使用 Pegasus 实施迁移学习进行文本摘要生成垃圾字符

我一直在尝试使用Pegasus 库生成摘要并按照上述步骤操作 -

  1. 创建输入数据 .tfrecordpegasus\data\testdata

  2. transformer_params创建一个返回命名的函数test_transformers(假设)

  3. 跑步 python3 pegasus/bin/train.py  --params=test_transformer  --param_overrides=vocab_filename=ckpt/pegasus_ckpt/c4.unigram.newline.10pct.96000.model,batch_size=1,beam_size=5,beam_alpha=0.6 --model_dir=ckpt/pegasus_ckpt/xsum/model.ckpt-30000

  4. python3 pegasus/bin/evaluate.py  --params=test_transformer  --param_overrides=vocab_filename=ckpt/pegasus_ckpt/c4.unigram.newline.10pct.96000.model,batch_size=1,beam_size=5,beam_alpha=0.6  --model_dir=ckpt/pegasus_ckpt/xsum/model.ckpt-30000

但是,当我生成文本时,我在输出中遇到这个问题 -

https://img2.mukewang.com/64ffcd6900014cdc19220422.jpg

它的实现方式或我在步骤 3 和 4 中运行 python 代码的方式是否存在问题?



qq_笑_17
浏览 62回答 1
1回答

牧羊人nacy

此问题突出的原因是:-1. --model_dir is typically a directory instead of a particular checkpoint.    -> Try changing model_dir to actual model directory instead of checkpoint2. It seems there are only 100 training steps.    -> Try changing "train_steps": 100
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python