使用 fairseq-generate.py,在转换器架构中,每个翻译都会生成如下部分:
Why is it rare to discover new marine mammal species?
S-0 Why is it rare to discover new marine mam@@ mal species ?
H-0 -0.0643349438905716 Pourquoi est-il rare de découvrir de nouvelles espèces de mammifères marins?
P-0 -0.0763 -0.1849 -0.0956 -0.0946 -0.0735 -0.1150 -0.1301 -0.0042 -0.0321 -0.0171 -0.0052 -0.0062 -0.0015
有了这个解释:
H是假设以及平均对数似然;P 是每个令牌位置的位置分数,包括句尾标记
我想知道在P行中说一个低(绝对)数字是否合理,这意味着对该特定单词的置信度更高?例如,“Pourquoi”的-0.07是否意味着它比“est-il”的(-0.1849)更快乐?最后的低点-0.0015意味着它真的有信心这句话应该在那里结束。
背景:我试图弄清楚的是,我是否可以使用H数,或者以某种方式使用单个P数,以获得其转换中的置信度。我一直在根据H数字分析一些翻译,并没有注意到它与我对翻译质量的主观看法之间有太多的对应关系。但是我有一些我认为特别差的地方 - 它错过了一些关键信息 - 最终的P数相对较高,并且(最终的P数在大多数上都是左右。-0.6099-0.3091-0.11
慕森王
相关分类