我正在尝试将语音转文本 API 的输出与地面实况转录进行比较。我想要做的是将语音到文本 API 遗漏或误解的基本事实中的单词大写。
例如:
真相: The quick brown fox jumps over the lazy dog.
语音到文本输出: the quick brown box jumps over the dog
期望的结果: The quick brown FOX jumps over the LAZY dog.
我最初的直觉是从基本事实中删除大写和标点符号并使用 difflib。这让我得到了准确的差异,但我无法将输出映射回原始文本中的位置。我想保留基本事实的大写和标点符号来显示结果,即使我只对单词错误感兴趣。
有什么方法可以将 difflib 输出表示为原始文本的词级变化吗?
慕斯王
HUX布斯
神不在的星期二
相关分类