我们正在使用 Stream 来搜索字符串的 ArrayList 字典文件已排序并包含 307107 个小写单词
我们正在使用 findFirst 从 TextArea 中的文本中查找匹配项
只要单词拼写错误超出 3 个字符 搜索有有利的结果
如果拼写错误的单词是这样的“Charriage”,则结果与匹配完全不相近
明显的目标是在不需要查看大量单词的情况下获得尽可能接近正确的结果
这是我们正在测试的文本
Tak acheive it hommaker 和 aparent as Chariage NOT ME Charriag 添加缺失的元音到 Cjarroage
我们对流搜索过滤器进行了一些重大更改,并进行了合理的改进
我们将编辑发布的代码,以仅包含搜索失败的代码部分 在
对流过滤器进行的代码更改之后
在代码更改之前,如果searchString 在位置 1 处有一个拼写错误的字符 在字典中找不到结果 新的搜索过滤器修复了这个问题
我们还通过增加endsWith 的字符数量添加了更多搜索信息
所以仍然失败!如果 searchString(拼写错误的单词)在单词末尾缺少一个字符,并且该单词在位置 1 到 4 之间有一个不正确的字符,则搜索失败
我们正在努力添加和删除字符,但我们不确定这是否可行解决方案
如果您想要我们将在 GitHub 上发布的完整项目,请在评论中询问,我们将不胜感激。
问题仍然是当拼写错误的单词中缺少多个字符时如何修复此搜索过滤器?
经过几个小时的免费 txt 词典搜索后,这是最好的
A 侧栏事实之一,它有 115726 个长度 > 5 的单词,并且单词末尾有一个元音。这意味着它有 252234 个末尾没有元音的单词
这是否意味着我们有 32% 的机会通过在 searchString 的末尾添加元音来解决问题?不是一个问题,只是一个奇怪的事实!
这里是字典下载的链接,并将words_alpha.txt文件放在C盘上的C:/A_WORDS/words_alpha.txt"); words_alpha.txt
qq_遁去的一_1
梦里花落0921
桃花长相依
相关分类