猿问

如何从长度为500个中文字符(UTF-8编码)的内容中分析出keywords.txt中包含的关键字?

已知一个文件keyword.txt,UTF-8编码,每行一个关键字,共10万行记录(可为数字、英文、中文等任意字符,每条记录长度不超过15个中文字符)。设计一个高效的算法,从长度为500个中文字符(UTF-8编码)的内容中分析出keywords.txt中包含的关键字。
假设keyword.txt文件内容为:
头条
抖音
张一鸣
...
输入文本:头条于XX年推出抖音产品......
则输出文本:头条、抖音

森林海
浏览 1140回答 1
1回答

缥缈止盈

其实,比KMP算法速度快的算法大把大把,而且理解起来更简单,为何非要抓住KMP呢?笔试出现字符串模式匹配时直接上sunday算法,既简单又高效,何乐而不为?说实话,想到sunday算法的那个人,绝对是发散思维,绝对牛。当我在被KMP折磨的够呛的时候,我就琢磨,有没有别的好算法呢??琢磨了半天也没想出个所以然来。笨啊,脑子不够发散。
随时随地看视频慕课网APP
我要回答