数据库有上亿条商品数据
需要处理大量按商品名称的模糊查询(假设商品名称的分词已经实现了,也就是用多个关键字来查询)
我最本来是这样设想的:
建立一个商品名称索引表:ID,Name,ProductID 三个字段
ID自增
Name(分词程序对商品名称进行分词后,保存下来的一个词),
ProductID,商品名称包含该词的商品ID(varchar(max)字段,任何包含该词的商品ID都存在这个字段
问题就是到了这里,比如一个词:黑色,可能包含黑色这个词的商品名称有N多个,就算我知道了这些商品ID处理起来也很麻烦了。
还有在网上看到很多资料,说这么大数据量要进行数据分区,但如果搜索名称字段的话,我必须要进行全表扫描才能得到想要的数据啊?
请大家帮我分析下,我该怎么处理啊?
墨色风雨
心有法竹
相关分类