-
holdtom
搞个笨方法吧,一般笨客户才有这种笨需求.所以就用笨方法.有什么不能过滤的新名词后面添加到函数里就好了
create function dbo.ft_get_short_company_name(@company_name varchar(50))
returns varchar(50)
as
begin
declare @company varchar(50)
select @company = replace(@company_name,'有限责任公司','')
select @company = replace(@company,'有限公司','')
select @company = replace(@company,'总公司','')
select @company = replace(@company,'公司','')
--去除省名城市名
--去除其它自定义内容
end
select * from Company where charindex(dbo.ft_get_short_company_name('格力电器有限责任公司'),CompanyName) > 0
-
aluckdog
模糊匹配效率低的解决方案就是不用模糊匹配.
mssqlserver的话用全文索引.很容易的
-
杨__羊羊
1、从你的客户需求来看,他们出的价钱一定很高,基本上快赶上那个要求不能使用ASPX(低档货)的客户的。我初步估计项目达到10亿,而且还是美元,虽然汇率在走低,不过还是有5、6个人民币那么多。
2、Google和Baidu基本上技术上能达到你客户的要求,你可以找这两家采购再转卖给你的客户。
3、好了,不扯了,
比如要查询: 格力电器珠海有限公司 客户希望 输入: 格力电器珠海总公司 ,格力电器珠海公司,格力电器珠海有限责任公司,格力电器责任有限公司,格力电器公司等都能匹配出来。
类似这样的需求,本身如果满足的话,就是说,你的客户可能每次输入都会得到8000~9000个符合要求的信息,因为电脑根本不知道为什么格力就成了关键词了,如果不小心把公司当成关键词的话,是不是每个有包含公司的公司都会出现?
如果不是这样的话,要么你的客户愿意在信息条“ 格力电器珠海总公司、格力电器珠海公司,格力电器珠海有限责任公司,格力电器责任有限公司,格力电器公司”这些里面建立一个匹配数据,否则鬼才知道。
你的客户如果愿意输入“格力”出现后面那一堆,那叫合理需求,如果非要手贱输入“格力电器珠海有限公司”,还要匹配那后面的一系列名称,你们的业务还同意的话,真心对你们公司的技术实力表示佩服,期待中国Google的出现。
当你们解决了这个问题以后(先假设你们可以解决),客户会有一个这样的需求的,比如Walmart超市,可不可以当用户输入是WALMART超市的时候也可以找出来啊。
或者搜索小米科技,可以找到五谷杂粮科技公司。
-
侃侃无极
灰常同意2楼观点,其实你们公司谈需求的不知道是谁?或者只是个熟悉业务并且对技术只有一点了解的人,其实这是很危险的,其实他要就只懂业务还好,但是如果还会那么一点点技术的话,那么他理解的这个需求他就会认为是完全可以实现的。
其实不然,因为你所要的效果是你输入一个字符串,只要其中有那么一两个字符或者中文与数据库中匹配,那么就可以将匹配的结果全部搜索出来,那么你的计算机怎么知道你想要匹配的是什么呢?你说你想查询: 格力电器珠海有限公司 客户希望 输入: 格力电器珠海总公司 ,格力电器珠海公司,格力电器珠海有限责任公司,格力电器责任有限公司,格力电器公司等都能匹配出来,那么这种情况是你自己认为你想要的是匹配你所输入的字符串中的“格力电器”or“格力”or“格力电”or“力电器”。。。等等,都要疯了,换而言之,你这样弄的话,假如你要搜索小米科技公司,还真的会带出五谷杂粮科技公司 -。-,客户的需求真的好高端,做之前真心需要好好分析,可行性实现的
-
德玛西亚99
解决方案还是有的,你可以考虑lucene等引擎建立分词库,然后根据词库去最小词义匹配。但正如大叔所言,这不是小需求,从商业角度及你们实施能力考虑,这个功能你至少得再加价200万以上加6个月时间,问问你的客户是否愿意买单?
-
喵喵时光机
用lucene吧。
-
海绵宝宝撒
lucene
-
精慕HU
请你有木有解决问题了,我也遇到同一类的问题
-
FFIVE
要求用户必须严格输入,现在无法实现智能化。
后来我们做了数据分类,把某些关键词指定为一个标准名称。