继续浏览精彩内容
慕课网APP
程序员的梦工厂
打开
继续
感谢您的支持,我会继续努力的
赞赏金额会直接到老师账户
将二维码发送给自己后长按识别
微信支付
支付宝支付

相似度计算方法:余弦相似度

慕哥9229398
关注TA
已关注
手记 1241
粉丝 199
获赞 913

基于用户的协同过滤算法

基于用户的协同过滤算法是推荐系统中最古老的算法,这个算法是1992年提出的,是用在了邮件过滤系统中,后面被用到了新闻过滤系统中。简单的来说,推荐系统中,基于用户的协同过滤就是,先找到与目标用户兴趣相似的用户,然后把这些用户喜欢的推荐给目标用户,先找到与目标用户兴趣相似的用户就是计算用户之间的相似度,今天主要就是讲讲用余弦相似度。

余弦相似度原理

用向量空间中的两个向量夹角的余弦值作为衡量两个个体间差异大小的度量,值越接近1,就说明夹角角度越接近0°,也就是两个向量越相似,就叫做余弦相似

余弦相似度公式

从书里面拿出来的公式,犹豫不会在线打数学公式,用手写的照片代替


webp

书里面的公式


直接背书可能大家会迷糊,给大家来个通俗版的


webp

通俗版公式


这个通俗版的大家应该可以看明白,下面就来说说推导公式的过程

推导公式的过程

如图a、b向量,夹角为θ


webp

a、b两个向量


如图做辅助线c


webp

辅助线c


现在的问题,就是求θ的余弦值,根据余弦定理,相比大家还记得吧

webp

余弦定理


如图,把这个模型放到二维坐标系中


webp

三角形的三个顶点坐标如图


那么,构建出来的三角形,三条边的边长如下:

webp

a、b、c三条边的边长


把a、b、c边长带入余弦定理公式,计算过程如下:

webp

推导过程如下


这是在二维坐标中,进行推导的,如果过程扩展到n位坐标系中,这个公式就是上面说通俗版公式

举个栗子

A用户对a、b、d物品有兴趣,B用户对a、c物品有兴趣,C用户对b、e物品有兴趣,D用户对c、d、e物品有兴趣,把这个转化成向量图,带入公式计算得出相似度,计算过程如图所示


webp



作者:小草莓子桑
链接:https://www.jianshu.com/p/f4606ae118b3


打开App,阅读手记
1人推荐
发表评论
随时随地看视频慕课网APP