问答详情
源自:3-8 usercf公式升级代码实战

在usercf中并不是两个用户共同看的电影越多,两个用户相似度就越高?

如下图所示:userid3和userid94共同看的电影最多,但是userid3与userid94的相似度却不是最高的,我想这是因为两者总共看的电影不同,计算相似度的时候因为userid94看的电影数太多而导致相似度下降

https://img.mukewang.com/5b6fcbf3000166b624160814.jpg

提问者:meengo 2018-08-12 13:59

个回答

  • David
    2018-08-13 11:49:41
    已采纳

    对的,是的我们在计算相似度的时候是考虑个性化因素,举例来说,如果A用户和B用户,A用户与C用户都是共同点击了3个物品。那么很明显,B和C谁点击过的物品越少越能体现出与A用户的相似。因为如果一个用户点击的物品太多,其实显示的并不是个性化需求,而是范需求。

  • meengo
    2018-08-12 14:07:39

    输出相应的total_movies可以看出相应的原因:

    用户userid94共看过148部电影,因此导致与userid3的相似度下降

    https://img1.mukewang.com/5b6fcea900011cb123680680.jpg