手记

推荐系统-通过数据挖掘算法协同过滤讨论基于内容和用户的区别

概念

个性化推荐是根据用户的兴趣特点和购买行为,向用户推荐用户感兴趣的信息和商品。 
为什么要个性化推荐? 
- 商品个数和种类快速增长,顾客需要花费大量的时间才能找到自己想买的商品 
- 浏览大量无关的信息和产品,信息过载问题,用户难以获取所需要的信息

分类

基于内容的推荐

根据用户的历史数据,推荐用户感兴趣的产品。 
1. 产品表示: 
为每个item 抽取出一些 特征来表示此item;结构化属性如身高、学历、籍贯等;非结构化属性如item自己写的交友宣言,博客内容等等,需要转化成结构化属性 
2. 兴趣学习: 
利用一个用户过去喜欢(及不喜欢)的item的特征数据,来学习出此用户的喜好特征(profile);典型的有监督分类问题,理论上机器学习里的分类算法都可用 
3. 产生推荐: 
通过比较上一步得到的用户profile与候选item的特征,为此用户推荐一组相关性最大的item。把模型预测的用户最可能感兴趣的n个item作为推荐返回给用户即可

协同过滤推荐

根据与目标用户兴趣类似的用户,预测目标用户对特定产品的喜好程度。 
- 以用户作为样本,每个用户对产品的评价作为该用户的特征,寻找最相似的用户。 
- 为用户推荐,其最相似用户已经购买、浏览,而该用户未购买、浏览的产品 
拓展阅读:协同过滤推荐中SVD分解的应用

优缺点对比

方法 新用户 新商品 冷门商品 特殊商品 潜在兴趣 特征提取、建模 依赖用户

方法新用户新商品冷门商品特殊商品潜在兴趣特征提取、建模依赖用户
基于内容××需要×
协同过滤××××不需要
  • 基于内容的推荐,无法发现用户的潜在兴趣,且对于非结构化特征的数据(电影、音乐等艺术作品)难以准确描述

  • 协同过滤推荐,可以发现潜在兴趣,不用提取特征、建模,因此对艺术作品有效;冷启动问题

UserCF 和 ItemCF 的比较

推荐系统思维导图:直通车



0人推荐
随时随地看视频
慕课网APP