⼀、余弦相似度:
余弦值越接近1,就表明夹⾓越接近0度,也就是两个向量越相似,这就叫\"余弦相似性\"⼆维向量的余弦相似度:
多维向量的余弦相似度(类⽐)
协同过滤(Collaborative Filtering, 简称 CF):
收集⽤户⾏为
减噪与归⼀化处理
1. 减噪:⽤户⾏为数据是⽤户在使⽤应⽤过程中产⽣的,它可能存在⼤量的噪⾳和⽤户的误操作,我们可以通过经典的数据挖掘算法过滤掉⾏为数据中的噪⾳,这样可以是我们的分析更加精确
2. 归⼀化:将各个⾏为的数据统⼀在⼀个相同的取值范围中,从⽽使得加权求和得到的总体喜好更加精确。⼆、基于物品的协同过滤推荐算法(itemCF):
算法思想:给⽤户推荐那些和他们之前喜欢的物品相似的物品
⽤户⾏为与权重:点击-1、搜索-3、收藏-5 、付款-10⽤户 A、B、C
商品 1、2、3、4、5、6
根据⽤户⾏为列表计算⽤户、物品的评分矩阵
根据⽤户、物品的评分矩阵计算物品、物品的相似矩阵
相似度矩阵x评分矩阵=推荐列表
推荐列表中⽤户之前已经有过⾏为的元素置为0
三、基于⽤户的协同过滤推荐算法(UserCF)
算法思想:给⽤户推荐和他兴趣相似的其他⽤户喜欢的物品⽤户⾏为与权重:点击-1、搜索-3、收藏-5 、付款-10⽤户 A、B、C、D、E、F 商品 1、2、3、4、5、6
根据⽤户⾏为列表计算物品、⽤户的评分矩阵根据物品、⽤户的评分矩阵计算⽤户、⽤户的相似矩阵相似度矩阵X评分矩阵=推荐列表将推荐列表中⽤户已有⾏为的元素置0
四、基于内容推荐算法
算法思想:给⽤户推荐和他们之前喜欢的物品在内容上相似的其他物品1表⽰电影具有某个特征 0表⽰电影不具有某个特征物品特征建模:Item Profile
构建Item Profile矩阵(电影的特征项矩阵)构建Item User评分矩阵(⽤户电影的评分矩阵)
Item User x Item Profile = User Profile (⽤户对电影的喜爱程度)对Item Profile和User Profile求余弦相似度
五、基于物品的协同过滤推荐算法(itemCF)说明:1、根据⽤户⾏为列表计算⽤户、物品的评分矩阵
2、根据⽤户物品的评分矩阵计算物品、物品的相似矩阵
3、相似度矩阵x评分矩阵=推荐列表
4、推荐列表中⽤户之前已经有过⾏为的元素置为0
因篇幅问题不能全部显示,请点此查看更多更全内容