当前位置：文档之家› 基于协同过滤算法的推荐系统设计

基于协同过滤算法的推荐系统设计

一、绪论：

长尾理论。

二、协同过滤算法的定义：

（一）预定义：

要实现协同过滤算法，需要做以下的预定义：

1、邻域：

给定集合X，映射U：X→P(P(X))（其中P(P(X))是X的幂集的幂集），U 将X中的点x映射到X的子集族U(x)），称U(x)是X的邻域系以及U(x)中的元

素（即X的子集）为点x的邻域，当且仅当U满足以下的邻域公理：

U1：若集合A∈U(x)，则x∈A。

U2：若集合A，B∈U(x)，则A∩B∈U(x)。

U3：若集合A∈U(x)，且A ?B ?X，则B∈U(x)。

U4：若集合A∈U(x)，则存在集合B∈U(x)，使B ?A，且?y∈B，B∈U(y)。

2、皮尔逊相关系数：

皮尔逊相关系数是一种度量两个变量相似程度的一种方法，若变量X和变量Y线性相关，则其皮尔逊系数的z值域为[-1,1]。系数值为1表示完全正相关；

系数值为-1表示完全负相关。

3、曼哈顿距离：

4、欧几里得距离：

5、余弦相似度：

6、 Jaccard相似度：

（二）基于用户的协同过滤算法：

在实际应用中，如果一个用户C需要得到个性化的推荐，那么根据这个用户过去喜欢过的物品，计算出与这个顾客有着相似偏好的用户，继而把这些相似的用户所喜欢的、且C没有喜好过的物品推荐给用户C，这就是基于用户的协同过滤算法的主要思路。

该方法主要包括两个步骤：

1、寻找和查询用户具有相似偏好的用户群体。

2、找到这些用户所喜欢的物品集合，选取其中用户最为感兴趣的子集推荐给

查询用户。

在步骤1中，我们使用相似度来度量两个用户之间的相似度。相似度的计算方法可以调用预定义中的皮尔逊相似度、余弦相似度、曼哈顿距离、欧几里得距离和jaccard相似度。记用户A和用户B之间的相似度为sim

在得到用户的相似度之后，我们需要给查询用户返回根据其兴趣度的T opK结果，我们用如下公式衡量用户的兴趣度：

公式

其中S(u,K)代表相似用户集中的前K个用户，N(i)代表喜欢物品i的用户集合。

R代表用户u对物品i的感兴趣程度。

下图代表基于用户协同过滤算法的主要流程：

（三）基于物品的协同过滤算法：

在基于用户的协同过滤算法的基础上，又发展出了基于物品的协同过滤算法。

这主要是因为在一般的网站应用中，用户的数量往往远远大于物品的数量，这就造

成了计算用户之间的相似度成为一件非常耗时的工作：以余弦相似度为例。设一个

网站中的用户数为N，那么就需要维护一张N*N的矩阵，因而遍历矩阵计算相似

度的时间复杂度为O（N*N），这在用户基数较大时其计算时间会明显增加。

基于物品的协同推荐算法的工作方式是先找到和用户历史上喜好过的物品相似的物品，然后返回这些物品中用户兴趣度最高的前K个物品。

基于物品的协同过滤算法也分为两步：

1、计算物品之间的相似度。

2、根据物品的相似度和用户的历史行为返回给用户的推荐列表。

在步骤1中，与基于用户的推荐算法相似，也使用皮尔逊相关系数、欧几里得距离等预定义中的相似度计算方法来计算物品之间的相似度。记物品A和物品B之间的相似度为sim。

在得到物品间的相似度之后，通过以下公式计算对用户u来说，每个物品的感兴趣程度。

公式

这里N（u）代表某个用户的物品喜好集合，s（j，K）代表相似物品集合中相似度最高的前K个物品组成的子集。

三、SVD推荐算法：

1、矩阵分解和baseline预测

matrix factorization model

把我们的用户评分想象成一个表:

每一行代表一个用户,每一列代表一个物品,这其实就是一个矩形,只是我们拥有的这个矩形可能是非常稀疏的,也就是我们知道的评分占总量很少,,但现在我们知道它是一个矩形,一个矩形自然可以表示为另两个矩形的乘积:

这也就是matrix factorization model的原理了,我们需要做的就是通过已有数据来学习右边的两个矩形,更intuitive的你可以把总的矩形里的每个评分看成是该用户的特征向量与物品特征向量的内积:(这里符号变得有些多,你理解了意思就成)

2.Baseline Predictors

Baseline Predictors就简单多了，我们设定μ是平均值，然后分别用bi和bu来代表具体用户和物品的“偏好”，也就是

这两个参数我们当然可以当成一个优化任务来计算，比如最小二乘：

也可以用比较快的方法来，因为实际上这就是经验似然：

1、SVD算法的原理

SVD(Singular Value Decomposition)的想法是根据已有的评分情况，分析出评分者对各个因子的喜好程度以及电影包含各个因子的程度，最后再反过来根据分析结果预测评分。电影中的因子可以理解成这些东西：电影的搞笑程度，电影的恐怖程度，等等。根据这些因子，将N*M的评分矩阵（R[u][i]代表用户u对电影i的评分）分解成一个N行

F列的用户因子矩阵P（P[u][k]表示用户u对因子k的喜好程度）和一个M行F列的物品因子矩阵Q（Q[i][k]表示第i个物品的因子k，具体见下述公式：

公式

下面是将评分矩阵R分解成用户因子矩阵P与物品因子矩阵Q的一个例子。R的元素数值越大，表示用户越喜欢这部电影。P的元素数值越大，表示用户越喜欢对应的因子。Q的元素数值越大，表示物品对应的因子程度越高。分解完后，就能利用P，Q来预测用户A对《等风来》的评分了。按照这个例子来看，用户A应该会给《等风来》较低的分数。因为他不喜欢幽默片。

表1

表3

实际上，我们给一部电影评分时，除了考虑电影是否合自己口味外，还会受到自己是否是一个严格的评分者和这部电影已有的评分状况影响。例如：一个严格评分者给的分大多数情况下都比一个宽松评分者的低。你看到这部电影的评分大部分较高时，可能也倾向于给较高的分。在SVD 中，口味问题已经有因子来表示了，但是剩下两个还没有相关的式子表示。因此有必要加上相关的部分，提高模型的精准度。改进后的SVD的公式如下：

R = OverallMean + biasU + biasI + P * T(Q)（1）

其中OverallMean表示所有电影的平均分，biasU表示用户评分偏离OverallMean的程度，biasI表示电影评分偏离OverallMean的程度，P，Q意思不变。特别注意，这里除了OverallMean之后，其它几个都是矩阵。

分解完后，即（1）式中的五个参数都有了正确的数值后，就可以用来预测分数了。假设我们要

预测用户u对电影i的评分：

bu表示第u个用户的偏离程度，bi表示第i部电影的偏离程度，pu表示第u个用户的因子爱好程度，qi表示第i部电影的因子程度。

2、参数学习：

为了得到用户因子P和物品因子Q，需要通过学习来得到矩阵的参数。SVD使用随机梯度下降(stochastic gradient descent)学习（1）式中除了OverallMean之外的参数。

学习过程可以概括成这样：先给各个参数一个初值，然后利用这些参数进行预测，并将预测结果与已知评分进行对比，最后根据对比结果修正各个参数。更准确点的说法是调整参数的值，使得以下式子能取到最小值：

ALPHA表示所有训练样本。被第一个圆括号括着的部分表示当前的预测结果与实际值的偏差。被第二个圆括号括着的部分是为了防止过拟合(overfitting)。

四、基于MovieLens数据集的推荐系统设计

1、选取数据集：

为了实现协同过滤算法和SVD算法，需要选取一个合适的数据集来分析。本文研

究了以下数据集：

1、BookCrossing：

这个数据集是网上的Book-Crossing图书社区的278858个用户对271379本书进行的评分，包括显式和隐式的评分。这些用户的年龄等人口统计学属性

(demographic feature)都以匿名的形式保存并供分析。这个数据集是由Cai-Nicolas

Ziegler使用爬虫程序在2004年从Book-Crossing图书社区上采集的。

2、JesterJoke：

Jester Joke是一个网上推荐和分享笑话的网站。这个数据集有73496个用户对100个笑话作的410万次评分。评分范围是-10~10的连续实数。这些数据是由

加州大学伯克利分校的Ken Goldberg公布的。

3、Netflix：

这个数据集来自于电影租赁网址Netflix的数据库。Netflix于2005年底公布此数据集并设立百万美元的奖金(netflix prize)，征集能够使其推荐系统性能上升10％

的推荐算法和架构。这个数据集包含了480189个匿名用户对大约17770部电影

作的大约lO亿次评分。

4、Usenet Newsgroups：

这个数据集包括20个新闻组的用户浏览数据。最新的应用是在KDD2007上的论文。新闻组的内容和讨论的话题包括计算机技术、摩托车、篮球、政治等。用

户们对这些话题进行评价和反馈。

5、MovieLens：

MovieLens数据集中，用户对自己看过的电影进行评分，分值为1～5。

MovieLens包括两个不同大小的库，适用于不同规模的算法．小规模的库是943个独立用户对1682部电影作的100000次评分的数据；大规模的库是6040个独立用户对3900部电影作的大约100万次评分。

在分析、比较各数据集的特性之后，发现MovieLens的数据集所涉及的主题—电影较为贴近我们的日常生活，因而具有较大的实用价值，且该数据库数据较为规范、不存在空值等需要进行数据清洗的情况，因而选择MovieLens作为分析实用的数据集。在MovieLens中，有大、中、小三个不同大小的数据集，因为本项目是个人开发，所以选择规模最小的“MovieLens-100K”数据集，其中包含了943个独立用户对1682部电影作的100000次评分的数据。

2、数学建模：

在数据集“MovieLens-100k”中，需要用到三个数据文件，分别是“u.data”、“u.item”、“https://www.doczj.com/doc/7114293093.html,er”。

“user.data”中包含943个独立用户对1682部电影作的100000次评分的数据。每个用户都至少对20部进行了打分。我们将其分为用户编号、电影编号、打分分值、打分之间等4个属性，以下述的形式存入数组：

user id | item id | rating | timestamp.

其中timestamp为用户评分的时间戳。

“u.item”保存了电影的信息，我们讲其分为电影编号、电影标题、上映时间、视频发行时间、IMDB链接、类别等属性，表示为下述的数组：

“https://www.doczj.com/doc/7114293093.html,er”保存了评分人的信息，将其分类为用户编号、年龄、性别、职业、解压密码等属性，以下述数组的形式储存：

user id | age | gender | occupation | zip code

将u.data按7：1分为训练集和测试集，具体方法见下述伪代码：

def dataSplit(data,M,k,seed)

test = empty

train = empty

for user ,item in data:

if random(0,M)==k:

test.append(user,item)

else

train.append(user,item)

return test,train

3、算法实现：

对于数据集“MovieLens-100k”调用载第二章所属的基于用户协同过滤算法、基于物品的协同过滤算法和SVD算法，其中相似度的计算方法调用预定义中的皮尔逊相关系数等6中方法。

下面给出个算法的伪代码：

（1）基于用户的协同过滤算法：

def UserSimilarity(train):

item_user = dict()

for u ,items in train.items:

for i in item.keys()

if i in item.keys():

item_user[i].add(u)

C= empty

N =empty

for i ,users in item_users.items():

for u in users:

N(u) +=1

for v in users:

if u == v:

continue

C[u][v]+=1

W=empty

for u.related_users in C.items():

for v.cuv in related_users.items():

W[u][v] = cuv / math.sqrt(N(u)*N(v))

return W

def Recommand(user ,train, W):

rank = empty dict

interacted_items = train[user]

for v,wuv in sorted(W[u].items, key =itemgetter(1),\reverse=true) for i rvi in train[v].item():

if i in interacted_items[v].items():

continue

rank[i] += wuv*rvi

return rank

（2）基于物品的协同过滤算法：

def UserSimilarity(train):

item_user = dict()

for u ,items in train.items:

for i in item.keys()

if i in item.keys():

item_user[i].add(u)

C= empty

N =empty

for i ,users in item_users.items():

for u in users:

N(u) +=1

for v in users:

if u == v:

continue

C[u][v]+=1

W=empty

for u.related_users in C.items():

for v.cuv in related_users.items():

W[u][v] = cuv / math.sqrt(N(u)*N(v))

return W

def Recommand(user ,train, W):

rank = empty dict

interacted_items = train[user]

for v,wuv in sorted(W[u].items, key =itemgetter(1),\reverse=flase)

for i rvi in train[v].item():

if i in interacted_items[v].items():

continue

rank[i] += wuv*rvi

return rank

（3）SVD算法：

from __future__ import division

import numpy as np

import scipy as sp

from numpy.random import random

class SVD_C:

def __init__(self,X,k=20):

'''

k is the length of vector

'''

self.X=np.array(X)

self.k=k

self.ave=np.mean(self.X[:,2])

print "the input data size is ",self.X.shape

self.bi={}

self.bu={}

self.qi={}

self.pu={}

self.movie_user={}

https://www.doczj.com/doc/7114293093.html,er_movie={}

for i in range(self.X.shape[0]):

uid=self.X[i][0]

mid=self.X[i][1]

rat=self.X[i][2]

self.movie_user.setdefault(mid,{})

https://www.doczj.com/doc/7114293093.html,er_movie.setdefault(uid,{})

self.movie_user[mid][uid]=rat

https://www.doczj.com/doc/7114293093.html,er_movie[uid][mid]=rat

self.bi.setdefault(mid,0)

self.bu.setdefault(uid,0)

self.qi.setdefault(mid,random((self.k,1))/10*(np.sqrt(self.k)))

self.pu.setdefault(uid,random((self.k,1))/10*(np.sqrt(self.k)))

def pred(self,uid,mid):

self.bi.setdefault(mid,0)

self.bu.setdefault(uid,0)

self.qi.setdefault(mid,np.zeros((self.k,1)))

self.pu.setdefault(uid,np.zeros((self.k,1)))

if (self.qi[mid]==None):

self.qi[mid]=np.zeros((self.k,1))

if (self.pu[uid]==None):

self.pu[uid]=np.zeros((self.k,1))

ans=self.ave+self.bi[mid]+self.bu[uid]+np.sum(self.qi[mid]*self.pu[uid]) if ans>5:

return 5

elif ans<1:

return 1

return ans

def train(self,steps=20,gamma=0.04,Lambda=0.15):

for step in range(steps):

print 'the ',step,'-th step is running'

rmse_sum=0.0

kk=np.random.permutation(self.X.shape[0])

for j in range(self.X.shape[0]):

i=kk[j]

uid=self.X[i][0]

mid=self.X[i][1]

rat=self.X[i][2]

eui=rat-self.pred(uid,mid)

rmse_sum+=eui**2

self.bu[uid]+=gamma*(eui-Lambda*self.bu[uid])

self.bi[mid]+=gamma*(eui-Lambda*self.bi[mid])

temp=self.qi[mid]

self.qi[mid]+=gamma*(eui*self.pu[uid]-Lambda*self.qi[mid])

self.pu[uid]+=gamma*(eui*temp-Lambda*self.pu[uid]) gamma=gamma*0.93

print "the rmse of this step on train data is ",np.sqrt(rmse_sum/self.X.shape[0])

#self.test(test_data)

def test(self,test_X):

output=[]

sums=0

test_X=np.array(test_X)

#print "the test data size is ",test_X.shape

for i in range(test_X.shape[0]):

pre=self.pred(test_X[i][0],test_X[i][1])

output.append(pre)

#print pre,test_X[i][2]

sums+=(pre-test_X[i][2])**2

rmse=np.sqrt(sums/test_X.shape[0])

print "the rmse on test data is ",rmse

return output

4、评分标准：

对于系统返回的推荐结果，需要对推荐的结果做出评价。一个完整的推荐系统一般存在3个参与方：用户、物品提供者和提供推荐的网站，因此在测评一个推荐系统时，需要同时考虑三方的利益，一个好的推荐系统可以使三方收益。

好的推荐系统不仅可以准确预测用户的行为，而且可以拓展用户的视野，帮助用户发现可能的潜在兴趣。同时，推荐系统还要帮助商家将被埋没在长尾中的物品推荐给可能感兴趣的用户。

本着这样的目的，本文使用了以下几种测评标准来衡量推荐结果的好坏：

1、预测准确度：

预测准确度度量一个推荐系统预测用户行为的能力。这个指标是最重要的系统离线测评指标。在训练集training set中建立用户行为和兴趣模

型，预测用户在测试集上的行为，并将预测行为和测试行为的重合度作为

预测的准确度。

对于MovieLens这种打分型的数据集，一般使用均方根误差（RMSE）来作为预测准确度的测评标准。对于测试集中的一个用户u和物品i，令

Rui是用户对物品的实际评分，而Rui是推荐算法给出的预测评分，则

RMSE的定义为：

公式

下面给出计算RMSE的伪代码：

def RMSE(records)：

return math.sqrt(

sum([(rui)])

)

对于T opN型的推荐，一般是为用户给出一个个性化的推荐列表。这种推荐的预测准确率一般通过准确率（precision）/召回率（recall）度量。

推荐结果的召回率定义为：

推荐结果的准确率定义为：

下面的伪代码显示了TopN推荐中的预测准确度计算过程：

2、覆盖率：

3、多样性：

基于用户的协同过滤算法 UserCF流程图

UserCF算法主要流程：主要全局变量： const int usersum = 6040; //用户总数 const int itemsum =3952; //项目总数 const int N =10; //为用户推荐前N个物品 int trainuser[usersum][itemsum]={0}; //训练集合user item rate矩阵 int test[usersum][itemsum]={0}; //测试集合user item rate矩阵 struct _simi { double value; //相似值 int num; //相似用户号 }; _simi simiUser[usersum][usersum]; //排序后的相似性矩阵double trainuserItem[usersum][itemsum]={0.0}; // user item 兴趣程度矩阵int recommend[usersum][N]={0}; //为每个用户推荐N个物品

拆分数据集函数int SplitData(int m, int k) 主要流程：将数据集拆分为测试集test和训练集trainuser，其中1/m为测试集,取不同的k<=m-1值在相同的随即种子下可得到不同的测/训集合

计算用户之间相似度函数double Simility(int* Ua, int*Ub)主要流程：计算用户Ua和Ub的相似性，返回值为Ua和Ub的相似度

用户相似性矩阵排序函数int sort(double *simArr,_simi *simStruct)主要流程：根据相似性由高到低排序，每行第一个是自己

改进了协同过滤推荐算法的推荐系统的制作流程

图片简介:

本技术介绍了一种改进了协同过滤推荐算法的推荐系统，属于推荐系统技术相关领域。该推荐系统包括输入模块、推荐算法和输出模块三个部分，输入模块用于输入用户个人基本信息、用户对项目的评分和用户历史信息等；推荐算法根据输入信息分析用户兴趣爱好，寻找最相似用户和项目，给出预测的评分结果；输出模块依据用户输入请求，输出相应的推荐项目。其中改进部分是对推荐算法中冷启动问题进行优化。针对新用户、新项目和新系统不同的冷启动问题，提出了优化解决方法。技术要求 1.一种改进了协同过滤推荐算法的推荐系统，其特征在于，包括输入模块、推荐算法和输出模块；输入模块用于输入用户个人基本信息、用户对项目的评分、用户历史信息和当前的点击操作；推荐算法根据输入信息分析用户兴趣爱好，寻找最相似用户和项目，给出预测的评分结果；输出模块依据用户输入请求，输出相应的推荐项目到客户端。 2.如权利要求1所述的一种改进了协同过滤推荐算法的推荐系统，其特征在于，所述推荐算法为协同过滤推荐算法，所述协同过滤推荐算法冷启动实现方式为：一、提供非个性化的推荐，非个性化推荐的最简单例子就是热门排行榜，可以给用户推荐热门排行榜，然后等到用户的反馈足够多，数据收集到一定的时候，再转换为个性化推荐；二、利用用户的注册信息，提供的年龄、性别、职业等数据做粗粒度的个性化；三、利用用户的社交网络账号登录，导入用户在社交网站上的好友信息，然后给用户推荐其好友喜欢的物品；四、利用物品的内容信息计算物品相关表，利用专家进行标注。 3.如权利要求2所述的一种改进了协同过滤推荐算法的推荐系统，其特征在于，在所述推荐算法中，用户点击商品链接后，推荐系统会记录用户的点击行为，然后系统计算用户间相似度，找出与当前用户最相似的前N个用户，接着在这前N个用户中找出当前用户没有点击的商品，将点击率最高的几个商品加入推荐列表，最后将推荐列表发往客户端向用户展示推荐的商品。

基于协同过滤的推荐算法及代码实现

基于协同过滤的推荐算法与代码实现什么是协同过滤？协同过滤是利用集体智慧的一个典型方法。要理解什么是协同过滤(Collaborative Filtering, 简称CF)，首先想一个简单的问题，如果你现在想看个电影，但你不知道具体看哪部，你会怎么做？大部分的人会问问周围的朋友，看看最近有什么好看的电影推荐，而我们一般更倾向于从口味比较类似的朋友那里得到推荐。这就是协同过滤的核心思想。协同过滤一般是在海量的用户中发掘出一小部分和你品位比较类似的，在协同过滤中，这些用户成为邻居，然后根据他们喜欢的其他东西组织成一个排序的目录作为推荐给你。当然其中有一个核心的问题：如何确定一个用户是不是和你有相似的品位？如何将邻居们的喜好组织成一个排序的目录？简单来说： 1. 和你兴趣合得来的朋友喜欢的，你也很有可能喜欢； 2. 喜欢一件东西A，而另一件东西B 与这件十分相似，就很有可能喜欢B； 3. 大家都比较满意的，人人都追着抢的，我也就很有可能喜欢。三者均反映在协同过滤的评级（rating）或者群体过滤（social filtering）这种行为特性上。深入协同过滤的核心首先，要实现协同过滤，需要一下几个步骤： 1. 收集用户偏好 2. 找到相似的用户或物品 3. 计算推荐 (1)收集用户偏好要从用户的行为和偏好中发现规律，并基于此给予推荐，如何收集用户的偏好信息成为系统推荐效果最基础的决定因素。用户有很多方式向系统提供自己的偏好信息，而且不同的应用也可能大不相同，下面举例进行介绍：

以上列举的用户行为都是比较通用的，推荐引擎设计人员可以根据自己应用的特点添加特殊的用户行为，并用他们表示用户对物品的喜好。在一般应用中，我们提取的用户行为一般都多于一种，关于如何组合这些不同的用户行为，基本上有以下两种方式：将不同的行为分组：一般可以分为“查看”和“购买”等等，然后基于不同的行为，计算不同的用户/物品相似度。类似于当当网或者Amazon 给出的“购买了该图书的人还购买了...”，“查看了图书的人还查看了...”

基于项目的协同过滤算法 ItemCF流程图

ItemCF算法主要流程：主要全局变量： const int usersum = 6040; //用户总数 const int itemsum =3952; //项目总数 const int N =10; //为用户推荐前N个物品 int trainuser[usersum][itemsum]={0}; //训练集合user item rate矩阵 int test[usersum][itemsum]={0}; //测试集合user item rate矩阵 struct _simi { double value; //相似值 int num; //相似物品号 }; _simi simiItem[itemsum][itemsum]; //排序后的相似性矩阵double trainuserItem[usersum][itemsum]={0.0}; // user item 兴趣程度矩阵int recommend[usersum][N]={0}; //为每个用户推荐N个物品

计算项目之间相似度函数double Simility(int* ItemA, int* ItemB)主要流程：计算用户ItemA和ItemB的相似性，返回值为ItemA和ItemB的相似度

用户i对物品j预测兴趣程度函数double getUserLikeItem(int i,int j,int k)主要流程：利用k个最近邻来计算

基于用户评分Kmeans聚类的协同过滤推荐算法实现

基于用户评分Kmeans聚类的协同过滤推荐算法实现一：基于用户评分Kmeans聚类的协同过滤推荐算法实现步骤 1、构建用户-电影评分矩阵： public Object readFile(String fileName){ List user = new ArrayList(); double[][] weight = new double[user_num][keyword_num]; List

文档之家

基于协同过滤算法的推荐系统设计

基于用户的协同过滤算法 UserCF流程图

改进了协同过滤推荐算法的推荐系统的制作流程

基于协同过滤的推荐算法及代码实现

基于项目的协同过滤算法 ItemCF流程图

基于用户评分Kmeans聚类的协同过滤推荐算法实现

一种改进的协同过滤推荐算法

基于协同过滤算法的电影推荐系统设计

基于在线评论情感分析的改进协同过滤推荐算法

浅谈基于协同过滤的个性化推荐算法

协同过滤推荐算法与应用

基于用户的协同过滤推荐算法原理和实现

基于用户-项目特征的协同过滤推荐改进算法

基于协同过滤算法的电影推荐系统

基于用户的协同过滤算法

基于协同过滤算法的推荐系统设计

基于项目的协同过滤推荐算法

基于协同过滤算法的电影推荐系统