您好,欢迎来到世娱网。
搜索
您的当前位置:首页基于RFM模型和协同过滤的电子商务推荐机制

基于RFM模型和协同过滤的电子商务推荐机制

来源:世娱网
第24卷第3期 江苏科技大学学报(自然科学版) Vo1.24 No.3 2010年6月 Journal of Jiangsu University of Science and Technology(Natural Science Edition) Jun.2010 基于RFM模型和协同过滤的电子商务 推荐机制 孙玲芳,张婧 (江苏科技大学经济管理学院,江苏镇江212003) 摘要:针对传统协同过滤算法在数据来源上依赖客户主观评价,以及现有推荐系统中缺少个性化推荐形式的缺陷,提出 利用RFM模型在反映客户购买偏好和客户价值方面的良好表征性,将RFM模型与原协同过滤机制进行结合,对传统的协 同过滤算法进行了改进,并制定了差异化的电子商务推荐策略,使推荐方式更符合不同客户的个性化,从而实现推荐内容 和推荐形式的全面个性化. 关键词:电子商务;推荐机制;协同过滤;RFM模型 中图分类号:F724.6 文献标志码:A 文章编号:1673—4807(2010l03—0285—05 Electronic recommendation mechanism based on RFM model and collaborative filtering Sun Lingfang,Zhang Jing (School of Economic and Management,Jiangsu University of Science&Technology,Zhenjiang Jiangsu 212003.China) Abstract:Considering the deficiency in the traditional collaborative filtering algorithm whose original data were from customers subjective evaluation and the lack of personalized recommendation pattern of current recommen- der systems,this paper combined RFM model with traditional collaborative filtering mechanism to improve the traditionaI collaborative filtering.Meanwhile.it drew up discrepant recommendation methods.This method can reflect customers purchase preference and customers value by taking advantage of the characteristics in RFM. Also,it can provide personalized services for customers in all—round manner. Key words:electronic commerce;recommendation mechanism;collaborative filtering;RFM model 电子商务在为客户提供越来越多的信息和选 映客户购买偏好和客户价值两方面的良好表征性 择的同时,也会使客户在大量的商品信息中,无法 对传统的协同过滤算法进行改进,并制定差异化的 』fO ̄,,JJ找到自己需要的商品.为解决这一矛盾,电子 电子商务推荐方式. 商务推荐系统应运而生.推荐系统的关键问题是推 荐技术或推荐算法.协同过滤推荐算法是当前研究 1 协同过滤推荐技术及存在的问题 的热点,其最大优点是不需要分析对象的特征属 1.1协同过滤技术 性,对推荐对象没有特殊要求,在数据密度达到一 协同过滤是目前研究最多、受关注度最高的电 定程度时表现出较好的推荐质量¨J.传统的协同 子商务推荐技术.它一般采用最近邻技术(K Nea. 过滤算法的数据来源需要客户主动参与为商品评 rest Neighbor,KNN) ,利用客户的历史偏好信息 分,另外,现有的推荐系统,无论高价值客户还是低 计算用户之间的距离.然后利用目标客户的最近邻 价值客户都采用同样的推荐方式,没有实现真正意 居对商品评价的加权平均值来预测他对特定项 义上的个性化.本文提出将客户关系管理领域的 (商品)的偏好程度.系统根据这一偏好程度来对 RFM模型引入到推荐机制中,利用RFM模型在反 目标客户进行推荐.协同过滤算法主要有3个步 收稿Et期:2009—05~26 作者简介:孙玲芳(1963一),男,江苏镇江入,教授,研究方向为管理信息系统与电子商务.E—mail:slf0308@163.COIl1 286 江苏科技大学学报(自然科学版) 第24卷 骤:评分表示、邻居形成和推荐生成. 1)评分表示:客户输入的评分数据可以用一 式中,R 是客户c, 对已评价商品的平均评分,sim (i,m)是客户 与最近邻集合Ⅳ中的客户U 的 个M X N阶矩阵 ( ,Ⅳ)来表示,如表1所示,其 中M行代表 个用户,Ⅳ列代表Ⅳ个商品, , 代 相似系数,尺…,是客户 ,对客户 未评价商品 对已评价商品的平均评 的评分, 是客户 表客户 对商品 的评分. 表1用户一商品评分矩阵 Table 1 User.item matrix 分,Ⅳ是最近邻的个数,P 值越大表示用户 对 未评价商品 ,的可能偏爱程度越高.计算出用户 对所有未评分商品 ,的预测值P ,之后,对P , 按降序进行排序,把排名靠前的 个商品提供给目 标客户 ,作为该客户的top.几推荐集. 1.2协同过滤推荐机制中所存在的问题 1)数据来源带有主观性.传统的协同过滤推 荐算法的输入即数据来源是客户对商品项的评 分,需要客户主动参与,而实际上许多客户在购 2)邻居形成:协同过滤算法的核心是根据用 买商品后不愿意参与评价,并且这些评分带有一 定的主观性. 户一商品评分矩阵发现需要推荐服务的目标客户的 最近邻居,客户之问相似性的度量方法主要有以下 2种. 2)推荐方式单一.现有的协同过滤推荐系统 以及基于其他技术的推荐系统在推荐方式上都比 较单一,没有对客户进行区分,尤其没有从客户价 值的角度进行区分,进而采取差异化的推荐策略. 不论是高价值客户还是低价值客户都采用相同的 推荐方式,不利于提高客户(尤其是高价值客户) 的忠诚度. ①余弦相似性度量,将客户评分看作是n维 商品项空间上的向量,客户间的相似性通过向量问 的余弦夹角度量.设U 和 在n维商品项空间上 的评分分别表示为向量i和.,,则客户U 和 ,之间 的相似性sie(i,.r )为 sim(i, ) c0s( (1)2 RFM模型 2.1 RFM模型概述 ②相关相似性度量,即Pearson相关系数度 量.设客户 和客户 共同评分过的商品项目集 合用I =I nJ,表示,则客户U 和客户 的相似 性sie(i,.r,)为 RFM模型是客户关系管理领域里的一种客户 行为分析模型 ,其中 (Recency)代表最近购买 时间,指上次购买至现在的时间间隔;F(Frequen- ∑(R 一R )( , 一 ) sier( , ):— 兰 二 ; —_二====三= .cy)代表购买频率,指的是某一期间内购买的次数; /∑( , 一Ri ./∑( ,。一 ) Elij 、/ E (2) (Monetary Values)代表总购买金额,指的是某一 期间内购买商品的金额.RFM又被称为客户响应 模型或客户价值分析模型 j. 2.2 RFM模型的特点 式中, 和 分别表示客户 和客户 对商品 项,。的评分,R NRj分别表示客户u 和客户 在 RFM模型在反映客户购买偏好方面具有良好 的表征性.研究发现R值越小,客户越有可能与企 各自所有已评价的商品项目上的评分的平均值. 3)推荐生成:在得到最近邻居用户集数据后, 下一步就是通过预测评分产生推荐.从目标用户的 业达成新的交易.F值越大,客户越有可能与企业 最近邻居中产生Ⅳ项产品推荐.设目标用户 的 最近邻居集合用Ⅳ表示,则用户U 对任意为评价 商品项 ,的预测评分 Ⅳ达成新的交易. 值越大,客户越有可能与企业达 成新的交易.所以RFM模型可以通过对这3个指 标的分析反映出客户对某种商品的偏好程度. ,可以通过用户 对最近 RFM模型在反映客户价值方面同样具有良好 的表征性.它是衡量客户价值和客户创利能力的重 要工具和手段.该模型通过一个客户的近期购买行 邻居集合Ⅳ中商品项的评分得到,计算方法如下 一=R + ∑ im(i,m)・( …,~Rm) L—__—————~ (3) 为、购买的总频率以及购买的总金额等3项指标来 描述该客户的价值状况.如果与该客户打交道的时 间足够长,也能够较为精确地判断该客户的长期价 nl=】 ∑sim( ,m) 第3期 孙玲芳,等:基于RFM模型和协同过滤的电子商务推荐机制 的RFM综合值,公式如下: ,RFM= ’ ‘ ‘X'm 287 值(甚至是终身价值),通过改善3项指标的状况, 从而为更多的营销决策提供支持 . (6) 3 基于RFM模型和协同过滤的推 式中,]RFM表示客户的RFM ̄,合值, , , 分别 荐算法设计 协同过滤推荐的基础是客户对商品的偏好信 息,而这一信息是由客户对商品的评价来反映的, 带有主观性.然而,RFM模型其中的一个特点就是 反映客户购买偏好,并且RFM模型的数据来源是 客户的历史交易数据,这些数据就存储在电子商务 网站的交易数据库中,容易获取,它不需要客户主 动参与评价,是客观真实的数据.因此,本文提出将 RFM模型与协同过滤进行结合,设计出一种基于 二者的个性化推荐算法,算法的处理过程如图1 嚼一 图1基于RFM模型和协同过滤的推荐算法处理过程 Fig.1 Procedure of the recommendation algorithm based on RFM model and collaborative filtering 3.1 R,F,M各指标的权重分配 采用专家调查法在电子商务网站中做调研, 对调研的结果应用层次分析法(AHP)进行分析, 把相关专家的主观经验与统计分析方法相结合, 科学确定 ,F, 各指标的权重.根据AHP的一 般处理步骤 J,将行业专家对 ,F, 各指标的 重要性进行两两比较,构造判断矩阵;然后用方 根法计算被比较指标的相对权重;最后进行一致 性检验,得到R,,, 各个指标的权重: , ,, . 3.2 R,F,M值的标准化 由于尺,F, 各值的度量单位各不相同,数据 的取值也存在很大的差异,所以需要对数据进行标 准化处理,标准化公式 X =(X— )/( 一X ) (4) X =( 一X)/( 一 ) (5) 式中, 是标准化的R,F,M值, 是原值, 是该 指标的最大值, 是该指标的最小值.由于F, 指标的影响是正向的,所以适用式(4),而 指标 的影响是负向的,适用式(5). 3.3计算客户的RFM综合值 将标准化的R,F,M各值加权求和,得到客户 表示R,F,M各指标的权重, :, ;,x,m分别表示标 准化后的R,F,M值. 3.4 RFM模型与协同过滤的结合 将式(6)计算得到的RFM模型的输出结果 ]RFM值作为原协同过滤的相关相似性度量的输入. , 和, FMI 表示客户U 和客户 购买商品 时 生成的, 值,IRrM ̄和/RFMi分别表示客户Ui和客户 在各自所有已购买过的商品项目上的平均加权 /RFM值, 表示客户 和客户 共同评分过的商 品项目集合.得到的公式如下 sim(i, )= (,RFM 一IRrM )(,盯M 一IRFM,) — 兰 ===三=_ =二二===三 (7) √ ,(,R ~RFM √荟 (,RF 一,R )2 根据式(3)预测目标客户U 对未购买商品的 偏好程度,并排列得到top—n推荐提供给目标 客户. 客户购买某项商品时产生的RFM数据可以反 映客户对该商品的偏好,通过客户偏好产生推荐正 是协同过滤的核心思想,所以RFM模型便有了与 协同过滤结合的切合点.从RFM各个指标的涵义 可以看出,RFM模型的数据来源是客户在电子商 务网站的历史交易数据,以RFM模型数据(经过 处理和转换后的RFM综合值)作为协同过滤的输 入,便可以解决协同过滤的数据来源依赖客户评分 的问题. 4 差异化的电子商务推荐策略的 设计 在以客户为中心的市场环境中,客户是利润的 来源,谁能给客户提供更好、更满意、更具有个性化 的产品和服务,谁就能赢得市场.电子商务推荐就 是为满足客户的个性化需要而产生的,并且已经实 现了推荐内容的个性化,但是却没有实现推荐方式 的个性化或者说是推荐策略的差异化.然而只有做 到内容和形式两方面的个性化才是从真正意义上 实现了客户需求的个性化.另外,对于电子商务网 站而言,根据帕累托2/8法则,差异化策略意味着 在高价值客户身上投入较多的成本,在低价值客户 身上则投入相对较少的成本 ,这将有利于网站 以有限的成本获得最高的客户响应或最大的利润 288 回报. 江苏科技大学学报(自然科学版) 第24卷 客户定为网站的一一般重要客户.网站可以针对这类 进行合理的客户细分,针对每类客户进行分析 是制定个性化或差异化的推荐策略的关键问题.上 文已提到RFM模型是CRM领域一种有效的客户 客户推荐一些打折商品,并且有低价促销活动的时 候可以及时发送邮件给该类客户. E类客户的特点是交易频率较高,交易金额较 大,这类客户比较偏爱网上购物,是电子商务网站 重要的客户资源,但是他们最近已经很久没有光顾 本网站,这说明这类客户有可能在渐渐流失,所以 行为分析模型,并且在反映客户价值方面具有良好 的表征性.因此,本文提出根据RFM所表现的不同 的客户价值来细分和分析客户,并制定有针对性的 电子商务推荐策略. 4.1客户细分 此处使用K.means聚类法来实现客户细分,它 是目前最常用的聚类方法,且简单有效,可以通过 SPSS统计软件完成 . 由于RFM中3个指标与其相对应的平均值相 比有大于(等于)或小于平均值的两种可能,因此 可初步将客户分为2 X 2 X 2:8种类别,如果单个 指标大于均值则用“T”表示,如果单个指标小于 均值则用“』”表示(表2). 表2客户分类表 Table 2 Classilfed customers 4.2客户分析与差异化推荐策略的制定 A类客户的特点是最近与网站有过交易,交易 频率较高,交易金额较大,可以将这类客户定为网 站的高价值客户.电子商务网站可定期发送有关商 品推荐的电子邮件,每逢重要节日或客户生日的时 可将祝福语随附在商品推荐信息后发送给客户,以 获得此类高价值客户的高满意度和忠诚度. B类客户虽交易频率较低,但最近与网站有过 交易且交易金额较大,可以将这类客户定为网站的 重要发展客户.网站在推荐商品的同时可以发送类 似邀请函的信息,邀请客户加入网站的虚拟社区, 如BBS、聊天室等,目的就是要保持与客户的联系, 使客户与网站形成更多的互动以提高其交易频率, 向A类客户转换. C类客户和D类客户的共同特点就是在最近 的某个时间购买了网站的商品,也就是最近比较关 注该网站,但是他们的交易金额较少,可以将这类 可将其定为重要挽留客户.电子商务网站针对这类 客户可采用适用于A类客户的推荐策略,争取挽 留住这类客户,并使其转换为A类客户. F类客户和G类客户的共同特点是有很长一 段时间没有与网站交易了,也就是说他们对网站的 关注度不高或可能已经流失,可将其定为一般客 户,采取普通的推荐策略. H类客户的特点是已经很久没有在网站进行 交易,交易频率低,交易金额少,网站可将其定为无 价值客户.为了节省有限的成本,可采取普通的推 荐策略. 5实验及结果分析 5.1数据集 本实验使用的数据集是从A电子商务网站后 台数据库中抽取的560名顾客的2 350条购买交 易记录.整个数据集需要进一步划分为训练集和测 试集,设定r=0。8,即整个数据集的80%作为训练 集,20%作为测试集. 5.2评估标准 本文使用Mobasher给出的评价测度 J,包括 覆盖率(Coverage,C)、准确率(Precision,P)以及 ,.测度(F.measure,F )3个指标,各个指标的定义 如下: C=正确推荐的产品数/顾客实际购买的产品数 P=正确推荐的产品数/所有条件的产品数 2×C X P =一 f C+P) 在这3个指标中,C和P实际上是一对相互矛 盾的指标,为了更好的评价最终的推荐质量,用, 来综合这2个指标,一般而言,具有较好的F (即 覆盖率和准确率都较好)的模型质量较好. 5.3实验方案及结果分析 本实验的目的是检验本文提出的基于RFM模 型和协同过滤推荐算法的推荐效果,实验采用相同 的数据集和, 评估标准,将新算法和传统的协同 过滤算法进行比较.在计算产品相似性时,由于余 弦相似性度量方法比较容易实现,预测速度比较 第3期 孙玲芳,等:基于RFM模型和协同过滤的电子商务推荐机制 289 快,而且预测精度也比较高,所以在本次实验中选 择余弦相似性作为用户问相似性的度量标准.实验 按照top—n值分别为3,5,10,15,20进行计算和对 比分析,计算结果见表3.根据表3可以得出本文 算法和传统协调过滤算法的性能比较(图2). 表3两种推荐算法的F 比较 Table 3 Two kinds of recommendation algorithms comparing in F 0 7O O.65 0.6O O.55 O 50 O 45 0.4O top一3 top一5 top-・t0 top・15 top一20 top— 图2两种推荐算法的性能比较 Fig.2 Performance comparison of two kinds of recommendation algorithms 从实验结果可以看出,在推荐不同的产品个数 (top-n值)的情况下,基于RFM模型和协同过滤推 荐算法具有较大的F ,由此可得本文提出的推荐 算法比传统算法有更好的推荐效果. 6 结论 1)针对原算法存在的数据来源依赖客户主观 评分这一缺陷,利用RFM客户行为分析模型在反 映客户购买偏好方面的良好表征性对原协同过滤 算法进行了改进,使数据来源变为客户的历史交易 记录且易于获取. 2)目前的推荐系统在推荐方式的个性化方面 还有所欠缺,没有考虑到针对个别客户尤其是高价 值客户和潜在高价值客户制定差异化的推荐方式, 本文利用RFM模型在反映客户价值方面的良好表 征性对不同价值的客户予以区分,并根据帕累托 2/8法则制定了有针对性的推荐策略,用有限的成 本,追求最高的客户忠诚度,实现网站利润的最 大化. 参考文献(References) [1]刘平峰,聂规划,陈冬林.电子商务推荐系统研究综 述[J].情报杂志,2007(9):46—53. Liu Pingfeng,Nie Guihua,Chen Donglin.A survey:e— lectronic commerce recommender systems[J].Journal of Information,2007(9):46—53.(in Chinese) [2]Jiawei H,Micheline K,范明,等,泽.数据挖掘:概念与 技术[M].北京:机械工业出版社,2001. [3]罗岚.CRM中的客户分群及分类的数据挖掘算法实 现[D].四川成都:四川大学,2005. [4]赵晓煜,黄小原,孙福权.基于RFM分析的促销组合 策略优化模型[J].中国管理科学,2005,13(1):60— 64. Zhao Xiaoyu,Huang Xiaoyuan,Sun Fuquan.An optimi— zation model for promotion mix strategy based on RFM a— nalysis[J].Chinese Journal of Management Science, 2005,13(1):60—64.(in Chinese) [5]Liu D R,Shi Y Y.Integrating AHP and data mining for product recommendation based on customer lifetime value [J].Information&Management,2005,42(3):387— 400. [6]秦寿康.综合评价原理与应用[M].北京:电子工业出 版社,2003:23—25. [7]孟庆良,韩玉启,邹农基.基于客户价值的供应商供 应能力分配的决策模型[J].江苏科技大学学报:自 然科学版,2006,20(6):92—96. Meng Qingliang,Han Yuqi,Zou Nongji.A decision model of supply competence allocation based on customer value[J].Journal of Jiangsu University of Science and Technology:Natural Science Edition,2006,20(6):92— 96.f in Chinese) [8]周欢.基于RFM分析模式的零售业客户分群实现过 程[J].金陵科技学院学报,2008,24(1):33—36. Zhou Huan.The process of cluster customers based on the RFM model[J].Journal ofJinling Institute of Technolo— gY,2008,24(1):33—36.(in Chinese) [9]Mobasher B,DM H H,Luo T,et a1.Discovery and eval— uation of aggregate usage profiles for web personalization [J].Date Mining and Knowledge Discovery,2002,6 (1):61—82. (责任编辑:缪文桦) 

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- worldimage.cn 版权所有 湘ICP备2024080961号-5

违法及侵权请联系:TEL:199 18 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务