站内搜索

        资讯分类
        产品搜索
        • 关键字:
        • 商品分类:
        •  
        您现在的位置:澳门金沙ag官网党建园地 > 一文读懂Bayesian Personalized Ranking算法

        字号:   

        一文读懂Bayesian Personalized Ranking算法

        浏览次数: 日期:2019-04-03

        【原创稿件】就像哲学有不同的流派一样,推荐系统的算法设计思路也可以分为不同的流派。 排序学习恰恰就是其中的一种流派。 熟悉RecSys等推荐系统国际会议的从业者可能会发现,自2010年以后的若干年内,陆续出现了许多基于排序学习的推荐系统算法。

        从BayesianPersonalizedRanking(BPR)到后续的CollaborativeLessisMoreFiltering(CLiMF)以及GapFM和XCLiMF等算法,在推荐系统领域出现了百家争鸣,百花齐放的局面。

        排序学习的设计思想与协同过滤和矩阵分解以及随后出现的深度学习的主要不同在于排序学习把推荐系统看成是一个排序的问题。 也就是如何给用户推荐商品的问题变成了如何在用户有可能喜欢的物品集合中对物品排序的问题。

        这个过程中算法不纠结于对于用户喜欢的物品的评分进行准确预测,而是把物品之间的顺序关系作为优化的目标。

        排序学习的英文名称是LearningtoRank,根据优化目标的不同,共分为三类:基于点的排序学习(Point-wiseLearningtoRank),基于关系对的排序学习(Pair-wiseLearningtoRank),以及基于列表的排序学习(List-wiseLearningtoRank)。

        基于点的排序学习本质上就是传统的分类算法,例如SVM,逻辑回归等都属于基于点的排序学习,这类排序学习通常被认为是排序学习的退化形式;基于关系对的排序学习强调的是物品集合中物品两两之间的关系,本章将要展开讨论的BayesianPersonalizedRanking算法就属于这一类算法;基于列表的排序学习强调的是物品集合中物品列表的整体排序关系,后续章节中将要展开讨论的CollaborativeLessisMoreFiltering算法属于这个范畴,这类算法将物品集合中物品评分的整体排序关系作为最终的优化目标。

        BayesianPersonalizedRanking的整体思路如下:假设我们现在有N个视频,每个视频有两种用户行为:被用户点击,没有被用户点击。 现在设定用户给物品的评分如下:被用户点击过的视频得分+1,从没有被用户点击过的视频中进行采样得到一部分视频,这部分视频被认为是用户不喜欢的视频,得分-1。 BayesianPersonalizedRanking首先假设用户对物品的评分背后的模型是某个常见模型,比如矩阵分解模型,也就是用户对物品的评分R=U*V,其中U是用户向量,而V是物品向量。 算法假定所有得分+1的物品和所有得分-1的物品,如果用评分矩阵R重新对物品进行打分,原本得分+1的物品的新得分将高于原本得分-1的物品的新得分。 算法的本质诉求是在最大可能的满足原有的+1物品得分高于-1物品得分的排序对成立的情况下,倒推出R评分分解后的U和V向量。 最后通过计算U和V的乘积,得到用户对物品的完整评分矩阵,完成整个算法过程。

        下面我们详细的展开算法进行讨论:首先定义有序关系,如果用户喜欢物品I1而不喜欢物品I2,则存在有序关系I1uI2。 定义评分矩阵为参数theta,建立需要被优化的贝叶斯模型。 用u表示有序对(I1,I2),建立最大似然函数求解公式如下:,其中,而是sigmoid函数,。 这里定义的贝叶斯模型是一个一般性的框架,具体的算法模型实现由的计算方式而定。 BayesianPersonalizedRanking优化的指标是AUC函数。 AUC函数在BayesianPersonalizedRanking问题中被归约为以下形式:其中采用随机梯度下降求解参数得到:,可以看到就是用户u对物品i和物品j的评分之差。 我们已经得到了随机梯度下降过程中的参数计算方法,在实际应用中只需要将用具体的模型替代即可,比如协同过滤,或者矩阵分解。 我们给他们分别用代号BPR-CF和BPR-MF等表示。 现在假定是由矩阵分解模型计算得到的。 也就是=UV=,带入随机梯度下降公式计算可得到:类似的,我们可以得到基于协同过滤的BPR的梯度下降公式。 BPR因为是计算两两有序对之间的关系,所以在实际的计算过程中涉及到的数据量可能非常庞大。

        另外,在最后进行评分预测时需要进行庞大的矩阵运算。 通常在实际的计算过程中采取了抽样等方法来降低计算量,而不是采用全量数据进行计算。 BPR是推荐系统中基于对的排序学习中的比较重要的一类方法,广泛应用在推荐系统的各种实践之中。 汪昊,区块链公司科学家,美国犹他大学本科/硕士,对外经贸大学在职MBA,在百度、新浪、网易、豆瓣等公司有超过8年的技术研发经验,曾担任恒昌利通大数据部总监。 擅长机器学习、数据挖掘、计算机图形学和科学可视化等技术。 在TVCG和ASONAM等国际会议和期刊发表论文10篇。 本科毕业论文获国际会议IEEESMI2008最佳论文奖。

        【51CTO原创稿件,合作站点转载请注明原文作者和出处为】【责任编辑:TEL:(010)68476606】。

        所属类别: 党建园地

        该资讯的关键词为:

        澳门金沙ag官网 | 版权所有                                             公司简介 | 人才招聘 | 在线留言 | 联系我们
        地址:广东省东莞市石碣水南家仁工业区 电话:86-769-86852439 86634560 传真:86-769-86852439 E-mail: ; wm03@www.donfineart.com
        Copyright(c) 2012 www.donfineart.com All right reserved. 中企动力提供网站建设 粤ICP备05032685号 后台管理