打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
Hadoop基于内容的推荐算法如何实现的?

公司有个对Hadoop比较感兴趣的java的实习生妹纸,昨天问我基于内容的推荐原理是什么,我简单给他讲了一下,今天也在这里介绍一下。

基于内容推荐(Content Based)算是最早被使用的推荐方法,它依据用户之前喜欢的产品(item),给用户推荐和他之前喜欢的产品类似的产品。

例如,一个推荐餐厅的系统可以根据用户过去喜欢较多的火锅店而给他推荐火锅店。CB最初应用于信息检索系统中,所以很多信息检索及过滤的方法都适用于CB。

(java人,java人,java人,java人,java人,java人,java人,java人,java人,java人)

CB的过程一般包括以下三步:

1) Item Representation:为每个item抽取出一些特征(也就是item的content了)来表示此item;

2) Profile Learning:利用一个用户之前喜欢(及不喜欢)的item的特征数据,来分析出此用户的喜好特征(profile);

3) Recommendation Generation:通过比较上一步得到的用户profile与候选item的特征,为此用户推荐一组相关性最大的item。

(java人,java人,java人,java人,java人,java人,java人,java人,java人,java人)

举例说明上面3个步骤,对于个性化阅读来说,1篇文章就是1个item。

第一步

首先要从文中提取出能够代表它们的属性。常用的方式就是利用出现在文中的词语来代表,而每个词赋予的权重依据信息检索中的tf-idf来计算。

对于这篇文章来说,词“CB”、“推荐”和“喜欢”的权重会较大,而“火锅”这个词的权重会较低。利用这种方式,就可以使用具体的一个向量来表示一篇抽象的文章了。

(hadoop组,hadoop组,hadoop组,hadoop组,hadoop组,hadoop组,hadoop组,hadoop组)

第二步

根据用户之前喜欢什么类型的文章来刻画其喜好的profile,最简单的方式就是把用户所有喜欢的文章相对的向量取平均值来作为此用户的profile。

比如,某个用户经常关注与推荐系统相关的文章,那么他的profile中“CB”、“CF”和“推荐”的权重值就会比较高。

第三步

在得到用户的profile后,CB就能够根据所有item与此用户profile的匹配度对其进行文章推荐。

一个常用的相关度计算方法是cosine。最终把候选item里与此用户最相关(cosine值最大)的N个item作为推荐返回给此用户。

(hadoop组,hadoop组,hadoop组,hadoop组,hadoop组,hadoop组,hadoop组,hadoop组,hadoop组)

我是如何4个月学会的Hadoop?

作为过来人,我知道学一门技术很难,所以希望能给大提供有用的知识。

我最开始买了几本比较权威的书,自己看书学但是效率很低,找不到方向和重点。后来在论坛认识了某渡的哥们,他给了我一套视频。

从0基础入门Hadoop,到Hadoop生态圈中各个组件的讲解,最最厉害的还是一些真实的商业案例,让我见识到了真实的生产环境,不然都不知道该学什么才适合工作。我也是跟着视频才找到的方向,到学会的Hadoop。

我把视频的获取方式留在最后一张图片右下角,如果你准备学Hadoop的话可以去要最新版的,我的有点老了。

注明:一点

最后我想说,看过文章不思考、不行动知识永远不会变成自己的。

共勉。

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
推荐算法(2):基于内容的推荐
Linux下jdk的安装
我是个Java开发者,我到底要不要学大数据开发?
安装完Hadoop之后,命令行输入hadoop却找不到命令的解决方法
大数据环境搭建之 Hadoop集群搭建准备(1)
用户需求模式协同构建的初步探索
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服