童话说说技术创业美文职业
快好知
职业母婴
职场个人
历史治疗
笔记技能
美文纠纷
幽默家庭
范文作文
乐趣解密
创业案例
社会工作
新闻家居
心理安全
技术八卦
仲裁思考
生活时事
运势奇闻
说说企业
魅力社交
安好健康
传统笑话
童话初中
男女饮食
周易阅读
爱好两性

基于LUCENE实现自己的推荐引擎

8月8日 亡命徒投稿
  采用基于数据挖掘的算法来实现推荐引擎是各大电子商务网站、SNS社区最为常用的方法,推荐引擎常用的ContentBased推荐算法及协同过滤算法(ItemBased、Userbased在电子商务推荐系统入门v2。0、电子商务推荐系统入门基础中已经有所阐述。但从实际应用来看,对于大部分中小型企业来说,要在电子商务系统完整采用以上算法有很大的难度。
  1、常用推荐引擎算法问题
  1)、相对成熟、完整、现成的开源解决方案较少
  粗略分来,目前与数据挖掘及推荐引擎相关的开源项目主要有如下几类:
  数据挖掘相关:主要包括Weka、RProject、Knime、RapidMiner、Orange等
  文本挖掘相关:主要包括OpenNLP、LingPipe、FreeLing、GATE等,具体可以参考LingPipe’sCompetition
  推荐引擎相关:主要包括ApacheMahout、Duineframework、SingularValueDecomposition(SVD),其他包可以参考OpenSourceCollaborativeFilteringWritteninJava
  搜索引擎相关:Lucene、Solr、Sphinx、HibernateSearch等
  2)、常用推荐引擎算法相对复杂,入门门槛较低
  3)、常用推荐引擎算法性能较低,并不适合海量数据挖掘
  以上这些包或算法,除了LuceneSor相对成熟外,大部分都还处于学术研究使用,并不能直接应用于互联网大规模的数据挖掘及推荐引擎引擎使用。
  2、采用Lucene实现推荐引擎的优势
  对很多众多的中小型网站而言,由于开发能力有限,如果有能够集成了搜索、推荐一体化的解决方案,这样的方案肯定大受欢迎。采用Lucene来实现推荐引擎具有如下优势:
  1)、Lucene入门门槛较低,大部分网站的站内搜索都采用了Lucene
  2)、相对于协同过滤算法,Lucene性能较高
  3)、Lucene对TextMining、相似度计算等相关算法有很多现成方案
  在开源的项目中,Mahout或者DuineFramework用于推荐引擎是相对完整的方案,尤其是Mahout核心利用了Lucene,因此其架构很值得借鉴。只不过Mahout目前功能还不是很完整,直接用其实现电子商务网站的推荐引擎尚不是很成熟。只不过从Mahout实现可以看出采用Lucene实现推荐引擎是一种可行方案。
  3、采用Lucene实现推荐引擎需要解决的核心问题
  Lucene擅长TextMining较为擅长,Lucene在contrib包中提供了MoreLikeThis功能,可以较为容易实现ContentBased的推荐,但对于涉及用户协同过滤行为的结果(所谓的RelevanceFeedback),Lucene目前并没有好的解决方案。需要在Lucene中内容相似算法中加入用户协同过滤行为对因素,将用户协同过滤行为结果转化为Lucene所支持的模型。
  4、推荐引擎的数据源
  电子商务网站与推荐引擎相关典型的行为:
  购买本商品的顾客还买过
  浏览本商品的顾客还看过
  浏览更多类似商品
  喜欢此商品的人还喜欢
  用户对此商品的平均打分
  因此基于Lucene实现推荐引擎主要要处理如下两大类的数据
  1)、内容相似度
  例如:商品名称、作者译者制造商、商品类别、简介、评论、用户标签、系统标签
  2)、用户协同行为相似度
  例如:打标签、购买商品、点击流、搜索、推荐、收藏、打分、写评论、问答、页面停留时间、所在群组等等
  5、实现方案
  5。1、内容相似度
  基于LuceneMoreLikeThis实现即可。
  5。1、对用户协同行为的处理
  1)、用户每一次协同行为都使用lucene来进行索引,每次行为一条记录
  2)、索引记录中包含如下重要信息:
  商品名、商品id、商品类别、商品简介、标签等重要特征值、用户关联行为的其他商品的特征元素、商品缩略图地址、协同行为类型(购买、点击、收藏、评分等)、Boost值(各协同行为在setBoost时候的权重值)
  3)、对评分、收藏、点击等协同行为以商品特征值(标签、标题、概要信息)来表征
  4)、不同的协同行为类型(例如购买、评分、点击)设置不同的值setBoost
投诉 评论 转载

网页设计师应具备的六大旁门左道我在前面的《抄袭网页设计师必备的本领之一》讲了设计师提升设计能力的一个方法。那么,除了提升设计能力外,想做为一个优秀的设计师还有些方面需要了解甚至是学习才能设计好网页。不得不说……互联网产品设计零碎记与部门同事做了个小小的交流,话题杂而浅,在此做一个小纪录。1、什么是设计工业设计、环境设计、建筑设计、平面设计、网页设计、服装设计、信息设计日常生活中,随处可听可见……AB测试:实现方法上文介绍了AB测试的基本概念,接下来我们继续探讨如何实现AB测试。我们先来看一个图:(注:感谢Algo提供本图。)上图展示了AB测试的实现原理。从左……基于LUCENE实现自己的推荐引擎采用基于数据挖掘的算法来实现推荐引擎是各大电子商务网站、SNS社区最为常用的方法,推荐引擎常用的ContentBased推荐算法及协同过滤算法(ItemBased、Userba……优雅地扩大链接响应区域合理地扩大页面链接响应区域可以提高网页的易用性。同时还要兼顾到链接的交互一致性以及视觉上的平衡,就需要做一些特殊的处理。实例一:一张图配一个链接。常规的做法有以下几……交互设计的“拟人趋势”,从海明威说起“海明威小说里的对话跟别人都不太一样。大部分作家写的对话都特别有逻辑,他们的对话都很连贯、很有逻辑。而海明威的对话,表面看上去好像是没逻辑的,有时候甚至是互相对不上,断断续续的……手机交互设计师的专业度手机交互设计师的专业度是对设计的分析能力、根据主要设计原则组织设计元素和对细节的挑剔程度,具体体现工作中的以下几个方面:美感。作为设计师,需要具备最基本的审美观。不管作品……从“告诉用户在哪里”说开去在网页设计里一提到“告诉用户在哪里”,我们最先想到的控件是面包屑,它不仅可以告诉用户在哪里,还能清晰的展现你所处的层级。当然还有一个控件也能“告诉用户在哪里”浏览器标题。而这两……前端开发中的一些用户体验细节用户体验已经是一个老生常谈的话题了。我非常赞同某位达人所说的,用户体验设计应该贯穿于产品从萌芽到出生的整个过程,产品原型、视觉设计、前端开发、后端开发甚至还包括产品测试大家都应……PeterSkillman浅谈用户体验创新“一款顶级设备要素构成中,设计只占5。市场营销、销售、分流以及采购构成了余下的95。”最近,ZUR网站有幸近距离与新任NokiaMeeGo设备用户体验和服务总负责人Pet……抄袭网页设计师必备的本领之一在前面的文章《减少你服务中的痛苦服务于优质的网站设计客户》里面谈了找优质客户。那么设计师如想确保优质客户继续合作下去。那首要就是要保证客户能够认可你的设计能力。关于这个话……从用户角度看百度说吧用户体验恐惧与信任最近一段的时间里,IT界里三大巨头一共有三条头条新闻,第一是Apple在国内发行Ipad掀起Apple迷的发狂般的购买高潮,第二就是微软发行InternetExplorer9装……
Axure7。0教程:实现猜数字小游戏产品设计流程系列:如何进行原型设计(上)Axure8。0实例模拟一个上传图片的原型Axure交互小技巧1:百度一下,你就知道Axure8。0实例自定义倒计时制作流程Axure实例中继器的增删改查,来实现从商品列表页到详情页Axure原型教你使用自适应视图构建界面两位资深设计师谈设计和工具关于Axure进度条制作的方法,这篇文章讲得最全面!很实用的干货浮动固定菜单与楼层导航实践Axure设计:商城类列表页页面布局选择(附源文件下载)Axure教程做一个简单的筛选和排序功能
我心中的偶像真正诠释智慧议论文年学校上半年工作总结偶尔失失眠淮河为什么不入海孩子嘴唇裂口又出血,还忍不住撕嘴皮,大夫的处理方式有些意外市场营销在我国的发展及未来趋势【歌词】斗争歌手:宋家皇朝热博聚热点网 碰瓷遇大神撒谎苹果iOS15iPadOS15watchOS8tvOS15公白居易的著名诗歌名言

友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找作文动态热点娱乐育儿情感教程科技体育养生教案探索美文旅游财经日志励志范文论文时尚保健游戏护肤业界