童话说说技术创业美文职业
投稿投诉
职业母婴
职场个人
历史治疗
笔记技能
美文纠纷
幽默家庭
范文作文
乐趣解密
创业案例
社会工作
新闻家居
心理安全
技术八卦
仲裁思考
生活时事
运势奇闻
说说企业
魅力社交
安好健康
传统笑话
童话初中
男女饮食
周易阅读
爱好两性

个性化推荐十大挑战(下)

5月13日 海岸线投稿
  本文为个性化推荐十大挑战最后一部分,主要介绍了推荐系统效果评估,用户界面与用户体验,多维数据的交叉利用,社会推荐。
  接上文:个性化推荐十大挑战(中)
  挑战七:推荐系统效果评估。
  推荐系统的概念提出已经有几十年了,但是怎么评价推荐系统,仍然是一个很大的问题。常见的评估指标可以分为四大类,分别是准确度、多样性、新颖性和覆盖率,每一类下辖很多不同的指标,譬如准确度指标又可以分为四大类,分别是预测评分准确度、预测评分关联、分类准确度、排序准确度四类。以分类准确度为例,又包括准确率、召回率、准确率提高率、召回率提高率、F1指标和AUC值。图5总结了文献中曾经出现过的几乎所有的推荐系统指标。之所以对推荐系统的评价很困难,是因为这些指标之间并不是一致的,一般而言,多样性、新颖性和覆盖率之间一致性较好,但不绝对,而这三者往往都和准确度有冲突。如前所述,解决多样性和精确性之间的矛盾本身就是一个重大的挑战!更不幸的是,即便是同一类指标,其表现也不完全一致。举个例子说,一些基于SVD分解的算法,以降低均方根误差(参考图5)为目标,在预测评分精确性方面表现上佳,但是在推荐前L个商品的准确率和召回率(参考图5)方面则表现得很不如人意,有些情况下甚至还不如直接按照流行度排序的非个性化算法。
  图5介绍的那些指标都是基于数据本身的指标,可以认为是第一层次。实际上,在真实应用时,更为重要的是另外两个层次的评价。第二个层次是商业应用上的关键表现指标,譬如受推荐影响的转化率,购买率,客单价,购买品类数等等,第三个层次是用户真实的体验。绝大部分研究只针对第一个层次的评价指标,而业界真正感兴趣的是第二个层次的评价(譬如到底是哪个指标或者哪些指标组合的结果能够提高用户购买的客单价),而第三个层细最难,没人能知道,只能通过第二层次的效果来估计。如何建立第一层面和第二层面指标之间的关系,就成为了关键,这一步打通了,理论和应用之间的屏障就通了一大半了。
  图6:Facebook页面上用户注意力集中的区域的分布,其中红色的区域是用户注意力最集中的区域,黄色次之,绿色再次之,白色最次。
  挑战八:用户界面与用户体验。
  这个问题更多地不是一个学术性质的问题,而是从真实应用中来的问题。十年前就有学者指出,推荐结果的可解释性,对于用户体验有至关重要的影响用户希望知道这个推荐是怎么来的。基于相似性的推荐(例如协同过滤)在这个问题上具有明显的优势,譬如亚马逊基于商品的协同过滤的推荐〔72〕在发送推荐的电子邮件时会告诉用户之所以向其推荐某书,是因为用户以前购买过某些书,新浪微博基于局部结构相似性的“关注对象推荐”在推荐的同时会说明哪些你的朋友也关注过他们。相对地,矩阵分解或者集成学习算法就很难向用户解释推荐结果的起源。一般而言,用户更喜欢来自自己朋友的推荐而不是系统的推荐,这一点在后面讲社会推荐的时候还会详细提到。另外,好的界面设计,能够让用户觉得推荐的结果更加多样化,更加可信。
  实际应用时,推荐列表往往含有很多项,这些推荐项最好能够区分成很多类别,不同类别往往来自于不同的推荐方法,譬如看过还看过(浏览过本商品的客户还浏览过的商品)、买过还买过(购买过本商品的客户还购买过的商品)、看过最终购买(浏览过本商品的客户最终购买的商品)、个性化热销榜(个性化流行品推荐)、猜你喜欢(个性化冷门商品推荐)等等。当然,每个推荐项呈现的结果往往都来自复杂的算法,绝不仅仅象它们的名字听起来那么简单。另外,推荐栏呈现的位置对于推荐的结果影响也很大,因为同一个网页上不同位置对于用户注意力的吸引程度大不一样。图6给出了EyeTrackShop针对Facebook个人页面不同位置受关注程度的示意,可以看出,不同的位置受到的关注相差很大。
  如何更好呈现推荐,是一个很难建立理论模型和进行量化的问题,对于不同被推荐品而言,用户界面设计的准则也可能大不相同。建立一个可以进行AB测试的系统(随机将用户分为两部分,各自看到不同的推荐页面和推荐结果),可以积累重要的实验数据,指导进一步地改善。
  挑战九:多维数据的交叉利用。
  目前网络科学研究一个广受关注的概念是具有相互作用的网络的结构和功能。网络与网络之间的相互作用大体可以分成三类:一类是依存关系,譬如电力网络和Internet,如果发生了大规模停电事故,当地的自主系统和路由器也会受到影响,导致网络局部中断;第二类是合作关系,譬如人的一次出行,可以看作航空网络、铁路网络和公路网络的一次合作;第三类是交叠关系,主要针对社会网络,这也是我们最关注的。我们几乎每一个人,都参与了不止一个大型的社会网络中,譬如你可能既有新浪微博的帐号,又是人人网的注册用户,还是用手机,那么你已经同时在三个巨大的社会网络中了。与此同时,你可能还经常在淘宝、京东、麦包包、1号店、库巴网这些地方进行网购,因此也是若干张用户商品二部分图中的成员。
  想象如果能够把这些网络数据整合起来,特别是知道每个节点身份的对应关系(不需要知道你真实身份,只需要知道不同网络中存在的若干节点是同一个人),可以带来的巨大的社会经济价值。举个例子,你可能已经在新浪微博上关注了很多数据挖掘达人的微博,并且分享了很多算法学习的心得和问题,当你第一次上当当网购书的时候,如果主页向你推荐数据挖掘的最新专著并附有折扣,你会心动吗?交叠社会关系中的数据挖掘,或称多维数据挖掘,是真正有望解决系统内部冷启动问题的终极法宝只要用户在系统外部的其他系统有过活动。单纯从个性化商品推荐来讲,可以利用用户在其他电商的浏览购买历史为提高在目标电商推荐的精确度当然,每一个电商既是付出者,也是获利者,总体而言,大家能够通过提高用户体验和点击深度实现共赢。与此同时,可以利用微博和其他社会网络的活动提高商品推荐的精度,还可以反过来利用商品浏览历史提高微博关注对象推荐的精度。给一个经常购买专业羽毛球和浏览各种专业羽毛球设备的用户推荐关注羽毛球的专业选手和业余教练的成功率应该很高,而且不会陷入“总在一个圈子里面来回推荐”的毛病中。
  从机器学习的角度,杨强等人提出的“迁移学习”算法有望解决这种跨邻域的推荐,因为这种算法最基本的假设就是在一个领域所学习的知识在其他领域也具有一定的普适性。Nori等人最近的分析显示,在某系统中特定的行为(比如说在Delicious上收藏标签)可以被用于预测另外系统中的特定行为(比如说在Twitter上的信息选择),其核心的思想与杨强等人一致。事实上,这种跨网的学习已经被证明可以提高链路预测的效果。尽管有上面的有利的证据,我们还是需要特别注意,迁移学习在不同领域间的效果差异很大,还依赖于相关系统内部连接产生的机制,并不是普遍都能产生良好地效果,因为有的时候在一个商品品类上表现出高相似性的用户在另外一些商品品类上可能表现出完全不同的偏好。
  图7:用户跨多个独立B2C电商网站浏览购物的示意图。
  我们分析了百分点科技服务客户的真实数据,发现有相当比例的用户都具有交叉购物的习惯,即在多个独立B2C电商有浏览和购买行为,如图7所示。即便只考虑两个点上,例如利用麦包包的浏览购买数据为名鞋库的用户进行个性化推荐(这些用户在名鞋库上是没有任何历史记录的新用户,但是在麦包包上有浏览购买行为),就可以明显提高推荐的准确度(比完全冷启动的随机推荐高数十倍),而如果利用3家或以上的外部电商的数据,其推荐的精确度可以明显高于热销榜(注意,热销榜一点个性化都没有),特别在团购类网站上表现非常好。拥有交叉用户使得不同系统之间的“迁移”更加容易(注意,“迁移学习”原始的方法不要求系统之间具有相同的用户和商品),Sahebi和Cohen最近测试同时评价了书和电影的用户,也发现利用对书的评分信息可以相当程度上预测对电影的评分。虽然针对多维数据挖掘的研究刚刚起步,但我相信其必将成为学术研究和商业应用上的双料热点和双料难点。
投诉 评论

个性化推荐十大挑战(下)本文为个性化推荐十大挑战最后一部分,主要介绍了推荐系统效果评估,用户界面与用户体验,多维数据的交叉利用,社会推荐。接上文:个性化推荐十大挑战(中)挑战七:推荐系统效……为什么我们不反感微信做支付,却反感支付宝做社交?携带着不安全感的基因,支付宝做社交既是战略导向,也是为前途考量,这次充满荷尔蒙和LOW的尝试,不知能不能留住用户的心。支付宝和微信都是超级APP,功能非常丰富,同是生态型的AP……个性化推荐十大挑战(中)前文介绍了个性化推荐十大挑战的背景其中的数据稀疏性问题,冷启动问题。本篇介绍个性化推荐十大挑战中的大数据处理与增量计算问题,多样性与精确性的两难困境,推荐系统的脆弱性问题,用户……深度怎么总是支付宝?马云的社交梦阿里就没人能扛吗?支付宝的料,想必大家已经饱了眼瘾了。马云这是社交梦未死,还是支付宝产品经理另有打算?怎么总是支付宝?我们今天准备从DT的角度解读这件事。一、社交是假的,本质还是要数据……也来扒一扒移动支付NFC支付(上)编者按:又快到苹果新品发布会,一如往年,苹果手机对NFC的支持又引来猜测。的确在移动支付风起云涌的时代,苹果的站队将能一锤定音的作用。那移动支付的未来将会在哪里呢?欢迎关注“也……个性化推荐十大挑战(上)有的人觉得个性化推荐就是细分市场和精准营销,实际上细分市场和精准营销往往是把潜在的用户分成很多群体,这固然相比基于全体的统计有了长足的进步,但是距离“给每一个用户量身定做的信息……支付系统设计:对账处理(二)可以说,对账是支付系统最头疼的事情。每一笔交易,都要做到各参与者的记录能够吻合,没有偏差。对账系统的工作,是发现有差异的记录,即轧帐;然后通过人工或者自动的方式,解决这些差异,……观察DEMO:支付宝的屡败屡战当昨天支付宝的新版“圈子”裹挟着各种美女的大尺度照片霸占了社交网络的话题头条时,舆论导向就既定了,再加上“娱乐圈纪委”王思聪的一条“支付鸨”的微博,就像是彻底给这事儿定了一个“……“小绿人”就这样灭了,它不会再亮起来小雪导语:犹记得当初企鹅和360干架的时候很多人弃用企鹅转向MSN,如今,企鹅早已运用微信占领了大众,小绿人却面临消失,不注重更新不注重用户体验的产品被淘汰也算了大势了。……起点学院内训起点学院走进易立德,千锤百炼出精品2014年2016年对于很多面临转型互联网的公司来说都是痛苦的,两年来起点学院接触了近百家企业,涉及家电、汽车、金融、医疗等领域,在和这些企业的接触中,我们能深刻的感受到他们对……移动互联网内容营销“玩法”变了!原生广告“主宰”新规则这篇文章说一下原生广告对对互联网及移动互联网带来改变,上篇文章中写道【原生广告“颠覆”来袭,移动互联网营销革命爆发】在我看来,互联网营销最本质的东西就是内容,不管你是搜索营销、……蛋糕背后的大坑:互联网车险的主要模式与可行性分析要想在互联网车险这个市场有所作为,还需要创业者和从业公司更多的时间和耐心去寻求突破。一、互联网车险市场发展状况:2013年左右,随着互联网金融的极速发展,互联网车险……
微信键盘正式上线,带来这些营销新机会!昨天(12月19日),微信键盘App发布1。0。0版本,正式上线应用市场。这或许是品牌可以抓住的又一波新红利。从定位看,微信键盘不同于我们现在使用的任何一个键盘,可……可别再用私域流量解释一切了别再用“私域流量”解释一切了当私域流量这个概念最早被提出的时候,其实从来没有被真正的解释过,导致品牌、企业对于“私域”,真是有太多误解。人人皆谈……微信小程序代码审核春节期间仅支持开发者加急提审的需求站长之家(ChinaZ。com)12月22日消息:今日,微信公众平台运营中心发布了春节期间小程序审核调整通知。通知称,小程序代码审核将在2023年春节期间1月21日(除夕……知乎:相关世界杯内容浏览量已达6。5亿次12月20日消息,今日,知乎足球季“纵谈足球,你可知乎”活动迎来收官,活动自11月18日上线以来,海量问题与专业讨论不断登上知乎。知乎方面披露的数据显示,相关世界杯内容浏览量已……盘点近期小红书医疗养生类爆文,背后值得抄作业的玩法~在看近一周小红书爆文榜单时,发现top10里有5条都是关于养生食疗抗阳的内容(如下图所示),之前分析过大量的美妆,零食,时尚等类目的top榜单的内容特征,难得医疗养生类目的内容……AlphabetCEO:世界杯决赛期间谷歌搜索达到成立25年站长之家(ChinaZ。com)12月20日消息:Alphabet和谷歌首席执行官SundarPichai周一表示,在紧张的国际足联世界杯决赛期间,谷歌搜索达到了其成立25年来……知乎报告:相关世界杯内容浏览量已达6。5亿次站长之家(ChinaZ。com)12月20日消息:今日,知乎足球季“纵谈足球,你可知乎”活动迎来收官,活动自11月18日上线以来,大量问题与专业讨论不断登上知乎。知乎方面……5天吸粉1500W,海外博主“淘金”记随着阿根廷在点球大战中力克法国队夺冠,一代球王梅西终于圆梦,第一次在北半球冬天举行的卡塔尔世界杯也缓缓落下帷幕。过去一个多月,短视频平台上关于足球、世界杯的内容可以说是铺……2023年抖音的机会和趋势,值得收藏!1、所有商家都应该200重视“中心场”流量,也就是商场流量搜索流量,讲大白话就是淘系的货架电商运营模式开始在抖音奏效。2、抖音直播玩法和技巧已经没啥创新,直播运营越来越难……vivoX90Pro新机皇成爆款2代骁龙8影像旗舰成了!在本月,vivo正式发布了X90系列手机,vivoX90Pro也是名副其实的真首发骁龙8Gen2芯片,做到了首款开售的旗舰机型,除了芯片功能非常强悍,vivoX90Pro在影像……断更三月,复更就收获10W,最近内容创作流量密码是什么?伴随着世界杯的结束,围绕该热点进行的内容创作也告一段落。在世界杯期间,我们看到不少创作者搭乘热点的顺风车,收获了多个爆款作品。结合友望数据的【热门内容】,我们发现最近有的……一年公众号投放1200万,能赚钱吗?各位村民好,我是村长。你怎么可以接广告呢?你怎么可以卖货呢?你怎么可以赚钱呢?你不应该免费分享的嘛!这是我在写作以来,在公众号的留言区,不时会看到……

友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找作文动态热点娱乐育儿情感教程科技体育养生教案探索美文旅游财经日志励志范文论文时尚保健游戏护肤业界