范文健康探索娱乐情感热点
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

年轻人多在反算法,没想到Spotify先站出来了

  作为煎饼果子圣地,天津人评价最高的煎饼店,一定不是人们趋之若鹜的网红店,而是「我家楼下那家」。
  人们对于音乐的喜好,和天津人对煎饼果子的爱有异曲同工之处,好友热情分享过来的音乐,通常会被你归为「垃圾」。随着卡带、CD、MP3 逐渐被移动互联网取代,音乐应用最终承载起满足人们音乐品味的重任。
  社交媒体上经久不衰的唯二的两个问题,一个是为什么「随机」推荐并不真的「随机」,另一个就是为什么音乐平台推荐的音乐都这么「垃圾」。如果有机会,估计所有人最想做的事情就是去面对面问一下音乐应用的程序员,自己到底怎么才能「调教」好这个 App,让它推荐更多自己喜欢的音乐。
  以用户数最多的音乐平台 Spotify 为例,他们最近开发出了一种新的算法 —— 偏好转化模型(Prefenrence Transition Model,PTM),想要预测,一年后的你会听什么音乐。揭开 Spotify「算法黑箱」
  抖音、微博、淘宝、YouTube、Spotify,这些平台的算法想尽办法猜测我们喜好,然后把它们觉得我们会喜欢的内容推给我们。
  有些时候,这些算法确实猜得很准,我们看到的都是喜欢的内容。但从另一方面来说,我们只看了自己喜欢的内容。
  互联网活动家伊萊・帕里瑟(Eli Pariser)在 2011 年的时候提出了他著名的「过滤气泡」(Filter Bubble)理论:算法会根据用户的地址、历史点击、过往搜索等用户相关信息猜测用户喜好。这个过程中,那些与用户意见相悖的信息就被过滤了。长期下来,用户就会无法接触新的想法和信息,逐渐隔绝在自己的意识形态泡沫中。
  在处理过滤气泡的问题上,Spotify 一直因为精准的算法而为人称道。不只是让用户在自己熟悉的内容中打转,它总能帮用户发现那些新鲜的歌曲。而恰好,这些歌曲还很讨人喜欢。
  「每周发现」(Discovery Weekly)是 Spotify 在 2015 年 7 月的王牌栏目。每周一,Spotiy 就会向用户推送 30 首完全没听过的歌曲。同时,它又总能带来非常好的用户体验。截至 2020 年 6 月 25 日,每周发现总共被播放了 23 亿小时,约合 26.65 万年,比人类文明存在的时间还长。
  Spotify 是怎么做到这一切的?当然还是算法。
  Spotify 主要使用了三种推荐机制 —— 协同过滤算法(Collaborative Filtering Model)、卷积神经网络(Convolutional Neural Networks)和自然语言分析(Natural Language Processing)。
  Netflix 是最早使用协同过滤算法来推荐内容的平台。在 Netflix 大获成功之后,这种算法就变得越来越流行。简单来说,它会根据用户之间的相似性而不是内容的相似性来推荐新事物。
  对 Spotify 来说,摆在它面前的是一个巨大的数据库,里面装满了用户听过内容的历史。协同过滤算法会根据用户 A 听过的歌曲,找到也喜欢这些歌的另一个用户 B,然后向 A 推送只有 B 听过的歌曲。
  ▲「同喜 QRS,则尝试一下 P 和 T」|Erik Bernhardsson,前 Spotify 员工
  但协同过滤算法的一大缺点是所谓的「冷启动」问题,只有掌握足够多的数据,协同过滤算法才能起作用。如果用户是一个还没有听过多少歌的新用户,或者内容库里有一首非常冷门歌曲,协同过滤算法就无法精准匹配。
  这就引入了另一种算法 —— 自然语言处理。Word2Vec 常被用在自然语言处理中,它可以将我们日常的对话编码成数学关系 —— 向量。
  Spotify 做了和 Word2Vec 相似的工作。它会抓取网络上描述音乐、歌曲或者歌手的词语,通过算法分配给它们不同的权重。这个权重,很大程度上代表了人们用这个词来描述音乐的概率。通过自然语言处理,Spotify 就能确定哪两首歌彼此是相似的,从而解决冷启动问题。即使是冷门的歌曲或歌手,也能得到推荐。
  Spotify 的第三种方式是卷积神经网。
  在前两种算法的帮助下,Spotify 已经获得了足够多的数据,但卷积神经网络可以进一步提高了音乐推荐的准确性。
  卷积神经网络会分析歌曲的特征,包括拍子、音调、模式、节奏、响度等。通过阅读这些歌曲的特征,Spotify 就可以根据用户的收听历史了解它们之间的相似性,匹配用户的喜好。
  Daft Punk 的歌曲「环游世界」的数据分析图|The Echo Nest
  正是通过这三种算法,Spotify 像魔法一般猜准了用户的喜好,打造出了千人千面的 Discover Weekly。
  但即使 Spotify 已经成为了世界上最流行的流媒体播放软件,即使世界上最聪明的人在这里构建出了无比精巧的算法,过滤气泡的「诅咒」依旧存在。
  于是,Spotify,又多做了一步。但是,人是会变的呀!
  2021 年 4 月,Spotify 联合多伦多大学发布了一篇论文《下一步去哪儿?一种用户偏好的动态模型》(Where To Next?A Dynamic Model of User Preferences)。
  他们在 4 年间(2016 年至 2020 年)分析了 10 万名用户的收听数据,来观察用户的消费分布变化。他们发现,随着时间的变化,用户的消费习惯也在发生变化。先前的算法擅长捕捉用户的静态喜好,但当面对长时间的跨度时,却无法捕捉用户动态的喜好变化。对于 Spotify 的长期用户来说,他们依旧可能困在过滤气泡中。
  这是 2016 年第一季度对比随后每个季度的总消费变化直方图。颜色越深,对比的时间跨度就越长。比如,最左边的浅色曲线是 2016 年第一季度和 2016 年第二季度的对比;最右边的深色曲线是 2016 年第一季度和 2020 年第二季度的对比。随着时间的增加,变化也越来越明显|图片来源:Spotify
  Spotify 同时发现,当免费用户消费的音乐种类越多时,他们越有可能转化为付费用户。也就是说,用户听到的音乐类型越多,他们越喜欢 Spotify。
  那么该如何知道,一个人未来的音乐口味呢?
  Spotify 给出了一个新的算法 —— 偏好转化模型(Prefenrence Transition Model,PTM)。
  在这张偏好转化模型的草图中,我们可以大致窥见 PTM 的工作原理。
  ▲图片来源:Spotify
  我们现在有个用户 1 号,根据历史,可以知道他喜欢听灵魂乐(Soul)。我们想知道,他以后会不会喜欢新世纪音乐(New Age)和布鲁斯(Blues)。
  转换矩阵 A 是 PTM 的核心,将上述的数据输入 A,就会得到一个预测的结果。可以看到,新世纪音乐的数值(0.4)和灵魂乐(0.4)非常接近,那用户 1 将来很有可能会喜欢上新世纪音乐。
  当然,这只是一个最简单的模型演示,实际情况要比这复杂得多。Spotify 总共归纳了 4000 种音乐流派。而在 Spotify 的数据库中,还有有 3.56 亿个这样的「用户 1 号」。
  ▲PTM 的核心算法:指数加权移动平均分布和泊松多项式两级分布|Spotify
  ▲与之前的算法相比,PTM 在各项测试中都得到了最好成绩|Spotify
  除了预测性能,PTM 的另一大特点就是可以直观地解释从一种音乐是如何转换到另一种音乐的。假定我们现在有两个音乐流派 a 和 b,PTM 就可以提供用户在听完 a 之后转换到 b 的概率。这就解释了两个问题:
  1、a 到 b,哪条路径是最短的?
  2、如果用户听了 a,那么他接下来最有可能播放哪个流派?
  回答这两个问题,大大提高了 PTM 的效率和预测准确性。
  这是一张偏好转化的示意图,显示了初始流派(绿色)到目标流派(红色)的最短路径|Spotify如何「驯服」算法
  看起来,Spotify 已经做得很好了。但再聪明的算法,都可能时不时抽一下风。毕竟,人确实很复杂,没有人可以像你自己一样了解自己。
  Spotify 官方也给出了一些建议,希望帮助你更好地「驯服」他们的算法。
  给你喜欢的歌曲点个❤️。
  如果你不喜欢一首歌,在 30 秒之前跳过它。30s 是个关键节点,如果在这之前跳过一首歌,相当于算法在内部给它点了👎。
  听听新的歌手和他们的音乐。这样算法就可以更好地学习你的行为模式。
  提供你的年龄和位置信息 —— 要是你不介意的话。Spotify 会根据用户的年龄和地理位置推荐不同的音乐类型。
  如果你不想 Spotify 注意到你的行为,可以使用「私密模式」。
  最后,保持耐心。算法在设计中会忽略新的收听行为中一些迅速的、突然出现的峰值,因为许多人会分享他们的 Spotify 登录信息。因此新的收听活动可能不会立刻导致你的播放列表变化。

笔记本电脑需求如何,零部件制造商和品牌厂意见相左据上游供应链消息人士透露,尽管下游品牌客户乐观看待2022年的笔记本电脑需求,但上游零部件制造商的态度正趋于保守。图源digitimesdigitimes报道指出,消息人士称,零部消息称三星加强亚洲供应链,欲多处建厂大招工人据业内人士透露,三星电子正在加强其亚洲供应链,以满足疫情大流行期间不断增长的产品需求。据韩联社报道,三星电子正着眼于在全球建设更多工厂,同时扩大劳动力规模。据悉,该公司目前正在巴基阿里云泄露用户数据引担忧,律师情节严重厂商或将停业,个人最高可判7年8月23日,阿里云将用户留存的注册信息泄露给第三方合作伙伴的消息引发热议。根据浙江省通信管理局的官方文件,阿里云在未经用户同意的情况下,擅自将用户留存的注册信息泄露给第三方合作公司5000万用户信息被黑客窃取,美国FCC开始调查TMobile数据泄露事件IT之家8月19日消息美国运营商TMobile上周表示,公司正在调查一个网络论坛帖子提出的指控。该帖子称,逾1亿用户的个人数据已经泄露。随后,他们公布了初步调查结果,确认包括已有客消费数据打压美股特斯拉祸不单行,苹果iPhone13下月第三周正常发布北京时间8月18日消息,美国7月零售数据不及预期以及不断增长的新冠确诊病例,加剧了市场对经济复苏进程的担忧,美股收跌,纳指在三大股指中表现最差。截至收盘,道指跌282。12点,跌幅业余时间搞开发仍归大厂所有?谷歌工程师自述亚马逊霸王条款经历,引发程序员众怒业余时间搞开发,所有权该归谁?最近这个话题,又引发了一阵热议。一位谷歌工程师,在社交网络上分享了之前的遭遇。3年前,他因为一份离谱工作合同,放弃了亚马逊软件工程师的高薪工作。合同上多益网络董事长徐波要彻查前CEO腐败贪污纵容外挂案IT之家8月20日消息多益网络昨日晚间发布公告,宣称其董事长徐波要亲查广告腐败广告假量纵容外挂案。董事长亲查广告腐败广告假量纵容外挂案本文为多益网络董事长徐波亲自书写。因公司前CE执意登陆火星,马斯克不知人类何时才能变成跨星球生存物种IT之家11月25日消息,今天晚间,特斯拉SpaceX的CEO埃隆马斯克(ElonMusk)在微博发布中英双语内容,表示如果我们能够在火星上自给自足,我们将成为星际公民,但不确定留消息称华米科技特斯拉将共同打造智能手表IT之家9月14日消息财联社报道,特斯拉与小米手环将联合打造一款智能手表。暂时还没有关于特斯拉与华米科技新产品的细节,但据猜测,这款手表将具有打开和关闭特斯拉电动汽车的可能性。华米消息称华米科技将联合特斯拉,9月15日或有新品发布9月10日,有海外爆料人士在社媒平台上爆出了疑似华米科技与特斯拉合作的海报,而就在同一天,华米科技创始人董事长兼CEO黄汪也通过微博表示,9月15日将继续飙车,并配了一张去年发布AFitbit自主注销国内微信公众号,该智能手表品牌已被谷歌收购感谢IT之家网友烦了的线索投递!IT之家2月14日消息据网友反馈,智能手表手环制造商Fitbit蜚比健康中国官方微信公众号已经自主注销,停止使用。另外,截至IT之家发稿前,fitb
联华电子将投资36亿美元,提高28纳米制程芯片产量IT之家5月2日消息根据外媒techpowerup消息,联华电子已经宣布了价值36亿美元的投资计划,用于提高其28纳米制程芯片的产量。此举目的是为了迅速缓解全球芯片短缺的问题,使用OPPO新研发总部OTower曝光采用O形设计IT之家4月21日消息BjarkeIngelsGroup(BIG)在中国的发展势头强劲,今天其公布了为中国智能手机制造商OPPO设计的研发总部摩天大楼。IT之家了解到,这座名为OT台媒联发科5G芯片制程超越高通,已拿下OPPOvivo小米订单IT之家4月19日消息据中国台湾经济日报报道,联发科正冲刺高端技术,消息称其新一代5G旗舰芯片由外界原本预期的5nm制程生产,升级到4nm,同时开出3nm产品,成为台积电4nm和3英特尔已建成3。2兆瓦太阳能发电站,将减排3800吨二氧化碳IT之家4月23日消息今年1月,英特尔在马来西亚建成一座全新的3。2兆瓦(MW)太阳能发电站。该太阳能发电站位于马来西亚居林高科技园的英特尔芯片与封装测试制造工厂,是英特尔在美国之英特尔复苏计划导致利润承压,数据中心业务疲软引发担忧北京时间4月23日早间消息,美国当地时间周四晚间,英特尔发布的第一季度财报显示,业绩轻松超过华尔街预期。在新冠病毒疫情期间,PC销售的持续强劲弥补了数据中心的需求疲软。尽管小幅上调英特尔第一财季营收197亿美元,净利润34亿美元,总体超预期北京时间4月23日凌晨消息,英特尔今天公布了2021财年第一财季财报。报告显示,英特尔第一财季营收为197亿美元,与上年同期的198亿美元相比下降1净利润为34亿美元,与上年同期的台积电今年员工全体加薪5,去年奖金分红人均32万元感谢IT之家网友狂奔的蜗牛的线索投递!IT之家4月23日消息据工商时报报道,台积电去年利润创下历史新高,除了董事会核准去年员工业绩奖金与酬劳及分红总计约新台币695亿元外,台积电也台积电5nm工艺一季度营收环比下滑,但预计全年仍会占到204月19日消息,据国外媒体报道,台积电的财报显示,他们去年量产的5nm工艺,营收在一季度有下滑,不及上一季度,但他们仍预计5nm工艺将贡献今年全年营收的20。从台积电的财报来看,一苹果谷歌参加应用商店反垄断听证会控制和分成都是为了消费者北京时间4月22日早间消息,据报道,美国参议院的一个委员会周三在听证会上针对苹果和谷歌在移动应用领域的主导地位,以及他们是否滥用自身力量侵害竞争对手的利益进行质询。美国参议院反垄断谷歌遭英国每日邮报起诉垄断广告业务北京时间4月21日早间消息据报道,英国每日邮报(TheDailyMail)宣布起诉谷歌,称搜索和广告巨头谷歌在出售在线广告位方面的权力,意味着报纸几乎看不到其内容产生的收入。诉讼中台积电如无法向华为出售芯片,将迅速填补缺口IT之家6月9日消息据机器之能报道,今天上午9点,台积电于新竹市国宾饭店召开年度股东大会。由于美国实施限制,被问及台积电是否可以填补华为海思遗留的订单缺口时,台积电董事长刘德音说我