童话说说技术创业美文职业
投稿投诉
职业母婴
职场个人
历史治疗
笔记技能
美文纠纷
幽默家庭
范文作文
乐趣解密
创业案例
社会工作
新闻家居
心理安全
技术八卦
仲裁思考
生活时事
运势奇闻
说说企业
魅力社交
安好健康
传统笑话
童话初中
男女饮食
周易阅读
爱好两性

技术,推动知识的迭代更新

8月20日 皇极城投稿
  历史上每一次的知识大爆炸,后面都有技术的推动。那么,我们这一代的技术,要怎样去运用解决未来的学习问题。
  大家好,我叫杨溥,我是得到的首席数据科学家。在过去十年的时间里,我一直在做和人工智能相关的事情。
  大家都知道,得到是一家知识服务公司,做课程、做电子书、做跨年演讲。
  去年,罗胖提了一个梦想要建立一所为终身学习者服务的通识教育大学。然后,这个任务就交给了我们。
  你可能要问:为什么建学校这件事,不是交给老师,也不是交给班主任,而是交给了我们程序员呢?
  这是因为历史上的每一次知识大爆炸,都是靠背后的工程师来搞定的。
  就像蔡伦造纸,古藤堡发明印刷术,他们给全世界带来了知识。所以我现在的工作,就是要用我们这一代的技术,去解决未来的学习问题。
  显然,这一代的技术,必然离不开人工智能的支持。
  说到人工智能,我们生活中已经随处可见了,但是大家有没有发现一些问题。比如:我打开外卖平台点餐,系统在首页上给我推荐了日餐,但事实上,我已经连续吃了5天的日餐了;再比如:我打开电商平台购买了一件运动服,系统仍然会不停的给我推荐各种不同品牌的运动服,而实际上,为了下定决心去运动,我已经购买了6件运动服了。
  这就是现在很多智能推荐系统和内容平台的做法,它在根据我过往的行为,预测我的喜好,并不停的给我推荐类似的商品和内容。
  作为一个从业者,我会问自己:“得到也要这样做么?”
  如果一个用户在得到上,已经学习了长时间的《薛兆丰经济学》,我们还应该反复的给他推荐经济学的内容吗?按照这种逻辑,他的首页,可能永远只会是这块内容了。
  类似这样的人工智能方法,在学习领域并不能满足需求。特别是得到用户,是一群对未知有着强烈好奇心的人,他们的好奇心会驱使他们学习不一样的内容。
  所以,得到面临的挑战,是全新的。
  今天,我想给大家分享的是一个内部称做“得到大脑”的项目。
  在上台之前,我问过公司的法务,这个项目可以披露吗?他们说:反正一时半会你也做不出来,随便你。
  一、“得到大脑”
  什么是“得到大脑”呢?
  得到大脑就是:期望通过技术的手段,来尽可能的改善大家的学习体验就像给我们的大脑,增加了一个外挂。
  前段时间,我接待了一个得到的重度用户,她给我详细的介绍了她在得到里的学习历程:
  最初她是被薛兆丰的经济学课吸引了进来,学完经济学之后,就想去学金融学。学金融学的时候,当看到非理性的股市时,就想去了解心理学对人决策的影响;之后,她又想去了解更底层的生命科学。她说她最近正在学习王立銘老师的课程,并且因为对生命产生了敬畏,已经在小本上列了下一步的计划,那就是学习高爽老师的天文学。
  你看,这个过程就有点像我们的学习过程最开始只是黑暗中的一团小火苗,但是因为知识之间的互相关联,从而变成了熊熊烈火,点燃了我们的探索之路。
  这也正是终身学习和传统的学校学习不一样的地方:它不是一个线性的,越来越专业的学习,而是在不断扩大你的知识范围。
  当然,刚才只是她一个人的探索路线,每个人的探索道路都会不一样;但“探索”不是“搜索”,得到大脑的目标不是做一个更好的搜索引擎,而是去给每个用户都展示一个“可以自由探索”的知识世界,帮助用户完成自己的探索。
  长期思考的人都知道:要想让自己的认知能力突飞猛进,很多时候不是因为你搜集了多少信息,而是在你探索的时候。有个瞬间,你突然意识到了一个从来没有想过的维度,知识和知识之间突然产生了化学反应。
  所以,得到大脑第一步想要完成的,就是要借助机器的力量,给每个人配上一个学习助理,然后从各种维度,主动的帮你将所有相关的信息整合在一起,再传达给你。
  但是,新的问题又来了:
  目前,以深度学习为主的人工智能技术,我们称作为感知智能,它还无法完成这样的工作。
  接下来,我们需要达到认知智能的水平,也就是让机器“能理解,会思考”,而知识图谱就是认知智能中最核心的技术。
  二、知识图谱
  知识图谱这个概念,最早是在12年由谷歌提出来的,主要用来提升谷歌的语义搜索服务能力。今天,当你搜索一个问题,比如“C罗的生日”,它给出的不仅仅是关键词匹配的结果,它还会给出具体的生日日期,C罗的百科介绍,甚至还有c罗在球队中的统计资料。
  现在,当有了知识图谱,再结合虚拟现实的技术,我们就可以想象出未来学习的场景了。
  比如,你想了解苏东坡这个人。
  你只需要一个入口,然后,你就可以跟着他的脚步,知道他哪一年走出四川,哪一年走进开封,哪一年被贬黄州,哪一年写了《赤壁赋》;每一年遇到了什么样的人,做了什么样的事,写了什么样的诗词。这每一个人、每一件事、每一首诗,过往的学者对它们做了什么样的研究,写出了什么样的著作。你现在所在的地方,和苏东坡当年待过的地方,相距有多远。他的遗作,藏在了你身边的哪一座博物馆里
  过程中,你突然对曾经看不惯苏东坡的王安石,产生了兴趣,你可以继续跳转到他的视角,开启新的知识探索。
  你看,整个过程,你不是在学习苏东坡,而是在代入苏东坡。
  好了,那这一系列的场景,它背后的知识图谱是什么样的呢?
  围绕着苏东坡,我们从时间、空间、人物、作品等各种各样的维度,构建了这样的一张知识图谱。
  它类似于思维导图,但是它具有更规范的层次结构,和更强大的知识表示能力。为了构造知识的基本框架,知识图谱除了包含实体之外,还需要包括概念、属性、关系这些信息。
  因为人的认知过程,正是不断用这些概念、属性和关系去理解世界、解释世界。
  《福尔摩斯探案集》的作者亚瑟柯南道尔有句名言:
  “一个逻辑学家,不需要亲眼见过或听过大西洋和尼亚加拉大瀑布,他从一滴水中就能推测出它们。”
  知识图谱也是如此它采集碎片化的信息和数据,然后按照标准化的方式加以整理,再将各种看似不相关,但背后有着共同联系的信息关联起来。
  好了,确定完技术方向,下一步,我们该如何构建一个面向学习者的知识图谱呢?
  首先,需要确定知识图谱的构建范围。
  显然,在知识服务领域,我们将会围绕“通识教育”和“学科教育”,去构建一个领域知识图谱。
  接下来,我们需要填充知识图谱中的内容,主要是两块内容:
  第一块,是以“知识点”为中心的实体内容,比如一些专业术语、历史人物、著作等等。
  第二块,就是这些知识点之间的关系内容。
  这些内容需要借助大量的自然语言处理技术,甚至辅助一定的人工手段,从海量的结构化数据数据、非结构化的文本中挖掘出来。比如:对于知识点的挖掘,我们会用到“领域词挖掘”、“命名实体识别”这些技术。
  对于关系的挖掘,我们会用到“事件抽取”、“关系抽取”的技术。其中,“事件抽取”是从文本中抽取出重要的事件信息,比如:事件发生的时间、地点、人物、原因等等,然后再将这些信息与知识点相关联。
  知识图谱中的知识,会按照前面的步骤不断的进行扩充。这个过程,我们还会结合“知识融合”相关的技术,用来消除歧义信息,保证只有高质量的知识才可以进入图谱。
  当知识达到一定量级以后,就可以开始知识的探索之旅了。
  三、学习路径
  事实上,借助“实体链接”的技术,机器就拥有了“理解”的能力。当你提出一个问题,问题中的信息就会和图谱中的信息链接起来。接下来,你可以在其中任意的穿梭,发现一个又一个有兴趣的关联。这个过程,就像是今天你喜欢的逛商场、打游戏。
  可更多的时候,当你面对一个新领域,我们是没有明确目标的;尤其是当你学习的范围越来越广,涉及的领域越来越多的时候,你就越觉得自己无知,这也是学习最大的难题。
  更高效的做法,不仅是要让机器理解知识,还要能够懂你、了解你,让你知道先学什么、后学什么。
  这也是为什么很多时候,当你想要快速的学习一个新的领域,你会找到这个领域中最专业的朋友进行沟通,因为他既懂专业知识,也懂你。
  所以,得到大脑第二步想要做的事,就是着手研究,如何为学习者量身打造合适的学习路径。
  首先,我们需要去挖掘知识的脉络结构,比如:知识点的前后依赖关系、上下位关系、从简单到复杂的递进关系等等。
  目前我们也正在和国内的高校团队进行合作,目标是从高质量的图书中挖掘出这些关系,并将这些关系按照一颗颗“知识树”的形态来构建。
  接着,就是在这颗知识树上,找到用户的定位。
  一方面,对于老用户,我们可以根据他的历史阅读记录、搜索记录,了解他对知识点的掌握情况,并映射到对应的知识树中。
  另一方面,对于新用户,我们可以提供一些标签入口,让用户自己选择一些感兴趣的领域,然后不断收集他的行为记录。
  当用户了解了自己的定位以后,学习上就可以更容易的进行取舍了。比如:哪些知识又是仅限于目前的了解就够了的,哪些知识是必不可少的,哪些知识又是要继续深入学习的。
  所以,这就是“得到大脑”正在开展的两个方向。未来,当你带着问题来到得到,AI会为你找到问题相关的知识,并在小范围内呈现给你。当你面对一个新的领域,不清楚该学习什么的时候,AI会为你推荐合适的学习路径。
  你可能要问我,什么时候能用到这些东西,现在我还不能明确的告诉你。但我能明确的是:当你用上这些功能的时候,我们已经在探索更远的方向了。
  好了,刚才的那些技术细节,可能并不是很好理解,但是没关系,实际上我想讲的是:我们正在努力做的这件事,就是为了让你的探索更自由。
  谢谢大家。
投诉 评论

谁偷走了你的玩具?对于社交网络的思考本文主要论述了社交为什么是人类社会的强需求,社交的本质是什么?以及为什么现在社区没有在本质上解决社交的需求?为什么说社交生态是一个类经济体系的存在?为什么说社交还有很大的机会?……飞常准的差异化场景服务之路随着互联网不断纵深发展,流量红利的消失,任何一个垂直业务或者细分业务,也是非常聚焦的。而在航空数据服务上,飞常准就做到了细分业务,并占据了航空数据行业的差异化场景服务。一……OYO再造新风口?年初迅速进入资本眼球的OYO,其商业逻辑和所谓的“风口”模式都不是特例,无论是现在、过去,还是未来。新故事太少的2019显得过于沉寂了,与往年相比,单纯一个瑞幸上市的消息……技术,推动知识的迭代更新历史上每一次的知识大爆炸,后面都有技术的推动。那么,我们这一代的技术,要怎样去运用解决未来的学习问题。大家好,我叫杨溥,我是得到的首席数据科学家。在过去十年的时间里,我一……Costco,下一个败走的亚马逊?美国付费会员制实体店Costco即将在上海正式落地,回看其美国同行亚马逊不久前宣布退出中国市场,一退一进,命运会有不同吗?亚马逊败走中国的落寞依旧历历在目,它的美国同行C……面对高价,拼多多为何却能让五环外的人实现“水果自由”?面对国内水果价格的攀升,城市青年纷纷开始抱怨吃不起水果,实现“水果自由”好难到底为什么今年的水果会这么贵呢?春节过后,国内水果价格行情如芝麻开花般节节高。照理说应该是果农……自毁简史:对一切“学习问题”来一次总清算如果你自信学习能力没有问题(多数人都这么想),没受到任何社会环境的“污染”,无需任何“改进”,那么,我们不妨先捋一下,一个自然健康的人,其学习能力应该达到什么水平。最近我……数据产权:互联网下半场不容回避的竞争焦点步入互联网下半场,数据已经代替流量,成为新的竞争焦点。数据归谁所有,这一问题牵涉多方利益。究竟是鼓励效率,还是支持公平性优先?是否能找出一条平衡效率与公平的解决路径?以下这篇文……乐华娱乐的十年,也是中国饭圈文化的十年以这次演唱会为契机回望可以看到,乐华娱乐十年,也是中国粉丝经济的十年。下一个十年,应该会是经纪公司、直播平台与粉丝经济融合发展的十年。说到中国的饭圈文化和粉丝经济,乐华娱……哭泣酒店、愤怒俱乐部。。情绪释放产业崛起的背后外表看似光鲜亮丽,背后实则充满负面情绪渴求释放,近几年,情绪释放业逐渐崛起,哭泣房、愤怒室、智能击打、呐喊宣泄仪这些你可能并不熟悉,但是却未必不想尝试。一向喜欢在大尺度边……决战618,阿里的合围战术:天猫上行,聚划算下沉坐拥7亿用户的大淘宝生态,以全球新品首发平台天猫为虎头承接全域消费升级红利,再以高性价比的聚划算为龙尾横扫下沉市场,虎头、龙尾形成合围之势,上下包抄全域市场,牢牢占据了618主……五环外的争夺:电商巨头的下沉往事2018年,拼多多的火速上市让五环外的市场浮出水面。拼多多的活跃用户超越京东,获客成本又远低于阿里,成立不到3年就赴美上市,让巨头们看到了下沉流量的红利。于是五环外的市场,电商……
适合没经验女性创业赚钱开的十五种店新项目2019年做生意有什么适合女性开的十五种店前景最好?现在女人没经验开什么店好赚钱,开什么店最赚钱投资小卖什么利润大不压货比较有前途,适合女性开的店有哪些,女性自主创业找项目哪些……2019大健康产业的趋势,你想抓住这波商机成为富翁吗?健康是人生一切之本。曾有人用这样一组数字,开端是1,后面的全是0来比喻人的终身,这里的“1”代表健康,而“1”后边的“0”分别代表生命中的事业、金钱、位置、权利、房子、车……这届年轻人为什么开始在B站看刑法了?作者DT财经来源:DT财经(ID:DTcaijing)作为一个法学专业的门外汉,小贺最近对刑法课视频走火入魔。而让小贺掉入深坑的致命诱惑就是最近火速蹿……思客云讲堂王一鸣:疫情冲击下制造业怎么办疫情的全球大流行,对中国乃至全球经济社会发展带来了多方面挑战和冲击。在3月25日,中国(海南)改革发展研究院与新华网思客联合举办的“疫情冲击下的产业发展”专家网络座谈会上,国务……范恒山:新基建VS老基建,怎么建才是关键新冠肺炎疫情的全球大流行,对中国乃至全球经济社会发展带来了多方面挑战和冲击。在近期中国(海南)改革发展研究院与新华网思客联合召开的“疫情冲击下的产业发展”专家网络座谈会上,国家……2000000000000!美国2万亿美元经济刺激法案在参议嗯,你没看错,一共12个0,这是2万亿!近日,美国2万亿美元经济刺激法案在参议院获得一致通过后,又获美国众议院表决通过,美国总统特朗普也随即签署了该法案。关于这项刺……黄群慧:重视供应链安全,推动产业链水平现代化、价值链高端化新冠肺炎疫情的全球大流行,对中国乃至全球经济社会发展带来了多方面挑战和冲击。在近期中国(海南)改革发展研究院与新华网思客联合召开的“疫情冲击下的产业发展”专家网络座谈会上,中国……老罗抖音首秀,关于直播不得不看的4000字来源:进击波财经(ID:jinbubo)作者:沈帅波老罗又刷屏了,回归了自己的主业:网红事业。支付交易总额突破1。1亿元。观看人数超过4800w。这是一组非常好……中概股最大丑闻的诞生:谁是瑞幸咖啡22亿财务造假受益者?作者相欣薛芳突如其来的财务造假自曝,让瑞幸咖啡制造了中概股发展史上最大丑闻。昨晚,瑞幸咖啡发布公告称从2019年第二季度到第四季度期间存在伪造交易行为,涉及销售总金……多地“官宣”消费券“大招”,背后有何深意?最近,你用消费券消费了吗?河南省郑州市4月1日宣布将发放4亿元消费券,定向鼓励本地消费者,扶持郑州商家,拉动线下消费。郑州并不是第一个这样做的城市。在此之前,包括南京、杭……瑞幸造假,套现离场的大股东还能安然无恙吗?瑞幸这次真的要成一杯“苦”咖啡了。4月2日晚,瑞幸咖啡发布公告称,公司董事会成立的内部特别调查委员会,初步阶段确定的信息表明,从2019年第二季度到第四季度,瑞幸咖啡伪造……盘前跌去80,盘后五次熔断!瑞幸惊天大骗局曝光:COO内部造瑞幸咖啡自己吹起来的资本泡沫,被自己戳破了。4月2日晚间,瑞幸咖啡(Nasdaq:LK)宣布,该公司董事会已成了一个特别委员会,以监督一项内部调查该公司公布的调……
友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找作文动态热点娱乐育儿情感教程科技体育养生教案探索美文旅游财经日志励志范文论文时尚保健游戏护肤业界