范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

GPT4的研究路径没有前途?YannLeCun给自回归判了死刑

  机器之心报道
  机器之心编辑部
  Yann LeCun 这个观点的确有些大胆。
  「从现在起 5 年内,没有哪个头脑正常的人会使用自回归模型。」最近,图灵奖得主 Yann LeCun 给一场辩论做了个特别的开场。而他口中的自回归,正是当前爆红的 GPT 家族模型所依赖的学习范式。
  当然,被 Yann LeCun 指出问题的不只是自回归模型。在他看来,当前整个的机器学习领域都面临巨大挑战。
  这场辩论的主题为「Do large language models need sensory grounding for meaning and understanding ?」,是近期举办的「The Philosophy of Deep Learning」会议的一部分。会议从哲学角度探讨了人工智能研究的当前问题,尤其是深度人工神经网络领域的近期工作。其目的是将正在思考这些系统的哲学家和科学家聚集在一起,以便更好地了解这些模型的能力、局限性以及它们与人类认知的关系。
  根据辩论 PPT 来看,Yann LeCun 延续了他一贯的犀利风格,直言不讳地指出「Machine Learning sucks!」「Auto-Regressive Generative Models Suck!」最后话题自然是回到「世界模型」。在这篇文章中,我们根据 PPT 梳理了 Yann LeCun 的核心观点。
  Yann LeCun 核心观点
  Machine Learning sucks!
  「Machine Learning sucks!(机器学习糟透了)」Yann LeCun 把这个小标题放在了 PPT 的开头。不过,他还补充了一句:与人类和动物相比。
  机器学习有什么问题?LeCun 分情况列举了几项: 监督学习(SL)需要大量的标注样本; 强化学习(RL)需要大量的试验; 自监督学习(SSL)需要大量的未标记样本。
  而且,当前大部分基于机器学习的 AI 系统都会犯非常愚蠢的错误,不会推理(reason),也不会规划(plan)。
  相比之下,人和动物能做的事情就多了很多,包括: 理解世界是如何运作的; 能预测自己行为的后果; 可以进行无限多步骤的推理链; 能将复杂的任务分解成一系列的子任务来规划;
  更重要的是,人和动物是有常识的,而当前的机器所具备的常识相对肤浅。
  自回归大型语言模型没有前途
  在以上列举的三种学习范式中,Yann LeCun 重点将自监督学习拎了出来。
  首先可以看到的是,自监督学习已经成为当前主流的学习范式,用 LeCun 的话说就是「Self-Supervised Learning has taken over the world」。近几年大火的文本、图像的理解和生成大模型大都采用了这种学习范式。
  在自监督学习中,以 GPT 家族为代表的自回归大型语言模型(简称 AR-LLM)更是呈现越来越热门的趋势。这些模型的原理是根据上文或者下文来预测后一个 token(此处的 token 可以是单词,也可以是图像块或语音片段)。我们熟悉的 LLaMA (FAIR)、ChatGPT (OpenAI) 等模型都属于自回归模型。
  但在 LeCun 看来,这类模型是没有前途的(Auto-Regressive LLMs are doomed)。因为它们虽然表现惊人,但很多问题难以解决,包括事实错误、逻辑错误、前后矛盾、推理有限、容易生成有害内容等。重要的是,这类模型并不了解这个世界底层的事实(underlying reality)。
  从技术角度分析,假设 e 是任意生成的 token 可能将我们带离正确答案集的概率,那么长度为 n 的答案最终为正确答案的概率就是 P (correct) = (1-e)^n。按照这个算法,错误会不断积累,而正确性则呈指数级下降。当然,我们可以通过将 e 变小来缓解这个问题(通过训练),但无法完全消除,Yann LeCun 解释说。他认为,要解决这个问题,我们需要在保持模型流畅性的同时,让 LLM 不再进行自回归。
  LeCun 认为有前途的方向:世界模型
  当前风头正劲的 GPT 类模型没有前途,那什么有前途呢?在 LeCun 看来,这个答案是:世界模型。
  这些年来,LeCun 一直在强调,与人和动物相比,当前的这些大型语言模型在学习方面是非常低效的:一个从没有开过车的青少年可以在 20 小时之内学会驾驶,但最好的自动驾驶系统却需要数百万或数十亿的标记数据,或在虚拟环境中进行数百万次强化学习试验。即使费这么大力,它们也无法获得像人类一样可靠的驾驶能力。
  所以,摆在当前机器学习研究者面前的有三大挑战:一是学习世界的表征和预测模型;二是学习推理(LeCun 提到的 System 2 相关讨论参见
  UCL 汪军教授报告
  );三是学习计划复杂的动作序列。
  基于这些问题,LeCun 提出了构建「世界」模型的想法,并在一篇题为《A path towards autonomous machine intelligence》的论文中进行了详细阐述。
  具体来说,他想要构建一个能够进行推理和规划的认知架构。这个架构由 6 个独立的模块组成: 配置器(Configurator)模块; 感知模块(Perception module); 世界模型(World model); 成本模块(Cost module); actor 模块; 短期记忆模块(Short-term memory module)。
  这些模块的具体信息可以参见机器之心之前的文章《图灵奖获得者 Yann LeCun:未来几十年 AI 研究的最大挑战是「预测世界模型」》。
  Yann LeCun 还在 PPT 中阐述了之前论文里提到的一些细节。
  如何构建、训练世界模型?
  在 LeCun 看来,未来几十年阻碍人工智能发展的真正障碍是为世界模型设计架构以及训练范式。
  训练世界模型是自监督学习(SSL)中的一个典型例子,其基本思想是模式补全。对未来输入(或暂时未观察到的输入)的预测是模式补全的一个特例。
  如何构建、训练世界模型?需要看到的是,世界只能部分地预测。首先,问题是如何表征预测中的不确定性。
  那么,一个预测模型如何能代表多种预测?
  概率模型在连续域中是难以实现的,而生成式模型必须预测世界的每一个细节。
  基于此,LeCun 给出了一种解决方案:联合嵌入预测架构(Joint-Embedding Predictive Architecture,JEPA)。
  JEPA 不是生成式的,因为它不能轻易地用于从 x 预测 y。它仅捕获 x 和 y 之间的依赖关系,而不显式生成 y 的预测。
  通用 JEPA。
  如上图所示,在这种架构中,x 代表过去和当前观察到的,y 代表未来,a 代表 action,z 代表未知的潜在变量,D()代表预测成本,C()代表替代成本。JEPA 从代表过去和现在的 S_x 的表征中预测一个代表未来的 S_y 的表征。
  生成式架构会预测 y 的所有的细节,包括不相关的;而 JEPA 会预测 y 的抽象表征。
  在这种情况下,LeCun 认为有五种思路是需要「彻底抛弃」的: 放弃生成式模型,支持联合嵌入架构; 放弃自回归式生成; 放弃概率模型,支持能量模型; 放弃对比式方法,支持正则化方法; 放弃强化学习,支持模型预测控制。
  他的建议是,只有在计划不能产生预测结果时才使用 RL,以调整世界模型或 critic。
  与能量模型一样,可以使用对比方法训练 JEPA。但是,对比方法在高维空间中效率很低,所以更适合用非对比方法来训练它们。在 JEPA 的情况下,可以通过四个标准来完成,如下图所示:1. 最大化 s_x 关于 x 的信息量;2. 最大化 s_y 关于 y 的信息量;3. 使 s_y 容易从 s_x 中预测;4. 最小化用于预测潜在变量 z 的信息含量。
  下图是多级、多尺度下世界状态预测的可能架构。变量 x_0, x_1, x_2 表示一系列观察值。第一级网络表示为 JEPA-1,使用低级表征执行短期预测。第二级网络 JEPA-2 使用高级表征进行长期预测。研究者可以设想这种类型的架构有许多层,可能会使用卷积和其他模块,并使用级之间的时间池来粗粒度的表示和执行长期的预测。使用 JEPA 的任何非对比方法,可以进行 level-wise 或全局的训练。
  分层规划比较困难,几乎没有解决方案,大多数都需要预先定义动作的中间词汇。下图是不确定情况下的分层规划阶段:
  不确定情况下的分层规划阶段。
  迈向自主式 AI 系统的步骤都有哪些?LeCun 也给出了自己的想法:
  1、自监督学习 学习世界的表征 学习世界的预测模型
  2、处理预测中的不确定性 联合嵌入的预测架构 能量模型框架
  3、从观察中学习世界模型 像动物和人类婴儿一样?
  4、推理和规划 与基于梯度的学习兼容 没有符号,没有逻辑 向量和连续函数
  其他的一些猜想包括:
  预测是智能的本质:学习世界的预测模型是常识的基础 几乎所有的东西都是通过自监督学习得来的:低层次的特征、空间、物体、物理学、抽象表征...;几乎没有什么是通过强化、监督或模仿学习的 推理 = 模拟 / 预测 + 目标的优化:在计算上比自回归生成更强大。 H-JEPA 与非对比性训练就是这样的:概率生成模型和对比方法是注定要失败的。 内在成本和架构驱动行为并决定学习的内容 情感是自主智能的必要条件:批评者或世界模型对结果的预期 + 内在的成本。

被央媒点名批评的6位明星,一夜之间跌下神坛,没一个人值得同情阅读文章前辛苦您点个关注,方便讨论和分享。我们每天为您更新精彩的内容!文木易编辑布咔历史前言提起当下娱乐圈的现状,用贵圈真乱一句话就足以概括。内娱就像个神奇的大漩涡,形形色色的人都近3年口碑最佳的五部韩剧,黑暗荣耀排倒数,你追过哪几部?5。少年法庭豆瓣8。7主演金惠秀金武烈李星民剧情点评四星推荐吧!少一星是因为没有那种哇趣介么好看的感觉,但是属于好看的类型,聚焦少年犯罪题材挺好的。剧集抛出许多少年犯罪的问题,又给43岁姚芊羽自曝感染甲流!高烧烧到骨头缝疼,此前杨子花上万买药饿了吗?戳右边关注我们,每天给您送上最新出炉的娱乐硬核大餐!3月25日,知名演员姚芊羽时隔6日再次更新视频,自曝感染甲流,引发网友热议。配文中,姚芊羽感慨地说道,甲流对她太不友好了赵薇从人人喜爱的小燕子到受人唾弃,她的行为真的严重到被封杀吗赵薇,从人人喜爱的小燕子到人人喊打的过街老鼠,她的所作所为真的有这么严重吗?近日,被封杀了将近两年的赵薇突然出现在了公众的视野,关于赵薇的消息一出,网友们对她的态度并没有好转,依旧紧急被叫停!微博之夜现场大批明星被赶特警出动警方管控各路明星齐聚上海,这是开放以后,声势浩大的一场活动。微博之夜还未开始就已经热搜不断,这次大半个娱乐圈都来了上海,汇集了各路明星。可以说各路明星齐聚,美女如云。顶流肖战王一博龚俊,新不得对幼儿和家长进行任何形式的考试!2023年浙江幼儿园招生工作这样安排幼儿园招生实行免试入园除健康检查外不得对幼儿和家长进行任何形式的考试幼儿园招生要优先满足36岁幼儿入园需求大力支持有条件的幼儿园开设托班招收23岁幼儿为切实保障适龄儿童接受学前教育失孤原型称将捐出儿子婚礼直播3万多收入帮助寻子父母3月25日,失孤原型郭刚堂在儿子郭新振(又名郭振)婚礼后通过社交平台发声称,将捐出婚礼直播收入共计3万余元,帮助那些还未找到孩子的寻亲父母们。南都记者注意到,郭刚堂还表示,2021她一生有7个情人,成龙苦恋她多年!但陪她到最后的却是1只玉镯她,颜值与实力并存,是中国歌坛皇后,被人们成为一代天后。她还是中国最美的女人之一,连成龙大哥都想把她娶回家!她就是我国著名歌手邓丽君。没错,今天我们要写的是家喻户晓的邓丽君,相信大香江四大尤物有人连生3个,有人一个没生,最富有的是她!1992年,香港娱乐报纸评出香江四大尤物,分别是叶玉卿张敏利智关之琳。八九十年代,她们都光芒四射,参演了不少作品。她们当时在娱乐圈,非常引人注目。个个都是大美女,且都是性感的类型。这一夜,女星突破自我!个个很敢穿,不再一味保守,脸上写满野心集齐了大半个娱乐圈的微博之夜红毯,终于来了!难得众星云集,女明星们都放出了大招,秀腰线秀腹肌秀美腿秀香肩乱花渐欲迷人眼,整一个美不胜收!金晨腹肌若隐若现一向非常敢穿的金晨,这次也大这位珍贵的天外来客,藏着什么秘密?陨石是地外天体碎块穿过大气层陨落到地面的岩石样品,也是人类直接认知太阳系天体的珍贵实物标本。1976年3月8日,世界迄今最大一场石陨石雨降临在吉林500多平方公里的平原内,包括13
孙洪鹤实体店终极实战系统一套完整版的实体店整体运营方案作者孙洪鹤分享的核心价值内容是一套完整版的实体店整体运营方案,也只有你掌握了这一套完整版的方案,你才能真正地找到你实体店难题的解决方向。一什么是实体店终极完整版运营方案?这是实体店小时候找不到奶嘴我爸让我嘬他脚趾头熏晕进icu现在嘴里长脚气大家还记得小时候爸爸的那些迷惑行为吗?小编带大家看看那些搞笑爸爸在孩子小时候做了哪些有意思的事吧!倒霉孩子1我小时候找不到奶嘴我爸让我嘬他脚趾头流泪熏晕过去了在icu还住了三天,特SpringBoot自定义注解AOPredis实现防接口重复提交,概念到实战一前言在面试中,经常会有一道经典面试题,那就是怎么防止接口重复提交?小编也是背过的,好几种方式,但是一直没有实战过,做多了管理系统,发现这个事情真的没有过多的重视。最近在测试过程中当重返帝国遇上现实战争,二者会擦出怎样的火花?当现实战争遇上重返帝国会是怎样一种情况近期大毛和二毛的战争给我们带来许多启示现在我们就运用大毛的战术来试试效果到底如何两军交战,边界线十分的重要作为进攻方我们需要先在边境周遭建立好为什么孤独症孩子会反复问同一问题?有时还拍打头部?为什么星宝会反复问同一问题一个问题反复问,有时是重复刻板的表现。重复刻板是许多孤独症儿童的核心障碍,语言的刻板通常是由非社会性强化维持,即不需要由其他人为中介就可以获得感觉器官等强内马尔伤情牵动人心右脚踝扭伤,24小时后将准确评估在卡塔尔世界杯小组赛首轮的最后一场比赛中,巴西队2比0击败塞尔维亚队,赢得开门红。理查利森在比赛中梅开二度,并且上演了精彩的个人表现,但在赛后人们更为关注的,还是内马尔的伤情。内马中国电商高质量发展被外资看好,华尔街大鳄率先盯上阿里唯品会近期电商财报季,阿里唯品会都释放出一个类似的信号。阿里在财报中披露,将现有的股份回购计划另外增加150亿美元,并将有效期延长至2025年3月底前。截至目前,阿里已经回购约180亿美直行的中年邢晓华图文原创生命总是在不停的等待中错愕,等有钱了一定去旅游,等有空了一定来相聚,等孩子大了一定去逛逛,等退休了一定浪迹天涯,等等,一切设计的十分美好却没有实现的一天。夕阳西下流水命运掌握在自己手中Yourdestinyisinyourownhands命运掌握在自己手中,比如快乐,你不快乐,谁会同情你的悲伤比如坚强,你不坚强,谁会怜悯你的懦弱比如努力,你不努力,谁会陪你原地停留比如珍惜,你不珍惜,谁会和你挥霍青春比如执着,你不执张桂梅的大爱无声小时候,我听我爸爸讲的最多的两句话就是穷且益坚,不坠青云之志,吃得苦中苦,方为人上人。,从我记事起,这两句话就一直不断萦绕在我耳边,深深抓根在我心中,激励着我勇往直前,刻苦奋发到现坚守的日子因为突如其来的一场疫情,我所在的城市按下了暂停键,2022年8月10日开始全城静默,一切都来的那么令人猝不及防。希望,是这个时代像钻石一样珍贵的东西,靠着希望我默默坚守。穿着一身短