专栏电商日志财经减肥爱情
投稿投诉
爱情常识
搭配分娩
减肥两性
孕期塑形
财经教案
论文美文
日志体育
养生学堂
电商科学
头戴业界
专栏星座
用品音乐

5620亿参数!谷歌发布史上最大通才AI模型,可让机器人更自主

  ·PaLM-E是迄今为止已知的最大VLM(视觉语言模型)。作为一种多模态具身VLM,它不仅可以理解图像,还能理解、生成语言,执行各种复杂的机器人指令而无需重新训练。它还展示出了强大的涌现能力(模型有不可预测的表现)。
  "距AGI(通用人工智能)的问世不会太遥远,不过过程中肯定会出现许多误判。预计在未来五年时间里,AI能够在大多数人类目前从事的工作上表现得比人类更好。"在ChatGPT发布前一个月,OpenAI联合创始人、ChatGPT项目的主要负责人John Schulman在强化学习播客《TalkRL》上说道。
  AGI似乎并不遥远,但对于如何通向AGI,目前研究者都还在探索。就在近日,一个新的研究成果发布——用视觉数据来增强语言处理能力。它的表现令人惊喜,展示出了强大的涌现能力(模型有不可预测的表现)。
  北京时间3月7日,谷歌和柏林工业大学的团队重磅推出了史上最大的视觉语言模型——PaLM-E,参数量高达5620亿(GPT-3的参数量为1750亿)。
  PaLM-E的应用示意。
  "PaLM-E是迄今为止已知的最大VLM(视觉语言模型)。我们观察到诸如多模态思维链推理(允许模型分析包括语言和视觉信息的一系列输入),只接受单图像提示训练的多图像推理(使用多个图像作为输入来做出推理或预测)等涌现能力。"论文的第一作者、谷歌AI研究员Danny Driess说。
  论文的第一作者、谷歌AI研究员Danny Driess的推文。
  在这个意义上,随着时间推移,深度学习模型变得越来越复杂,PaLM-E似乎延续了"产生惊喜"的这个趋势。
  PaLM-E(Pathways Language Model with Embodied )是PaLM-540B语言模型与ViT-22B视觉Transformer模型的结合。它被称为"PaLM-E"是因为它基于谷歌现有的 "PaLM"大语言模型 (类似于ChatGPT背后的技术)。谷歌通过添加感官信息和机器人控制,使PaLM"具身化(embodiment,与身体联系紧密的状态)"。由于它基于语言模型,PaLM-E会进行连续观察,例如图像信息或传感器数据,并将它们编码为一系列与语言标记大小相同的向量。这允许模型以与处理语言相同的方式"理解"感官信息。PaLM-E还借鉴了谷歌之前在ViT-22B视觉Transformer模型上的工作,ViT-22B已经接受过各种视觉任务的训练,例如图像分类、对象检测、语义分割和图像字幕。
  谷歌并不是唯一一个致力于使用神经网络进行机器人控制的研究小组。这项特殊的工作类似于微软最近的"ChatGPT for Robotics"论文,该论文尝试以类似的方式将视觉数据和大型语言模型结合起来进行机器人控制。
  作为一种多模态具身视觉语言模型(VLM),PaLM-E不仅可以理解图像,还能理解、生成语言,可以执行各种复杂的机器人指令而无需重新训练。
  机器人被要求去抽屉里拿薯片。
  根据谷歌的说法,当给出一个高级命令时,比如"把抽屉里的薯片拿给我",PaLM-E可以为一个有手臂的移动机器人平台(由谷歌机器人开发)生成一个行动计划并执行自己的行动。
  PaLM-E通过分析来自机器人相机的数据来实现这一点,而无需对场景进行预处理。这消除了人类预处理或注释数据的需要,并允许更自主的机器人控制。它还具有弹性,可以对环境做出反应。例如,PaLM-E模型可以引导机器人从厨房取薯片袋,而且,通过将PaLM-E集成到控制回路中,它可以抵抗任务期间可能发生的中断。在一个视频示例中,研究人员从机器人手中抓取薯片并移动它们,但机器人找到薯片并再次抓取它们。
  在另一个示例中,相同的PaLM-E模型通过具有复杂序列的任务自主控制机器人,这些任务以前需要人工指导。谷歌的研究论文解释了PaLM-E如何将指令转化为行动:
  我们展示了PaLM-E在具有挑战性和多样化的移动操作任务上的性能。机器人需要根据人类的指令规划一系列导航和操纵动作。例如,给出指令"我把饮料弄洒了,你能给我拿点东西来清理吗",机器人需要规划一个包含"1. 找到海绵,2. 捡起海绵,3. 拿来,4.放下海绵"的序列给用户。受这些任务的启发,我们开发了3个用例来测试PaLM-E的具身推理能力:可供性预测、故障检测和长期规划。
  PaLM-E识别图像中的篮球明星科比·布莱恩特,并可以生成关于他的文本信息,比如他赢得了多少次冠军。
  研究人员写道,PaLM-E也是一种"有效的视觉语言模型"。例如,它可以识别图像中的篮球明星科比·布莱恩特,并可以生成关于他的文本信息,比如他赢得了多少次冠军。在另一个例子中,PaLM-E看到一个交通标志并解释与之相关的规则。
  PaLM-E看到一个交通标志并解释与之相关的规则。
  除了机器人技术,谷歌研究人员还观察到一些有趣的效果,这些效果显然来自PaLM-E的核心——大型语言模型。PaLM-E表现出了"正迁移"能力,即它可以将从一项任务中学到的知识和技能迁移到另一项任务中,从而与单任务机器人模型相比具有"显着更高的性能"。
  语言模型越大,在视觉语言和机器人任务训练时就越能保持其语言能力。
  此外,他们还观察到模型规模的趋势:"语言模型越大,在视觉语言和机器人任务训练时就越能保持其语言能力——从数量上讲,562B PaLM-E模型几乎保留了其所有的语言能力。
  谷歌研究人员计划探索PaLM-E在现实世界场景中的更多应用,例如家庭自动化或工业机器人。他们希望PaLM-E能够激发更多关于多模态推理和具身AI的研究。
  "多模态"已成为一个流行语,我们可能会越来越多地听到这个词。因为很多公司正在研发看起来能够像人类一样执行一般任务的通用人工智能。

高顺为什么没有一人劝降,毕竟人品能力还是权位都与张辽差不多?高顺的人品能力都要强于张辽,但是在白门楼上,却几乎没有一人为高顺说话,没有一人为高顺求情,这是为何呢?事实上,这个原因很简单!你就看看高顺有多恐怖就知道了!白门楼上的滑稽场面事实上为什么郎平离开中国女排后感觉年轻了不少?在女排压力很强吗?郎平没有工作压力,放松心情,享受生活,精神面貌肯定显年轻了不少。任中国女排主教练压力责任很大!无官一身轻!郎平不用操心操劳女排,悠哉游哉,潇洒走一回!看不出年轻来。她在女排的压力不为什么感觉现在的很多孩子都比较容易出现叛逆心理?现在孩子生的少,孩子的要求大人都尽量满足,舍不得让干活,惯的现在的孩子在家里都跟大爷一样,衣来伸手饭来张口现在的孩子太娇惯了,大人从小到大,什么也不让孩子做,放嘴里怕化了,放在手里江苏人考南航南理工有多难吗?江苏人考南航南理工难吗?江苏人既然想考南航南理工,首先就要对南航南理工有一个基本了解。南航南理工应该指的是南京航空航天大学,属于211大学,南京航空航天大学坐落在历史文化名城南京,人连续吃一个月的水煮白菜会怎么样?能达到减肥的效果吗?人连续吃一个月的水煮白菜只能说能有效减重,暂时也能减肥。不过这样的减肥不科学,不健康,因为这样的减肥没有供给人体足够的优质蛋白质,还有膳食纤维,碳水化合物整个都缺失了,这样的减肥只大罗纳尔多时代真的是群星璀璨吗?我是体坛霸主我来回答这个问题。罗纳尔多时代是从1996年2006年,那个时代真是群星璀璨,各路巨星们犹如八仙过海,各显神通。堪称足坛的黄金十年!小编这就带您回顾那个群雄逐鹿的时代。周围的同事都辞职了,我怎么办?主管是一位退伍女兵今年34岁,是一位不折不扣的大美人。我们在的这家公司,是一家民营企业,公司的最高领导是她的父亲。我刚进公司的时候,她就已经是生产车间的主管了。由于她好讲话,没有跟你是怎么熬过坐月子那40天的?分享一下你月子里的酸甜苦辣?堵奶到想回奶。我妈知道我胸大,就怕我堵奶,才特意给我请了月嫂。这里说明下,我初次生孩子,啥也不懂,我家里人双方老人都60岁左右了,也不太懂胸部处理,就后面堵奶了。结果月嫂水平有限,怎么样保持做饭的热情?怎么保持做饭的热情?首先最重要的是要有人对你的厨艺有热情,有称赞第二,就是要有精湛的厨艺哦困为孩子和个人爱好,好的食材很重要。有一个你爱的人就有动力了,反正我老公在家我就想给他多做孩子上一年级了,可是上课不认真听课,注意力不集中怎么办?1,确定身体和精神是否有问题。有朋友孩子是这样的,连米饭都致敏,之后医生让大运动,2个月就有明显好转。2,家长接孩子时要引导孩子说当天上课的内容。我家孩子从幼儿园就开始这样训练。3养狗的人都是些什么样的人?谢谢邀请!养狗的人都是些病得不轻的人,他们对狗狗毫无免疫力。首先,现在人们的生活越来越好了,养宠的人也越来越多了,其中养狗的人最多。他们因为最初对狗狗的喜爱,从此走上了一条病得不轻
王毅台海稳定的定海神针就是一个中国原则来源新华社7月11日,国务委员兼外长王毅在东盟秘书处就坚持开放的区域主义发表政策演讲并答问。针对记者问及当前台海局势紧张的根源以及如何维护台海和平稳定,王毅强调,台海稳定的定海神针券商投行业务中考成绩单IPO承销保荐入账137亿元,头部机构马太效应凸显上半年券商投行业务榜单出炉。数据显示,2022年上半年,券商投行业务股权承销规模超7300亿元,其中首发承销规模超3000亿元,远超去年同期。行业龙头业务优势依旧明显,中信证券蝉联在房贷断供的大背景下,作为投资者的我们该怎么办?最近几天业主断供房贷冲上热搜,大家讨论得最多的就是这种行为是否合法,为什么会出现这样的问题?以及解决的方法。首先这种行为肯定是不合法的,因为贷款合同是和银行签的,房子烂尾是业主和开光遇7。11任务怎么做?2022年7月11日每日任务完成方法分享今天小编为广大的玩家持续更新光遇每日任务的完成攻略,玩光遇的这款手游的玩家应该都知道,每天都有任务等待大家完成,完成任务就可以获得相应的游戏奖励,下面小编为大家带来详细的完成方法,为了复杂而复杂,无效环节太多,是浪姐3不得不反思的问题如果把乘风破浪的姐姐第一季(下称浪姐1)和乘风破浪第三季(下称浪姐3)放在一起比较,在下相信一定有很多人觉得浪姐1更好看。除了浪姐1横空出世的新鲜模式带来的冲击感,抓马的情节设置精期房烂尾,到底谁该出来买单房子,对于中国来百姓来说一直是头等大事,近几十年高涨的房价,带来了巨额的社会财富,也掩盖了许多问题,带来了很大的社会压力。在中国,房子的诸多特殊属性,导致它成为了一种极度特殊的商品女人手表戴左手好,还是右手好?戴错小心让人嘲笑,学会不吃亏文Nicolehi,我是Nicole,准备好一起变美了吗?一个代表的女人,哪怕初次见面,旁人也可以轻易就从腕表中摸索出她的性格和品味。小小一块手表,能瞬间提升搭配的穿搭level,七七事变,一组时间线告诉你发生了什么85年过去,如今卢沟桥的样貌令人很难想象,这里曾经发生过怎样惨烈的战事。卢沟桥卢沟桥文化发展中心供图今天,是七七事变的第85周年。今天,一组时间线告诉你当年的事件经过。回顾当年那些北京健康宝增加新标识,注意!有时间期限北京健康宝疫苗接种情况增加了新标识!除了常见的完成基础免疫完成加强免疫等标识外,还新增了不适宜接种标识。哪些人可以申请?去哪儿申请?具体流程是怎样的呢?受访者供图如果对疫苗成分过敏19年华裔美女警官自杀!曾被多名上司胁迫发生关系,时间长达2年文影中纪实编辑影中纪实前言2022年6月,发生在加拿大的一则诉讼案件引发了世人广泛关注。一户华裔家庭将加拿大温哥华警局全体成员告上法庭,只为给一位在2019年选择自杀的家庭成员陈某探班中国女足王霜的青岛时间7月12日下午,中国女足在青岛国信体育场举行了媒体开放日活动。早在6月中旬,女足队员分批抵达青岛进行集训,备战2022东亚杯足球赛。7月12日下午,中国女足队员正在青岛国信体育场集
友情链接:快好知快生活快百科快传网中准网文好找聚热点快软件