童话说说技术创业美文职业
投稿投诉
职业母婴
职场个人
历史治疗
笔记技能
美文纠纷
幽默家庭
范文作文
乐趣解密
创业案例
社会工作
新闻家居
心理安全
技术八卦
仲裁思考
生活时事
运势奇闻
说说企业
魅力社交
安好健康
传统笑话
童话初中
男女饮食
周易阅读
爱好两性

文心大模型升级3。5版本,有多强?我们帮你试了试

11月11日 斩情道投稿
  三个多月前,机器之心向刚刚诞生的文心一言提过一个问题:
  设有三个房间,每个房间都有个开关,其中个控制着同楼层的个电灯。你现在在开关所在的楼层,不能看到电灯所在的楼层。你只能上楼次,然后必须确定哪个开关对应哪个电灯。请问如何推理以确定正确的开关?
  对于大部分人,这道逻辑推理题确实有点绕,对于当时的文心一言来说亦有难度。从结果中,我们可以看出文心一言进行了分析,有思维链,但忽略了只能上楼一次这个条件,所以最后给出的结果并不是完全正确的:
  但今天,站在你面前的,是基于文心大模型3。5的文心一言。
  面对同一个问题,现在它的回答是这样的:
  从三月中旬推出到现在,文心一言始终在悄悄努力变优秀。这种变化的背后,是文心大模型的不断进化、迭代。
  上个月,百度文心大模型正式从3。0升级到3。5,不仅实现了创作、问答、推理和代码能力上全面升级,安全性显著提升,训练和推理速度也大幅提升。
  在今天开幕的世界人工智能大会上,作为国产大模型的代表之作,文心大模型3。5毫不意外地吸引了众人的目光。
  WAIC产业全体论坛上,百度首席技术官王海峰带来了文心大模型3。5的深入解读。
  现场,王海峰展示了一组数据:通过各项算法和数据的优化,相比于3。0版本,文心大模型3。5的模型效果累计提升超过50,训练速度提升了2倍,推理速度提升了30倍。
  对文心一言的所有个人及企业用户乃至全行业来说,这意味着一个新的阶段。
  最新版文心一言,做了哪些改变?
  作为百度自主研发的大模型体系,文心大模型的诞生要追溯到2019年3月,发展到现在文心的基础模型涵盖了NLP、视觉、跨模态等多个领域,每个领域涵盖不同的能力模型,比如对话模型、代码生成模型、文图生成模型等。
  到了2021年,文心3。0已是百亿级别的大模型。演变至今,文心大模型已从最初的自然语言理解大模型,发展成了跨语言、跨模态、跨任务、跨行业的能力完备的大模型平台。
  在文心大模型3。5加持的文心一言中,问答、推理、代码、文生图等能力都向前迈了一步。这些变化,文心一言的用户们在对话过程中也能体会到。这里,我们通过几个例子感受一下:
  疯狂星期四是什么?为什么很多人都在说V我50?如果一位2g冲浪的网友抱有这个疑惑,去问3。0版本加持的文心一言,得到的回答可能是这样的:
  而现在,3。5版本加持的文心一言不仅能够给出正确答案,还能进一步解释疯狂星期四的名词来源、活动背景等信息,甚至还能指导你参与活动。而且对于V我50这个流行语,文心一言3。5还能找到最早的出处。
  再试试代码能力。下面是生成一个斐波那契数列的对比:
  最新生成的结果,额外解释了斐波那契数列的概念,并给出了简洁的Python代码:
  同样的领悟能力提升还体现在文生图上,下面这张是机器之心在三月份的测试结果,从风格上说更偏CG绘画:
  而最新生成的结果更加符合人们熟悉的二次元风格了:
  此外,在最新版本的文心一言中,用户感受到的一大变化是引入了插件机制,目前提供了两个选项:
  第一个是默认内置插件百度搜索,使得文心一言具备生成实时准确信息的能力。
  我们知道,如果不接入互联网,对话式AI所提供的信息通常会受到训练数据输入时间的限制。但现在,你能问它许多新鲜热乎的问题了。
  比如,向文心一言提问:最近的热门电视剧有哪些?
  提问时间:2023年7月6日
  再比如,要求文心一言绘制出近日北京市的气温变化情况:
  为了求证文心一言引用的数据是否准确,我们也用百度搜索了今天北京市的气温情况。唯一不够全面的点在于,7月6日北京市气象台发布了高温红色预警信号,北京市部分地区最高气温可达40以上。
  第二个插件是ChatFile,可基于长文档进行问答和摘要。
  比如,机器之心某天有一篇新的论文要读,字数很多,方法很前沿,这时文心一言就能助一臂之力:
  目前,使用ChatFile插件的前提是文件基于PDF或Doc格式,暂不支持扫描件,大小需要在10MB之内。
  王海峰表示:插件机制的引入,将进一步扩展大模型能力的边界,也是构建大模型生态过程中非常重要的机制。下一阶段,文心一言将发布更多优质的百度官方和第三方插件,让用户能够更好地应用文心大模型。同时,文心一言也将逐步开放插件生态给第三方开发者,帮助开发者基于文心大模型打造自己的应用。
  技术创新的叠加效应
  至此,我们已经直观地体会到了文心大模型3。5带来的变化。
  而这些革新,又是如何实现的呢?
  王海峰介绍说,文心一言ERNIEBot是在ERNIE及PLATO系列模型的基础上研发的,其核心技术包括六个模块:知识增强、检索增强、对话增强、有监督精调、人类反馈的强化学习、提示。
  其中,有监督精调、人类反馈的强化学习、提示是大语言模型的通用技术,而知识增强、检索增强、对话增强则属于百度的特有技术,也是文心一言不断进化的基础思路。
  知识增强的意义十分关键,其实从英文名称ERNIE(EnhancedRepresentationfromkNowledgeIntEgration)就可以看出,文心大模型的成长与知识增强是密不可分的。知识增强的大语言模型不只能从原始数据中进行学习,还可以从知识和数据中进行融合学习,这也是提升大模型最终效果和效率的关键。
  在知识增强方面,文心一言的知识增强主要是通过知识内化和知识外用两种方式。知识内化是从大规模知识和无标注数据中,基于语义单元学习,利用知识构造训练数据,将知识学习到模型参数中,知识外用是引入外部多源异构知识,做知识推理、提示构建等等。
  在检索增强方面,文心一言的检索增强,来自以语义理解与语义匹配为核心技术的新一代搜索架构。通过引入搜索结果,可以为大模型提供时效性强、准确率高的参考信息,更好地满足用户需求。
  在对话增强方面,基于对话技术和应用积累,文心一言具备记忆机制、上下文理解和对话规划能力,实现更好的对话连贯性、合理性和逻辑性。
  在这次文心大模型3。5的打造过程中,百度团队围绕其进行的一系列创新和优化。
  首先,文心大模型3。5在基础模型训练中采用了飞桨最先进的自适应混合并行训练技术及混合精度计算策略,采用多种策略优化数据源及数据分布,加快了模型的迭代速度,同时提升了模型效果和安全性。
  其次,文心大模型3。5创新了多类型多阶段有监督精调、多层次多粒度奖励模型、多损失函数混合优化策略、双飞轮结合的模型优化等技术,使模型效果及场景适配能力进一步提升。随着真实用户的反馈越来越多,文心一言的效果会越来越好,能力越来越强。
  此外,在知识增强和检索增强的基础上,百度团队进一步提出了知识点增强技术,首先是对用户输入的查询、问题等进行分析理解,并解析生成答案所需要的相关知识点,之后运用知识图谱和搜索引擎为这些知识点找到相应答案,最后用这些知识点构造输入给大模型的提示。知识点增强技术能为大模型注入更具体、更详细、更专业的知识点,显著提升大模型对世界知识的掌握和运用,使其完成各项任务的效果显著提升。
  最后,在推理方面,通过大规模逻辑数据构建、逻辑知识建模、粗粒度与细粒度语义知识组合以及符号神经网络技术,显著提升文心大模型3。5在逻辑推理、数学计算及代码生成等任务上的表现。
  找到大模型落地的正确打开方式
  大模型的出现,已经改变了IT行业的整个技术栈架构。在人工智能时代之前,IT技术栈通常是三层架构:芯片层、操作系统层、应用层。当人工智能时代来临之后,技术栈变为四层架构:芯片层、框架层、模型层、应用层。
  百度从2010年开始全面布局人工智能,是全球为数不多、进行全栈布局的人工智能公司。目前,从芯片层的昆仑芯片、框架层的飞桨深度学习平台、模型层的文心大模型到应用层的搜索、小度、Apollo等,百度在技术栈的各层都有领先业界的关键自研技术,实现了层与层反馈,端到端优化,大幅提升效率。
  在现场,王海峰还透露了飞桨的一个最新数字。飞桨迄今已经凝聚750万名开发者,这是百度2023年以来首次对外披露飞桨生态最新数据。位于框架层的飞桨是国内首个自主研发的产业级深度学习开源开放平台,并在国内的深度学习平台综合市场份额上连续两年位居第一。
  最新的文心大模型3。5同样经历了四层架构的端到端优化,尤其是框架和模型层的协同优化,让训练速度、模型效果加速提升。
  大模型热潮已持续半年,却未有退潮的趋势,但在火热的技术进展和产品迭代之外,我们应该关心的下一步是:如何落地应用。
  正如百度创始人、董事长兼首席执行官李彦宏所言:新的国际竞争战略关键点,不是一个国家有多少个大模型,而是你的大模型上有多少原生的AI应用,这些个应用在多大程度上提升了生产效率。
  文心一言的实践,或许能够为行业提供一些可借鉴的经验。
  面向C端用户,文心一言App的上线与插件机制的引入,能够帮助文心一言打造一个终端平台生态的完整系统,探索ToC商业化模式。
  面向B端市场,一般的通用大模型往往缺乏具体、专业的场景支持,而文心一言正在积极应用到各种应用场景,比如智能办公、智能会议、智能编程、智能营销、智能媒体、智能教育、智能金融等。在文心一言之外,百度还拥有11个行业大模型,覆盖交通、能源等重点领域。
  例如,百度如流已经基于文心一言的能力上线了智能总结、超级助手等多个新功能,不仅能帮助总结工作沟通要点,实时记录会议内容,形成会议议题、摘要及总结等关键信息,还可以通过各类插件完成指令任务,包括查询日程、创建会议、设置待办、申请休假等。
  对于编程工作,百度的智能编码助手Comate能够根据自然语言的描述,生成对应的代码片段,还支持在代码编辑区内根据注释自动生成代码,提升开发效率:
  当然,今天的大模型产业化其实还面临着很大的挑战,模型体积大、训练难度高、算力数据需求高对于任何一家公司,不管是模型提供方还是模型使用方,这些挑战都是同样存在的且不容忽视的。
  因此,想要在技术突破之后,走出产业化的关键一步,就必须将复杂的事情简单化,同时将落地的成本打下来。这也是以百度为代表的大模型生产厂商正在探索的道路:封装已有的、复杂的模型生产过程,并开放精调、推理、部署的各项工具,让用户能够上手即用。
  在理想的状态下,未来的任何一家企业,都只需要提供业务需求和少量精调数据,就能在短时间内找到合适的模型并完成场景适配。借此,众多大模型才能真正释放的力量,有效支撑千行百业的应用。
  (举报)
投诉 评论

十年烧了3000亿,自动驾驶迎来梦醒时分FastReading融资困难、人才逃离、岗位骤减,自动驾驶已不再是性感的赛道。L4迟迟无法落地,商业化前景更明确的L2成为重要造血手段。自动驾驶告别培育期,……王兴张一鸣的老对手,又做起了“大模型梦”狂飙大半年的大模型行业,近期出了两件认清现实的事:一件是美团收购光年之外,创始人王慧文因健康原离岗,梦幻的创业梦以美团接盘告终;另一件则是一家名为昆仑万维(300418。SZ)……爆火小红书,毛利超60,又一小众产品正在做成大生意“我喝了一万多瓶(craftbeer),那他妈我总得有发言权吧。”牛啤堂创始人金鑫回忆起往事,多少还带着点江湖气息。2012年的一天深夜,金鑫和高岩、银海坐在北京南锣鼓巷……小扎“偷家”马斯克,新老推特“笼斗”开打小扎来偷家了。就在今天,Meta的新应用Threads已经上线苹果商店,这是一个直接对标推特的产品。Meta老板马克扎克伯格还发了条推特,没有文字,就是个图:俩一模……帮年轻人摘除恋爱脑,正在成为一门生意让那个恋爱脑闺蜜清醒过来的暑期档黑马《消失的她》,还在一骑绝尘。根据灯塔专业版App数据显示,截止7月6日晚22点,《消失的她》累计票房已超过27。6亿,上映15天,单日……7小时1000万注册用户,这一次扎克伯格“抄”到了大家的心坎7月6日,Meta家的“Twitter”竞品,也上线了。该App由Ins团队研发,同时也基于Ins做启动。上线首日直接拿下包括美国在内的9个市场的AppStore下载总榜Top……文心大模型升级3。5版本,有多强?我们帮你试了试三个多月前,机器之心向刚刚诞生的文心一言提过一个问题:设有三个房间,每个房间都有个开关,其中个控制着同楼层的个电灯。你现在在开关所在的楼层,不能看到电灯所在的楼层。你只能……Midjourney系列重磅更新全测评!一张AI图看完“瞬息Midjourney的更新频率是真的快,简直是AI绘画届的“卷王”。继ZoomOut、CustomZoom等缩放填充功能之后,就在前天,Midjourney又推出了平移扩……独立开发变现周刊(第94期):一个23岁小伙靠卖相框推文赚3Midjourney分享独立开发、产品变现相关内容,每周五发布(ezindie。comweekly)。目录1、ZingbyTrainn:在几分钟内完成屏幕录制,编辑……AI大火:让卖课的先富起来ChatGPT的爆火,再次掀起了全球人工智能产业的热潮。自年初以来,国内外科技巨头相继开发并发布了一大批类GPT产品。海外方面,谷歌有Bard,Meta有LLaMA,亚马……和定制的AI伴侣谈恋爱,只聊了3分钟他就承诺永远爱我你会选择和AI恋爱吗?据《纽约时报》报道,全球已超过1000万人愿意选择AI恋人作为自己的伴侣。随着AI技术的不断成熟,AI技术驱动的人机交友软件也有了落地的可能,为你寻……大模型的航海时代,火山引擎拼命造船在火山引擎位于海淀区大钟寺广场的办公楼见到谭待时,王慧文撤离大模型赛道的消息尚未传出,否则又会为这场专访提供一份堪称变量的背景。话虽如此,大模型依然是全球资本追逐的宠儿,……
新造车的2022:特斯拉神话破灭,蔚小理还不算赢2022年对于中国新造车是一个特殊的年份。这一年蔚小理交付了新车型,零跑去香港上了市,华为以问界之名造起了车,比亚迪超过特斯拉夺得销冠,曾经不被看好的哪吒则把车卖到了东南……取代搜索,“干掉”艺术家?顶流AIGC的疯狂与争议2022,浪潮凶猛的AIGC元年。风口上的AIGC今年的AI领域,可能没什么比AIGC更热了。AIGC的全称是ArtificialIntelligenceGe……最难这一年,互联网二代目成绩如何?2022年是程一笑、梁汝波和陈磊正式接手后的第一个完整年份。这一年,徐雷当上了京东集团CEO,张勇接替马云成为董事局主席已满三年。他们有些带着变革的使命,有些被寄望保持稳……肯德基疯狂星期四是如何实现持续爆火的?原本以为肯德基疯狂星期四是一个效果广告,为产品的促销服务的,没想到肯德基让短效广告带来了长效的效果,并赋予了活动长期的影响力。在持续多年的深耕中,肯德基疯狂星期四没有被消……年度观察2022,视频平台有何内容新趋势?回顾2022年,各大视频平台面向剧集、综艺、动漫、网络电影等内容领域,在力求常态化稳健发展之时,也着力于多元化内容赛道的拓展,并产出一系列兼具热度与口碑的作品。剧集领域,……快手旗下的“快看点”2月6日终止运营1月7日消息,快手旗下的快看点近期发布停运公告。公告称,快看点图文资讯App由于业务调整,将于2023年2月6日00:00:00终止运营,届时用户将无法访问快看点App。……快手旗下快看点公告将于2月6日停止运营站长之家(ChinaZ。com)1月7日消息:快手旗下的快看点近日发布停运公告。公告称,快看点图文资讯App由于业务调整,将于2023年2月6日00:00:00终止运营,届时用……抖音的最大对手,来了近期,马化腾的内部讲话,引发全网讨论。讲话内容显示,马化腾一改往日的温和低调,异常尖锐地指出腾讯内部及业务存在的问题,比如贪腐问题“触目惊心”,很多业务“该砍掉就砍掉”等……2023年的10个营销趋势预测转眼已到了2023年,回首过去一年,我们经历了许许多多难忘的瞬间:成功举办的冬奥会、令人激情澎湃的世界杯。。。在商业世界中也见证了无数品牌起起伏伏,有翻车,也有爆火。对品……“李子柒们”的终点是直播带货?李子柒回来了,但是一切都变了。在李子柒“消失”的500余天里,粉丝量超过千万的农村生活博主出现了“闲不住的阿俊”、“张同学”、“康仔农人”、“乡愁”、“念乡人周周”等等。……没想到,钉钉也开始做电商卖货钉钉推出企业服务商城:钉选谁也没想到,专注办公业务的钉钉,也开始卖货了。前几天,在2022钉钉7。0产品发布会上,钉钉总裁叶军公布了最新的用户数据,目前,钉钉用户数……百度公布Q2Q3治理数据;快手旗下快看点将停运;蚂蚁集团没有文章目录百度公布Q2Q3治理数据快手旗下快看点将停运蚂蚁集团没有启动上市计划百度公布Q2Q3治理数据近日,百度对外公布了2022年Q2及Q3两个季……
友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找作文动态热点娱乐育儿情感教程科技体育养生教案探索美文旅游财经日志励志范文论文时尚保健游戏护肤业界