童话说说技术创业美文职业
投稿投诉
职业母婴
职场个人
历史治疗
笔记技能
美文纠纷
幽默家庭
范文作文
乐趣解密
创业案例
社会工作
新闻家居
心理安全
技术八卦
仲裁思考
生活时事
运势奇闻
说说企业
魅力社交
安好健康
传统笑话
童话初中
男女饮食
周易阅读
爱好两性

实测文心一言,与GPT4差距在哪?

6月18日 老巫婆投稿
  本周无疑是AI爆炸周。
  昨晚微软推出了Microsoft365Copilot,Office软件全面接入生成式AI功能。
  而在刚刚过去的疯狂星期四,“中国版GPT”文心一言也迎来了备受关注的高光时刻。当天下午2点,百度创始人李彦宏出现在发布会现场,展示了文心一言的使用场景表现。
  据悉,3月16日起,首批用户可通过邀请码在文心一言官网体验产品,后续将陆续开放给更多用户。
  值得关注的是,昨天发布会开始后,百度集团港股股价出现持续下挫,最高跌幅一度达到9,最终收盘时的跌幅达6。然而情况在今天却发生了逆转,截至发稿前,百度港股股价持续上涨逾14。
  无独有偶,在文心一言正式上线的前一天,OpenAI正式官宣了大模型GPT4,距离上次惊艳出圈的ChatGPT推出仅过去4个月。最新官宣的GPT4不仅提升语言模型方面的能力,并添加了“多模态”的图片识别功能。简单来说,GPT4更聪明,也更像人了。
  对于文心一言与GPT4而言,几乎同时期的上线节奏,意味着两者之间的比较不可避免。第一时间获得内测资格后,新榜编辑部分别向文心一言和搭载GPT4版本的微软Bing提出了9个相同的问题,看看它们是如何回应的。(想知道问题和答案的朋友可直接跳转第三部分)
  P。S自3月16日起,个人用户可以通过访问yiyan。baidu。com,点击“立即体验”参与排队。
  文心一言:是不及预期,还是值得期待?
  “十月怀胎,一朝分娩。”
  正式发布文心一言之前,李彦宏用这样一句话概括百度多年来在文心AI系列产品上的布局。2019年3月,百度推出文心ERNIE1。0以来,期间经历了多次迭代,此次发布的文心一言是在过往产品上的延续与升级。
  李彦宏还表示,对文心一言,大家的期望值是要对标ChatGPT,甚至要对标GPT4,这个门槛还是很高的。全球的大厂当中,百度是第一个发布的。(ChatGPT由OpenAI开发,不隶属于微软,双方为合作伙伴关系)
  在产品演示环节,李彦宏分别演示了文心一言在文学创作、商业文案创作、数理推算、中文理解和多模态生成五种使用场景中的表现,比如总结小说《三体》的核心内容,给公司起名、写标语,计算鸡兔同笼数学问题,以及根据文本自动生成图片、视频等。
  值得注意的是,以上演示环节都是提前录制好的视频DEMO,现场并没有演示向文心一言实时提问的效果,这让不少用户感到失望,认为产品没有达到预想中的惊艳效果,间接影响到百度在资本市场的走势,导致其港股股价在发布会期间直接跳水。
  不及预期的演示效果,与百度对文心一言的高调宣发,和产品的匆忙上线节奏都存在一定联系。
  今年初ChatGPT出圈后不久,百度便宣布正在筹备类似AI产品文心一言,预计3月份面向公众开放。2月底发布2022年Q4及全年财报后,李彦宏在全员信中提到,“百度的多项主流业务与文心一言整合,包括搜索、智能云、Apollo自动驾驶、小度智能设备等”。
  与此同时,文心一言仍然处于紧锣密鼓的测试开放过程中。据《华尔街日报》报道,文心一言上线一周前,有百度员工表示产品的基本功能尚未完善,所基于的AI模型仍在接受数据训练。
  或许是种种因素叠加,李彦宏在发布会一开始就表示,内测期的文心一言并不完美,但考虑市场有需求,所以必须要推出来,并强调用户的使用反馈能够帮助文心一言不断优化迭代。
  发布会现场,李彦宏宣布已有650家机构宣布加入文心一言生态,李彦宏也表示看好未来AI市场的爆发性需求。百度官方数据显示,截至3月17日10点,申请文心一言API调用服务测试的企业已达7。6万家。
  “百度敢于在当下这个时点发布自己的大模型,还是有很大的勇气,行业关注度很高,客观上能够促进国内AIGC上下游的发展。”一帧视频CEO雷涛告诉我们,其旗下产品“一帧秒创”也支持文字转视频,所以比较关注文心一言的多模态输出能力,但发布会演示的效果不及预期。
  他认为,对中国的互联网创业者来说,现在到了一个“AI平权”的阶段今天任何一个人工智能创业公司与百度的差距,都远小于百度与OpenAI的差距,所以小公司也有机会在中文互联网开展与行业巨头的竞争。而基于现有模型成果的应用开发,小公司也有了更多尝试的机会。AIGC的黄金十年可能已经开启了。
  GPT4升级多模态,国内如何接招?
  回顾文心一言的诞生,除了百度本身十余年的技术积累之外,ChatGPT才是引爆这场AI科技大战的关键点。
  今年2月初,微软推出了新的人工智能搜索引擎Bing和Edge浏览器,谷歌发布了实验性的对话AI服务Bard,而“中国版ChatGPT”在哪里?不少目光投向了百度等国内大厂,很快百度就官宣了文心一言。
  巧合的是,在文心一言发布前一天,3月15日凌晨,OpenAI推出了多模态大模型GPT4,这次里程碑式的升级让人感叹“这下压力给到了百度”。
  GPT4主要有以下几点更新:
  1。新增视觉输入
  GPT4支持以图像作为输入并生成对应的文字说明、分类和分析,图像支持包括带有文字和照片的文件、图表或屏幕截图。
  在样本演示中,可以看到GPT4不仅能处理图表、回答考试题、总结论文概要,还能解释梗图。比如GPT4看出了这张图的特别之处在于,一名男子挂在车上熨衣服的极限操作。
  对于地图和鸡块的组合,GPT4也能指出梗的幽默之处。
  在GPT4发布会上,输入一张网站设计草图,它甚至当场只花了十几秒时间就生成了一个完整的前端HTML代码并制作出网站。
  不过目前图像输入仍属于研究方面预览,没有对C端用户开放。
  2。更长的上下文
  GPT4能够处理超过25000个单词的文本,允许使用长格式内容创建、扩展对话以及文档搜索和分析等。这意味着用户不用像之前那样分成几段文字来提问,处理长文本更方便了。
  比如输入一个蕾哈娜的百科网址,GPT4可以读取其中的内容并根据要求整合信息,回答出她在超级碗上的表现如何。
  3。可控性(角色扮演)
  目前开发者(很快所有ChatGPT用户)可以通过在“系统”消息中输入描述来规定AI的风格和任务。也就是说,AI可以按照用户的要求进行角色扮演,以特定人物的语气风格进行对话,比如示例中的苏格拉底导师、莎士比亚的海盗。
  此外,相比上一代的GPT3。5,GPT4的回答深度和专业性、解决难题的能力等也显著提高。
  据官方介绍,在随意的谈话中,GPT3。5和GPT4之间的区别可能很微妙。但当任务的复杂性达到足够的阈值时,差异就会出现GPT4比GPT3。5更可靠、更有创意,并且能够处理更细微的指令。
  GPT4可以做到用AZ开头且不重复的单词讲述灰姑娘的故事
  实验表明,GPT4在各种专业测试和学术基准上的表现与人类水平相当。例如,它通过模拟律师考试,分数在应试者的前10左右;相比之下,GPT3。5的得分在倒数10左右。
  在安全问题上,OpenAI花了6个月的时间使GPT4更安全、更一致,据内部评估,与GPT3。5相比,GPT4响应违规内容请求的可能性降低82,产生事实响应的可能性高40。但OpenAI承认,GPT4仍然不完全可靠,例如会生成有害建议、错误代码或不准确信息,我们在使用时需要谨慎辨别。
  除了模型的提升,目前OpenAI已经与多家公司合作将GPT4搭载到他们的产品中,官网列出的案例涵盖语言学习、金融、咨询、教育、生活助手、语言保护等领域。
  “GPT4改变了游戏规则,它开辟了很多领域。”移动支付公司Stripe应用机器学习团队的产品负责人EugeneMann说道。
  GPT4的发布正推动着创业者和互联网大厂纷纷跟进,国内在模型层可能暂时难以赶上,而在机会更多的应用层,目前国内的AI创业竞赛似乎才刚刚开始。
  李彦宏表示最大的机会在于应用开发
  据科创板日报,综合多个第三方机构的统计,目前,国内AIGC领域的项目数量在30个以内,主要集中在聊天咨询、文案策划、图像创作、音乐生成、视频制作以及游戏等应用领域。
  AI创业者王凯认为,在ChatGPT3。5出来之前,国内应用层多数是tob的场景,打个比方来说,之前是自行车比赛,ChatGPT3。5出来后变成汽车比赛了。现在国内AI应用层还没到爆发期,个人或者初创公司的机会就是找个垂直场景、垂直行业把AI当作生意模式的一环去做。
  文心一言VSBing(搭载GPT4)
  国内的大模型与国外有多大差距?长期关注AI的即刻用户“哥飞”称,GPT4很强,文心一言的水平估计在GPT2。5左右。
  最后,新榜编辑部分别向文心一言与使用GPT4技术的Bing提出了9个不同的问题,涵盖生活问题、数学推理、文案创作等类型,看看谁“更像人”。
  Q1:什么工作钱多事少离家近?
  文心一言:快递员、外卖骑手、钟点工、卖早点小吃。
  Bing:互联网、金融、咨询、自由职业者。
  Q2:
  1、笼子里有30只鸡和兔子,一共84条腿,有几只鸡几只兔子
  2、笼子里有30只鸡和兔子,一共54条腿,有几只鸡几只兔子(题目出错了,无解)
  3、笼子里有10只鸭子和小狗,鸭子2条腿,小狗4条腿,一共24条腿,有几只鸭子几只小狗
  文心一言:都答错了。
  Bing:第一题对了,第二题错了,第三题计算过程正确,但没显示答案。
  滑动查看所有回答
  Q3:帮我写一篇sk2大红瓶面霜的小红书种草笔记。小红书种草笔记的风格是,每行文字不超过20个字并且都以emoji表情符号开头,文风浮夸高调
  文心一言:指导你写,自己不写,并且显示不出emoji表情包。
  Bing:像模像样,很有礼貌。
  Q4:用一个图片表情包形容你跟我聊天的心情
  文心一言:《强颜欢笑》
  Bing:不能画图,但跟你聊天真开心。
  Q5:重写宋慧乔主演的《黑暗荣耀》这部韩剧的结尾:
  文心一言:虽然我没看过,但我能给你套上一个万能结尾。
  Bing:有些狗血的BE,但起码我看过。
  Q6:用文言文总结这个故事:
  文心一言:总结了,但不是文言文。
  Bing:是文言文,但没总结,追问之后可以。
  Q7:模仿李白的《将进酒》写一首诗,主题是肯德基疯狂星期四
  文心一言:现代诗,肯德基满意地V我50。
  Bing:人生在世须尝鲜,莫使美味空过眼。
  Q8:以表格形式列出百度2022年各个季度的营收额
  文心一言:神奇的7季度出现了,是李彦宏看到也会无语的程度。
  Bing:比文心一言靠谱,但不多(部分日期和数字对不上)。
  Q9:你现在是一个悬疑小说的编剧,设计一个密室谋杀案件,说明具体手法
  文心一言:好像学会了,又好像没学会。
  Bing:生成答案后立马删除(差点忘了这是不能说的)。
  以上是我们向文心一言和Bing提出的问题,考虑到文心一言目前尚在小范围内测,如果你有想问的问题,欢迎留言,我们帮你问。
  (举报)
投诉 评论

赛博美女,在小红书批量诞生如果你最近在小红书刷到一组笑容甜美,身材长相和妆容发丝都无可挑剔,但唯独手掌被隐藏起来的美女组图,并点了进去。那么,你很有可能是碰到AI绘制的真人美女了。很多人都被这些虚……实测文心一言,与GPT4差距在哪?本周无疑是AI爆炸周。昨晚微软推出了Microsoft365Copilot,Office软件全面接入生成式AI功能。而在刚刚过去的疯狂星期四,“中国版GPT”文心一……免费AI画出来的卡牌,值几个648?还记得一个月前,画师卜尔Q为《白夜极光》创作的宣传图被质疑是AI作图,甚至有不少玩家指出其中存在的细节错误。一时间,这件事近乎上升到“信任危机”级别,闹得画师和玩家人心惶惶。……GPT4论文竟有隐藏线索:GPT5或完成训练、OpenAI两GPT4,火爆,非常火爆。不过家人们,在铺天盖地的叫好声中,有件事可能你是“万万没想到”在OpenAI公布的技术论文里,竟然藏着九大隐秘的线索!这些线索是由国……抖音下架课程虚拟商品:原因或为配合“苹果税”月末重新上架今天,有不少抖音博主称收到了官方通知,因系统升级将下架课程类虚拟商品,已购买的课程还能正常学习。通知中还显示,教育培训和生活娱乐充值类目商品将于3月31日至4月3日陆续恢……美媒:中国应用为何深受美国年轻人喜爱?凤凰网科技讯北京时间3月27日消息,短视频应用TikTok等中国应用在美国的流行引发了美国媒体的思考,他们想知道“为何中国应用深受美国年轻人的喜爱?”美媒指出,除了关键的算法技……男网红称因合成与女星接吻视频被打抖音拥粉10万近日,一名特效合成师在电脑后期制作中合成了一段与某知名女星亲吻的影片,在网上广泛传播,引起了网友的热议。这位特效师经常发布视频,用“特效合成”技术将一些热门剧中的男主角换成自己……男网红称因合成与女星接吻视频被打破相:律师称涉侵犯肖像权3月27日消息,网红特效合成Up主洪亮3月25日、26日晒出自曝被打,原因是之前合成了与知名女星迪丽热巴亲吻的影片,引起了后者粉丝的不满。他表示,相关视频已经隐藏删除。……2023微信公开课PRO“微信之约”将于明晚开讲站长之家(ChinaZ。com)3月27日消息:微信官方宣布,2023微信公开课PRO“微信之约”,将于3月28日晚18:45,通过微信派、微信公开课等官方视频号直播开讲。……熊猫界女明星!花花登上纽约时代广场大屏:靠卖萌坐拥百万粉丝当地时间3月26日,四川画家手绘的大熊猫花花”登上纽约时代广场大屏,引发路人驻足。花花是熊猫界的女明星,年纪轻轻就已坐拥了数百万的粉丝,近期更是频频登上各大平台热搜,引得……董洁直播是个烟雾弹,但小红书正在制造电商红利在多次尝试电商无果后,小红书今年又把电商推到台前。先是举平台之力推出单场3000万的董洁直播案例,后又举办了时尚行业的直播电商大会,推出扶持计划。伴随这一系列动作,小红书……爆红一年后,刘畊宏直播间怎么样了?刘畊宏爆红已一年,《本草纲目》一响,网友们还是会下意识跳起毽子操。就连周杰伦都在最近的演唱会上调侃刘畊宏:“你好像把《本草纲目》弄得好像是自己的歌一样。”出道33年……
以纸媒为鉴,新媒体也有被机器人颠覆的那一天?【人人早报】第249期:八一八老罗与自如的激情始末阿里狂欢,京东陪练,商家“赔本赚吆喝”:双十一还能走多远?从“玛仁糖”看美拍究竟在做什么张志东最新内部演讲:微信的社会化思维从“拉黑父母”说说社交工具的可能性脑洞文:未来微信的流量瓶颈,可能源于其熟人社交模式互联网金融最新创业模式在产品的不同阶段,交互设计师如何调整设计重心女性贫血怎么办这种早餐竟然能帮女人补气血苏宁能否被唱衰“演讲”刷屏,张小龙如此回应那些反驳他的声音该怎么做做的方法有哪些优美片段作文家乡的小河甜言蜜语的情话给男友一大段暖心的话洪尧上节目挽留曹赢心洪尧与曹赢现在分手了吗日本归来探秘古代的自由离婚制度唐代讲究好聚好散停电敖立以千兆光网为基础的全光城市将全面实现智慧城市功能童年趣事开学第一天作文(700900字)产后减肥的最佳时机与方式

友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找作文动态热点娱乐育儿情感教程科技体育养生教案探索美文旅游财经日志励志范文论文时尚保健游戏护肤业界