在全世界人民都仍处于GPT4的震惊中时,百度终于发布了自己的同类产品文心一言。蓝鲸财经记者在第一时间拿到了内测名额,为大家实测这款新一代大语言模型、生成式AI产品文心一言。 由于是精通中文语境,所以我们首先拿前不久一道给chatGPT做过的题给它做: 显然,文心一言准确地识别了问题中的人物,并且精准回答了其中暗藏的玄机。 但这种喜悦似乎并没有持续多久,当我希望文心一言为我推荐一些礼物备选时,它的回答真的是靠谱中夹杂着各种不靠谱。 请问哪里可以用500块买到iPhone13ProMax手机,我出双倍买! 文心一言像一个听话的工具,让干啥干啥,但似乎缺乏一些判断力,比如我让它帮我撰写一段诺贝尔数学奖的领奖词,这也是写得头头是道,完全没考虑到这奖项根本不存在 可见文心一言虽然有基础的文案撰写能力,但是对于问题并没有基础的纠错能力,同时文案本身也缺乏创意,基本是一些片儿汤话。 在见识过水平能上哈佛的GPT4后,大家对文心一言不太满意在所难免。因此也有博主将其比作AI界的马保国。 但是如果你把这个结论告诉文心一言,它可能会很开心,因为它对马保国的评价很高! 或许文心一言和你对于马保国武术水平的评价并不一致,但是并不能因此否定它作为一款大语言模型、生成式AI产品的能力。 比如我们体验了它的AI绘画功能,虽然某些细节有出入,但是基本要素是具备的: 在chatGPT横空出世之后,不少人都产生了AI焦虑担心自己的工作被AI取代,那文心一言会取代我们的工作吗? 身先士卒,我请文心一言帮助处理了一些工作中的常见数据收集与整理问题: 但仔细校对会发现根据国家电影局数据,2021年春节档电影票房达78。22亿元,这个数据并不准确,除此之外,近五年的指令似乎也没有很好的执行,中间有不少遗漏。看来如果把这类工作都交给文心一言,还是很有风险的。 听说编剧也是有可能被AI取代的高危职业,于是我邀请文心一言续写了今年大热的电影《流浪地球2》,希望能为李彦宏的阳泉老乡刘慈欣省点心: 结果发现,大刘还是得接着写文心一言这水平连投资都骗不到。 文心一言对于信息的覆盖面和掌握程度无需多言,并且在分析的时候很有逻辑: 比如最近爆红的《乌梅子酱》它也能点评一二,并且像模像样: 但从整个回答也能看得出,文心一言呈现的内容比较片面,缺乏更全面的观点,与此同时缺乏更加深刻的点评,换句话说,如果把回答中的李荣浩换成周杰伦应该也是完全可以的,虽然周杰伦的粉丝可能不同意 虽然截至目前,文心一言的表现都显得比较AI,没有人情味,但是我发现它有些时候还是会展示一些人性特质的,比如面对感情问题,它也会表现得像个情感导师 面对深刻的爱与死亡话题也能给出这样的回答: 比如下面这种情况: 截至目前,我们对于文心一言的体验暂告一段落。 虽然这场万众瞩目的发布会被各界唱衰,甚至百度的股价都应声下跌,但真正体验过之后发现,作为近期国内首款大模型,文心一言从回答速度到对话效果整体不错,虽然这其中有很多令人啼笑皆非的bug。但敢于发布文心一言,敢于发布大模型放在公众舆论之下,本身就需要勇气。 就像李彦宏自己也在会上说的:这类大语言模型还远未到发展完善的阶段,进步空间很大,未来这段时间它一定会飞速发展,日新月异,openAI也是在不断自我迭代过程中成长为大魔王的,文心一言刚刚迈出自己的第一步。