ChatGPT死活不认27能被3整除,网友不是说AI要统治世界了吗?
Alex 羿阁 发自 凹非寺
量子位 | 公众号 QbitAI
让众人疯狂的网红AI ChatGPT ,原来也有明显的短板?
一段"网友调教这只AI"的聊天记录,在网上传开了。
可以看到,AI起初居然说27是个质数。
在网友向其提出质疑后,AI仍嘴硬称"27不能被3整除 "。
网友不得不和AI"大战几百回合",最后在人类锲而不舍的教导下,AI才终于终于低头认错。
上述图源:微博@沙雕文案 援引网友空间截图
有一说一,AI的认错态度 倒是很好。
有围观者看完后调侃:AI不是都要统治世界了吗,怎么会输给一道简单的数学题?
不过,也有很多人为ChatGPT说话:这么坦诚的认错态度,不比某些人强多了
。
数学水平拉胯,还贼固执
具体事情是这样的:
网友在和ChatGPT互动的过程中发现,这只AI数学水平过于拉胯,连27是不是质数这种简单问题都能搞错——而且还是在知道质数定义的情况下……
于是网友让ChatGPT证明它给出的结论,没想到,AI居然说27不能被3整除。
网友表示无语,但还是耐着性子又问了一遍,结果AI依然嘴硬,偏把9说成是9.0。
无奈,网友只能搬出代码,试着用Python 来教会AI。
结果AI还真学会了!而且人家还主动承认了刚才的错误。
有意思的是,我们刚才也去问了ChatGPT"27是不是质数",发现它已经改过来了。
然后我们又拿了几个数字去问AI,结果在这一回合中,它都正确地判断了一个数到底是不是质数。
不过仔细一看,AI并没提到35能被7整除,于是我们又专门问了一遍。然鹅……
这岂不是一本正经地胡说八道嘛?
于是我们也只好搬出Python教教它,但这回,连python似乎也没能让AI承认自己的错误……
所以这只AI为啥算术水平如此堪忧,而且还如此固执?
其中一个重要的原因就是,ChatGPT是个语言大模型,根据Open AI的GPT-3.5的模型微调而成,它擅长逻辑推理,但并不能执行标准的计算机算法。
而且与搜索引擎不同,它目前也没有网页浏览功能,无法调用在线计算器。
此前,ChatGPT其实已经向用户坦言,它不懂算术。两位数的乘法或许还凑乎,但遇到三位数的乘法,人家直接不干了。
我们也去问了一遍,现在AI到是直接给了个答案,不过是错的。(正确答案为186524)
另外,ChatGPT一般不会根据用户的反馈来纠正自己的答案,但如果用户提出了额外的信息,有时也能辅助AI优化答案。
所以,我们暂时没有成功地"教育"AI,大概也许可能是运气不太好……除了数学其他都很全能
尽管ChatGPT有时会展现出"人工智障"的一面,但不得不说,大多数时候它的表现还是很优秀的。
比如,哥伦比亚大学教授、谷歌工程师Kenneth Goodman就分享,ChatGPT已经做好成为律师的准备了!
在律师执业考试 中,ChatGPT的正确率高达70%(35/50) 。
不仅是法律方面,Goodman还让ChatGPT参加了其他不同领域的各种考试,都取得了很高的成绩。
包括美国医师执照考试(USMLE) ,拿掉其中的图像选择题后,ChatGPT同样做到了70%的正确率。
为了防止ChatGPT的训练数据中包含这些题目,Goodman还特意选取了纽约州2022年8月最新化学注册考试 :
去除5个图片选择题,ChatGPT的正确率为77.7%(35/45) 。
同样批次的英语考试 中,ChatGPT的正确率甚至达到了91.6%(22/24)
有网友已经开始预测,或许我们每个人都将拥有自己的律师AI了,咨询律师的费用也会大大下降。接下来就是医生AI、营养师AI……
怎么样,你看好ChatGPT的未来应用吗?
(或者你有让它学好数学的建议吗?
)
参考链接:
[1]https://weibo.com/7095186006/Mj6LVF0zS#comment
[2]https://twitter.com/TonyZador/status/1601316732689604608
[3]https://twitter.com/pythonprimes/status/1601664776194912256
— 完 —
量子位 QbitAI · 头条号签约
关注我们,第一时间获知前沿科技动态
万物让孩子也能读懂前沿科学!2023年中文版正式开订万物是一本怎样的杂志?万物,一本让更多孩子爱上科学的杂志。由国内领先的科学编辑团队,与享誉全球的青少年科普杂志HOWITWORKS独家内容合作,为中国家庭奉献前沿权威的科普知识图谱
读书感悟家有顽童本书作者讲述了6类顽童的教育误区和教育对策,教会将顽童向天才转变的5个步骤和4个习惯,以及应对你可能遇到的7个难题。如同书名所说你的孩子是顽童吗?恭喜你,他可能是个天才!书中前面有
无侧切无撕裂,我的顺产日记生产只用了不到半小时,无侧切无撕裂医生说真棒,可是生之前的催产简直痛不欲生啊。我宫缩了一天才开了一指,大夫说开指太慢,建议催我可以说我已经很坚强结果还是求饶了2指打了无痛。我觉得催
坚持不上市的美国工业巨头年入8900亿,家族财富超盖茨巴菲特头条创作挑战赛中国最大的非上市私营企业是华为,但大家知道全球范围内最大的非上市私营公司是哪一家吗?这家公司就是美国的科氏工业,公司背后的掌舵者就是大名鼎鼎的科赫家族。很多朋友可能会
卡塔尔壕气冲天的背后,真的是有钱任性么?有了世界杯这大手笔,让卡塔尔以土豪的身份出圈。那卡塔尔是真的冤大头还是有意为之,我来说,你们来琢磨。卡塔尔和迪拜同属波斯湾海峡,那为什么提到中东,大家想到的多数是迪拜,却鲜有人知卡
冬季晚上咳嗽痰多睡不着怎么回事,如何有效缓解进入冬季以后,天气一天天转凉,寒气的日益加重又为我们的身体带来了一定的隐患。有不少人入冬后开始出现频繁的感冒咳嗽头疼等症状,而到了晚上咳嗽咳痰症状更是会加重,不仅给个人的身体健康带
最后的出击,最成熟的梅西,这一次,里奥真的不再有压力?2022世界杯我只看梅西紧张过一次,阿根廷足球名宿贝隆透露,还不是在足球场上。2010年世界杯小组赛末轮阿根廷对阵希腊之前,马拉多纳第一次把队长袖标交给梅西。梅西不怕在场上当领袖,
布伦森不管手感如何巴雷特总能保持自信这是他的特质直播吧11月22日讯今天,尼克斯以129119战胜了雷霆。在赛后场边接受采访时,布伦森被问及了巴雷特本场的高效表现,对此布伦森这样说道今天,他除了命中了那些投篮之外,我想说的就是他
京东方颇具中国特色的融资之路京东方,A股市场的当之无愧的圈钱之王,在这一点上倍受股友们的诟病。但京东方经过这么多年的不断投融资,给中国企业,尤其是大产业链企业摸索出了一条具有中国特色的产业融资之路,可谓居功于
安永忻怡金融机构应尽快对自身运营和金融资产展开碳盘查2020年9月,中国提出将在2030年之前实现碳达峰2060年之前实现碳中和的承诺。碳中和目标的设立将为金融业的发展带来巨大机遇以及诸多挑战。未来国内金融机构在碳中和目标的道路上如
世界杯上的中国企业赞助商,万达海信蒙牛vivoBOSS直聘雅迪上榜原创三言三言Pro四年一度的世界杯昨日开幕,卡塔尔世界杯创造了很多个第一。它还是最贵的世界杯,卡塔尔投资花费了2290亿美元,相当于此前六届世界杯总和的5倍。此外,这届世界杯中国元