不知道iPhone14,是ChatGPT的最大短板
AI带来的惊奇越来越多了,前有StableDiffusion的AI绘画让画师高呼职业生涯结束,后有ChatGPT让无数程序员、文字编辑越用越心凉。甚至很多用户在对比谷歌搜索和ChatGPT之后,已经喊出谷歌完蛋了。
AI的进化实在太快。
上周,顶着明星光环的OpenAI发布了ChatGPT一个自然语言生成式AI,发布后很快就在小范围内流行起来,随后持续发酵,大量的对话截图开始涌现在Twitter、即刻、微博及朋友圈,并风靡全网。
从敲代码、写稿、推荐到教你学英语、写小说,甚至是一场类似人类之间的对谈,ChatGPT都表现出现了惊人的语言能力。
甚至有TikTok工程师通过一步步引导在ChatGPT中实现了一门新的编程语言GPTLang:
图Tisoga
与此同时,惊人的语言能力也让互联网上人类和AI的界限越来越模糊,Twitter网友clowwindy就发布了一串推文,讨论了ChatGPT使用泛滥可能导致社交媒体上充斥更多、威胁更大的虚假信息:
图clowwindy
讽刺的是,clowwindy最后揭晓这一系列推文讨论实际都是由AI编写完成。
程序员同样也震惊了。国内程序员社区V2EX有用户就在程序员节点发表了一则帖子,名为《体验了下chatGPT,越玩心越凉》。
图V2EX
心凉的背后是,越来越多证据显示ChatGPT在代码编写上的能力,更关键的在于AI的进化速度,在很多人看来AI将在不久后替代大量底层程序员。
当然,ChatGPT现阶段还远不足以替代程序员,但其回答问题的能力却实实在在威胁到了作为搜索引擎的Google,以及编程问答社区StackOverflow。
就在本周,StackOverflow已经宣布一项新的规则:禁止使用ChatGPT生成的内容来回答社区里的问题。
StackOverflow声称,在使用ChatGPT生成的文本回复的问题中,其正确率非常低,而这些内容对整个网站以及寻求正确答案的用户来说是有害的。
ChatGPT不是恶魔也不是神,实际上ChatGPT的横空出世在两年前就埋下了伏笔。
ChatGPT的身前身后
ChatGPT,介绍一下你自己。
图ChatGPT
简单理解,ChatGPT首先是一个对话式的AI。类似我们和Siri、小爱同学通过语音进行对话,寻求AI语音助手的帮助和解答,我们通过文字与ChatGPT对话。不同的是,ChatGPT的能力要强太多,它甚至可以告诉你写一个Chrome离线的小恐龙游戏或俄罗斯方块的代码:
俄罗斯方块完整代码的部分,图ChatGPT
想要了解ChatGPT,绕不开它的身前和身后。
ChatGPT衍生自GPT3的最新迭代版本GPT3。5,同样发布于上周。而早在2020年,OpenAI就发布了自然语言生成模型GPT3,一石激起千层浪,给整个行业都带来不小的震撼,在去年还发布了一个衍生自GPT3的新AIDALLE。
到今年上半年,DALLE升级为DALLE2并对外限时开放使用,在StableDiffusion开源走红之前,正是DALLE2引领了AI绘画的热潮,同时也带火了那张经典的宇航员骑马图。
图OpenAI
DALLE2专注文本生成图像,ChatGPT被定位于人机对话,他们都是身后的OpenAI公司在AI应用与商业化上的尝试。
事实上,OpenAI经历过两个阶段。在第一个阶段,创始人伊隆马斯克以及知名创业孵化器公司YCombinator时任总裁山姆柯曼,出于对强人工智能的担忧成立了非营利组织OpenAI,目标是与其他机构和研究者在AI上进行合作,并向公众开放专利和研究成果。
到第二个阶段,马斯克由于特斯拉在自动驾驶上的利益冲突,选择退出OpenAI董事会。随后,OpenAI于2019年成立了营利性质的子公司OpenAILP。山姆柯曼为此从YC离职后专注于OpenAILPCEO一职,随后还拉来微软10亿美元的入股与合作,并开始了AI商业化的探索。
在GPT3模型发布后,OpenAI就将模型以API形式向开发者客户有偿提供,开发者可以通过API利用GPT3的能力,据官网显示目前已有300多名开发者在App上利用上了GPT3。
DALLE和ChatGPT也是OpenAI商业化探索的一部分。前者已经在图片领域掀起了滔天巨浪,后者更有着巨大的想象空间,从最初级的客服到程序生成,甚至是成为新型搜索引擎。
AI超神,但远不完美
ChatGPT目前仍然处于公测状态,一方面既是希望搜集大众的使用反馈并对AI进行新的改进,另一方面也意味着ChatGPT还处在一个优化迭代的阶段。但即便如此,ChatGPT在搜索、内容创作辅助和编程协助场景上已经带来太多惊喜。
开发者发现ChatGPT不仅能写完整代码,原来还能用来修bug,甚至还会对此进行解释:
图amasad
也能用来辅助写代码。独立开发者TualatriX就展示了ChatGPT如何辅助写代码的过程,并评价其比GitHubCopilot还要好用:
图TualatriX
从开发者群体的反馈来看,普遍都惊叹于ChatGPT在写代码上的实力。
不仅如此,ChatGPT甚至还能写产品路线图和求职信:
写一份InstagramStoryCamera的产品路线图,图Twitter截图
就算是数学公式,ChatGPT给出的回答不仅呈现方式更好,还进行了更全面的解释:
用LaTeX格式来表达微分方程,图jdjkelly
笔者还尝试以明朝背景科幻小说的开头应该怎么写询问ChatGPT,不仅能得到建议角度,还有一个挺有意思的开头:
在明朝的都城里,江南一座城池,宫殿里,官员们在讨论着朝政大事。官员们手中都拿着一张纸,上面画着一张地图,相互猜测着这张地图所代表的意义。
用户也可以直接将ChatGPT当作寻常的搜索引擎使用,询问鲫鱼豆腐汤怎么做或者向小孩子解释量子力学。
很多时候,ChatGPT的语气都非常接近于真人,不仅上知天文、下知地理,更重要的是它会承认自己的错误,甚至主动拒绝一些不合理的问题,这些都让ChatGPT更像屏幕另一端的真人。
ChatGPT当然不完美。
公测期间ChatGPT就多次被挤爆下线,实际对话中经常写到一半就中止,甚至完整句子也没写完,需要用户指示继续。
同时由于海量用于训练的学习数据都截止到2021年,且并不联网,ChatGPT无法针对最近两年的信息给出回答,比如询问iPhone14相关信息,它会直白地告诉你不知道:
图ChatGPT
但这些问题显然不是关键,只要OpenAI花费精力至少都可以解决或改善。ChatGPT的核心问题还是不能实际理解人类的语言,距离AGI(通用人工智能)还有很远的距离。
甚至同样的需求,比如写一个原神,有的用户只会收到原神是腾讯公司推出的网络游戏的回答,有的用户则会收到正确的表诉和示例代码:
图DashHuang
OpenAI也承认,尽管ChatGPT生成的回答从语气上已经非常逼近真人,但有时仍会给出完全错误的答案。
之前就有网友测试发现,询问ChatGPT味精发明人时,回答会指向名叫李清照的中国科学家,笔者尝试同样问题会得到湖北医生阎锡山的可笑回答:
图ChatGPT
相比谷歌搜索,ChatGPT在部分特定范围内确实能更好地回答复杂问题,并且是以接近真人口吻的语气与你交流的,更容易被用户接受。
但就结果而言,ChatGPT可能永远都无法确保结果的准确性,也不同于搜索引擎只是对信息进行价值排序,最终还是让用户自己筛选信息并得出自己的结论。
何况ChatGPT的核心是先通过训练互联网上海量的文本数据,再进行概率性猜测来回答用户的问题,并不能像搜索引擎那样根据实时信息来回答问题,更遑论替代谷歌等通用搜索引擎。
但就像ChatGPT表现出来的,它在数学公式、程序代码以及辅助内容创作上能给出更具参考价值的解释和回答,这也是过去对话式AI并没有突出表现的方面。
写在最后
BoxCEO亚伦莱维认为,当一种新技术已经到了改变你对计算机的看法时,你会有一种特定的感觉。谷歌做到了,火狐做到了,AWS(亚马逊)做到了,iPhone做到了,OpenAI正在通过ChatGPT做到这一点。
图levie
过去几年,AI技术的应用一直是科技巨头的重点,微软、亚马逊、Meta以及谷歌数次推出过类似ChatGPT的对话式AI。
2016年微软就推出过AI聊天机器人Tay,微软宣称用户与Tay聊得越多,它就越聪明。但事实是聊得越多,Tay越是变得满口脏话和反主流言论,它的中国姐妹小冰也是同样。
今年8月,谷歌也推出了新的对话式AILamda,直接表示AI不会从与使用者的互动当中学习,以避免重蹈微软的覆辙,但也切断了Lamda在对话中成长的可能。
ChatGPT没有选择这种思路,而是在先期就设置了安全规范,避免AI在与用户互动中学习到色情、暴力等知识。
从目前来看,ChatGPT绝对是对早期对话式AI的巨大改进,安全设置也避免ChatGPT面对毁灭世界、色情和暴力等要求时一口回绝,但在用户一步一步的问题引导下,ChatGPT还是出现了毁灭人类计划书,甚至还给出了部分Python代码。
去年,OpenAI就承认他们所做的改进并不能消除大型语言模型中固有的毒性问题。GPT3接受了超过600GB网络文本的训练,其中一部分来自具有性别、种族、身体和宗教偏见的社区。与其他大型语言模型一样,它会放大训练数据的偏差。
问题是当OpenAI将ChatGPT正式推向市场,面对海量的用户和一步一步的引导之后,会发生什么?
题图来自OpenAI
现摘下来的桂花能泡着喝吗?为什么?鲜桂花洗净是可以直接泡茶的,不过鲜桂花含水量大,泡出来的茶口感和干桂花泡的口感还是会有一些差异的。干桂花要香味保持的好,建议使用电磁炉干燥或者用食品干燥剂来干燥。现在正式桂花快要开
一提到福建省,你会想到什么?一提到福建,很自然地想到福建是著名的革命老区,第二次国内革命战争时期,方志敏邵式平黄道等领导创建的闽浙赣省革命根据地,毛泽东曾称赞为方志敏式的革命根据地和模范的闽浙赣省。从福建走出
你知道哪些运动员的悲情故事?我所知道的运动员的悲情故事,以前是小山智丽(何智丽),现在是小枣刘诗雯。为啥说她们悲情呢,因为感觉她们受到不公正待遇,都在职业生涯巅峰时期,因为人为原因,都曾经排名世界第一,都曾拿
我们提倡喝热水,日本习惯喝凉水,都是东亚黄皮肤人种差别在哪?我是中国人,一年四季喝凉的直饮水,不喝热开水。吃火锅要拿个空碗放凉了再吃。一直被视为异类。别人奇怪为什么我肠胃那么好,我也奇怪别人为什么不怕烫。我是从什么时候开始的呢?是很多年前看
最新的WTT澳门冠军赛,如果缺少日本女乒乓球队,还会精彩吗?WTT澳门冠军赛,是一场在家门口的比赛。既然是我们的主场,为了让国人和澳门观众看到一场精彩的赛事,国家队派出了全主力阵容陈梦孙颖莎王曼昱刘诗雯这些奥运选手,将会悉数登场。大家都知道
老家河南,老家山西,老家山东,到底哪是中国人老家?中国人的老家是山西大槐树还是河南?山西大槐树走出来多少中国人?为何有人说河南才是中国人的老家?随着现在生活水平的提高,来到假期的时候,很多人选择出门旅游来放松自己,这也是生活质量提
宁德有什么明星?宁德的明星一蔡韵蔡韵,1988年生,福安籍,14岁成为世界和平纪念馆中国儿童的形象代表,因学习成绩优势,15岁获新加坡政府全额奖学金赴新加坡留学,大学毕业后任新加坡国家电视台电视节
魔兽世界怀旧服饥饿之寒白字伤害还不如符文剑,为何能成为狂暴战毕业副手?在魔兽世界怀旧服中增加武器技能的武器并不算多,对于狂暴战来说,无非就是哈卡双刀,符文剑以及饥饿之寒,由于哈卡双刀需要凑齐一对才能提高6点武器技能,所以真正意义上增加武器技能的单手剑
历代街头霸王中的人物都经历了哪些变更?街头霸王是卡普空公司旗下的经典格斗游戏,和拳皇系列是格斗游戏中的两座高峰,那么街头霸王中的人物都经历了哪些变更,加菲来简单总结一下。1隆,作为第一男主角,他就是一个孤独的求道者形象
万国葡计好还是浪琴名匠好呢?各位大神推荐一下哈?相比浪琴名匠来说,万国葡萄牙计时系列腕表不管从品牌价值和性能上都更好。从价位上考虑,这两款相差23万,如果预算没问题的话,我建议推荐万国葡计,下面具体来看看这两款腕表。万国葡萄牙计
准备换车,奇骏2。0和RAV42。0该选哪一个?我都开过这两款车,丰田荣放和东风日产奇骏,发现六个缺点,奉劝大家买车的时候一定要三思,先了解缺点,以后买车少后悔!很多人买车,都有两个特点,第一,要空间大省油,第二个特点开出去有面