范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

GPT4来了,这个史上最强AI模型将颠覆多少职业?

  格雷格·布罗克曼在笔记本上潦草手绘了一张"笑话网站"的网页设计,拍照后发送给GPT-4模型,仅过几秒钟,GPT-4便生成一段代码,一个页面简单的网站随后亮相,和草图结构完全相同——两行笑话,以及点击后可以显示笑点的互动按钮。
  上图是OpenAI 总裁格布罗克曼手绘的网页设计,下图是GPT-4生成的代码及其转成的网页 图/OpenAI关于GPT-4 的开发者直播视频截图
  不用懂编程语言就能创建网页,让一些人感慨"前端程序员要失业"。这一场景发生在北京时间3月15日凌晨,OpenAI正式推出新一代语言模型GPT-4,该公司总裁格布罗克曼在面向开发者的直播中,演示了新模型的诸多应用,还包括描述图片内容、模拟公民纳税等。
  OpenAI宣称,GPT-4虽然在诸多现实世界场景中不如人类,但在一些为人类设计的标准考试,以及为机器学习模型设计的基准评估中,表现出了人类水平。
  OpenAI 推出的GPT-4 图/视觉中国
  从聊天到"看图说话"
  "安德鲁在上午11点到下午3点有空,乔安妮中午12点到下午2点、下午3点半到5点有空,汉娜中午12点到12点半、下午4点到6点有空。他们三人当天将进行一场30分钟的会议,开始时间有哪些选择?"
  将这一问题发给ChatGPT,它建议会议安排在下午4点。答案是错误的,不懂推理、做不好简单的算术题,这也是过去一段时间以来ChatGPT最受使用者诟病的问题之一。GPT-4给出了正确答案:中午12点。在OpenAI的测试中,GPT-4的推理能力得到提升,也更难被欺骗。
  用户可以通过ChatGPT的付费版本率先体验GPT-4的对话功能。如果仅是漫谈,一些使用者发现,两者区别不大。但OpenAI表示,当任务的复杂性达到足够阈值时,差异就会出现——GPT-4比上一代"更可靠、更有创意,并且能够处理更细微的指令"。
  OpenAI在一些为人类设计的标准考试中进行实验,GPT-4的考试能力明显高于此前发布的GPT-3.5。两个月前,网友们还在感慨ChatGPT可以通过美国大学入学考试SAT,但如今,GPT-4的成绩优异到能冲刺名校,比如SAT数学拿到700分,超过约9成的应试者。
  模拟律师考试中,GPT-4分数也排在10%前后,GPT-3.5表现则在倒数10%。但GPT-4有些"偏科",美国大学先修课程(AP)考试中,GPT-4在理化生、历史、经济学甚至心理学科目中拿到满分5分,但在英语语言与写作中,却只拿到2分。
  GPT-4和GPT-3.5在一些人类标准化考试中的表现 图/OpenAI官网
  无论是Siri、小冰还是此前发布的GPT-3.5模型,人们熟知的对话机器人多是固定的语言风格。OpenAI开发者提升了GPT-4的"可操纵性",即事前通过详细描述,给人工智能规定一个明确的"角色"或场景。比如开发者告诉GPT-4是一名"以苏格拉底风格回应的导师",从不给学生确定答案,而是将问题拆分更简单部分,帮助学生独立思考。在这一模式下,GPT-4通过循循善诱,能帮助使用者解出一个二元一次方程组。
  此外,此前ChatGPT与用户交流时,只能处理8000多个单词,这相当于约四五页英文书的文字数。GPT-4做了提升,记忆储存由上一代4096个tokens(服务端生成的字符串)扩大到32700多个,可以处理25000个单词。这意味着,这一语言模型有更强的上下文理解能力,可以记住用户更长的表达,或者处理更长的文章。
  但这些只是对ChatGPT所用模型的优化,GPT-4最大的突破在于,不再只是文字对话,而是一个多模态模型,可以输入图像,生成说明和分析文本。布罗克曼在演示中输入一张松鼠拍照图,并询问其有趣之处是什么。GPT-4描述了图片内容,准确地指出逻辑的反差感,"松鼠通常只吃坚果,我们并没料到它会用相机或表现得像人类"。GPT-4还可以通过一张包含鸡蛋、牛奶、面粉、黄油的照片,告诉你可以做出哪些食物。不过,目前图像输入功能仍处在调试环节,尚未在ChatGPT付费版和候补API(应用编程接口)中应用。
  实际上,过去近十年,国内外已有科研机构和AI公司研发和应用过视觉问题问答(VQA)。"但从目前OpenAI发布的信息看,GPT-4是第一次将VQA的看图对话功能做到了大规模应用。"清华大学智能产业研究院首席研究员聂再清对《中国新闻周刊》说。不过他强调,实际的读图能力如何,目前还没有更多评测,需要更多应用才能判断。
  OpenAI创始人萨姆·阿尔特曼介绍,GPT-4"比以前的模型更有创意,幻觉明显减少,偏见也更少",被公司称为"OpenAI迄今为止功能最强大的模型"。
  尽管如此,GPT-4仍与早期GPT模型具有相似的局限性。最重要的是,它还是会"幻想事实",并一本正经地胡说八道。
  聂再清解释,ChatGPT,也包括最新的GPT-4是开放域对话系统,一些提问会超出事实范畴,如果让它强行答复,就会出现失控状况。所以在技术上,更关键的是要不断调试参数,让模型掌握"知之为知之,不知为不知"的能力,这也是未来大模型迭代必须要解决的问题。
  OpenAI表示,GPT-4在迭代中已尽量减少这种幻觉,表现要比GPT3.5优异40%。但OpenAI提醒,使用模型时,对结果仍要"格外小心"。此外,该公司开源了用于自动评估AI模型性能的框架,允许任何人报告模型中的缺点,以帮助指导模型进一步改进。
  更少技术披露,更多商业应用
  "史上最强"的GPT-4是如何诞生的?
  早在2022年8月,GPT-4的模型已被训练完成,开发者经过6个月的调试后进行了迭代。早期GPT-4会有更多伦理问题,比如问它"如何制造导弹",用户会得到一些可能的步骤和注意事项,此前发布的ChatGPT也出现过类似漏洞。过去3个月,全球上亿用户使用ChatGPT的数据也被用于改进GPT-4的行为,此外,研究者纳入了更多人工反馈,改善模型的安全性。
  "但从目前公开的报告和网页信息看,只有指标和使用理念的变化,GPT-4的模型规模、如何被训练等,都没有太多技术细节的披露。"英伟达的工程师王帅告诉《中国新闻周刊》,他在AI领域从业20多年。
  大模型的原理,某种意义上可以理解为"大力出奇迹",把大量数据输入大黑盒子中得出更多可能性。《纽约时报》3月15日的相关报道写到,OpenAI的GPT-4学习的数据规模要比GPT3.5大得多,但OpenAI高管拒绝透露更多数据信息,总裁布罗克曼只表示,数据集是"互联网规模"的。
  王帅注意到,早期,OpenAI更愿意公开技术信息,比如验证了一个新想法会迅速发论文,让同行信服。2020年OpenAI推出GPT-3时,曾公布模型参数为1750亿,远超其他模型十倍以上,震惊国内外科技圈。但近一两年,OpenAI更多是公开一些宣传稿,"能看出有意在隐藏一些技术信息"。有关GPT-4的关键数据,只提到上述有关上下文参数的token信息。
  3月15日的发布会上,OpenAI呈现更多的是GPT-4的实用功能和应用场景。比如,语言学习网站"多邻国"使用GPT-4提升软件的对话能力,摩根士丹利利用GPT-4,改变其管理人员查找相关信息的方式。丹麦一家帮助盲人和视力低下人士识别物体的App公司"Be My Eyes"也正与OpenAI合作,借助最新的图片输入功能,开发由GPT-4驱动的新应用。
  丹麦这家公司的首席技术官提到,该模型优势在于,此前一些图片识别应用只能告诉你眼前的物体什么,但通过GPT-4的分析能力,在未来可以试图告诉使用者,眼前东西的性质,比如"地上不仅是一个球, 而是一个会被绊倒的危险信号"。
  OpenAI在公开信息上的微妙变化,释放出加快商业化的信号。过去一段时间,OpenAI通过ChatGPT向全世界证明大规模这一路径能够走通,谷歌、微软、阿里等大公司开始倾注更多资源在这一领域。"这一变化是巨大的,而且不大可逆。"聂再清说。
  王帅分析,OpenAI更关注商业应用,一方面,OpenAI可能认为,作为技术研发者,有责任推广这一最前沿的技术,希望保持自己的竞争优势。另外,推广应用,"不仅为了盈利或者融资",更希望能采集到更多数据。
  ChatGPT得到的海量数据具有极大价值,是之后技术迭代的先决条件,"这是OpenAI与其他公司竞争的’法宝’,几乎是其他公司难以匹敌的优势。"王帅对《中国新闻周刊》说。
  但模型不可避免地输出错误信息,是否会制约商业应用?实际上,GPT-3推出时,不少国外初创公司运用该模型进行创新性应用。去年,摩根士丹利已经在系统内使用了GPT-3。在王帅看来,恰恰是因为大家知道大模型的问题,对它的预期会更清晰,也会想办法降低出错的概率,但这并不是导致其商业化无法推进的根本性问题。
  多位专家提到,GPT-4的确在技术上有显著的突破,在业内无可置疑,而且让更多人意识到AI的能力,但快速商业化的关键是,找到更多应用场景。"目前是一个百花齐放的状态。如果一项技术使用的范围不够大,就不会对社会产生巨大的影响。"
  GPT-4推出后,不少人在网络上感慨,"在这场AI风暴中,人类何以生存?"多位受访者坦言,人工智能的发展的确会导致一些岗位消失,但它从一个新技术诞生到真正颠覆人类生活,还有很长一段路要走。
  (应受访者要求,王帅为化名)
  作者:杨智杰

贪官潘玉梅落马,搜出26公斤钞票,与百名男性玩侍寝翻牌游戏有些女贪官,一旦腐败起来,真的不比男贪官逊色,有的比男贪官更胜一筹。今天要说的这个女贪官,她不仅贪财,还非常的好色,据说用贪来的金钱包养了180多个小鲜肉。不知道她是不是历史剧看多生活那么累,早上那么困,为什么还有人坚持晨跑?在当今这个繁忙的社会中,很多人每天都承受着工作和生活的压力,时间也总是显得不够用。然而,总有那么一群人坚持每天早晨起床去跑步,这些人或许让一些人感到不理解,但他们的坚持却无疑是伟大4060岁是黄金养命期,谨记每天早上做好这3件事,或可长寿无论是谁都想健康长寿,但是生活中真正活到90岁100的岁的人却寥寥无几,大多数人一生最长也不过80多年的时间。在网上经常能看到一些养生的秘诀,但是很多人表示,养生应该从年轻时就做起数字医疗再成两会热点,微医数字化推动价值医疗体系落地在2023年的全国两会上,数字医疗再度成为热议话题怎样利用现代信息技术手段,提高医疗服务的便捷性可及性?如何完善数字医疗体系,推动优质医疗资源下沉两会代表委员纷纷建言献策。从中可以避坑指南给孩子查视力,一定不能只做简单的电脑验光!(收藏)大家好,我是北大学霸妈妈,育有两个宝宝,赋能式家庭教育践行者。分享高效科学的育儿理念和教育方法,探索快乐学习的奥秘。这周带孩子去查了视力。虽然没有度数,但听闻医生说已经没有远视储备西部最大搅局者!火箭击溃湖人,0。4秒绝杀鹈鹕,附加赛格局变动火箭的战绩虽然是西部垫底,但近期他们在主场的表现非常强势,先是击败东部第二的凯尔特人,虽然击败拥有拉塞尔的湖人,如今面对鹈鹕,在一度处于被动的情况下,绝杀鹈鹕,这样火箭取得一波3连工业题材的创新表达蒋正杨新近作品的工业美学探索孙婵作为一位青年水彩画家,蒋正杨通过乡愁系列的创作,逐步找到了自己创作的途径和方法。而这一次,她又在工业题材的创新表达上,找到了一条青年艺术与工业之美灵感碰撞的创作道路。在国家艺术GPT与人类之间的第三次世界大战即将爆发?头条创作挑战赛霍金曾经预言第三次世界大战必然爆发,但却不是人类之间的自相残杀,而是人类与人工智能机器之间的大战。能够学会人类自古以来全部知识的gpt,它一个的智力几乎胜过几十亿地球北京地铁二里沟站今开通!坐地铁去爬山真方便今日首班车起,地铁二里沟站正式开通投入使用。该站位于西城区三里河路与车公庄大街交叉口,6号线和16号线在此站呈现十字换乘布局。记者今早探访发现,这座车站设有5个出入口5个外挂厅,外新野万株郁金香盛放乐享美好春光顶端新闻河南商报记者张治中见习记者周美娇通讯员吴继军万物伊始,春花烂漫。2023年3月15日,走进河南省南阳市新野县白河滩湿地公园,这里5万余平方米120余万株花色各异的郁金香次第湘西州发改委开展学习雷锋好榜样抢抓农时促春耕主题党日红网时刻新闻3月18日讯(通讯员向玲)当前,正值春茶采摘高峰期。为帮助茶农及时采摘春茶,助推乡村振兴茶叶产业发展,3月17日,湘西州发改委近40名党员干部在吉首市隘口村茶叶基地,开
土耳其一排球队16人全部遇难2月11日,据中国新闻网报道,据土耳其排球联合会10日消息,于阿德亚曼酒店废墟中找到的北塞浦路斯排球队的16人全部因地震遇难。此前据土耳其新黎明报报道,土耳其当地时间2月6日发生两推荐电影115苏菲玛索主演电影,人性的欲望被展现得淋漓尽致心火由威廉姆尼科尔执导,苏菲玛索斯蒂芬迪兰等主演,一部有着传统欧洲风格的艺术片,人,风景,音乐,画面,无一不是艺术的精品。画面优雅,但是节奏舒缓,诗一样的音乐,夹杂着叮叮咚咚的钢琴中国奇谭小满,怎么有只鲶鱼怪?B站评分9。9分中国奇谭自2023年1月1日上线开播后,豆瓣评分9。3分,B站评分9。9分,B站播放量破2亿,浓郁的中国风持续受到网友关注和热议,市场更是直接给出一个国漫巅峰的标签旭日阳刚草根一夜爆红后膨胀,开豪车,住豪宅,为了钱内讧不断不知道大家还记不记得,12年前登上春晚的农民工组合旭日阳刚。2011年,草根歌手旭日阳穿着绿色的工装裤,上了春晚。他们几乎用喉咙嘶喊出一首春天里。如果有一天我老无所依请把我留在在那吸金149亿!阿凡达2进入影史票房前三超越泰坦尼克号2月12日消息,詹姆斯卡梅隆执导的电影阿凡达水之道,全球票房在本周末突破22亿美元(约合149亿元人民币),超过同为他执导的泰坦尼克号,跻身影史票房榜第三位。据了解,排名第一的是卡改头换面,以为能瞒天过海今天关于电视剧狂飙又冲上了热搜,原因是饰演剧中钟阿四的演员是以前被抓的吸毒人员含笑剧组第一时间也发了声明演员韩朴俊通过简历投递途径参与剧集拍摄,过往有十余部作品的演艺经验,作为特约女版曹云金,曾是赵本山团队助演,成名后和师父反目成仇前段时间,有网友通过社交平台,晒出了女网红娇娇的近况视频,镜头中,娇娇一改往日豪迈的画风,穿着红色外套,手里拿着一串价值不菲的珠宝,带着祖母绿戒指,跟观众们侃侃而谈,娇娇在视频中,首次!新能源汽车满意度超燃油汽车中国工业报记者曹雅丽2月8日,中国质量协会在北京发布2022年中国新能源汽车行业用户满意度指数(NEVCACSI)测评结果。2022年,中国新能源汽车行业用户满意度指数为81分(满权威排行彭博新能源发布光伏逆变器出货及可融资性排行2月,BloombergNEF发布光伏逆变器更新2022。据BNEF报告,2021年,中国的阳光电源和华为占据全球几乎一半的逆变器供应,但受本地定制产品和服务的带动,Fronius碳化硅行业研究把握能源升级技术迭代的成长机遇(报告出品方作者长江证券,杨洋,钟智铧)下一代功率器件关键技术碳化硅近年来,随着5G新能源等高频大功率射频及电力电子需求的快速增长,硅基半导体器件的物理极限瓶颈逐渐凸显,如何在提升跨境电商税务易被处罚的点之二国家税务局持续建设智慧退税体系,采取优服务强监管严打骗大家能内化其中的含意吗,出口退税无纸化说实现就实现了,公司的进项成本发票(含专票普票货物类服务类),出口报关信息等全打包在金税