GPT4太烧钱,微软想甩掉OpenAI?曝出PlanB:千块
9月21日 老巫婆投稿 GPT4太吃算力,微软被爆内部制定了PlanB,训练更小、成本更低的模型,进而摆脱OpenAI。
GPT4太吃算力,连微软也顶不住了!
今年,无数场微软AI大会上,CEO纳德拉台前激动地官宣,将GPT4、DALLE3整合到微软全家桶。
微软全系产品已被OpenAI的模型重塑,愿景是让AI成为每个人的生活伴侣。
然而在幕后,因GPT4运行成本太高,微软却悄悄地搞起了planB。
TheInformation独家爆料称,为了摆脱对OpenAI的依赖,由PeterLee领导的1500人研究团队中,一部分人转向研发全新对话式AI。
据称,研发的模型性能可能不如GPT4,但参数规模小,研究成本更低,运行速度更快。
目前,微软已经在必应聊天等产品中,开启了内测。
不仅是微软,包括谷歌在内的其他科技巨头,正在另辟蹊径,以在AI聊天软件和芯片两方面节省成本。
而Llama2宣发时微软与Meta的合作,也不啻是一种摆脱完全依靠OpenAI的手段。
这是微软帝国继续向前成长、突破当前局限,注定要走的路。
更精炼的模型,必应先尝鲜
今年2月,微软正式发布新必应(NewBing),其中结合了ChatGPT和自家的普罗米修斯(Prometheus)模型。
在GPT4公布后,微软紧接着宣布,GPT4整合到必应中,将搜索体验带上了一个新台阶。
微软搜索主管MikhailParakhin近日表示,BingChat目前在创意和精准模式下使用的是100的GPT4。
而在平衡模式下(多数用户选择的模式),微软用普罗米修斯模型,以及图灵语言模型(Turinglanguagemodels)作为补充。
普罗米修斯模型是技能和技术的集合体。而图灵模型不如GPT4强大,旨在识别和回答简单的问题,并将更难的问题传递给GPT4。
微软内部,已经将其手头的2000块GPU中的大部分,都投入到了小模型的训练当中。当然,这与微软提供给OpenAI的芯片数量相比,只能说是小巫见大巫了。
不过,这些模型可以执行比GPT4更简单的任务,也是微软为破冰所作的努力。
打破OpenAI束缚
多年来,微软与OpenAI这两家公司,保持着千丝万缕的联系。
但是,随着ChatGPT,微软必应等全家桶竞相推出,微软与OpenAI也开始秘密开展市场角逐战。
尽管微软的努力仍处于早期阶段,但纳德拉正带领微软,为自家AI产品开辟一条不完全依赖OpenAI的路。
这终究还是要发生的,Databricks的高管NaveenRao在谈到微软内部的AI工作时说。
微软是一家精明的企业,当你部署产品使用GPT4巨型模型时,他们要的是高效。这就好比说,我们并不需要一个拥有3个博士学位的人,来当电话接线员,这在经济上是行不通的。
然而,纳德拉和研究主管PeterLee希望在没有OpenAI的情况下,开发出复杂的AI,这大概只是一厢情愿。
自从微软投资OpenAI后,这家巨头的研究部门把大部分时间,都用来调整OpenAI的模型,以便使其适用微软的产品,而不是开发自己的模型。
微软的研究团队,也并没有幻想自己能开发出像GPT4这样强大的AI。
他们清楚地知道,自身没有OpenAI的计算资源,也没有大量的人类审查员来反馈LLM回答的问题,以便工程师改进模型。
过去一年里,随着几波研究人员的离职,包括一些转入微软内部的产品团队,研究部门的人才也在不断流失。
对微软自身来说,在没有OpenAI帮助的情况下,开发高质量的LLM,可以在未来几年,两家公司讨论续签合作关系时赢得更多谈判筹码。
目前,两者交易对双方都有利。
微软投资OpenAI一百多亿美元,作为回报,能够在微软产品中永久使用OpenAI现有知识产权的独家权利。
此外,微软还将获得OpenAI75的理论运营收益,直到其初始投资偿还为止,并且将获得利润的49,直到达到一定上限为止。
现在,微软希望通过与OpenAI,以及其他AI企业的现有联盟,在一个不确定的时期内增加至少100亿美元的新收入。
Oce365全家桶在得到GPT4能力加持,已经出现了早期的收入增长迹象。
微软还在7月份表示,已有超过2。7万家公司为代码编写工具GitHubCopilot付费了。
Statista统计,2023年除了微软云服务比例最大,加速生产力商业流程的软件产品收入占比也在逐渐增加。
然鹅,讽刺的是,微软与OpenAI的交易条款,也间接地帮助微软努力摆脱对OpenAI的依赖。
当用户使用必应时,微软可以访问OpenAI模型输出的结果。
目前,微软正在利用这些数据,创建更加精炼的模型。内部研究人员的研究结果表明,这些模型可以用更少的计算资源产生类似的结果。
小模型的探索
在OpenAI的阴影下度过一年后,微软的一些研究人员找到了全新的目标制造一个模仿GPT4的蒸馏模型。
今年6月,微软训练了一个算力消耗只有GPT4十分之一的模型Orca。
为了创建这个Orca,微软将GPT4生成的数百万个答案输入到了一个更为基本的开源模型之中,并以此教它模仿GPT4。
论文地址:https:arxiv。orgabs2306。02707
结果显示,Orca不仅超过了其他的SOTA指令微调模型,而且在BigBenchHard(BBH)等复杂的零样本推理基准中,实现了比Vicuna13B翻倍的性能表现。
此外,Orca在BBH基准上还实现了与ChatGPT持平的性能,在SAT、LSAT、GRE和GMAT等专业和学术考试中只有4的性能差距,并且都是在没有思维链的零样本设置下测量的。
甚至,在某些情况下,Orca的表现与OpenAI的免费版ChatGPT不相上下。
类似的,微软还公布了一款参数量不到GPT4千分之一的模型phi1。
由于采用了教科书级的高质量训练数据,phi1在数学和逻辑问题上的熟练程度,完全不亚于5倍于它的开源模型。
论文地址:https:arxiv。orgabs2306。11644
随后,微软在研究一个LLM有多小,才能达到一定的能力上更进了一步,推出了只有13亿参数的模型phi1。5。
论文地址:https:arxiv。orgabs2309。05463
phi1。5展现出了许多大模型具备的能力,能够进行一步一步地思考,或者进行一些基本上下文学习。
结果显示,phi1。5在常识推理和语言技能上的表现,与规模10倍于它的模型旗鼓相当。
同时,在多步推理上,还远远超过了其他大模型。
虽然目前还不清楚,像Orca和Phi这样的小模型是否真的能与更大的SOTA模型(如GPT4)相媲美。但它们巨大的成本优势,加强了微软继续推动相关研究的动力。
据一位知情人士透露,团队在发布Phi之后,首要任务就是验证此类模型的质量。
在即将要发表的论文中,研究人员又提出了一种基于对比学习的方法,让工程师们可以教模型区分高质量和低质量的响应,从而改进Orca。
同时,微软其他的团队也正在紧锣密鼓地开发全新的多模态大模型,也就是一种既能解释又能生成文本和图像的LLM。
GPT4V
显然,像Orca和Phi这样的模型,可以帮助微软降低为客户提供AI功能时所需的计算成本。
据一位在职员工透露,微软的产品经理已经在测试如何使用Orca和Phi而不是OpenAI的模型,来处理必应聊天机器人的查询了。比如,总结小段文本、回答是或者否,这种相对简单的问题。
此外,微软还在权衡是否向Azure云客户提供Orca模型。
据知情人士透露,Orca论文一经发表,就有客户来询问何时能用上了。
但问题在于,如果真要这样操作的话,微软是不是还需要找Meta拿个许可。毕竟后者对哪些公司可以将其开源LLM进行商业化,还是有所限制的。
参考资料:
https:www。theinformation。comarticleshowmicrosoftistryingtolessenitsaddictiontoopenaiasaicostssoar?rcepv9gi
https:thedecoder。commicrosoftseeksplanbformorecosteffectiveaisidesteppingopenaisgpt4
(举报)
投诉 评论
美国经济陷入低迷?货运市场已有先兆在美国阿肯色州西北部举行的FreightWaves供应链大会上,FreightWaves经济学家安东尼史密斯(AnthonySmith)展示了以下这张双Y轴图表,对比了平板车货……
泽连斯基誓言“为新胜利而战”5月10日报道据路透社基辅5月9日报道,乌克兰总统泽连斯基周一纪念在二战中战胜纳粹德国时说,乌克兰在与俄罗斯的战争中将取得胜利,不会割让任何领土。他说:“我们正在为新的胜……
菲律宾大选凌晨开票,小马科斯赢了菲律宾媒体10日凌晨公布的初步统计结果显示,菲律宾联邦党候选人费迪南德罗穆亚尔德斯马科斯赢得9日举行的总统选举。小马科斯资料图。图源:视觉中国初步统计结果显示,在已……
快手电商“聚宝盆计划”已完成1。6亿GMV站长之家(ChinaZ。com)5月13日消息:今天快手电商引力大会上,快手用户增长负责人刘桐公布的数据显示,快手站外投放服务“聚宝盆计划”已联动多个商家完成80场外投、1。6……
字节跳动又盯上一个“水下生意”:超100亿在直播生态中,“卖铲子”会是一门好生意么?字节入局直播硬件的消息,又为久违热搜的直播带货行业带来了一些热度。近日,据媒体报道,字节新上线了一款名为“聆镜视频直播一体……
快手VS拼多多:为什么短视频比电商更难盈利?一边是行业内卷到拼刺刀,一边是令人艳羡的高毛利率,如此矛盾现象,就发生在电商身上。而赛道热得发烫的短视频,却没有想象中赚钱。快手和拼多多都交出了2021年财报成绩,虽然放……
快手部分ERP上线“入仓自动退”功能5月13日消息,今日,快手发布消息,为解决商家的痛点问题,快手小店服务市场的部分ERP已开通“入仓自动退”功能,商家验收消费者退回商品后,实现ERP入库后退货订单自动退款。……
快手钓鱼相关创作者00后和90后超过四成站长之家(ChinaZ。com)5月13日消息:越来越多年轻人加入到钓鱼行列,可以看到在快手、抖音等平台上,有不少钓鱼相关的直播和短视频内容。今日,快手大数据研究院发布数……
面向新商家!抖音电商发布520运费险百亿补贴活动站长之家(ChinaZ。com)5月13日消息:日前,抖音电商发布了520运费险百亿补贴活动,该活动主要面向从未投保过运费险的抖店新商家。据悉,活动时间为2022年5月1……
全国首例短视频“爬虫”案宣判:罚3万元刷个短视频,个人信息和需求竟被人知道得一清二楚?不久后,私人信箱中还会收到仿佛量身定制”的推销信息,这都源于一款神奇的爬虫”软件。昨日,公众号梁溪检察”就报道了全国首例短……
“我报名了9块9的配音课,技巧没学会,深夜还在接骚扰电话”抖音9块9的配音课,是怎样让人乖乖掏钱的?2022最赚钱的方式是什么?报名9块9的“声音变现课”啊!万万没想到,去年开始便四处“肆虐”的“9块9声音变现”广告……
农产品商家在抖音电商快速起步,懂这几条经验就够了“高山散养、贵州特产、鸡刚下的蛋。。。。。。”镜头前的主播情绪高昂,向直播间粉丝介绍着“绿壳鸡蛋”,直播间背景就是贵州山地上的养鸡林。商家“苗家圆圆”正在参加“山货上头条”直播……