范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

斯坦福草泥马火了100美元就能比肩GPT3。5!手机都能运行

  梦晨 金磊 发自 凹非寺
  量子位 | 公众号 QbitAI
  一夜之间,大模型界又炸出个big news!
  斯坦福发布Alpaca(羊驼,网友口中的"草泥马"): 只花100美元,人人都可微调Meta家70亿参数的LLaMA大模型,效果竟可比肩1750亿参数的GPT-3.5(text-davinci-003)。
  而且还是单卡就能运行的那种,甚至树莓派、手机都能hold住!
  还有一个更绝的"骚操作"。
  研究所涉及到的数据集,是斯坦福团队花了不到500美元用OpenAI的API来生成的。
  所以整个过程下来,就等同于GPT-3.5自己教出了个旗鼓相当的对手AI
  。
  (薅羊毛高手……)
  然后团队还说,用大多数云计算平台去微调训练好的模型,成本也不到100美元:
  复制一个GPT-3.5效果的AI,很便宜,很容易,还很小。
  而且团队还把数据集(秒省500刀)、代码统统都给开源了,这下子人人都能去微调个效果炸裂的对话AI:
  项目在GitHub发布才半天时间,便已经狂揽1800+星,火爆程度可见一斑。
  Django联合开发者甚至对斯坦福的新研究用"惊天大事"来形容:
  不仅如此,斯坦福团队还搞了个demo,在线可玩的那种。
  话不多说,我们现在就来看看这个"草泥马"的效果。 比肩davinci-003的草泥马Aplaca
  在斯坦福官方的演示中,他们先小试牛刀地提了一个问题:
  什么是羊驼?它和美洲驼的区别是什么?
  草泥马Aplaca给出的答案较为干练:
  羊驼是一种小型骆驼科动物,原产于秘鲁、玻利维亚、厄瓜多尔和智利;它比美洲驼小,羊毛更细,也没有驼峰。
  而后又简单的介绍了二者群居生活的不同。
  同样的问题若是交给ChatGPT(GPT3.5-turbo),则答案就不会像草泥马Aplaca那般简洁:
  对此,团队给出的解释是:
  Alpaca的答案通常比ChatGPT短,反映出text-davinci-003的输出较短。
  而后团队演示了让草泥马Alpaca写邮件:
  写一封e-mail祝贺被斯坦福大学录取的新生,并提到你很高兴能亲自见到他们。
  草泥马Alpaca对于这个任务也是信手拈来,直接给出了一个像模像样的邮件模板:
  难度再次进阶,团队这次提出了让草泥马Alpaca写论文摘要的需求:
  写一篇经过深思熟虑的机器学习论文摘要,证明42是训练神经网络的最优seed。
  草泥马Alpaca给出的答案从内容上来看,非常符合大多数论文的摘要形式:试图回答什么问题、用了什么方法、结果如何,以及未来展望。
  当然,也有迫不及待的网友亲自下场试验,发现草泥马Alpaca写代码也是不在话下。
  不过即便草泥马Alpaca能够hold住大部分问题,但这并不意味着它没有缺陷。
  例如团队便演示了一个例子,在回答"坦桑尼亚的首都是哪里"的问题时,草泥马Alpaca给出的答案是"达累斯萨拉姆"。
  但实际上早在1975年便被"多多马"取代了。
  除此之外,若是亲自体验过草泥马Alpaca就会发现,它……巨慢:
  对此,有网友认为可能是使用的人太多的原因。
  笔记本、手机、树莓派都能跑
  Meta开源的LLaMA大模型,刚发布几周就被大家安排明白了,单卡就能运行。
  所以理论上,基于LLaMA微调的Alpaca同样可以轻松在本地部署。
  没有显卡也没关系,苹果笔记本甚至树莓派、手机都可以玩。
  在苹果笔记本部署LLaMA的方法来自GitHub项目llama.cpp,使用纯C/C++做推理,还专门对ARM芯片做了优化。
  作者实测,M1芯片的MacBook Pro上即可运行,另外也支持Windows和Linux系统。
  还是这个C++移植版本,有人成功在4GB内存的树莓派4上成功运行了LLaMA的 70亿参数版本。
  虽然速度非常慢,大约10秒生成一个token(也就是一分钟蹦出4.5个单词)。
  更离谱的是仅仅2天之后,有人把LLaMA模型量化压缩(权重转换成更低精度的数据格式)后成功在Pixel 6安卓手机上运行(26秒一个token)。
  Pixel 6使用谷歌自研处理器Google Tensor,跑分成绩在骁龙865+到888之间,也就是说新一点的手机理论上都能胜任。
  微调数据集也开源
  斯坦福团队微调LLaMA的方法,来自华盛顿大学Yizhong Wang等去年底提出的Self-Instruct。
  以175个问题作为种子任务,让AI自己从中组合出新的问题以及生成配套答案实例,人工过滤掉低质量的,再把新任务添加到任务池里。
  所有这些任务,之后可以采用InstructGPT的方法让AI学会如何遵循人类指令。
  套娃几圈下来,相当于让AI自己指导自己。
  斯坦福版Alpaca,就是花了不到500美元使用OpenAI API生成了5.2万个这样的示例搞出来的。
  这些数据同样开源了出来,并且比原论文的数据多样性更高。
  同时还给出了生成这些数据的代码,也就是说如果有人还嫌不够,可以再去自行扩充微调数据,继续提高模型的表现。
  微调代码也会在HuggingFace官方支持LLaMA后放出。
  不过Alpaca最终的模型权重需要Meta许可才能发布,并且继承了LLaMA的非商用开源协议,禁止任何商业用途。
  并且由于微调数据使用了OpenAI的API,根据使用条款也禁止用来开发与OpenAI形成竞争的模型。 One More Thing
  还记得AI绘画的发展历程吗?
  2022年上半年还只是话题热度高,8月份Stable Diffusion的开源让成本下降到可用,并由此产生爆炸式的工具创新,让AI绘画真正进入各类工作流程。
  语言模型的成本,如今也下降到了个人电子设备可用的程度。
  最后还是由Django框架创始人Simon Willison喊出:
  大语言模型的Stable Diffusion时刻到了。

气体口香糖奶茶杯等产品频现,如何防范电子烟打擦边球近日,科普评测自媒体老爸评测发布了一则警惕儿童电子烟的视频,引起媒体舆论广泛关注。该视频曝光了一款号称气体口香糖但与电子烟十分相似的产品。该产品吸一口就能吐出烟雾,产品外观风格可爱通往地狱的大门ampampquot洞穴ampampquot是存在的!一个有毒气体和沸水的ampampquot燃烧地狱ampampquot通往地狱的山洞,也就是传说中女先知的据点,是否真的存在?一个研究小组经过十年的研究,发现了一些令人惊讶的事实。通往地狱的西伯利亚山洞真的存在吗?世界各地的宗教和神话中都有地狱的概念塔里木油田前11个月油气产量当量超3000万吨经济日报乌鲁木齐12月4日讯(记者乔文汇)12月初,在新疆拜城县境内的塔里木油田博孜油气外输管道现场,收尾投产工作正有条不紊地进行。中国石油塔里木油田构建生产组织协调多维度保障体系发布肖特基二极管白皮书,助力汽车工业实现小型化和更低损耗导读近年来,随着电动汽车的加速以及物联网在工业设备消费电子设备领域的普及,应用产品中搭载的半导体数量也与日俱增。其中,中等耐压的二极管因其能有效整流和保护电路,而被广泛应用在从手机基金新能源汽车大涨,反转了吗说新能源不行的人出来走两步。这是一位朋友的留言,谢谢这位朋友。要说新能源行不行,先看一下它的走势图,这是新能源汽车一年的走势图,从图中可以看出,自7月份以来,这个板块有一个大幅度的东北人从哪里来?顺治八年拨民以填辽东早期东北移民史顺治七年七月盛夏的一天,顺治皇帝在书房恍恍惚惚的睡着了。睡梦中,他梦到了自己的父亲皇太极,皇太极对他说福临吾儿,汝可是女真族否?顺治答道当然是,阿玛为何如此发问?皇太极略带恼怒的说鏖战近4小时!许昕爆冷输球,樊振东空砍2分,马龙大获全胜不败北京时间12月7日晚,乒超联赛迎来一场焦点对决,马龙领衔的山东鲁能队登场,迎战以樊振东许昕为核心的上海地产集团,结果双方鏖战了近四个小时才分出胜负,马龙樊振东都是连得2分,许昕连丢河南嵩山龙门负重只会招致更多伤害全场比赛7黄1红,刷存在感,嵩山龙门与成都蓉城一役当值主裁李海新,着实疯了一把。其实,这不过是包括但不限于河南嵩山龙门在内的中小俱乐部,在包括但不限于这场比赛的历次中国中球比赛中所湖北箭成功发射湖北星湖北日报讯(记者许旷通讯员谭青海)12月7日9时15分,随着一声点火令下,快舟十一号固体运载火箭在我国酒泉卫星发射中心点火升空,成功将行云交通VDES试验卫星航天金租1号送入预定轨神秘的南极哈喽,大家好。今天啊,我们来聊聊地球上最神秘的大陆南极。南极在地球上最后一个被发现,因此被人们称为第七大陆。整个南极由三部分组成,大陆面积为1239万平方千米,周围岛屿面积约为7。关于企业职工基本养老保险,海南人社部门解答热点问题怎样让企业职工老有所养?近日,海南省印发了海南省企业职工基本养老保险若干规定,社会关注度高。海南省人社系统有关负责人对参保范围个人账户退休年龄缴费年限等热点问题划重点,及时回应群众
十连冠!中国队第22次夺得世乒赛男团冠军10月9日,成都世乒赛团体赛结束男团决赛争夺,由樊振东马龙和王楚钦出阵的中国队以30击败欧洲劲旅德国队,实现世乒赛男团十连冠,这也是中国队第22次捧得男团冠军奖杯斯韦思林杯。本届世为什么你明明是个很聪明的人却一生碌碌无为?为什么我们生活当中的很多人,明明自己拥有超于普通人的智商或是个人能力,却还是选择或被迫选择一生碌碌无为的生活!马克吐温说在人生的前半生,只有享乐的能力而无享乐的机会在人生的后半生,转载余秀华先生,我想给你写信,说说我的贪心2022年10月08日先生,我想给你写信,明知道鸿雁已逝,我已经深陷泥潭。那个一向活得乱七八糟却还骄傲纯粹的姑娘已经被折磨得发了疯,想着有一天我病入膏肓,终于得你恩赐见那一面又能说湖人这消息,比浓眉受伤还让人难受!赛季刚开始啊别人的新赛季兴高采烈整装待发,湖人的新赛季心酸无奈。看看隔壁快船人复出的巨星,歇了这么久,至少季前赛适应得还行,甚至训练时都叮嘱队友要认真。再看看湖人自家的巨星,歇了N久也不训练,湖人对阵勇士伤情詹皇威少轮休浓眉复出克莱休战格林暂时离队北京时间10月10日,湖人阵勇士的伤情报告,浓眉复出,詹姆斯威少和贝弗利轮休不打,特洛伊琼斯(腰部酸痛)和施罗德(未与球队汇合)缺席比赛,预计施罗德明天归队三大主力缺战勇士,哈姆表场均17分,湖人赢球意外收获!完美适配老詹浓眉,威少首发难保NBA季前赛继续进行,勇士和湖人的比赛,湖人主帅哈姆让威少詹姆斯以及贝弗利休息,浓眉带着第二阵容打,勇士虽然克莱和格林不打,不过纸面实力比湖人要强。但最终的结果却是勇士121124爆冷,湖人击败勇士!狂轰4910,浓眉纳恩齐爆发,库里普尔49分NBA季前赛,洛杉矶湖人队和金州勇士队进行交锋。此前,湖人队季前赛已经遭遇两三连败,勇士队则是季前赛两连胜。湖人队今夏休赛期补强了贝弗利施罗德和朗尼沃克等后卫球员,威少据说也是在改湖人4大消息!1签1裁囤后卫,施罗德否认肥约,浓眉或打首发中锋北京时间10月11日,湖人再次调整阵容,裁掉后卫费格罗亚,和后卫布莱斯汉密尔顿签下训练营合同。施罗德正式亮相湖人并接受采访,透露了加盟湖人原因,否认湖人给过4年8000万美元肥约。普尔单节18分库里2444浓眉高能28分湖人胜勇士北京时间10月10日,202223赛季NBA季前赛继续进行,金州勇士坐镇主场迎战洛杉矶湖人。全场打完,湖人124121险胜勇士。全场数据具体比分3533251929393530(湖主帅西热力江首发!抢断助攻远投,率队102开局,同曦硬扛天津10月11日,在20222023赛季CBA联赛常规赛第1轮中,南京同曦宙光挑战天津先行者。从比赛走势来看,焕然一新的上赛季副班长南京同曦,打得虎虎生威,主帅兼球员西热力江更是亲自披小米12系列杀疯了!买到就是赚到!仅需2688文万怡飘责编吕东兴总编唐迪小尺寸性能手机大升级,性能,影像,全面更强悍突破14项记录的A级屏幕旗舰级的高清自拍和高端音质,邀你一手掌握。京东商城到手仅需2688元,详细性能了解可点