范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

Meta连夜加入AI大模型混战!用110参数量干过GPT3,单个GPU就能跑

  智东西(公众号:zhidxcom)
  编译 | 程茜
  编辑 | 心缘
  智东西2月25日报道,围绕生成式AI的前沿技术竞争愈发胶着。就在昨晚,Meta突然公布了一款全新的AI大型语言模型LLaMA,宣称可帮助研究人员降低生成式AI工具可能带来的"偏见、有毒评论、产生错误信息的可能性"等问题。
  此前在最新季度财报电话会议中,Meta CEO扎克伯格提到"生成式AI"的次数比"元宇宙"还要多。如今,Meta带来了一个利好研究学者的前沿AI重磅成果——仅用约1/10的参数规模,实现了匹敌OpenAI GPT-3、DeepMind Chinchilla、谷歌PaLM等主流大模型的性能表现。
  Meta介绍LLaMA论文
  论文链接:
  https://research.facebook.com/publications/llama-open-and-efficient-foundation-language-models/
  Meta目前提供有70亿、130亿、330亿和650亿四种参数规模的LLaMA模型。
  根据论文,在一些基准测试中,仅有130亿参数的LLaMA模型,性能表现超过了拥有1750亿参数的GPT-3,而且能跑在单个GPU上;拥有650亿参数的LLaMA模型,能够跟拥有700亿参数的Chinchilla、拥有5400亿参数的PaLM"竞争"。
  要知道,GPT-3是AI聊天机器人ChatGPT背后大模型GPT-3.5的前代,GPT-3.5的参数量也高达1750亿;而谷歌驱动对话式AI应用Bard进行搜索查询的模型,参数量比5400亿还要多。
  这是大模型研究迈出的重要一步!随着技术持续优化,未来有朝一日,你也许能在自己的笔记本电脑乃至手机上跑类ChatGPT功能的语言模型。
  扎克伯格说,LLaMA"在生成文本、进行对话、总结书面材料以及解决数学定理或预测蛋白质结构等更复杂的任务方面表现出了很大的潜力"。
  扎克伯格Facebook贴文
  值得一提的是,Meta宣布LLaMA基础大型语言模型"开源",不作商用目的,免费供给研究人员。目前Meta在GitHub上提供了精简版LLaMA。
  GitHub地址: https://github.com/facebookresearch/llama
  一、拥有70-650亿参数,20种语言训练
  LLaMA作为一种基础大型语言模型,相比于GPT-3等模型,其可以让开发人员使用更少的计算能力和资源来进行测试。
  目前,科技巨头玩家在大型语言模型领域开展军备竞赛,并且有多个成果面世。但研发人员在运行此类大模型时往往需要大量的资源投入,导致部分开发人员并不能全面研究访问这些模型。
  而这种限制就会阻碍人员去理解这些模型的工作模式和功能,并且使得他们在调整模型的偏见、发生错误的可能性上会较为困难。
  作为一个基础模型,LLaMA不是为特定任务而设计,Meta研究人员通过标记一些Tokens等来训练基础模型,其优势在于更容易针对特定潜在产品应用进行再训练和微调。
  不同于Chinchilla、PaLM、GPT-3等大模型,LLaMA只使用公开可用的数据集进行训练,其中包括开放数据平台Common Crawl、英文文档数据集C4、代码平台GitHub、维基百科、论文预印本平台ArXiv等。项目成员称,这是为了使其工作与开源兼容和可复现。
  总体来看,整个训练数据集在标记化后大约包含1.4万亿个Tokens。
  其中,拥有650亿参数的LLaMA和拥有330亿参数的LLaMA使用1.4万亿Tokens进行训练,最小的拥有70亿参数的LLaMA在1万亿Tokens上进行了训练。
  拥有不同参数的模型与训练损失的关系图
  与其他大型语言模型一样,LLaMA的工作原理是将一系列Tokens作为输入,并预测下一个单词以递归生成文本,Meta使用了20种语言对其进行训练。
  此外,大型语言模型中还可能会遇到生成偏见、不良信息、不实信息的风险,基于共享LLaMA的代码,其他开发人员可以测试限制或消除大型语言模型中这些问题的方法。
  二、7项AI能力,不输业界主流大模型
  在测试过程中,研究人员采用0-shot和1-shot、5-shot、64-shot几种方式,将LLaMA与GPT-3、Gopher、Chinchilla等模型进行了比较。
  尤其值得一提的是,130亿参数LLaMA模型在单个GPU上运行时,性能表现可能超过1750亿参数GPT-3。这也许会给类ChatGPT产品跑在消费级硬件上打开新的大门。
  1、常识推理(Common Sense Reasoning)
  LLaMA涵盖了八个标准常识性数据基准,包括BoolQ、PIQA等。这些数据集包括完形填空、多项选择题和问答等。
  结果显示,拥有650亿参数的LLaMA在BoolQ以外的所有报告基准上均超过拥有700亿参数的Chinchilla。同时,除BoolQ和WinoGrande外,该模型测试中均超过拥有5400亿参数的PaLM。
  拥有130亿参数的LLaMA模型在大多数基准测试上也优于拥有1750亿参数的GPT-3。
  2、闭卷问答(Closed-book Question Answering)
  研究人员就闭卷答疑对LLaMA进行了测试,该基准测试的数据集包含阅读理解与问答的大规模语料集TriviaQA以及自然问题。
  拥有650亿参数的LLaMA在0-shot和1-shot条件下,实现了较好的性能。
  在推理过程中,拥有130亿参数的LLaMA在一个V100 GPU上运行,其基准测试结果显示,与GPT-3和Chinchilla不相上下。
  3、阅读理解(Reading Comprehension)
  在阅读理解能力方面,LLaMA通过大型深层阅读理解任务数据集RACE评估,拥有650亿参数的LLaMA与拥有5400亿参数的PaLM相差并不大。
  4、数学推理(Mathematical reasoning)
  研究人员根据两个数学基准评估LLaMA模型,分别是包含中学和高中数学问题的数据集MATH、OpenAI发布的小学数学题数据集GSM8k。
  其比较模型对象是,从ArXiv和Math Web Pages提取的拥有385亿数据进行微调的PaLM模型Minerva。结果显示,在GSM8k上,拥有650亿参数的LLaMA优于拥有620亿参数的Minerva。
  5、代码生成(Code generation)
  基于编程代码开源数据集HumanEval和小型数据集MBPP,被评估的模型将会收到几个句子中的程序描述以及输入输出实例,然后生成一个符合描述并能够完成测试的Python程序。
  对于拥有相似参数的模型,LLaMA优于其他通用模型。
  6、大规模多任务语言理解(Massive Multitask LanguageUnderstanding)
  这一数据集基准涵盖人文科学、STEM、社会科学等各种知识领域的多项选择题。
  经比较,研究人员发现,拥有650亿参数的LLaMA在大多数领域平均落后于拥有700亿参数的Chinchilla和拥有5400亿参数的PaLM几个百分点。
  研究人员猜测,其中一个可能的原因是,他们在训练前使用的数据集较为有限,包括177GB大小的ArXiv、Gutenberg和Books3,而其余模型的训练数据足有2TB大小。
  7、训练期间的能力进化(Evolution of performance during training)
  在训练过程中,研发人员跟踪了LLaMA在一些问题回答和常识性基准上的表现,其都保持稳步提高。
  不过针对于相关数据集的评估,研究人员认为其存在许多性能差异,该基准的结果并不可靠。
  三、去年曾发布Galactica大模型,但因偏见和造假火速下架
  关于大模型的研究如今在AI领域十分火热。其基本原理就是通过获取新闻、社交媒体或其他互联网资源上的文本,来训练软件,使得基于大模型生成的产品可以在用户给出提示或查询搜索时自行预测和生成内容,其目前最直观的例子就是最近爆火的聊天机器人ChatGPT。
  也正由于这一现象级消费级应用的推动,使得科技巨头开始构建基于大模型的产品测试,并将生成式AI视作新竞争领域。
  年初,微软向聊天机器人ChatGPT的创造者OpenAI投资了数十亿美元,随后,微软推出了其ChatGPT版新Bing搜索引擎。谷歌很快也加入竞赛,该公司基于其大型语言LaMDA推出类似的对话式AI应用程序Bard。
  去年5月,Meta也曾发布了拥有1750亿参数的OPT大型语言模型,这一模型的适用对象也是开发人员,是生成其聊天机器人BlenderBot的基础模型。半年后,Meta推出名为Galactica的语言模型,该模型可以撰写科学文章并解决数学问题,但在推出三天后,这一模型就因经常胡言乱语以及给出虚假信息被撤下。
  国外投资机构DA Davidson高级软件分析师Gil Luria认为:"Meta今天的公告似乎是测试他们生成式AI能力的一步,这样他们就可以在未来将它们应用到产品中。"
  他还补充道:"生成式AI作为AI的一种新应用,Meta对此经验较少,但显然对其未来的业务很重要。"
  结语:生成式AI竞赛不断升温
  大型语言模型已经在生成创意文本、解决数学问题、预测蛋白质结构、回答阅读理解问题等方面展示出了巨大的潜力,如今ChatGPT的发布使得其在消费级应用市场中爆发。
  继微软、谷歌之后,Meta也试图在这一领域展现自己的技术优势。
  在科技大厂纷纷亮出生成式AI商用计划之时,Meta难得地聚焦在研究贡献上,无论是用更多数据训练出的更少参数规模模型实现优于更大参数规模模型的研究成果,还是将LLaMA模型和权重开源开放,都令人感到耳目一新。
  但也由于仅限于研究用途,这可能导致Meta短期内难以在生成式AI领域形成像OpenAI、谷歌那样的影响力。

2022年最值得买的3款拍照手机,影像实力强,表现不输小单反2022年最值得买的3款拍照手机,影像实力强,表现不输小单反第一款小米12SUltra内置的18bit高通Spectra三ISPI支持同时拍摄8KHDR视频和6400万像素的照片。预算3000元左右,体验堪比6000元的高端手机,这3款可以闭眼买一加9R处理器高通骁龙870LPDDR4XUFS3。0续航4500mAh65W闪充后置4800万主摄(imx586OIS)1600万超广角500万微距200万黑白前置1600万像素华为千元手机开售,搭载麒麟芯片,仅售1699元?由于禁售令的限制,华为在元器件的供应方面遇到了很大的阻力,其中芯片相关元器件受到的限制最大因此去年,华为并没有发布搭载麒麟芯片的旗舰手机,推出的P50系列也大规模采用骁龙芯片,今年截至目前,盘点搭载天玑9000系列的手机1OPPOFindX5Pro天玑版搭载天玑9000旗舰处理器,采用台积电4nm工艺制程,高性能,低功耗,性能与功耗完美平衡,日常和游戏表现非常稳正面是一块6。7英寸的三星E4发光材vivoX90系列配置曝光骁龙8Gen2领衔这堆料真的强近几年来,vivo凭借X系列旗舰机型的优秀表现,俘获了不少国内消费者的芳心,并进一步提高了自身在国内高端市场的份额。vivo目前在售的X系列最新机型为4月份发布vivoX80系列,特斯拉人型机器人渐近!机构密集调研中国基金报记者文夕特斯拉AI日即将于9月30日举行,人形机器人Optimus原型机也有望亮相。近期在A股市场上,机器人概念板块逐渐升温。近半月以来,多家机器人概念股被机构密集关注。专访地铁跑酷负责人yoyo10年老游戏如何翻红霸榜1个月运营近10年的老游戏想要翻红几乎不可能,但就是如此离谱的事情,在创梦天地发行运营的地铁跑酷身上却真实发生了。这款在2012年发售的产品,再有20天左右就要达成上线满10年的成就。而史上最强8位机游戏!恶魔城血之轮回为何是神作?文GameForce虽然现如今的科乐美属实不招玩家待见,但不可否认的是,出自科乐美之手的经典之作数不胜数,就比如有着悠久的历史和众多粉丝的恶魔城系列游戏,尽管该系列已经很长时间没有扎克伯格痴迷元宇宙,致个人损失5千亿,还连累李嘉诚损失上千亿扎克伯格旗下的FACEBOOK一度市值高达1万亿美元,这让扎克伯格的个人身家一度超过了1500亿美元,折合1万亿人民币。可是因为扎克伯格痴迷于元宇宙,这导致FACEBOOK市值一路华为mate50pro的大光圈真香F1。4和F4的光圈成像效果有什么不一样?这就给你看F4光圈F1。4光圈可以看到,物理光圈的效果非常的惊艳,而且虚化效果准确真实。放大仔细看,虚化部分的一根毛,都被真实保留下来了,海信发布U8H电视BOE(京东方)ADSPro技术品牌开启高端电视新视界9月20日,海信召开电视新品发布会,重磅发布ULEDX参考级影像新品海信U8H超高清电视。作为BOE(京东方)ADSPro技术品牌赋能的系列高端产品,海信U8H搭载BOE(京东方)
注意!楼市成为裁员高风险区域最近国外多家科技巨头进行了大量裁员,而且裁员潮还在继续蔓延。首先是推特公司在11月4日裁掉了约50的员工,然后脸书的母公司MATE也宣布裁员约13的员工,约1。1万人昨天亚马逊也宣美联储或数次拒绝中国运黄金,中国发出黄金新信号,幕后推手出现美联储副主席布雷纳德在11月15日表示将很快放缓加息步伐,准备最早在12月会议上开始以较小幅度升息,并将重新评估利率需升到多高才能将通胀降下来,此前,另一位理事沃勒也做出了类似发言全球首款WIFI7路由器亮相!产品不重要,一起看看WIFI7有哪些升级没想到,可能很多人还没用上WIFI6,现在WIFI7又来了。其实早在今年3月,上游厂商就公布了WIFI7方案,预计在今年下半年开始推广,这么看如今已经是11月,似乎WIFI7已经算积分球测量荧光量子产率的最优测试条件荧光量子产率,是单位时间(s)内,发射荧光的光子数与吸收激发光的光子数之间的比值,符号f。它表示物质将吸收的光能转变成荧光的能力,是荧光物质一个最基本而重要的参数。f值的大小与物质武侠开放世界国产游戏新的流量密码?本文来自快爆编辑野台开放世界玩法成为如今游戏业界的发展大趋势,这已经是我们老生常谈的话题了。而对于武侠这一我们独有的国风元素,近年来各大厂商似乎也情有独钟。那么今天呢我们就不再赘述积极信号已经出现,最后的上车机会?连续几天的上涨行情,让我想起了时间的玫瑰投资不要投机和短线,只有守住时间的玫瑰,最后才能收获灿烂的花期。如果放在一个长周期,这个理念大概率正确。但是,对于想获得超额收益的那些投资者A股半导体掀起涨停潮,核心五家,获将成为芯片第一?半导体掀起涨停潮,核心五家,获将成为芯片第一?随着中国半导体产业的发展,中国的半导体材料也在逐渐发生变化,已经从第一代半导体材料过渡到第三代半导体材料。那么,什么是半导体,半导体是研究人员制造出一种地球上不存在的材料但这只是故事的开始这听起来像是一部科幻电影的情节人类正在破坏地球,在其地壳上挖出巨大的伤痕,并在开采和提炼技术进步所必需的关键元素时污染了空气和地面。现在科学家们在检查一块外星陨石时发现了一种独特的响灿适界观丨营养师揭秘,保护肠道的6个关键点,建议收藏转发肠道肩负着消化营养生物合成生物屏障促进免疫等重任。尤其在促进免疫上,肠道可谓劳苦功高,因为其他免疫器官,如肝脏甲状腺淋巴系统等,都需要肠道提供的营养来生存。从这个意义上说,肠道就是肇州奶茶店事件,会让多少投资人对黑龙江望而却步?奶茶店的视频我反复看了好几遍,甚至和家人在一起讨论了其中的细节到底是怎么回事。相关的报道也看了多篇,包括朋友们写的小作文。此时,我想告诉大家,作为一个黑龙江人,我现在的心情和外面的Meta被裁员工流向TikTok比亚迪半导体IPO终止NASA登月火箭发射日报君发自凹非寺量子位公众号QbitAI大家好,今天是11月16日星期三,这周工作日已过半快来和日报君看看,今天科技圈有哪些新鲜事阿尔忒弥斯1号登月火箭预计今天下午发射多次推迟的阿