专栏电商日志财经减肥爱情
投稿投诉
爱情常识
搭配分娩
减肥两性
孕期塑形
财经教案
论文美文
日志体育
养生学堂
电商科学
头戴业界
专栏星座
用品音乐

Meta连夜加入AI大模型混战!用110参数量干过GPT3,

  智东西(公众号:zhidxcom)
  编译程茜
  编辑心缘
  智东西2月25日报道,围绕生成式AI的前沿技术竞争愈发胶着。就在昨晚,Meta突然公布了一款全新的AI大型语言模型LLaMA,宣称可帮助研究人员降低生成式AI工具可能带来的偏见、有毒评论、产生错误信息的可能性等问题。
  此前在最新季度财报电话会议中,MetaCEO扎克伯格提到生成式AI的次数比元宇宙还要多。如今,Meta带来了一个利好研究学者的前沿AI重磅成果仅用约110的参数规模,实现了匹敌OpenAIGPT3、DeepMindChinchilla、谷歌PaLM等主流大模型的性能表现。
  Meta介绍LLaMA论文
  论文链接:
  https:research。facebook。compublicationsllamaopenandefficientfoundationlanguagemodels
  Meta目前提供有70亿、130亿、330亿和650亿四种参数规模的LLaMA模型。
  根据论文,在一些基准测试中,仅有130亿参数的LLaMA模型,性能表现超过了拥有1750亿参数的GPT3,而且能跑在单个GPU上;拥有650亿参数的LLaMA模型,能够跟拥有700亿参数的Chinchilla、拥有5400亿参数的PaLM竞争。
  要知道,GPT3是AI聊天机器人ChatGPT背后大模型GPT3。5的前代,GPT3。5的参数量也高达1750亿;而谷歌驱动对话式AI应用Bard进行搜索查询的模型,参数量比5400亿还要多。
  这是大模型研究迈出的重要一步!随着技术持续优化,未来有朝一日,你也许能在自己的笔记本电脑乃至手机上跑类ChatGPT功能的语言模型。
  扎克伯格说,LLaMA在生成文本、进行对话、总结书面材料以及解决数学定理或预测蛋白质结构等更复杂的任务方面表现出了很大的潜力。
  扎克伯格Facebook贴文
  值得一提的是,Meta宣布LLaMA基础大型语言模型开源,不作商用目的,免费供给研究人员。目前Meta在GitHub上提供了精简版LLaMA。
  GitHub地址:https:github。comfacebookresearchllama
  一、拥有70650亿参数,20种语言训练
  LLaMA作为一种基础大型语言模型,相比于GPT3等模型,其可以让开发人员使用更少的计算能力和资源来进行测试。
  目前,科技巨头玩家在大型语言模型领域开展军备竞赛,并且有多个成果面世。但研发人员在运行此类大模型时往往需要大量的资源投入,导致部分开发人员并不能全面研究访问这些模型。
  而这种限制就会阻碍人员去理解这些模型的工作模式和功能,并且使得他们在调整模型的偏见、发生错误的可能性上会较为困难。
  作为一个基础模型,LLaMA不是为特定任务而设计,Meta研究人员通过标记一些Tokens等来训练基础模型,其优势在于更容易针对特定潜在产品应用进行再训练和微调。
  不同于Chinchilla、PaLM、GPT3等大模型,LLaMA只使用公开可用的数据集进行训练,其中包括开放数据平台CommonCrawl、英文文档数据集C4、代码平台GitHub、维基百科、论文预印本平台ArXiv等。项目成员称,这是为了使其工作与开源兼容和可复现。
  总体来看,整个训练数据集在标记化后大约包含1。4万亿个Tokens。
  其中,拥有650亿参数的LLaMA和拥有330亿参数的LLaMA使用1。4万亿Tokens进行训练,最小的拥有70亿参数的LLaMA在1万亿Tokens上进行了训练。
  拥有不同参数的模型与训练损失的关系图
  与其他大型语言模型一样,LLaMA的工作原理是将一系列Tokens作为输入,并预测下一个单词以递归生成文本,Meta使用了20种语言对其进行训练。
  此外,大型语言模型中还可能会遇到生成偏见、不良信息、不实信息的风险,基于共享LLaMA的代码,其他开发人员可以测试限制或消除大型语言模型中这些问题的方法。
  二、7项AI能力,不输业界主流大模型
  在测试过程中,研究人员采用0shot和1shot、5shot、64shot几种方式,将LLaMA与GPT3、Gopher、Chinchilla等模型进行了比较。
  尤其值得一提的是,130亿参数LLaMA模型在单个GPU上运行时,性能表现可能超过1750亿参数GPT3。这也许会给类ChatGPT产品跑在消费级硬件上打开新的大门。
  1、常识推理(CommonSenseReasoning)
  LLaMA涵盖了八个标准常识性数据基准,包括BoolQ、PIQA等。这些数据集包括完形填空、多项选择题和问答等。
  结果显示,拥有650亿参数的LLaMA在BoolQ以外的所有报告基准上均超过拥有700亿参数的Chinchilla。同时,除BoolQ和WinoGrande外,该模型测试中均超过拥有5400亿参数的PaLM。
  拥有130亿参数的LLaMA模型在大多数基准测试上也优于拥有1750亿参数的GPT3。
  2、闭卷问答(ClosedbookQuestionAnswering)
  研究人员就闭卷答疑对LLaMA进行了测试,该基准测试的数据集包含阅读理解与问答的大规模语料集TriviaQA以及自然问题。
  拥有650亿参数的LLaMA在0shot和1shot条件下,实现了较好的性能。
  在推理过程中,拥有130亿参数的LLaMA在一个V100GPU上运行,其基准测试结果显示,与GPT3和Chinchilla不相上下。
  3、阅读理解(ReadingComprehension)
  在阅读理解能力方面,LLaMA通过大型深层阅读理解任务数据集RACE评估,拥有650亿参数的LLaMA与拥有5400亿参数的PaLM相差并不大。
  4、数学推理(Mathematicalreasoning)
  研究人员根据两个数学基准评估LLaMA模型,分别是包含中学和高中数学问题的数据集MATH、OpenAI发布的小学数学题数据集GSM8k。
  其比较模型对象是,从ArXiv和MathWebPages提取的拥有385亿数据进行微调的PaLM模型Minerva。结果显示,在GSM8k上,拥有650亿参数的LLaMA优于拥有620亿参数的Minerva。
  5、代码生成(Codegeneration)
  基于编程代码开源数据集HumanEval和小型数据集MBPP,被评估的模型将会收到几个句子中的程序描述以及输入输出实例,然后生成一个符合描述并能够完成测试的Python程序。
  对于拥有相似参数的模型,LLaMA优于其他通用模型。
  6、大规模多任务语言理解(MassiveMultitaskLanguageUnderstanding)
  这一数据集基准涵盖人文科学、STEM、社会科学等各种知识领域的多项选择题。
  经比较,研究人员发现,拥有650亿参数的LLaMA在大多数领域平均落后于拥有700亿参数的Chinchilla和拥有5400亿参数的PaLM几个百分点。
  研究人员猜测,其中一个可能的原因是,他们在训练前使用的数据集较为有限,包括177GB大小的ArXiv、Gutenberg和Books3,而其余模型的训练数据足有2TB大小。
  7、训练期间的能力进化(Evolutionofperformanceduringtraining)
  在训练过程中,研发人员跟踪了LLaMA在一些问题回答和常识性基准上的表现,其都保持稳步提高。
  不过针对于相关数据集的评估,研究人员认为其存在许多性能差异,该基准的结果并不可靠。
  三、去年曾发布Galactica大模型,但因偏见和造假火速下架
  关于大模型的研究如今在AI领域十分火热。其基本原理就是通过获取新闻、社交媒体或其他互联网资源上的文本,来训练软件,使得基于大模型生成的产品可以在用户给出提示或查询搜索时自行预测和生成内容,其目前最直观的例子就是最近爆火的聊天机器人ChatGPT。
  也正由于这一现象级消费级应用的推动,使得科技巨头开始构建基于大模型的产品测试,并将生成式AI视作新竞争领域。
  年初,微软向聊天机器人ChatGPT的创造者OpenAI投资了数十亿美元,随后,微软推出了其ChatGPT版新Bing搜索引擎。谷歌很快也加入竞赛,该公司基于其大型语言LaMDA推出类似的对话式AI应用程序Bard。
  去年5月,Meta也曾发布了拥有1750亿参数的OPT大型语言模型,这一模型的适用对象也是开发人员,是生成其聊天机器人BlenderBot的基础模型。半年后,Meta推出名为Galactica的语言模型,该模型可以撰写科学文章并解决数学问题,但在推出三天后,这一模型就因经常胡言乱语以及给出虚假信息被撤下。
  国外投资机构DADavidson高级软件分析师GilLuria认为:Meta今天的公告似乎是测试他们生成式AI能力的一步,这样他们就可以在未来将它们应用到产品中。
  他还补充道:生成式AI作为AI的一种新应用,Meta对此经验较少,但显然对其未来的业务很重要。
  结语:生成式AI竞赛不断升温
  大型语言模型已经在生成创意文本、解决数学问题、预测蛋白质结构、回答阅读理解问题等方面展示出了巨大的潜力,如今ChatGPT的发布使得其在消费级应用市场中爆发。
  继微软、谷歌之后,Meta也试图在这一领域展现自己的技术优势。
  在科技大厂纷纷亮出生成式AI商用计划之时,Meta难得地聚焦在研究贡献上,无论是用更多数据训练出的更少参数规模模型实现优于更大参数规模模型的研究成果,还是将LLaMA模型和权重开源开放,都令人感到耳目一新。
  但也由于仅限于研究用途,这可能导致Meta短期内难以在生成式AI领域形成像OpenAI、谷歌那样的影响力。

华为MatePadSE10。4英寸平板电脑曝光,骁龙6802K屏1499元起IT之家2月5日消息,去年5月,华为推出了搭载海思麒麟710A的MatePadSE平板电脑,464GB版本1299元,4128GB版本1499元起。这款平板电脑采用10。1英寸10降价iPhone14Pro系列官降800苹果调整销售战略?昨天跟大家分享了苹果的最新财报,财报中提到第一财季营收是苹果2019年以来首次出现同比下降2016年9月以来最大的降幅。也许是为了扭转下降趋势,接下来苹果将给iPhone14Pro隆回的由来隆回即是大家说的隆回县,是湖南省邵阳市下面一个县城的名字,以前大部分人不了解隆回,因为它只是一个名不见经传的县城,如果说是个小县城也符合大部分人对隆回的认知,但单独从人口来看,并不唐僖宗李儇名存实亡的大唐天子,在位15年,两次弃长安而逃请大家在阅读前,先点击上面的关注,感谢各位的支持,希望能给大家带来良好的阅读体验,并与您分享阅读的快乐!笔者后续将会为大家带来更多的精彩故事。唐僖宗李儇,他是大唐王朝第十九位皇帝,不击半渡之敌的宋襄公,究竟是真仁义还是死脑筋?春秋五霸,是春秋时期五位称霸一时的国君,他们或者因势利导,或者吃到了战争红利,或者享受着前人栽树,后人乘凉之利好,总之,富国强民,名噪一时。春秋五霸包括齐桓公晋文公秦穆公楚庄公宋襄把汉献帝支到许昌,把曹操抬上王公之爵,董昭舔曹家三代有一套如果说从制度上为曹操上位而铺路的大臣,我们就不得不提到董昭了。董昭字公仁,是济阴定陶人。他被推举为孝廉后在地方工作,袁绍入主冀州后将董昭召入身边。袁绍和公孙瓒在界桥对峙时,袁绍手下曾国藩家书读书笔记(187188)曾国藩给弟弟曾国荃的读书建议凡读书有难解者,不必遽求甚解。有一字不能记者,不必苦求强记,只须从容涵泳,今日看几篇,明日看几篇,久久自然有益。但于已阅过者,自作暗号,略批几字,否则历关羽失荆州并非是大意北京晚报五色土作者瀛洲海客汉献帝建安二十四年(219)秋,关羽发动襄樊之战,先围曹仁满宠,后水淹七军,斩庞德擒于禁,威震华夏。然而短短数月内,荆州形势就发生了急剧变化。孙权的突然背四川省内江市发展改革委以项目建设为引擎推动经济社会高质量发展封面新闻记者黄晓庆2023年2月1日,在内大高速(四川境)项目施工现场,东兴管养中心主体结构已经完成,正在进行外墙装饰,中间路段工人在进行底基层摊铺作业。这个川渝合作重点交通项目,金钱社会之下,谁还能保持纯真金Qian社会之下,谁还能保持纯真?这是一个值得思考的问题。在这个社会中,人们往往只关注物质生活的享受和物质财富的占有,而忽视了人的精神世界。我们从三个方面说说这个问题。一金Qia统治者永远英明,坏的都是那些奸臣?奸臣,其实就是皇帝的忠臣中国有一个走不出的历史怪圈,那就是统治者永远英明,坏的都是那些奸臣,百姓的眼睛永远是雪亮的。但是历史上发生的很多事情却证明了这种怪圈的荒谬,如果统治者永远英明的话,为什么会重用那些
白色面板满血重生,魅族17系列免费换电池,陶瓷机身质感十足魅族17系列于2020年发布,拥有罕见的白色面板陶瓷机身等配置,曾经凭借古装小姐姐模特海报红极一时。官方宣布,正式开启5款手机的免费换电池活动,其中就有魅族17系列两款产品,让一代这一夜,女主持人朱迅端庄,孙俪的指甲吸睛,韩红露老艺术家气质没想到,央视这台没有节目单的晚会,在播出后,口碑彻底爆了。有人长叹这次晚会完美诠释了专业的人做专业的事,不愧是央视!也有人表示,看国庆晚会,在没有节目单的前提下,完全是在开盲盒,期某云南领导参加下属小孩的满月酒,随礼300,竟大喝了3瓶茅台酒云南是一个好地方,那里的景色特别的美丽,很多人都去云南丽江旅游,很多流浪的人也喜欢待在那里,很多唱民谣的,开民宿的也都在云南。可见云南的独特之处。在云南有姓夏一对夫妻,他们因为工作亚麻籽油怎么吃?掌握这2个简单原则,吃油越来越健康我是饮食健康管理师小辉。现在越来越多人知道亚麻籽油的好处,可是要怎么吃,很多人还不懂,今天告诉你几个简单的原则,让你吃油越来越健康。亚麻籽油摄入比例亚油酸与亚麻酸都是人体必需的多不中老年人适当行事,可带来8大健康益处!记住这3点有助健康一对年仅56岁的夫妻向我诉苦,我们结婚三十多年来,感情一直都很好。现如今将近两三年的时间都没有过夫妻生活,而且共同的言语也越来越少,感情一直降到了谷底。夫妻都认为,这就是因为夫妻生南瓜饼最好吃的做法,外酥里糯还香甜,少油更健康,小朋友超爱吃金灿灿的秋天是万千宝藏的收获季,板栗香红薯糯南瓜甜,现在南瓜是一年四季中味道最好的季节,喜欢的朋友千万不能错过,香甜绵软的蒸南瓜,入口即化的南瓜汤,软糯咸香的炒南瓜,各种好吃的做法关于生命的起源我们千百次的问?我是谁?我们从哪里来?我们到哪里去?这是人类的终极之问。是人类对自身存在的拷问,更是人类科学和思想的破茧成蝶,晋升之问。目前,世界有两大答案。人是自然进化的产物,也有人说,人是神创中老年补钙别只知道喝牛奶,常吃五大补钙食物,强筋骨益健康人的一生当中,各个阶段都离不开钙质,尤其是中老年时期,一方面吸收能力不如青壮年时期,另一方面体内的钙也在随着岁月逐步流失,补钙更加刻不容缓。说到补钙,很多人第一反应就是喝牛奶,甚至无畏金兰!李梦T恤上写满女篮队友名字来源人民日报客户端北京时间10月1日下午,在2022年女篮世界杯决赛中,中国队以6183负于美国队,时隔28年,再次收获世界大赛亚军。赛后第一时间,中国篮协和国家女篮向参加本次世界瑞光科技友情提醒晚上睡觉时开灯是光污染,危害身心健康关灯睡觉,这是常规操作,可是有些人喜欢开着灯睡觉。请注意,瑞光科技友情提醒,晚上睡觉时开灯是在接受光污染,会危害人们的身心健康。人类的身体响应昼夜节律产生褪黑激素,其具有抗氧化诱导小儿四磨汤口服液养胃护肠专注孩子身体健康小儿消化不良是一种常见儿科消化系统疾病,患儿往往会出现进食或食后腹部不适腹胀噯气呃逆厌食,腹痛恶心呕吐等情况,并常常伴有舌苔厚腻及上腹部压痛,不少患儿甚至还会有食欲减退反酸胀气打嗝
友情链接:快好找快生活快百科快传网中准网文好找聚热点快软网