LeCun转赞苹果M1M2芯片上跑LLaMA！130亿参数模

爱情常识
搭配分娩
减肥两性
孕期塑形
财经教案
论文美文
日志体育
养生学堂
电商科学
头戴业界
专栏星座
用品音乐

LeCun转赞苹果M1M2芯片上跑LLaMA！130亿参数模

　　科技之巅
　　编辑：好困
　　【新智元导读】现在，Meta最新的大语言模型LLaMA，可以在搭载苹果芯片的Mac上跑了！
　　前不久，Meta前脚发布完开源大语言模型LLaMA，后脚就被网友放出了无门槛下载链接，惨遭开放。
　　消息一出，圈内瞬间就热闹了起来，大家纷纷开始下载测试。
　　但那些手头没有顶级显卡的朋友们，就只能望模型兴叹了。
　　不过，问题不大。GeorgiGerganov在最近做了一个名为llama。cpp的项目没有GPU也能跑LLaMA。
　　项目地址：https：github。comggerganovllama。cpp
　　是的，这也包括搭载了苹果芯片的Mac。并且还获得了LeCun的转发支持。
　　在M1M2的Mac上跑LLaMA
　　目前来说，比较全面的教程有两个，分别基于苹果的M1和M2处理器。
　　第一篇：https：dev。l1x。beposts20230312usingllamawithm1mac
　　第二篇：https：til。simonwillison。netllmsllama7bm2
　　话不多说，先看效果。
　　比如在最小的7B模型上提问：第一个登上月球的人是。
　　很快，几秒之后，结果就出来了。
　　p第一个登上月球的人是
　　第一个登上月球的人是38岁的宇航员NeilA。Armstrong。
　　1969年7月20日，阿波罗11号在月球上着陆。
　　阿波罗11号是第一个登陆月球的载人任务，也是太空竞赛的高潮。1969年7月，NeilArmstrong和EdwinBuzzAldrin成为第一批在月球上登陆的人类。
　　阿波罗11号于7月16日从肯尼迪航天中心发射。
　　从阿姆斯特朗登月的年龄、中间名和日期来看，并没有出现明显的事实性错误。这对于如此体量的小模型来说，实属不易。
　　如果用下面这个提示，则可以生成了一些实用的Python代码。pdefopenandreturncontent（filename）：defopenandreturncontent（filename）：Opensfile（returningthecontent）andperformsbasicsanitychecksifos。path。isfile（filename）：withopen（filename）asf：contentf。read（）returncontentelse：print（WARNING：file｛｝doesnotexist。format（filename），filesys。stderr）returndefgetfileinfo（filename，fullpath）：Getfileinformation（i。e。，permission，owner，group，size）接下来，我们就来看看具体是如何实现的。
　　第一步：下载模型
　　首先要做的就是下载LLaMA模型。
　　你可以通过官方的表格向Meta提交申请，或者从网友分享的链接里直接获取。
　　总之，完成后你会看到下面这堆东西：
　　正如你所看到的，不同的模型都在不同的文件夹里。每个模型都有一个params。json，包含关于该模型的细节。比如：
　　第二步：安装依赖项
　　首先，你需要安装Xcode来编译C项目。xcodeselectinstall
　　接下来，是构建C项目的依赖项（pkgconfig和cmake）。brewinstallpkgconfigcmake
　　在环境的配置上，假如你用的是Python3。11，则可以创建一个虚拟环境：opthomebrewbinpython3。11mvenvvenv
　　然后激活venv。（如果是fish以外的shell，只要去掉。fish后缀即可）。venvbinactivate。fish
　　最后，安装Torch。pip3installpretorchtorchvisionextraindexurlhttps：download。pytorch。orgwhlnightlycpu
　　如果你对利用新的Metal性能着色器（MPS）后端进行GPU训练加速感兴趣，可以通过运行以下程序来进行验证。但这不是在M1上运行LLaMA的必要条件。pythonPython3。11。2（main，Feb162023，02：55：59）〔Clang14。0。0（clang1400。0。29。202）〕ondarwinTypehelp，copyright，creditsorlicenseformoreinformation。importtorch；torch。backends。mps。isavailable（）True
　　第三步：编译LLaMACPP
　　gitclonegitgithub。com：ggerganovllama。cpp。git
　　在安装完所有的依赖项后，你可以运行make：makeIllama。cppbuildinfo：IUNAMES：DarwinIUNAMEP：armIUNAMEM：arm64ICFLAGS：I。O3DNDEBUGstdc11fPICpthreadDGGMLUSEACCELERATEICXXFLAGS：I。I。examplesO3DNDEBUGstdc11fPICpthreadILDFLAGS：frameworkAccelerateICC：Appleclangversion14。0。0（clang1400。0。29。202）ICXX：Appleclangversion14。0。0（clang1400。0。29。202）ccI。O3DNDEBUGstdc11fPICpthreadDGGMLUSEACCELERATEcggml。coggml。ocI。I。examplesO3DNDEBUGstdc11fPICpthreadcutils。cppoutils。ocI。I。examplesO3DNDEBUGstdc11fPICpthreadmain。cppggml。outils。oomainframeworkAccelerate。mainhusage：。main〔options〕options：h，helpshowthishelpmessageandexitsSEED，seedSEEDRNGseed（default：1）tN，threadsNnumberofthreadstouseduringcomputation（default：4）pPROMPT，promptPROMPTprompttostartgenerationwith（default：random）nN，npredictNnumberoftokenstopredict（default：128）topkNtopksampling（default：40）toppNtoppsampling（default：0。9）tempNtemperature（default：0。8）bN，batchsizeNbatchsizeforpromptprocessing（default：8）mFNAME，modelFNAMEmodelpath（default：modelsllama7Bggmlmodel。bin）cI。I。examplesO3DNDEBUGstdc11fPICpthreadquantize。cppggml。outils。ooquantizeframeworkAccelerate
　　第四步：转换模型
　　假设你已经把模型放在llama。cpprepo中的models下。pythonconvertpthtoggml。pymodels7B1
　　那么，应该会看到像这样的输出：｛dim：4096，multipleof：256，nheads：32，nlayers：32，normeps：1e06，vocabsize：32000｝nparts1Processingpart0Processingvariable：tokembeddings。weightwithshape：torch。Size（〔32000，4096〕）andtype：torch。float16Processingvariable：norm。weightwithshape：torch。Size（〔4096〕）andtype：torch。float16Convertingtofloat32Processingvariable：output。weightwithshape：torch。Size（〔32000，4096〕）andtype：torch。float16Processingvariable：layers。0。attention。wq。weightwithshape：torch。Size（〔4096，4096〕）andtype：torch。float16Processingvariable：layers。0。attention。wk。weightwithshape：torch。Size（〔4096，4096〕）andtype：torch。float16Processingvariable：layers。0。attention。wv。weightwithshape：torch。Size（〔4096，4096〕）andtype：torch。float16Processingvariable：layers。0。attention。wo。weightwithshape：torch。Size（〔4096，4096〕）andtype：torch。float16Processingvariable：layers。0。feedforward。w1。weightwithshape：torch。Size（〔11008，4096〕）andtype：torch。float16Processingvariable：layers。0。feedforward。w2。weightwithshape：torch。Size（〔4096，11008〕）andtype：torch。float16Processingvariable：layers。0。feedforward。w3。weightwithshape：torch。Size（〔11008，4096〕）andtype：torch。float16Processingvariable：layers。0。attentionnorm。weightwithshape：torch。Size（〔4096〕）andtype：torch。float16。。。Done。Outputfile：models7Bggmlmodelf16。bin，（part0）
　　下一步将是进行量化处理：。quantize。models7Bggmlmodelf16。bin。models7Bggmlmodelq40。bin2
　　输出如下：llamamodelquantize：loadingmodelfrom。models7Bggmlmodelf16。binllamamodelquantize：nvocab32000llamamodelquantize：nctx512llamamodelquantize：nembd4096llamamodelquantize：nmult256llamamodelquantize：nhead32llamamodelquantize：nlayer32llamamodelquantize：f161。。。layers。31。attentionnorm。weight〔4096，1〕，typef32size0。016MBlayers。31。ffnnorm。weight〔4096，1〕，typef32size0。016MBllamamodelquantize：modelsize25705。02MBllamamodelquantize：quantsize4017。27MBllamamodelquantize：hist：0。0000。0220。0190。0330。0530。0780。1040。1250。1340。1250。1040。0780。0530。0330。0190。022main：quantizetime29389。45msmain：totaltime29389。45ms
　　第五步：运行模型
　　。mainm。models7Bggmlmodelq40。bint8n128pThefirstpresidentoftheUSAwasmain：seed1678615879llamamodelload：loadingmodelfrom。models7Bggmlmodelq40。binpleasewait。。。llamamodelload：nvocab32000llamamodelload：nctx512llamamodelload：nembd4096llamamodelload：nmult256llamamodelload：nhead32llamamodelload：nlayer32llamamodelload：nrot128llamamodelload：f162llamamodelload：nff11008llamamodelload：nparts1llamamodelload：ggmlctxsize4529。34MBllamamodelload：memorysize512。00MB，nmem16384llamamodelload：loadingmodelpart11from。models7Bggmlmodelq40。binllamamodelload：。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。donellamamodelload：modelsize4017。27MBnumtensors291main：prompt：ThefirstpresidentoftheUSAwasmain：numberoftokensinprompt911576The937first6673president310of278the8278USA471was29871samplingparameters：temp0。800000，topk40，topp0。950000ThefirstpresidentoftheUSAwas57yearsoldwhenheassumedoffice（GeorgeWashington）。Nowadays，theUSelectorateexpectsthenewpresidenttobemoreyoungatheart。PresidentDonaldTrumpwas70yearsoldwhenhewasinaugurated。Incontrasttohispredecessors，heisphysicallyfit，healthyandactive。Andhisfitnesshasbeenaprominentthemeofhispresidency。Duringthepresidentialcampaign，hefamouslysaidhewouldbethemostactivepresidenteverastatementTrumphasnotyetachieved，butonethatfitshisapproachtotheoffice。Histweetsdemonstratehisphysicalactivity。main：mempertoken14434244bytesmain：loadtime1311。74msmain：sampletime278。96msmain：predicttime7375。89ms54。23mspertokenmain：totaltime9216。61ms
　　资源使用情况
　　第二位博主表示，在运行时，13B模型使用了大约4GB的内存，以及748的CPU。（设定的就是让模型使用8个CPU核心）
　　没有指令微调
　　GPT3和ChatGPT效果如此之好的关键原因之一是，它们都经过了指令微调，
　　这种额外的训练使它们有能力对人类的指令做出有效的反应。比如总结一下这个或写一首关于水獭的诗或从这篇文章中提取要点。
　　撰写教程的博主表示，据他观察，LLaMA并没有这样的能力。
　　也就是说，给LLaMA的提示需要采用经典的形式：一些将由。。。。。。完成的文本。这也让提示工程变得更加困难。
　　举个例子，博主至今都还没有想出一个正确的提示，从而让LLaMA实现文本的总结。
　　参考资料：
　　https：github。comggerganovllama。cpp
　　https：dev。l1x。beposts20230312usingllamawithm1mac
　　https：til。simonwillison。netllmsllama7bm2

家里南瓜太多了，怎么快速吃完，怎么做好吃？我是吃货小筑Vivi，一枚专注于烘焙的美食博主，这是我在悟空问答的第361个原创回答。家里南瓜太多了，怎么快速吃完，怎么做好吃？很高兴和友一起探讨这个问题。说到南瓜，也是我家最爱吃腊肠外面的肠衣是什么做的？余味记为你回答，请关注余味记，您如果问的是四川香肠，或者广东广味肠，那么那种是猪小肠，猪小肠洗干净，用刮子在外面一点点的挂，把里面的软制全部刮出来不要，最后只留下薄薄的，半透明的肠从昆明出发，自驾到北海，怎么规划行程？从昆明自驾游北海，全程也就1000公里左右，如果中途不过多停留的话，一天就到了，当然如果不想那么赶，想中途停留休息游玩一两天也是可以的，线路沿途还是有一些可以玩的地方，去程建议走文请问你最喜欢的中国旅游城市有哪些？为什么？旅游城市对于普通老百姓来说，只要住的舒服，景点多，价廉物美的旅游城市是首选。我最喜欢的是南京，景点价格便宜，停车方便，最主要是南京是一个历史悠久的城市，带老人孩子逛逛都很不错，其次联想真的有问题吗？用老百姓的话说，趁乱把国家的东西全部放进自己的口袋，尝到甜头后一发不可收拾。台底下的交易多了，现在被放到台面上了，在黑暗中生存了那么多年，能见光吗？最坏的是他这一套东西，影响了许多为什么目前电动车上不安装太阳能板来充补电能，骑更远路程？为什么目前电动车上不安装太阳能板来充电补电能，骑更远路程？是想装装不了，或者说是想装装不起。提问者会计师行业的，不懂得科技，让一些人的理想很骨感，现实很无奈。人类如果能够用太阳能板vivoOPPO荣耀哪个系统更流畅？首先，系统流畅与否和硬件配置有关，vivoOPPO和荣耀都是安卓手机，过去安卓系统对硬件的要求比较高。如果手机是入门配置，或者是两三年前的中端机，那么无论哪个牌子的安卓手机都不会特考个CPA到底能有多么吃香？CPA是注册会计师的英文缩写，在其他行业不太清楚，但是该证书在财会行业，含金量算最高的。一个证书所谓的吃香，我觉得，意味着能够入职高位拿到高薪，不然考出来的证书也就是个摆设。初中级西电只是211，为什么密码学排第一？首先说一下，西电在211里面属于顶级211，超过不少985大学。其次，很多211，甚至双非学校都有单个学科排第一的情况。比如，南京医科大学是双非学校，它的预防医学与公共卫生排全国第屁股上长出什么可能与癌症有关？屁股上长出这东西要重视可能是癌症的前兆在日常生活中，往往一些小病都会被我们忽视，但它们的呈现也是主要疾病的前兆。只有注意重视和正确地治疗它们，我们才能更好地保护我们的身体健康，使我经常吃石榴有好处吗？能清理血管吗？感谢邀请。吃石榴是很好的选择，石榴营养丰富，能提供不少矿物质维生素和有益成分，不过要把石榴和清理血管联系起来还是挺牵强的，我们可以认为每日果蔬的摄入有助预防多种心脑血管疾病，不过清

<<<<<<－>>>>>>

10，门框救险孙兴慜头槌致命一击，韩国队掀翻非洲杯5冠王亚洲排名第3世界排名第28的亚洲劲旅韩国队迎来了一场国际友谊赛，韩国队此役坐镇自己的主场PK非洲杯5次冠军得主非洲排名第5世界排名第38的喀麦隆队。在这个国际比赛日里，韩国队上一场男篮丢掉偶像包袱吧！巴林比哈萨克斯坦强！郭孙组合真不如阿拉基哈萨克斯坦真没让人失望，中国男篮差点摔了跟头。赛前就曾分析到，这支哈萨克斯坦男篮这些年进步神速，队内的主力都属于哈萨克斯坦国内的阿斯塔纳虎俱乐部，他们常年参加俄罗斯的TVB联赛，实韩国体操公主许昭英为爱学中文，就要嫁中国小伙，被同胞骂叛徒这可能是体育里最浪漫的爱情故事。许昭英，一个才华与美貌并肩的奇女子，绰号韩国体操公主。没错，她在韩国的影响力，就相当于是咱们巅峰时期的刘璇，韩国国宝级体操运动员，是妥妥的体育圈顶流艾迪生雷现身，穿黑色吊带背心搭短裤雪地靴运动风满满近日，艾迪生雷（AddisonRae）杉矶外出。当天，艾迪生雷（AddisonRae）现身，穿黑色吊带背心搭短裤雪地靴运动风满满。她微胖型的身材很丰韵，很有青春的气息，戴着一副墨镜1948年宋时轮与粟裕不和，晚年宋时轮被针对，粟裕为何还力保他？我们第10纵队多日来连续奋战在一线，弹药缺失严重不说，部队损失也一直未给予补充，如果上级还是这样，这仗打不了！上述是发生于1948年9月在济南战役开始前，在华东野战军一次高级作战军马卡老佛爷对皇马引援很满意，他透露是姆巴佩自己选留在巴黎直播吧9月28日讯据马卡报报道，本周末皇马俱乐部将召开会员大会，为准备此事，当地时间9月27日弗洛伦蒂诺和相关人员召开了一次预备会，在会议上弗洛伦蒂诺表示对皇马引援很满意，他同时透王昭君嫁父子三人，儿子小叔变丈夫，她到底经历了什么？公元前38年，年仅14岁的王嫱作为南郡秀女被选入宫，本以为凭着自己的才情和美貌，可以在汉元帝的后宫占一席之地。可平民出身的她，既无后台背景，又无钱财傍身，在那个酒香也怕巷子深的年代林彪的准儿媳张宁遇人不淑，离婚丧子，最终万念俱灰皈依佛门前言有人想尽办法让自己的容貌更加出众，有人天生就拥有绝世容颜，却宁愿自己相貌平平。比如，我们今天故事的主人公，张宁。她的美貌曾经让印尼王子一见倾心，并且为她疯狂，也曾使林彪的儿子一大衣哥新儿媳怀上双胞胎，奖励丰厚，陈亚男清空社交网站背景介绍大衣哥朱之文的儿子朱单伟先前与拥有400多万粉丝的陈亚男是夫妻，但两人当时因为三观不合而分开，而后更是有谣言称朱单伟无法生育，两人有遗憾而分开，但如今大衣哥新儿媳的到来打破杨振宁百岁寿宴挂超大寿字！与小54岁妻子十指紧扣，孙楠惊喜现身饿了吗？戳右边关注我们，每天给您送上最新出炉的娱乐硬核大餐！9月27日，有媒体曝光出杨振宁院士百岁生日宴的现场视频，当天的宴会办得十分低调，只宴请了几位好友，不过杨振宁还是隆重地作十一假期美丽乡村自由行之云浮新兴白水坑十一假期自由行，不扎堆，不排队，不买门票，珠三角自驾游推荐云浮新兴县白水坑村。导航新兴白水坑，很天然很幽静很慢生活的世外桃源！可欣赏美丽乡村风光徒步曲径通幽山间小道嘻戏如画般山泉村

友情链接：快好找快生活快百科快传网中准网文好找聚热点快软网