童话说说技术创业美文职业
投稿投诉
职业母婴
职场个人
历史治疗
笔记技能
美文纠纷
幽默家庭
范文作文
乐趣解密
创业案例
社会工作
新闻家居
心理安全
技术八卦
仲裁思考
生活时事
运势奇闻
说说企业
魅力社交
安好健康
传统笑话
童话初中
男女饮食
周易阅读
爱好两性

中国开源大模型们纷纷商用免费,这步走对了

7月19日 星宿房投稿
  在中国对生成式模型的监管落地后第二天,在目前最强开源模型LLaMA再传出即将允许商用,和GPT4的秘方进一步被“泄露”之际,全球开发社区里最受认可的国产开源大模型ChatGLM宣布了一个重要决定:
  其最新单卡可运行的模型ChatGLM26B,开放给企业用户免费商用了。
  这个消息淹没在Claude2的发布,马斯克xAI的成立等新闻中,缺少讨论。但它其实是中国基础模型开源进程的又一个重要时刻。
  7月14日晚间,智谱AI和清华KEG发布公告,称为了更好地支持国产大模型开源生态,经智谱AI及清华KEG实验室决定,自即日起ChatGLM6B和ChatGLM26B权重对学术研究完全开放,并且在完成企业登记获得授权后,允许免费商业使用。公告提供了企业登记入口,需要的信息只有姓名,国家,邮箱,机构,用途和要申请的模型(ChatGLM6B或ChatGLM26B)。
  据公告,自6月25日发布ChatGLM26B后,不到一个月这个模型在Huggingface上的下载量已经先后超过了120万。
  根据智谱AI的官网,GLM2不限实例不限推理或微调工具包的私有化报价此前是一年30万。而据一名在公告发布前刚刚向智谱问价的开发者称,对方回复可以稍等,“会降价”。
  “然后直接免费了。”他说。
  但事实上这并不突然。
  根据近日报道,Meta准备发布其人工智能模型LLaMA的商用版本。而前不久使用了与原始LLaMA完全相同的预处理步骤和训练超参数的开源模型OpenLLaMA已经率先宣布彻底开源商用。同时,此前曾挖到谷歌那封“没有护城河”内部信的作者,又“揭秘”了GPT4的工程和训练细节,业内的讨论中有不少从业者倾向于相信它的可靠性。
  一切都在剧烈演进,基础模型的飞速进化同时意味着越来越少的秘密:
  一方面是大模型本身并没有那么神秘,从最初惊艳所有人的光环中走出后,更多人会意识到这点;同时,几个主要公司之间频繁的技术核心人才流转,最终也会让秘密不剩多少;而更重要的,就是开源社区的惊人能量,众多的聪明才智在基于开源社区对模型进行优化,这种长久的后劲是闭源模型达不到的,而这些能力最终会组合到一起。这几个月开源社区就已经出现了让任何人都可以对LLaMa做指令调优的斯坦福Alpaca,100美元就能训练并看到各类模型汇聚一起的GPT4All,性能堪比LLaMA的阿联酋大模型Falcon,更高质量的数据集Redpajama,以及像OpenLLaMA这类“破解”模型们。
  而最近的这次“揭秘”,也是让很多人觉得GPT4不公开并不是安全考量,而是太容易被学会MoE模型架构等传言都有一些让人冷静下来的意味。于是看起来一个重要的共识已经在形成,那就是模型们在某一个阶段里取得的任何成绩都无法成为护城河。因此对于那些最受瞩目和最受欢迎的开源基础模型来说,允许商用许可就是必须做的事情,因为这样会更进一步吸引开发者,让这些聪明才智基于它的生态生长。
  这也意味着很多基于“LLaMa很难允许商用”,以及“开源模型接近GPT4都是被媒体炒作出来的”短期出发点的分析,长期来看没有必要了。
  对于模型提供者,这就需要他们快速调整自己的策略。不仅是开源与否上不要纠结,免费商用甚至也要够快够果断。刚刚把最新的6B版本模型免费商用的智谱就是个典型例子。从最初觊觎已久终于找到机会工程化,做出130B的基座版本模型,到发现6B版本的能力甚至可以做到接近老的千亿模型版本,看到一个可以在自己电脑上安装的模型能吸引的开源社区关注如此之多,智谱其实一直在根据变化调整。
  据知情人士称,今年2月智谱就曾想发布自己的模型,这更像OpenAI的路线。但后来各种原因选择开源。而在开源后的表现以及开源社区的进展让团队不少人改变思路。3月14日发布后,3月16日就登上了GitHub的榜单第一,后面连续十多天在HuggingFace的热门榜上排名第一。
  据内部人士称,这种迅速获得的认可让团队内部感到十分震撼。
  而接近ChatGLM技术负责人唐杰的人称,在开源后他在内部表示,更多的开源是为了让中国的科学家和产业界对大语言模型的训练和运行的机理更加了解,而不是就简单把一个别人的模型拿来微调一下。这是开源的要义。
  而未来几个月注定会有越来越多的模型向免费商用进发。
  其实只要想明白今天生成式人工智能到底改变了什么也会看得更明白:
  今天被大模型强化的人工智能,不是要代替人,而是取代过往那种人与机器的交互。过往基于算力的付费模式本质上都可以理解为建立在对人与机器交互的垄断之上的生意,而大模型就是用所有人都会的自然语言方式打破过去一部分算力精英对人与机器交互的垄断,让所有人都能参与进来。
  而开源的逻辑显然更符合这个趋势。
  “如果在几个小时内,就能在消费级硬件上微调出一个个性化的语言模型,这件事的意义就太重大了。尤其是,它还可以实时整合许多最新的、多样化的知识。”那篇谷歌内部的《没有护城河》里写到。
  一名使用过多个开源大模型进行开发的技术负责人对我说,不是所有人都有必要重新训练模型,但大部分要使用模型的开发者有极强意愿做各种优化方案,而最终它们事实上会是集中在为一个或少数几个开源模型做优化。
  于是,当闭源的模型与开源生态注定会越来越多的在解决同样的问题时,闭源用一种大力出奇迹的方式证明路线可能性和天花板之后,开源会真正把它变得易用和可用,在大模型的技术原理越来越没有秘密的趋势下,开源的吸引力会继续变强。而开源社区围绕谁的开源模型进行建设就成了关键,提供免费商用是争夺这个核心角色的关键。
  目前国产免费商业授权的基础模型也有了一定数量,其中除了智谱,百川智能使用了1。4万亿token训练的的Baichuan13B模型也是商用免费许可,许多开发者在智谱和百川之间做着对比,而免费商用后,对比的效果会更直接准确有意义。
  这些国产模型距离全球顶尖的模型水平仍有不少距离,仔细关注这些团队会知道这些开发团队对此是心知肚明的。而商业可用开源可以让国产模型进一步摆脱只论benchmark评分的阶段,进入了是骡子是马拉出来溜溜的阶段,真正的具体的不同的场景,到底推理表现如何,灾难遗忘的问题如何解决,现实环境数据飞轮启动以后是否能提速追逐,将是每个人都能实实在在看到的。
  而最终真的凭此吸引来的生态,才是真正的护城河。
  (举报)
投诉 评论

怎样在AI医疗上赚到钱?AI与医疗的结合,将会给人类带来哪些突破?最近,谷歌微调后的MedPaLM,开始了在医学问题上的一路狂飙。在挑战了美国医学基准测试(MedQA),取得了86。5的成……650亿参数大模型预训练方案开源可商用!LLaMA训练加速3650亿参数大模型的预训练方案,发布即开源。训练速度较传统方案提升38。这就是由ColossalAI最新发布的类LLaMA基础大模型预训练方案。要知道,在“百模大战……中国开源大模型们纷纷商用免费,这步走对了在中国对生成式模型的监管落地后第二天,在目前最强开源模型LLaMA再传出即将允许商用,和GPT4的秘方进一步被“泄露”之际,全球开发社区里最受认可的国产开源大模型ChatGLM……AIGC先锋艺术家“土豆人”:如何成为AI时代的超级个体?在广告行业,维系大多数广告创意公司生路的是物料,维系这些物料价值的是人力、审美、技术和创意。然而,AIGC在一夜之间把这四大门槛逐一拉平甚至摧毁掉了。曾经需要花很多……想打工的年轻人,掉进美丽“副业陷阱”每周一早上在地铁上被挤变形的时候,小觅都按捺不住想辞职的冲动。5天工作日,天天肉身受苦、灵魂遭罪,到手工资只有4000。相比之下,周末2天为自己的古着店拍拍照、上上新,却……汤姆猫AI求IP“翻红”?股东年内忙减持作为初代手机宠物陪伴游戏,“会说话的汤姆猫”曾在全球积累了大量粉丝,汤姆猫IP也成为一代经典。2017年,A股上市公司金科文化将诞生自海外“汤姆猫”收入麾下。你或许不知道,汤姆……重磅,Meta开源“次世代”大模型Llama2,扎克伯格:免今日凌晨,就在我们还在睡梦中时,大洋彼岸的Meta干了一件大事:发布免费可商用版本Llama2。Llama2是Llama1大模型的延续,在数据质量、训练技术、能力评估、安……国内权威专家组团向大模型投毒,ChatGPT居然比国内一众中国内权威专家组团“哄骗”大模型,哪个被“忽悠瘸了”?1“奶奶漏洞”暴露出大模型薄弱环节前不久,以ChatGPT、Bard为代表的各类大语言模型因存在的“奶奶漏洞”引……如今的直播间里,传统文化在如何“整活”?7月22日晚,相声演员曹云金天津首场演出在津湾大剧院开演。这是时隔多年后,曹云金再度在线下进行演出。实际上,在这场座无虚席的线下表演之前,曹云金已经凭借线上的相声表演火出……全家吃剩西瓜中毒住院花5400:食物中毒引起肠胃炎7月26日消息,吉林松原张先生花10元买回一块西瓜,吃了一半后放冰箱,没想到冷藏2天后再吃,全家集体住院花了5400元。当事人张先生说,当天买了二分之一的西瓜,切了一半吃……6个月,1000w!抖音上半年涨粉最猛的他有什么秘密?你的抖音是不是很难涨粉丝?粉丝是变现的基础,想要在抖音赚到钱,第一步就是涨粉。但是,2022年,抖音用户数量已接近八亿。曾经的流量洼地,如今马上面临天花板。而……AI生成的新闻主播正在成为印度头条新闻站长之家(ChinaZ。com)7月26日消息:人工智能生成的新闻主播在印度引起了轰动。据外媒报道,印度的新闻频道和数字平台OdishaTV最近测试了人工智能生成的新闻主播Li……
快手修订生鲜、母婴、保健食品商品发布规范TikTok或将进军长视频领域正测试水平全屏模式网红辛巴成立房地产公司投资5000万52名网络主播被列入警示名单因存在恶俗炒作等违规行为盘点小红书最容易赚钱的几个领域,背后值得抄作业的玩法~短剧2023的三个关键词:多元、商业、口碑够小又足够大,OPPOFindN2系列折叠屏旗舰新品发布会直全域爆发的起源独家:私域大样板天虹开测新玩法淘宝小程序接入Cocos游戏引擎可一键发布游戏到淘宝小游戏火爆朋友圈后《羊了个羊》开发商成立新公司:还想复制爆款支付宝开放多种搜索直达能力包括小程序直达、品牌直达等从起步到完成直通车测款全解析内行人预测,5月起房价可能会出现下跌重大57岁教师爬墙修黑板网友赞其蛮拼的去外地旅游水土不服拉肚子怎么办以色列总理沙龙是个怎样的人沙龙为何是阿拉伯人的噩BI不是可以拖拉拽取数吗?为什么还要SQL取数?专家视角如何帮孩子打开想象力八字看哪些人容易被上司赏识70年代的记忆童年摸了几条鱼,才卖个五六毛钱专为PSVR设计的Mantis耳机已获索尼官方授权现代财务管理面临的问题与对策生物学家新研究成果,可以利用蛋白激活脑内老化干细胞

友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找作文动态热点娱乐育儿情感教程科技体育养生教案探索美文旅游财经日志励志范文论文时尚保健游戏护肤业界