部署国产ChatGPT,首个功能型对话开源中文大模型Chat
编辑:LRS好困
【新智元导读】自己部署一个ChatYuan,再也不用担心网络拥堵了!
前段时间,元语智能开发团队训练了一个类似ChatGPT的功能型对话大模型ChatYuan,并在网页版中开放了试玩接口。
现在你也可以在自己的机器上部署一个ChatYuan了!
模型可用于问答场景,能够结合上下文做对话、做各种生成任务,包括创意性写作,也能回答法律、新冠等领域类问题。
并且在全中文任务中支持零样本学习,用户可以通过提供prompt的方式来使用,支持文本生成、信息抽取和理解大类下近30多种中文任务。
ChatYuan基于PromptCLUElarge结合数亿条功能问答和多轮对话数据进一步训练得到,模型参数量7。7亿,显存6G左右,一张民用显卡即可加载使用,目前模型已开放下载。
PromptCLUE在1000亿token中文语料上预训练,累计学习1。5万亿中文token,并且在数百种任务上进行Prompt任务式训练。
针对理解类任务,如分类、情感分析、抽取等,可以自定义标签体系;针对多种生成任务,可以进行采样自由生成。
如何使用
1。Github
项目地址:https:github。comclueaiChatYuan
2。Huggingface
项目地址:https:huggingface。coClueAIChatYuanlargev1
3。ModelScope
项目地址:https:modelscope。cnmodelsClueAIChatYuanlarge
加载模型:
使用模型进行预测推理方法:
4。PaddlePaddle
项目地址:https:aistudio。baidu。comaistudioprojectdetail5404182
模型地址:https:huggingface。coClueAIChatYuanlargev1paddle
使用自有数据训练模型
1。组织数据
将数据组织成统一的格式,由两部分构成:输入(Input)和输出(Output)。
针对单轮问答或生成:
输入(Input):任务描述输入文本
输出(Output):系统需要预测的文本,如下图中小元后的内容。
针对多轮对话:
输入(Input):任务描述上文输入文本
输出(Output):系统需要预测的文本,如下图中小元后的内容。
单轮对话数据格式:
多轮对话数据格式:
2。训练模型
训练代码可以参考:
使用pCLUE数据集进行训练、预测和效果验证,pytorch实现在线colab。
Github项目:https:colab。research。google。comdrive1lEyFhEfoc5Z5xqpEKkZtiMaojH1MP?uspsharing
举个例子
示例1
用户:
你能干什么
小元:
您好!我是元语AI。我可以回答您的问题、写文章、写作业、翻译,对于一些法律等领域的问题我也可以给你提供信息。
示例2
用户:
写一个诗歌,关于冬天
小元:
冬夜寂静冷,
云在天边飘,
冰封白雪上,
寒冷像一场雪。
雪花融化成冰,
像那雪花飘洒,
在寒冷的冬天,
感受春天的喜悦。
冬日里,
风雪渐消,
一片寂静,
把快乐和温暖带回家。
示例3
用户:
学前教育专业岗位实习中,在学生方面会存在问题,请提出改进措施。800字
小元:
在学前教育专业岗位实习中,在学生方面会存在一些问题,如学生缺少专业知识、缺乏合作意识、缺乏基本的责任心等等,需要我们采取措施,来解决这些问题。
首先,在实习过程中,我们需要培养学生的团队意识,加强学生与老师之间的合作,加强与家长之间的沟通,提高他们的沟通能力。另外,我们也需要加强学生的独立性,让学生学会独立思考,学会和老师、家长进行沟通,培养其独立性。
此外,在日常的工作中,我们也要为学生提供适当的机会和机会,让学生多接触社会、多参加社会活动,加深他们对社会、学校的认识,培养他们主动、积极和创新的精神。
最后,我们还需要重视学生在实习中出现的问题,尤其是学生缺乏合作,有依赖心理,不懂得分享,有拖延行为等,这些学生应该引起我们的重视,制定合理的改进措施,改善这些问题。技术与训练过程
ChatYuan是在PromptCLUE基础上进一步训练获得的模型。它去掉了文本理解、信息抽取类任务,加强了问答、对话和各种生成式任务的学习和训练;
针对多轮对话容易受到上下文的干扰,加入了抗干扰数据使得模型可以在必要时忽略无关的上下文;加入了用户反馈数据的学习,使得模型不仅具有一定的通用语言理解能力、特定任务上的生成能力,也能更好的响应用户的意图。
PromptCLUE的学习过程
三大统一:统一模型框架(texttotext),统一任务形式(prompt),统一应用方式(zeroshotfewshot)(T0)
大规模预训练:在t5large版基础上,使用数百G中文语料,训练了100万步,累积训练了1。5万亿个中文字词级别token
大规模任务数据:使用了16种任务类型,数百种任务,累积亿级别任务数据
混合预训练:一方面将下游任务作为预训练语料,另一方面将下游任务和预训练语料一起训练,减少任务灾难遗忘以及缩短预训练和下游任务的距离,更好的适应下游任务(ExT5)
混合采样:针对众多数据量差异极大的任务,采用在每个训练batch内对所有的任务进行按照比例采样,根据任务的数据量进行平滑采样,并且同时限制任务数据量采样池的上限。平滑采样可以减少任务训练有偏危害,在每一batch内训练可以减少异质任务之间训练负迁移的情况(T5)
分阶段训练:一方面指在预训练分阶段,涉及训练序列长度的分阶段(128和512),加快预训练速度(Bert);另一方面,在下游训练分阶段,涉及学习率和序列长度的变化以及递减式对下游任务的数据量限制,更好的适应下游的不同任务。
增加语言模型的训练:参考t5。1。1,除了使用SpanCorrpution构建的方式进行无监督训练,同时在使用prefixLM的方式训练,增强生成任务的能力(LMadapted)
增加对模型的encoder以及decoder的训练:根据下游任务数据分别构建Datatext,Datatarget预训练数据语料,加入到预训练中,分别增强模型的encoder理解能力和decoder的生成能力(见UIE)
重新构建模型中文字典:使用sentencepiece上在千亿token上学习并构建模型字典,更加符合中文语言习惯
后续工作
目前版本可以进行问答、对话和各种创意性写作或文本生成,相对于线上的版本,它的意图理解和生成能力在一些场合还有比较大的提升空间;它也还不能较好实现推理或复杂的任务。之后,会根据反馈进一步改进现有版本。
这个世界怎么了,为什么最近总遇到类似这种案例,还是屡教不改?6月10日河北唐山,一男子骚扰女生被拒后,多名同伴上前暴力殴打女子,被打女子有多惨,相信大多数人都看到那情景,简直惨不忍赌,有的人围观但也只是看看并未做任何帮助。7月26日贵阳一美
突发!河南一县城对全域人员赋红黄码已经静态管理超过9天的河南商丘民权县正迎来更加严厉的管控措施。8月3日晚间,商丘市民权县发出全域人员赋码管理通知,决定对全域人员赋码管理,其中绿洲街道南华街道北关镇王桥镇老颜集乡白
买牛腱子肉,注意区分前腱和后腱,口感差别大,教你1招,别被骗夏天,天气炎热,下厨房做饭是件辛苦的事情,所以,我老妈喜欢购买一些卤菜,比如卤牛肉卤鸡爪鸭脖子卤干子卤藕卤牛肚等菜肴,买回家也简单,比如卤干子,搭配肉丝和青椒,简单炒一下,就是一盘
我女儿,河南人,2岁半时被姥姥带去庙会,至今失踪18年生死未卜这是我们讲述的第650位真人的故事我女儿张慧,2001年11月5日,出生于河南省驻马店市新蔡县。于2004年4月28日,在河南省周口淮阳县疑似被一个年轻女人拐骗走,年仅2岁半。我女
网红纠正哥患恶性胸腺瘤!公开治疗过程,女徒弟负责照顾日常古语有云好人无好报,坏人活逍遥。这句话虽然不是绝对,但却适用于现实的情况。伴随着各种网红的兴起,一种以打假为主的网红也应运而生,他们的存在很大程度上维护了正义,就像开头所说的那样,
越陈越香,普洱经典之美当我们一提到越陈越香的时候,第一时间想到是普洱茶,虽然它不是普洱茶的专属特性,却是普洱茶的兴起,让越陈越香成了一个耳熟能详的俗语,普洱茶也因为这个特性,在中国的众多名茶中异军突起,
明天,台湾海峡将上演这一幕没有拦截伴飞,更没有击落击沉,昨夜的台湾海峡静悄悄。佩洛西已经悄然入住台北君悦饭店,今天就将窜访台湾所谓立法院总统府。我们一夜无眠,黯然神伤,义愤填膺。原本以为我们这么多人,吐点唾
感慨一下我们大家庭里的那点事宝岛台湾傍晚结束了一天劳累而又充实的农活,我收工回到了家,走进家门看到老妈在厨房里烧着晚饭。我便走过去说,老妈需要我帮忙吗?老妈笑着回到,不用了饭已煮好了,还有一个辣椒炒豆腐干就好了。你也
师出有名是时候好好教育教育台湾了今天有个领导跟我分析了这次的佩洛西访台事件我觉得很有道理他说昨天我们没有拦截下佩洛西的飞机,也没有打响中美战争的第一枪是很明智的,尽管昨晚我国的舆情都指向国内。他认为我们国家和美国
封岛三天的军事演习前所未闻?现在为您解读各位大家好,欢迎各位观看今天的专题目录。此文章是通过邱震海博主的视频整理下来的最新文章。邱震海现在最主要的是封岛三天锁岛三天这样的军事演习。从规模到形式,这个坦率地讲,在过去是从来
唐山打人案最新进展,受害者伤情鉴定公开,轻伤二级怎么判的?对于唐山的这些肇事者会得到什么样的惩罚,有法律界的专家学者发声,他们的罪行可以判三到五年,最高十年。我搜索了类似的情况,从秦汉到唐宋元明清。古人是怎么惩罚他们的?唐山打人案重大进展
今日立冬,这些养生小知识你需要知道古籍月令七十二候集解中说冬,终也,万物收藏也,意思是说秋季作物全部收晒完毕,收藏入库,动物也已藏起来准备冬眠。即是说,立冬是表示冬季开始,万物收藏,规避寒冷的意思。立冬是冬天的第一
想和大吉鲁一样健壮吗?吉鲁透露食谱做菜0糖0油但喜欢提拉米苏直播吧11月8日讯36岁的吉鲁本赛季状态不错,法国人透露了自己的食谱做菜最好0糖0油,但是很喜欢吃提拉米苏。吉鲁不喜欢过分精致的菜肴,而且很少放调味品,会尽可能不要糖和油,吃大量的
德甲1不来梅五连胜领跑北京时间11月9日凌晨3点30分,202223赛季德甲联赛第14轮,拜仁慕尼黑坐镇主场迎战不来梅。上半场,穆西亚拉闪击破门,安东尼容扳平比分,舒波莫廷罚丢格纳布里创造的点球,马内伤
今日繁华如斯,岂能忘却历史纪念淞沪会战85周年1937年8月13日,八一三淞沪会战爆发。上海这座城市,铭记着中华民族近代史上的这段苦难危亡与全民族的浴血奋战日军的侵略历史和战争罪行。85年过去,脚下大地早已换了人间。如今,走过
土皇帝的荒唐事迹,县医院当成皇宫,40名护士成了妃子爱新觉罗溥仪,是中国历史上封建时期的最后一位皇帝,自1912年清朝灭亡后,统治了我国两千多年的封建社会制度终于落幕,我们也迎来了历史的新章程。人们终于摆脱了身上的枷锁,开启向着新中
食物的本味一日读北村的文章我的自然生活,里面写到自然农法的耕作方式,其中写到一个实践成果显赫的实例,令人印象深刻并惊羡我们连一片小小的果干,都要实现一个目的还原到其本味。何谓本味,就是造物主
冬季食补常见食物(及药物)食用宜忌速查冬季宜食用温补滋养的食物,阳气过盛口舌干燥面颊潮红手足心热者则不宜盲目滋补。以下总结20种冬季常用食物及药物的食用宜忌1羊肉宜可用于老年人及虚弱消瘦腰膝酸痛产后虚冷腹痛男人五劳七伤
还原一个真实的怀斯曼01噩梦始于夏洛特序这是一个系列,可能有点长,所以它有个序。新赛季截至目前,卫冕冠军勇士开局3胜7负,最近五个客场连战连败,看起来他们的目标似乎要从再夺一冠,变成俯冲文班亚马。为他们成功开心的同时,
中超积分榜!广州队11轮不胜,武汉止住11轮不胜,三镇重回榜首中超第24轮全部结束,今日有6场比赛,广州双雄全输了,海港击败沧州,梅州客家险胜河南嵩山,国安不敌武汉三镇,大连人战胜深圳。比赛结束后,积分榜随之发生变化,让我们看看发生了什么。广
有一种爱,你来或不来,我都会一直等待头号解忧馆秋风,吹来了一片落叶,我看到上面全是你对我的思念,阳光正好,微风不燥,我站在秋天里,静静地去回忆从前。有一种爱,你来或不来,我都会一直等待,时间过了很久,还是想得到你的消
外媒分析美国中期选举的五个决定性因素拉美社近日发表题为美国中期选举的五个决定性因素的文章。全文摘编如下许多准备参加美国中期选举的选民认为,与以往的选举相比,此次选举在一个特殊的环境中展开。本文将从经济民主移民堕胎和医