范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

部署国产ChatGPT,首个功能型对话开源中文大模型ChatYuan开放下载

  编辑:LRS 好困
  【新智元导读】自己部署一个ChatYuan,再也不用担心网络拥堵了!
  前段时间,元语智能开发团队训练了一个类似ChatGPT的功能型对话大模型ChatYuan ,并在网页版中开放了试玩接口。
  现在你也可以在自己的机器上部署一个ChatYuan了!
  模型可用于问答场景,能够结合上下文做对话、做各种生成任务,包括创意性写作,也能回答法律、新冠等领域类问题。
  并且在全中文任务中支持零样本学习,用户可以通过提供prompt的方式来使用,支持文本生成、信息抽取和理解大类下近30多种中文任务。
  ChatYuan基于PromptCLUE-large结合数亿条功能问答和多轮对话数据进一步训练得到,模型参数量7.7亿,显存6G左右,一张民用显卡即可加载使用,目前模型已开放下载。
  PromptCLUE在1000亿token中文语料上预训练,累计学习1.5万亿中文token,并且在数百种任务上进行Prompt任务式训练。
  针对理解类任务,如分类、情感分析、抽取等,可以自定义标签体系;针对多种生成任务,可以进行采样自由生成。
  如何使用
  1. Github
  项目地址:https://github.com/clue-ai/ChatYuan
  2. Huggingface
  项目地址:https://huggingface.co/ClueAI/ChatYuan-large-v1
  3. ModelScope
  项目地址:https://modelscope.cn/models/ClueAI/ChatYuan-large
  加载模型:
  使用模型进行预测推理方法:
  4. PaddlePaddle
  项目地址:https://aistudio.baidu.com/aistudio/projectdetail/5404182
  模型地址:https://huggingface.co/ClueAI/ChatYuan-large-v1-paddle
  使用自有数据训练模型
  1. 组织数据
  将数据组织成统一的格式,由两部分构成:输入(Input)和输出(Output)。
  针对单轮问答或生成:
  输入(Input):任务描述+输入文本
  输出(Output):系统需要预测的文本,如下图中「小元」后的内容。
  针对多轮对话:
  输入(Input):任务描述+上文+输入文本
  输出(Output):系统需要预测的文本,如下图中「小元」后的内容。
  单轮对话数据格式:
  多轮对话数据格式:
  2. 训练模型
  训练代码可以参考:
  使用pCLUE数据集进行训练、预测和效果验证, pytorch实现——在线colab。
  Github项目:https://colab.research.google.com/drive/1lEyFhEfoc-5Z5xqpEKkZt_iMaojH1MP_?usp=sharing
  举个例子
  ==========示例1==========
  用户:
  你能干什么
  小元:
  您好!我是元语AI。我可以回答您的问题、写文章、写作业、翻译,对于一些法律等领域的问题我也可以给你提供信息。
  ==========示例2==========
  用户:
  写一个诗歌,关于冬天
  小元:
  冬夜寂静冷,
  云在天边飘,
  冰封白雪上,
  寒冷像一场雪。
  雪花融化成冰,
  像那雪花飘洒,
  在寒冷的冬天,
  感受春天的喜悦。
  冬日里,
  风雪渐消,
  一片寂静,
  把快乐和温暖带回家。
  ==========示例3==========
  用户:
  学前教育专业岗位实习中,在学生方面会存在问题,请提出改进措施。800字
  小元:
  在学前教育专业岗位实习中,在学生方面会存在一些问题,如学生缺少专业知识、缺乏合作意识、缺乏基本的责任心等等,需要我们采取措施,来解决这些问题。
  首先,在实习过程中,我们需要培养学生的团队意识,加强学生与老师之间的合作,加强与家长之间的沟通,提高他们的沟通能力。另外,我们也需要加强学生的独立性,让学生学会独立思考,学会和老师、家长进行沟通,培养其独立性。
  此外,在日常的工作中,我们也要为学生提供适当的机会和机会,让学生多接触社会、多参加社会活动,加深他们对社会、学校的认识,培养他们主动、积极和创新的精神。
  最后,我们还需要重视学生在实习中出现的问题,尤其是学生缺乏合作,有依赖心理,不懂得分享,有拖延行为等,这些学生应该引起我们的重视,制定合理的改进措施,改善这些问题。 技术与训练过程
  ChatYuan是在PromptCLUE基础上进一步训练获得的模型。它去掉了文本理解、信息抽取类任务,加强了问答、对话和各种生成式任务的学习和训练;
  针对多轮对话容易受到上下文的干扰,加入了抗干扰数据使得模型可以在必要时忽略无关的上下文;加入了用户反馈数据的学习,使得模型不仅具有一定的通用语言理解能力、特定任务上的生成能力,也能更好的响应用户的意图。
  PromptCLUE的学习过程
  三大统一:统一模型框架(text-to-text),统一任务形式(prompt),统一应用方式(zero-shot/few-shot)(T0)
  大规模预训练:在t5-large版基础上,使用数百G中文语料,训练了100万步,累积训练了1.5万亿个中文字词级别token
  大规模任务数据:使用了16种任务类型,数百种任务,累积亿级别任务数据
  混合预训练:一方面将下游任务作为预训练语料,另一方面将下游任务和预训练语料一起训练,减少任务灾难遗忘以及缩短预训练和下游任务的距离,更好的适应下游任务(ExT5)
  混合采样:针对众多数据量差异极大的任务,采用在每个训练batch内对所有的任务进行按照比例采样,根据任务的数据量进行平滑采样,并且同时限制任务数据量采样池的上限。平滑采样可以减少任务训练有偏危害,在每一batch内训练可以减少异质任务之间训练负迁移的情况(T5)
  分阶段训练:一方面指在预训练分阶段,涉及训练序列长度的分阶段(128和512),加快预训练速度(Bert);另一方面,在下游训练分阶段, 涉及学习率和序列长度的变化以及递减式对下游任务的数据量限制,更好的适应下游的不同任务。
  增加语言模型的训练:参考t5.1.1, 除了使用Span Corrpution构建的方式进行无监督训练,同时在使用prefix LM的方式训练,增强生成任务的能力(LM adapted)
  增加对模型的encoder以及decoder的训练:根据下游任务数据分别构建Data_text,Data_target预训练数据语料,加入到预训练中,分别增强模型的encoder理解能力和 decoder的生成能力(见UIE)
  重新构建模型中文字典:使用sentencepiece上在千亿token上学习并构建模型字典,更加符合中文语言习惯
  后续工作
  目前版本可以进行问答、对话和各种创意性写作或文本生成,相对于线上的版本,它的意图理解和生成能力在一些场合还有比较大的提升空间;它也还不能较好实现推理或复杂的任务。之后,会根据反馈进一步改进现有版本。

缺点浮出水面,卢总也有犯错的时候?RedmiK60实测找答案!RedmiK60系列发布以后,全网几乎都是一片好评,但新机真的没有任何缺点吗?经过一段时间实测体验发现,原来K60系列也有遗憾,卢伟冰打造手机时犯了一个大错,希望下一代改正。上手K如何让你的亲人能,始终追踪并知道,你是安全的?我的生活也是头条如果,你有苹果手机,或者是自带谷歌地图手机的朋友,本文将告诉你,Google地图如何让您的亲人始终知道您的安全三分钟阅读与您所爱的人分享您的行踪,让他们知道您是安全破解资源短板困局!铁矿石保供应如何?来源矿业界铁矿石作为国家战略矿产资源,对维护钢铁产业链供应链安全有压舱石作用。近日,由冶金工业规划研究院主办的2022(第十一届)中国钢铁原材料市场高端论坛聚焦高质量建设钢铁产业链买在无人问津处!!!如图,M2(可以理解为社会的总资金,包含定期和活期存款)同比增速已经超过2020年疫情开始时的增速,说明现在市场不差钱,但是为什么房价股市等各类资产还在低步呢?再看下图,社融图,社国产手机,焦头烂额的一年作者王珊来源商业人物(IDbizleaders)壹2022,是一个特殊且不平凡的一年。无论其他人是否会怀念2022,至少国产手机大佬不会。这一年,黑天鹅和灰犀牛事件此起彼伏,一众国事关你的钱袋子!这件事,年底前别忘了距离2022年结束还有几天,你的2023年度个人所得税专项附加扣除确认了吗?专项附加扣除可在个税税前扣除,相当于少交了一笔税。根据政策规定,专项附加扣除信息需要在每年12月进行确认10胜2负!联盟第一!王朝终结者果然犀利,超级豪阵要东山再起本赛季,篮网队76人队勇士队和快船队,这四支球队都拥有一套非常强大的冲冠阵容。篮网和76人两支球队开赛战绩都不好,两支球队分别当过东部倒数第二和倒数第一。但是,现在篮网队重返东部前新民快评出去浪,还要悠着点慢慢来12月26日,国家卫健委发布关于对新型冠状病毒感染实施乙类乙管的总体方案(以下简称总体方案),其中优化了中外人员往来管理,取消入境后全员核酸检测和集中隔离。昨天(27日),国家移民满脑子天真想法的人,在社会上吃点苦头也是好事命运是在事后回顾的东西,不是事先知道的东西。后来我不再去谈论理想和现实,因为我相信对于真正优秀的人来说,他们是一样的。把自己交给他人的眼光去评判,正是产生不安和怀疑的根源。也许一个2个级别拳王比沃尔是个坏男人,他将剁碎贝特比耶夫本月入选国际拳击名人堂的前2个级别世界冠军蒂莫西布拉德利,对WBA轻重量级拳王德米特里比沃尔赞不绝口。布拉德利观看了比沃尔今年11月战胜吉尔伯托拉米雷兹的比赛,对他印象深刻。赛前,患前列腺炎的男人,通常有5个表现,早知早好男性的前列腺是身体非常重要的一个器官,前列腺的健康事关男人的生活是否幸福,因为前列腺在人体毒素代谢和排泄方面起着重要作用,但是前列腺是一个相对脆弱的地方。许多男性年满50岁后,前列
我的搞机之路(上初中高中篇)从小学初中就喜欢研究手机,那时候手机都是父母包办(没得选,通常是手机店老板推荐,或者逛中关村临时买的),看着那梦想中的手机只能疯狂的在中关村在线,ZOL,各大论坛对比参数,和网友辩谷歌为PixelWatch智能手表推出跌倒检测功能IT之家3月1日消息,谷歌在今天发布的博文中,表示为PixelWatch智能手表推出跌倒检测功能。该手表内置的运动传感器可以通过机器学习,确定跌倒的严重程度,并提供紧急情况的处理方超测前瞻D系猎豹的好兄弟?R系7级坦歼ChiToSP加入超测!各位坦克世界的玩家们大家好,您是否查看了我们制作的开发计划前瞻R系自行反坦克炮动态物体和其他内容!视频呢?在该视频中,我们为您展示了即将加入游戏的R系自行反坦克炮,目前我们正在超测新疆21家单位7种产品上榜2022年度绿色制造名单天山网讯(记者马伊宁报道)近日,工业和信息化部公布2022年度绿色制造名单,新疆21家单位和7种产品上榜,其中20家企业入选绿色工厂,7种产品入选绿色设计产品,1家工业园区入选绿色独家美团地图业务浮出水面,已在骑手端等产品小范围上线来源Tech星球文陈桥辉Tech星球独家获悉,美团自研的美团地图已经在骑手端等产品小范围上线了,目前骑手可以切换高德和美团地图进行使用,有骑手表示,送餐到达目的地附近后,切换美团自MWC2023三星强调开放合作,与伙伴联合展示产品环球网综合报道韩国科技巨头三星在西班牙巴塞罗那举行的世界移动通信大会(MWC)上正式展出其最新产品和服务,包括GalaxyS23Ultra智能手机和GalaxyBook3Ultra阅读看世界侨界书香活动在日照侨胞之家(侨史馆)举行中国侨网2月28日电据日照侨联微信公众号消息,2月25日下午,由日照市侨联指导,五莲县侨联亿思维(日照)文化发展有限公司承办的阅读看世界侨界书香儿童英文绘本公益读书会在日照侨胞之家十年磨一剑深圳打造世界级滨海生态旅游度假区大鹏飞兮振八裔。在1月29日,深圳市高质量发展大会暨2023年首批重大项目开工仪式上,大鹏新区集中开工项目10个,总投资64亿元,吹响高质量发展的号角,奏响了先行示范的强音。而此前无缘世界足球先生,皇马巨星公开炮轰!高光1赛季,不如别人1个月2022年国际足联年度颁奖典礼目前已经落幕,在最引人关注的年度最佳球员争夺中,梅西高居第1位,他个人第7次当选世界足球先生。梅西在获奖后,外界纷纷恭喜梅西,为梅西发文喝彩。不过也有世界上投入研发经费最多的10个国家,看我国投入多少科研经费你知道世界上哪个国家在科技研究上投入的经费是最多的吗?有人可能会说是发展最强大的美国,或者是科技专利最多的日本,但事实真的是如此吗?这一次我给大家带来的就是在世界范围内,投入研发经辣个男人回来了?特斯拉CEO马斯克已重回世界首富CNMO新闻目前,马斯克掌握这多家科技公司,包括电动汽车公司特斯拉太空探索技术公司SpaceX等等。在2022年,他还以440亿美元的价格收购了海外的社交媒体公司推特。这些公司中,