范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

ChatGPT开源替代来了!参数量200亿,在4300万条指令上微调而成

  #科技之巅#
  机器之心报道
  编辑:张倩
  OpenChatKit 是一个类 ChatGPT 开源工具包,内含一个 20B 参数量的大模型,而且该模型在 4300 万条指令上进行了微调。
  2023 年,聊天机器人领域似乎只剩下两个阵营:「OpenAI 的 ChatGPT」和「其他」。
  ChatGPT 功能强大,但 OpenAI 不太可能将其开源。「其他」阵营表现欠佳,但不少人都在做开源方面的努力,比如前段时间Meta 开源的 LLaMA。
  除此之外,一个名为 EleutherAI 的开源 AI 研究团队也一直在贡献开源大模型成果。自 2020 年 7 月成立以来,该团队先后开源了基于 GPT-3 的、包含 60 亿参数的 NLP 模型 GPT-J,类 GPT 的27 亿参数模型 GPT-Neo,以及 200 亿参数的GPT-NeoX-20B。据悉,他们的最终目标是将开源模型的参数规模扩展到 1700 亿左右,就像 GPT-3 一样。
  在 ChatGPT 火遍全球之际,EleutherAI 的这些开源成果派上了用场。一家名为 Together 的组织表示,他们基于 EleutherAI 开源的 GPT-Neo 和 GPT-J 构建了一个新的类 ChatGPT 开源项目 ——OpenChatKit。
  项目链接:https://github.com/togethercomputer/OpenChatKit
  这个项目提供了一个强大的、开源的基础,可以为各种应用创建专门和通用的聊天机器人。具体来说,它包含: 一个参数量达 20B 的开源模型,该模型基于 EleutherAI 的 GPT-NeoX-20B,在 4300 万条指令上进行了微调; 一个参数量达 60 亿的审核模型(moderation model),可以帮模型过滤不当内容; 一个可扩展的检索系统,可以帮模型检索维基百科等资源库,从而给出最新信息。
  根据 Together 提供的链接,我们可以粗略看到 OpenChatKit 在摘要提取、问答、写作等方面的表现。以下是 Together 提供的一些 demo:
  想要深入了解 OpenChatKit 的读者也可以亲自测试。
  测试链接:https://huggingface.co/spaces/togethercomputer/OpenChatKit
  从目前的表现来看,OpenChatKit 可能还不太令人满意。但在此开源项目的基础上,社区有望构建出更加强大的聊天机器人应用。
  参数量 20B 的指令调优大模型
  GPT-NeoXT-Chat-Base-20B 是构成 OpenChatKit 基础的大型语言模型。它基于 EleutherAI 的 GPT-NeoX 模型,并通过专注于对话互动的数据进行了微调。Together 在 Huggingface 上发布了这个模型的预训练权重:https://huggingface.co/togethercomputer/GPT-NeoXT-Chat-Base-20B
  Together 的开发者将模型调整的重点放在几个任务上,如多轮对话、问答、分类、提取和总结。他们用 4300 万条高质量指令对模型进行了微调,并与 LAION 和 Ontocord 合作,创建了该模型所基于的 OIG-43M 数据集。数据集信息参见:https://laion.ai/blog/oig-dataset/
  OIG-43M 数据集示例。
  开箱即用的 GPT-NeoXT-Chat-Base-20B 为一系列广泛的自然语言任务提供了一个强大的基础。从质量上看,它在 HELM 基准上的得分比其基础模型 GPT-NeoX 高,特别是在涉及问答、提取和分类的任务上。
  在 HELM 上评估 GPT-NeoXT-Chat-Base-20B 并与 GPT-NeoX 进行比较。†表示测试包含微调语料库中的数据。
  模型长处
  OpenChatKit 有几个任务是开箱即用的,包括:
  1、将一份长的文件总结成一句话,并回答与该文件相关的问题,问答可进行多轮;
  2、从非结构化文件中提取结构化信息,如下图所示;
  3、将一个句子或段落分为不同的类别(比如情绪是积极还是消极)。
  利用 OpenChatKit 把一段长文字内容转化成图表。
  模型短板
  OpenChatKit 目前的短板包括: 基于知识的封闭式问答。该聊天机器人可能会给出不正确的结果,需要用户提供反馈; 代码相关任务。由于训练数据中没有足够多的代码,因此该聊天机器人在代码方面表现欠佳; 重复性。该聊天机器人有时会重复自己的回答,用户可以点击刷新,开始新的对话; 上下文切换。该聊天机器人不太擅长转换话题。 创意写作和较长的答案。该聊天机器人不会生成长的、有创意的文本,如论文或故事。
  针对特定任务定制聊天机器人
  在一般问答任务中,大型语言模型已经显示出令人印象深刻的能力。当为特定的应用进行微调时,它们往往能达到更高的准确率。例如,谷歌的 PaLM 在医学回答上达到了大约 50% 的准确率,但是通过添加指令支持和对医学特定信息的微调,谷歌创造了 Med-PaLM,其准确率达到了 92.6%。同样的方法也可以用于其他任务。
  OpenChatKit 提供了一些工具来为专门的应用微调聊天机器人。其开发团队正在与研究小组和公司合作,帮助他们为各种任务创建自定义模型。这些任务包括: 教育助手:在开放的教科书数据集上进行微调,创建一个聊天机器人,通过自然对话帮助各年龄段的学生了解各种主题; 金融问答:微调并利用美国证券交易委员会文件等金融数据的检索,实现金融领域的问答; 客户支持代理:利用知识库数据进行微调,创建聊天机器人,帮助终端用户分辨问题并快速找到答案。
  如何进行微调
  微调需要的操作包括 准备好你的数据集,使用指定格式的交互示例; 将你的数据集保存为 jsonl 文件,并按照 OpenChatKit 的 GitHub 文档对聊天模型进行微调; 不要忘记审核模型!在开始使用你的微调模型之前,请注意审核模型可能需要过滤的域外问题。如果有必要,准备一些调节数据并微调审核模型。
  这个过程的文档和源代码可以在 OpenChatKit 的 GitHub 链接中找到。由于 OpenChatKit 在 Apache-2.0 许可下完全开源,你可以为自己的应用或研究深入调整、修改或检查权重。
  用于实时更新答案的可扩展检索系统
  OpenChatKit 还包括一个可扩展的检索系统。有了这个检索系统,聊天机器人能够将定期更新的内容或自定义的内容,如来自维基百科的知识、新闻提要或体育比赛成绩纳入回答中。
  检索增强系统的工作流程示例。
  审核模型在必要时进行干预
  OpenChatKit 的最后一个组件是一个由 GPT-JT 微调的 60 亿个参数的审核模型。在聊天应用中,审核模型与主聊天模型同步运行,检查用户话语中是否有任何不适当的内容。基于审核模型的评估,聊天机器人可以将输入的内容限制在经过审核的主题上。当然,这个审核模型只是一个基线,用户可以根据不同的需求进行调整和定制。
  在推理过程中,开发者进行了 few-shot 分类,将用户问题分为五类。聊天机器人只在问题落入允许的分类中时才会做出回应。
  参考链接:https://www.together.xyz/blog/openchatkit

兴业银行济南分行高密花园社区支行开展防范非法集资宣传活动为持续开展好金融知识普及工作,有效抵制高息集资诱惑防范非法集资风险,切实保护金融消费者财产安全,兴业银行济南分行集中开展防范非法集资宣传活动。日前,该行下辖的兴业银行潍坊高密花园社滴滴自动驾驶卡车KargoBot首次亮相上海车展4月19日,第二十届上海国际汽车工业展览会继续举行。滴滴自动驾驶货运KargoBot首次亮相车展并举办品牌战略发布会,KargoBot负责人韦峻青博士详细介绍了KargoBot的技乐陵花园镇归雁兴产带富一方4月4日,乐陵市首家党支部领办合作社联营餐厅李蔬记手工鲜包试营业。餐厅由花园镇恭敬李村党支部领办合作社及股东共同出资40万元建设完成,食材均由合作社直供和北京小胖包子的中央食堂统一急需软柿子!迎战世界第93,国足要小心,当家前锋葡超场均0。5球对于中国球迷来说,今年6月份最好的消息莫过于此前被传得沸沸扬扬的阿根廷国家队来华,要知道这支阿根廷国家队刚刚在卡塔尔世界杯上拿下冠军,而中国则是他们此后第一次前往国外!当然本以为国首轮遭遇开门黑,却仍在搞副业,勇士下份大合同,注定与你无缘由于种子队之间的差距并不明显,所以今年季后赛西部首轮的对阵形势格外引人关注。而如果硬要挑出一组话题性最高的系列赛,大家首先想到的多半是国王vs勇士,因为在前不久结束的一场常规赛里,济南首笔绿色金融数字人民币贷款发放,投放金额300万元来源爱济南新闻客户端近日,交通银行山东省分行成功为济南市章丘区自来水有限公司发放济南市首笔绿色金融数字人民币贷款,投放金额300万元,在数字人民币贷款投放上实现济南地区单笔最大金额谁是最常用的银行APP?后疫情时代,手机银行已成为商业银行线上触客的最重要入口。那么,在头部商业银行手机银行的竞争中,谁最受消费者青睐?谁又在奋起直追呢?截至4月17日,梳理已经公布2022年年报的国有六私人充电桩安装需要什么条件?费用大概要多少?新能源汽车的普及,让越来越多车主想要在自家安装一台私人充电桩。那么安装一台私人充电桩需要满足哪些条件,具体大概要出多少费用?下面小编就为广大新能源车主整理出一份家用新能源汽车充电桩vivos17系列配置信息曝光,vivoS16低至百元抢购再抢购有消息称,vivo正在开发下一代S系列新机vivoS17系列。而该系列机型的分布情况与现款S16系列一致,将会推出vivos17es17标准版和s17Pro。预计该系列机型会在5月又白跑一趟?要孩子,看不孕,究竟需要注意哪些?看完你就明白了大夫拿着检查单皱了皱眉,之前跟你们反复强调,检查前一个星期不要行房,怎么不听呢?王丽丽和李晨脸滕地一下红了,没敢吭声。大夫看着二人局促的样子,也不好多说什么,只能叹口气把单子还给王甲秀楼皇冠上的明珠WhenitcomestoGuyng,everyoneagreesthatthesymbolparexcellenceisJiXiLu。Thishistoricbuildingwa
12!爆冷!夺冠热门倒下,对手轰无解世界波,少了张琳艳真不行正文近日结束的女甲联赛争冠组第二轮一场焦点战中,夺冠热门广州队爆冷倒下,12不敌浙江杭州女足,迎来争冠组两连败,接下来争冠难度大大增加。显而易见,广州队女足本赛季少了核心主力张琳艳男排世锦赛波兰3比2险胜美国,小组赛后再胜对手,半决赛将战巴西北京时间9月9日消息,2022年世界男排锦标赛结束14决赛较量,波兰男排苦战五局以3比2险胜美国队,继小组赛后再胜对手,巴西队以3比1战胜阿根廷队。半决赛,波兰迎战巴西,意大利迎战CBA新赛季下月打响常规赛第一阶段大概率在杭州举办北京青年报记者昨日获悉,新赛季CBA定于10月10日打响,常规赛第一阶段是赛会制,举办地大概率会在杭州。第一阶段将打9轮比赛。第二阶段拟定于12月1日开始,联赛公司将视疫情防控形势2022。09。09国防军工概念大盘分析收盘后消息面1内(1)国常会部署阶段性支持企业创新的减税政策激励企业增加投入提升创新能力(2)国家卫健委防控形势严峻复杂倡导广大群众国庆假期在本地过节(3)9月8号,采用自工程创新服务绿色低碳发展高级别研讨会举行2022年服贸会期间,工程创新服务绿色低碳发展高级别研讨会举办,国内外政产学研等领域的知名学者专家围绕工程创新服务绿色低碳发展主题,从科技革命政策支持产业发展三个维度,研讨工程如何我国期货市场对外开放再迎利好合格境外机构投资者可参与部分期货期权交易我国期货市场对外开放又有新动态9月2日,国内4家期货交易所相继发布公告,明确了合格境外机构投资者(QFII)和人民币合格境外机构投资者(RQFII)可以参与各自交易所的期货期权合约包头首富金利斌24岁靠摆地摊起家,20年狂赚25亿,44岁选择自杀2011年4月12日晚,一个男人驾驶奥迪A8直入福禾豆业。他下车从后备箱搬出几箱汽油,不管不顾地狂泼。不一会儿,奥迪车身就沾满了汽油。泼完车,男子还不尽兴,直接把汽油浇在自己身上。明晚开始,持续到春节襄阳好风日大美在襄城五场大型主题活动邀您参与9月7日,记者从市政府新闻办组织召开的新闻发布会上获悉,襄城将结合中秋节重阳节国庆节党的二十大春节等节日和重要时间节点,以襄阳好风日大美1415!丢冠三连崩,王霜留洋当陪练2次抢断2次拦截北京时间9月11日上午,美国女足顶级联赛完成了一场第18轮的比赛,中国女足一姐王霜所在的路易斯维尔竞赛再次输球了,以15惨败给了北卡罗来纳勇气,从而在积分榜上继续下跌,目前以2胜8社区杯朝阳区孙河地区中年队一起享受最纯粹的足球代表朝阳区中年组参加本届社区杯市级决赛的球队来自朝阳孙河地区,这个球队有个最大的特点就是所有球员都是土生土长的孙河人,所以大家一起踢球的年头久了,默契成为了他们最大的优势,请听记者孙悦现状,面容依旧身材却已发福,最大的遗憾或许是来自家庭看了这个夏天国家队的比赛,很多球迷无比怀念前中国男篮的后卫球员孙悦。首先,孙悦的身高有205公分。记得当时孙悦打国家队比赛的时候,担任解说的主持人说了这么一句话对方的中锋205公分