专栏电商日志财经减肥爱情
投稿投诉
爱情常识
搭配分娩
减肥两性
孕期塑形
财经教案
论文美文
日志体育
养生学堂
电商科学
头戴业界
专栏星座
用品音乐

ChatGPT的崛起从GPT3,AIGC时代即将到来

  ChatGPT是个啥?
  近期,OpenAI发布了ChatGPT,是一个可以对话的方式进行交互的模型,因为它的智能化,得到了很多用户的欢迎。
  ChatGPT也是OpenAI之前发布的InstructGPT的亲戚,ChatGPT模型的训练是使用RLHF(Reinforcementlearningwithhumanfeedback)也许ChatGPT的到来,也是OpenAI的GPT4正式推出之前的序章。什么是GPT?从GPT1到GPT3
  GenerativePretrainedTransformer(GPT),是一种基于互联网可用数据训练的文本生成深度学习模型。它用于问答、文本摘要生成、机器翻译、分类、代码生成和对话AI。2018年,GPT1诞生,这一年也是NLP(自然语言处理)的预训练模型元年。性能方面,GPT1有着一定的泛化能力,能够用于和监督任务无关的NLP任务中。其常用任务包括:自然语言推理:判断两个句子的关系(包含、矛盾、中立);问答与常识推理:输入文章及若干答案,输出答案的准确率;语义相似度识别:判断两个句子语义是否相关;分类:判断输入文本是指定的哪个类别;
  虽然GPT1在未经调试的任务上有一些效果,但其泛化能力远低于经过微调的有监督任务,因此GPT1只能算得上一个还算不错的语言理解工具而非对话式AI。GPT2也于2019年如期而至,不过,GPT2并没有对原有的网络进行过多的结构创新与设计,只使用了更多的网络参数与更大的数据集:最大模型共计48层,参数量达15亿,学习目标则使用无监督预训练模型做有监督任务。在性能方面,除了理解能力外,GPT2在生成方面第一次表现出了强大的天赋:阅读摘要、聊天、续写、编故事,甚至生成假新闻、钓鱼邮件或在网上进行角色扮演通通不在话下。在变得更大之后,GPT2的确展现出了普适而强大的能力,并在多个特定的语言建模任务上实现了彼时的最佳性能。
  之后,GPT3出现了,作为一个无监督模型(现在经常被称为自监督模型),几乎可以完成自然语言处理的绝大部分任务,例如面向问题的搜索、阅读理解、语义推断、机器翻译、文章生成和自动问答等等。而且,该模型在诸多任务上表现卓越,例如在法语英语和德语英语机器翻译任务上达到当前最佳水平,自动产生的文章几乎让人无法辨别出自人还是机器(仅52的正确率,与随机猜测相当),更令人惊讶的是在两位数的加减运算任务上达到几乎100的正确率,甚至还可以依据任务描述自动生成代码。一个无监督模型功能多效果好,似乎让人们看到了通用人工智能的希望,可能这就是GPT3影响如此之大的主要原因。GPT3模型到底是什么?
  实际上,GPT3就是一个简单的统计语言模型。从机器学习的角度,语言模型是对词语序列的概率分布的建模,即利用已经说过的片段作为条件预测下一个时刻不同词语出现的概率分布。语言模型一方面可以衡量一个句子符合语言文法的程度(例如衡量人机对话系统自动产生的回复是否自然流畅),同时也可以用来预测生成新的句子。例如,对于一个片段中午12点了,我们一起去餐厅,语言模型可以预测餐厅后面可能出现的词语。一般的语言模型会预测下一个词语是吃饭,强大的语言模型能够捕捉时间信息并且预测产生符合语境的词语吃午饭。通常,一个语言模型是否强大主要取决于两点:首先看该模型是否能够利用所有的历史上下文信息,上述例子中如果无法捕捉中午12点这个远距离的语义信息,语言模型几乎无法预测下一个词语吃午饭。其次,还要看是否有足够丰富的历史上下文可供模型学习,也就是说训练语料是否足够丰富。由于语言模型属于自监督学习,优化目标是最大化所见文本的语言模型概率,因此任何文本无需标注即可作为训练数据。
  由于GPT3更强的性能和明显更多的参数,它包含了更多的主题文本,显然优于前代的GPT2。作为目前最大的密集型神经网络,GPT3能够将网页描述转换为相应代码、模仿人类叙事、创作定制诗歌、生成游戏剧本,甚至模仿已故的各位哲学家预测生命的真谛。且GPT3不需要微调,在处理语法难题方面,它只需要一些输出类型的样本(少量学习)。可以说GPT3似乎已经满足了我们对于语言专家的一切想象。GPT3存在什么问题?
  但是GTP3并不完美,当前有人们最担忧人工智能的主要问题之一,就是聊天机器人和文本生成工具等很可能会不分青红皂白和质量好坏地对网络上的所有文本进行学习,进而生产出错误的、恶意冒犯的、甚至是攻击性的语言输出,这将会充分影响到它们的下一步应用。OpenAI也曾经提出,会在不久的将来发布更为强大的GPT4:
  将GPT3与GPT4、人脑进行比较(图片来源:LexFridmanyoutube)
  据说,GPT4会在明年发布,它能够通过图灵测试,并且能够先进到和人类没有区别,除此之外,企业引进GPT4的成本也将大规模下降。
  ChatGPT与InstructGPT
  谈到ChatGPT,就要聊聊它的前身InstructGPT。
  2022年初,OpenAI发布了InstructGPT,在这项研究中,相比GPT3而言,OpenAI采用对齐研究(alignmentresearch),训练出更真实、更无害,而且更好地遵循用户意图的语言模型InstructGPT。InstructGPT是一个经过微调的新版本GPT3,可以将有害的、不真实的和有偏差的输出最小化。InstructGPT的工作原理是什么?
  开发人员通过结合监督学习从人类反馈中获得的强化学习,来提高GPT3的输出质量。在这种学习中,人类对模型的潜在输出进行排序;强化学习算法则对产生类似于高级输出材料的模型进行奖励。训练数据集以创建提示开始,其中一些提示是基于GPT3用户的输入,比如给我讲一个关于青蛙的故事或用几句话给一个6岁的孩子解释一下登月。
  开发人员将提示分为三个部分,并以不同的方式为每个部分创建响应:人类作家会对第一组提示做出响应。开发人员微调了一个经过训练的GPT3,将它变成InstructGPT以生成每个提示的现有响应。下一步是训练一个模型,使其对更好的响应做出更高的奖励。对于第二组提示,经过优化的模型会生成多个响应。人工评分者会对每个回复进行排名。在给出一个提示和两个响应后,一个奖励模型(另一个预先训练的GPT3)学会了为评分高的响应计算更高的奖励,为评分低的回答计算更低的奖励。开发人员使用第三组提示和强化学习方法近端策略优化(ProximalPolicyOptimization,PPO)进一步微调了语言模型。给出提示后,语言模型会生成响应,而奖励模型会给予相应奖励。PPO使用奖励来更新语言模型。重要在何处?
  核心在于人工智能需要是能够负责任的人工智能。
  OpenAI的语言模型可以助力教育领域、虚拟治疗师、写作辅助工具、角色扮演游戏等。在这些领域,社会偏见、错误信息和毒害信息存在都是比较麻烦的,能够避免这些缺陷的系统才能更具备有用性。ChatGPT与InstructGPT的训练过程有哪些不同?
  总体来说,ChatGPT和上文的InstructGPT一样,是使用RLHF(从人类反馈中强化学习)训练的。不同之处在于数据是如何设置用于训练(以及收集)的。(这里解释一下:之前的InstructGPT模型,是给一个输入就给一个输出,再跟训练数据对比,对了有奖励不对有惩罚;现在的ChatGPT是一个输入,模型给出多个输出,然后人给这个输出结果排序,让模型去给这些结果从更像人话到狗屁不通排序,让模型学习人类排序的方式,这种策略叫做supervisedlearning,本段感谢张子兼博士。)
  ChatGPT存在哪些局限性?
  如下:
  a)在训练的强化学习(RL)阶段,没有真相和问题标准答案的具体来源,来答复你的问题。
  b)训练模型更加谨慎,可能会拒绝回答(以避免提示的误报)。
  c)监督训练可能会误导偏向模型倾向于知道理想的答案,而不是模型生成一组随机的响应并且只有人类评论者选择好的排名靠前的响应
  注意:ChatGPT对措辞敏感,有时模型最终对一个短语没有反应,但对问题短语稍作调整,它最终会正确回答。训练者更倾向于喜欢更长的答案,因为这些答案可能看起来更全面,导致倾向于更为冗长的回答,以及模型中会过度使用某些短语,如果初始提示或问题含糊不清,则模型不会适当地要求澄清。
  来源:https:mp。weixin。qq。coms?src11timestamp1670297402ver4209signatureK2rascqO48M2JVvk1KwWV746heycx0kFllQnnZT2jYSCdbdwS5S8X6TErw1XOh3wo7kEcUzk24vfV2Wc5K0FnQnj7jp52fhjNIX8j1E9vZQ9Rf30t5QwNRukyGKnew1

北宋第一完人范仲淹的传奇人生他才华横溢,能从一个寒门孤子到千古名相,可以说是武能上马定乾坤,文能提笔安天下,让后世景仰千年。他就是范仲淹。那范仲淹究竟做了些什么,竟值得后世景仰千年呢?网图范仲淹,字希文,生于人生修行的最高境界我们活在两个世界,一个是物质世界,一个是精神物质世界。佛祖说色即是空,空即是色。啥意思呢?何为色?色,就是物质世界,一切有形物质皆为色。什么是空?空,就是灵性世界,心灵世界谓之空。人间清醒,自我治愈上班很累,总不能不上吧!挣钱很苦,总不能不挣吧!年纪越来越大,任性就少一点吧,可以做我们不喜欢的事,但要做应该做的事。性格不同,理念不同,所以圈子也不同,适合我们的圈子很小,但我们人生至美,学会取悦自己,爱生活,也爱自己作者子墨关于春天的美好,我无法用文字表达得彻底,那么多关于春天的文字,铺天盖地,就如春天的花朵,每一朵都那么美丽。也许,只是需要一份珍爱,一份深情就能表达,用心情感受数枝桃花开,就城市花园,山水暨南首届青瓦樱花节开幕2月24日,由中共诸暨市暨南街道工作委员会诸暨市人民政府暨南街道办事处主办诸暨市融媒体中心承办浙江青瓦农业开发有限公司协办的2023春季休闲旅游推介会暨首届青瓦樱花节开幕式在青瓦樱31年无性婚姻46年精神病史,丈夫因她出名她却只配以丈夫姓氏为名前言英国著名作家弗吉尼亚伍尔夫和丈夫保持了31年的无性婚姻,佣人们曾私下议论她是不是处女。这个问题用不着回答,因为在弗吉尼亚伍尔夫还是个孩子的时候,就先后被两个哥哥侵害了。1941合影从无败绩,让圈内女人黯然失色的同框杀手,梅婷的美被低估了娱乐圈拍照有这么一个定律,那就是不找李小冉和梅婷合影,前者是因为白的出众,后者则是单拍一般,合影却从未输过,不论是多美的女明星,站在梅婷的身边都会黯然失色!早年时候的梅婷曾经与章子难怪女人不穿小白鞋了,今春开始流行淑女鞋,优雅舒适又显高当初人手一双的小白鞋,现在早就已经过时了,如果在2023年,你还想要穿出独一无二的风格,并且不想让自己的造型烂大街的话,那么就一定要开始尝试淑女鞋,不仅会显得造型更加优雅时髦,而且途牛于敦德乡村民宿值得长期做下去中国商报(记者赵熠如)2月23日至26日,世界旅游联盟湘湖对话在杭州举办。途牛旅游网首席执行官于敦德在活动期间接受中国商报记者采访时表示,随着乡村振兴基建的完善以及消费者回归田园需10万株樱花绽放台中市新社商圈粉红隧道超吸睛台中市新社商圈栽种10万株樱花,近来陆续绽放,呈现粉红色美景。(台中市府提供)近日,全台各地樱花景点几乎塞爆,而其实,台中市也有赏樱祕境。新社区沐心泉休闲农场樱花鸟森林园区栽种约有相聚福清灵石山,赴一场樱花之约又是一年春光景,福清灵石山国家森林公园里的万株樱花如约盛开,在这个春暖花开的季节里,我们一群伙伴们也从全国各地赶来福清,相聚在灵石山,赴一场樱花之约,完成与春天的约定。福清灵石山国
近3年口碑最佳的五部韩剧,黑暗荣耀排倒数,你追过哪几部?5。少年法庭豆瓣8。7主演金惠秀金武烈李星民剧情点评四星推荐吧!少一星是因为没有那种哇趣介么好看的感觉,但是属于好看的类型,聚焦少年犯罪题材挺好的。剧集抛出许多少年犯罪的问题,又给融合发展,两岸影视业未来可期作者张盼大陆影视剧狂飙三体流浪地球2等近来在台湾引发广泛关注,岛内观众对剧情和表演赞不绝口。今年春节期间,台湾也有电视台在网上24小时播放大陆古装剧甄嬛传,足足播了5轮,共有473紧急被叫停!微博之夜现场大批明星被赶特警出动警方管控各路明星齐聚上海,这是开放以后,声势浩大的一场活动。微博之夜还未开始就已经热搜不断,这次大半个娱乐圈都来了上海,汇集了各路明星。可以说各路明星齐聚,美女如云。顶流肖战王一博龚俊,新她一生有7个情人,成龙苦恋她多年!但陪她到最后的却是1只玉镯她,颜值与实力并存,是中国歌坛皇后,被人们成为一代天后。她还是中国最美的女人之一,连成龙大哥都想把她娶回家!她就是我国著名歌手邓丽君。没错,今天我们要写的是家喻户晓的邓丽君,相信大香江四大尤物有人连生3个,有人一个没生,最富有的是她!1992年,香港娱乐报纸评出香江四大尤物,分别是叶玉卿张敏利智关之琳。八九十年代,她们都光芒四射,参演了不少作品。她们当时在娱乐圈,非常引人注目。个个都是大美女,且都是性感的类型。狂飙最终boss老演员张潮62岁再得一子,大女儿现已成一线女明星阅读此文前,诚邀您点击一下关注,既方便您进行讨论与分享,又给您带来不一样的参与感,感谢您的支持。引言最近,凭借饰演电视剧狂飙中李牧一角的老年演员张潮迎来广泛关注。据了解,张潮是中国邓超犯二,是刻在骨子里的基因?邓超又又又,犯!二!了!微博之夜都看过了吧,先不急,来看看场外情况。这样貌似躲避地震的场面,真的让人感受到了,微博之夜,来参加的明星之多,之广。能到现场看到自己的偶像,并能与之互动从爆红到人间蒸发,李晨的失败是否预示着娱乐圈的无情?头条创作挑战赛近日,李晨的一张照片在网络上疯传,照片中的他衣衫褴褛满脸憔悴,让人不禁想起多年前的陈小春和郭富城,被媒体拍到的垮掉样子一度震惊全国。这一次,轮到了李晨,让人不禁感慨娱双视角组排教学哪里亮了点哪里,高渐离玩法!大家好,我是菜狗老柠萌给各位推荐一套双排可玩的阵容本次阵容推荐就是我们的高渐离鬼谷子希望各位看完可以玩的开心。技能上高渐离并没有什么太难理解的,我精简了一下技能。各位随意看看,加深中国古代兵役制度专题系列论唐代府兵制为何衰败腐朽前言本专题系列的开创以配合广大军事,历史爱好者简单,生动,全面的了解中国古代兵役制度为目的,个人看法欢迎评论区讨论。灵光一闪来自敦煌壁画中的唐军上篇笔者讲到唐代的兵役制度在唐朝中后中国人保去年净利润同比增长12。8,大个险营销员人数减少近五成界面新闻记者吕文琦界面新闻编辑3月24日晚间,中国人民保险集团(中国人保,601319。SH01339。HK)披露的2022年年报显示,去年实现保险业务收入6258。09亿元,同比
友情链接:快好找快生活快百科快传网中准网文好找聚热点快软网