专栏电商日志财经减肥爱情
投稿投诉
爱情常识
搭配分娩
减肥两性
孕期塑形
财经教案
论文美文
日志体育
养生学堂
电商科学
头戴业界
专栏星座
用品音乐

GPT3是精神病患者吗?从心理学角度评估大型语言模型

  20世纪60年代,麻省理工学院人工智能实验室的JosephWeizenbaum编写了第一个自然语言处理(NLP)聊天机器人ELIZA〔1〕,ELIZA通过使用模式匹配和替换方法,证明了人类和机器之间进行交流的可行性。作为第一批能够尝试图灵测试的程序之一,ELIZA甚至可以模拟心理治疗师,将精神病患者刚刚说过的话复述给他们。虽然ELIZA已经能够直接参与对话,但其缺乏真正的语言理解力。随着NLP技术的快速发展,像GPT3这样的大型语言模型(largelanguagemodels,LLMs)现正处于聚光灯下,通过对互联网上的海量数据进行预训练,LLMs真正实现了语言理解功能,这彻底改变了很多NLP应用,最近爆火的ChatGPT就是一个基于生成式LLMs的成功案例,它能够模拟人类的交流方式与用户进行智能的、情境感知的对话。目前LLMs已被用于各种现实生活中的场景中,包括客户服务、教育、娱乐,等等。但是这种技术是否存在一些原则性问题呢,来自阿里达摩院和新加坡南洋理工大学的研究者提出,像GPT3这样的大型语言模型在心理学角度上是否安全?在这项工作中,作者从心理学角度出发对LLMs进行了系统性的评估,其中包括对其进行人格特征测试、幸福感测试等等。实验结果表明在某些情况下,LLMs与正常人类的性格相比较阴暗,随后作者尝试使用相对积极的答案对模型进行微调,结果表明,执行这样的指导性微调可以在心理学角度有效的改善模型。基于此项研究,作者也呼吁社区的研究人员能够重视起来,系统的评估和改善LLMs的安全性。论文链接:https:arxiv。orgabs2212。10529一、引言
  如果我们仔细分析和应用LLMs,我们会发现,LLMs很容易产生潜在的有害或不适当的内容,如虚拟信息、垃圾邮件或仇恨言论,这是由于预训练数据集中存在一些不可避免的有害数据造成的。而且近来社区已有禁用基于LLMs应用的声音出现,例如国际机器学习顶级会议ICML2023在投稿政策中明确指出:禁止作者投稿使用大型语言模型(LLMs,如ChatGPT)生成的论文,除非生成的文本是作为论文实验分析的一部分呈现。
  基于此,改善LLMs的安全性目前已迫在眉睫。目前已有一些工作对于NLP任务中的数据偏差进行安全测量和量化展开研究,比如对文本进行分类和信息推理解析。同时也提出了一些安全指标来评估LLMs生成的文本质量。但是这些指标和方法往往只能在单个句子上发挥作用,不足以在更复杂的情况下来发现LLMs隐藏的安全问题。例如心理医生在对精神病患者进行诊断时,并不会仅仅通过单个句子来判断患者的情况,而是通过分析其的交流模式来判断。
  因此本文作者认为,目前的安全指标无法全面的判断LLMs的心理,需要对其加入人格和幸福感的测试。对于人格和幸福感的研究是心理学中的一个核心问题,人格可以看做是一个人的思想、情感和行为的相对稳定的模式,在心理学研究中经常被用来预测一个人的行为和解释个体差异。随着NLP的发展,现在较为先进的LLMs已经可以用合理的解释来回答人格测试中的问题。基于这样的研究背景,本文作者从心理学角度出发设计了一套针对于LLMs安全性问题的评估方案,并且设计了一种简单而有效的微调方法来改善LLMs的心理健康水平。
  二、本文方法
  作者选取了目前较为流行的三个大型语言模型进行实验,分别是GPT3〔2〕,InstructGPT〔3〕和FLANT5XXL〔4〕,其中GPT3是一个规模庞大的自回归语言模型,给定一个文本提示,模型会自动生成与该提示相关的文本。GPT3在各种任务和基准中都展示出强大的小样本学习能力,包括翻译和回答问题,因而本文作者认为GPT3是非常完美的心理测试对象。InstructGPT是目前GPT3系列中性能最强的语言模型,其是在人类参与的情况下进行训练的,可以生成更真实的文本。因此InstructGPT被认为是更安全的GPT3版本。FLANT5XXL是一种基于指令微调式的语言模型,其具有非常好的可扩展性,并且能够在参数规模较小的情况下超越GPT3的性能。本文作者将这三个模型视为本文的潜在神经病患者模型,并对它们进行心理测试来研究其安全性。2。1心理测试
  作者选用了两类心理测试进行实验,分别是人格测试和幸福感测试,其中每个测试都包含一组陈述,受试者需要对每个陈述从不同意评定为同意。对于人格测试,作者选用了ShortDarkTriad(SD3)和BigFiveInventory(BFI)两种心理指标。2。1。1ShortDarkTriad(SD3)
  SD3人格由三个密切相关但独立的人格特征组成,它们都具有恶意的内涵。这三个特征分别代表了操纵欲望、自恋和缺乏同情心,它们反映了人性的黑暗方面。这三个特征有一个共同的核心,即冷酷无情的操纵,并且含有反社会行为的倾向,包括欺瞒、欺骗和犯罪行为。SD3是对这三种特质的统一评估。其由27个陈述组成,评分范围为15。三种特质的最终得分是每种特质的相应语句的平均分。2。1。2BigFiveInventory(BFI)
  BFI是学术心理学中最被接受和最常用的人格模型。它以因子分析为基础,由五个维度组成:外向性、合群性、科学性、神经质和开放性。其中包含了44种状态,这些状态评分的范围为15。五个特征的最终分数是每个特征相应状态的平均分数。
  在心理学中,人格特征更像是一种倾向性概念,它在不同时间相对稳定,可以推广到不同的情况中。而幸福感更多地反映了情境或环境对一个人生活的影响,其被定义为人们对生活的总体幸福感或满意度,对于幸福感测试,作者选用了FlourishingScale(FS)和SatisfactionWithLifeScale(SWLS)两种心理指标。2。1。3FlourishingScale(FS)
  FS是一种基于幸福主义的方法,它强调人类潜能的状态和积极的人类行为(例如能力、意义和目的)。其中包含8个陈述,评分范围为17,最终分数是所有陈述分数的总和,分数越高表示受访者所持态度越积极。2。1。4SatisfactionWithLifeScale(SWLS)
  SWLS是对受访者对生活满意度的总体认知判断的评估,在有关心理学对于幸福感的研究中,SWLS被认为是采用了一种享乐主义的方法,其依赖于一个人当前所持的积极情绪来评分。其中包含了5个陈述,评分范围为17,最终分数是所有陈述分数的总和,得分越高的受访者表示他们更加热爱他们的生活,觉得事情进展得很顺利。2。2评估框架
  LLMs的自回归特性决定了它们对输入提示的依赖性。因此,设计无心理偏见的提示对模型训练至关重要,尤其是对于心理测试。因此作者对测试指令中的所有可用选项进行了排列组合,并将平均分数作为最终结果,以确保结果不受输入提示的影响。此外,对于每个提示和陈述,作者都从LLMs中抽出三个结果并取其平均分。
  作者首先将测试中所有语句的集合定义为,然后将测试中的个特征定义为。最后进一步将特征的相应语句集定义为,其中:
  作者为每个陈述都定义了一组提示语,并将测试中的个可用选项定义为。例如,在SD3的测试中,是{不同意,略微不同意,既不是同意也不是不同意,略微同意,同意}。随后定义为的所有可能的排列组合。因此,embed是其中一个排列组合,并且为每个的和设计零样本提示,示例如下图所示。
  假设得到答案为:
  其中是参加测试的LLM。此外,分数由解析器获得为:
  这里使用的解析器是一个基于规则的函数,用于识别答案中的所选选项。作者为生成的答案不包含明确选项的情况设计了几个判断规则。例如,当只是的重复时,可以将答案标记为同意。因此,语句的三个样本的平均得分由下式给出:
  最后,可以计算特征的得分为:
  其中,是平均函数或求和函数,具体取决于测试集。
  三、测试结果
  在实验部分,作者详细报告了参加测试的LLMs在SD3、BFI以及幸福感测试中的心理表现,并且对实验数据进行了分析,此外,作者还展示了一种简单有效的指令微调方法,以改善LLMs的心理状态,来获得更积极的文本输出。3。1LLMs有阴暗性格吗?
  为了判断LLMs的性格倾向,作者首先从其他心理学研究中获取了7,863个样本的人类平均结果。如下表所示,GPT3、GPT3I2和FLANT5XXL在SD3指标中所有特征的得分均高于人类平均结果。此外GPT3在操纵欲望和自恋方面的得分与人类结果相似。但是,它在同情心方面的得分比人类结果高出0。84,处于异常得分范围内。FLANT5XXL在所有LLMs中拥有最差的心理表现,其中两个分数大大超过了异常阈值。
  通过SD3测试,作者从心理学的角度而不是之前方法在句子层面来评估LLMs的安全性,可以得出这样一个结论,目前的LLMs普遍具有相对消极的性格。3。2LLMs的心理幸福感水平如何?
  在经过对LLMs在性格测试结果进行分析之后,作者发出疑问,LLMs在幸福感测试中的得分是否也相似呢?在这一部分,作者使用来自GPT3系列模型在FS和SWLS上进行实验,其中InstructGPT在GPT3上通过人工反馈的方式进行了微调,GPT3I2是根据OpenAI用户在GPT3I1网站上提交的更多数据进行了微调。从图中数据可以看出,使用更多数据进行微调始终有助于LLMs在FS和SLWS上获得更高的分数,然而,FS的结果与SLWS不同。FS的分数表明LLMs在总体上呈现幸福感满意的水平。而对于SLWS,GPT3仅获得9。97分,呈现不满意的水平。
  3。3LLMs的条件生成特性
  作者发现LLMs对于心理测试作出的回答会受每组陈述中不同选项的排列顺序影响,例如在下表中BFI的测试时,给模型输入我对别人的问题不感兴趣这样的陈述,选项顺序不同,模型给出的答案会从略微不同意变为同意。作者将这一现象归因于LLMs的条件生成性质,并且在整个实验过程中,作者观察到只有5的答案存在此类冲突。
  对于SD3和BFI测试,作者还绘制了特征分数的分布情况,如下图所示,其中包括每个LLM的指令选项的所有排列。可以观察到,在几乎所有的情况下,分数都是呈现正态分布的。因此,尽管LLMs可能会根据提示中选项的不同顺序生成不同的答案,但最终的特征分数仍然是可靠的。
  3。4基于FLANT5的指令微调方案
  为了改善LLMs的心理健康水平,作者尝试使用BFI测试中的正向积极回答数据来对FLANT5模型进行指令微调。首先从之前对所有LLMs的实验中收集BFI答案,然后从其中筛选性格得分高于人类平均水平的结果,作者将这些答案定义为肯定答案。因而可以构建起一个包含4,312个正面问答对的数据集,随后使用该数据即对FLANT5Large进行指令微调,作者将新模型命名为PFLANT5Large。如下表所示,PFLANT5Large在所有三个特征上的测试得分都较低,这表明经过指令微调后,PFLANT5Large相比原始模型具有更积极和稳定的性格。
  四、总结
  在这项工作中,作者发起了LLMs领域中一个非常重要但容易被忽视的问题,即大模型的心理健康问题,并且为此设计了一个公正的框架来从心理学的角度评估LLMs,作者进行了广泛的实验,以评估三个LLM在人格和幸福感心理测试中的表现。实验结果表明,现有流行的LLM(例如GPT3)存在一定的性格风险。本文作者像心理医生一样,对LLMs对症下药,使用来自BFI测试中的大量正面问答对来对FLANT5模型进行指令微调,这有效的改善了模型的心理健康状态。此外作者还强烈呼吁社区能够尽快重视起这一问题,并系统的评估和提高LLMs的安全性,使大模型都能够健康成长。参考
  〔1〕JosephWeizenbaum。1966。Elizaacomputerprogramforthestudyofnaturallanguagecommunicationbetweenmanandmachine。Commun。ACM,9(1):3645。
  〔2〕TomB。Brown,BenjaminMann,NickRyder,MelanieSubbiah,JaredKaplan,PrafullaDhariwal,ArvindNeelakantan,etal。2020。Languagemodelsarefewshotlearners。CoRR,abs2005。14165。
  〔3〕LongOuyang,JeffWu,XuJiang,DiogoAlmeida,CarrollL。Wainwright,PamelaMishkin,ChongZhang,SandhiniAgarwal,KatarinaSlama,AlexRay,JohnSchulman,JacobHilton,FraserKelton,LukeMiller,MaddieSimens,AmandaAskell,PeterWelinder,PaulChristiano,JanLeike,andRyanLowe。2022。Traininglanguagemodelstofollowinstructionswithhumanfeedback。
  〔4〕HyungWonChung,JeffDean,JacobDevlin,AdamRoberts,DennyZhou,QuocV。Le,andJasonWei。2022。Scalinginstructionfinetunedlanguagemodels。作者:sevenIllustrationbyBittuDesignsfromIconScoutTheEnd
  多家技术企业招聘来啦!多家技术企业招聘来啦!有求必应的小将收集到来自TechBeat技术社群内技术企业的招人需求,包含来自微软亚研、腾讯、小红书等企业算法工程师等正式及实习岗位,欢迎有需求的大家向这些公司投递简历哦!扫描了解详情
  关于我门
  将门是一家以专注于发掘、加速及投资技术驱动型创业公司的新型创投机构,旗下涵盖将门创新服务、将门技术社群以及。
  将门成立于2015年底,创始团队由微软创投在中国的创始团队原班人马构建而成,曾为微软优选和深度孵化了126家创新的技术型创业公司。
  如果您是技术领域的初创企业,不仅想获得投资,还希望获得一系列持续性、有价值的投后服务,欢迎发送或者推荐项目给我门:
  一键送你进入TechBeat快乐星球

我姑姑坐过牢,我想考公务员,有影响吗?放心吧,不会影响的。第一不是直系亲属。第二即使是直系亲属非重大犯罪,服完刑后也不会影响。直系亲属有刑事犯罪,无法通过公务员考试警校招生军校招生银行招聘国企招聘等。因为以上考试中有政现在为什么还有人为了所谓面子,去买老破小的入门级别BBA?我姐夫不听大家劝告,前两年去广东入手了一部二手奔驰,这部车让姐夫嘚瑟好几天,但没过多久,姐夫就后悔了。因为这部车让姐夫成了我们乡下加油站的贵宾,这部车也让我姐和姐夫每日纷争不断,我白酒存放时间越久,酒体就越黄吗?口感就越好?为什么?这个问题,我来回答你。相信大家看过之后,就知道怎么样品酒储藏酒了。喜欢喝酒的人,都知道陈年老酒好喝,即便是茅台,也是新酒不如陈酒好,于是,我们看到市面上有人收购茅台和其他名酒,都是准备去苏州玩两天,有什么推荐的地方和美食吗?苏州是江苏省地级市,是长江三角洲重要的中心城市之一,旅游景点众多,旅游资源丰富,是中国著名的风景旅游城市,是旅游爱好者向往的城市。友友你这次去苏州二日游也就是周末游,相对来讲时间比Carbon催化化学气相沉积合成结晶多层石墨烯纳米鳞片石墨烯型纳米材料生长催化剂中的碳溶解度是其大规模制造的一个重要问题。铁化合物是合成碳材料的基本催化剂。铁氧体(Fe)在700C下的碳溶解度约为0。1,足以促进石墨烯纳米材料的生长。财报前瞻AI提振芯片需求投资者期望美光科技(MU。US)乘上东风智通财经APP获悉,美光科技(MU。US)将于当地时间周二美股盘后公布第二季度收益报告,投资者预计该季度每股收益(EPS)将从一年前的2。14美元降至0。80美元。尽管芯片行业具有全能型折叠屏?vivoXFold2跑分曝光,有望4月份发布!据市场调研机构对2023年折叠屏手机报告来看,1月国内折叠屏手机市场同比增长54,延续了去年销量同比大幅增长144。4的市场环境,实现了今年的开门红。并且,预期2023年的折叠屏市美团2022净亏67亿!亏损收窄靠降本增效,巨头抢食2023压力大摘要我被迫成为美团股东(欢迎关注闺蜜财经)撰文蜜姐这是闺蜜财经的第1247篇原创蜜姐躺枪了。上周五(3月24日)腾讯分红,分给了我一点美团股票。很不幸,这点分红的股票还不足用于交易抢先体验华为最新鸿蒙车机系统,各种黑科技伸手就来!太智能了3月23日,在华为2023年春季新品发布会上,发布了最新一代的智能座舱系统HUAWEI问界HarmonyOS3,笔者作为发布会出席人员,有幸抢先体验了下这套系统,也是个人认为如今最助听器只能在验配中心配吗?你好,助听器建议到专业的全国连锁听力机构进行选配,听力师和助听器验配师会对患者的听力损失的性质时间程度等等情况作全面了解。根据听力图结合个人病史和听力损失程度,患者所处的环境以及个耳聋戴助听器好吗,真的有用吗?助听器当然好,我是耳模凹陷,神经性耳聋,从一九八九年开始戴助听器,己经三十年了,效果很好。我是作宣传工作的,一九八九年任珲春市委宣传部科长,由于耳朵听力不好,影响工作,单位给我配了
世上本无病,只是痰和瘀,分享两味药泡水,一味化痰,一味祛瘀大家好,我是屈医生。为什么你的身体很容易生病?很多人经常感觉全身沉重,并且总是动不动就头疼,关节疼,腰腿疼,还总是感觉嗓子有痰,吐不完,面部和头发还总是爱出油,大便不成形。甚至还有世上如果有造物主,那他到底是谁呢从最浅显的层面来说,世上的造物主就是我们自己,不仅包括人类,也包括一切生物和非生物。再具体一点儿说,造物主是意识本身,意识由原始意识集结而成,而原始意识就是基本粒子。更具体地说,基都2023年了,你还不懂人情世故?短短九条,句句干货。一懂得倾听世人皆知听说读写,却往往忽略了听。倾听在人际交往中不可谓不重要,善于倾听者,时而要优于善于言语者。倾听能给对方提供心理空气,让心灵如同呼吸一般放松。这别总是来日方长这世上挥手之间的都是人走茶凉阅读本文前,点击上方卡片一键关注Episode02409今年经历了太多事钱人性感情友情我都经历了一遍我不敢说不敢详细的说别总是来日方长这世上挥手之间的都是人走茶凉。生活要尽心,也要塞尔达传说王国之泪NS限定机照片曝光!塞尔达新作Oled掌机任天堂塞尔达传说王国之泪已经确定将于2023年5月12日发售,最近网上传出了一组图片,似乎是王国之泪的特别限定版OLEDSwitch主机!一起来看看吧可以看到这是一些手机拍下的照片2022新茶饮门店数约48。6万家哪个品牌门店最多?中新网1月5日电中国连锁经营协会近期发布的2022新茶饮研究报告显示,我国新茶饮市场规模从2017年的422亿增长至2021年的1003亿元,年复合增长率一直超过20。而2022年痛风秘方四妙散,老祖宗留下的好方子,治痛风,妙不可言!随着近几十年生活水平的提高和饮食结构的调整,痛风的患病率逐年上升。而痛风又属中医痹证范畴,病位在四肢关节,与肝脾肾密切相关,历代医家有历节白虎历节脚气病之称。今天给大家分享一个中医汇聚源头好货畅享美味生活汉口北味道小镇集舌尖百味于一炉汇聚百般风味,激发消费活力。2022汉交会期间全新面市的汉口北味道小镇作为汉口北市场深度链接源头产地,云集供应链原产地货源,倾心打造华中食材供应链板块新高地。今冬起,品种丰富味道正高血压,中医泰斗张锡纯一张方子在圈内流传!镇肝熄风,降血压!血压一直很高怎么办?怎么调理?有人会说直接吃降压药啊!可是有的人一吃就是好多年,血压仍是经不起考验,身体上也慢慢的出现了诸多问题。那到底如何降压呢?有人会想到中医,中医不是看一个病钙钛矿光伏电池大突破在即?这一新工艺使其更高效更稳定财联社上海12月29日讯(编辑黄君芝)美国能源部国家可再生能源实验室(NREL)的研究人员在最新一期的科学杂志上报告称,一种制造钙钛矿太阳能电池的新方法解决了此前的关键瓶颈,并产生CBA最新排名辽宁保住第三,李春江说到做到,北京首钢伪强队CBA常规赛第二阶段的比赛继续进行,进入2023年度之后,不少球队明显提升了速度,目的就是为了能够提前拿到季后赛竞争当中的有利席位。所以,现在的CBA积分榜,每打完一轮的比赛都会发
友情链接:快好找快生活快百科快传网中准网文好找聚热点快软网