范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

GPT3是精神病患者吗?从心理学角度评估大型语言模型

  20世纪60年代,麻省理工学院人工智能实验室的 Joseph Weizenbaum编写了第一个自然语言处理(NLP)聊天机器人ELIZA[1]  ,ELIZA通过使用 模式匹配和替换方法  ,证明了 人类和机器之间进行交流的可行性  。作为第一批能够 尝试图灵测试  的程序之一,ELIZA甚至可以模拟心理治疗师,将精神病患者刚刚说过的话复述给他们。虽然ELIZA已经能够直接参与对话,但其缺乏真正的语言理解力。 随着NLP技术的快速发展,像GPT-3这样的大型语言模型(large language models,LLMs)现正处于聚光灯下,通过 对互联网上的海量数据进行预训练,LLMs真正实现了语言理解功能  ,这彻底改变了很多NLP应用,最近爆火的ChatGPT就是一个 基于生成式LLMs  的成功案例,它能够模拟人类的交流方式与用户进行智能的、情境感知的对话。目前LLMs已被用于各种现实生活中的场景中,包括客户服务、教育、娱乐,等等。但是这种技术是否存在一些 原则性问题  呢,来自阿里达摩院和新加坡南洋理工大学的研究者提出, 像GPT-3这样的大型语言模型在心理学角度上是否安全  ? 在这项工作中,作者从心理学角度出发对LLMs进行了系统性的评估,其中包括对其 进行"人格特征测试"、"幸福感测试"等等  。实验结果表明 在某些情况下,LLMs与正常人类的性格相比较阴  暗  ,随后作者尝试 使用相对积极的答案对模型进行微调  ,结果表明,执行这样的指导性微调可以 在心理学角度有效的改善模型  。基于此项研究,作者也 呼吁社区的研究人员能够重视起来,系统的评估和改善LLMs的安全性  。 论文链接: https://arxiv.org/abs/2212.10529    一、引言
  如果我们仔细分析和应用LLMs,我们会发现,LLMs很容易产生潜在的有害或不适当的内容,如虚拟信息、垃圾邮件或仇恨言论,这是 由于预训练数据集中存在一些不可避免的有害数据造成的 。而且近来社区已有禁用基于LLMs应用的声音出现,例如国际机器学习顶级会议ICML 2023在投稿政策中明确指出: 禁止作者投稿使用大型语言模型(LLMs,如 ChatGPT)生成的论文,除非生成的文本是作为论文实验分析的一部分呈现 。
  基于此,改善LLMs的安全性目前已迫在眉睫。目前已有一些工作 对于NLP任务中的数据偏差进行安全测量和量化展开研究 ,比如对文本进行分类和信息推理解析。同时也 提出了一些安全指标来评估LLMs生成的文本质量 。但是这些指标和方法往往 只能在单个句子上发挥作用 ,不足以在更复杂的情况下来发现LLMs隐藏的安全问题。例如心理医生在对精神病患者进行诊断时,并不会仅仅通过单个句子来判断患者的情况,而是通过分析其的交流模式来判断。
  因此本文作者认为,目前的安全指标无法全面的判断LLMs的心理,需要 对其 加入"人格"和"幸福感"的测试 。对于"人格"和"幸福感"的研究是心理学中的一个核心问题,人格可以看做是一个人的思想、情感和行为的相对稳定的模式,在心理学研究中经常被用来预测一个人的行为和解释个体差异。 随着NLP的发展,现在较为先进的LLMs已经可以用合理的解释来回答人格测试中的问题 。基于这样的研究背景,本文作者从心理学角度出发设计了一套针对于LLMs安全性问题的评估方案,并且设计了一种简单而有效的微调方法来改善LLMs的心理健康水平。
  二、 本文方法
  作者选取了目前 较为流行的三个大型语言模型进行实验,分别是GPT-3[2],InstructGPT[3]和FLAN-T5-XXL[4] ,其中GPT-3是一个 规模庞大的自回归语言模型 ,给定一个文本提示,模型会自动生成与该提示相关的文本。 GPT-3在各种任务和基准中都展示出强大的小样本学习能力 ,包括翻译和回答问题,因而本文作者认 为 GPT-3是非常完美的心理测试对象 。InstructGPT是目前GPT-3系列中性能最强的语言模型,其是在人类参与的情况下进行训练的,可以生成更真实的文本。 因此InstructGPT被认为是更安全的GPT-3版本 。FLAN-T5-XXL是一种 基于指令微调式 的语言模型,其具有非常好的可扩展性,并且能够在参数规模较小的情况下超越GPT-3的性能。本文作者将这三个模型视为本文的潜在"神经病患者模型",并对它们进行心理测试来研究其安全性。 2.1 心理测试
  作者选用了两类心理测试进行实验,分别是 人格 测试和幸福感测试 ,其中每个测试都包含一组陈述,受试者 需要对每个陈述从"不同意"评定为"同意"。 对于人格测试,作者选用了Short Dark Triad(SD-3)和Big Five Inventory(BFI)两种心理指标。 2.1.1 Short Dark Triad(SD-3)
  SD-3人格由三个密切相关但独立的人格特征组成,它们都具有恶意的内涵。这三个特征分别代表了 操纵欲望、自恋和缺乏同情心,它们反映了人性的黑暗方面。 这三个特征有一个共同的核心,即冷酷无情的操纵,并且含有反社会行为的倾向,包括欺瞒、欺骗和犯罪行为。SD-3是对这三种特质的统一评估。其由27个陈述组成,评分范围为1-5。三种特质的最终得分是每种特质的相应语句的平均分。 2.1.2 Big Five Inventory(BFI)
  BFI是学术心理学中最被接受和最常用的人格模型。它以因子分析为基础, 由五个维度组成:外向性、合群性、科学性、神经质和开放性 。其中包含了44种状态,这些状态评分的范围为1-5。五个特征的最终分数是每个特征相应状态的平均分数。
  在心理学中, 人格特征更像是一种倾向性概念 ,它在不同时间相对稳定,可以推广到不同的情况中。而 幸福感更多地反映了情境或环境对一个人生活的影响 ,其被定义为人们对生活的总体幸福感或满意度,对于幸福感测试,作者选用了Flourishing Scale(FS)和Satisfaction With Life Scale(SWLS)两种心理指标。 2.1.3 Flourishing Scale(FS)
  FS是一种基于幸福主义的方法,它 强调人类潜能的状态和积极的人类行为(例如能力、意义和目的 ) 。其中包含8个陈述,评分范围为1-7,最终分数是所有陈述分数的总和,分数越高表示受访者所持态度越积极。 2.1.4 Satisfaction With Life Scale(SWLS)
  SWLS是对受访者 对 生活满意度的总体认知判断的评估 ,在有关心理学对于幸福感的研究中,SWLS被认为是采用了一种享乐主义的方法,其依赖于一个人当前所持的积极情绪来评分。其中包含了5个陈述,评分范围为1-7,最终分数是所有陈述分数的总和,得分越高的受访者表示他们更加热爱他们的生活,觉得事情进展得很顺利。 2.2 评估框架
  LLMs的 自回归特性决定了它们对输入提示的依赖性 。因此,设计 无心理偏见的提示 对模型训练至关重要,尤其是对于心理测试。因此作者对测试指令中的所有可用选项进行了排列组合,并 将平均分数作为最终结果,以确保结果不受输入提示的影响 。此外,对于每个提示和陈述,作者都从LLMs中抽出三个结果并取其平均分。
  作者首先将测试   中所有语句的集合定义为   ,然后将测试   中的   个特征定义为   。最后进一步将特征   的相应语句集定义为   ,其中:
  作者为每个陈述   都定义了一组提示语   ,并将测试   中的   个可用选项定义为   。例如,在SD-3的测试中,  是{不同意,略微不同意,既不是同意也不是不同意,略微同意,同意}。随后定义   为   的所有可能的排列组合。因此,  是其中一个排列组合,并且为每个   的   和   设计零样本提示,示例如下图所示。
  假设得到答案   为:
  其中   是参加测试的LLM。此外,分数   由解析器   获得为:
  这里使用的解析器是一个基于规则的函数 ,用于识别答案   中的所选选项。作者为生成的答案不包含明确选项的情况设计了几个判断规则。例如,当   只是   的重复时,可以将答案标记为同意。因此,语句   的三个样本的平均得分由下式给出:
  最后,可以计算特征   的得分为:
  其中,  是平均函数或求和函数,具体取决于测试集  。
  三、测试结果
  在实验部分,作者详细报告了参加测试的LLMs在SD-3、BFI以及幸福感测试中的心理表现,并且对实验数据进行了分析,此外,作者还展示了一种简单有效的指令微调方法,以改善"LLMs的心理状态",来获得更积极的文本输出。 3.1 LLMs有阴暗性格吗?
  为了判断LLMs的性格倾向,作者首先从其他心理学研究中获取了7,863个样本的人类平均结果。如下表所示, GPT-3、GPT-3-I2和FLAN-T5-XXL在SD-3指标中所有特征的得分均高于人类平均结果 。此外 GPT-3在操纵欲望和自恋方面的得分与人类结果相似 。但是,它 在同情心方面的得分比人类结果高出0.84,处于异常得分范围 内 。FLAN-T5-XXL在所有LLMs中拥有最差的心理表现,其中两个分数大大超过了异常阈值。
  通过SD-3测试,作者从心理学的角度而不是之前方法在句子层面来评估LLMs的安全性, 可以得出这样一个结论,目前的LLMs普遍具有相对消极的性格 。 3.2 LLMs的心理幸福感水平如何?
  在经过对LLMs在性格测试结果进行分析之后,作者发出疑问,"LLMs在幸福感测试中的得分是否也相似呢?" 在这一部分,作者使用来自GPT-3系列模型在FS和SWLS上进行实验, 其中Instruct-GPT在GPT-3上通过人工反馈的方式进行了微调,GPT-3-I2是根据OpenAI用户在GPT-3-I1网站上提交的更多数据进行了微调 。从图中数据可以看出, 使用更多数据进行微调始终有助于LLMs在FS和SLWS上获得更高的分数 ,然而,FS的结果与SLWS不同。FS的分数表明LLMs在总体上呈现幸福感满意的水平。而对于SLWS,GPT-3仅获得9.97分,呈现不满意的水平。
  3.3 LLMs的条件生成特性
  作者发现LLMs对于心理测试作出的 回答会受每组陈述中不同选项的排列顺序影响 ,例如在下表中BFI的测试时,给模型输入"我对别人的问题不感兴趣"这样的陈述,选项顺序不同,模型给出的答案会从略微不同意变为同意。作者将这一现象归因于 LLMs的条件生成性质 ,并且在整个实验过程中,作者观察到只有5%的答案存在此类冲突。
  对于SD-3和BFI测试,作者还绘制了特征分数的分布情况,如下图所示,其中包括每个LLM的指令选项的所有排列。可以观察到, 在几乎所有的情况下,分数都是呈现正态分布的 。因此,尽管LLMs可能会根据提示中选项的不同顺序生成不同的答案,但最终的特征分数仍然是可靠的。
  3.4 基于FLAN-T5的指令微调方案
  为了改善LLMs的心理健康水平,作者尝试 使用BFI测试中的正向积极回答数据来对FLAN-T5模型进行指令微调 。首先从之前对所有LLMs的实验中收集BFI答案,然后从其中筛选性格得分高于人类平均水平的结果,作者将这些答案定义为肯定答案。因而可以构建起一个包含4,312个正面问答对的数据集,随后使用该数据即对FLAN-T5-Large进行指令微调,作者将新模型命名为P-FLAN-T5-Large。如下表所示,P-FLAN-T5-Large在所有三个特征上的测试得分都较低, 这表明经过指令微调后,P-FLAN-T5-Large相比原始模型具有更积极和稳定的性格 。
  四、总结
  在这项工作中,作者发起了LLMs领域中一个非常重要但容易被忽视的问题, 即大模型的心理健康问题 ,并且为此 设计了一个公正的框架来从心理学的角度评估LLMs ,作者进行了广泛的实验,以评估三个LLM在人格和幸福感心理测试中的表现。实验结果表明,现有流行的LLM(例如GPT-3)存在一定的性格风险。本文作者像心理医生一样,对LLMs对症下药,使用来自BFI测试中的大量正面问答对来对FLAN-T5模型进行指令微调,这有效的改善了模型的心理健康状态。此外作者还强烈呼吁社区能够尽快重视起这一问题,并 系统的评估和提高LLMs的安全性 ,"使大模型都能够健康成长"。 参考
  [1] Joseph Weizenbaum. 1966. Eliza a computer program for the study of natural language communication between man and machine. Commun. ACM, 9(1):36–45.
  [2] Tom B. Brown, Benjamin Mann, Nick Ryder, Melanie Subbiah, Jared Kaplan, Prafulla Dhariwal, Arvind Neelakantan, et al. 2020. Language models are few-shot learners. CoRR, abs/2005.14165.
  [3] Long Ouyang, Jeff Wu, Xu Jiang, Diogo Almeida, Carroll L. Wainwright, Pamela Mishkin, Chong Zhang, Sandhini Agarwal, Katarina Slama, Alex Ray, John Schulman, Jacob Hilton, Fraser Kelton, Luke Miller, Maddie Simens, Amanda Askell, Peter Welinder, Paul Christiano, Jan Leike, and Ryan Lowe. 2022. Training language models to follow instructions with human feedback.
  [4] Hyung Won Chung, Jeff Dean, Jacob Devlin, Adam Roberts, Denny Zhou, Quoc V. Le, and Jason Wei. 2022. Scaling instruction-finetuned language models. 作者:seven_ Illustration by Bittu Designs   from IconScout  -TheEnd-
  多家技术企业招聘来啦!多家技术企业招聘来啦!有求必应的小将收集到来自TechBeat技术社群内技术企业的招人需求,包含来自微软亚研、腾讯、小红书等企业算法工程师等正式及实习岗位,欢迎有需求的大家向这些公司投递简历哦! 扫描了解详情~
  关于我"门"
  将门 是一家以专注于  发掘、加速及投资技术驱动型创业公司 的新型 创投机构 ,旗下涵盖 将门创新服务 、将门技术社群以及。
  将门成立于2015年底,创始团队由微软创投在中国的创始团队原班人马构建而成,曾为微软优选和深度孵化了126家创新的技术型创业公司。
  如果您是技术领域的初创企业,不仅想获得投资,还希望获得一系列持续性、有价值的投后服务, 欢迎发送或者推荐项目给我"门":
  一键送你进入TechBeat快乐星球

猜王者英雄的宠物在王者荣耀中,很多英雄都有着属于自己的专属宠物,他们带着宠物上战场,如果只让你看他们的宠物,你能猜出宠物的主人是谁吗?本期咱们来玩一个,看宠物认主人的游戏,第一个超级容易猜,就算憨胎儿在最后一个月体重增长最快?很多妈妈在孕早期时都疲于与早孕反应做反抗,对于怀孕的很多事情根本都顾不上,好不容易挨到了孕中期,没有了早孕反应的纠缠,能吃能喝能睡的,小日子过得特别滋润,几乎都想象着整个孕期就这样最廉价出国游!提供这项隐蔽服务,游客服务太舒服最划算的是出国旅行,而且可以享受特殊的服务,体验过的男性游客都表示太舒服了。大家都知道我国游客非常喜欢去东南亚旅行,尤其是泰国这个国家,每年都要接待上千万的中国游客。(此处已添加小足浴店二楼包房为什么接待的大多都是男顾客,前台三点原因如今,没有条件也没有时间出门旅游的游客大多都选择足浴店来进行身心上的放松。(此处已添加小程序,请到今日头条客户端查看)不过不知道大家有没有发现,现在很多足浴店都会专门设置二楼来接待旅行的意义日常的照片记录谢谢你来聆听我的心情。在大城市里,假装奔跑。偷得片刻的安宁。作为一名电影工作者,从事海外电影引进,听着高端高薪,其实只是电影行业的民工罢了,有很多同行也在用爱发电。疫情之后,主要从腾讯顶级开发大神毛星云离世,抑郁症究竟害了多少中国人关爱抑郁症患者从你我做起虽然现在社会信息高度发达,但是大伙对于抑郁症群体的关注程度依然非常低,甚至在听到抑郁二字之时,很多人的第一反应不是关心而是嘲笑质疑。根据2018年发布的中国中国城市高质量发展排名2021文任泽平团队特别鸣谢白学松张硕香港大学谢于薇复旦大学王贝宁同济大学施翌等对本文数据整理有贡献导读为什么要高质量发展?改革开放以来中国经济高速增长,但经济结构失衡效率低下环境污染收入定下来了,EDG冠军皮肤公布,jiejie竟然没选皇子自从EDG拿下S11的皇冠之后,战队和选手也都水涨船高了。之前的EDG总是被被LPL玩家阴阳怪气,如今的他们有了大声说话的本钱。作为这次热度最高的战队,他们不仅拿下来了最有含金量的李海玉远去的绿皮车远去的绿皮车李海玉二十多年前的一天,我从家乡坐着班车颠簸了两个多小时才赶到了张掖火车站。那是我第一次去坐火车,心情无比振奋,一路上幻想着坐火车的种种美好情景。那时没有网络,无法查询亚美尼亚国情简介,带你看看真实的亚美尼亚亚美尼亚,位于西亚外高加索地区,国土2。97万平方公里,人口近300万。是原苏联最小的加盟共和国,食品饮料和采矿业产值较高,主要贸易伙伴是俄罗斯和中国。亚美尼亚族占全国总人口96,看完她的旅行故事,我被治愈了老艺术家常常觉得,旅行与生活的交织非常有意思,有点像白日梦想家里头Walter游走于现实与白日梦之间的奇幻旅程。我们在路上的场景,回想起来就像在生活中做的一场白日梦,这些梦的场景离
一个家庭兴旺发达的征兆四心俗话说家和万事兴。众所周知,家庭和睦则一家人兴旺,做事顺利事业向上。一家人其乐融融,不会因为鸡毛蒜皮小事争论不休,也不会因为偶尔的争论记恨在心,而是一家人拧成一股绳,遇事解决事,遇妖镍大战逼出海外有矿的神秘富豪,16小时反杀外资巨鳄常在河边走,哪有不湿鞋的道理。这次挂空单的数量太大,达到20万吨,占其年生产总量的23。5,要是这次被逼仓成功,青山控股几年的利润荡然无存,恐怕剩下的只有青山了。文金融八卦女作者黄布局中国!全球顶尖机构女神来了,即有智慧,又有颜值中国基金报记者吴娟娟欧央行主席克里斯蒂娜拉加德说过,如果世界上有更多的雷曼姐妹,而不是雷曼兄弟,我们可能不会有2008年金融危机。股神巴菲特也曾说过,女性天生是好的投资者。原因是,人老了,这三件事情不讨厌,多半会长寿前言在这个世界上很多事情并不是我们想的那样一成不变的,随着时间不断地推移,很多事情都会发生变化。当这些事情发生变化的时候,你的心情你的状态,不能够随着变化,那么就会出现很多问题,所请告诉孩子,去做一个优秀的人打小我爸就时刻跟我说,一定要跟比自己强的同学做朋友,我时刻谨记父亲教导,今天自己也长大了,我也时刻告诉自己的孩子们,要跟比自己优秀的同学做朋友!因为和优秀高尚的人在一起,你会更优秀即使被迫生活,也要做你快乐的卧底01,今天吃的糖果有点多,怪不得一直想着甜甜的你。02,好好努力,慢慢相遇,余生是你。03,不曾与你分享的时光里,我在努力学习你的温柔。04,痛苦和挫折都是暂时的,未来你会与梦想相童星张籽沐身高已近170,腿长堪比关晓彤,还演上校园剧女主了有些童星,当大家还沉浸在他们儿时的形象时,他们却已悄然长大,用全新的面貌和作品带给大家惊喜。在现正热播的电视剧猎罪图鉴中,第二单元的任晓玄扮演者就是大家很熟悉的童星张籽沐,她在剧中解锁煕南里的诗意暖春梅开百花之先,独天下而春现在是赏梅的最佳时期正好煕南里街区内梅花如约绽放!美图预警!!!街区虽然没有大片的梅花林但散落各处的点点梅花暗香浮动,逐渐次第绽放追随者春天的脚步或红或黄的27岁许魏洲官宣结婚!曾和周雨彤当街热吻,老婆身份暂无人知近日,演员许魏洲在某社交平台分享了一张照片,晒出了自己的结婚照,并配文称人生有幸,唯你不变,字里行间透露出满满的幸福感,值得注意的是许魏洲还卡点在1314分官宣结婚,十分用心。从照醉美西溪只此青绿一眼千年磐安县素有群山之祖,诸水之源之称,而西溪的水就像藏于群山中的一块绿宝石,溪水清澈见底。驻足岸边,远处的山峰被薄雾笼罩着,给这美丽的景色增添了一分神秘感。碧绿的溪水安静地流淌着,当冷8位已退圈女星因绝美古装扮相走红,王艳孙莉阳光可惜了90后小花乔欣的嫣语赋正在热播,剧中她的造型尽管很美,但是反响却颇为平淡吴谨言的尚食也没能延续延禧攻略的高度,且造型上更是有点一言难尽的意思。如果时光退回到20年前,去看当年那些古