童话说说技术创业美文职业
投稿投诉
职业母婴
职场个人
历史治疗
笔记技能
美文纠纷
幽默家庭
范文作文
乐趣解密
创业案例
社会工作
新闻家居
心理安全
技术八卦
仲裁思考
生活时事
运势奇闻
说说企业
魅力社交
安好健康
传统笑话
童话初中
男女饮食
周易阅读
爱好两性

英伟达爆火智能体研究:AI逼真还原人类情感!会饿会孤独,会跑

3月23日 老巫婆投稿
  AI智能体,竟然能反映人类的真实情感,还有人际关系中微妙的距离感?
  最近,来自英伟达、华盛顿大学、港大的研究人员发布了类人智能体HumanoidAgents。
  从名字就可以看出,这种智能体能够反映人类的基本需求。
  以往的智能体模拟,智能不完全地模仿人类行为,原因就在于,它们并没有真正反映出人类的基本需求、真实情感及人际间微妙的距离感。
  而HumanoidAgents的初衷,就是研发一个融合上述元素的、更贴近人类的智能体。
  智能体受系统1思维和系统2思维的指导,系统1思维会响应具体条件(如基本需求),而系统2思维则涉及明确的规划
  目前,论文已被EMNLPSystemDemonstrations2023接收。
  论文地址:https:arxiv。orgabs2310。05418
  从这个视频可以看出,HumanoidAgents逼真地再现了《生活大爆炸》中谢耳朵和Penny交互的有趣场景。
  正如原子、分子和细胞的计算模拟塑造了我们研究科学的方式,类人智能体的真实模拟,也成为了研究人类行为的宝贵工具。
  要知道,以往的智能体有一个缺点,它们虽然可以完成看似可信的行动,但跟真实的人类思维方式并不像。
  绝大多数人类,并不会提前制定计划,然后在日常生活中精确到一丝不苟地执行这些计划。
  为了减轻这个缺点的影响,研究者从心理学中汲取了灵感,提出了HumanoidAgents。
  心理学家Kahneman认为,人类有两个互补的思维过程:系统1(直觉的、轻松的、即时的)和系统2(逻辑的、有意的、缓慢的)。
  而这次研究者提出的HumanoidAgents,就引入了系统1所需的三个要素基本需求(饱腹感、健康和能量)、情感和关系亲密程度,来让智能体表现得更像人类。
  利用这些元素,智能体就能调整自己的日常活动,以及和其他智能体的对话。
  而且,智能体也会像人一样,遵守马斯洛需求理论。
  如果它们没有与他人充分地互动,它就会感到孤独;如果没有保持健康,就会得病;如果没休息够,就会感到疲劳。
  如果仅靠系统2的规划,就可以让智能体规划休息时间,满足基本的需求。
  然而如果没有系统1的反馈,智能体即使感到疲倦,也无法在下午3点小憩,因为就寝时间安排在午夜。
  而如果智能体感到愤怒,它就需要干一些能发泄情绪的事情,比如跑步或冥想。
  并且,智能体之间的关系密切程度,也会影响它们之间互动的方式。
  社会大脑假说提出,我们的认知能力很大程度上是为了追踪社会关系的质量而进化的。
  这就意味着,人们经常根据与他人相处的感觉和亲密程度,来调整与他人的互动。
  为了更好地模仿人类,研究者让智能体能够根据彼此之间的距离,来调整对话。
  他们提出了一个平台,可以在生活大爆炸、老友记、LinFamily中模拟人形智能体的行为,然后用UnityWebGL游戏界面将它们可视化,并使用交互式分析仪表板,显示智能体随时间变化的状态。
  实验证明,对于系统1各方面的变化,HumanoidAgents都可以有效响应并推断。
  而且,这种系统还可以扩展到更多方面,比如个性、道德价值观、同理心、乐于助人、文化背景等等。
  工作原理
  HumanoidAgents中,研究人员采用了OpenAI的ChatGPT3。5。
  第1步:根据用户提供的种子信息初始化Agent。
  简单说,就是每个Agent的人物设定,它们的名字、年龄、日程、喜好等,对其做出人物规划。
  比如,JohnLin是一个WillowMarket的药店店主,喜欢帮助他人,特点是友好和善良。
  此外,HumanoidAgents的默认情绪被设置为7种可能的情绪:愤怒、悲伤、恐惧、惊讶、高兴、中立和厌恶。
  第2步:Agent开始计划自己的一天。
  第3步:Agent根据自己的计划采取行动。如果同在一个地点,Agent可以相互交谈,进而影响他们之间的关系。
  Agent日计划以1小时为间隔,能够递归地分解计划,然后,以15分钟为间隔,来改进活动随时间的逻辑一致性。
  每15分钟,Agent在它们的计划中执行一项活动。
  不过,Agent可以根据内部状态,即情绪和基本需求,的变化更新计划,或做补充。
  比如,如果Agent目前非常饥饿,但计划是在3个小时后吃一顿饭。
  这里,Agent可以在继续当前活动的同时,吃点零食,这就特别像打工人,开饭前可能发生的行为。
  那么,这些Agent过利用情感和基本需求状态,以及与其他Agent亲密关系,将其转换成自然语言描述,进而决定如何与Agent相处。
  在对话结束时,每个Agent将通过对话历史,来确定自己是否享受对话。
  如果是这样,它们与其他Agent的亲密度将增加一倍,否则,亲密度将减少一倍。
  从亲密关系逐渐改变,可以映射到人与人之间的关系如何随着时间的推移而发展。
  此外,谈话历史也用来来确定Agent的情绪是否受到谈话的影响。
  第4步:Agent评估所采取的行动是否改变了他们的基本需求和情绪。
  第5步:根据基本需求和情感的满足情况,Agent可以更新未来的计划。
  除了默认的五种需求(饱腹感、社交、健康、娱乐和能量)之外,还可以为Agent添加删除更多的基本需求。
  为此,用户需要按照以下格式,创建自己的defaultagentconfig。json文件:
  {:,:5,:,:,:0。05,:from0to10,0increasesordecreasesby1}
  基本需求对活动的影响
  HumanoidAgents是一个动态系统,由许多组成部分组成,因此将每个基本需求对Agent活动的影响分离出来是一个挑战。
  为了调查每个基本需求的贡献,研究人员模拟了一个Agent的世界。
  这些Agent最初有一个基本需求设置为0,让Agent在一天开始时,极度饥饿、孤独、疲劳、不适或无聊。
  作者研究了在一个模拟的一天中,Agent为了满足基本需求而进行活动花费的时间。比如,为了克服饥饿而吃食物,为了缓解孤独而进行社交活动。
  然后,研究人员将其与Agent在正常情况下(每个基本需求设置为5,能量设置为10)执行此类活动所花费的时间,进行比较,从而,计算出在测试条件下,用于满足每种基本需求所花费时间的增加百分比。
  如下表所示,当健康(156)、能量(56)和饱腹感(35)等基本需求被初始化为0时,HumanoidAgents对其活动的适应程度最高。
  马斯洛将它们归类为低层次的生理和安全需求,人们在满足其他需求之前需要先满足这些需求,这证明了其重要性。
  在这种情况下,行为主体通常会看病、休息、觅食等等。
  另一方面,当Agent因缺乏社会交往而感到孤独时,它们只会稍微调整自己的行为(12),与其他Agent进行更多的交流。此外,Agent社交和娱乐活动变化较小的另一个原因是:正常情况下,行为主体已经花费大量的时间,来做满足这些基本需求的活动。
  平均而言,它们花费11个小时做自己喜欢的事,8。75个小时用于社交互动,只有5。75个小时用于休息,2。75个小时用于吃饭和做一些改善健康的事情。
  这意味着,一开始将娱乐或社交设置为0的效果,在一天中很早时候消失,取而代之的是其他优先事项,包括工作义务,比如Penny在芝士蛋糕坊工作。
  情绪对活动的影响
  这里,作者研究了在一天的模拟中,Agent进行表达每种情绪的活动的次数(间隔15分钟)。
  例如,当Agent生气的时候,会跑步来发泄愤怒;当伤心的时候,会寻求一个值得信赖的朋友的倾诉;当厌恶的时候,会练习深呼吸和冥想;当感到惊讶的时候,会花时间来处理和思考这些令人惊讶的发现。然后,研究人员计算Agent在正常设置中,执行此类活动的次数的差值。
  在正常情况下,Agent通常不会表现出悲伤、愤怒、恐惧、厌恶或惊讶的行为,不过实验结果显示,与正常情况下的Agent相比,表达这些情绪的行为数量有所增加。
  如上表所示,愤怒对行为主体影响最大(15个活动),其次是悲伤和恐惧(各10),然后是厌恶(4)和惊讶(1),最后是快乐(2)。
  负面情绪似乎比正面情绪更能影响Agent,因为Agent通常不会计划做带有负面情绪的活动,因此不得不显著调整自己的计划来管理负面情绪。
  有趣的是,观察到Agent在快乐的时候,为了使自己保持快乐,而减少做一些活动。
  亲密关系对活动的影响
  另外,作者还研究了初始关系亲密度对2个Agent之间对话的影响。
  如下表所示,随着亲密度的增加,谈话平均转折点次数呈倒U形。
  Agent距离较远的时候说话少,距离近的时候说话多,但是在距离非常近的时候,又会逐渐减少。
  这点与人类非常相似,当我们感觉与他人非常亲近时,就不那么需要进行礼貌的谈话。
  有趣的是,在Lin’sFamily中,这个转折点发生在ratherclose处。而在老友记和生活大爆炸中,转折点在发生在close处。
  或许是因为,Lin中的两个Agent是父子关系,在较低的亲密程度下进行较少的交流就很舒服,不会让关系紧张。
  而在老友记和生活大爆炸中,Agent彼此之间是朋友和邻居,需要更积极的沟通来维持关系。
  与人类标注的比较
  为了评价HumanoidAgents的预测能力(比如活动是否满足自己的基本需求、活动中自己会表现出什么情绪、对话是否会使两个Agent更亲近),研究者将系统的预测与人类标注进行了比较。
  三位人类标记者会使用和ChatGPT相同的指令,来标记林氏家族世界中一天的模拟。
  每个标注者针对情感和基本需求都独立标注了144项活动,针对用户对话对则有30项标注。
  然后,研究者对所有标注者进行多数投票,并计算了多数投票与系统预测之间的microF1。
  表1显示,在所有基本需求、情感和关系亲密程度方面,评分者之间的信度良好(F0。556)。
  研究者还发现,如果一项活动增加了饱腹感和能量,Agent就能在分类方面表现良好(F10。84)。
  而且Agent能在活动中表达出情绪,对话还能拉近不同Agent之间的距离。
  然而,Agent在给活动是否满足乐趣、健康和社交的基本需求时,却表现不佳。
  原因或许在于,Agent系统大大高估了满足这些需求的活动数量。比如健康占Agent预测活动的34vs人类标注活动的4。9,娱乐占44。4vs10。4,社交占47。2vs24。3。
  Agent会认为因为JohnLin在药房工作,这些活动就有助于Agent的身体健康;收到教授的反馈,或帮助老客户买到药物,就会令自己愉快。
  研究者判断,如果使用更理解常识的语言模型,可能会缓解这个问题。
  都是用LLM构建AI智能体,创新在哪
  斯坦福西部世界小镇的里程碑式论文一出,业界被激发了许多想象力,用LLM构建可想象的人类行为智能体研究也层出不穷。
  HumanoidAgents跟之前大热的BabyAGI、AutoGPT等智能体,区别在哪里呢?
  研究者指出,HumanoidAgents应该是目前唯一模拟类人智能体日常活动的工作,其他的工作一般都是实现外部定义的目标。
  比如LangchainAgents、BabyAGI、AutoGPT、AgentVerse、Voyager和CAMEL,都是构建以任务为导向的智能体,通过递归将用户定义的任务分解为更简单的子任务来解决。
  而且根据情感、游戏角色描述和个人事实生成的多轮对话响应,并不是由智能体动态模拟出的,而是基于一组静态的、与角色无关的文本信息。
  这些先前的工作,并不能模拟出动态属性的影响,比如无法反映出一对智能体之间亲密度的变化。
  而且,HumanoidAgents在生成对话响应时,可以同时考虑到基本需求、情感、亲密度等多个方面,就像真正的人类一样。
  而此前的这些工作,一次只考虑了一个方面。
  定制Agent
  目前,系统支持三种内置设置:
  1。生活大爆炸(BigBangTheory)
  mapfilename。。locationsbigbangmap。yamlagentfilenames。。specificagentssheldoncooper。json。。specificagentsleonardhofstadter。json。。specificagentspenny。json
  2。老友记(Friends)
  mapfilename。。locationsfriendsmap。yamlagentfilenames。。specificagentsjoeytribbiani。json。。specificagentsmonicagellor。json。。specificagentsrachelgreene。json3。LinFamily
  mapfilename。。locationslinfamilymap。yamlagentfilenames。。specificagentseddylin。json。。specificagentsjohnlin。json同时,用户还可以通过自定义设置,创建自己的地图和Agent。
  需要注意的是,Agent和地图并不是完全分离的。对于指定的每一个agentfilename,它的name字段都必须作为关键字包含在Agents下的map。yaml中。
  分析面板
  Agent在活动过程中所生成的数据,可通过交互式仪表盘直观显示。它包括基本需求图和社会关系图,以及相应的信息,包括情感和对话细节。
  cdhumanoidagentspythonrundashboard。pyfolder
  所需参数
  folder是runsimulation。py生成的输出结果存放的文件夹
  mode是从文件夹中选择数据的方法。它有两种模式:(1)all:显示文件夹中的所有文件(2)daterange:显示所选日期范围内的文件(需要在参数中说明)
  可选参数
  当modedaterange时,startdate是起始日期(包含)。格式为YYYYMMDD,如20230103
  当modedaterange时,enddate是结束日期(包含)。格式为YYYYMMDD,如20230104
  作者介绍
  ZhilinWang
  ZhilinWang是英伟达NeMoNLP团队的高级应用科学家。此前,他曾获得华盛顿大学硕士学位,学习的是自然语言处理,研究对话系统和计算社会科学。
  (举报)
投诉 评论

身份证会被手机消磁吗?绝对不可能:压根没有磁条快科技10月17日消息,相信很多人从小就听说过,身份证、银行卡等卡片一定不要和手机放在一块,会被消磁无法使用。这个说法其实在10年前算是正确的,但如今已经完全不用在意了。……iPhone15ProMax大陆零部件仅占2美国最高约33日经济新闻和FomalhautTechnoSolutions拆解机构联合对苹果最新的iPhone15系列进行了拆解和成本分析,发现与上一代机型相比,整体硬件成本增加了816。……三菱公司考虑竞购富士通芯片部门探索进入半导体制造领域站长之家(ChinaZ。com)10月17日消息:据路透社消息,三菱公司正在考虑竞标富士通的芯片封装业务子公司ShinkoElectricIndustries(新光电气工业),……华为支付首批入驻伙伴包括滴滴美团同程猫眼等站长之家(ChinaZ。com)10月17日消息:据科技日报报道,近日华为支付正式开通。华为方面透露,花瓣支付公司支持下的华为支付是鸿蒙生态中的全场景支付服务,用户可以在华为钱……深度解读:泛生子签署私有化协议的长远影响10月12日,纳斯达中概股公司泛生子(NASDAQ:GTH)发布公告,宣布已正式签署私有化合并协议。根据协议,参与此次交易的买方团包括中金康瑞医疗基金、WealthStr……Canalys2023年Q3全球手机市场报告:小米市占率连续市场调研机构Canalys发布2023年Q3全球智能手机市场报告,报告显示,2023年第三季度,全球智能手机市场仅下跌1,下滑势头有所减缓。在全球前五手机品牌中,三星、苹果、O……亚运会明星运动员入驻背后,百度何以成为达人经营新阵地?百度正在成为运动员影响力打造的重要阵地。本届亚运会期间,体操选手丘索维金娜(网友称“丘妈”)成为了全场焦点,这位48岁的运动老将在赛场上的优异表现之外,背后“你未痊愈,我……ChatGPT当导购员!全球最大超市,全面应用生成式AI全球最大连锁超市沃尔玛(Walmart)在官网宣布,将在电商平台试用3款生成式AI,帮助用户改善购物体验提升效率。据悉,沃尔玛使用了一种类ChatGPT的产品,可根据文本……麦肯锡发布生成式AI报告,预测2030可达人类水平【新智元导读】麦肯锡AI报告发布,生成式AI进步飞快,经济效益巨大,未来不可小觑。麦肯锡重磅报告发布!核心结论就一句话:AI达到人类水平的时间会比想象中要快,中位预……国内什么样的AI公司现在能拿到VC投资?当下的大模型赛场,随着最初的热潮褪去,不少VC和投资人对大模型已经进入了一个冷静期,其投资标准,也变得理性、严谨了许多。既然如此,那么这一阶段能得到明星资本青睐的团队,都……英伟达爆火智能体研究:AI逼真还原人类情感!会饿会孤独,会跑AI智能体,竟然能反映人类的真实情感,还有人际关系中微妙的距离感?最近,来自英伟达、华盛顿大学、港大的研究人员发布了类人智能体HumanoidAgents。从名字就……大模型时代下的技术变革:训练、负载、部署、效率、安全。。都遇随着互联网的快速发展,AI大模型算的上是当前行业里最“炽手可热”的技术,大模型是AI领域的重要发展趋势。大模型需要大量的数据和计算资源,同时也需要强大的应用场景支持,对各行各业……
马斯克母亲逛上海豫园在抖音等平台开设账号抖音即创平台官方入驻条件是什么即创app工具下载安装地址登录360将进军直播带货:周鸿祎亲自挂帅或效仿东方甄选B站UP主录制渣女AI视频播放量超两百万一声“哥哥”引10万AI视频模拟毒蘑菇致幻视觉B站播放超150万获赞超20万抖音联手KOL掀起龙年AI写真热全网都在晒龙年芭莎AI大片周鸿祎回应带队360直播带货:高度关注网红经济AI视野:天工2。0MoE大模型发布;智谱AI推出激励计划;直播带动跨城购房西双版纳出现“反向买房”投资AI技术深度加持!新版虎牙直播“看播”互动超有趣周鸿祎否认直播带货:雷军、余承东都是神级网红我要向他们学习YouTube将为苹果VisionPro开发专属应用恢复微信指定人所有聊天记录(微信某人聊天记录恢复)历史上著名的四大叛将他们最终的结局谁最惨?吃饱了咱也聊聊地摊儿经济华为Mate40Pro跑分多少华为Mate40Pro跑分性能全球大最具幸福感科技公司县管校聘出方案了?会不会落聘?快来看看刑侦日记四位90后女演员,演技在线颜值很高,王菲也令人难忘无所不能成语接龙大全富贵竹烂根拯救方法仙鹤的笛声三星GalaxyA515G评测:这次来真的,瞄准5G中端市场孕妇吃螃蟹多久流产

友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找作文动态热点娱乐育儿情感教程科技体育养生教案探索美文旅游财经日志励志范文论文时尚保健游戏护肤业界