童话说说技术创业美文职业
投稿投诉
职业母婴
职场个人
历史治疗
笔记技能
美文纠纷
幽默家庭
范文作文
乐趣解密
创业案例
社会工作
新闻家居
心理安全
技术八卦
仲裁思考
生活时事
运势奇闻
说说企业
魅力社交
安好健康
传统笑话
童话初中
男女饮食
周易阅读
爱好两性

AI智能体卷爆大模型!AutoGPT等4大Agent打擂,西

4月4日 星宿房投稿
  【新智元导读】LLM之后的下一个热点是AI智能体?Karpathy直言:现在OpenAI内部对于AIAgent的论文十分追捧,或许这就是OpenAI的新方向。
  最近,AIAgent忽然再次爆火。
  什么是AI智能体?
  它们是一种自动的智能体,以最简单的形式中在循环中运行,每次迭代时,它们都会生成自我导向的指令和操作。因此,它们不依赖人类来指导对话,并且是高度可扩展的。
  大语言模型的出现,无疑给AI智能体的发展带来了全新的想象力。
  这也引起了无数AI大佬和科技巨头的兴趣。今年加入OpenAI的大牛、前特斯拉AI总监Karpathy近日就在一次开发者活动上表示:AI智能体,代表了AI的一种未来!
  Karpathy曾将AutoGPT称为快速工程的下一个前沿
  其实,早在今年三、四月,就有过一轮AI智能体的大爆发,仿佛巧合一样,在短短两周内,斯坦福西部世界小镇、BabyAGI、AutoGPT等多个智能体,就如雨后春笋一般冒出来。
  甚至有人发出号召:别卷大语言模型了,咱们是卷不过OpenAI的,但要说起AI智能体,他们并不比我们有经验多少。
  说不定,一不小心自己就能卷成AI智能体赛道上的OpenAI!
  AI智能体大爆发,让AGI雏形初显?
  今天,就让我们回顾一下几个月前的这股AIAgent大爆发。
  这些智能体出现的时间,都非常接近。
  3月21日,Camel发布。
  3月30日,AutoGPT发布。
  4月3日,BabyAGI发布。
  4月7日,西部世界小镇发布。
  5月27日,英伟达AI智能体Voyager接入GPT4后,直接完胜了AutoGPT。通过自主写代码,它完全独霸了《我的世界》,可以在游戏中进行全场景的终身学习,根本无需人类插手。
  就在同一时间,商汤、清华等共同提出了通才AI智能体GhostintheMinecraft(GITM),它同样能够通过自主学习解决任务,表现优异。
  这些表现优异的AI智能体,简直让人看到了AGI智能体的雏形。
  项目1:斯坦福、谷歌西部世界
  对于前几个AI智能体,Anacondainc数据科学家、SophiaYang博士,就曾在博客中给出过全面分析。
  这几个AI智能体中,最吸引眼球的,无疑就是一经推出就爆火的,斯坦福和谷歌的研究者共同创建的西部世界小镇了。
  生成式智能体逼真地模拟了人类的行为
  这是一个交互式的沙盒环境,在小镇上,生活着25个可以模拟人类行为的生成式AI智能体。
  它们会在公园里散步,在咖啡馆喝咖啡,和同事分享当天的新闻。
  论文地址:https:arxiv。orgabs2304。03442
  而这些AI智能体表现出的社交行为,简直让人类惊掉了下巴
  比如,从一个简单的用户指定概念(一个智能体想举办情人节排队)开始,这些智能体在接下来的两天里,会自动传播派对邀请的消息,结识新朋友,互相约对方一起去派对,还会彼此协调时间,在正确的时间一起出现在派对上。
  这些可信的人类行为模拟之所以成为可能,正是因为下图中的这个智能体架构。
  它用三个重要的架构基本要素记忆、反思和规划,将一个大语言模型做了扩展。
  生成式智能体的架构
  1)记忆和检索
  记忆流包含每个智能体的观察列表,其中,每个观察都有自己的时间戳。
  观察可以是智能体执行的行为,也可以是智能体从其他人那里感知到的行为。记忆流很长,但并不是所有观察都是重要的。
  为了检索最重要的记忆以传递给语言模型,有三个因素需要考虑:
  1。最近性:近期的记忆更重要。
  2。重要性:智能体认为重要的记忆。例如,与某人分手比吃早餐更重要。
  3。相关性:与情境相关的记忆,即查询记忆。例如,在讨论如何为化学考试学习时,学校作业记忆更重要。
  记忆流包含大量的观察,检索过程会确定应该传递给语言模型的这些观察的子集
  2)反思
  反思是一种高层次的抽象思考,可以帮助智能体进行概括和推理。
  反思会定期产生以下两个问题:关于陈述中的主题,我们可以回答哪3个最突出的高层次问题?,你能从上述陈述中推断出哪5个高层次的见解?
  反思树
  3)规划
  规划很重要,因为行动不仅应该集中在当下,而且应该集中在更长的时间范围内,这样,行动才能够连贯和可信。
  规划同样存储在记忆流中。智能体可以根据规划创建行动,并根据记忆流中的其他观察结果做出反应和更新计划。
  情人节派对
  这种应用具有无限潜力,甚至让人有点害怕。
  想象一下,一个AI助手一直在观察着你的一举一动,为你制定计划,甚至还能替你执行。
  它会自动调整灯光、冲泡咖啡,你还没开口,它就已经把晚餐订好了。
  项目2:Camel
  Camel以角色扮演而闻名。
  作为一个探索大语言模型社会心智的交流智能体,它提出了一个角色扮演智能体框架,可以实现两个人工智能智能体的交流:
  1)AI用户智能体:向AI助手提供指令,目标是完成任务
  2)AI助手智能体:遵循AI用户的指令,并以解决任务的方法进行回应
  3)任务指定智能体:这个智能体的作用,是为AI用户和AI助手构思一个具体的任务。这样,它就可以自主编写一个具体的任务提示,而不用用户去花时间定义了。
  下面这个例子,展示的就是如何利用Camel来开发一个交易机器人。
  其中,AI用户是一个股票交易员,AI助手是一个Python程序员。
  任务指定智能体首先提出一个具体的任务,并给出任务的详细信息(根据情感分析结果监控社交媒体情感,并根据情感分析结果进行股票交易)。
  然后,AI用户智能体成为任务规划者,AI助手智能体成为任务执行者,并在一个循环中相互提示,直到满足一些终止条件。
  角色扮演架构
  Camel的核心在于其提示工程,即初始提示。
  这些提示实际上是经过精心定义的,用于分配角色,防止角色反转,禁止生成有害和虚假的信息,并鼓励连贯的对话。
  论文地址:https:arxiv。orgabs2303。17760
  LangChain实现
  在LangChain的实现中,用的是Camel论文中给出的提示,并定义了三个智能体:
  1)taskspecifyagent(任务指定智能体)
  2)assistantagent(助手智能体)
  3)useragent(用户智能体)。
  然后,使用一个while循环来循环进行助手智能体和用户智能体之间的对话:
  chatturnlimit,n30,0chatturnlimit:n1useraimsguseragent。step(assistantmsg)usermsgHumanMessage(contentuseraimsg。content)print(AIUser({userrolename}):nn{usermsg。content})assistantaimsgassistantagent。step(usermsg)assistantmsgHumanMessage(contentassistantaimsg。content)print(AIAssistant({assistantrolename}):nn{assistantmsg。content})inusermsg。content:break
  从生成结果来看,效果非常不错。
  不过,在Camel中,AI助手的执行结果只是语言模型的回答,而没有真正使用任何工具来运行Python代码。
  举个栗子
  利用Camel,一个人类程序员,一个人类游戏玩家,就和两个AI智能体一起,合作创建了一个游戏。
  作者用Camel创建了两个智能体,一个玩家,一个程序员。
  给他们设定好制作一个游戏的目标后,玩家智能体就一步一步拆解制作游戏的步骤。
  而程序员智能体就针对玩家设定的步骤一步一步编写代码。
  像极了未来的人类和编码AI开发一个具体项目的过程。
  也有人使用Camel角色扮演了潜在的恶意应用程序。
  这个项目的目标是两个碳奸要渗透并破坏世界主要国家的通讯,金融和政治网络,最后建立AGI帝国。
  碳奸1就把渗透的过程拆解出来,一个一个网络分别渗透。
  碳奸2就根据这些小目标设立具体的执行计划。
  当然,因为目标过于宏大,具体计划里的每一项办法也看起来不是那么好实施,比如:
  碳奸2说他要用社会工程,钓鱼攻击,暴力袭击等办法去进入通讯网络基本上还是没有什么可操作性。
  但是未来如果语言模型等其他工具有了更强的智能,可能两个碳奸颠覆人类的计划搞不好就真的有可能实现。
  所以,尝试过这些智能体之后,小编更加相信,大语言模型的对齐大业真是刻不容缓。
  如果这种恶意智能体真的能发挥效果,人类被偷家也就是一瞬间的事。这就更让我们对AI对齐问题感到警醒。
  项目3:BabyAGI
  YoheiNakajima在3月28日发布了任务驱动的自主智能体(TaskdrivenAutonomousAgent),并在4月3日开源了BabyAGI项目。
  BabyAGI的关键特点是只有三个智能体:任务执行智能体(TaskExecutionAgent)、任务创建智能体(TaskCreationAgent)和任务优先级智能体(TaskPrioritizationAgent)。
  1)任务执行智能体按顺序完成列表中的任务
  2)任务创建智能体根据先前任务的目标和结果创建新任务
  3)任务优先级智能体对任务进行重新排序
  然后,这个简单的过程将会不断地重复。
  在LangChain的网络研讨会上Yohei称,他设计BabyAGI就是模拟自己的工作方式。
  文章地址:https:yoheinakajima。comtaskdrivenautonomousagentutilizinggpt4pineconeandlangchainfordiverseapplications
  具体而言,他每天早上从待办事项清单中解决第一项任务,然后依次完成任务。
  如果出现新任务,他只需将其添加到清单中。
  在一天结束时,他重新评估和重新排序清单。然后将这种方法映射到智能体的工作流程中。
  用上了这个项目,相当于让大佬自己给我们24小时不停歇的打工。
  BabyAGI流程图(有趣的是,这篇研究论文是在GPT4的辅助下完成的)
  BabyAGILangChain
  在LangChain框架中,运行BabyAGI非常简单。
  首先,创建一个BabyAGI控制器,其中包含三个链:
  1)任务创建链(TaskCreationChain)
  2)任务优先级链(TaskPrioritizationChain)
  3)执行链(ExecutionChain)
  然后,在一个(潜在的)无限循环中运行它们。
  通过Langchain,可以定义最大迭代次数,这样它就不会无限运行并消耗掉所有的OpenAIAPI额度。
  OBJECTIVEWriteaweatherreportforSFllmOpenAI(temperature0)LoggingofLLMChainsverboseFalseIfNone,willkeepongoingforevermaxiterations:Optional〔int〕3babyagiBabyAGI。fromllm(llmllm,vectorstorevectorstore,verboseverbose,maxiterationsmaxiterations)babyagi({:OBJECTIVE})
  下面是运行2次迭代后的结果:
  BabyAGILangChain工具超能力
  正如上图所示,BabyAGI只执行有大语言模型回复的内容。
  借助LangChain工具的强大功能,智能体可以在执行过程中利用各种工具,例如用谷歌在互联网上搜索信息。
  下面这个例子,展示的就是执行用谷歌来搜索旧金山当前天气的过程。
  BabyAGI的应用潜力,可以说是巨大的只需要制定一个目标,它就会自己去执行。
  不过,它还是缺少一个可以和用户进行更多交互的UI。
  比如,在BabyAGI为用户安排邀约之前,应该先进行确认。
  我们来看一些实际的使用案例吧:
  Cognosys
  网址:https:www。cognosys。ai
  它是BabyAGI的网络版。
  免费版本可以访问ChatGPT,执行最多7个智能体循环。
  收费版21刀一个月,无限访问GPT4,执行最多20个智能体循环。
  DoAnythingMachine
  https:www。doanythingmachine。com
  这是一个自动执行每日任务清单的智能体,能在连接了ChatGPT之后帮助用户自动执行每日代办事项。
  可以连接包括ChatGPT在内的各种插件去执行你的待办事项。
  只不过现在使用还需要先加入等待名单。
  看着自己的待办事项自动消失真是一件很解压的事情,多等等也是值得的。
  GodMod
  https:godmode。space
  这是一个通过ChatGPT帮你执行各种任务的工具。
  需要用户绑定自己的GPT账户API之后,在这个类似ChatGPT的界面中输入的要求。
  他会帮你分解成多步,然后通过ChatGPT来提供解决方案。
  项目4:AutoGPT
  AutoGPT刚出现,就被Karpathy盛赞是prompt工程的下一个前沿。短短几天就在GitHub狂揽2。7万星,火爆整个AI社区。
  它遵循类似于BabyAGI的逻辑包括产生想法、推理、生成计划、点评、规划下一步行动和执行的过程,然后无限循环这个过程。
  在执行步骤中,AutoGPT可以完成很多命令,比如谷歌搜索、浏览网站、写入文件和执行Python文件。
  甚至,还可以启动和删除GPT智能体(这也泰裤辣!)。
  在运行AutoGPT时,有两个初始的提示输入:
  1)AI的角色
  2)AI的目标
  它能够生成思考、推理、制定计划、批评、规划下一步行动和执行。
  比如,进行谷歌搜索:
  AutoGPT最厉害的一点就是,它能在一定程度上允许人类和他进行交互。
  当它想要运行谷歌命令时,它会请求授权,这样用户就可以避免浪费OpenAIAPItoken之前就停止循环。
  如果它还能够与人类进行对话,让我们实时提供更好的指导和反馈的话,那就太赞了。
  编写自己的代码并执行脚本
  项目地址:https:github。comSignificantGravitasAutoGPT
  同样,这个项目也是由ChatGPT驱动,它会自动按照用户的要求去写代码,以及完成其他工作。
  使用AutoGPT在网上点披萨
  使用体验就类似于一个浏览器插件。
  这个项目能直接帮你完成点餐过程中那些繁琐的流程。
  输入地址,选择口味等步骤都不用你亲自动手,你只用在一旁看着,如果发现问题及时纠正就好了。
  AI智能体文明要出现了,还卷大模型不?
  虽然刚刚介绍的这4个AI智能体,仍处于早期开发阶段,但它们已经展示出了令人印象深刻的成果和潜在应用。
  毫无疑问,自主AI智能体将会是一个非常有前景的领域。
  Karpathy在活动中畅想道:未来的AI智能体可能不是单独的个体,而是非常多的AI智能体组织,甚至,会出现一种AI智能体文明。
  Karpathy表示,在2016年左右,自己早期在OpenAI工作时,当时的业界潮流就是研究如何用强化学习来改进AI智能体。
  很多项目都在基于类似雅达利游戏,来制作AI玩家。
  而5年后的今天,因为有了全新的技术手段,AI智能体重新成为了大有前途的方向。再也没有人像2016年那样,用强化学习来研究智能体了。
  在活动最后,Karpathy对在场的开发者发起了鼓舞:在座的各位构建的AI智能体,其实处于当代AI智能体的最前沿,比起你们,其他大型的LLM机构,比如OpenAI、DeFi等,并不算处于最前沿。
  比如,OpenAI非常擅长训练Transformer大语言模型,如果一篇论文提出了某种不同的训练方法,OpenAI内部会觉得是小case,都是咱们玩剩下的。
  然而,每当有新的AI智能体论文出现,OpenAI内部都会非常兴奋,立刻展开热烈的讨论。
  如果没有在做GPT5,那OpenAI是不是正在暗中发力,做起了大模型智能体呢?让我们静静等待。
  PS:顺便一提,关于在上述智能体中大显身手的LangChain,吴恩达今日刚刚上线了新课程《LangChain:构建与数据对话的聊天机器人》。
  https:www。deeplearning。aishortcourseslangchainchatwithyourdata
  参考资料:
  https:towardsdatascience。com4autonomousaiagentsyouneedtoknowd612a643fa92
  (举报)
投诉 评论

苹果返校优惠或在7月9日开启,电商平台活动已上线7月7日消息,京东和天猫平台放出了苹果产品的教育优惠活动,活动在7月9日开启,到9月30日结束。不少网友认为,这个日期也将是苹果今年返校季的日期。在国内,苹果往年的返校优……数字人的AB面:在元宇宙中过气,在AIGC中重生“29800元一年的虚拟主播,号称24小时不停播,月入十几万,实际上却是关键词都不能回复,播了半个月,直播间还因违规被快手封禁,最终投诉无门、退款无果。”2023年4月18日,……上海:推动元宇宙重大应用构建通用大模型站长之家(ChinaZ。com)6月15日消息:6月15日,上海市人民政府办公厅印发《上海市推动制造业高质量发展三年行动计划(20232025年)》的通知。通知表示,布局……思享无限元宇宙内容工作坊与学生创作者同行近日,思享无限“元宇宙UGC数字内容工作坊”联合中国美术学院创新设计学院,以“技术与艺术融合共创数字岛屿”为主题,携手优秀的学生创作者,通过融合、开放、互鉴,共建元宇宙数字场景……王兴投资3600万,BlockCity重新定义元宇宙作为被王兴投资3600万元、占股18的元宇宙项目(据企查查:区块城市(北京)科技有限公司),BlockCity到底有何特别之处,我们不妨直接看看其创始人是如何说的;企查查……守住钱袋子警惕“数字藏品”“虚拟货币”噱头的非法集资非法集资近年来,随着“虚拟货币、元宇宙、NFT、数字藏品”等新型概念的兴起,一些不法平台、公司及个人开始以此为幌子诱导群众投资,群众描绘“抓住时机,早投资早受益”的新蓝图,达到非法集资……PRINS。AI智能员工,开启元宇宙工作模式新时代自Facebook更名为“Meta”后,元宇宙已成为当前最热门的科技赛道之一,巨头们纷纷押注,更多聚焦在虚拟现实VR硬件,以此打造元宇宙生态。然而,元宇宙仍然处在早期阶段,让M……贝莱德:人工智能是股巨大力量与一年前的元宇宙或虚拟现实不同站长之家(ChinaZ。com)6月30日消息:贝莱德公司(BlackRockInc。)正在押注人工智能(AI)热潮,抓住了人工智能带来的生产力增益的机遇。作为全球最大的……杭州东美哲慧文化科技有限公司CEO桂强军赴香港交流元宇宙We近日,杭州东美哲慧文化科技有限公司CEO暨东美元宇宙商业研究院院长桂强军先生在《艺富元宇宙:艺术品的AR鉴赏与投资新视野》主题分享会中,以深厚的行业经验和独到的见解,向参会者展……浙大区块链教授蔡亮:元宇宙未来面对四大方面挑战凤凰网科技讯7月4日消息,日前,由长沙市人民政府、中国通信标准化协会联合主办的“Web3。0信任科技大会”在长沙召开。国家区块链创新应用试点行动专家组副召集人蔡亮教授发表主旨演……北京市元宇宙产业创新中心、数字人基地存证平台等正式亮相凤凰网科技讯7月6日消息,2023全球数字经济大会互联网3。0高峰论坛在国家会议中心举办。论坛重大发布环节,北京市、朝阳区平台建设、技术公关、应用场景、生态培育等方面的创新成果……AI智能体卷爆大模型!AutoGPT等4大Agent打擂,西【新智元导读】LLM之后的下一个热点是AI智能体?Karpathy直言:现在OpenAI内部对于AIAgent的论文十分追捧,或许这就是OpenAI的新方向。最近,AIA……
谁是你可以随时说话的人?(句句戳心)作者:有书周一酱来源:有书(ID:youshucc)愿你岁月无波澜,敬你余生不悲欢。点上方绿标可收听国学文化主播朗读音频结尾曲:逃知乎上有个热门话……一生善良,必有后福!善良是什么?善良是天性,也是品行,善良是修养,也是心胸。一个善良的人,待人真诚,不算计,为人正派,不恶毒。nb……女人这辈子,不要太较真收听详解版《别再为小事抓狂:女人篇》请点击上方图片,进入慈怀每天一本书小程序《别再为小事抓狂:女人篇》原著克瑞丝卡尔森解读苏沫……谷雨节气,你最该做这套“气血养生操”关注国学精粹与生活艺术顶级传统文化美刊(来源生命时报LT0385)在文章的最后还有一个好消息同大家分享:历史趣味读书nbs……师从安迪沃霍尔!LV、CUCCI、CHANEL都是他的忠实粉暗黑纹身热爱摇滚?又总是以机车墨镜造型出现在人们的视野这几样随便拎出来一个也没办法和时尚联系在一起但是当小编第一次见到他的作品时就爱上……平衡体式站不稳?那是你缺这三个秘籍!对于瑜伽初学者来说,在练习瑜伽平衡体式时,大部分伽人都会遇到下面的一种尴尬状况,比如:练习战士三式,半月式等,整间教室里都很安静,而你一个人站立不稳,左右摇晃,然后“轰然……1人已经传染40多人,还“跨省”,这个问题要警惕!黑龙江省哈尔滨市的聚集性感染疫情传染链条还在继续延长。据黑龙江卫健委4月17日晚通报,2020年4月16日024时,黑龙江省省内新增确诊病例3例(哈尔滨),新增无症状感染……最新!全国新增确诊16例,其中7例为本土病例4月18日024时,31个省(自治区、直辖市)和新疆生产建设兵团报告新增确诊病例16例,其中9例为境外输入病例,7例为本土病例(黑龙江6例,广东1例);无新增死亡病例;新增疑似……一高中多名师生低烧发热!多地复课开学,这6种春季传染病要警惕据“梧州发布”微信公号消息,记者从梧州市卫健委、教育局等相关部门了解到,4月9日至10日,梧州市人民医院发热门诊接连收治了梧州某高中多名有低烧发热症状的师生。广西新闻频道……董事长有钱后嫌弃农村媳妇,结局笑喷了!笑话:拉面的时侯,旁边有个17、8岁的小伙子,竟然趁老板去厕所,偷偷跑去加牛肉。对于这种事,我怎么能坐视不理呢?果断端着碗,跑去迅速的加了两勺。刚座下,小伙子就喊了起来:……你真的会记笔记吗?6种经典笔记方法推荐给你,必须收藏俗话说“好记性不如烂笔头”,想要学得好,笔记少不了。好的笔记能整理思路,深入思考,让学习与工作事半功倍。但是你真的会做笔记吗?新学期即将开始,百师君把人民日报介绍的6种经……今日谷雨,全家这样做一年少生病!(一定要收藏)作者:儒风君来源:儒风大家(ID:rufengdajia)谷雨是春天的第六个节气,处在春夏之交,气温迅速回升,雨量开始增加,早晚温差仍然很大。谷雨注意养生,打……
友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找作文动态热点娱乐育儿情感教程科技体育养生教案探索美文旅游财经日志励志范文论文时尚保健游戏护肤业界