范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

再不能用ChatGPT写作业了!新算法给AI文本加水印,置信度99。99

  明敏 Alex 发自 凹非寺
  量子位 | 公众号 QbitAI
  AI生成文本,又遇新对手!
  凭借识别AI生成文本中的"水印",一种新算法能够准确判断文本到底是谁写的。
  无需访问模型参数、API,结果置信度高达99.999999999994% 。
  方法一经发布就引来大量网友围观。这回拿ChatGPT"作弊",怕不是要更难了?
  要知道,最近一段时间,ChatGPT先是成为美国高中生的写作业利器,后面帮专业媒体写稿子,引发巨大恐慌。如Nature、纽约教育部等,都针对ChatGPT发布禁令。
  马里兰大学学者们提出的这一新方法,为解决这些麻烦提出了个新思路。
  不少网友都觉得,这个方法提出的正是时候,而且效果看着也不错。
  有学者还和美国高中生喊话,你们要做好准备了!
  作者表示,方法代码将在2月15日免费开源。计算文本由AI生成的概率
  所谓模型水印,人类无法看到,但是计算机可以。
  这是一种现在被常用于大规模语言模型(LLM)中的方法,能让AI生成的文本带有"特殊标记"。即把信号嵌入到生成的文本中,让算法能从一小段token中检测出来。
  最近,OpenAI方面也表示,考虑在ChatGPT中添加水印,以降低模型被滥用带来的负面影响。
  这篇最新论文的作者,就想验证下这个想法到底靠不靠谱。他们通过给LLM中嵌入水印,然后再进行检测。其中水印的嵌入不会影响文本生成质量。
  具体来说,大规模语言模型每次生成一个token,每个token将从包含大约5万个词汇的词汇表中进行选择。
  在新token生成之前,该方法会从基于最近已生成的token为随机数生成器(RNG) 提供"种子",以此来压一个水印。
  然后使用RNG,能将词汇表分为黑名单 和白名单 ,并要求LLM接下来只能从白名单中选择词汇。
  如果整段文本中,白名单中的词汇越多,就意味着越有可能是AI生成的 。
  黑白名单的区分,基于一个原则:
  人类使用词汇的随机性更强。
  举例来说,如果在"美丽的"后面生成词汇,水印算法会将"花"列入白名单,将"兰花"列入黑名单。
  论文作者认为,AI更可能使用"花"这个词汇,而不是"兰花"。
  然后,就能通过计算整段文本中白名单token出现的情况,来检测水印。
  如果一共有生成了N个token,所有的token都使用了白名单词汇,那么这段文字只有2的N次方分之一 概率是人类写的。
  即便这段文字只有25个词组成,那么水印算法也能判断出它到底是不是AI生成的。
  但作者也表示,水印有时候也不一定完全靠谱。
  比如模型输出了"SpongeBob Square",下一个单词一定会是"Pants"吧?但是Pants会被标记到黑名单里,即认为是只有人才会写的词。
  (注:SpongeBob SquarePants是《海绵宝宝》动画片的英文,可理解为一个专有名词)
  这种情况会严重影响算法的准确性,因此作者将其定义为低熵token ,因为模型几乎不会有更好的选择。
  对应来看,也会有高熵token ,比如"海绵宝宝感觉____"这个句式里,能填入的词汇太多了。
  对于这一情况,作者选择针对高熵token制定更强的规则,同时保留低熵token,确保水印质量更好。
  与此同时,他们还添加了波束搜索(Beam search) ,允许LLM能够排布一整个token序列,以避免黑名单词汇。
  这么做,他们能确保LLM使用白名单词汇的概率在大约80% 左右,而且不影响文本生成质量。
  举例来看,对于下面这段文字,水印算法认为它有99.999999999994%的可能是由AI生成的。
  因为在这段文字中,包含36个token。如果是人类写的,那么文本中应该包含9 2.6个白名单词汇(白名单词汇的概率约为25%)。
  但这段文字中,包含了28个 白名单词汇。
  计算来看,这段文字由人类写出的概率,仅有0.0000000000006%  (6乘以10的-15次方) 。
  如下标注的是文本中的黑名单token。
  需要注意的是,如果想要水印正常发挥作用,并不受到攻击,就必须对文本进行一些标准化处理,并且需要检测某些类型的对抗性提示。
  这一方法是对外公开的,将在2月15日 开源代码。
  加一个随机秘钥,也能变成保密模式并且托管到API上,这能保证水印不会被篡改。
  论文中使用的模型是Meta开源的OPT-1.3B 模型。
  由于不用访问底层模型,所以该检测方法的速度很快,成本也不会很高。
  而且可以使用标准语言模型生成带水印的文本,不用再重新训练。网友:似乎很容易绕过?
  巴特,不少网友觉得,这个方法的具体实践效果可能远不及理想,质疑之声迭起。
  有人提出:如果我在AI生成的文字基础上,修改几个词,还能被查出来吗?那在替换成近义词后,检测准确率会下降多少?
  毕竟大家往往不会一字不改、直接用AI生成的内容。
  对此,论文通讯作者、马里兰大学副教授Tom Goldstein回答称:对于一段自带水印的文字,至少得修改40%-75%的token,才可能成功去除水印。
  (如果用其他程序修改内容话) ,为发生同义词攻击,导致生成内容的质量很低。
  简而言之,想要通过换近义词来消除水印,得大篇幅修改,而且若不是人亲自手动修改的话,效果会很拉胯。
  还有人提出:
  对于专门设计过的低熵token序列,应该能检测出水印。但是,长度和检测率之间 (存在一些矛盾) ,它们的优先级应该如何权衡?
  对此,Tom教授表示:根据设定,使用波束搜索时,绝大多数 (通常是90%) 的token在白名单上,即使是低熵token,也会被列入白名单。
  所以,至少得修改一半以上的token,才能删除水印,而这需要一个超级强大的LLM模型才行,一般人很难接触到。
  不过,研究者们也在论文中承认,这种方法确实存在一些局限性。
  比如,检测水印的z统计量,只取决于白名单大小参数γ和生成白名单的哈希函数,和其他不少重要的参数并没有什么相关性。
  这就让他人可以在下游水印检测器上做手脚,可以改变水印采样算法,重新部署水印,最终让原本生成的水印失效。
  就连OpenAI CEO Sam Altman也表示:
  创造完美检测AI抄袭的工具,从根本上来说是不可能的。
  (尽管他说OpenAI打算启用水印大法)
  但话说回来,人们为了限制AI生成文字的负面影响,还是煞费苦心——
  之前就有人搞出了一个检测ChatGPT的网站,名曰GPTZero,只需要把相应的内容粘进去,几秒内就能分析出结果。
  论文地址:
  https://arxiv.org/abs/2301.10226
  参考链接:
  [1]https://twitter.com/tomgoldsteincs/status/1618287665006403585
  [2]https://twitter.com/goodside/status/1610552172038737920
  [3]https://www.technologyreview.com/2023/01/27/1067338/a-watermark-for-chatbots-can-spot-text-written-by-an-ai/
  — 完 —
  量子位 QbitAI · 头条号签约
  关注我们,第一时间获知前沿科技动态

喜迎开门红,多家企业竞相入驻长江工业园区近日,由中冶天工集团承建的建筑面积8。6万平方米四川长江工业园全部厂房已正式入驻,崭新的宜宾市动力电池小镇迎来了一批新村民,多家企业竞相入驻标志着宜宾市动力电池小镇,宜宾市新能源产马拉维共和国农业部长率团访湘(马拉维农业部与湖南中湘拉维国际贸易有限公司签署贸易协议。通讯员摄)湖南日报3月16日讯(全媒体记者周帙恒)3月9日至14日,马拉维共和国农业部长塞缪尔达利索卡瓦莱率团访问湖南,赴315只是平民的自嗨315,国际消费者权益日,看似保护消费者的权益,实则是一场平民的自嗨。随着口罩问题的影响,很多企业受到了冲击,现在放开了限制,也放松了管理。年年都存在问题的行业,企业,今年竟然都没联想的问题从未被真正解决过文暮春编辑杨旭然如果要盘点近年来遭受非议最多的企业,联想绝对榜上有名。网红经济学家和更加纯粹的网红们,视之为流量的收割机,联想系的方方面面都接连陷入舆论风暴眼。而其主力旗舰联想集团苹果又为iPhone15系列手机涨价找到了理由硬件升级明显!目前,有关苹果iPhone15系列手机的预热逐步增多了,因为很多消息显示,目前iPhone15系列手机已经处于试产阶段了,所以基本配置都已经确定了,而最新消息,iPhone15系列荣耀V30升级鸿蒙3。0系统,再更新补丁的使用体验升级鸿蒙3。0系统有两周多了,今天收到升级鸿蒙3。0系统后的补丁,更新安装后有了一点点发现。部分内置应用可以卸载更新完后发现系统内置的部分应用可以卸载了,如运动健康生活服务这两个软iOS16。4beta4测试版推送升级,正式版预计月底推送我们之前刚刚跟大家分享过在iOS16。4正式版之前苹果还会推送iOS16。4beta4第四个测试版升级更新,现在iOS16。4beta4测试版升级更新来了。苹果今天向iPhone手春日勤学忙!快来使用BNU笔记本装点你的课堂BNU笔记本新学期已经步入正轨你的课堂笔记做得怎么样了呢?木小铎给BNUers带来了最新款的BNU笔记本内页还等什么赶快下载下来用它来承载你学到的新知识吧!animatetrans联想YOGAM5无线鼠标夕岚粉雾海蓝霜月银开售IT之家3月16日消息,联想YOGA官方宣布,YOGAM5无线鼠标迎来了新的配色。除了此前的黑白色外,新增夕岚粉雾海蓝霜月银。支持无线双模多设备连接,USBC充电接口。今天上午正式3月份的旗舰手机,可真是扎堆来啊寻找数码点评派三月份的旗舰机,可真是扎堆来啊。前几天发了荣耀Magic5系列。之后魅族在经过差不多一个月的预热后,终终终终终于表示要在3月30日正式发布魅族20系列。上次咱聊到的华浙江45岁女子,每天服用一片叶酸,半年后,发生这几个变化现在的人讲究优生优育。女性在备孕期怀孕期都需要注意,很多事情,有经验的朋友应该都知道,备孕期间或者怀孕前期服用叶酸,保护胎儿健康成长。叶酸,并不只是对于孕妇和胎儿,有较强的保护作用
中国仅存一女侍二夫的村子,几乎与世隔绝,全村只有22户在母系社会中,人们很难想象古人的婚姻生活,但是在某些落后地区,依然延续着一夫多妻或者是一妻多夫的制度。中国仅存一女侍二夫的村子,几乎与世隔绝,全村只有22户。雨崩村位于云南省迪庆藏电影巴林塔娜引发内蒙旅游热跟和合国际有关吗和合国际滴咚个游和合小康电影巴林塔娜自上映以来,受到了广大观众的热烈追捧,票房成绩也屡创新高。然而,该电影不仅仅是一部普通的商业电影,它还引发了内蒙旅游热和和合国际的关注。首先,电苹果CarKey或仅支持UWB,不再支持NFC?近日,根据国外科技媒体9to5Mac报道,通过解析iOS16。4Beta3代码,相关人员发现未来苹果的CarKey功能必须支持UWB的设备才能使用,因为对于仅兼容NFC的苹果设备,ChatGPT创始人靠吃这款药抗衰老,还可预防癌症和老年痴呆?据国外媒体报道,为了让自己活得更久,人工智能实验室OpenAICEO萨姆阿尔特曼(SamAltman)正在服用一种名为二甲双胍的糖尿病药物。OpenAI开发了最近爆红的聊天机器人CIntelFSP介绍概述FSP(FirmwareSupportPackage)是Intelsilicon初始化代码的一个binary形式的发布包。FSP主要提供chipset,processor初始化降价没效果,华为问界遭遇新危机,余承东今后怎么把牛逼吹下去?正如华为终端业务CEO余承东之前的说法,华为与赛力斯的合作,是智选车模式最好的样板。无论华为还是赛力斯,都对这样的合作模式抱有非常高的期望。作为华为与赛力斯联合打造的中高端智能新能中国专家3年就能造光刻机!2年过去了,中国光刻机有希望吗?近两年中国经济迅速发展,这是大家有目共睹的事,在科技领域我们也取得了不错的成就。我们都知道,我国在很多方面起步都比较晚,我们却用几十年的时间赶超了那些西方国家,这个就是我们最大的底谁是与巴菲特共进午餐的第一位中国人2006年,段永平以62。01万美元中标,成为与巴菲特共享午餐的第一位中国人。段永平是小霸王和步步高创始人,曾于1999年以其明晰的远见和创新能力,被评为亚洲20位商业与金融界千禧3D打印火箭尝试首飞,将开启太空旅行新时代太空探索一直是人类的梦想,但也面临着巨大的挑战和成本。传统的火箭制造需要复杂的工艺和大量的零部件,导致火箭价格昂贵生产周期长可靠性低。如何打破这些限制,提高火箭的性能和效率,是太空种菜上网新华社北京3月12日电3月12日,新华每日电讯发表题为种菜上网的报道。浇水不湿手,种菜不下田,丰收不问天这些充满不可能和混搭感的场景,如何变得合情合理?答案是用AI(人工智能)种菜多项能源转型新技术亮相剑桥能源周新华社休斯敦3月10日电(陈晨)国际能源界高端会议剑桥能源周10日在美国能源之都休斯敦闭幕,重点讨论如何应对能源安全和能源转型的双重挑战。会议期间展出的众多能源转型新技术备受关注。