再不能用ChatGPT写作业了！新算法给AI文本加水印，置信度99。99

　　明敏 Alex 发自 凹非寺
　　量子位 | 公众号 QbitAI
　　AI生成文本，又遇新对手！
　　凭借识别AI生成文本中的＂水印＂，一种新算法能够准确判断文本到底是谁写的。
　　无需访问模型参数、API，结果置信度高达99.999999999994% 。
　　方法一经发布就引来大量网友围观。这回拿ChatGPT＂作弊＂，怕不是要更难了？
　　要知道，最近一段时间，ChatGPT先是成为美国高中生的写作业利器，后面帮专业媒体写稿子，引发巨大恐慌。如Nature、纽约教育部等，都针对ChatGPT发布禁令。
　　马里兰大学学者们提出的这一新方法，为解决这些麻烦提出了个新思路。
　　不少网友都觉得，这个方法提出的正是时候，而且效果看着也不错。
　　有学者还和美国高中生喊话，你们要做好准备了！
　　作者表示，方法代码将在2月15日免费开源。计算文本由AI生成的概率
　　所谓模型水印，人类无法看到，但是计算机可以。
　　这是一种现在被常用于大规模语言模型（LLM）中的方法，能让AI生成的文本带有＂特殊标记＂。即把信号嵌入到生成的文本中，让算法能从一小段token中检测出来。
　　最近，OpenAI方面也表示，考虑在ChatGPT中添加水印，以降低模型被滥用带来的负面影响。
　　这篇最新论文的作者，就想验证下这个想法到底靠不靠谱。他们通过给LLM中嵌入水印，然后再进行检测。其中水印的嵌入不会影响文本生成质量。
　　具体来说，大规模语言模型每次生成一个token，每个token将从包含大约5万个词汇的词汇表中进行选择。
　　在新token生成之前，该方法会从基于最近已生成的token为随机数生成器（RNG） 提供＂种子＂，以此来压一个水印。
　　然后使用RNG，能将词汇表分为黑名单 和白名单 ，并要求LLM接下来只能从白名单中选择词汇。
　　如果整段文本中，白名单中的词汇越多，就意味着越有可能是AI生成的 。
　　黑白名单的区分，基于一个原则：
　　人类使用词汇的随机性更强。
　　举例来说，如果在＂美丽的＂后面生成词汇，水印算法会将＂花＂列入白名单，将＂兰花＂列入黑名单。
　　论文作者认为，AI更可能使用＂花＂这个词汇，而不是＂兰花＂。
　　然后，就能通过计算整段文本中白名单token出现的情况，来检测水印。
　　如果一共有生成了N个token，所有的token都使用了白名单词汇，那么这段文字只有2的N次方分之一 概率是人类写的。
　　即便这段文字只有25个词组成，那么水印算法也能判断出它到底是不是AI生成的。
　　但作者也表示，水印有时候也不一定完全靠谱。
　　比如模型输出了＂SpongeBob Square＂，下一个单词一定会是＂Pants＂吧？但是Pants会被标记到黑名单里，即认为是只有人才会写的词。
　　（注：SpongeBob SquarePants是《海绵宝宝》动画片的英文，可理解为一个专有名词）
　　这种情况会严重影响算法的准确性，因此作者将其定义为低熵token ，因为模型几乎不会有更好的选择。
　　对应来看，也会有高熵token ，比如＂海绵宝宝感觉____＂这个句式里，能填入的词汇太多了。
　　对于这一情况，作者选择针对高熵token制定更强的规则，同时保留低熵token，确保水印质量更好。
　　与此同时，他们还添加了波束搜索（Beam search） ，允许LLM能够排布一整个token序列，以避免黑名单词汇。
　　这么做，他们能确保LLM使用白名单词汇的概率在大约80% 左右，而且不影响文本生成质量。
　　举例来看，对于下面这段文字，水印算法认为它有99.999999999994%的可能是由AI生成的。
　　因为在这段文字中，包含36个token。如果是人类写的，那么文本中应该包含9±2.6个白名单词汇（白名单词汇的概率约为25%）。
　　但这段文字中，包含了28个 白名单词汇。
　　计算来看，这段文字由人类写出的概率，仅有0.0000000000006%  （6乘以10的-15次方） 。
　　如下标注的是文本中的黑名单token。
　　需要注意的是，如果想要水印正常发挥作用，并不受到攻击，就必须对文本进行一些标准化处理，并且需要检测某些类型的对抗性提示。
　　这一方法是对外公开的，将在2月15日 开源代码。
　　加一个随机秘钥，也能变成保密模式并且托管到API上，这能保证水印不会被篡改。
　　论文中使用的模型是Meta开源的OPT-1.3B 模型。
　　由于不用访问底层模型，所以该检测方法的速度很快，成本也不会很高。
　　而且可以使用标准语言模型生成带水印的文本，不用再重新训练。网友：似乎很容易绕过？
　　巴特，不少网友觉得，这个方法的具体实践效果可能远不及理想，质疑之声迭起。
　　有人提出：如果我在AI生成的文字基础上，修改几个词，还能被查出来吗？那在替换成近义词后，检测准确率会下降多少？
　　毕竟大家往往不会一字不改、直接用AI生成的内容。
　　对此，论文通讯作者、马里兰大学副教授Tom Goldstein回答称：对于一段自带水印的文字，至少得修改40%-75%的token，才可能成功去除水印。
　　（如果用其他程序修改内容话） ，为发生同义词攻击，导致生成内容的质量很低。
　　简而言之，想要通过换近义词来消除水印，得大篇幅修改，而且若不是人亲自手动修改的话，效果会很拉胯。
　　还有人提出：
　　对于专门设计过的低熵token序列，应该能检测出水印。但是，长度和检测率之间 （存在一些矛盾） ，它们的优先级应该如何权衡？
　　对此，Tom教授表示：根据设定，使用波束搜索时，绝大多数 （通常是90%） 的token在白名单上，即使是低熵token，也会被列入白名单。
　　所以，至少得修改一半以上的token，才能删除水印，而这需要一个超级强大的LLM模型才行，一般人很难接触到。
　　不过，研究者们也在论文中承认，这种方法确实存在一些局限性。
　　比如，检测水印的z统计量，只取决于白名单大小参数γ和生成白名单的哈希函数，和其他不少重要的参数并没有什么相关性。
　　这就让他人可以在下游水印检测器上做手脚，可以改变水印采样算法，重新部署水印，最终让原本生成的水印失效。
　　就连OpenAI CEO Sam Altman也表示：
　　创造完美检测AI抄袭的工具，从根本上来说是不可能的。
　　（尽管他说OpenAI打算启用水印大法）
　　但话说回来，人们为了限制AI生成文字的负面影响，还是煞费苦心——
　　之前就有人搞出了一个检测ChatGPT的网站，名曰GPTZero，只需要把相应的内容粘进去，几秒内就能分析出结果。
　　论文地址：
　　https://arxiv.org/abs/2301.10226
　　参考链接：
　　[1]https://twitter.com/tomgoldsteincs/status/1618287665006403585
　　[2]https://twitter.com/goodside/status/1610552172038737920
　　[3]https://www.technologyreview.com/2023/01/27/1067338/a-watermark-for-chatbots-can-spot-text-written-by-an-ai/
　　— 完 —
　　量子位 QbitAI · 头条号签约
　　关注我们，第一时间获知前沿科技动态

CBA辽宁VS浙江稠州勤能补拙是良训，一分辛苦一分才CBA第十四轮重头戏，领头羊浙江稠州，迎战强敌辽宁，赛前杨鸣指导已经盛赞过浙江，认为浙江实力强于广东和辽宁，可以说杨鸣指导很谦虚，但以目前浙江稠州的阵容厚度和外援状态，辽宁确实是被威少留队概率大增！美媒曝湖人盯上猛龙投手列3换1方案留6后卫北京时间12月16日，TA记者萨姆阿米克报道，在本赛季的训练营开始之前，湖人老板珍妮巴斯拒绝用威少去换步行者的迈尔斯特纳与巴迪希尔德。如今湖人交易他的概率越来越小。威少自10月28施暴侮辱被排挤，22岁少女以死抗争，揭开韩体坛最后的遮羞布请帮忙照顾好我的宠物狗，拜托了！2020年6月26日，韩国铁人三项运动员崔淑贤，在给朋友发完最后一条消息后。当天中午，便被发现在宿舍中自杀身亡，年仅22岁。作为韩国国内最被看好的铁与多名男子吐舌合影！40岁瓦妮莎频繁参加聚会，原来是想要改嫁了头条创作挑战赛不知不觉，科比的三公主碧昂卡已经迎来六岁的生日，这一家子的生活已经步入了正轨。虽然没有了科比的陪伴，可科比的兄弟大加索尔无时不再关心着这个家庭，在碧昂卡生日的这一天送今天，正式告别974球场！封面新闻记者闫雯雯喻言永别了，974体育场。来自中国北京的博主火阳阳在观看了巴西VS韩国的比赛之后，走出了974体育场，发了一条朋友圈向着974球场深深地鞠了一躬，好好地与这座有着3比4！丁俊晖英锦赛决赛重演，回应假球事件，拒绝与他人同流合污英公赛第3个比赛日，中国选手胜少负多，只有赵心童和傅家俊晋级下一轮（32强），最受球迷们关注的丁俊晖则止步32强。面对艾伦，他重演英锦赛决赛的剧本，3比1拿到赛点的情况下再次被对手电脑租好还是买好？在哪儿可以租？现如今，在快节奏工作之下，项目变化和人员流动等原因，让很多公司不再批量购置办公电脑，取而代之的是租赁模式。除了考虑成本之外，还有很多使用上的优势，购买是租赁无法比的。1。电子设备更为什么同样是65英寸，有的卖2300元，有的卖1万多？这次终于懂了电视作为大家童年的记忆，在没有电脑和手机的时代，电视是我们了解外面世界最快的途径，每天晚上蹲点看电视的记忆犹新，很多品牌也陪伴我们整个童年，例如，长虹康佳TCL等传统电视企业，不过中老铁路年考答卷成绩亮眼截至12月2日，中老铁路开通运营满一年，累计发送旅客850万人次货物1120万吨，客货运量持续增长，服务品质显著提升，辐射效应不断增强，国际物流黄金大通道作用日益凸显。（新华网12北极光创投宋高广中国医疗行业进入新周期投资关注散点式创新宋高广。资料图我们非常看好医疗行业的发展。尽管近两年一些赛道出现波动，但整体趋势一定是向好的。北极光创投合伙人宋高广分享了对医疗健康投资的观察。北极光创投长期专注于投资早期科技创新发改委猪价退出过度上涨预警区间，两节期间仍将适时投放猪肉储备点蓝字关注，不迷路国家发改委12月16日消息显示，据监测，12月5日至9日当周，36个大中城市精瘦肉零售价格周均价同比涨幅低于30，根据国家发展改革委等部门联合印发的完善政府猪肉储

<<<<<<－>>>>>>

59岁江华事业遭受打击！加入直播带货半年，疑因销量惨淡宣布结业伴随着大陆直播带货的兴起，很多香港老戏骨自感这是一块超级大的肥肉，而且可以不费吹灰之力就能捞取，随随便便直播就能带来销量，所以纷至沓来，殊不知这其中的门路很多，并不是所有港星都能够巩固川陕苏区的仪南战役1932年12月后，红军相继解放了通（江）南（江）巴（中），建立了川陕革命根据地。仪陇县和南部县的嘉陵江以东地区位于川陕苏区西南方向，南部县古有盐乡之称，是四川著名的产盐区。红军为幸福到万家第33集预告王秀玉离家出走，何幸福找万传家理论电视剧幸福到万家第33集预告有如下六大精彩看点。130万赔偿款到账，王友德和林桂枝息事宁人，内心还有一丝高兴，觉得有了这笔钱那小儿子的婚礼总算有着落了。王秀玉听到保健品厂的同事们私小姐姐，给你看样东西！女生在大街上，遇见过暴露狂吗？导语现在网上有很多即时的新闻，不仅有娱乐新闻，还有犯罪的新闻，我们可以通过网络来了解。在网上，我们可以看到一些人说自己曾经见过暴露症，不知道你们对暴露症有什么看法，你们知道暴露症是床上无性，床下随便，中年人的性焦虑，出轨真的能解决吗？老林同时出轨五名女子，确实让人难以理解。但看一下周围，好像都在出轨。以前觉得只有男性出轨，现在觉得，女性也出轨，只是她们不会说。只是我们忽略了男性出轨的对象是女性是未婚的，还是已婚美领馆对孟买港发号施令，印度外交部美方举动不合规环球时报报道记者李培松印度与美国因制裁俄罗斯问题又生龃龉。针对美国驻孟买总领事馆日前对孟买港务局发号施令，印度外交部14日表示，美方此举不符合相关规定。据印度论坛报14日报道，印度国兵队员发挥出色！顺利晋级半决赛决赛！胜利在望北京时间7月16日，2022年世界乒乓球职业大联盟，匈牙利布达佩斯球星挑战赛继续进行。国乒队员们发挥出色，顺利晋级半决赛，决赛。马龙，梁靖崑，王楚钦，莫雷高德挺进男单四强。孙颖莎，唐山打人案主犯是省公安厅干部儿子？当事人辟谣近日，河北省公安厅政治部副主任在微博的一则辟谣受到了外界关注。7月13日，微博用户听雨廖书胜在微博发文称，据传，唐山烧烤店打女人主犯陈继志的母亲，是河北省公安厅副厅级二级巡视员政治还珠格格王艳上热搜！曾跪着洗脚被儿子骂猪头，如今怎样了前几天，晴格格王艳在她的短视频账号晒了晒自家的小猫咪，就喜提了一个热搜。仔细一看才知道，原来是因为这个视频一不小心就坐实了王艳住在故宫旁的传闻。细心的网友发现视频中王艳窗边可以俯瞰谋女郎刘浩存频上热搜，难道是四字弟弟的挡箭牌，国话回应了谋女郎刘浩存频上热搜，难道是四字弟弟的挡箭牌，国话回应了！几乎同一天四字弟弟和谋女郎刘浩存同时上了热搜，这时候肯定有网友坐不住了，四字弟弟和刘浩存的关系大家都知道，可偏偏为什么同一口是心非？极力反对简体字的苏贞昌，居然在悼念安倍时写了简体字文叶德平工作室李不言台湾地区的台独分子们向来是严以律人，宽以待己！他们多次妄称简体字大陆电视剧大陆软件等都是文化统战的工具，因此不仅极力反对简体字在岛内的推行，还将爱奇艺等平台一举