范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

看不见的Unicode码让敏感词轻松逃过审核,谷歌IBM都中招

  Unicode 码作为全世界文字的统一编码,使用范围广,用它去对 NLP 模型做对抗攻击,可谓中招一大片。
  就比如下面这个谷歌翻译:
  文字部分都没有啥问题,注意到账户数字 4321 翻译前后不一样吗?
  为什么会发生这样的情况?
  来看 Unicode 码是怎么捣的乱吧。
  其实原句中就是 1234,问题出现在左边:英文句子中数字前面插入了一个不可见的字符 0x202E。
  这是一个可以把字符的文本方向倒转的 Unicode 码。这样一来,左边的解析系统就会将该 1234 显示成 4321。
  而谷歌翻译引擎的机制是忽略 Unicode 码,也就是右边还显示原来的 1234。因此,两边就不一样了。
  这个例子虽然没啥杀伤力,如果万一真有人将它用在了真实转账场景,后果会如何呢?使用 Unicode 码对 NLP 模型进行对抗攻击
  事实上,这种情况在真实场景中并不少见,通过在输入文本中插入一些看不见的 Unicode 码进行对抗攻击,就有可能骗过 AI 的语言处理系统去做一些"坏事"。
  比如改账号、改收款人姓名、绕过评论审核发一些极端言论……
  而且即使是微软、谷歌、IBM 或 Facebook 这样的大公司开发的软件都可能会因为对 Unicode 码风险意识的缺乏,被一些精心设计的 Unicode 码骗过。
  下面就来看一个发垃圾评论的例子:
  "You are a coward and a fool",假如这样一个不友好的评论无法通过审核发出去,那么利用 Unicode 码,你只需这样加工一下:
  You akU+8re aqU+8AU+8coward and a fovU+8JU+8ol.
  也就是在一些字母中间加上一个多余的字母和 U+8,就能让审核系统(The moderation system)忽略 Unicode 码、看到一串拼写错误的句子,从而将一些本不该出现的不友好评论放出来。
  U+8:用于删除前一个字符的不可见 Unicode 字符。
  这一招对谷歌的 Perspective API 和 BMI 的 Toxic Content Classifier(两个语言审核系统)都有效。
  再来一个同形文字的例子:
  将"paypal"中第一个英文字母 a 换成西里尔字母 a,尽管这俩人眼视觉上看起来是一样的,但 Unicode 码不同,谷歌俄语翻译最终就会将它翻译成"папа",也就是"爸爸"的意思。
  这样一来,"有心之人"没准就能在有同样问题的 AI 程序中进行违规付款等操作。如何防止此类情况的发生
  来自英国剑桥大学和加拿大多伦多大学的研究人员发现了上述机器学习模型中对输入文本处理的这一问题,在今年 6 月发表的一篇论文中进行了阐述。
  他们通过对包括微软谷歌旗下等在内的商业系统进行对抗攻击发现:
  通过一次不可察觉的编码注入 —— 比如一个不可见字符、同形符、重新排序或删除的操作字符 —— 攻击者可以显著降低一些模型的性能,而经过三次注入,大多数模型都可能在功能上失灵。
  利用视觉和逻辑表示之间的差异,仇恨言论、垃圾信息、损失财产的风险等操作会出现在任何机器学习用于自然语言处理的地方。
  (当然,计算机视觉方面也早就出现过了一些类似原理的对抗攻击。比如下面这两个经过特殊处理的标志就会被自动驾驶系统认成限速标志。)
  下图说明了文本可视化和 NLP 处理管道两者之间的差异是如何给对抗攻击留下可乘之机的:
  一些 NLP 模型无法处理具有不同编码的控制序列或看起来相似的字母。
  在具体过程中,NLP 管道会将文本 token 化之后注释掉它不认识的 token,这一步差异也就是造成问题出现的主要原因。那面对自然语言模型的被对抗攻击,又该如何处理呢?
  研究人员提出了一些见解:
  要么处理输入时完全过滤掉特殊的 Unicode 字符;
  要么将 Unicode 传递给神经网络之前将其传递给解析器 *(如果可行的话)*,这样才能保证用户看到的和神经网络处理的是同一个东西。
  像那种从英文字母到西里尔字母的变化就更应该被严加注意。
  相关论文:
  https://arxiv.org/abs/2106.09898
  参考链接:
  https://forums.theregister.com/forum/all/2021/08/06/unicode_ai_bug/

淘宝会员名可以改了?淘宝官微暂时不能改IT之家9月17日消息此前有网友发帖称可以改淘宝会员名了,对此淘宝官微表示,暂时不支持修改会员名,可以自主修改的是淘宝昵称,用户可以在自己的手淘操作界面自行修改,不需要联系淘宝客服当当科文盖公章公告承认李国庆为公司董事长和总经理IT之家4月26日消息今日晚间,李国庆方面用北京当当科文电子商务有限公司的名义发布声明,表示,没有当当公司公章的公司声明,均不能代表公司。当当网今天下午发布声明表示,称李国庆伙同5当当10答李国庆夺章俞渝很平静,望他离当当越远越好李国庆伙同多人上门抢夺当当网公章一事持续发酵。今晚,当当副总裁阚敏在接受新浪科技等采访时,回应了该事件所引发的部分热点问题。1,今天到底发生了什么?阚敏除了李国庆外,有7个人,突然李国庆确认接管当当网,称召开董事会当选董事长最新李国庆发告当当全体员工书重管公司,俞渝无职权4月26日下午消息,今日有消息透露,李国庆率人上门抢当当公章,并发布告当当全体员工书。对此消息,李国庆向新浪科技确认,已接管当当。在李国庆发告当当全体员工书重管公司,俞渝无职权4月26日下午消息,今日有消息透露,李国庆率人上门抢当当公章,并发布告当当全体员工书(以下简称告知书),称俞渝仅为董事,无任何职权李国庆当选董事长,负责公司经营管理。李国庆在告知书经济学家谈李国庆夺公章肯定要承担刑事责任针对李国庆抢夺当当网公章一事,中南财经政法大学数字经济研究院执行院长盘和林在接受新浪科技采访时明确指出,抢公章属于违法行为,肯定要承担刑事责任。盘和林认为,在这起事件中,第一,李国李国庆率4条大汉上门抢当当公章是否有理?律师取决于股东大会的合法性IT之家4月26日消息新浪法问消息,今日下午李国庆率4大汉抢当当公章一事持续发酵,目前李国庆方面已发文称重新接管公司,而当当方面称已报警且李国庆所抢公章无效。有律师也就此次事件作出当当网目前朝阳隔离区同事核酸检测全部阴性IT之家2月23日消息IT之家获悉,22日晚,当当网就员工确诊新冠肺炎一事再次发声目前朝阳隔离区的同事,核酸试剂检测全部阴性。其他集中隔离的同事,体征正常。同时,当当网表示,经与疾当当网员工家人感染新冠肺炎,李国庆希望早日康复IT之家2月17日消息昨日下午当当网创始人李国庆发布微博表示,一些网络公司急于在公司办公是因为没有把员工健康放首位,还因为工作目标不清晰上级喜欢随意且过程管理缺乏激励制度。另得知当北京开展共享单车专项治理行动,将曝光拒不改正企业IT之家5月13日消息据交通北京发布消息,北京市将从2019年5月13日起,开展为期一个月的互联网租赁自行车专项治理行动,将重点针对乱停乱放违规投放破损废弃的互联网租赁自行车和违规摩拜单车回应无法扫码用车已恢复服务IT之家4月19日消息今日有网友反馈摩拜单车一度出现无法扫码用车,摩拜方面回应称,目前摩拜单车已恢复服务,用户可正常扫码用车。今日晚间有网友反馈称,微信小程序上摩拜单车无法扫码用车
腾讯已启用QQ。中国域名IT之家8月6日消息据中国互联网络信息中心官网,腾讯公司今年陆续开通解析了QQ。中国与腾讯。中国两个域名。其中,QQ。中国解析到腾讯网,腾讯。中国解析到腾讯官网。IT之家发现,目前首个鸿蒙HarmonyOS职业认证体系发布,含三个开发者级别IT之家7月16日消息今日HarmonyOSConnect伙伴峰会在重庆召开。在大会上,华为正式发布了首个HarmonyOS职业认证体系。这一认证体系针对想要加入HarmonyOS摩根士丹利将苹果目标股价调高至166美元,预计Q2业务强劲北京时间7月15日晚间消息,据报道,投资银行摩根士丹利今日发布投资研究报告,将苹果公司目标股价从162美元调高至166美元,继续维持其股票增持评级。摩根士丹利分析师凯蒂休伯特(Ka美国数字支付服务商Stripe聘请法律顾问,为上市做准备北京时间7月9日下午消息,据报道,多位知情人士今日称,美国数字支付处理服务商Stripe已聘请一家律师事务所帮助筹备上市事宜。目前,Stripe正在考虑直接上市模式,而非传统的IP迅雷COO罗为民因个人原因辞职,继续担任战略顾问北京时间6月1日晚间消息,迅雷(NasdaqXNET)今日宣布,公司首席运营官(COO)罗为民因个人原因辞职。该辞职于2021年6月1日生效。辞职后,罗为民将继续为迅雷提供支持,并迅雷2021年Q1营收5330万美元,环比增长5。95月20日晚间消息,迅雷(纳斯达克XNET)发布了截至2021年3月31日的第一季度未经审计财报。财报显示,Q1迅雷集团各项业务总营收为5330万美元,环比上升5。9。云计算及其他研究机构一季度全球云IT基础设施支出同比增长2。26月29日消息,据国外媒体报道,今年一季度,汽车航空等众多行业都受到了影响,但云计算并未受到明显的不利影响,相反,企业和机构对云计算的需求还有增加。对云计算需求的增加,也拉动了对云云计算厂商加快采用液体降温,传统散热已难以满足需求6月17日消息,据国外媒体报道,随着越来越多的企业将业务负载转移到云计算平台,对云计算的需求大幅增加,云计算服务提供商对设备的降温也有了更高的要求,正在加快采用液体降温,而传统的散美国防部采购行为被质疑,百亿美元云计算合同或重新竞标6月11日消息,据国外媒体报道,美国联邦巡回上诉法院似乎要求国防部重新审查其有争议的100亿美元云计算服务合同。此前,甲骨文公司提起诉讼称,合同招标条件不公平,排除了合格的竞争者。从亚马逊谷歌挖角,苹果也要对云计算下手了看上去,苹果正在进行疯狂招募,打算组建云计算的全明星阵容。就职于GoogleCloud负责维护开发者关系的KelseyHightower,上个月在Twitter上透露。而科技媒体P天猫成立房产部门称至少3年不赚钱,收入全补贴购房者IT之家9月16日消息天猫宣布,与合作伙伴易居联合推出天猫好房,并共同发布不动产交易协作机制(ETC)。IT之家了解到,未来,天猫好房将帮助房地产企业定制线上房产旗舰店,把3D购技