既然机器可以学习,它们还会忘记吗?
研究人员看看他们是否可以在不从头开始重新训练 AI 的情况下删除敏感数据。
各种公司都使用机器学习来分析人们的欲望、厌恶或面孔。一些研究人员现在提出了一个不同的问题:我们如何让机器忘记?
计算机科学的一个新兴领域被称为机器 学习, 正在寻找在人工智能软件中诱发选择性失忆症的方法。目标是从机器学习系统中删除特定人员或数据点的所有痕迹,而不影响其性能。
如果实用,这个概念可以让人们更好地控制他们的数据和从中产生的价值。尽管用户已经可以要求一些公司删除个人数据,但他们通常对他们的信息帮助调整或训练的算法一无所知。机器取消学习可以让一个人同时提取他们的数据和公司从中获利的能力。
尽管对于那些对他们在网上分享的内容感到后悔的人来说很直观,但人工健忘症的概念需要计算机科学方面的一些新想法。公司花费数百万美元训练机器学习算法来识别面孔或对社交帖子进行排名,因为这些算法通常比单独的人类编码人员可以更快地解决问题。但是一旦经过训练,机器学习系统就不会轻易改变, 甚至不会被理解.消除特定数据点影响的传统方法是从头开始重建系统,这是一项可能代价高昂的工作。"这项研究旨在找到一些中间立场,"宾夕法尼亚大学致力于机器学习的教授亚伦罗斯说。"当他们要求删除数据时,我们是否可以消除他们数据的所有影响,同时避免从头开始重新训练的全部成本?
机器取消学习的工作部分是由于人们越来越关注人工智能可能侵蚀隐私的方式。长期以来,世界各地的数据监管机构都有权迫使公司删除不义之举的信息。某些地区的公民,如欧盟和加利福尼亚州,如果他们对披露的内容改变了主意,他们甚至有权要求公司删除他们的数据。最近,美国和欧洲的监管机构表示,人工智能系统的所有者有时必须更进一步:删除针对敏感数据进行训练的系统。
去年,英国数据监管机构警告公司,一些机器学习软件可能会受到 GDPR 权利的约束,例如数据删除,因为人工智能系统可能包含个人数据。安全研究人员已经表明,算法有时会被迫泄露其创建中使用的敏感数据。今年年初,美国联邦贸易委员会迫使面部识别初创公司 Paravision删除了一系列以不当方式获取的面部照片和用它们训练的机器学习算法。FTC 专员 Rohit Chopra 称赞这种新的执法策略是一种迫使违反数据规则的公司"丧失其欺骗成果"的方式。
机器取消学习研究的小领域正在努力解决这些监管转变带来的一些实际和数学问题。研究人员已经表明,他们可以让机器学习算法在某些条件下忘记,但该技术尚未准备好迎接黄金时段。"对于一个年轻的领域来说很常见,这个领域渴望做的事情与我们现在知道如何做的事情之间存在差距,"罗斯说。
多伦多大学和威斯康星大学麦迪逊分校的研究人员在 2019 年提出的一种很有前景的方法是将新机器学习项目的源数据分成多个部分。然后单独处理每个,然后将结果组合到最终的机器学习模型中。如果稍后需要忘记一个数据点,则只需重新处理原始输入数据的一小部分。该方法被证明适用于在线购买数据和超过一百万张照片的集合。
Roth 和来自宾夕法尼亚大学、哈佛大学和斯坦福大学的合作者最近证明了这种方法的一个缺陷,表明如果提交的删除请求以特定的顺序出现,无论是偶然的还是来自恶意行为者,学习系统都会崩溃。他们还展示了如何缓解这个问题。
滑铁卢大学教授 Gautam Kamath 也致力于取消学习,他表示,该项目发现并解决的问题是关于如何让机器取消学习不仅仅是实验室好奇心的许多悬而未决的问题的一个例子。他自己的研究小组一直在探索通过让系统连续取消学习多个数据点来降低系统准确性的程度。
Kamath 还对寻找方法让公司证明——或监管机构来检查——系统真的忘记了它应该忘记的东西。他说:"感觉好像还有一段路要走,但也许他们最终会为这类事情配备审计员。"
随着 FTC 和其他机构仔细研究算法的力量,调查机器解除学习可能性的监管理由可能会增加。牛津大学研究数据保护的教授鲁本·宾斯 (Reuben Binns) 表示,近年来在美国和欧洲,个人应该对其数据的命运和成果有发言权的观念越来越多。
在科技公司真正实施机器学习之前,需要精湛的技术工作,让人们更好地控制其数据的算法命运。即便如此,该技术可能不会对人工智能时代的隐私风险产生太大影响。
差分隐私是一种巧妙的技术,用于对系统可以泄漏的个人信息进行数学限制,提供了有用的比较。苹果、谷歌和微软都对这项技术赞不绝口,但使用相对较少,隐私风险仍然很多。
Binns 说,虽然它确实很有用,但"在其他情况下,它更像是一家公司所做的事情,以表明它正在创新。" 他怀疑机器取消学习可能会证明是相似的,与其说是数据保护的重大转变,不如说是对技术敏锐度的展示。即使机器学会忘记,用户也必须记住要小心与谁共享数据。
自动驾驶存在降维打击吗?关键是抓住时间窗口文东篱自动驾驶公司又融资了,Momenta获得上汽集团在内的多家公司联合领投的5亿美元C轮融资。仅在今年1月,就有近30亿美元的资本涌入自动驾驶的赛道。几乎无路可
耳机很大,你忍一下雷柏Ti100蓝牙降噪耳机开箱前言真蓝牙无线耳机已经开始普及的今天,更多的厂家开始拓展新的领域,已经推出了多款真蓝牙无线耳机的雷柏也顺势推出了ANC主动降噪功能的Ti100,一起开箱一瞧开箱虽然雷柏Ti100产
首款V6引擎GT跑车这就是最便宜的法拉利?近日,外媒曝光了一组法拉利全新超跑的路试谍照,新车将搭载以中置V6双涡轮引擎为基础的油电混动系统,预计将成为法拉利旗下首款使用V6引擎的跑车,定位有点玛莎拉蒂MC20或者讴歌NSX
新增双擎版新款丰田奕泽将6月6日上市近日,一汽丰田官方对外透露,新款奕泽IZOA系列车型将在今年6月6日正式上市,新车在细节上有所调整,并首次推出2。0L双擎混动版可选。作为参考,此前上市的新款CHR售价区间为14。
电商数据采集效率开挂,从使用小捕快开始大家好上期介绍了简知系统大家有试用吗据统计我瞎哔哔的电商从业者在数据采集上每天至少花费2小时以上手动筛选数据调整样式做成表格最近创因科技推出了小捕快极大地提高了电商数据采集的效率除
地表最强!一加99pro手机保护贴膜钢化膜一加9系列的似乎很值得入手。那么问题来了,一加9por适合的曲面屏的保护膜好找吗?一加9适合的曲面屏钢化膜是真的不好找,两个月前,我在网上看到较多人都在讨论一加9por这款手机。我
掌阅iReader将发布10。3英寸电纸书预约价3069元根据掌阅电纸书官方微博的报道,8月27日,iReader将会发布新款电纸书。掌阅天猫旗舰店已经有了预约页面,这款10。3英寸的电纸书,搭载触控笔,预约价为3069元。据介绍,掌阅新
英伟达RTX2080显卡跑分曝光领先GTX1080Ti约30老黄在昨天正式发布了基于图灵架构的QuadroRTX专业卡,基本上可以确定新一代Geforce游戏显卡使用的就是图灵架构,主要是增加了RTX处理单元,大大提升光线追踪的性能。而现在
谷歌CEO确认中国审核版谷歌搜索App正在研发据CNBC报道,本周一,谷歌CEOSundarPichai承认谷歌正在开发一个中国审核版谷歌搜索App,并称能满足超过99的搜索请求。谷歌CEOSundarPichai透露了中国审
一分钟看懂坚果Pro2S配置详情8月20日老罗在发布会上正式发布了坚果Pro2S,虽然本次发布会的实机演示一如既往地出现了问题,但是这款手机的亮点还是很多的,一分钟看懂坚果Pro2S配置详情。坚果Pro2S本次共
智能窗帘一套500块终身可用不香吗?说起智能窗帘,大家都有一个误解。总感觉不好用,总是坏,这都是过去的老思想,传统观念。在没做智能窗帘之前,我也是这样想法。等到自己做了,发现不是这样的情况。首先介绍一下,智能窗帘是由