保健励志美文体育育儿作文
投稿投诉
作文动态
热点娱乐
育儿情感
教程科技
体育养生
教案探索
美文旅游
财经日志
励志范文
论文时尚
保健游戏
护肤业界

36氪专访港科大教授杨强数据安全时代,可信联邦学习正在改变人

  文张婧怡
  编辑苏建勋
  这是一个隐私和数据安全比以往更受关注的时代。
  人工智能技术正在各行业应用落地,随之提高的是人们对用户隐私和数据安全的关注度。用户更加关注隐私信息是否未经许可便被他人出于商业或其他目的而利用,甚至滥用。
  同时,随着相关法律法规的进一步实施,已有很多互联网、金融机构等企业由于泄露用户数据而被重罚。
  另一方面,国家强调探索建立安全规格的数据要素流通规则。这意味着,监管趋严背景下,机构对数据的采集、流通与应用愈发谨慎;而同时现实又在不断推动数据要素加速走向开放共享。
  因此,联邦学习作为隐私增强计算与人工智能相结合的新型技术范式,成为了解决数据安全与开放共享矛盾的一个重要技术路径。
  联邦学习中,客户可以在自己的终端使用本地数据对模型进行训练,并将模型的加密参数进行上传汇总,将不同的模型更新进行融合,优化预测模型。
  而2022年将成为一个新的技术分水岭从联邦学习到可信联邦学习。
  针对近两年来隐私计算和联邦学习发展和应用中面临的安全、效率等挑战,可信联邦学习被提出,这一范式将隐私保护、模型性能、算法效率作为核心,共同构成了更加安全可信的联邦学习。
  举例来说,在一个新能源车厂的营销项目中,营销项目甲乙方两边的数据不能互传,但是又有业务合作,因此一定要在合作高效率的前提下,又保证数据安全。
  这时,可信联邦算法的出现就极大地降低了数据被攻击的可能性,又能极大提高效率。同时,算法能高效防止终端有恶意用户下毒,使得整个系统都是可信的。
  针对可信联邦学习这一新范式,香港科技大学计算机与工程系讲席教授、FATE开源社区技术指导委员会主席,可信联邦学习提出者杨强院士在接受36氪采访时表示:现在越来越多的公司主动要求引入隐私计算的解决方案,所以可信联邦学习的商业前景的大门是开的,只不过技术的人要更加聪敏地设计平衡的方案。
  杨强表示,任何多方参与进行人工智能建模的过程,都绕不开可信联邦学习这一通用的机器学习范式。
  可信联邦学习的核心命题是结合分布式机器学习和人工智能算法,找到联合建模可信、可行及可控的解决方案,极大降低隐私计算的成本,提升隐私计算应用质量,进而推动隐私计算的加速发展。杨强介绍。
  同时,杨强认为,目前开源已成为大势所趋,成为隐私计算产业生态核心组成部分。以国内首个联邦学习开源社区FATE为例,作为向隐私计算、联邦学习开源生态中的开发者、贡献者、用户及生态伙伴建立的学习与交流平台,帮助开发人员快速实现联邦学习应用开发与部署,可通过可信联邦学习中模型的版权保护(FedIPR),实现数据版权的保护和结果可溯源、可审计、可解释;通过开源、开放和共享,实现普惠。
  以下是36氪等媒体与香港科技大学计算机与工程系讲席教授、可信联邦学习提出者杨强的采访实录,经编辑后发布:
  媒体:与传统联邦学习相比,可信联邦学习进行了哪些拓展?其优势是如何体现的?
  杨强:传统上,隐私计算更多强调安全,就是不可见的部分。但是在实践当中,不管是用联邦学习也好、用多方安全计算也好,还是用什么其他的安全计算范式,在利用多方数据的安全前提下建模,都离不开联邦学习的整体框架,并且一定要把可用提到和安全一样的高度。
  所以问题是如何把安全效率和模型效能,就是模型的准确率和算法的效率,时间、复杂度,这三者如何做一个有机平衡。
  目前,我们已经有了一些进展:理论上,我们研究了通用的多方合作的联合建模、联合使用模型的方式,发现不管是联邦学习也好、隐私计算也好、安全多方计算也好,都逃不出这样一个均衡问题。我们把这个问题通俗易懂地描述成没有免费的午餐,就是不可能有乌托邦式的安全,也不可能有乌托邦式的效率。在实践当中,这三者的有效平衡是对每一个算法设计者和法律设计者的考验。下一阶段,我们在隐私计算和联邦学习技术的发展上,应该对这样的平衡非常重视。
  同时我们也认为,后期的管理非常重要。比方我们建立一个模型,这个模型另外一方使用。在使用过程中,万一它把模型进行二次售卖,在我不知情或者没有收益的情况下,就相当于把我的书复印了一份到其他的市场售卖一样的道理,是一个违法行为。
  另外就是互通互联,我们希望各家的解决方案能够很容易地互相联通,有共用的基础模块,最后大家可以把这些模块建成我们所要的基础架构,软件架构、硬件架构,这就好像我们盖房子一样,我们有各种材料,最后把这些材料盖成我们想要的房子。因此,开源尤其重要。
  开源对于安全机制也非常有效,因为大家都可以监管,在阳光下有漏洞的可能性远远小于在阴暗的角落发展出一个黑箱所可能犯的错误。所以,我们非常鼓励开源和普惠。
  媒体:今年应该是深度学习的十周年,在过去十年这一波人工智能是由深度学习驱动的,您认为可信联邦学习对于以深度学习为基础的人工智能发展的逻辑,是否会带来一些改变呢?
  杨强:我觉得有几个改变是非常明显的,也可以看作转折点。
  第一,现在发现深度学习驱动的人工智能发展确实非常有效,因为它促进了人工智能指数型的发展。但是现在也有很多的迹象表明并没有我们想象的那么理想,其中一个重要的原因是,它在输入端并没有大家想象的那么顺畅。数据都有属主,属主有它的考虑、有它的利益、有它的隐私,因此安全性、对隐私的保护也被提出,这些都是转折点的驱动力。
  第二个,在算法上,过去都是基于一个单计算中心设计的。但是当我们有了上千万的手机、有了上百万级的无人车,每一个端点都是一个计算中心。这种状态下,分布式的数据和分布式的计算,如何能够安全高效地进行人工智能的模型训练,这是过去没有考虑过的问题,这又是一个转折点。
  现在看到很多大模型都能做非常复杂的工作,但是他们在实用上却少之又少,也就是说它们现在变成一个奥运会的比赛,并没有深入到千家万家,为什么这样,原因就在这,数据不是这样分布的,数据真正是分布式的,算法没有跟上,所以在算法层面我们是要研究一种算法。
  最后,当我们有了这种分布式数据格局和伦理考虑之下,更多的不是数据在网络当中传输,是模型在传输,所以未来的世界是一个多模型世界,在多模型世界下,模型的治理、审计、合作、安全就被提出来了,在深度学习驱动的AI里面没有解决这样一个模型驱动世界的难题。
  媒体:从商业化的角度来看,可信联邦学习未来的商业潜力是怎样的?
  杨强:从大概三四年以前,隐私计算和联邦学习进入大家视野,到现在已经有了很多实际应用的案例,有些案例也给我们很多启发。其中一个重要的启发就是效率是一个非常关键的问题,如果使用一个隐私计算的解决方案使得算法的效率大为下降,这就属于一个不可用的技术。所以,我们既要安全又要效率,这是商用需求的一个前提,不是我们提出来的,这是很多需求方首先提出来的。
  首先是可用和安全并举,而不是空泛的安全,所以这方面的商业前景主要看需求,这个需求是非常强烈的。并且,我们也同时看到在法律和国家法规的要求下,现在普法的工作做得非常彻底,现在越来越多的公司主动要求引入隐私计算的解决方案,所以我觉得这个商业前景的大门是开的,只不过技术的人要更加聪敏地设计平衡的方案。
  媒体:未来我们会进入一个数据密态的时代,肯定要保证数据安全,它才能被更多人使用,但安全的提升是不是意味着全社会的数据流通的性能要下降呢,是不是意味着我们会迎来一个更慢的互联网?未来在这方面会不会引发新一轮的技术创新?
  杨强:实际上,我们希望数据是流通的。加了法律以后,大家都有所忌惮,可能在一个极端的情况下,大家都不合作,这个情况下是最安全的。
  现在我们也看到了这样一个现象,比方欧盟出了GDPR法案以后,很多公司不敢到欧洲去做生意了,这是因为它的禁止。所以,如果我们没有一个既合法又能够促进模型和数据的交流的技术手段,那就会形成一种孤岛和停滞的局面,这是我们不希望看到的。
  所以我们比较的不是那种野蛮状态下的互联网效率,而是在合法、安全状态下的互联网率。
  应该说,我们用了可信联邦学习,效率反而提高了,因为比较的对象是停滞的孤岛状态,孤岛是没有任何商业交流和合作的。
  相反,比那种野蛮生长的会不会更慢呢?野蛮生长是对谁有利呢?只对寡头有利,我们不认为野蛮生长是对大众有利的。
  这会不会引发软硬件结合新一轮的创新,我认为会。比方在隐私计算里面,可能在业界对隐私计算和联邦学习谁是谁的子集这样的问题,大家都有混淆。其实答案是非常简单的,我们有两个概念,一个是目标,一个是工具,隐私计算和联邦学习都可以是目标,它的目标在AI的角度来看,都是联合建模,利用分布式的数据建模,所以它们没有区别,你可以用一个名字作为另外一个名字的代名词。
  但是同时,它们又是工具,作为工具来说,他们都是工具箱的一员。比如安全多方计算是工具箱的一员,TEE硬件解决方案也是这个工具箱的一员,联邦学习这种分布式架构也是一员。我们可以把这些工具作为满足刚才说的隐私计算和联邦学习目标的手段和它们的组合作为一个手段,所以这样一个架构的隐私计算和联邦学习就并不是矛盾的,或者安全多方计算和联邦学习并不是二选一,而是大家都有用,可以组合完成我们的总目标。
  如何利用这些作为基础的建筑材料,有些是砖头、有些是混凝土、有些是门框,我们需要他们所有的互通互联能够搭建一个房子,这个房子就是隐私计算和联邦学习。所以从这一点来看,新的创新确实是在发生。
  媒体:您觉得在可信联邦学习模型最终成熟或者落地之后,下一个公共数据安全的挑战点还会出现在哪个方面?
  杨强:可信联邦是数字经济的一个赋能者。但是赋能归赋能,我们看到最终的目的是建立一个数字经济,在数字化的互联网上面进行的商业活动是满足一系列的伦理、道德、法律、规章,同时又高效,又可以产生商业价值,它的这个商业分配机制也是公平的。那么从我们现在的状态到刚才的理想状态中间,还有很多的路要走。我们建立一个可信联邦学习就是建立了这条公路,我们到达目标这条公路。
  因此在这之后可能会有各种不同的挑战,如何能够把需求变成一个真正的需求,而不是可有可无的一个状态。
  举例来说,我们现在所使用的软件,包括我们在PC、在手机上使用的软件还是比较落伍的。原因是我们现在基于的数据都是本地的,我们数据的传输还是在做数据上传,我们在进行一项工作的时候,往往是利用不到其他数据源上数据来帮助我们提高效率。
  但未来的软件也许会升级好几个版本,也就是说应该是联邦学习inside,每一个软件应该是自动地带有联邦学习的特性,大家可以自主地形成合作,可以分配合理的收益,并且合法合规,并且安全可信,可以大为提高我们的生产效率和生活质量。
  而在现在,我们正处于一个拓荒期。举例来说,好比我们刚刚从石器时代走入铁器时代,但是后面还有很多的路要走,才能真正走到数字时代。

交通数据法治建设需要解决两大难题对于自动驾驶汽车来说,前方的道路是用数据铺成的。在这个未来交通图景中,物理空间的交通与数字化的信息变得密不可分。我国目前缺乏兼顾创新需求和权利保护的交通数据立法,只有数据法治和……俄罗斯一项新研究发现,不抱怨的人抗压能力强积极对待过去、对人生愿景有长期规划的人抑郁少,睡眠好。相比较,那些消极对待过去、对现在持宿命论或享乐主义态度的人,对未来容易感到绝望和无助,表现出更多抑郁特征。俄罗斯心理学家和……2021年国庆节征文200字精选篇1:升起来了,升起来了,升到万众瞩目的高度。虽然没有惊涛骇浪,但有一种排山倒海的气势在起伏,有一种雷霆万钧的力量在激荡。升起来了,万物在这个高度里陶醉!……3分钟小学生自我介绍合集6篇初到一个新的环境,我们总归要向他人介绍自己,自我介绍是一展示自己的手段。那么自我介绍应该包括什么内容呢?下面是小编帮大家整理的3分钟小学生自我介绍6篇,欢迎阅读,希望大家能够喜……大家知道国产热水器哪个品牌质量好吗?感谢邀请!热水器分类家用热水器目前主要分为四种,它们各有特点。燃气热水器:即开即用,出水量不受限制,水温恒定电热水器:安装便捷,价格实惠太阳能热水器:绿色环保、安全,使用……数字化本质是什么?是怎样的?您好!很高兴回答您的问题!在21世纪的各个行业无不在谈智能化、数字化,各种论坛上digitize是必讲的话题。那么,数字化是什么?他的本质又是什么?一言以蔽之,数字……女儿写给忙碌的爸爸的一封信亲爱的爸爸:爸你是个大忙人,你刚进家门,还没来得及换好拖鞋,电话就响了,爸爸你连忙跑到屋里接电话。那时你还左脚穿着拖鞋,右脚穿着皮鞋,鞋带还是解开的。有时候,一家人……LeetCode判断子序列判断子序列题目描述:给定字符串s和t,判断s是否为t的子序列。字符串的一个子序列是原始字符串删除一些(也可以不删除)字符而不改变剩余字符相对位置形成的新字符串。(例如,a……必备小学叙事作文400字九篇在日常学习、工作或生活中,大家都有写作文的经历,对作文很是熟悉吧,借助作文人们可以反映客观事物、表达思想感情、传递知识信息。怎么写作文才能避免踩雷呢?以下是小编为大家整理的小学……加仓新能源!冯明远陆彬谢治宇等一季度买入这些公司记者杜薇编辑随着上市公司一季报陆续披露,明星基金的最新持仓动向也浮出水面。今年,随着原材料价格上涨,多家新能源汽车纷纷提价,股价却备受重挫,整体板块跌幅超30……有关开学第一天的日记5篇开学的第一天,即平常,又特殊的第一天!下面小编整理了开学第一天日记,供你参考。开学第一天日记篇1开学的第一天,永远是那么的让人充满想象,在来到学校的路上,我虽然外表……初三关于中秋节的作文600字【篇一】今年的中秋节与往年的不一样,今年的中秋月与往年的不一般。你看,那皎洁的月亮如同一面明镜,照亮了我们每一个人的心hellip;hellip;今年中秋节,我们全……
阿里女员工被侵害事件最新进展,警方称调查有难度,饭店员工发声阿里女员工被侵害事件曝光以后,引发全网关注。目前,阿里作出处罚决定,相关主管领导引咎辞职,涉事男员工辞退,永不录用。事发当天,警方已介入,目前正在侦办中。那么自7月27日事发至……童年趣事作文童年是五彩的,童年是绚烂的,也是值得我们回忆的。童年发生的许多事都像肥皂水泡泡一样消失了,但有一件事我还是忘不了。记得那是在一年的暑假,我早早地写完了暑假作业,妈妈怕我无……小米MIX4已发布,除了手机平板,MIUI系统更受关注就在今天,雷布斯今天按照时间节点如期发布了备受广大网友期待已久的MIX4,网上泄漏的数据太多了,米粉们对参数已经了如指掌了,所以也并没有过多的惊喜。MIX4手机详细……中芯国际钱没白花,7nm芯片正式传来消息美方要求台积电只要使用了美国技术就禁止为华为代工芯片,这也使华为陷入了芯片危机之中。华为的Mate40系列缺货严重,P50系列也从3月拖到了现在也是因为华为在芯片方面未能找到方……impala实操impala操作环境impalashellkinitktdataimpala。keytabimpalaklistimpalashell连接impala时指定impalad……蓝牙耳机啥牌子好?发烧友杨灿口碑最好的蓝牙耳机排行蓝牙耳机这款看似不起眼的数码产品,这几年可是得到了快速的发展。无论是音质,佩戴还是硬件配置等,都和前几年今非昔比了。不过发展的越快,品牌和型号也就越多,蓝牙耳机啥牌子好这个问题……电饭煲哪家强?2021上半年TOP50爆款产品透秘,哪个品牌本文为《2021年家电爆款产品榜单》系列文章之电饭煲篇。数据源自于京东、天猫、淘宝、苏宁易购、国美在线,2021年上半年电饭煲品类的合计销售数据。这可能是全网最全、……雷军突然官宣,小米新品牌代言人诞生,网友这次肯定没选错人选择品牌代言人听起来很简单,但实际上却非常困难,因为品牌代言人非常重要,某种程度上更是一个品牌价值观的体现,一个好的品牌代言人可以极大的提升品牌知名度和口碑,但相反一个有不良事……描写军训生活的作文300字【第1篇】在我们的生活中,有许许多多的第一次,第一次炒蛋炒饭,第一次独立入睡,第一次得奖在人生的道路上,我们会经历许许多多的第一次,但最令我难忘的是这次军训,因为这是我第……第一次撒谎作文3篇相信每个人都有许许多多的第一次,而且都会给我们留下深浅不一的印象。而我的第一次撒谎却记忆犹深,以下是小编给大家整理的第一次撒谎作文3篇,喜欢的过来一起分享吧。第一次撒谎作文一……妈妈我爱你优秀作文这个周末中有一项任务是对妈妈说一句;我爱你。回家的路上,我怀着忐忑的心情思考着该怎么说出口,毕竟我们是男孩,应该没有这个胆量吧。不知不觉中我走到了家门口,生怕妈妈在里面,迟迟不……又见外婆的照片850字作文后院的栀子花开了,香气围绕在后院,我看着看着,心口抽了一下。今年还有人为我戴栀子花吗?我的心引领我到一座老房子前,我抬头一看,发现我竟然到了外婆家。打开早已上锁的房门。看见墙上……
友情链接:易事利快生活快传网聚热点七猫云快好知快百科中准网快好找文好找中准网快软网