范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

联邦学习前路如何?杨强已到合久必分的状态

  衡宇 金磊 发自 凹非寺
  量子位 | 公众号 QbitAI
  2022年,联邦学习论文数量出现大幅跃升 ,成为了屡登顶会的香饽饽:
  NeurIPS发布联邦学习论文41篇,较前一年有近30%的增长幅度;ICML则在2022年收录联邦学习论文74篇,几乎成倍于2021年。
  这个规律同样存在于顶会AAAI、AISTATS、KDD及CVPR中。
  联邦学习论文在顶会频现,相应的,相关产业实践也进行得如火如荼。
  这个现象的最好解答者,自然是联邦学习领域的国内最知名大牛:香港科技大学计算机与工程系讲座教授和前系主任、中国人工智能学会(CAAI) 荣誉副理事长、微众银行首席人工智能官杨强 教授。
  不仅因为他是CAAI,AAAI,ACM,IEEE,AAAS等多个国际学会Fellow,能够解惑一二。
  更能激起求知欲的是,这些联邦学习论文中,有多篇与他带领的团队有关联。
  △ 杨强
  今年,他在微众银行带领的AI团队,与上海交通大学、中山大学等机构联合撰写了3篇联邦学习领域论文 。
  这3篇论文,以一作身份,被IJCAI 2022、TPAMI 2022、ACM TIST国际人工智能顶级学术期刊和顶级学术会议收录发表。可信联邦学习,走的是一条怎样的路?
  2018年,国内引进了联邦学习(Federated Learning) 概念。
  为了解决数据割裂、数据孤岛等问题,杨强带领的微众银行AI团队在国内系统性提出联邦学习理论 。
  能够保证各企业在自有数据不出本地,不违规的情况下进行联合建模,提升机器学习建模效果。
  而后,又于2019年开源首个工业级联邦学习技术框架FATE ,同年6月捐献给Linux基金会。
  3年时间,在联邦学习领域探索的公司如雨后春笋。
  联邦学习发展空前,已在金融、医疗、互联网等领域落地应用,并延伸出图联邦学习、动态联邦学习、包容性联邦学习等研究分支。
  从刚开始的2018年至2019年间,FATE和主攻横向联邦学习的TensorFlow分庭抗礼,到2019年后,众多初创公司或以FATE为内核,或推出新系统。
  一路至今,用杨强的话来说,现在的联邦学习已经进入到"合久必分"的状态。
  正是在此基础上,联邦学习发展出第二阶段,可信联邦学习 。
  联邦学习的发展和应用,一直伴随着这样的声音:
  存不存在为了提高效率和性能,牺牲安全性的可能?
  杨强简明扼要地解释道,绝对安全等于绝对低效,绝对高效意味着绝对不安全:"联合建模要结合安全性和可用性一起看 。如果是一个极端安全的模型,安全到不能实际使用,这东西也没用。"
  对此,论文《联邦学习中隐私与模型性能没有免费午餐定理》通过研究给出的答案是:隐私保护、模型性能、算法效率三者需要平衡,且可以平衡。
  在联邦学习过程中,一个半诚实的攻击者,通过观察和了解参与方的数据信息,可能可以推断用户的隐私数据。这种针对隐私的攻击叫做"贝叶斯推断攻击(Bayesian Inference Attack) "。
  文章从信息论的角度,为联邦学习中隐私泄露和效用损失的分析提供了一个通用框架 。
  这个理论框架揭示了对于满足"贝叶斯隐私"的多方计算系统而言,都满足"|安全|+|效能|≤常数"这一"安全-效益恒定定律"。
  无免费午餐定理通过量化隐私和效用之间的约束关系,证明信息的相互泄露和模型效能是互相制约的。
  之所以叫"无免费的午餐",是因为研究表明,一般情况下,隐私和效用的权衡中,必须用一定程度的效用降低来交换隐私的保护,将潜在的隐私损失维持在可接受范围内。
  那么,能不能发明一种"聪明"的算法,把安全性、模型效能、准确率同时最大化 呢?
  微众银行AI团队和中山大学合作发表的另一篇论文——《FedCG:利用条件生成对抗网络在联邦学习中保护隐私并保持模型性能》——正面回答了这个问题。
  FedCG,文章提出的一种新的联邦学习方法,利用条件生成对抗网络,以实现高水平的隐私保护,同时保持模型的性能。
  具体而言,FedCG将每个联邦学习参与者的本地网络分解成一个私有提取器和一个公共分类器,然后保持提取器的本地性来保护隐私。
  △ FedCG概述图
  它结合条件生成对抗网络和分割学习,不是暴露提取器,而是通过与服务器共享客户端的生成器来聚合客户端的共享知识,从而提高本地网络的性能。
  实验表明,与联邦学习基线相比,FedCG有更好的隐私保护能力 ,同时在模型性能上也具有竞争力 。
  另外,考虑到联邦学习不是一次性的训练,它涉及数据的收集、选择,模型的训练、推断甚至交换,整个过程可能面临非法复制、重新分发、滥用的风险。
  针对于此,结合对模型知识产权保护的思考,微众银行AI团队进行了一项工作:提出一种联邦深度神经网络 (FedDNN) 所有权验证方案,称为FedIPR。
  《FedIPR:联邦学习模型所属权验证》一文详细介绍道,FedIPR方案允许嵌入和验证私有水印,来申明FedDNN模型的所有权。
  有了这个方案,模型由谁做出、有谁用过、谁进行过模型交易,以及模型的危险性、特别性等,都会得到很好的检测。
  如此这般,方便了对联邦学习模型进行全生命周期管理,也对模型知识产权起到保护作用。
  模型的归属权验证一直是业界致力于解决的难题,微众银行AI团队是首个在联邦学习中融入这项工作的团队。长远来看,这项工作有利于数据和模型市场的建立和规范。
  综合看来,此次陆续发表的3篇联邦学习论文,分别从理论、实践、规模化、工程化 等不同的角度,对可信联邦学习进行了全面探索。
  可信联邦学习的提出,通过提出端到端安全生命周期的管理、FedCG这种防火墙式的安全方法等一系列技术上的提升,再加入许多软件工程的管理,譬如软件治理、模型追踪等,将联邦学习领域的发展推进了一步。
  至此,联邦学习为何能够成为顶会们的香饽饽,也就有了清晰的眉目。
  而且对于联邦学习的火热,杨强还这样评价道:
  联邦学习的第二阶段,也就是可信联邦学习,从全世界范围来看都是刚刚起步,到处都有学者响应。
  但正所谓能用起来的技术才是好技术,那么接下来的一个问题便是:顶会们的"香饽饽",正如何改变我们的生活?
  正如我们刚才提到的,可信联邦学习需要处理的那些数据,一般都具备较强的独立性、隐私性、安全性 。
  因此,金融、医疗、物流、政务等场景便成为了联邦学习发挥其实力极佳的"试验田";尤其是在金融场景中,联邦学习涉足较早。
  联邦学习现在应用上的发展态势,用"百花齐放" 来形容不足为过。
  例如全球科技巨头谷歌,国内外学术机构如卡内基梅隆大学(CMU) 、北京邮电大学等名校也在致力于研究联邦学习;在论文全球高被引方面,国外机构谷歌排名第一,而国内机构则是杨强所在的微众银行。
  而且与之相关的开源框架也是陆续被提出,例如OpenMined推出的Pysyft、微众银行的FATE和谷歌的TFF框架等等。
  从大方向上来看,现在微众银行所使用的可信联邦学习,不单单是能够完成一个项目那么简单,更是能够对项目做一个分析和认证 。
  在此能力的背后,微众银行所依托的便是全球首个开源的工业级联邦学习框架——FATE(Federated AI Technology Enabler) 。
  而自2019年开源以来,这个框架也在不断的提升自己的能力。
  像刚才我们提到入围的几篇论文,都已经被涵盖了进来,目前已经步入2.0阶段。
  具体到实际案例,可信联邦学习在金融行业反欺诈 上便起到了很好的作用。
  因为在这个过程中所涉及到的数据着实纷繁复杂,包括银行机构、电商、运营商、政务等等。
  各方都需要保障自己数据的安全、隐私以及所有权,但交易过程中相互之间又有所交织。
  而可信联邦学习就能在保障这个大前提之下,还能做到挖掘金融行为、消费行为、通信行为、社交行为等众多特征。
  以及再针对不同细分金融反欺诈业务场景构建专有模型,从而提升金融行业的整体反欺诈能力。
  再如信贷风控 ,亦是如此。
  以往中小微企业在信贷风控上所面临的老大难问题,便是信贷评审数据稀缺、不全面、历史信息沉淀不足等。
  但有了可信联邦学习之后,就能在确保数据提供方数据安全以及隐私保护的情况下,让银行融汇企业经营数据、税务数据、工商数据、支付数据等多源信息,丰富建模特征体系,提升模型的有效性。
  由此可见,联邦学习能够成为顶会、顶刊们的香饽饽,不仅是因为在科研领域中所具备的前沿性,更是因为它在现实场景中正在发挥着不可替代的作用。
  那么对于被顶会、顶刊们pick的联邦学习,以及它玩转数据的这套打法,你怎么看?
  FATE框架地址:
  https://github.com/FederatedAI/FATE/blob/master/README_zh.md
  参考链接:
  [1]https://arxiv.org/pdf/2203.05816.pdf
  [2]https://www.ijcai.org/proceedings/2022/324
  [3]https://ieeexplore.ieee.org/abstract/document/9847383/
  — 完 —
  量子位 QbitAI · 头条号签约
  关注我们,第一时间获知前沿科技动态

50年广东流传怪病,14个村村民即将死绝,中央派专家调查表情怪异1950年,正值新中国成立不久,广东省三水地区北部的公社,来了个长相斯文的清瘦男子。他叫陈心陶,是一名出生于福建的学者。来这里前,他刚从美国考察回来,前脚刚踏上祖国的土地,立马就接最新智能手机重点市场厂商排名它在中国卖得最好9月19日,市场调研机构Canalys发布的数据显示,2022年第二季度,全球智能手机出货量减少至2。87亿台,是疫情爆发以来,2020年第二季度后的季度最低点。与此同时,今年二季智能投影仪,不要贵的只选对的昨天有小伙伴私信问我投影仪的推荐,我问他为什么不买电视呢,他说租的房子电视太小没意思太大搬家携带又不方便,投影仪是最优解。我也是最近了解到小明Q2智能投影仪,这款千元内卷王。体积小人工智能批量写营销文案拼接抽绳小脚裤AI文案多属性可控文本生成类型是裤版型是显瘦裤款式是拼接拉链抽绳裤腰型是松紧腰裤口是小脚1这款裤子采用了拼接的设计,让整体看起来层次感十足。松紧腰头搭配抽绳装饰,穿着舒适且不失时尚华为Mate50首发体验卫星救命只要7秒,1电量续命3小时智东西(公众号zhidxcom)作者云鹏编辑心缘智东西9月19日消息,最近华为和苹果接连发布了自家的年度重磅旗舰智能手机,先于苹果一天发布的华为Mate50系列,首发了北斗卫星通信首份!中国在售新能源汽车百强报告调研即将启动站在前所未有的大变局中,谁能拨开迷雾,纵览全貌?在全球能源紧缺以及碳达峰碳中的时代背景下,新能源汽车产业迎来前所未有的发展机遇。无论是政策的推动,还是消费者对新能源汽车需求的猛增,全国有车家庭中81。4的家庭汽车价格在20万元以下你家汽车多少钱?本报记者徐佩玉中国去年生产销售的汽车数量均为全球第一。今年以来,汽车消费稳步走旺,8月份汽车产销分别完成239。5万辆和238。3万辆,同比分别增长38。3和32。1。作为世界上最智能手表不只有华为小米HaylouRS4PLUS不到300堪称性价比典范HaylouRS4PLUS智能手表不到300元却可与华为小米千元手表一较高下?曾经的HaylouRS4凭借不到300的售价大火了一波,而现在HaylouRS4PLUS又保持了同样的每日一习话构建更加紧密的上海合作组织命运共同体视频加载中(欢迎点击视频,观看本期每日一习话)习近平我们应该高举上海精神旗帜,在国际关系民主化历史潮流中把握前进方向,在人类共同发展宏大格局中推进自身发展,构建更加紧密的上海合作组速递治愈乙肝新希望?创新疗法有望终止病毒复制,实验结果积极药明康德内容团队编辑BeamTherapeutics今日宣布其所开发的多重碱基编辑平台最新临床前积极数据。结果显示,此平台可显著减少乙肝病毒(HBV)表面抗原(HBsAg)等病毒生黑客曝光GTA6大量源代码,要价上万美元!steam一周销售榜近期游戏界有件大事情发生,R星悄悄开发多年的GTA6被人提前泄露,90多条视频片段总共高达3。4GB的内容在网上公开。此外一并泄露的还有接近1万行源代码。彭博社知名记者JasonS
魅蓝Note3魅族16T等机型无法参与电池免费焕新,魅族致歉IT之家9月11日消息,今日下午,魅族科技发文称,产品焕新计划免费换电池活动已公布两批机型,帮助许多用户手中的魅族经典产品重获新生。魅族表示,由于部分机型的电池物料停产已久,以及投2022年换手机可以看看这四款,性能强耗电少还便宜,用5年不卡顿您在阅读前请点击上面的关注二字,后续会第一时间为您提供更多有价值的相关内容,感谢您的支持。随着手机性能的提升,手机的耗电量也在逐步地增加,不过天玑芯片由于耗电量低性能强而受到很多用比小米更具性价比,荣耀这款骁龙芯66W快充,好评率高达97对于很多人来说,小米手机是众所周知的性价比手机,尤其是红米系列手机,一直很具有性价比,成为了普通消费者的首选。不过国产手机品牌众多,高性价比手机层出不穷,因为推出千元机的公司非常多腾讯回应年内减持1000亿股票投资没设定目标金额,也无外部压力Tech星球9月2日消息,近日,网传腾讯今年内目标减持1000亿元股票投资的消息引发热议。对此,腾讯方面回应称,没为减持设定任何目标金额腾讯的投资一向以为公司和股东创造丰厚回报为目关于一个苹果与天人合一的哲思世界上有两个著名的苹果,一个是牛顿的苹果,砸出了历史影响深远的万有引力定律。另一个是乔布斯的苹果,一个被上帝咬了一口的残缺苹果,却缔造了一个移动互联网的新时代。当下,一个长相俊美秀车长超5米轴距2980mm,提供67座可选,大众揽境够大够宽敞在生活中,国人对大空间的追求从未停歇过,人们都比较喜欢大房子大车子。尤其是在二胎三胎政策开放以后,很多家庭都已经有了二孩甚至三孩,如果全家一起出行的话,一般的五座车型就显得不够用了我的账户还有6。5w,我想炒到1000W我于21年12月8600元入市,两天时间赚了19。我记得很清楚,当时买的是华塑股份。当时深感遗憾自己怎么没早一点接触股市,这也太好赚钱了吧。都说亏得多人开始玩的时候是赚钱的,我信了小康股份三度更名,绑定华为战车,赛力斯前景几何?文胡嘉琦石丹IDBMR2004小康股份又又又更名了。2022年8月2日,华为在汽车领域的合作伙伴重庆小康工业集团股份有限公司(下称小康股份)证券简称变为赛力斯,证券代码601127煤潮疯即将到来1。国内产能出清,激进的碳中和,这几年的限产限电造成煤炭产能紧缩。最后并没有像预想的那样,替代煤炭。2。2021年之后的全球经济复苏(货币宽松下的刺激),钢铁铝业铜,以及很多稀有金没钱拿地后,房企只能干这事了?撰文李逗编辑孙春芳开发商房子不好卖的2022年里,代建一哥绿城管理的生意突然翻红了。2022年7月中旬,位于广州白云新城的奥园云和公馆的业主们,终于等来了一个好消息。这个已经停工了2023年,天津城乡居民医保调整!涉及缴费报销近日,市医保局市财政局市人社局市税务局发布关于做好2022年城乡居民基本医疗保障工作的通知。本通知自印发之日起施行,有效期5年。2023年,天津医保个人缴费标准待遇保障水平均有所提