童话说说技术创业美文职业
投稿投诉
职业母婴
职场个人
历史治疗
笔记技能
美文纠纷
幽默家庭
范文作文
乐趣解密
创业案例
社会工作
新闻家居
心理安全
技术八卦
仲裁思考
生活时事
运势奇闻
说说企业
魅力社交
安好健康
传统笑话
童话初中
男女饮食
周易阅读
爱好两性

算法歧视?大数据折射人类社会偏见与阴暗

6月10日 孤小单投稿
  在未来的算法开发过程中应该对算法开发者进行适当的“算法伦理”教育,并且确定一些算法的“基本准则”,如同“机器人永不能伤害人类一样”。
  IG夺冠的喜讯让互联网沸腾,玩家们奔走相告,竞相庆祝。作为IG战队老板的王思聪随即在微博抽奖,随机抽113位用户每人发放一万元现金为奖励。
  可是抽奖结果出乎意料,获奖名单中有112名女性获奖者和1名男性获奖者,女性获奖者比率是男性的112倍。然而根据官方数据显示,在本次抽奖中,所有参与用户的男女比率是1:1。2,性别比并不存在悬殊差异。
  (获奖者名单,来源自微博夜的咖啡)
  于是不少网友开始质疑微博的抽奖算法,甚至有用户主动测试抽奖算法,将获奖人数设置大于参与人数,发现依然有大量用户无法获奖。
  这些无法获奖的用户很有可能已经被抽奖算法判断为“机器人”,在未来的任何抽奖活动中都可能都没有了中奖的机会。网友们纷纷开始测算自己是否为“垃圾用户”,微博的“算法事件”一时满城风雨。
  这已经不是第一次人们质疑算法背后的“公正性”。在大数据时代,人类会有越来越多的利益分配和大数据直接相关;谁都不想在求职中被大数据自动判断为“缺乏竞争力的求职者”或者在法庭审判上被大数据抓进监狱。
  然而事实却是,在算法决策的“黑匣子”面前,人类无法了解到算法的决策过程,而只能够了解到结果。
  纵观近几年,众多科技公司的算法都被检测出歧视,谷歌的搜索算法将黑人标记为“大猩猩”;微软公司的人工智能聊天机器人Tay出乎意料的被“教”成了一个集反犹太人、性别歧视、种族歧视等于一身的“不良少女”这些事件都引起了轩然大波,并且最终也导致了算法被叫停。
  为什么大数据算法会歧视?
  上梁不正下梁歪
  在计算机领域,有一句非常有名的缩写是GIGO(Garbagein,GarbageOut),翻译过来就是说,输入的如果是垃圾数据,那么输出的也将会是垃圾数据。而在大数据领域也有类似的说法,《自然》杂志曾用BIBO表示BiasIn,BiasOut,也就是说偏见进,偏见出。
  大数据可以理解成是社会的明镜,能够折射出人类社会中意识到的和没意识到的偏见。如果整个社会对某少数族裔或者性别有偏见,那么大数据也将在结果中展现出这种偏见。
  亚马逊公司曾经在2014年开发了一套“算法筛选系统”来帮助亚马逊在招聘的时候筛选简历,开发小组开发出了500个模型,同时教算法识别50000个曾经在简历中出现的术语让算法学习在不同能力分配的权重。但是久而久之,开发团队发现算法对男性应聘者有着明显的偏好,当算法识别出“女性”(womenandwomen’s)相关词汇的时候,便会给简历相对较低的分数,比如:女子足球俱乐部等;算法甚至会直接给来自于两所女校的学生降级。
  这个算法最终被路透社曝光,而亚马逊公司也停止了算法的开发和使用,但是为什么看似人畜无害的算法会变坏呢?
  亚马逊全球员工构成
  通过上图不难发现,亚马逊公司的整体员工构成以男性为主,而从路透社整理的自2017年起这些公司公布的数据中得知,像谷歌、苹果、微软、Facebook这些公司,整体上男性占了23,而单独挑出技术岗位,男性比例则达到了将近45。
  亚马逊用来训练算法的“老师(简历数据)”本身就带有很强的性别偏好,而年幼无知的算法则只能邯郸学步,从以往的简历数据学习,自然而然就学到了这个偏好,算法清楚的将互联网产业的性别偏好摆在了台面上。
  也就是说,算法的歧视是从人类社会学来的。数据不够,没法凑现行算法中很难存在绝对公平。
  众所周知的是,当算法学习的数据量越大时,算法的错误会越少,而且结果会越趋向于精准。就算人类能够开发出一套筛选系统排除带偏见的数据,将不带偏见的数据输入算法中给算法学习,算法也无法达到绝对公平。
  因为非主流总是拥有更少的数据,而主流永远拥有更多的数据。所以当两套算法相比较的时候,数据少的一方的错误会更多,而数据多的一方错误会更少。久而久之,两套算法之间的还是会拉开差距。
  举个例子:如果你加入IG,同时训练两款游戏,CS1。6和英雄联盟,而你在此之前从没有涉猎过相似的游戏。在加入训练之后,每天让你在完全相同的心理和生理状态下玩3个小时的CS1。6和3个小时的英雄联盟,剩下的时间吃饭睡觉,如果其他条件相同的情况下,你玩这两个游戏的水平应该是以相同的速度稳步提升。
  但是实际情况是,CS1。6这款游戏已经过时,玩CS1。6的人很少,你只能通过和少数玩家一起对战,在对战中提升水平,学习到的地图枪法相对固定,无法准确的衡量自己的水平提高的程度,并且玩家数量的缺乏让你的水平在有限范围内提高,容易达到瓶颈。
  但英雄联盟就不同,它是一款非常火爆的游戏,每天有无数的玩家能够和你对战,在每次对战中你都能够学到最新的战法,对英雄的熟练程度稳步提高,并且足够数量的玩家能够形成训练梯队,在对战中能够你能够清楚的了解到自己的水平提升情况,而且永远能够遇到比自己强的玩家。久而久之,虽然每天都是花相同的时间玩两款游戏,但是水平却会产生巨大的差距。
  现行算法中没有任何算法的准确率和公正率是百分之百的,这是一个算法学习领域暂时还未能解决的问题。
  在不远的未来可能有依靠少量数据学习的算法,但是当算法被应用到现实中的时候,算法还是有可能会根据实际情况调整偏好,倾向于主流人群。
  不能向“算法歧视”低头
  公平是每个人的事不公平的算法带来的歧视是无形、不易察觉而又影响深远的,这种歧视影响到算法控制的所有领域。
  如果不是本次悬殊的抽奖比率的差距,很少有人会意识到自己已经被划归为机器人,而被标记为机器人之后,少数群体也就被算法完全孤立了,在一个本来可以广泛参与的社交软件中,少数群体成为了旁观者,所有的抽奖活动都与他们无关,而且他们不知道如何消除自己身上的标签。
  久而久之,如果没有人关注并且发声,少数群体只能选择离开这个平台。
  关于如何解决算法歧视问题,科技界众说纷纭,有人曾提出算法要公正透明,能够让公众监督算法。但是算法不属于每一个人都有能力和愿意去监督的,它有其专业性的壁垒。现在已经有不少的科学家在努力开发出一套“公平公正”的算法系统,算法的未来可期。
  然而不容置疑的是科技公司以及组织不应该将“带有明显歧视性质的算法”在不经测试之下,应用到现实情景中。
  如果要将算法应用到更广泛的领域,就需要根据各行各业的情况定制算法并且对不同情况下的公平进行合理的定义,以保证人类社会中的法律规则、制度以及司法决策行为受到程序正义(ProceduralJustice)和正当程序约束。
  而在未来的算法开发过程中应该对算法开发者进行适当的“算法伦理”教育,并且确定一些算法的“基本准则”,如同“机器人永不能伤害人类一样”。
  参考文献:
  〔1〕张玉宏秦志光肖乐(2017)。大数据算法的歧视本质。自然辩证法研究。
  〔2〕JeffreyDastin(2018)。AmazonscrapssecretAIrecruitingtoolthatshowedbiasagainstwomen。Reuters。
  〔3〕量子位(2018)。AI学会了人类的“傲慢与偏见”,比如性别歧视。
  〔4〕MoritzHardt(2017)。HowBigDataisunfair。Medium
  〔5〕HannahDevlin(2016)。Discriminationbyalgorithm:scientistsdevisetesttodetectAIbias。TheGuardian
  〔6〕曹建峰(2017)。人工智能:道德外包与“黑箱”中的算法歧视。腾讯研究院。
  
投诉 评论

天猫双十一:如何在众多玩法中获利最大化消费者参与“双十一”为的是省钱,那么如何尽量拿到最低价?如何在众多玩法中不被迷花了眼,使得自己获利最大化?本文将一一解读。本篇是我写的双十一三部曲之二,初心就是好奇。之前……算法歧视?大数据折射人类社会偏见与阴暗在未来的算法开发过程中应该对算法开发者进行适当的“算法伦理”教育,并且确定一些算法的“基本准则”,如同“机器人永不能伤害人类一样”。IG夺冠的喜讯让互联网沸腾,玩家们奔走……当政府数字化成为弱势群体的最后一根稻草现如今,世界各地正在向政府数字化方向努力,政府数字化的施行会为人们的生活带来哪些变化呢?为了一张证件请假三天,跑了好几个部门还没办上的情况,可能不少人都经历过。每当……粉丝经济分析“粉丝”在媒介创造的虚拟环境中充分调动情绪,产生情绪化的模仿和顺从行为的经济模式,这种经济模式的出发点在于“粉丝”对某种商品或者某一类人群的关注度。一、粉丝经济定义……为什么我们更像是在为抖音筛选内容,而非消费内容?似乎每一个互联网创业者都有一个做社区的梦,然而,想要成功并非是一件易事。在之前,有种很流行的做法:几乎每个有意在互联网创业浪潮里打拼的人,或多或少都会想做个社区产品。……知识付费下半场的趋势探讨知识付费下半场该如何产生并展开?其呈现逻辑如何?本文将为你一一解读,enjoy“知识付费”一词并不新鲜,它并不是互联网催生出的专属词汇。交学费上学、拿钱补习课外班、……社区拼团们的未来,能进一步发展吗?继社区创业的风潮刮起后,一大波跟风者蜂拥而入,当前,社区创业项目又正在向社区拼团转型,未来,能够进一步发展吗?继风投(“疯投”)的社区O2O火遍一时之后,大部分社区O2O……95团购成功率100优惠券核销!这个小程序在“不善社交”的支阿里的社交梦早已不仅是说说而已,这些年以来阿里一直在不断地尝试以前人们总是调侃,阿里有个社交梦,腾讯有个电商梦。这么多年过去了,腾讯的电商梦因为成功的多线投资和小程序的搅……身处十字路口,小程序开发者应如何应对?小程序的战场上战火一直未曾停歇过,从微信开辟小程序市场,再到支付宝和百度相继加入,最近今日头条也正式推出小程序,整个业界似乎都对小程序寄予了厚望。继支付宝和百度之后,今日……互联网教育:在线教育五种商业模式有一个好的BusinessModel,成功就有了一半的保证。本文将问您拨开迷雾,浅析国内在线教育五种商业模式。自2012年网易云课堂创立,2014年腾讯课堂创立。持……百度会学与人人都是产品经理联合推出“产品经理频道”近年来,产品经理的职位需求相当旺盛,与之相关的教育资源更是成爆炸式增长。随之而来的一系列问题也逐渐暴露出来:教育资源分散、教育资源质量良莠不齐、行业内对产品经理缺乏一套标准的学……B站小黑屋:内容社区的自治和自管理风纪委员会从产品的角度来说是把审核维护的一部分工作交给用户,一方面增加用户粘性和活跃,一方面保证内容质量和社区氛围。1。B站内容管理上的放权和对用户和妥协1。1B站……
【人人晚报】127期:如何让产品在90后中爆红【导读】作为产品经理,每天想的最多的时如何打动用户吧,让用户一直在自己的产品中遨游。那么到底有哪些方法可以来吸引当下的90后呢?【正文】1。【……互动直播明星如何走进草根们的狂欢近期陌陌请来了音乐圈的知名人物梁翘柏来帮忙其打造陌陌现场,互动直播在公众传统的印象中一直都是草根们的狂欢,而此次像周笔畅这样的一线明星居然也开始借助陌陌踏入该领域,但与草根不同……如何摆脱3BAT阴影:KK与傅盛对话启发创业者这次凯文凯利(KevinKelly,以下简称KK)的中国之行,我非常关注。除了像追星一样合影,我更多的关注KK此次中国行的一些访谈与对话,并有幸参加了其中一场只有20人参加的私……【人人晚报】126期:O2O是真火,但烧的钱永远回不来【导读】即便是若干年后,我们会怀念这个有泡沫的时代,时至今日,我们还是无法否认带着O2O标签的。COM泡沫正在眼前重演。【正文】1。【O2O企……【JOJO带你逛起点】想做产品经理?过了我这一关再说!9月12迎来了起点学院广州又一次线下产品经理实战训练营。本次实战训练,汇聚了全国各地慕名而来的小伙伴,有大学生、产品经理、市场高手、CEO、创业者、技术工程师、测试、运营、牛X……好邻居与京东分手便利店与电商深度合作很难【导读】淘宝与台湾全家便利店联姻了。北京好邻居便利店与京东“分手”后,火速“勾搭”上了当当网。上海联华快客便利店开始为其兄弟企业百联E城提供收件服务了。便利店企业似乎都在以各种……从客户需求、主营业务和商业模式三个维度看教育科技的前世、今生1200亿人民币的在线教育市场规模,年复合增长率在19,当时间的齿轮走到了2015年9月,中国的在线教育市场在经历了这两年的快速发展时间后,开始逐渐成为冉冉上升的一条巨大赛道。……【人人早报】第85期:称霸世界腾讯新战早报导语昨天,小编才做了腾讯与阿里的战争的专辑。结果,今天小编不得不做腾讯与360的官司报道,我去腾讯这是想称霸世界的感脚啊。亲们你们是支持腾讯呢?还是支持腾讯呢?……透过达沃斯,看中国在互联网时代如何超越美国前几日,夏季达沃斯刚刚在大连落下帷幕,其所主办的达沃斯数字颠覆者论坛引来了学者、企业家等众多人士的热议。在这次论坛中,腾讯副总裁、腾讯网络媒体总编辑陈菊红与滴滴CEO程维、大众……大数据还是隐私?移动互联网给我们的二选一我们国人向来倡导“事无不可对人言”的信息共享情结。孔老爷子从小就教育我们说“君子坦荡荡,小人藏鸡鸡”,如果你做事总是遮遮掩掩,那么一定非奸即盗,社会舆论也整天叫嚣着“公平公正,……iOS9广告屏蔽Apple截胡Google搜索外界对于苹果将会在iOS9上加入广告屏蔽这个功能的说法已经有铺天盖地的报道了,很多人都把它看成是针对谷歌的传统广告收入的一次挑衅。其实大家有所不知的是,iOS9中所提供的另外一……【人人早报】499期:Facebook将推“dislike”早报导语早上好,亲们,小白今天让丫头来代班给大家做早报,么么哒。前段时间饿了么才融资成功,今天早上就看到美团官方发布了律师声明,报案追究造谣者刑事责任;据说Faceboo……
友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找作文动态热点娱乐育儿情感教程科技体育养生教案探索美文旅游财经日志励志范文论文时尚保健游戏护肤业界