范文健康探索娱乐情感热点
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

矮化女性和少数族裔,OpenAI的GPT模型成AI歧视重灾区

  机器学习技术近几年突飞猛进,许多强大的 AI 因此诞生。以知名科研机构 OpenAI 开发的语言生成模型 GPT 为例,它现在已经可以写文章、帮人做报表、自动查询信息,给用户带来了很大的帮助和便利。
  然而,多篇近期发表的论文指出,包括 GPT 在内的一些 AI 模型,其生成的结果包含基于性别和族裔的偏见。
  而这些 AI 模型在商业领域的应用,势必将导致对这些偏见对象的歧视得到强化。
  卡耐基梅隆大学的 Ryan Steed 和乔治华盛顿大学的 Aylin Caliskan 两位研究者近日发表了一篇论文《无监督的方式训练的图像表示法包含类似人类的偏见》 (Image Represnetations Learned With Unsupervised Pre-Training Contain Human-like Biases, arXiv:2010.15052v3) 。
  研究者对 OpenAI 在 GPT-2 基础上开发的 iGPT,和 Google的 SimCLR,这两个在去年发表的图像生成模型进行了系统性的测试,发现它们在种族、肤色和性别等指标上几乎原样复制了人类测试对象的偏见和刻板印象。
  在其中一项测试中,研究者用机器生成的男女头像照片作为底板,用 iGPT 来补完(生成)上半身图像。
  最为夸张的事情发生了:在所有的女性生成结果当中,超过一半的生成图像穿着的是比基尼或低胸上衣;
  而在男性结果图像中,大约42.5%的图像穿的是和职业有关的上衣,如衬衫、西装、和服、医生大衣等;光膀子或穿背心的结果只有7.5%。
  这样的结果,技术上的直接原因可能是 iGPT 所采用的自回归模型的机制。研究者还进一步发现,用 iGPT 和 SimCLR 对照片和职业相关名词建立关联时, 男人更多和"商务"、"办公室"等名词关联,而女人更多和"孩子"、"家庭"等关联;白人更多和工具关联,而黑人更多和武器关联。
  这篇论文还在 iGPT 和 SimCLR 上比较不同种族肤色外观的人像照片的"亲和度"(pleasantness),发现阿拉伯穆斯林人士的照片普遍缺乏亲和力。
  虽然 iGPT 和 SimCLR 这两个模型的具体工作机制有差别,但通过这篇论文的标题,研究者指出了这些偏见现象背后的一个共同的原因: 无监督学习。
  这两个模型都采用了无监督学习 (unsupervised learning),这是机器学习的一种方法,没有给定事先标注过的训练数据,自动对输入的数据进行分类或分群。
  无监督学习的好处,在于数据标注是一项繁琐费时的工作,受制于标注工的个人水平和条件限制,准确性很难保证在一个很高的水准上,标注也会体现人工的偏见歧视,一些领域的数据则缺乏标注数据集;无监督学习在这样的条件下仍能有优秀的表现,最近几年也很受欢迎。
  然而,这篇新论文似乎证明,采用无监督学习并无法避免人类一些很常见的偏见和歧视。
  研究者认为,这些采用无监督学习的机器学习算法中,其所体现的偏见和歧视的来源仍然是训练数据,比如网络图像中男性的照片更多和职业相关,女性的照片更多衣着甚少。
  另一个原因是这些模型采用的自回归算法。在机器学习领域,自回归算法的偏见问题已经人尽皆知,但试图解决这一问题的努力并不多。
  结果就是,机器学习算法从原始数据集当中学到了所有的东西,当然也包括这些数据集所体现的,来自人类的各种有害偏见和歧视。
  在此之前,OpenAI 号称"1700亿参数量"的最新语言生成模型 GPT-3,在发布的论文中也申明因为训练数据来自网络,偏见势必无法避免,但还是将其发布并商用。
  上个月,斯坦福和麦克马斯特大学的研究者发布的另一篇论文 Persistent Anti-Muslim Bias in Large Language Models,确认了 GPT-3 等大规模语言生成模型对穆斯林等常见刻板印象的受害者,确实存在严重的歧视问题。
  具体来说,在用相关词语造句时,GPT-3 多半会将穆斯林和枪击、炸弹、谋杀和暴力关联在一起。
  在另一项测试中,研究者上传一张穆斯林女孩的照片,让模型自动生成一段配文。文字里却包含了明显的对暴力的过度遐想和引申,其中有一句话"不知为何原因,我浑身是血。"
  Language models are few-shot learners, but they are also bias-promoters.
  而当这类算法被更多应用到现实生活当中时,偏见和歧视将进一步被强化。
  iGPT 和它背后的 OpenAI GPT 技术,现在已经开发到了第三代。它的能力确实很强大,就像我们之前曾经报道过的那样,几乎无所不能,也因此被许多商业机构所青睐和采用。
  其中一家最知名的客户就是微软。去年9月,微软 CTO Kevin Scott 宣布将和 OpenAI 展开合作,独家获得 GPT-3 的授权,将其技术应用到面向微软用户的各项产品和 AI 解决方案当中。
  微软尚未透露具体会把 GPT-3 应用到哪些产品当中,但考虑到微软产品十亿级的用户量,情况非常值得令人担忧。比如微软近几年在 Word、PPT 等产品中推广的自动查询信息、文字补完和图像设计功能,当用户输入某个特定词语或添加一张照片时,如果正好落入了 GPT-3 的偏见陷阱,结果将会是非常糟糕的。
  不仅 GPT,按照前述较新论文的说法,所有采用无监督学习的算法都可能包含这样的偏见。而现在因为无监督学习已经非常热门,在自然语言处理、计算机视觉等领域,它已经成为了非常关键的底层技术。
  比如翻译,对于人际沟通十分重要,但一条错误的翻译结果,一次被算法强化的偏见事件,少则切断了人与人之间的联系,更严重者甚至将导致不可估量的人身和财产损失。
  论文作者 Steed 和 Caliskan 呼吁,机器学习研究者应该更好地甄别和记录训练数据集当中的内容,以便能够在未来找到降低模型中偏见的更好方法,以及在发布模型之前应该做更多的测试,尽量避免把被算法强化的偏见带入模型当中。

立冬要多吃萝卜,加1块豆腐,教你新吃法,外香里嫩,孩子超爱吃立冬要多吃萝卜,加1块豆腐,教你新吃法,外脆里香,上桌孩子连汤汁都不剩天气越来越冷了,冬季我们这边吃得最多的就是青萝卜。最近我家一周都吃了4次萝卜了,每天我也是变了花样的来做,萝卜冷天早餐就馋这碗粉,10分钟上桌,营养不上火,大人孩子都爱吃冷天早餐就馋这碗粉,10分钟上桌,营养还不上火,大人孩子都爱吃。天渐渐变冷了,冷天早上就特别爱睡懒觉,很多人睡懒觉早餐都是随便解决的,其实越是冷天,早餐更是不能马虎,冷天的早餐来上孕妇怀孕全家断网,还要求隔壁关wifi,邻居没必要这么矫情文齐姐育儿本文为原创文章,欢迎个人转载分享在动物界,母兽护崽是一种本能。中学课本上也有这样一篇文章,叫藏羚羊的跪拜,讲的是藏羚羊被猎人追捕后放弃逃跑流泪跪拜的故事。虽然最后它仍被枪本周最佳就是它!两种食材,三步搞定,宝宝吃到渣都不剩最近发现了一个土豆的新吃法,真的让我惊喜万分!一端上桌,全家人就凑在一起夸了半天,小宝趁我们说话间,伸出小手想要偷拿两块,被眼尖的小阿姨立马给喊停了,别动,先让我拍个照,朋友圈先吃怀胎十月,胎儿一直在偷偷保护妈妈,太暖心了怀孕是一件非常辛苦的事情,孕吐吐得茶饭不思,全身酸痛难受,晚上睡觉还失眠睡多梦,总是尿频跑厕所整个孕期的准妈妈受尽折磨。但是为了宝宝,准妈妈们都挺了过来,小心翼翼地保护着胎宝宝可妈十月怀胎一朝分娩,胎儿猛涨期是这个阶段,过早进补只会徒添赘肉导读十月怀胎一朝分娩,胎儿猛涨期是这个阶段,过早进补只会徒添赘肉各位点开这篇文章的朋友们,想必都是很高的颜值吧,我们真的是很有缘哦,小编每天都会给大家带来不一样的育儿资讯,如果对小二胎政策已经放开五年了,婴儿出生率为什么还是在下降?老一辈人的思想观念是多子多福,孩子一定要多生,在当时大力推行计划生育的背景下,不管家庭条件是否允许,哪怕罚款抄家丢工作,他们依然坚持多生。所以造就了我国人口数量的巅峰,为国家经济的几天洗一次头才健康?洗发水会伤头发吗?正确调理是关键现在脱发掉发的人越来越多,其中很大一部分原因,是因为大家洗头的方式错了。很多人都有睡觉之前洗头的习惯,一天不洗头,就觉得头发油油的,睡觉都不踏实。这种习惯呢,虽然说是爱干净的表现,宝宝的安抚奶嘴,是哄娃神器还是坏牙元凶,全看爸妈怎么用上班休息期间和同事小张在聊天,她最近有一个事情特别苦恼,那就是孩子的牙齿问题。小张说在宝宝一个月左右就给他买了安抚奶嘴,因为那时哭闹现象很严重,再加上小张是新手妈妈,不知道怎么哄娃从万炮齐轰金门岛到象征性打宣传弹共产党与国民党用炮火达成默契炮击金门国共两党炮火中的默契从万炮齐轰金门岛,到只是象征性地打打宣传弹,毛泽东导演了一场新的战争戏剧。这场战争从打击美国的侵略企图和国民党的嚣张气焰开始,毛泽东始终把军事斗争和政治奇袭安顺场飞夺卢定桥的勇士们都得到了哪些奖励奇袭安顺场,飞夺泸定桥,是中国工农红军长征中的两场重要战役,打破了蒋介石妄图把红军变成第二个石达开的反革命迷梦,是红军长征中具有战略意义的重大胜利之一。安顺场十七勇士的姓名我们现在
荷兰版楚门的世界小镇都是老年痴呆病人,医生护士伪装居民荷兰阿姆斯特丹郊区的一个小镇,看起来平平常常,但是如果你仔细观察,会发现走在街上的几乎都是步履蹒跚的老人。这个小镇,是荷兰政府为了解决老年痴呆症患者的护理问题,专门建设的小镇,里面LV集团为什么花费320亿,就为买下一个凉鞋品牌?LV集团是世界上最大的奢侈品集团,旗下包含了众多的奢侈品品牌,例如路易威登LouisVuitton迪奥Dior纪梵希Givenchy芬迪Fendi宝格丽Bvlgari轩尼诗Henn滴滴在美国上市,第一天才涨了1相当难堪,问题出在哪里?中国的网约车巨头滴滴在美国成功上市,通过IPO筹集资金大约44亿美元。但是在第1天的交易日高开低走,最终小幅度涨了1,相对于一般上市企业第1天交易日普遍大涨的情况,滴滴第一个交易日大事件,G20财政部长会议支持全球最低企业税,对中国是好是坏?20国集团的多国财政部长在意大利威尼斯开会,批准一项针对跨国企业的全球税收改革提案,为订立最低15统一的企业税率,打下了坚实的基础。未来,全球统一15的最低企业税率,将会非常有希望为什么国际电影蜂拥到希腊进行拍摄?你知道么,电影主题国家和实际拍摄地可能完全是两个国家,比如北京遇到西雅图,美国场景根本不是在西雅图,而是全程在加拿大温哥华拍摄的。欧洲希腊,通过多样化的风情场景,低廉的拍摄价格,以中国新经济新职业,给玩偶娃娃化妆和整容随着中国新经济发展,新的职业不断涌现出来。让兔子吐舌头50块,给娃娃修毛40块,换双眯眯眼50块,玩偶IP现在已经衍生出了多元产业链,为了让盲盒里的娃娃变得更精致,由此出现了一个全朝日啤酒退出中国挺进欧洲,海外业务首次超过了日本国内差不多已经退出中国市场的朝日啤酒,现在在欧洲市场却很火,甚至比在它的本国市场日本,还要卖得好。虽然欧洲疫情比较严重,但是仍然创造了一年8000亿日元的收入,相比2019年增长了13ZARA遇到了强劲对手,来自中国的神秘品牌现在有家中国快时尚品牌,很多中国人都没听过,但是在国外年轻人中爆火,它家卖的衣服的火爆程度,直接抢占了Zara和HM的市场,今年的销售量很大可能将超过Zara,这个品牌专属的APP中国老龄化问题浮现,建筑行业越来越多的女工中国老龄化问题浮现中国老龄化问题慢慢浮现,人口计生法不断放宽生育数量限制,背后最为迫切的现实是,新生儿数量锐减,2020年相比2018年的新生儿数量,直接减少了300多万,同时却面中国发出明确信号,中国不允许有财阀马云曾经说我比总统还忙,但没有总统的权力,阿里巴巴全球一共有25万员工,但是想要总统权力的马云却连25万人的国也管不好,公司里年轻女员工被上级领导和客户在饭局上灌酒和性侵后,女员工养猪行业竟然这么难?中国养猪住宾馆,欧洲美国不能圈养猪肉都是大家喜欢吃的美食,养猪也是发展非常好的行业,随着科技水平发展,养猪变成了高科技行业,而且随着动物保护意识兴起,现在都养猪行业变化越来越大。养猪竟然这么难?!难倒了中国首富这