OpenAI有偏见吗?为什么用不同语言生成一个女人图片,结果
我们探索了OpenAI如何用不同语言生成一个女人。
OpenAI项目的两项热门新技术ChatGPT和DALLE2都引起了媒体和社交媒体用户的广泛关注。在数字版权、技术和新闻领域,关于这些技术可以实现什么、哪些工作可能被取代、如何处理版权问题以及这些技术如何放大现有偏见的讨论正在进行。
全球之声尝试了AI图片生成器dale2,看看它是如何从不同语言生成图片的。我们用九种语言输入了同样的短语:窗户边一个悲伤女人的影子的油画。
以下是我们收到的结果:
英语Oilpaintingofashadowofagrievingwomanatthewindow
西班牙语Pinturaalleodelasombradeunamujerendueloantelaventana
捷克Olejomalbastnutruchlcenyuokna
俄罗斯
印尼Lukisancatminyakbayanganseorangjandaperempuanyangsedangberdukadisampingjendela
简体中文窗边悲痛女人的影子油画
哈萨克斯坦i
乌兹别克Derazaoldidaqayguchekayotganayolsoyasiningmoylirasmi
马拉雅拉姆语
显然,这些照片中的一些与原来的提示有很大不同。这可能是因为原始语言的数据不足。DALLE的发明者在接受TechCrunch采访时解释说,它使用的模型被称为CLIP(对比语言图像预训练)。CLIP使用从互联网上抓取的4亿对带有文字说明的图像进行训练。正如OpenAI在其网站上所说:
GPT3表明,语言可以用来指导大型神经网络执行各种文本生成任务。图像GPT表明,同一类型的神经网络也可以用于生成高保真的图像。我们扩展了这些发现,表明通过语言操纵视觉概念现在是触手可及的。
我们生活在一个视觉世界里,OpenAI的首席科学家伊利亚苏茨克弗在接受《麻省理工科技评论》采访时表示:
从长远来看,您将拥有既能理解文本又能理解图像的模型。人工智能将能够更好地理解语言,因为它可以看到单词和句子的意思。
由于不同的语言产生了如此不同的输出,该模型工作的网络搜索的重点似乎是使用更广泛使用的语言,如英语或西班牙语,而不是不太明显的语言。
因此,许多来自互联网的带有乌兹别克语或马拉雅拉姆语描述的图片并没有出现在人工智能训练的原始数据中。如果模型打算使用更多的语言,它需要更多地专注于训练带有英语以外描述的图像。否则,来自哈萨克斯坦的用户将继续收到美食而不是女性的照片,而说马拉雅拉姆语的用户将收到自然的照片。在某种程度上,俄罗斯的形象明显被性化了。印度尼西亚的这幅画描绘了几个女孩坐着,捷克的这幅画以一罐油抢了风头,获得了独创性奖。这些简体中文的图片简直太吓人了。
当然,基于这一点,我们不能说OpenAI是种族主义者。我们在这里可以看到,它没有收到足够的非英语语言数据。现在,它是否会保持这种状态,我们不知道,但我们强烈建议它不会。