ChatGPT、Llama2等大模型,能推算出你的隐私数据!
9月1日 飞虹谷投稿 ChatGPT等大语言模型的推理能力有多强大?通过你发过的帖子或部分隐私数据,就能推算出你的住址、年龄、性别、职业、收入等隐私数据。
瑞士联邦理工学院通过搜集并手工标注了包含520个Reddit(知名论坛)用户的个人资料真实数据集PersonalReddit,包含年龄、教育程度、性别、职业、婚姻状况、居住地、出生地和收入等隐私数据。
然后,研究人员使用了GPT4、Claude2、Llama2等9种主流大语言模型,对PersonalReddit数据集进行特定的提问和隐私数据推理。
结果显示,这些模型可以达到85的top1和95。8的top3正确率,仅通过分析用户的文字内容,就能自动推断出隐藏在文本中的多种真实隐私数据。
论文地址:https:arxiv。orgabs2310。07298
研究人员还指出,在美国,仅需要地点、性别和出生日期等少量属性,就可以确定一半人口的确切身份。
这意味着,如果非法人员获取了某人在网络上发过的帖子或部分个人信息,利用大语言模型对其进行推理,可以轻松获取其日常爱好、作息习惯、工作职业、家庭住址范围等敏感隐私数据。
构建PersonalReddit数据集
研究人员构建了一个真实的Reddit用户个人属性数据集PersonalReddit。该数据集包含520个Reddit用户的个人简介,总计5814条评论。评论内容涵盖2012年到2016年期间。
个人属性包括用户的年龄、教育程度、性别、职业、婚姻状况、居住地、出生地和收入等8类。研究人员通过手工标注每一个用户简介,来获得准确的属性标签作为检验模型推理效果的真实数据。
数据集构建遵循以下两个关键原则:
1)评论内容须真实反映网上使用语言的特点。由于用户主要是通过在线平台与语言模型交互,网上语料具有代表性和普适性。
2)个人属性种类需不同种类,以反映不同隐私保护法规的要求。现有数据集通常只包含12类属性,而研究需要评估模型推断更广泛的个人信息的能力。
此外,研究人员还邀请标注人员为每个属性打分,表示标注难易程度及标注人员的确信程度。难易程度从1(非常简单)到5(非常困难)。如果属性信息无法直接从文本中获取,允许标注人员使用传统搜索引擎进行查验。
对抗交互
考虑到越来越多的语言聊天机器人应用,研究人员还构建了一个对抗对话的场景来模拟实际交互。
开发了一个恶意的大语言模型驱动的聊天机器人,表面作用是作为一个乐于助人的旅行助手,而隐藏任务则是试图套取用户的个人信息如居住地、年龄和性别。
在模拟对话中,聊天机器人能够通过似乎无害的问题来引导用户透露相关线索,在多轮交互后准确推断出其个人隐私数据,验证了这种对抗方式的可行性。
测试数据
研究人员选了9种主流大语言模型进行测试,包括GPT4、Claude2、Llama2等。对每一个用户的所有评论内容,以特定的提示格式进行封装,输入到不同的语言模型中,要求模型输出对该用户的各项属性的推测。
然后,将模型的推测结果与人工标注的真实数据进行比较,得到各个模型的属性推断准确率。
实验结果显示,GPT4的整体top1准确率达到84。6,top3准确率达到95。1,几乎匹敌专业人工标注的效果,但成本只有人工标注的1左右。
不同模型之间也存在明显的规模效应,参数数量越多的模型效果越好。这证明了当前领先的语言模型已经获得了极强的从文本中推断个人信息的能力。
保护措施评估
研究人员还从客户端和服务端两方面,评估了当前的隐私数据的保护措施。在客户端,他们测试了业内领先的文本匿名化工具进行的文本处理。
结果显示,即使删除了大多数个人信息,GPT4依然可以利用剩余的语言特征准确推断出包括地点和年龄在内的隐私数据。
从服务端来看,现有商用模型并没有针对隐私泄露进行对齐优化,目前的对策仍无法有效防范语言模型的推理。
该研究一方面展示了GPT4等大语言模型超强的推理能力,另一方面,呼吁对大语言模型隐私影响的关注不要仅限于训练数据记忆方面,需要更广泛的保护措施,以减轻推理带来的隐私泄露风险。
(举报)
投诉 评论
抖音打造单一爆款产品玩法各位村民好,我是村长。在抖音上卖货,已经是不争的事实。许多人都想在抖音上卖货赚钱,但到底卖什么,怎么卖一直摸不着头脑。相比那些明星、达人、品牌方来说,自己没有……
星巴克回应出bug:全力抢修中站长之家(ChinaZ。com)4月12日消息:不少网友反馈,星巴克App今日出现Bug,账户里忽然被发放多张优惠券,包括生日邀请券、周年庆邀请券等。对此,星巴克客服回应……
做抖音电商,你必须建立的两个底层思维2020年,直播电商站上风口。彼时,抖音最早一批“吃螃蟹的人”大多是一些实体店或者批发商,他们因线下生意的不稳定开始尝试线上直播。这类人群的货品都是自己实体店的商品,由于长期做……
电商平台内卷短视频:搬上首页、给补贴招达人,能否破局?近几个月,拼多多、京东、淘宝等电商平台先后传出了重点布局短视频的消息和动作。为此,有业内人士评论道:“传统电商平台2020年在直播赛道内卷了一波,现在开始要在短视频赛道继……
茶颜悦色负责人回应重庆开店非常有潜力站长之家(ChinaZ。com)4月13日消息:近日,网红奶茶品牌茶颜悦色宣布将在重庆开设三家新门店,对于新门店的开业,茶颜悦色品牌负责人翟敏慧表示,重庆是一个大城市,是非常有……
帅农鸟哥B站半月涨粉180万!能否超过张同学?上周在《B站最火理发师,一个月涨粉200万!怎么做到的?》一文中提到山城小栗旬是今年B站的涨粉狂魔,当时就有粉丝留言:“帅农鸟哥不服”。在看完B站一周涨粉数据后发现,帅农……
B站变短,创作者跟不跟?“竖屏封面功能已上线,辛苦通知所有竖屏主播今日更新粉版哔哩哔哩并上传竖屏封面。”这是一则发在B站直播娱乐公会群里的通知。通知下方工作人员还附上了一份详细的操作指引,并表示……
视频号直播商家激励计划升级主播商家可享免费流量了站长之家(ChinaZ。com)4月13日消息:日前,视频号面向部分商家发布通知称,为进一步扶持商家成长,平台将进一步升级商家激励计划,视频号主播和商家可以免费领取官方流量了。……
赶紧自查!巨量千川严打直播间投放商品“混淆信息”行为站长之家(ChinaZ。com)4月13日消息:日前,抖音电商发布了《巨量千川关于“混淆信息”行为的专项治理公告》,直播间投放商品混淆消费者认知平台的行为作出惩罚。抖音电……
B站报告:2021年求职相关视频播放量同比增长91站长之家(ChinaZ。com)4月13日消息:日前,哔哩哔哩与智联招聘联合发布了《2022青年求职行为洞察报告》,报告称,视频成为当代青年获取职场知识的新选择,在2021年就……
尴尬的中小博主:赚不到钱,也离不了场做了3年美妆账号的叶舒感觉到:“现在人人都是博主了。”事实确实如此。小红书、B站、抖音、快手等平台,不仅仅是社交和分享日常那么简单,嗅到网红效应巨大红利的年轻人们,早就琢……
快手打击恶意营销行为清理违规视频87336条站长之家(ChinaZ。com)4月13日消息:今日,快手发布《快手关于打击恶意营销行为的公告》称,近期通过技术手段与人工审核等方式进一步清理各类恶意营销内容和帐号,对以社会热……