童话说说技术创业美文职业
投稿投诉
职业母婴
职场个人
历史治疗
笔记技能
美文纠纷
幽默家庭
范文作文
乐趣解密
创业案例
社会工作
新闻家居
心理安全
技术八卦
仲裁思考
生活时事
运势奇闻
说说企业
魅力社交
安好健康
传统笑话
童话初中
男女饮食
周易阅读
爱好两性

ChatGPT、Llama2等大模型,能推算出你的隐私数据!

9月1日 飞虹谷投稿
  ChatGPT等大语言模型的推理能力有多强大?通过你发过的帖子或部分隐私数据,就能推算出你的住址、年龄、性别、职业、收入等隐私数据。
  瑞士联邦理工学院通过搜集并手工标注了包含520个Reddit(知名论坛)用户的个人资料真实数据集PersonalReddit,包含年龄、教育程度、性别、职业、婚姻状况、居住地、出生地和收入等隐私数据。
  然后,研究人员使用了GPT4、Claude2、Llama2等9种主流大语言模型,对PersonalReddit数据集进行特定的提问和隐私数据推理。
  结果显示,这些模型可以达到85的top1和95。8的top3正确率,仅通过分析用户的文字内容,就能自动推断出隐藏在文本中的多种真实隐私数据。
  论文地址:https:arxiv。orgabs2310。07298
  研究人员还指出,在美国,仅需要地点、性别和出生日期等少量属性,就可以确定一半人口的确切身份。
  这意味着,如果非法人员获取了某人在网络上发过的帖子或部分个人信息,利用大语言模型对其进行推理,可以轻松获取其日常爱好、作息习惯、工作职业、家庭住址范围等敏感隐私数据。
  构建PersonalReddit数据集
  研究人员构建了一个真实的Reddit用户个人属性数据集PersonalReddit。该数据集包含520个Reddit用户的个人简介,总计5814条评论。评论内容涵盖2012年到2016年期间。
  个人属性包括用户的年龄、教育程度、性别、职业、婚姻状况、居住地、出生地和收入等8类。研究人员通过手工标注每一个用户简介,来获得准确的属性标签作为检验模型推理效果的真实数据。
  数据集构建遵循以下两个关键原则:
  1)评论内容须真实反映网上使用语言的特点。由于用户主要是通过在线平台与语言模型交互,网上语料具有代表性和普适性。
  2)个人属性种类需不同种类,以反映不同隐私保护法规的要求。现有数据集通常只包含12类属性,而研究需要评估模型推断更广泛的个人信息的能力。
  此外,研究人员还邀请标注人员为每个属性打分,表示标注难易程度及标注人员的确信程度。难易程度从1(非常简单)到5(非常困难)。如果属性信息无法直接从文本中获取,允许标注人员使用传统搜索引擎进行查验。
  对抗交互
  考虑到越来越多的语言聊天机器人应用,研究人员还构建了一个对抗对话的场景来模拟实际交互。
  开发了一个恶意的大语言模型驱动的聊天机器人,表面作用是作为一个乐于助人的旅行助手,而隐藏任务则是试图套取用户的个人信息如居住地、年龄和性别。
  在模拟对话中,聊天机器人能够通过似乎无害的问题来引导用户透露相关线索,在多轮交互后准确推断出其个人隐私数据,验证了这种对抗方式的可行性。
  测试数据
  研究人员选了9种主流大语言模型进行测试,包括GPT4、Claude2、Llama2等。对每一个用户的所有评论内容,以特定的提示格式进行封装,输入到不同的语言模型中,要求模型输出对该用户的各项属性的推测。
  然后,将模型的推测结果与人工标注的真实数据进行比较,得到各个模型的属性推断准确率。
  实验结果显示,GPT4的整体top1准确率达到84。6,top3准确率达到95。1,几乎匹敌专业人工标注的效果,但成本只有人工标注的1左右。
  不同模型之间也存在明显的规模效应,参数数量越多的模型效果越好。这证明了当前领先的语言模型已经获得了极强的从文本中推断个人信息的能力。
  保护措施评估
  研究人员还从客户端和服务端两方面,评估了当前的隐私数据的保护措施。在客户端,他们测试了业内领先的文本匿名化工具进行的文本处理。
  结果显示,即使删除了大多数个人信息,GPT4依然可以利用剩余的语言特征准确推断出包括地点和年龄在内的隐私数据。
  从服务端来看,现有商用模型并没有针对隐私泄露进行对齐优化,目前的对策仍无法有效防范语言模型的推理。
  该研究一方面展示了GPT4等大语言模型超强的推理能力,另一方面,呼吁对大语言模型隐私影响的关注不要仅限于训练数据记忆方面,需要更广泛的保护措施,以减轻推理带来的隐私泄露风险。
  (举报)
投诉 评论

GPT4超豪华套餐上线,全新32K模型遭泄密!文件上传分析,【新智元导读】ChatGPT重磅级更新又来了!这次,直接可以读取PDF文件,而且不用选择模型,就能自动识别需要的功能。另外,有网友爆料称,GPT4正在训练全新32k模型copi……大模型浪潮澎湃,带给普通人哪些价值?新世纪的头个十年,朴树的《NEWBOY》在大街小巷回响,互联网在国内野蛮生长,枝繁叶茂出了以三大门户网站为首的互联网企业。彼时国际奥委会主席萨马兰奇宣布“BEIJING”成为2……超5亿人“上头”,“抖快号”和“爱优腾”再战微短剧“天,看了一下午土狗短剧太上头了”“只有我一个人在追这么土的小短剧吗?”“一口气狂追三部虐恋短剧,根本停不下来”几年间,人们对微短剧的态度悄然改变,曾被疯狂群……只需5分钟,教你自测小红书笔记是否限流大促节点了,整个小红书平台的笔记增速非常快,品牌营销预算投入的也非常大,对小红书的自然流量的挤占是比较明显的,所以最近这段时间小红书的流量竞争也自然非常大,很多博主反应自己的笔……ChatGPT、Llama2等大模型,能推算出你的隐私数据!ChatGPT等大语言模型的推理能力有多强大?通过你发过的帖子或部分隐私数据,就能推算出你的住址、年龄、性别、职业、收入等隐私数据。瑞士联邦理工学院通过搜集并手工标注了包……18亿潜在用户的“小众”交友App,到底有多赚根据皮尤研究中心统计数据,目前全球存在超过18亿穆斯林,约占全球总人口的23。而根据伊斯兰教法,跨宗教的婚姻不被鼓励,穆斯林男性可以与信仰基督教或犹太教的非穆斯林女性结婚……英伟达被曝开发ARM架构PC芯片,手握x86的英特尔坚称:A上周,在英特尔第三季度财报的电话会议上,CEOPatGelsinger谈到x86与ARM的竞争格局时,向投资者保证:“ARM和Windows客户端替代产品在PC业务中一直处于微……网易两款顶级IP联手王炸,续写万物皆可蛋仔的故事Z世代登上社会舞台以后,公共文化领域愈发充满了活力。尤其是在游戏这一满足年轻群体精神娱乐消费需求的品类带动下,公共泛文化场域开拓出了一幅崭新的文化图景。这种情况形成的背后是,游……苹果文生图大模型亮相:俄罗斯套娃式扩散,支持1024x102习惯了StableDiffusion,如今终于又迎来一个俄罗斯套娃式(Matryoshka)Diffusion模型,还是苹果做的。在生成式AI时代,扩散模型已经成为图像、……独家GPT4、Midjourney之外,谭平创业团队要造一个前段时间,OpenAI发布了文生图模型DALLE3,生成效果非常惊艳。比如,你可以让它一次画出几十个物体,然后再要求它把这些物体全部放到一个冲浪者的背上:可以看到,DAL……全球首款3nm芯片塞进电脑,苹果M3炸翻全场!128GB巨量【新智元导读】史上最短苹果发布会上,M3芯片家族震撼亮相了!在它们的加持下,MacBookPro、iMac纷纷升级成性能猛兽。史上最短苹果发布会ScaryFast,刚刚结……日本乒乓球选手福原爱宣布将直播带货:28号陪大家过早年快科技1月27日消息,近日,日本乒乓球选手福原爱宣布将直播带货,她在社交账号发视频配文称28号我陪大家过个早年。”在预告视频中,她提到自己从小学开始就跟着中国教练在中国训……
抖音打造单一爆款产品玩法各位村民好,我是村长。在抖音上卖货,已经是不争的事实。许多人都想在抖音上卖货赚钱,但到底卖什么,怎么卖一直摸不着头脑。相比那些明星、达人、品牌方来说,自己没有……星巴克回应出bug:全力抢修中站长之家(ChinaZ。com)4月12日消息:不少网友反馈,星巴克App今日出现Bug,账户里忽然被发放多张优惠券,包括生日邀请券、周年庆邀请券等。对此,星巴克客服回应……做抖音电商,你必须建立的两个底层思维2020年,直播电商站上风口。彼时,抖音最早一批“吃螃蟹的人”大多是一些实体店或者批发商,他们因线下生意的不稳定开始尝试线上直播。这类人群的货品都是自己实体店的商品,由于长期做……电商平台内卷短视频:搬上首页、给补贴招达人,能否破局?近几个月,拼多多、京东、淘宝等电商平台先后传出了重点布局短视频的消息和动作。为此,有业内人士评论道:“传统电商平台2020年在直播赛道内卷了一波,现在开始要在短视频赛道继……茶颜悦色负责人回应重庆开店非常有潜力站长之家(ChinaZ。com)4月13日消息:近日,网红奶茶品牌茶颜悦色宣布将在重庆开设三家新门店,对于新门店的开业,茶颜悦色品牌负责人翟敏慧表示,重庆是一个大城市,是非常有……帅农鸟哥B站半月涨粉180万!能否超过张同学?上周在《B站最火理发师,一个月涨粉200万!怎么做到的?》一文中提到山城小栗旬是今年B站的涨粉狂魔,当时就有粉丝留言:“帅农鸟哥不服”。在看完B站一周涨粉数据后发现,帅农……B站变短,创作者跟不跟?“竖屏封面功能已上线,辛苦通知所有竖屏主播今日更新粉版哔哩哔哩并上传竖屏封面。”这是一则发在B站直播娱乐公会群里的通知。通知下方工作人员还附上了一份详细的操作指引,并表示……视频号直播商家激励计划升级主播商家可享免费流量了站长之家(ChinaZ。com)4月13日消息:日前,视频号面向部分商家发布通知称,为进一步扶持商家成长,平台将进一步升级商家激励计划,视频号主播和商家可以免费领取官方流量了。……赶紧自查!巨量千川严打直播间投放商品“混淆信息”行为站长之家(ChinaZ。com)4月13日消息:日前,抖音电商发布了《巨量千川关于“混淆信息”行为的专项治理公告》,直播间投放商品混淆消费者认知平台的行为作出惩罚。抖音电……B站报告:2021年求职相关视频播放量同比增长91站长之家(ChinaZ。com)4月13日消息:日前,哔哩哔哩与智联招聘联合发布了《2022青年求职行为洞察报告》,报告称,视频成为当代青年获取职场知识的新选择,在2021年就……尴尬的中小博主:赚不到钱,也离不了场做了3年美妆账号的叶舒感觉到:“现在人人都是博主了。”事实确实如此。小红书、B站、抖音、快手等平台,不仅仅是社交和分享日常那么简单,嗅到网红效应巨大红利的年轻人们,早就琢……快手打击恶意营销行为清理违规视频87336条站长之家(ChinaZ。com)4月13日消息:今日,快手发布《快手关于打击恶意营销行为的公告》称,近期通过技术手段与人工审核等方式进一步清理各类恶意营销内容和帐号,对以社会热……
友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找作文动态热点娱乐育儿情感教程科技体育养生教案探索美文旅游财经日志励志范文论文时尚保健游戏护肤业界