范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

openGauss动态数据脱敏功能介绍

  数据脱敏背景及介绍
  1.1数据库脱敏背景
  伴随着互联网大数据、云服务等新兴技术的飞速发展和普及,业务上云、数据集中存储、数据共享等数据应用方式已成为未来发展的趋势,云数据库和云计算服务具有易部署、低成本、高效率、高可靠的优势,使得越来越多的消费者更倾向于将个人数据存储在云上而非个人移动硬盘中。实际上,由于数据使用场景愈加复杂,个人隐私数据泄露、被窃取的风险越来越高,仅近年来就发生数起重大数据库信息泄露事件,这对数据库安全提出了更高的要求。
  数据脱敏,顾名思义就是将敏感数据通过变形、屏蔽等方式处理,其目的是保护隐私数据信息,防止数据泄露和恶意窥探。当企业或者机构收集用户个人身份数据、手机、银行卡号等敏感信息,然后将数据通过导出(非生产环境)或直接查询(结合生产环境)的方式投入使用时,按照隐私保护相关法律法规需将数据进行"脱敏"处理。
  1.2 数据脱敏介绍
  数据脱敏主要分为静态脱敏和动态脱敏,静态数据脱敏(Static Data Masking)采用"先脱敏-后分发"的方式,一般是将生产环境数据拷贝到测试或开发库中,导出后的数据已经改变了原始数据的内容,使得脱敏后的数据成为了测试开发源数据。而动态数据脱敏(Dynamic Data Masking)是与生产环境紧密关联的,访问敏感数据时实时地进行脱敏,主要用于直接访问生产数据的场景,在屏蔽敏感信息的同时也保证了源数据的一致性和有效性。
  图1:静态脱敏与动态脱敏
  动态数据脱敏和静态数据脱敏适用于不同的场景,两者之间没有优劣之分,主要是以使用场景来选择合适的脱敏模式。openGauss最新版本已正式对外支持动态数据脱敏特性,下面的章节将围绕openGauss动态数据脱敏机制进行阐述。
  目前主流的动态数据脱敏技术路线分为"结果集解析"和"语句改写"两条路径: 结果集解析:不改写发给数据库的语句,需要提前获悉数据表结构,待数据库返回结果后再根据表结构判断集合内哪些数据需要脱敏,并逐条改写结果数据。 语句改写:将包含敏感字段查询的语句改写,对于查询中涉及的敏感字段(表列)通过外层嵌套函数的方式改写,使得数据库运行查询语句时返回不包含敏感数据的结果集。
  从性能上来说,结果集解析方法需要在数据库返回结果集后再逐行字段解析、规则匹配、数据脱敏,需要逐个修改结果集中每一行数据,因此脱敏耗时与结果集容量线性相关,整体性能损耗较大;而语句改写通过将较为简短的查询语句进行解析并重写的方式,对语句中的敏感列外嵌了一层脱敏函数,数据库执行命令时将自动执行脱敏函数实现数据脱敏,返回的结果集即为脱敏后的数据。该方式仅仅改写一条查询语句而不涉及结果集的解析,因此能够极大地降低性能损耗,openGauss便是采用了语句改写的方式,10万条敏感数据脱敏的性能损耗低于5%。
  另外,对于比较复杂的命令,查询字段一般包含大量同名字段、表别名、嵌套查询等,基于结果集解析首先需要将结果集与真实查询列进行一一对应才可判断出该字段是否需要脱敏,查询越复杂识别难度越高,匹配的准确率就越低,而基于语句的改写可精确的对复杂查询涉及的字段嵌套脱敏函数。
  综上分析,基于语句改写方法的数据脱敏无论对于性能还是准确性来说都是较为优秀的脱敏方案,openGauss基于语句改写思想,在查询解析获取查询树后,根据用户定义的脱敏策略识别查询树目标结点(Node),并对待脱敏结点进行改写构造"脱敏查询树",再交由数据库内核执行最终返回脱敏后数据。
  openGauss 动态数据脱敏解决方案
  动态数据脱敏功能在工业界通常以中间插件或数据脱敏系统(Data Masking System)的形态加载,通过在客户端与服务端数据库之间拦截命令或结果集来实现脱敏,而openGauss内置动态数据脱敏特性,使数据库无需借助外部插件就可以实现数据脱敏,有效地降低数据中间传输而导致敏感数据泄漏的风险。
  openGauss从1.1.0版本定义了一套完整的内置安全策略模型,基于该模型用户可以定义资源标签来标识敏感数据,针对不同的资源标签类别和内容可定义相关的安全策略机制,而动态数据脱敏就是其中一种。
  2.1 内置安全策略
  内置安全策略(Security Policy)模型,是指通过配置一系列安全策略来对用户行为进行识别和保护,提供了包括保护用户敏感数据的能力。
  资源标签(Resource Label)是Security Policy的基础,它的本质是一系列数据库资源集合。为了能够统一管理数据库资源,数据管理者可以将多个数据库资源添加到同一个资源标签下,通过对资源标签配置策略来实现批量地对数据库资源进行管理的能力。
  例如,多张数据表中均包含银行卡号"creditcard"这种敏感信息列,那么可以将这些列统一地划分到资源标签"creditcard_label"中,随后管理员便可以通过对"creditcard_label"配置脱敏策略以实现对所有相关敏感列的批量配置。
  动态数据脱敏策略(Dynamic Data Masking)是Security Policy模型支持的一类安全策略,数据控制者对用户表中的敏感数据识别后(敏感数据发现和识别不在该特性范围内),对包含敏感列的资源标签配置数据脱敏策略,并依据不同的应用场景来限制用户对数据的访问行为和信息提取行为,以达到对敏感信息保护的能力。
  总的来说,资源标签是用来归类数据库资源,并将这些资源统一地投入到各种安全策略中去管理。动态数据脱敏特性便是利用资源标签去识别敏感数据,然后匹配脱敏策略,实现对敏感数据的屏蔽。
  2.2 动态数据脱敏核心思路
  openGauss中的动态数据脱敏是以内置安全插件(security plugin)的方式与数据库部署在一起的,业务方面无需额外适配就可使用,SQL的解析与脱敏策略匹配交由openGauss安全策略模块负责,业务在配置脱敏策略后即可生效。
  2.2.1 配置脱敏策略
  脱敏策略的配置主要包括三个方面——脱敏方式(Masking Function)、脱敏对象(Resource Label)、用户过滤器(Masking Filter)。 脱敏方式,是指该脱敏策略使用何种方式对目标字段进行脱敏,目前openGauss预置了7种脱敏方式:creditcardmasking、 basicemailmasking、fullemailmasking、alldigitsmasking、shufflemasking、randommasking、maskall。分别适用于不同的脱敏场景。 脱敏对象,是指脱敏策略生效时作用的对象集合(LABEL),若查询目标字段存在于LABEL中,则该字段将会根据脱敏策略进行敏感数据脱敏,需要注意的是,openGauss动态数据脱敏特性支持对仅包含数据列的LABEL进行脱敏。 用户过滤器,指出脱敏策略在何种用户场景下生效,主要涉及USER(用户名)、APP(用户登录客户端名称)、IP(用户所处的ip)。当查询用户同时满足Masking Filter所指定的阈值时,数据脱敏策略才会生效。
  以下案例演示了一个数据动态脱敏策略创建的基本过程。
  1.数据准备
  确认内置安全策略总开关是否开启。
  准备两张包含敏感字段(creditcard、customername)的表。
  2.策略配置
  策略管理员(拥有poladmin权限)登录数据库,将两张数据表的敏感字段分别添加到资源标签"creditcard_label"、"customer_label"中去管理。
  策略管理员创建两个脱敏策略,其作用如下: 脱敏策略mask_card_pol:只有当用户"user1"在‘10.11.12.13’ip上使用gsql访问表时,标签creditcard_label中的列将按照‘creditcardmasking’方式脱敏。 脱敏策略mask_name_pol:默认对于所有查询用户,标签customer_label中的列将按照‘MASKALL’的方式脱敏。
  2.2.2触发脱敏策略
  当系统接收到查询命令时,security_plugin将在解析器中拦截语义分析生成的查询树(Query),首先根据用户登录信息(用户名、客户端、IP)筛选出满足用户场景的脱敏策略。由于脱敏策略是基于(仅包含表列的)资源标签配置的,因此需要判断查询树的目标节点是否属于某个资源标签,然后将识别到的资源标签与脱敏策略相匹配,根据策略内容将查询树目标节点改写,最终将查询树返还给解析器。
  security_plugin模块由于内置查询树脱敏方式,数据访问者不会感知内置安全策略重写查询树的过程,如同执行普通查询一样去访问数据,同时保护数据隐私。
  图2:openGauss动态数据脱敏架构
  基于配置脱敏策略小节举出的案例,我们可以通过查询数据表来触发脱敏策略。
  触发脱敏策略
  用户user1在满足mask_card_pol策略的情况下使用gsql登录数据查询敏感数据,系统将返回脱敏后的数据结果。而用户user2不满足该条策略,因此该用户查询的数据未做脱敏处理。
  而无论对于user1还是user2用户,他们查询order表时都会触发脱敏策略mask_name_pol,因此customername字段将会被脱敏处理。
  openGauss动态数据脱敏优势
  openGauss动态数据脱敏关注访问用户身份识别问题,用户过滤器(Masking Filter)的配置细化到指定用户、客户端工具、登录IP,策略管理员可以灵活地根据不同业务、不同用户场景来制定不同的脱敏策略,赋予他们不同级别的敏感数据访问能力以适用于各种复杂的生产环境。例如金融、医疗行业中前台服务人员只允许看到身份证、银行卡号部分信息,而运维管理员则可以查询并维护所有用户信息。在保证脱敏场景多样性的前提下,指定用户过滤器时系统会进行严格的互斥校验,避免同一用户同时满足多个用户过滤器而出现策略选择的二义性。
  图3:openGauss根据过滤条件脱敏
  其次,openGauss动态数据脱敏更加注重数据库资源的批量管理,在安全策略模型中,将需要管控的数据库资源集中归类划分成标签,对标签的操作实际上就是对指定一簇资源的操作,极大的简化管理流程,提高管理效率。在其他数据库上的动态数据脱敏特性一般是基于单个列或单张表的,脱敏策略与数据库资源是一一对应的,即使想要采用相同的脱敏方式,不同的数据库资源也要配置多个对应的脱敏策略,这无疑是提高了策略配置成本,增加了后期运维、批量资源策略管理的难度。因此将需要批量管理的数据库资源划分到资源标签中是openGauss动态数据脱敏的基础,也是其优势之一。
  图4:openGauss资源标签批量配置策略
  动态数据脱敏内置在openGauss内核中,能够在一定程度上保证数据传输路径上的安全性,而外部插件存在绕过风险:当外部插件将客户端发送的SQL或服务端返回的结果集改写后,攻击者依然可以绕过插件直接向数据库发送SQL或截取数据库返回的源数据结果集,导致脱敏插件失效。因此相较于外部插件脱敏的方式,openGauss动态数据脱敏在一定程度上也能降低传输路径上的敏感数据泄漏风险。
  动态数据脱敏其目的是屏蔽结果集中的敏感数据,动态数据脱敏是与生产环境相结合,由业务方提供查询接口,再由接口触发数据脱敏,openGauss为了尽可能的保证敏感数据的安全性,在绝大多数场景包括带有RETURNING的增删改、Merge into、CTE、Subquery等场景也适配了脱敏策略,这样能够丰富业务方对敏感数据的操作接口而不单单只能提供数据查询接口。
  openGauss为了提高易用性,提供了一套简洁的策略配置语法,涵盖了资源标签以及脱敏策略的增删改,用户使用定义语法可以轻松地配置脱敏策略,简化了管理员操作流程。
  openGauss 动态数据脱敏的展望
  openGauss动态数据脱敏特性提供了相对简洁、灵活的策略配置方案,在一定程度上保用户隐私数据不被泄漏,是openGauss多层级安全防御架构中不可或缺的一环。
  未来openGauss动态数据脱敏特性将开放更加灵活的策略配置手段包括UDF(User Defined Function)Masking以及条件脱敏(Conditional Masking)等,以期支持更加灵活、丰富的隐私保护场景。
  更多内容请参考:
  https://docs.opengauss.org/

方大特钢钢铁工人变废为宝自造上百件钢铁侠11月17日获悉,方大特钢工业旅游景区我为景区再添一景作品评选结果揭晓,霸王龙美猴王等33件作品获奖。这些由员工自制的钢铁机器人吸引了广大员工和游客们的眼球,让原本无用的废料重新活红河金佛脚下的神秘山庄,用火烧水果,围着火堆吃饭一宇嵌山窟,重重开晓烟弥勒寺,寺下有一个美丽富饶的村落柏支古村。听说在古村中藏着一家宝藏山莊,莊外梯田错落有致,莊内惬意得不可方物,露营烧烤吃柴火鸡火塘烤茶,还有动物园,把生活的浪再游湿地公园昨天拉着老公去济西湿地公园,不是周末,南门口停了也就有几十辆车,这几十个人分流到公园里,基本上看不到人,公园太大了,路线若干多,所以一路下来,感觉就我们俩在里面逛一样!美景正当时,资本家和企业家的区别头条创作挑战赛刘强东给京东员工发了全员信,说将要做这么几件事第一,给德邦的兄弟交齐五险一金。其中还特别提到,过去德邦的做法虽然合规合法,而且五险一金的比例还远超其他同类公司,但仍然国产手机密集上新,旗舰影像为何遭到下放?导读随着各项技术的成熟以及下行市场周期下的激烈竞争,一大批原属于顶端旗舰产品的影像配置正在快速下放。(观察者网讯文周昊编辑吕栋)11月末,手机市场进入密集上新周期,继vivo荣耀接站在科技与人文的十字路口,黑科技退烧,好科技赶潮站在科技和人文的十字路口这句原本出自乔布斯的话,却因为罗永浩的引述而被大家熟知。意思是,通过优质的设计,让冰冷的科技和温暖的人文在十字路口交汇,达到和谐统一。时至今日,这句话一直被大型存储计算排行榜,中国夺魁并占据前十名一半国际技术组织io500最近发布了大型存储计算设施输入输出能力全球排行榜。io就是英语input和output的意思。也就是输入和输出。这个组织通过测试每个系统十个节点得到的数据进行刘强东,够兄弟头条创作挑战赛角度的不同,往往能够得出不同的结论。如果说一个大学生去KTV陪唱,那么大家往往都会对其唾弃。如果说一个KTV陪唱努力的考上了大学,那么大家往往都会对其竖起大拇指。如果墨西哥文坛超新星!豪尔赫科门萨尔成名作突变引进中国近日,墨西哥文坛新星豪尔赫科门萨尔的长篇处女作突变由上海译文出版社出版。这是豪尔赫科门萨尔作品在国内的首次译介,小说一经出版即被翻译成十种文字,科门萨尔也凭借该作一举成名。豪尔赫科如果李铁不被调查,李铁在中国足坛的地位应该是天花板一样存在石破天惊的新闻国足前主教练李铁被调查,直接刷爆各种热点。毕竟在2022年卡塔尔世界杯激战正酣和全国防疫新闻面前,一个李铁被调查直接抢了一下子抢了所有人的眼球。虽然新闻很短只有几行字刘兴国2023年工业经济复苏振兴充满希望中新网11月25日电(中新财经记者吴涛)24日,在中新论坛举办的稳住经济大盘加力振作工业经济沙龙上,中国企业联合会研究部副主任刘兴国表示,2023年应该是工业经济复苏振兴充满希望的
2020年度消费维权十大典型案例中国质量万里行消费投诉平台在对2020年度受理的消费投诉进行数据分析时发现,新冠肺炎疫情爆发后,防疫产品市场需求呈爆发式增长。随之而来的是,防疫产品质量违法案件与消费者投诉大幅增长硅谷银行破产,有什么影响?对咱们有什么警示?美国硅谷银行宣布破产。这家银行是跟着互联网企业成长起来的,有四十多年历史,在美国银行业当中虽然算不上老资格,但也不是新手。其手中的客户资产高达两千多亿美元,历史上表现一直不错。但就美股收盘道指跌近350点中概股多数下挫雾芯科技逆势涨15金融界3月11日消息,2月非农就业报告的失业率意外回升薪资增速低于预期,减弱此前市场对于美联储未来强劲货币政策预期,但2年期美债收益率盘中降近30个基点较周四高位回落近50个基点,义新欧班列为中西贸易提速近年来,以义新欧班列为代表的中欧班列,为中西经贸合作注入了源源动力。图为三月九日从西班牙马德里向中国义乌发出的中西建交纪念号中欧班列。本报记者颜欢摄3月9日,伴随着轰鸣的汽笛声,一23考研多所院校复试线公布,最高降44分!2023研考国家线已经公布多个学科分数线有所下调那么很多人都会好奇各高校的复试线会不会也下降呢来看已经公布复试线的高校清华大学多学科复试分数线下降,最高降44分。分数线上涨的学科有舍一段时光,得一院墨韵春日晴好,油菜花金灿灿地开着,粉蝶飞来飞去,洋溢蝶恋花的幸福滋味。屯溪区奕棋镇林塘村,推开一扇木门,雲亼舍得墨韵民宿初见。客房有蝶恋花的铭牌,一首蝶恋花的诗在民宿吟唱。墨韵,墨是自要是不成功,这钱我出!探索致富,老兵冲在前编者按2023年全国两会,新一届全国人大代表全国政协委员齐聚北京共商国是。即日起,退役军人事务部推出代表委员中的退役军人组稿,展现新时代代表委员中的退役军人不负重托担当作为的新风采你好,代表吉列子日建议增加对农村的产业扶持,引导年轻人才投身乡村振兴央视网消息(记者豆瑞华弟辰晨)阿布洛哈村过去三面环山一面临崖,交通极为不便,2020年6月,村里通了车,与外界的联系也逐渐多了起来。首次成为全国人大代表的95后村支书吉列子日,带着CBA快讯赵睿被球迷怒喷!两小将成男篮希望,北控惨遭五连败在11号晚和广厦吗比赛中,最终广东以两分的优势取胜,在赛后这场比赛也引发了很大的热议,一是部分球迷觉得裁判的判罚有一些不公正,导致广厦输掉了比赛,二是赵睿的表现比较低迷,在赛后很多长垣这13家企业入选新乡星级工业企业名单河南广电融媒体记者崔新保通讯员王晨光近日,新乡市工业和信息化局公布了新乡市2022年度星级工业企业名单,长垣市共有13家企业入选,占星级企业总数的22。4。其中包含五星级工业企业2全国人大代表李毛持续推动能源化工企业绿色转型双碳目标下,能源化工企业的绿色低碳发展,既是我国产业转型的必然趋势,也是实现经济社会全面绿色转型的重要任务。今年政府工作报告中提出推进煤炭清洁高效利用和技术研发,加快建设新型能源体