人工智能如何进行数据管理?
字数统计:3427字预计阅读时间:约7分钟
人工智能正在悄然改进数据管理,包括其质量、可访问性和安全性。
但是随着数据越来越多,数据管理变得至关重要。
01One
数据管理的重要性
人工智能正在悄然改进数据管理,包括其质量、可访问性和安全性。
数据管理对于创建数据可以在整个组织中发挥作用的环境至关重要。有效的数据管理可以最大限度地减少不良数据引起的问题,例如增加摩擦、预测不佳,甚至是简单的不可访问性,最好是在它们发生之前。
然而,管理数据是一项劳动密集型活动:它涉及清理、提取、集成、编目、标记和组织数据,以及定义和执行许多与数据相关的任务,这些任务通常会让数据专家和员工感到沮丧他们标题中的数据。
人工智能已经以数千种方式成功应用,但其中一种不太明显和不太引人注目的应用是改进数据管理。我们认为人工智能在五个常见的数据管理领域发挥着重要作用:
分类:广义上包括从文档、照片、手写和其他媒体中获取、提取和构建数据。
编目:帮助定位数据。
质量:减少数据中的错误。
安全性:保护数据免受不良行为者的侵害,并确保根据相关法律、政策和习俗使用数据。
数据集成:帮助构建数据的主列表,包括通过合并列表。
下面,我们依次讨论这些领域中的每一个。我们还描述了供应商格局以及人类对数据管理必不可少的方式。
02Two
人工智能对数据管理的影响
单靠技术无法取代良好的数据管理流程,例如主动攻击数据质量、确保每个人都了解自己的角色和职责、构建数据供应链等组织结构以及建立关键术语的通用定义。但人工智能是一种宝贵的资源,可以显着提高生产力和公司从数据中获得的价值。以下是人工智能可以对组织中的有效数据管理产生最大影响的五个领域。
1、数据分类;
数据分类和提取是一个广阔的领域,随着越来越多的媒体被数字化以及社交媒体越来越以图像和视频为中心,它的规模还在不断扩大。在当今的在线环境中,如果没有人工智能,就不可能大规模地审核内容以识别不当帖子(尽管许多人仍在该领域工作)。我们在这个领域包括分类(这是仇恨言论吗?),身份实体解析(这是人还是机器人,如果是人,是哪一个?),匹配(数据库A中的JaneDoe是否与数据库B中的JEDoe?),数据提取(此司法备案中最重要的数据是什么?),等等。
多年来,人工智能的原始形式一直用于光学字符识别(OCR),以从银行支票或写有地址的信封等物品中提取重要数据。OCR变得如此普遍,以至于我们不再考虑AI等功能。较新的AI系统已通过深度学习模型扩展了OCR,这些模型现在能够准确读取人类笔迹。
人工智能是一种宝贵的资源,可以显着提高生产力和公司从数据中获得的价值。
重要数据通常采用固定的文档格式,如传真、PDF和冗长的文字处理文档,为了访问、分析甚至回答相关问题,必须先将其提取出来。例如,在医疗保健领域,信息仍然通过传真传递,访问它需要大量的人力。一家电子病历公司编写了一个人工智能程序,从传真中提取数据并将其直接输入到EHR系统中,从而节省了大量时间。人工智能程序还可以从合同中识别和提取重要条款,这对律师和审计员等很有用。
2、数据编目;
几十年来,公司一直缺乏关于关键数据在其系统和记录中的位置的准确指导。幸运的是,数据编目在过去几年中出现,作为跟踪该材料的重要帮助。然而,创建并保持此类目录最新是一项劳动密集型工作。
人工智能可以自动搜索各种数据存储库并自动创建目录。人工智能系统可以捕获系统文档中存在的任何元数据。人工智能还可以描述数据的沿袭数据来源、创建者、修改方式以及当前所在位置。
但是,虽然使用AI可以更轻松地创建目录和数据沿袭信息,但公司仍必须努力解决现有数据环境的混乱问题。许多公司拒绝使用传统的劳动密集型方法创建目录,因为他们不想揭示架构混乱的程度,或者因为他们想等到数据组织得更好、质量更高后再投入大量工作。然而,使用人工智能轻松创建和更新目录意味着公司可以将更轻松的信息访问与持续的数据改进流程结合起来。
3、数据质量;
数据质量工具本质上是实施控制,通常使用业务规则来定义允许数据值的域。考虑一个由一天和一个月组成的日期。允许值的组合只有366种。因此,Jebruary不是允许的月份,35不是允许的日期,February31不是允许的组合。定义、编码和更新业务规则尤其繁重,而我们在基于机器学习的AI中看到了巨大的好处。
AI工具可以扫描数据以识别不允许的值,一些错误的值会自动更正,而其他值则分配给某人或某个组进行更正。一些供应商已经吹嘘他们的工具将机器学习用于这些目的。
AI还可以执行其他与数据质量相关的功能,包括使用来自其他内部或外部数据库的附加信息(在匹配过程之后)扩充数据,预测如何填补缺失的数据缺口,以及删除重复或很少使用的数据。
重要的是,如果供应商支持更主动的数据质量管理方法,他们可以改进他们的工具一种专注于防止数据错误而不是发现和修复错误的方法。为此,应在尽可能靠近数据创建点的地方应用控件。此外,工具应使数据质量测量与业务影响密切相关,并支持统计过程控制和质量改进。
4、数据安全;
保护数据安全和隐私是当今任何组织的关键问题。自数据保护行业诞生以来,防止黑客攻击、数据泄露和拒绝服务在很大程度上一直是人类活动。
人工智能可以协助完成其中的许多功能。例如,它在威胁情报方面很有用观察外部世界;合成威胁信号、参与者和语言;并预测谁可能对谁做什么。基于AI的威胁情报是对网络安全专业人员面临的众多挑战的回应,包括大量威胁行为者、大量看似毫无意义的信息以及熟练专业人员的短缺。
领先的解决方案采用机器学习来跨多个内部和外部系统自动收集安全数据,从非结构化格式创建结构化数据,并评估哪些威胁最可信。人工智能系统可以根据以前的攻击模式预测可能的攻击路径,并确定新威胁是来自以前已知的攻击者还是新威胁。考虑到跨多个未连接的安全系统的误报网络安全威胁的数量,决策规则和机器学习模型的组合可以对威胁进行优先排序或分类,以供人类调查。
无监督学习系统可以识别组织IT环境中的异常情况,例如异常访问模式或访问组织系统的罕见IP地址。这些方法的优点是不需要接受过去的网络安全方法的培训,这些方法总是会发生变化。
AI还可用于识别欺诈或不遵守法规的内部威胁。这种能力对银行业和投资业等受到高度监管的行业特别感兴趣。人工智能软件监控组织内的数字通信并识别可疑语言或行为模式。当然,人工调查对于确认员工或客户的渎职行为是必要的。
5、数据集成。
也许人工智能对数据管理的最大改进之一是在数据集成领域也称为掌握这涉及创建一个主数据记录或黄金数据记录,这是组织内数据元素的最佳可能来源。公司可能出于多种原因需要数据集成:因为随着时间的推移,他们激增了不同版本的关键数据,因为他们想要将交易数据重新用于分析目的,或者因为他们收购或合并了拥有自己数据库的公司。从历史上看,在大型组织中合并和掌握数据一直是一项需要多年努力的艰巨任务。
过去,最常见的数据集成方法是主数据管理,它使用一组业务规则来决定,例如,是否应该合并一组特定的客户或供应商记录,因为它们本质上是相同的记录。然而,创建和修改大量规则非常困难且成本高昂,以至于许多数据集成项目在完成之前就被放弃了。
现在,来自Tamr等公司的基于机器学习的母带处理系统使用概率匹配技术来决定是否应该合并记录。很可能是同一实体的记录(比如90或更高)会自动合并。这种方法无法解决的相对较少的记录可以由人类主题专家进行审查。
03Three
哪些数据管理需要人工来做?
尽管AI在改进数据管理方面取得了进展,但仍有许多事情无法做到。总的来说,好的数据还是需要好的管理者,他们关心数据,将其视为重要资产,并建立相应的管理体系。
AI帮助不大的具体任务包括:
创建数据策略并确定哪些数据对企业最重要。
创建数据驱动的文化。
校准传感器或设备。
制定数据治理政策和结构。
定义关键业务术语或使用通用语言。
确定组织是使用正确的数据还是错误的数据来解决问题。
建议组织应在何处存储或处理其数据。
惩罚任何违反网络安全或数据相关欺诈行为的人。
那么,所有组织都将继续需要人来管理数据包括创建和使用数据的普通员工,以及负责构建、保护和管理数据的数据管理专业人员。无论是现在还是在不久的将来,高度结构化和频繁执行的数据管理任务都不可避免地会在AI的帮助下实现自动化。这对数据管理及其用户和从业者来说总体上是个好消息,尽管一些低级别数据管理专业人员的工作可能会发生巨大变化甚至消失。在认为良好数据对其当前和未来运营很重要的组织中,重要的是要计划他们希望使用AI完成哪些任务,哪些活动仍属于人工去做,以及两者将如何协同工作。
汶川地震后王石言论引争议,多年后回首当时做好被乱棍打死准备在2018年播出的访谈节目十三邀中,请来了一位中国企业界的传奇人物王石。他是著名房地产企业万科的创始人,将其一步步发展壮大为国内乃至全世界规模最大的地产商之一。作为节目主导者的许知
坐拥千亿身家,在深圳却只住三室一厅,每天都到员工饭堂吃饭提起王传福,可能很多朋友会觉得陌生,但提起比亚迪相信大家一定都听闻过这家近几年红极一时的国产车企巨头。王传福这位低调的企业家正是比亚迪的创始人。如今,已经坐拥千亿身家的王传福并不像
管不住下半身的7位明星,一个比一个会作,不值得同情9月11日,正是十五的月亮十六圆的这天,昔日的四大顶流再次陨落一位。大蓝V平安北京发文通报李易峰因多次嫖娼被依法刑拘,对违法事实供认不讳。9月10日还有很多人不敢相信的事实,11日
焦游四方之怡时行走,漫行拾趣2016年夏天,和挚友净钟及其子一行三人,全程火车大巴,开启参禅访友之旅。计划温州南鹿岛,再到宁德支提寺福州鼓山涌泉寺雪峰寺莆田南山文化寺厦门南普陀一路随遇而安,走哪算哪一支画笔,
中秋晚会,蒋勤勤真的太美了将近50岁的蒋勤勤还是那么美!看惯了姐姐的现代装之后,一下子变成如此惊艳的着装,真令人眼前一亮,尽显东方女性之美。但愿人长久,千里共婵娟。生活中蒋勤勤比较随性,尤其是在穿着上,把随
1958年毛主席视察广西,他的爱将韦国清试探您敢吃蛇羹吗?广西产蛇,因而在当地有一道名菜,那就是蛇羹,不过大多数人提到蛇,都是闻之色变,所以对于蛇羹,更是望而却步毛主席的身上,就发生了一件与蛇羹有关的趣事,那是在1958年的时候。当时毛主
在宰相刘罗锅中,脱鞋的吏部侍郎和珅和江宁知府刘墉,谁官大呢?要先比较谁的官大呢,我们需要先看一下清朝的官制体系清朝官制分中央官职和地方官职两大类,其中中央官职包含内阁军机处和六部,再加上同六部并立的中央行政机构所属官员而地方官职则整体分省府
2022虎年男孩晴明西峰,绿缛南溪的男宝宝名字大全新生儿的到来是家庭的大喜事,是父母们期待已久的,而在宝宝出生之后父母需要做的第一件事情就是为孩子起一个寓意好的名字,从古诗词里或者是成语里选择些吉利的汉字起名,给孩子带来好运,让孩
不满6个月的宝宝不能坐婴儿车里婴幼儿脊椎问题需重视现在的婴儿车盛行,只要怀孕快生了,家里就开始张罗婴幼儿用品了,婴儿车是必不可少的!因为不仅仅可以睡,还可以坐!推出门遛弯也是厉害得不行。但是,婴儿车潜在的威胁,家长都忽略了!婴儿车
没有家族史为什么孩子有遗传病?大河健康报记者安伟孙倩文实习生张馨月据卫生健康部门统计,我国是出生缺陷高发的国家,每年有20万30万可见的畸形儿出生,加上出生后才逐渐显现的缺陷,我国先天残疾儿童总数高达80万12
阿豆(小小说)文小为图片小为阿豆,从小胆怯,怕爹吵,怕娘骂,怕姐姐的斜眼。其实,阿豆是家里的娇儿,都想把他当个菜捯,尤其是他爹,靠他传后呢,可他不成型,不成块,软塌塌地,让人捯不起来。越是这样,
东莞哪里有免费景区?谢邀请答题。东莞有免费的景区,我来告诉你!东莞石碣镇袁崇焕公国,石排镇塘尾古村落,东莞桥头莲湖花园,东莞旗峰山,东莞茶山镇古村落。欢迎评论!欢迎关注!欢迎转发!欢迎点赞!东莞植物园
有哪些适合养老的地方?来四川遂宁市养老是最佳选择!这里,是天府之国的腹心,丘陵地区,山水域市,有小成都之称。涪江穿城而过,怀抱比西湖还大的观音湖,人杰地灵,美女帅哥美食满眼都是。有古寺庙古镇可游,有死海
万能的头条大神们快要六岁孩子,四句2小时背不过哪里出了问题?这个我要说两句。小孩的学习情绪很重要,他背不到的时候你是鼓励加油还是凶他吼他?我女儿也正在学拼音,我发现她多几个读不出来的就着急了,她妈就吼她,小孩泪眼朦胧的再也学不进去,越学不进
你觉得国足杀进世界杯有希望吗?为什么?我觉得希望不大!因为这一套教练组有点乱,去了这么多领导到底谁说了算呢?没有希望,因为李铁能力经验根本驾驭不了这种复杂而又激烈的比赛局面!前面的四场比赛完全证实了这一点!洗洗睡吧!没
为什么近几年日本的制造业渐渐没落了?日本企业之溃败,始于家电行业。2009年,先锋电子陷入经营困难,将Pioneer的品牌使用权出售给苏宁电器。2016年,陷入巨额亏损的夏普卖身富士康。索尼也好不到哪去,在2008至
如果全世界用人民币代替了美元,那人民币未来会升值吗?如果人民币代替了美元,小编认为人民币的汇率会保持稳定。其实美元就是一个很好的参照物,美元作为世界货币,它也不会只升不贬,而是保持在比较稳定的区间。如果人民币代替了美元,那么人民币为
没了华为,荣耀一天不如一天,应该如何应对以后?没了华为,荣耀真就一天不如一天了?NO,至少从目前来看,荣耀发展得还不错,特别是荣耀50的发布,重整雄风,荣耀的市场份额最高时达到16。在刚刚过去的Q3,荣耀超过了苹果小米,位居国
吴亦凡最后结果是什么?吴亦凡最后的结果是什么?这个先是红得发紫,然后又发黑发臭的人物,以后的结果,大体是这样的0以目前的形势,他涉嫌刑事犯罪,判刑入狱是概率非常大的事件,再想平安无事,基本不可能。1以强
怎么在两个多星期左右减掉15斤的体重?r肥胖非冰冻三尺一日之寒,减肥也不能一蹴而就。建议不要两周内减15斤,这样是很容易反弹的,对身体并不好!rr肥胖是因为能量摄入过多引起的代谢的,要减肥主要还是控制能量的摄入,建议平
体检发现肾囊肿应该怎么办?囊肿,听起来挺吓人的,尤其是这囊肿还经常长在我们的体内的脏器,不乏让谈癌色变的人感到一丝忧虑!而且很多时候我们只是在自己的B超等检查报告单中看到肾囊肿,但对于自己的肾囊肿到底长什么
朋友刚结婚1个月,单位想派他去非洲工作3年,年薪20万,他该不该去?看了很多答案,动不动就写一整套分析理论,画一堆思维导图,分析的头头是道。请问你咋不去呢?帮别人分析的一本正经,让你去,你去吗?真是站着说话不腰疼。举一个例子吧我们公司在海外开网点,