童话说说技术创业美文职业
投稿投诉
职业母婴
职场个人
历史治疗
笔记技能
美文纠纷
幽默家庭
范文作文
乐趣解密
创业案例
社会工作
新闻家居
心理安全
技术八卦
仲裁思考
生活时事
运势奇闻
说说企业
魅力社交
安好健康
传统笑话
童话初中
男女饮食
周易阅读
爱好两性

6个方面分析:知识图谱的价值和应用

4月4日 莫思归投稿
  知识对于人工智能的价值就在于,让机器具备认知能力和理解能力。构建知识图谱这个过程的本质,就是让机器形成认知能力,理解这个世界。
  一、知识图谱无处不在
  说到人工智能技术,人们首先会联想到深度学习、机器学习技术;谈到人工智能应用,人们很可能会马上想起语音助理、自动驾驶等等,各行各业都在研发底层技术和寻求AI场景,却忽视了当下最时髦也很重要的AI技术:知识图谱。
  当我们进行搜索时,搜索结果右侧的联想,来自于知识图谱技术的应用。我们几乎每天都会接收到各种各样的推荐信息,从新闻、购物到吃饭、娱乐。
  个性化推荐作为一种信息过滤的重要手段,可以依据我们的习惯和爱好推荐合适的服务,也来自于知识图谱技术的应用。搜索、地图、个性化推荐、互联网、风控、银行越来越多的应用场景,都越来越依赖知识图谱。
  二、知识图谱与人工智能的关系
  知识图谱用节点和关系所组成的图谱,为真实世界的各个场景直观地建模。通过不同知识的关联性形成一个网状的知识结构,对机器来说就是图谱。
  形成知识图谱的过程本质是在建立认知、理解世界、理解应用的行业或者说领域。每个人都有自己的知识面,或者说知识结构,本质就是不同的知识图谱。正是因为有获取和形成知识的能力,人类才可以不断进步。
  知识图谱对于人工智能的重要价值在于,知识是人工智能的基石。机器可以模仿人类的视觉、听觉等感知能力,但这种感知能力不是人类的专属,动物也具备感知能力,甚至某些感知能力比人类更强,比如:狗的嗅觉。
  而“认知语言是人区别于其他动物的能力,同时,知识也使人不断地进步,不断地凝练、传承知识,是推动人不断进步的重要基础。”知识对于人工智能的价值就在于,让机器具备认知能力。
  而构建知识图谱这个过程的本质,就是让机器形成认知能力,去理解这个世界。
  三、图数据库
  知识图谱的图存储在图数据库(GraphDatabase)中,图数据库以图论为理论基础,图论中图的基本元素是节点和边,在图数据库中对应的就是节点和关系。用节点和关系所组成的图,为真实世界直观地建模,支持百亿量级甚至千亿量级规模的巨型图的高效关系运算和复杂关系分析。
  目前市面上较为流行的图数据库有:Neo4j、OrientDB、Titan、FlockDB、AllegroGraph等。不同于关系型数据库,一修改便容易“牵一发而动全身”图数据库可实现数据间的“互联互通”,与传统的关系型数据库相比,图数据库更擅长建立复杂的关系网络。
  图数据库将原本没有联系的数据连通,将离散的数据整合在一起,从而提供更有价值的决策支持。
  四、知识图谱的价值
  知识图谱用节点和关系所组成的图谱,为真实世界的各个场景直观地建模,运用“图”这种基础性、通用性的“语言”,“高保真”地表达这个多姿多彩世界的各种关系,并且非常直观、自然、直接和高效,不需要中间过程的转换和处理这种中间过程的转换和处理,往往把问题复杂化,或者遗漏掉很多有价值的信息。
  在风控领域中,知识图谱产品为精准揭露“欺诈环”、“窝案”、“中介造假”、“洗钱”和其他复杂的欺诈手法,提供了新的方法和工具。尽管没有完美的反欺诈措施,但通过超越单个数据点并让多个节点进行联系,仍能发现一些隐藏信息,找到欺诈者的漏洞,通常这些看似正常不过的联系(关系),常常被我们忽视,但又是最有价值的反欺诈线索和风险突破口。
  尽管各个风险场景的业务风险不同,其欺诈方式也不同,但都有一个非常重要的共同点欺诈依赖于信息不对称和间接层,且它们可以通过知识图谱的关联分析被揭示出来,高级欺诈也难以“隐身”。
  凡是有关系的地方都可以用到知识图谱,事实上,知识图谱已经成功俘获了大量客户,且客户数量和应用领域还在不断增长中,包括沃尔玛、领英、阿迪达斯、惠普、FT金融时报等知名企业和机构。
  目前知识图谱产品的客户行业,分类主要集中在:社交网络、人力资源与招聘、金融、保险、零售、广告、物流、通信、IT、制造业、传媒、医疗、电子商务和物流等领域。在风控领域中,知识图谱类产品主要应用于反欺诈、反洗钱、互联网授信、保险欺诈、银行欺诈、电商欺诈、项目审计作假、企业关系分析、罪犯追踪等场景中。
  那相比传统数据存储和计算方式,知识图谱的优势显现在哪里呢?
  (1)关系的表达能力强
  传统数据库通常通过表格、字段等方式进行读取,而关系的层级及表达方式多种多样,且基于图论和概率图模型,可以处理复杂多样的关联分析,满足企业各种角色关系的分析和管理需要。
  (2)像人类思考一样去做分析
  基于知识图谱的交互探索式分析,可以模拟人的思考过程去发现、求证、推理,业务人员自己就可以完成全部过程,不需要专业人员的协助。
  (3)知识学习
  利用交互式机器学习技术,支持根据推理、纠错、标注等交互动作的学习功能,不断沉淀知识逻辑和模型,提高系统智能性,将知识沉淀在企业内部,降低对经验的依赖。
  (4)高速反馈
  图式的数据存储方式,相比传统存储方式,数据调取速度更快,图库可计算超过百万潜在的实体的属性分布,可实现秒级返回结果,真正实现人机互动的实时响应,让用户可以做到即时决策。
  五、知识图谱的主要技术
  5。1知识建模
  知识建模,即为知识和数据进行抽象建模,主要包括以下5个步骤:
  以节点为主体目标,实现对不同来源的数据进行映射与合并。(确定节点)
  利用属性来表示不同数据源中针对节点的描述,形成对节点的全方位描述。(确定节点属性、标签)
  利用关系来描述各类抽象建模成节点的数据之间的关联关系,从而支持关联分析。(图设计)
  通过节点链接技术,实现围绕节点的多种类型数据的关联存储。(节点链接)
  使用事件机制描述客观世界中动态发展,体现事件与节点间的关联,并利用时序描述事件的发展状况。(动态事件描述)
  5。2知识获取
  从不同来源、不同结构的数据中进行知识提取,形成知识存入到知识图谱,这一过程我们称为知识获取。针对不同种类的数据,我们会利用不同的技术进行提取。
  从结构化数据库中获取知识:D2R。
  难点:复杂表数据的处理。
  从链接数据中获取知识:图映射。
  难点:数据对齐。
  从半结构化(网站)数据中获取知识:使用包装器。
  难点:方便的包装器定义方法,包装器自动生成、更新与维护。
  从文本中获取知识:信息抽取。
  难点:结果的准确率与覆盖率。
  5。3知识融合
  如果知识图谱的数据源来自不同数据结构的数据源,在系统已经从不同的数据源把不同结构的数据提取知识之后,接下来要做的是把它们融合成一个统一的知识图谱,这时候需要用到知识融合的技术(如果知识图谱的数据结构均为结构化数据,或某种单一模式的数据结构,则无需用到知识融合技术)。
  知识融合主要分为数据模式层融合和数据层融合,分别用的技术如下:
  数据模式层融合:概念合并、概念上下位关系合并、概念的属性定义合并。
  数据层融合:节点合并、节点属性融合、冲突检测与解决(如某一节点的数据来源有:豆瓣短文、数据库、网页爬虫等,需要将不同数据来源的同一节点进行数据层的融合)。
  由于行业知识图谱的数据模式通常采用自顶向下(由专家创建)和自底向上(从现有的行业标准转化,从现有高质量数据源(如百科)转化)结合的方式,在模式层基本都经过人工的校验,保证了可靠性,因此,知识融合的关键任务在数据层的融合。
  5。4知识存储
  图谱的数据存储既需要完成基本的数据存储,同时也要能支持上层的知识推理、知识快速查询、图实时计算等应用,因此需要存储以下信息:三元组(由开始节点、关系、结束节点三个元素组成)知识的存储、事件信息的存储、时态信息的存储、使用知识图谱组织的数据的存储。
  其关键技术和难点就在于:
  大规模三元组数据的存储;
  知识图谱组织的大数据的存储;
  事件与时态信息的存储;
  快速推理与图计算的支持。
  5。5知识计算
  知识计算主要是在知识图谱中知识和数据的基础上,通过各种算法,发现其中显式的或隐含的知识、模式或规则等,知识计算的范畴非常大,这里主要讲三个方面:
  图挖掘计算:基于图论的相关算法,实现对图谱的探索和挖掘。
  本体推理:使用本体推理进行新知识发现或冲突检测。
  基于规则的推理:使用规则引擎,编写相应的业务规则,通过推理辅助业务决策。
  5。6图挖掘和图计算
  知识图谱之上的图挖掘和计算主要分以下6类:
  第一是图遍历,知识图谱构建完之后可以理解为是一张很大的图,怎么去查询遍历这个图,要根据图的特点和应用的场景进行遍历;
  第二是图里面经典的算法,如最短路径;
  第三是路径的探寻,即给定两个实体或多个实体去发现他们之间的关系;
  第四是权威节点的分析,这在社交网络分析中用的比较多;
  第五是族群分析;
  第六是相似节点的发现。
  5。7可视化技术
  目前两个比较常见的可视化工具是:D3。js和ECharts。
  D3。js:全称DataDrivenDocuments,是一个用动态图形显示数据的JavaScript库,一个数据可视化工具,它提供了各种简单易用的函数,大大方便了数据可视化的工作。
  ECharts:是一款由百度前端技术部开发的,同样基于Javascript的数据可视化图标库。它提供大量常用的数据可视化图表,底层基于ZRender(一个全新的轻量级canvas类库),创建了坐标系、图例、提示、工具箱等基础组件,并在此上构建出折线图(区域图)、柱状图(条状图)、散点图(气泡图)、饼图(环形图)、K线图、地图、力导向布局图以及和弦图,同时支持任意维度的堆积和多图表混合展现。
  六、知识图谱的应用
  知识图谱的应用场景很多,除了问答、搜索和个性化推荐外,在不同行业不同领域也有广泛应用,以下列举几个目前比较常见的应用场景。
  6。1信用卡申请反欺诈图谱
  6。1。1欺诈手法
  银行信用卡的申请欺诈包括个人欺诈、团伙欺诈、中介包装、伪冒资料等,是指申请者使用本人身份或他人身份或编造、伪造虚假身份进行申请信用卡、申请贷款、透支欺诈等欺诈行为。
  欺诈者一般会共用合法联系人的一部分信息,如电话号码、联系地址、联系人手机号等,并通过它们的不同组合创建多个合成身份。比如:3个人仅通过共用电话和地址两个信息,可以合成9个假名身份,每个合成身份假设有5个账户,总共约45个账户。假设每个账户的信用等级为20000元,那么银行的损失可能高达900000元。
  由于拥有共用的信息,欺诈者通过这些信息构成欺诈环。
  一开始,欺诈环中的账户使用正常,欺诈者会进行正常的购买、支付和还款行为,这种行为称为“养卡”。“养卡”了一段时间后,信用额度会有所增加,随着时间推移会增长到一个让欺诈者相对“满意”的额度。
  突然有一天欺诈环“消失”了,环内成员都最大化地使用完信用额度后跑路了。
  6。1。2知识图谱解决信用卡申请反欺诈问题
  使用传统的关系数据库,来揭露欺诈环需要技术人员执行一系列的复杂连接和自连接,而且查询构建起来非常复杂,查询效率低、速度慢且成本高。
  知识图谱产品利用图数据库的天然优势,直接将银行欺诈环节可能涉及的所有有用的数据字段:如申请号、账户、身份证、手机、地址、家庭电话、联系人、设备指纹等设计成图谱的节点,定义好图谱所需的所有节点和节点属性后,定义两两节点间的关系。
  如:申请号节点与设备指纹节点相连构成“申请设备”关系,人节点与地址节点相连构成“申请人地址”关系。
  根据业务上设计好的图谱进行建图,建图后,用户可以直接在关联图谱平台上,输入某个节点值查询节点的关联信息,如:输入某个黑手机号,看其关联5层范围内的涉及到的申请人信息,看该节点是否与其他节点关联成欺诈环,看节点与历史的黑节点间是否有过关联等等。
  用户可借助知识图谱产品,在贷前防御风险,贷中进行关联分析找出可疑点,控制风险,贷后进行风险把关,让损失降到最低。
  6。2企业知识图谱
  目前金融证券领域,应用主要侧重于企业知识图谱。企业数据包括:企业基础数据、投资关系、任职关系、企业专利数据、企业招投标数据、企业招聘数据、企业诉讼数据、企业失信数据、企业新闻数据等。
  利用知识图谱融合以上企业数据,可以构建企业知识图谱,并在企业知识图谱之上利用图谱的特性,针对金融业务场景有一系列的图谱应用,举例如下:
  (1)企业风险评估
  基于企业的基础信息、投资关系、诉讼、失信等多维度关联数据,利用图计算等方法构建科学、严谨的企业风险评估体系,有效规避潜在的经营风险与资金风险。
  (2)企业社交图谱查询
  基于投资、任职、专利、招投标、涉诉关系以目标企业为核心向外层层扩散,形成一个网络关系图,直观立体展现企业关联。
  (3)企业最终控制人查询
  基于股权投资关系寻找持股比例最大的股东,最终追溯至某自然人或国有资产管理部门。
  (4)企业之间路径发现
  在基于股权、任职、专利、招投标、涉诉等关系形成的网络关系中,查询企业之间的最短关系路径,衡量企业之间的联系密切度。
  (5)初创企业融资发展历程
  基于企业知识图谱中的投融资事件发生的时间顺序,记录企业的融资发展历程。
  (6)上市企业智能问答
  用户可以通过输入自然语言问题,系统直接给出用户想要的答案。
  6。3交易知识图谱
  金融交易知识图谱在企业知识图谱之上,增加交易客户数据、客户之间的关系数据以及交易行为数据等,利用图挖掘技术,包括很多业务相关的规则,来分析实体与实体之间的关联关系,最终形成金融领域的交易知识图谱。
  在银行交易反欺诈方面,可以从从身份证,手机号、设备指纹、IP等多重维度对持卡人的历史交易信息进行自动化关联分析,关联分析出可疑人员和可疑交易。
  6。4反洗钱知识图谱
  对于反洗钱或电信诈骗场景,知识图谱可精准追踪卡卡间的交易路径,从源头的账户卡号商户等关联至最后收款方,识别洗钱套现路径和可疑人员,并通过可疑人员的交易轨迹,层层关联,分析得到更多可疑人员、账户、商户或卡号等实体。
  6。5信贷消费贷知识图谱
  对于互联网信贷、消费贷、小额现金贷等场景,知识图谱可从身份证、手机号、紧急联系人手机号、设备指纹、家庭地址、办公地址、IP等多重维度对申请人的申请信息,进行自动化关联分析,通过关系关系并结合规则,识别图中异常信息,有效判别申请人信息真实性和可靠性。
  6。6内控知识图谱
  在内控场景的经典案例里,中介人员通过制造或利用对方信息的不对称,将企业存款从银行偷偷转移,在企业负责人不知情的情况下,中介已把企业存在银行的全部存款转移并消失不见。通过建立企业知识图谱,可将信息实时互通,发现一些隐藏信息,寻找欺诈漏洞,找出资金流向。
  相关阅读
  什么是关联图谱?
投诉 评论

凛冬将至:品牌和传统零售商如何逃离倒闭潮?国内外的零售业都在感受着“凛冬到来的残酷”,传统零售业迎来关店潮。关店潮的背后,是实体零售业所面临的巨大危机。那么品牌和传统零售商将如何逃离倒闭潮?国内外的零售业都在感受……为什么P2P乱象不断,我仍旧看好互联网金融?监管层的积极表态,无疑释了两个信号:一个是互联网金融的整治依旧复杂,也为备案延期给出了说法;另一个是监管层正谋求可持续、健康发展、长治有效的监管体制。央行又一次放出“狠话……舌尖上的消费升级:酱油,应该怎么打?人们对酱油产品的印象就是名副其实的“小产品”。近年来,随着社会经济的发展,消费水平的提高,酱油这个小产品越来越趋向专业化,功能化,市场需求不断增长。中国饮食文化追求“五味……信息流之后:微信公众号的三条道路公众号改版成信息流之后,微信对公众号变现的渠道收窄了,而从当下的情形来看,公众号能够生存下去,主要有这三条道路。一看看微博,刷刷朋友圈,逛逛知乎今日头条,……关于智能路灯,你所不知道的那些事儿一般人眼里,路灯就是路旁平凡的照明之物。但随着科技的发展以及智慧城市的兴起,路灯渐渐被赋予更多的使命,摇身一变,时尚智能。本文带大家了解一下每天坚持熬夜看世界杯的朋友,一……爆雷靴子落地,P2P或不再负重前行从P2P行业本身来看,爆雷是表,让劣币不再驱逐良币才是里。7月9日,2013年年初成立、交易额已经累计325亿元的钱爸爸,一下子变成了“囧爸爸”。“经侦部门介入调查”这一……品牌的成长的4个阶梯:为什么腾讯、阿里不算是品牌?为什么腾讯阿里不算是品牌呢?很简单,它们自己就是模仿者,制造着一批又一批的模仿品。那品牌成长阶梯有是怎样的呢?在影片中,“瑞士格列宁”令大多慢粒白血病人不满,并引发病友们……产品世界的暗黑模式,默默操纵着人们产品世界的暗黑模式是什么?它为什么可以操纵着我们?本文对此进行了分析解答。还记得2018一开年,支付宝年度账单运营活动流程中,默认选中”我同意《芝麻服务协议》”,这一举动……抖音国际版TikTok运营“真经”:拒绝“平台造星”抖音国际版TikTok摸索出一本运营“真经”,一句话概括他们在海外市场的运营方式,那就是“让用户自己去运营自己”,而不是“平台造星”。7天时间,从暂时被封禁到最终恢复服务……全渠道中台业务:中台的核心模块的落地方案前端时间写了一篇《全渠道中台业务:聊聊线下商超的新零售》简单分析了当前商超零售的新零售的思路和战略方向,今天延续上篇文章的思路继续扩展开全渠道中台的内核,讲讲中台的核心模块以及……中国是消费升级,还是消费降级?我们用数据说话五一劳动节当天,一篇《这届年轻人已经开始消费降级了》,不得不服这个标题和话题都非常抓眼球,并且现在我们年轻人被现在的各种网文搞得异常焦虑,也异常敏感,所以这篇刷屏也就不足为奇了……6个方面分析:知识图谱的价值和应用知识对于人工智能的价值就在于,让机器具备认知能力和理解能力。构建知识图谱这个过程的本质,就是让机器形成认知能力,理解这个世界。一、知识图谱无处不在说到人工智能技术,……
996。ICU掀起互联网的“遮羞布”996的枷锁还要带很久,圈外人高呼“程序员的命也是命”,圈内人却选择视而不见。“能做996是一种巨大的福气,这是我们修来的福报。很多人想996都没有机会,你去想一下没有工……从视觉中国的公关危机,谈谈“主流价值观”问题术有正邪,道则一也。核心提示:图片版权是中国图片商业模式之基,也是其南征北战之剑,但如果被滥用,也可能为其带来灭顶之灾。4月10日,全人类首张宇宙黑洞的照片公布,引……当我们说起平台时,到底在说什么?(二)当我们研究平台时,可以尝试着先问自己关于文中的8个问题,它能够帮助我们了解这个平台的形态框架。在这个系列,我希望能用两篇文章将如何研究一个平台的基本框架讲清楚,这个框架的……【天天问每周精选】第70期:朋友圈广告爱用美女图?还能艾特好微信一直都是产品人的热点,近期出现了愚人节输入我喜欢你,会掉落黑脸;朋友圈文字折叠机制;朋友圈广告可以艾特好友等等热点事件,我们在天天问交流了这些问题,那么本期就来看看大家的讨……所有的创新,最后都是人的问题经过数月的紧张筹备,2019产品创新大会,上周末终于在深圳落幕了!在这两天的短暂相聚中,有太多精彩的瞬间,也有无数让人欢笑和尖叫的惊喜。接下来,一起来看看……程序员集体意识的爆发:996背后的深问题996的情况,归于法律的归法律,归于市场机制的应该由市场经济调整。最近关于程序员的话题成为热门,这个事件其实早就在互联网上有过几次发酵,最早是在58同城时,一线城市对于程……产品分析拼多多,一个琳琅满目又热热闹闹的“两元店”本文笔者将从市场,用户,功能,运营等4个角度对拼多多的产品进行分析。点开拼多多的APP,花花绿绿的商品页面,秒杀清仓的特卖活动,9块9、5块8的单品标价,以及APP首部不……90后,还愿意延迟满足吗?新技术展开的四个阶段是什么?如何面对市场的非理性繁荣?如何面对市场上的泡沫破裂?今天我想跟大家分享的主题跟时代动力、明天思维有关,我用了一个稍微夸张一点的标题叫“公司制的……六大方向,聚合支付行业该如何突围移动支付一直是一块许多人都想吃到的肥肉,面对成型的市场,从业者还有没有机会进入分一杯羹呢。接下来,笔者将为我们讲一讲如何从红海市场突围,建立优势?派盟2018年发布了《中……读作工业4。0,唱作工业互联网,写作中国制造2025工业4。0是近几年非常耳熟能详的概念,这个名词也意味着工业上出现的新要求、新变革。笔者强调,工业4。0将会是中国传统经济和互联网经济的一次“大蜕变”。接下来,看看笔者是如何分析……13个怪诞数字,揭示95后矛盾特征本文为95后消费者研究报告,据此你可以详细了解其消费特点、生活习惯以及行为趋势等相关信息。1。全球98的95后通常喜欢在实体店购物,是网上购物的3倍。71的95后喜欢体验……还原巴宝莉上海大撤退真相巴宝莉关闭在上海的门店,与其说是一次大撤退,不如说是一次战略转移。在大环境普遍变冷的情况下,奢侈品的日子越来越不好过了,但是关闭门店,并不意味着巴宝莉没落了。具体背后有何真相是……
友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找作文动态热点娱乐育儿情感教程科技体育养生教案探索美文旅游财经日志励志范文论文时尚保健游戏护肤业界