童话说说技术创业美文职业
投稿投诉
职业母婴
职场个人
历史治疗
笔记技能
美文纠纷
幽默家庭
范文作文
乐趣解密
创业案例
社会工作
新闻家居
心理安全
技术八卦
仲裁思考
生活时事
运势奇闻
说说企业
魅力社交
安好健康
传统笑话
童话初中
男女饮食
周易阅读
爱好两性

知识图谱的本体模型设计和ER模型设计的区别

5月13日 观潮阁投稿
  本体的概念最早起源于哲学领域,指的是对客观存在系统的解释和说明。这句话出现在了几乎所有系统介绍知识图谱和本体的材料里。在很长一段时间里,以为这是一句废话,现在对这句话有了更多的体验。
  一、前言
  知识图谱的本体涉及很多具体概念,如:实体、关系、对象节点(资源)、数据节点(字面量)等。
  所以向别人解释什么是本体时需要耗费非常多的精力,巴拉巴拉抛出一大堆概念,最后对方可能没听懂,或者听懂了但是人家根本就不关注这些细节。所以针对不同的听众可以有完全不同的说法。
  当对方是市场人员或者客户,和对方提到”本体“两个字,仅仅是为了说明知识图谱构建工程需要做哪些事情。
  比如:我们需要三周时间进行业务梳理和本体构建。
  那么无论如何也绕不过什么是本体,要解释为什么要耗费这么长时间去构建本体。这种时候可以说的非常粗略:“本体是一个数据模型,这个模型用以约束知识图谱数据的组织方式”。
  当时对方是技术人员或者产品人员,可以说:“本体可以理解为关系型数据库的ER模型”。
  ER模型即“Entityrelationshipmodel”,其实本体也是这两个概念,实体和关系。本体把名词概念称作一个实体,一个实体是一个节点,各个概念之间的联系称作关系,一条关系是两个相关节点之间的连线。
  本体就是定义哪些名词概念成为实体节点和定义实体间关系的模型。如果对方是个Coder,也可以说本体模型类似类图,表达类与类之间的关系。
  本体的一个实体就是一种类,本体的实例节点就是类的实例对象。本体的关系就是表达类之间的关系,当然本体的关系类型比类图的关系类型要多的多。
  所以本体设计和传统的数据库或者数仓设计一样,需要强依赖于业务流程和业务需求。刚刚接触知识图谱和本体的时候,我曾错误的将本体设计和ER设计等同起来,甚至为了简便直接将ER模型当作本体模型使用。
  本篇文章将会分享相关经验,通过举个小例子来讨论下本体设计和关系型数据库ER图的区别。
  本体和知识图谱的构建流程可以查看本人在本站之前的文章进行交流:
  知识图谱在风控的应用
  二、场景举例
  拿私募基金业务为例,有如下简化版的数据结构。
  私募基金管理人和其相关的股东、联系人、实际控制人、员工。根据相关规定:基金管理人的法律主体被限定为公司或合伙企业,自然人被排除在外。
  基金管理人通常都会设定为公司形式,尤其是有限责任公司形式。其中股东和实际控制人可以为自然人,也可以为法人。
  员工和联系人为自然人,一家私募基金管理人对应一个联系人和实际控制人,对应多个股东和公司员工。一个法人或自然人可以同时为股东和实际控制人,一个自然人可以同时作为一家私募基金管理人的员工和联系人。
  三、本体设计
  如果我们直接把ER模型转化成本体模型,再直接依据该本体进行数据映,可以得到相应的图谱如下。
  该图谱最大的问题在于:同一个人或者同一家公司会有多个节点,换句话说没有做节点融合。
  如上图所示:有两个相同的自然人节点”赵某“,两个相同公司节点“北京XX科技有限公司”。
  这对于知识图谱的大部分应用场景来说是不合理的,在同一个图谱中,同一个实例不能属于两种类型,不能成为两个节点。
  所以上述的知识图谱应该如下:
  为什么同一个实例不能有不同的节点呢?从应用的角度,在更加复杂从的关系中,很难发现关键节点和业务关注的关系结构。
  将上述关系以未作节点融合的图谱进行展示,仍旧很难发现多个节点之间存在的关系。
  根据上述描述,如果采用进行实体融合后的图谱,则可以非常容易的发现该图谱中存在穿刺投资、持股方和被持股方拥有相同的联系人等结构。
  所以由以上的图谱倒推得到一个更加合理的本体模型如下:
  总结
  ”本体的概念最早起源于哲学领域,指的是对客观存在系统的解释和说明“这句话出现在了几乎所有系统介绍知识图谱和本体的材料里。
  在很长一段时间里,本人也以为这是一句废话。现在对这句话有了更多的体验:
  什么是客观世界,就是一个实例就只有一个。我作为一个自然人只有一个,所以反应在图谱里也只能有一个节点。但是我是作为”人“存在,还是作为“男人”存在,还是作为“员工”存在,是依赖于特定范围的业务需要。结合知识图谱的发展史,
  知识图谱起源于语义网络和网络链接,本体的目标史对数据标准进行定义,使得图谱支持数据融合以及便于机器理解和展示。
  本体模型的设计和其他数据模型的设计类似,没有一个绝对正确的设计,只能说哪个模型更加合理。
  从以往经验看来:一个合理的本体模型大概要满足以下几点要求:
  有效地支撑业务的分析和决策。
  正确一致地展示数据信息。
  拥有广泛的适用性,易于添加新的节点类型和关系
投诉 评论

知识图谱的本体模型设计和ER模型设计的区别本体的概念最早起源于哲学领域,指的是对客观存在系统的解释和说明。这句话出现在了几乎所有系统介绍知识图谱和本体的材料里。在很长一段时间里,以为这是一句废话,现在对这句话有了更多的……如何对电商首页、详情页进行优化?入职至今的核心工作,基本是围绕网站页面优化展开,具体来说是网站的首页和商品详情页。在项目过程中,也进行了不同电商网站首页和详情页的内容设计探索调研,一点总结分享给大家。用……评论区设计(二):如何做好树状式评论?文章以腾讯新闻为例,给大家讲解一下如何做好树状式评论区设计。腾讯新闻评论区的样式:进入腾讯新闻评论区,最先看到的是一级评论,然后是二级评论,最后是评论小湖泊。上图是……设计师!你为什么要用模块化设计?本篇文章从“什么是模块化设计”和“模块化设计的好处”两方面出发,教大家如何通过模块化设计减少无用功,从而提高工作效率。最近在做项目的时候发现一个问题:在我当前做的APP项……关于移动BI的规划设计思考在移动化、大数据浪潮的今天,移动BI基于手机端随时随地进行数据查询和分析,是重视数据的公司的标配。那么移动BI该怎么做?笔者作为一家物流行业的产品经理,站在传统行业的角度上来和……评论区设计(一):如何做好盖楼式评论?本篇文章以网易新闻评论区为例,为大家讲解了五种评论区的设计模式,并且讲述了使用每种模式的原由,供大家参考。评论区设计有多种模式,本文以网易新闻评论区为例,只讨论盖楼模式。……Dashboard设计思考,数据有效传达信息本篇文章作者分别从用户角色、信息密度、数据洞察三方面出发,对Dashboard设计进行详细地介绍,最后跟大家分享自己的总结与感悟。“Dashboard设计”这个关键词已经……项目模板,如何承载场景模型?在Worktile7。0中,我们提供了大量的底层元部件,包括:任务类型、状态、组件等等。这些内容我们在之前的文章中都有介绍,其实大部分的客户,并不会在乎元部件究竟是什么,只在乎……案例解析:【社交电商】App详情页大揭秘俗话说,详情页乃兵家必争之地,得详情页者得天下。那本文分别从功能结构、以及细节,来剖析拼多多、云集、环球捕手、洋葱海外仓这四款电商产品的详情页。社交电商在2018年可谓风……AxureRP9案例:那些熟悉的交互,原来都可以用函数实现在原型设计中,利用函数都可以实现哪些交互呢?吸附导航、数学计算、音量进度滑竿、文字计数等等这些交互效果都可以实现。那么具体怎么在Axure中运用函数呢?看看文中的案例分析吧,相……Sketch52常用中文数据共享(含使用方法)本文给大家分享了一些普适性较强的中文数据源,有需要的小伙伴们欢迎来自取哦!更新过Sketch52之后,对于数据源功能(Data)很是喜爱。但官方提供的预置资源,特别是“人……四种实用方法教你总结详情页框架在设计详情页之时我们需要适时地总结其“框架”,每一次总结都将会使我们受益匪浅。本篇文章告诉大家总结详情页框架的必要性,并且一同附上了四种实用的详情页框架以供参考。详情页也……
药店口罩预约小程序的MVP设计设计干货:一篇文章带你搞定全局组件的使用UX设计0到1的全方案思考与呈现解析如何构建集团化医院协同共享云平台?从一段采访说起,谈谈我国电子病历系统的构建与发展小米爆品开发者高雄勇:爆品的3条定律如何理解互动系统中的转发功能?五类UX工作坊的应用方法新拟物化,会是2020年的UI设计趋势吗?新拟态国外设计师分析的全新UI趋势产品设计的10点深入思考如何设计好一场抽奖活动?

友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找作文动态热点娱乐育儿情感教程科技体育养生教案探索美文旅游财经日志励志范文论文时尚保健游戏护肤业界