专栏电商日志财经减肥爱情
投稿投诉
爱情常识
搭配分娩
减肥两性
孕期塑形
财经教案
论文美文
日志体育
养生学堂
电商科学
头戴业界
专栏星座
用品音乐

实操小微风控报告中的地址信息的清洗与照面和司法数据使用

  在中小微企业的大数据风控体系中,工商数据与司法数据是最基本也是最常见的两类信息维度,在企业大数据体系的应用场景中扮演着重要角色。由于企业工商与司法数据的多部分内容属于社会公开化信息,因此在行业市场内也是非常容易获取的,可以通过国家或地方相关的工商司法公共服务系统,或者企查查、天眼查、启信宝等商用平台,直接查询了解企业的基本信息与风险状况。若作为数据需求方的公司单位有一定资质,可以与工商或司法数据相关机构或平台进行合作,引入工商司法更为详细的底层数据,以便加工得到更丰富的特征指标,从而为企业风控的架构与完善赋予更多的效能。
  1、工商与司法数据的应用背景
  企业工商与司法数据在实际业务中的重要性不言而喻,对于银行、小贷等金融机构开展企业信贷业务的审批环节必然不可或缺,同时对于企业融资的助贷机构也是金融科技的重要元素。无论是产品风控的策略应用,还是业务运营的信息周转,企业工商数据可以认为最基础的信息体系,在风控准入策略、风控评估报告、客户画像分析等方面,必然会有工商与司法数据的展示及其信息描述的体现,在实际场景应用中发挥着非常重要的数据参考价值。
  企业工商数据从细化维度来区分,可以包括照面信息、股东信息、对外投资信息、分支机构、变更信息、主营业务、社保信息、网址信息、主要人员对外投资信息、联系方式信息、社会组织信息、司法信息等。其中,工商照面信息是企业的基本数据,可以理解为企业的一张名片,由此提取或加工出的特征字段,往往可以作为客户画像或风控准入等场景的分析指标。
  企业司法数据包括开庭公告、法院公告、裁判文书、执行公告、案件流程、执行公告、拍卖公告、曝光台等维度。司法数据作为企业风险评估的重要组成部分,可以详细地展示企业经营涉诉等信息,能够很直观地量化企业的整体风险状况,不仅可以将司法统计指标用于产品准入条件,而且为企业风险模型提供了较多的特征维度。
  为了便于大家对企业的工商照面信息、司法涉诉信息有更全面的理解与熟悉,本文将结合具体的报文数据实例,依次来介绍下企业这两类重要数据在企业风控体系中的应用思路与实现方法。
  2、工商照面信息的数据分析
  2。1工商照面信息的报文样例
  企业的工商照面信息数据,可以在某些工商数据提供平台,根据企业全名、社会信用代码、注册号其中之一作为查询ID,通过API接口精确获取企业相关的工商信息。这里以小米科技有限责任公司为例,调用并返回对应的工商照面信息报文样例如图1所示。从实例数据结果中可以大体了解到,返回的企业照面数据都是企业的最基本信息,似乎与OCR识别企业营业执照获取的信息非常类似,但此处需要注意的是,这里获取的企业照面数据比营业执照的信息更为全面。
  编辑
  添加图片注释,不超过140字(可选)
  图1企业工商照面信息
  2。2工商照面信息的数据挖掘
  通过图1展示的数据报文样例,可以很清晰的了解到企业工商照面信息的指标结构,接下来我们按照指标顺序,来依次介绍下各字段的业务含义,以及部分特征在风控流程中的应用逻辑。
  (1)id:企业主键的加密id,非企业工商数据,仅为数据机构方的内部标识。
  (2)name:企业名称,与社会信用代码(creditNo)组合可用于企业二要素信息核验,一般作为产品风控的准入条件,若企业名称与社会信用代码信息不对应则拒绝。
  (3)econKind:企业类型,常见的可以分为有限责任公司、股份有限公司、无限公司、两合公司、股份两合公司,本例为有限责任公司类型的细分维度自然人投资或控股。
  (4)econKindCode:企业类型代码,这里以常见的有限责任公司类型为例,列出企业类型代码的对应含义,具体如图2所示。
  编辑
  添加图片注释,不超过140字(可选)
  图2企业类型代码含义
  (1)registCapi:注册资本,一般情况下公司的注册资金越高有利于外部对企业实力的认可,但同时需要承担的风险也越大;对于一定规模的中小微企业,注册资金在合理范围内较高可以初步认为较好。
  (2)historyNames:历史名称,是一个数组形式,可以有多个名称;名称较多在一定程度可反映出企业历史的不稳定性。
  (3)address:详细地址,可重点解析省、市、区的具体名称,对于企业融资产品,往往适用于线上产品的准入条件;若企业的地址不在定义区域范围内则拒绝。
  (4)regNo:企业注册号。
  (5)scope:经营范围,可了解企业的主营业务情况,主要用于企业征信报告中对公司的基本信息介绍。
  (6)termStart:营业开始时间,与当前时间加工出经营年限,可用于产品风控的准入条件,当企业经营年限小于产品的年限标准则拒绝。
  (7)termEnd:营业结束时间,与当前时间加工出剩余年限,可用于产品风控的准入条件;当企业剩余年限小于产品的年限标准则拒绝;若营业结束时间的值为长期时则无需加工新指标。
  (8)belongOrg:所属工商局,可与企业详细地址的省市区进行对比,验证企业所属工商所辖区域是否异常;例如本例的企业地址(北京市海淀区)与工商局地址(北京市海淀分局)是对应的。
  (9)operName:企业法定代表人,与企业名称(name)、统一社会信用代码(creditNo)组合,可用于企业三要素信息核验,一般作为产品风控的准入条件,若三者信息不对应则拒绝。
  (10)startDate:成立日期,与当前时间加工出成立年限,可用于产品风控的准入条件,当企业成立年限小于产品的年限标准则拒绝,与上文的经营年限逻辑类似,实际情况通常二者相同。
  (11)endDate:注销日期,若取值有具体时间则说明企业当前未正常营业。
  (12)checkDate:核准日期,若具体时间距当前时间较近,说明企业近期存在法定登记信息的变更,例如法人、股权、经营范围等信息,可进一步根据历史变更信息了解详情。
  (13)status:经营状态,可分为8种状态,分别为续存、在业、吊销、注销、迁入、迁出、停业、清算,其中在业、续存等状态属于正常情况,若取值为吊销、注销、停业、清算等情况,在风控准入条件中直接拒绝。
  (14)orgNo:组织机构号。
  (15)creditNo:统一社会信用代码,作为企业通用的主键标签,类似自然人的身份证号,与企业名称、法定代表人组合,可用于企业二、三要素信息核验。
  (16)districtCode:地区代码,由6位数字表示具体省市区(县),其中第12位是省级编码,第34位是地级编码,第56位是县级编码;可通过国家统计局进行查询,这里以北京市为例,具体地区代码与含义如图3所示。
  编辑
  添加图片注释,不超过140字(可选)
  图3企业地区代码含义
  (1)actualCapi:实缴金额,可与注册资本(registCapi)进行对比,通常情况若实缴金额占注册资本的比例越高,体现出的企业风险越低。
  (2)domain:四级行业,可通过国家统计局的国民经济行业分类标准进行查询,行业四级组合依次指门类、大类、中类、小类;以本例M7590说明,M指门类,表示科学研究和技术服务业;75指大类,表示科技推广和应用服务业;759指中类,7590指小类,表示其他科技推广服务业。此外,这里以M75大类为例,介绍下内含的中小类型,具体如图4所示。
  编辑
  添加图片注释,不超过140字(可选)
  图4企业四级行业(M75)
  (1)tags:企业资质,取值是一个数组结构,可以取多个值,例如为高新企业、上市公司等;此特征的取值越多,说明企业的资质能力越好。
  2。3工商照面信息的风控应用
  围绕以上对企业工商照面信息的指标解读,大体熟悉了各字段的业务含义与应用方向,也可以看出多数字段是对企业整体情况的介绍,而对其风控应用主要集中在其中部分指标,下面我们以图1报文数据作为样例,来进一步描述下重要特征的实际场景应用。
  (1)企业要素二要素核验:企业名称(name)、统一社会信用代码(creditNo),判断二者是否对应,返回布尔型值(例10);当企业主体小米科技有限责任公司与91110108551385082Q相对应则信息验证通过。
  (2)企业要素三要素核验:企业名称(name)、统一社会信用代码(creditNo)、企业法定代表人(operName),判断三者是否对应,返回布尔型值(例10);当企业主体小米科技有限责任公司、91110108551385082Q、雷军相对应则信息验证通过。
  (3)企业经营时长(duration):当前时间(currTime)营业开始时间(termStart),以年为单位;本例2022201012(年),与产品准入经营年限years进行比较,当前者大于等于后者则通过。
  (4)企业成立时长(estabTime):当前时间(currTime)成立时间(startDate),以年为单位;本例2022201012(年),与产品准入成立年限years进行比较,当前者大于等于后者则通过。
  (5)企业经营状态(status):作为风控准入核验企业当前的经营状态,当取值为在业、续存则通过,当取值为吊销、注销、停业、清算则拒绝,当取值为迁入、迁出则待定。
  (6)企业地址省(province):根据企业详细地址(belongOrg)提取省级名称(含直辖市),可通过关键词省市实现指标加工,指标用于产品适用地区范围(省级)的准入校验。
  (7)企业地址市(city):根据企业详细地址(belongOrg)提取市级名称(含直辖市所辖区),可通过关键词市区实现指标加工,指标用于产品适用地区范围(市级)的准入校验。
  (8)实缴资本比例(capiPct):实缴金额(actualCapi)注册资本(registCapi),通常情况下比例值越大越好,可作为企业评分卡模型企业资本维度的模型指标。
  以上各指标均为企业工商照面信息的常见应用思路,在实际场景中可以根据情况综合考虑。此外,对于企业类型(econKind)、经营范围(scope)、企业资质(tags)、历史名称(historyNames)、四级行业(domain)、注册资本(registCapi)等信息,往往作为企业数据征信或风控评估报告的描述内容,便于对企业进行全面多方位的了解,作为信审人员的信息参考。
  2。4企业地址信息的省市提取
  在企业工商照面信息中,企业地址address是一个可深入探索的特征字段,尤其是根据详细地址信息提取出省、市名称,可以便于我们进一步加工出城市发展等级、区域经济指数等特征,从而为产品适用地区范围的准入条件、企业风控模型的环境影响评价等方面,提供相关的特征标签或字段来源。
  为了便于大家对地址信息有更好的理解与应用,我们结合具体的数据样例,来实现围绕地址来提取省市名称的过程,我们通过图5所示python代码来构造一份数据,得到的样本数据如图6所示,包含企业序列号(id)、企业名称(name)、企业地址(address)共3个字段。
  编辑
  添加图片注释,不超过140字(可选)
  图5企业地址数据构建
  编辑
  添加图片注释,不超过140字(可选)
  图6企业地址数据样例
  围绕以上样本数据,我们需要对企业地址(address)进行详细信息的提取,包括省、市、区的具体名称。在实际场景的Python语言环境中,本次在知识星球中介绍的工具,可以智能解析出地址信息的省市区地址,还可以同步输出地址对应的地区代码,应用较为方便且广泛,具体实现过程详见知识星球代码详情。。按照这种方法对图6的地址数据进行批量解析,最终输出结果如图7所示。
  编辑
  添加图片注释,不超过140字(可选)
  图7企业地址解析结果
  当然在常规的地址信息的清洗过程中,我们更多的依赖地址中划分的信息进行划分,比如参考下此份的地址汇总信息:
  编辑切换为居中
  添加图片注释,不超过140字(可选)
  此份相关内容也一起同步至知识星球平台,可以一起前往下载查阅。
  3、司法涉诉信息的数据分析
  企业的司法诉讼信息数据,可以根据企业全名或社会信用代码,通过相关系统或平台进行查询。企业司法信息虽然包含了多个细化,常见的有开庭公告、法院公告、裁判文书、司法拍卖等,但数据信息结构与司法属性理解都是比较类似的,因此本文将选取裁判文书、开庭公告这两个维度作为样例来进行描述。
  3。1裁判文书信息的风控应用
  裁判文书是记录人民法院对案件的审理过程和结果,它是诉讼活动结果的载体,也是人民法院确定和分配当事人实体权利义务的唯一凭证。图8为某企业涉诉的实际裁判文书案例,现按照前边开庭公告、法院公告的解析思路,对裁判文书的分析进行简单介绍。
  编辑
  添加图片注释,不超过140字(可选)
  图8企业裁判文书样例
  本例涉及企业主体名称为重庆越通贸易有限公司,解析指标如下:
  (1)文书类型:执行裁定书。根据裁判文书常见类型,可以分为民事调解书、民事裁定书、行政裁定书、行政判决书、执行裁定书、刑事裁定书等。一般情况下,当裁判文书属于民事调解书时,说明案件风险系数较小,而执行裁定书相对来说,有一定风险属性;具体风险定义是相对来讲,若主体企业是原告且胜诉,则此裁判文书是风险较低类别;
  (2)距今时长:8年。根据立案时间2014年09月11日,以及当前日期年份2022,可以算出相隔年份数为8年,事件发生时间窗距今较长,风险系数较低;
  (3)法院类型:中级法院。示例中的重庆市第四中级人民法院,属于中级法院,从案件属性与发展形态方面分析,事件有一定风险;
  (4)审理结果:执行异议。具体状态包括一审、二审、执行等,若此案件状态为执行,说明案件审理已结束,而二审状态相比一审状态,更能体现出案件的风险。
  综合以上指标分析,若以此例裁判对企业进行描述可以概括为:企业主体在此执行案件中,身份为申请执行人,审理结果为胜诉,同时事件发生时隔较久,风险程度表现很低。
  3。2法院公告信息的风控应用
  法院公告是指由独立行使审判权的国家机关向社会公众公布的法律文书,按程序可分为诉讼公告和非诉讼公告。现以某企业涉诉的实际法院公告案件为例(如图9),来介绍如何解析法院公告具体的数据报文内容,并将挖掘生成的相关指标应用于风控决策流程中,以及实现的效果。
  编辑
  添加图片注释,不超过140字(可选)
  图9企业法院公告样例
  本例涉及企业主体名称为华易租赁股份有限公司,与开庭公告案例类似,可以重点分析以下几个指标:
  (1)案件身份:原告。这是案件需要优先关注的一个属性指标,主体原告身份相对被告来讲,往往可以体现风险程度较低;
  (2)距今时长:4年。根据立案时间2018年07月24日,以及当前日期年份2022,可以算出相隔年份数为4年;一般情况下,当案件发生的时间在3年内,可以认为具有一定风险,若涉诉事件在1年内发生,则风险系数更大;
  (3)法院类型:基层法院。示例中的杭州市西湖区人民法院,属于基层法院,相对中高级法院来讲,在案件发展形态方面来讲,初步可以认为此案例的风险程度较低。
  (4)案由类型:普通民事风险。从法院对案件处理的类型角度出发,可以判定案件的风险程度一般。
  结合以上各指标的分析,若以此样例的法院公告信息对企业进行描述可以概括为:企业主体涉及的法院公告为普通民事案件,原告身份,法院为基层人民法院,且案件发生在三年以前,风险程度很低。
  当企业涉及多个法院公告案件时,可以根据相关指标进行统计汇总,如近1年法院公告案件数量、近3年法院公告案件数量、历史法院公告案件数量、历史法院公告案件身份为被告的数量、历史法院公告中级以上法院审理案件数量等,这些指标展示在企业风险评估报告中,可以很直观地体现出企业司法涉诉风险的高低,同时部分指标也可作为企业评分模型的字段。
  以上对开庭公告、法院公告、裁判文书案件类型的分析思路,都是通过解析案件内容加工出案件身份、距今时长、法院类型、案由类型等指标,然后进一步将所有涉诉案件的指标进行统计汇总,便可以得到每个司法涉诉维度下的综合指标,并最终用于企业信用评分模型的字段,或者展示在企业信用风险评估报告中。除了以上司法维度的举例说明,其他几个司法涉诉类型原理逻辑类似,如执行公告、拍卖公告、案件流程等。
  综合以上内容,我们围绕企业的工商照面信息与司法涉诉信息,先后通过具体的数据报文样例,介绍了各维度下的特征提取逻辑、风控应用思路、企业风险评价等,并在现有字段的基础上衍生部分风控指标,以及对企业风险信息的概况总结,从而为企业的风控准入与征信描述提供必要的数据应用价值。为了便于大家对企业工商照面与司法涉诉信息的进一步了解与熟悉,本文额外附带了企业工商司法信息更多维度的报文数据样例,详情请移至知识星球查看相关内容。
  编辑切换为居中
  添加图片注释,不超过140字(可选)
  【企业工商司法信息示例】
  编辑切换为居中
  添加图片注释,不超过140字(可选)
  【地址清洗代码示例与地址库信息汇总】
  编辑切换为居中
  添加图片注释,不超过140字(可选)
  【知识星球相关资料预览】
  另外关于中小微财税票中的模型内容,有兴趣的童鞋可关注:
  编辑切换为居中
  添加图片注释,不超过140字(可选)
  。。。
  原创文章

科莫多巨蜥的毒液到底有多可怕?2009年,一名31岁的渔民安瓦尔,在印尼科莫多岛上采摘水果,结果不小心从水果树上掉了下来,刚好踩到了一只巨型蜥蜴,蜥蜴瞬间就朝他扑了过去,咬住了他的腿,之后又咬住了他的手臂,身体武汉未来的房价会涨到100000元平米吗?这个问题的答案是肯定的!以目前的趋势,未来武汉房价必然达到10万的水平,只是时间长短的问题。2010年至2017年,短短七年间,武汉的房价已经翻了3番,目前,武汉部分高端楼盘如洞庭兰州青白石片区,中央公园怎么样?兰州北拓的黄金区域,目前基础交通还跟不上建设需要,交通滞后可能会成为十四五期间兰州青白石片区发展的的最大障碍!不过就兰州地理位置和城区格局而言,青白石片区是离主城区最近的待开发区域农民为什么不在国家统计失业范围之内?中国有四个儿子,大儿子叫工人,二儿子叫子弟兵,三儿子叫公务员,四儿子叫农民,所以四儿子就没有纳入统计失业包括养老金范围,因为四儿子有金山银山还有三分地。农民有土地,这是农民可以赖以农村成立社区是什么意思?很多农村驻有村委会办公室,同时也驻有社区管理委员会办公室,特别是在城市郊区的农村和街道的农村都同时设立了村委会和社区管理委员会,很多人弄不明白是怎么回事。那农村成立社区是什么意思呢农村里的剩男,为何一剩再剩呢?到底是什么原因?男女比例失调。计划生育只要一个孩子时,受封建思想影响,都拚命要男孩,等他们长大了,很难找到媳妇。一,农村姑娘远嫁,二,女孩见少,三,彩礼高,四,剩男挣钱少。我就一大龄剩男!个人亲身抖音付费直播试水,看直播要给钱了?我们应该如何思考?使劲收,最好是家人们看的话,一分钟100块钱。毕竟粉丝听话的很。毕竟人设都设计好了打PK,卖货摆错价格,怒亏2个亿回馈粉丝。没事就怼工厂,怼员工反正就是赔钱回馈粉丝。赔完还得补交税马上就要退休了,退休工资才3650元太少了,怎么办?3600不少了。我企业工龄32年,退休时退休金只有2200,涨了这么多年还不到3000。知足常乐吧!如果身体不好,这些钱也够生活了,如果身体还可以,就找一些力所能及的工作,打打工补南宁五象新区未来的发展潜力很大吗?五象新区无法成为国家级新区!!!目前看来,五象新区的潜力也就这样了。我们对比一下贵阳的贵安新区,贵安新区的面积是1700平方公里,由贵阳市的郊区和安顺市合并得来。是全国第8个国家级如果把三峡大坝加高10米,截留更多的洪水,可行吗?我国的三峡大坝,作为当今世界上最大的水利枢纽工程,位于湖北省宜昌市上游,距下游葛洲坝水电站38公里,三峡大坝全长2309米高185米,呈梯形形状,集发电旅游航运调控洪水于一身。三峡大家有经历过亲人去世吗?是怎样走出痛苦和想念的?2018年9月1日下午3点8分,我的妻子在医院里停止了呼吸。她的眼睛没有闭上,我流着泪,帮她合上了双眼。我永远失去了我最亲近的爱人,孩子永远的失去了妈妈。一位好妻子,好女儿,好姑妈
炸藕盒想外酥里嫩,大厨用面粉用淀粉都不对,学会1招外酥里嫩冬日生活打卡季炸藕盒想外酥里嫩,大厨用面粉用淀粉都不对,1招外酥里嫩超好吃!过大年,现在的过年已经少了许多的年味,孩子们也不是那样的期盼了。但是对于我们传统节日最好的传承,还是家家方圆15万亿公里共用一盏灯泡,太阳能够照亮整个太阳系吗?太阳和塞德娜看到这个小亮点了吗?你绝对想象不到,它就是给我们带来光明和温暖的太阳。太阳怎么变成星星了呢?这是在塞德娜星球上看到的太阳。塞德娜距离太阳有125亿公里之遥,最远的时候可量子异质结构综述量子材料通常是异质的,具有结构缺陷杂质表面边缘界面和无序。这些异质性有时被视为传统体系中的缺点然而,它们的电子和磁性结构通常定义并影响量子现象,如相干相互作用纠缠和宿主系统中的拓扑重看蜗居才发现,海藻的不劳而获,是被这两人惯出来的文重流年海藻的身上,有一个很不好的标签不劳而获。因为不劳而获,她工作不脚踏实地,三天打鱼两天晒网,经常换工作。也因为不劳而获,她投入宋思明的怀抱,在大是大非的问题上,犯了糊涂。海藻神农识药清热解毒药之鱼腥草哈喽,大家好呀,又到了疏调学派的科普小课堂神农识药的时间啦,今天是清热解毒药系列的第十三期。我们就从清热解毒药的第十三味药鱼腥草继续给大家介绍了。鱼腥草,性味辛,微寒。归肺经。本草海藻面膜的功效与作用?自制海藻面膜怎么样?(揭秘真相20问)有关海藻面膜的话题实在太多了,有很多人对海藻面膜这个东西不理解,也不懂,加上网上一些别有用心的人的宣传,对海藻面膜的认知迷雾是越来越障碍,今天我就大义灭亲,告诉大家有关海藻的真相,韶关仁化推广现代植保技术全程托管低产果园助农稳产眼下正值丹霞贡柑的采摘季,笔者走进韶关仁化县丹霞街道向阳村300多亩的柑橘林,放眼望去,一棵棵果树上缀满果实。此时的丹霞贡柑完全进入成熟期,橙黄色的果实犹如一个个小灯笼般挂满枝头。韶关仁化丹霞贡柑营销公司成立,拓宽贡柑销售渠道12月18日,在丹霞贡柑地理标志农产品保护工程项目品牌发布会上,丹霞贡柑营销公司揭牌成立。该公司的成立对壮大丹霞贡柑产业规模提升丹霞贡柑品牌效应具有十分重要的意义,标志着丹霞贡柑产您有洗肛门的习惯吗?别害羞,正确清洗有这3大好处注意个人卫生,养成良好清洁习惯,才能去除身上累积的污垢,保持皮肤干爽。而大多数人在洗澡时会针对双脚腋窝腹股沟后背等部位重点清洗,有时还会搓澡,搓澡时可以发现有黑色的泥垢产生。还有的风吹半夏大结局这几个人生真相,越早知道越好风吹半夏上周就大结局了,我刚刚追完。网友们对这部剧的评价挺不错,不过结局却很出乎意料,除了冯遇,钢铁小组全都得到了法律的惩处,裘毕正因为病重没有坐牢,被罚了款,每个人都为自己曾经的生气是自己没有标准不要轻率易怒,置自己或别人于不顾不要轻率易怒,置自己或别人于不顾。有些人使自己和别人都很难保持尊严,他们总是濒于愚蠢的边缘。这种人随处可见却不易相处。一天之中惹出一百件麻烦也不使他
友情链接:快好找快生活快百科快传网中准网文好找聚热点快软网