童话说说技术创业美文职业
投稿投诉
职业母婴
职场个人
历史治疗
笔记技能
美文纠纷
幽默家庭
范文作文
乐趣解密
创业案例
社会工作
新闻家居
心理安全
技术八卦
仲裁思考
生活时事
运势奇闻
说说企业
魅力社交
安好健康
传统笑话
童话初中
男女饮食
周易阅读
爱好两性

科普帖:懂了这些名词,你就已经是个“风控人”了

12月4日 倾城傷投稿
  本文主要是一个科普帖,把当前互联网风控业务内部各环节遇到的一些特定名词给大家尝试做一些浅尝辄止的介绍。
  序言篇
  风控其实是一个很宽泛、很有历史感的概念,在不同的公司形态、业务职能上都会有风控的存在:如并购业务中的风控、股债汇业务中的风控、财务职能中的风控、法务审计职能中的风控。在金融领域,风控已经有近百年的概念,广泛应用于信用评级、量化投资等领域,也产生了诸多经典的风控模型,如金融的小伙伴熟知的KMV、creditmetric、Copula函数等模型。
  而在本篇中提及到的风控则是一个相对较新的概念,属于互联网大背景下涵盖网络安全、信息安全、统计机器学习等内容并结合企业自身业务发展衍生出来的一门新兴交叉学科。而在这块常见的应用场景主要包括电商和网络信贷场景,这是与之前的风控截然不同的地方,也对互联网大背景下的风控从业人员有了不一样的要求。
  业务篇
  本篇会简要介绍目前在一些名词概念,这些名词会是在互联网企业的风控业务中经常遇到的,所有的互联网公司应该都会遇到下面这些手段的攻击。因为我本身不是技术出身,所以在下述的介绍中只能做到浅尝辄止。
  此篇建议风控初级运营人员浏览。
  手机号码、验证码则成为了许多网络平台的“通行证”,为了“迎合”市场的需求,就有了一整条配合用户注册网络平台账号的“产业链”。
  1。卡商
  这条产业链的源头是卡商,所谓卡商就是手里拥有大量手机号的个人所有者
  这些手机号的来源主要有以下几方面:
  (1)物联网卡
  物联卡业务是中国移动、中国联通、中国电信面向物联网用户提供的采用物联网专用的段作为MSISDN的移动通信接入业务,通过专用网元设备支持短信等基础通信服务,并提供通信状态管理和通信鉴权等智能通道服务,默认开通物联网专用的短信接入服务号和物联网专用APN。这张卡可以用流量、发短信、就是不能打电话。物联网卡只针对企业工业级应用,不针对个人市场,如共享单车里面就是用到了这样的物联网卡。
  (2)虚拟手机号
  即虚拟运营商号段,170171号段,这块大家应该比较熟悉了,暂不多表。
  (3)境外卡
  因为越南等国用的信号与我国相同,所以越南这边的手机卡在我国是可以收到短信的,且因为不需要实名所以需求也较为强烈,笔者曾经在某群内看到大量售卖境外卡,每张售卖1015元,每张卡后续新用户盈利完全可以cover住成本。
  (4)真实注册的运营商号码
  在部分地区,因为基层运营商有业务考核压力,所以当有人愿意大量办卡的时候其实基层运营商是很愿意配合的。因为管理不规范这样的操作风险的存在导致大量的真实号码流入产业链当中。
  2。猫池设备农场
  当卡商拥有大量的手机号之后,需要大量承载手机号的硬件设备,于是猫池出现了。
  猫池是一种集成了多路短信收发模块的高性能工业级短信猫设备,支持多路并发从而可满足大量短信收发的应用需求。类型按可接入手机卡数量分为:单口猫池、八口猫池、16口猫池、32口猫池、64口猫池等,随着2G到4G的过度,现今一般可以插16128张卡不等,按实用功能分:普通短信猫池、普通声讯猫池、彩信猫池、GPRSWAP四合一猫池等。
  而随着互联网网站防御对抗的升级(如语音验证码的出现),这种通过猫池来进行批量账号生成的手法已经渐渐遇到了瓶颈,为了更好的服务好“需求”(除了注册之外,刷投票、刷流量、刷阅读量同理),承载的硬件设备也从猫池升级到了“手机农场”。
  顾名思义,手机农场是用大量的廉价手机组成“设备池”,并依赖“群控”工具完成批量操作,这就比猫池设备高级了,隐匿性和真实性更高。
  (手机农场)
  3。接码平台
  接码平台,或者也可称之为验证码平台。它类似于手机卡市场的“淘宝”,卡商将自己的卡号放到平台上售卖,而羊毛党或者其他有验证码需求的人则可以直接在平台上购买号码,接收短信,卡商平台提供软件支持、业务结算等服务,通过业务分成获利。
  (某接码平台客户端)
  一张从未做过验证码服务的卡,在平台上一天的收益大约有1525元,根据验证码的属性不同,卡商和平台的分成比例也不同,语音类验证码五五开,短信类验证码三七开,卡商占七成。
  4。打码平台
  而在产业链的主链条中,还有一些辅助工具的加入,才能配合该链条运转,比如打码平台就是个很好的例子。在注册、抢购过程中都会遇到验证码的存在,而这个时候打码平台就派上用场了。
  打码平台的本质是“人肉打码”,很多打码平台需要跟网赚平台进行合作,因为网赚平台的用户量比较大,这种每天输入一些验证码就能赚钱的平台是很多用户比较喜欢的。网赚平台通过金币的形式给用户发放,金币累积一定数量后可进行提现。
  在网赚平台上的佣工可以勾选想要接收的验证码复杂度,有选择题、填空题、鼠标点击类型等等,每种验证码的积分不同,验证码难度较高的积分较大些,同时网赚平台夜间工作给的积分也会多。
  (打码平台流程图)
  目前随着人工智能的发展,图像识别技术已经越来越精准,很多简单的字符验证码已经不能够有效阻挡机器行为,使用简单的OCR识别工具即可进行识别,稍微复杂的可以结合机器学习等进行高准确率的识别,大大提高了“工作效率”。
  5。伪基站
  伪基站设备是嫌疑人私自组装生产的一种高科技仪器,主要由主机、笔记本电脑组成,能够强制连接用户手机信号,摄取一定半径范围内的手机信息,可以任意冒用手机或公用服务号码强行向用户手机发送短信。
  伪基站的主要特点,是可以随意更改发送的号码,可以选择尾号较好的号码,还可以使用尾数为10086或95588等号码,使手机用户误以为真的是移动公司或工商银行发送的短信。利用伪基站设备发送带有木马链接的短信、利用木马盗取公民重要信息(如银行卡信息、短信验证码)已经成为非常普遍的一种犯罪方式。
  《中华人民共和国刑法修正案(九)》规定:
  “违反国家规定,擅自设置、使用无线电台(站),或者擅自使用无线电频率,干扰无线电通讯秩序,情节严重的,处三年以下有期徒刑、拘役或者管制,并处或者单处罚金;情节特别严重的,处三年以上七年以下有期徒刑,并处罚金。”
  6。短信嗅探
  GSM协议中2G网络架构是开源的,它本身传输数据时也没有加密,这就导致短信内容是明文传输的,这就给不法分子提供了可乘之机诈骗者可以利用GSM2G网络的设计缺陷,在不接触目标手机的情况下,获得目标手机所接收到的验证短信,盗取用户支付宝、微信或者网银中的资产。
  犯罪团伙基于2G移动网络下的GSM通信协议,搭配专用手机,组装成便于携带易使用的短信嗅探设备。通过号码收集设备获取一定范围下的潜在的手机号码,然后在一些支付网站或移动应用的登录界面,通过“短信验证码登录”途径登录,再利用短信嗅探设备来嗅探短信提取短信中的验证码。
  大家的银行卡、身份证号等隐私信息也早早就被泄露在网上,那么资金盗刷对于诈骗分子来说就是轻而易举的事情,由此掌握目标的四大件:手机号码、身份证号码、银行卡号、短信验证码。通过获取的四大件,实施各类与支付或借贷等资金流转相关的注册绑定解绑、消费、小额贷款、信用抵扣等恶意操作,实现对目标的盗刷或信用卡诈骗犯罪。
  因为,一般短信嗅探技术只是同时获取短信,并不能拦截短信,所以不法分子通常会选择在深夜作案,因为这时,受害者熟睡,不会注意到异常短信,等到受害人发现的时候早已经销赃完成。
  7。模拟器改机工具
  对于硬件信息的修改已经成为非常重要的手段,而对于硬件信息的更高手段也是愈发多样。手机模拟器一种常见的软件,常见于各类薅羊毛活动,采用多开方式手动操作或是结合模拟点击脚本,进行攻击行为,一般模拟器也具有修改设备信息的功能。
  (模拟器可以完成手机型号修改、IMEI修改、位置修改等功能)
  改机工具通过劫持系统函数,伪造模拟指定手机(模拟器)的设备信息的APP,能够欺骗厂商在设备维度的检测。改机工具会从系统层面劫持获取设备基本信息的接口,APP只能得到伪造的假数据。Andriod和iOS都有很多相应的改机工具,Andriod改机大部分都基于Xposed框架,需要Root,iOS大多基于Cydia框架,需要越狱。
  系统篇
  本篇会主要介绍风控系统内部的一些功能及概览,以及支撑起风控系统运转的一些功能模块,不同家企业基于自身业务的差别风控系统可能也有差别,此处会介绍一些较为通用的风控系统功能模块。
  此篇建议风控初级产品人员浏览。
  1。风控决策引擎
  风控决策引擎是风控的大脑,即在各环节通过一大堆原始数据的输入,通过负面名单、规则策略、模型结果等方面的综合输出,以实现最终决策的作用。跟人的大脑作用类似,通过外界要素的输入做出正确的判别,这块后续还涉及到一个错误反哺优化的迭代机制,所以一个决策引擎的强大是一个风控系统能
  下图为一个典型的风控决策引擎应该具备的基本功能(只做功能展示作用):
  (1)支持节点无限分叉
  (2)支持各类逻辑、计算、深度挖掘类的规则
  (3)支持多种处理结果返回,通过、拒绝、人工、预警、加验短信等
  (4)灵活的规则库,可以做到秒级实时上线
  2。设备指纹技术
  设备指纹并不是一个新的概念,而是在风控工作中常遇到的,即对某一设备的唯一标记,即“设备的身份证”,早期的时候大家喜欢用IMEIIDFV这样的要素作为设备的身份识别标记。
  但是前文也提过,更改设备参数已经是一个非常容易实现的东西,所以设备指纹技术就应运而生。总的来说是通过采集设备多方面的要素,并通过一定的权重和算法加密之后得到的一串字符,目前有多家安全乙方公司提供类似的服务,因为各家的权重、算法设置不同,所以不能通用。另外,设备指纹技术除了安卓、IOS、H5之外,随着小程序应用的盛行,对于小程序设备指纹的采集也是个较大的挑战。
  常见的设备指纹采集要素(很小部分的要素):
  目前来看没有一家能够有效的识别不同的设备,这块也是个攻防对抗不断优化提升的过程。
  3。知识图谱技术
  欺诈案件(比如身份造假,团体欺诈,代办包装等),且会涉及到复杂的关系网络,这也给欺诈审核带来了新的挑战。
  知识图谱,作为关系的直接表示方式,可以很好地解决这两个问题。首先,知识图谱提供非常便捷的方式来添加新的数据源,知识图谱本身就是用来表示关系的,这种直观的表示方法可以帮助我们更有效地分析复杂关系中存在的特定的潜在风险。
  (点代表人,线代表人与人之间的关系)
  通过知识图谱可以识别
  团伙识别:通过某些关系可以将一个团伙全部链接起来;
  身份伪造:即某个人的身份资料在知识图谱不同的案件中出现了矛盾;
  贷后失联:通过知识图谱协助贷后,找到与失联人有关系的联系人。
  而知识图谱在风控引擎中的应用也可以通过规则、模型等实现。
  知识图谱具体的构建方式研发人员感兴趣可以自行搜索相关资料。
  模型篇
  该篇内容会涉及到一些建模类的东西。模型这个东西本身构建过程中会涉及到很多数理统计类的理论,所以建模人员需要有相当的数学背景。该部分不会介绍如何去建模,而是主要介绍一些模型的基本概念、结论,帮助大家理解。
  此篇不建议风控建模人员浏览,因为你们都会!其他的风控小伙伴可以静下心来认真看下,其实理解起来并不那么神秘,理解之后你就可以试着跟建模的同学撕逼了:
  你的模型效果不好,我不用!!
  1。分类模型与评分卡
  1。1分类模型
  分类模型是风控中最常用的模型之一,即在一堆样本中判定哪些有可能是好用户哪些有可能是坏用户,所以换句话说,风控是人工智能最容易介入、也是介入较领域。
  目前在风控中用的较多的分类模型包括决策树、逻辑回归、神经网络、随机森林等,这些模型本身就具备着分类的功能,通过一堆历史上带有标签的数据并结合min(损失函数)的过程完成训练,期望可以通过综合一系列带有区分度的指标得到一个综合评分,以期可以实现对某一个样本进行评价的目的。
  模型本身其实是一个很有温度的东西,根据一堆冷冰冰的原始数据的输入能够得到一个比人的直观感知更科学、更定量的结果,难道不是很有趣么。其实在建模的过程中,其实因为损失函数的设定,本身已经把人的直观认知融入到模型当中,在建模的过程中已经添加了人的感情因素在里面,就跟女娲造人一样:用一堆冰冷的泥土去赋予生命,建模的过程回头再看看也是如此。
  1。2评分卡
  评分卡模型是分类模型中的一种特殊表现形式,我们直观看到的评分卡大概是类似于以下图表的,即不同的x变量会给与不同的分数,比如年龄在一定区间内的加m分,在另外一个区间给n分,看着是很随意,但是实际不然。
  评分卡模型本质核心是基于逻辑回归模型衍生的,根本上是结合企业的业务形态并结合逻辑回归当中各个参数前面的系数进行转换(如根据模型中年龄前面的系数进行转化),具体转换过程暂不表述
  上图为某一典型的评分卡效果演示
  2。模型评价指标:混淆矩阵、ROC与KS
  评价指标指的是一个模型做出来了,他的效果怎么样呢?这块的指标理解清楚了,也更方便的帮助业务人员跟建模人员撕逼。
  很多作者在写有关评价指标的时候运用大量的字母、公式等,让读者读起来非常吃力,我很不喜欢这种方式,但是实际上这块的只管理解是非常简单的。
  在1的描述中,我们构建了一个模型,yf(Xi),于是对于所有样本,基于这些样本的自变量Xi,我们可以得到每个样本对应的y值,这个y值代表的就是这个样本逾期的概率。(下述来自于实验样本结果)
  2。1混淆矩阵
  混淆矩阵不能作为评估模型的唯一标准,但是混淆矩阵是算模型其他指标的基础,后面会讲到,所以对混淆矩阵的理解是必要的。
  模型跑出来的“Y”值为每个客户的预测违约概率,可以理解为客户的有多大的可能违约。把Y等分分段,通过每分段内的区间人数和实际坏用户的标签进行比对,可以得到下述图表。
  我们从上图发现,横轴越大其bad率越高,而混淆矩阵就是基于上述的预测结果生成的。
  我们取任何一个x值进行分段,如x0。5,0。5我们认为是好人,0。5我们认为是坏人,但是这样的认定会有误差,即有可能把实际的好人误判为坏人,也有可能把实际的坏人漏过判为好人,这就形成了在这个分界点下的混淆矩阵(即绿的是对的):
  每一个x值(即分界点)都会形成一个混淆矩阵,而每一个混淆矩阵都会有很多判别指标:如accuracy、TPR、FPR,就是基于TPFPFNTN四个值的加除,请读者自行百度,我也不记得了。
  2。2ks值
  KS(KolmogorovSmirnov)用于模型风险区分能力进行评估,指标衡量的是好坏样本累计分部之间的差值。好坏样本累计差异越大,KS指标越大,那么模型的风险区分能力越强。
  KS值的计算也是基于上述的混淆矩阵。KS的计算步骤如下:
  计算每个评分区间的好坏账户数;
  计算每个评分区间的累计好账户数占总好账户数比率(good)和累计坏账户数占总坏账户数比率(bad);
  计算每个评分区间累计坏账户占比与累计好账户占比差的绝对值(累计good累计bad);
  然后对这些绝对值取最大值即得此模型的KS值。
  说人话就是在某个分割点对应的混淆矩阵中,坏人被识别出来的比例(70的坏人可以被识别出来)误杀好样本的比例(如30的好人被错当成坏人了)。
  因为分割点可以有无数个,我们可以得到一个曲线,max(坏人被识别出来的比例误杀好样本的比例)的点即为最佳KS值。
  在建模中模型的ks要求是达到0。3以上才是可以接受的。
  除了上述两个评价指标之外,还有基尼系数、PSI、AUC等多个评价指标,主要评价的目的是判定模型的区分度、稳定性等,读者有兴趣可以自行搜索学习。
  结语篇
  当前大数据背景下的互联网业务形态,给风控这个已经很古老的名词又赋予了新的意义、新的内涵、新的使命,互联网业务形态的复杂性、数据爆炸特性,导致风控的玩法也愈加多样。本文主要是一个科普帖,把当前互联网风控业务内部各环节遇到的一些特定名词给大家尝试做一些浅尝辄止的介绍。
  业务、系统、模型各职能模块间是相辅相成的,无论做哪方面的工作,理解更多的工作内容才能打破职能模块间的壁垒、更好的去推进工作!

连锁行业:消费模式的核心是什么?未来消费品行业的趋势是什么?一种就是消费者口味的变化;另一种是消费模式是什么。上周非常有幸受到好友,招商证券零售行业分析师许荣聪的邀请,作为主讲嘉宾,参加了“招商证券am……尴尬的微信,子弹的机遇要说最近在互联网圈什么产品最火,非子弹短信莫属了。就像很多突然爆火的产品一样,随着产品的爆火,各种分析、评论的文章,唱衰、点赞的声音接踵而来。比如:曾经的脸萌、足记,突然的爆火……抖音:让用户产生关注行为的5大动机如何才能吸引抖音用户,成为抖音圈内的网红大神?该篇文章从满足快乐、满足好奇、学习效仿、解决问题、自我实现五个方面分析了抖音用户对内容的核心需求。不妨作为参考,为自己的抖音号做一……陌生人社交二三事其中的诀窍是找到最适合的数据类型,这也许是约会app们最有趣的竞争领域:是一见钟情时通过智能手表测量出来的心跳吗?还是第一次约会共度的时光长短?或者看的Netflix系列剧?抑……解决了货源整合的核心问题,货拉拉却要因小失大?“货运版滴滴打车”模式与滴滴打车类似,是将网约车的运作理念运用到了传统运输行业,通过互联网的方式匹配“货车”与“货源”,将滴滴网约车平台的“载客”模式转换成了“载货”,改变了传……微信七年,十面埋伏微信已经七年了,可是这一路走来,从来都不是平稳的。01:2010年11月,久未露面的张朝阳显得很亢奋。在搜狐上海淮海中路的办公室里,身穿双排黑色大衣的他当着所有记者……自带流量10亿补贴,悟空问答为何没能扳倒知乎?抵抗一个自带巨大流量和金钱的挑战者,知乎是怎么做到的?而悟空问答又是怎么失败的呢?“被腾讯借鉴了怎么办”已经不是这届创业者最担心的生死之问了,他们现在关心的是张一鸣会不会……科普帖:懂了这些名词,你就已经是个“风控人”了本文主要是一个科普帖,把当前互联网风控业务内部各环节遇到的一些特定名词给大家尝试做一些浅尝辄止的介绍。序言篇风控其实是一个很宽泛、很有历史感的概念,在不同的公司形态……全身运动的锤子软件和身处迷局的子弹短信锤子作为一个软硬兼施的公司,其硬件主打工业设计,软件主打用户体验。本文主要来探讨一下全身运动的锤子软件和身处迷局的子弹短信。作为锤粉,看完锤子2018夏季发布会后有些失望……供应链金融服务平台:融资方案和风控系统建立的总结供应链金融是指金融机构(银行、非银机构)从整个产业链出发,开展综合授信,把供应链上的相关企业作为一个整体,根据交易中构成的链条关系和行业特点设定融资方案,将资金有效注入到供应链……深度分析FacebookADS广告投放平台(1):平台介绍上篇讲了今日头条DSP(其实应该叫今日头条ADS)的基础信息和主要特点,最近由于对接Facebook的MarktingAPI,对Facebook的ADS有非常深入的了解,而且F……从2000年的互联网泡沫,到2018年的估值倒挂等得起和追求确定性,背后就一定是会错过小概率事件,而一味追求小概率事件却又容易被收割。在过去的几周里,我们能明显察觉到互联网市场的各种波动。其实,现在看到的很多问题,都可……
盲盒公司泡泡玛特年入16亿网红泡泡玛特赴港上市文章目录盲盒公司泡泡玛特年入16亿泡泡玛特赴港上市6月1日儿童节当天,靠着“盲盒”概念名声大噪的国内知名网红潮玩公司泡泡玛特向港交所递交招股书。招股书显示,2……京东618报复性消费:自营房产1小时卖出221套根据京东官方数据,截至6月1日下午14点,京东618成交额同比增长74,而在6月1日全天,销售过亿的品牌数量达到了40个,消费全面复苏,某些品类甚至出现了“报复性”的反弹。……AMD三代锐龙创史上最低价拼多多万人团低至999元站长之家(ChinaZ。com)6月3日消息:今天上午10点,拼多多将上线“AMD盒装CPU万人团”活动,五款当红CPU组团上阵,届时下单将享受300600元的特惠补……微信支付加码小店经营小商家数增长2。36倍【TechWeb】6月2日消息,微信官方今日对外披露,截至5月31日,微信支付“小店”交易活跃度达到历史最大峰值,较1月疫情严重期间,全国小商家数增长2。36倍,交易笔数增长5……超深度梳理:那些玩转私域流量的大公司,多在用这4个策略!文章目录驱动增长的是体系,不能单纯依靠私域或公域流量关注两个要点抓住流量走向趋势超快速迭代“人、货、场”各种匹配关键问题:怎么掌握用户生命周期?……iOS14全部适配机型汇总苹果iOS14支持哪些设备机型根据外媒Verifier报道,iOS14支持适配的机型曝光了,将继续支持iPhone6S等老设备,也就是说能更新iOS13的机型也一定能更新iOS14,其中包括iPhone6s……泡泡玛特赴港上市:网红盲盒公司1年赚4。5亿元毛利率高达64站长之家(ChinaZ。com)6月2日消息:做网红盲盒到底有多赚?泡泡玛特一年净赚4。5亿你敢信?6月1日,盲盒公司泡泡玛特向港交所递交的IPO招股书的显示,该公司20172……爱奇艺回应“庆余年超前点播案”:保留上诉权利【TechWeb】6月2日消息,北京互联网法院今日开庭审理了吴某诉爱奇艺公司网络服务合同纠纷一案,法院当庭宣判确认,爱奇艺公司的《爱奇艺VIP会员服务协议》部分无效;在吴某购买……Zoom第一财季获得总营收3。28亿美元净利同比激增134倍【TechWeb】6月3日消息,据国外媒体报道,美国当地时间周二,视频会议软件公司Zoom公布了截至2020年4月30日的2021财年第一财季财报。财报显示,该公司第一财季的总……杨柘加入小米担任集团副总裁,向雷军、卢伟冰双线汇报凤凰网科技讯6月2日消息,小米集团发布了最新一轮人事任命。任命杨柘为小米集团副总裁,中国区首席营销官(CMO),负责中国区市场营销战略制定、计划实施以及品牌建设和推广等工作,向……大众汽车完成对自动驾驶初创公司ArgoAI的26亿美元投资【TechWeb】6月2日消息,据国外媒体报道,自动驾驶初创公司ArgoAI周二表示,大众汽车已完成对该公司26亿美元投资。ArgoAI表示,此举将有助于该公司在欧洲的扩……拼多多回应“二次上市”:公司现金储备充裕暂无任何计划凤凰网科技讯6月2日晚间消息,有媒体报道称拼多多将确定回港二次上市,并表示确定中金为其保荐人之一。相关报道称,拼多多上市团队原计划6月中旬交表,但是不排除提速。拼多多发言……
友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找作文动态热点娱乐育儿情感教程科技体育养生教案探索美文旅游财经日志励志范文论文时尚保健游戏护肤业界