标签和指标到底有什么区别?
最近在工作中也经常和标签、指标打交道,但是似乎很少有人能完全说明白这两者的明确定义、区别和联系,今天尝试来聊聊这个问题。内容
本来应该先从定义开始,但是数据玩家找了很多定义,总感觉很晦涩,需要一定的深入思考和实践经历才能完全理解,于是我们先暂时不看定义,从两者的特征开始比较,第一个特征是两者的内容。
指标通常描述客观事实
常见的指标,宏观层面比如GDP、CPI、PPI,金融机构常用的存贷比、不良率、AUM,产品运营的MAU、DAU、LTV等等,都是对一个客观事实的描述,通常以可量化的数值形态呈现,或为数值,或为比率。
一个指标通常包含三个部分:口径逻辑、维度、限定词。
口径和逻辑,也就是这个指标具体的含义,首先得有一个业务口径,然后由技术把他落地成为一个技术的加工逻辑,从哪几个表取,count、sum、max、min或者是avg。
维度指的是我们从什么角度去看这个指标,是时间维度(年月日)、机构维度(不同分支机构)还是客群或产品维度,在SQL语句里就是groupby。
限定词就是在这个维度下,我们选取哪一个具体的枚举值,对应SQL语句就是where条件。
举个栗子,AUM的业务口径是客户名下所有资产,包括存款、理财、代销基金、保险等技术的加工逻辑会有一长串SQL,关键的点是所有金额做sum。
如果只看全行的AUM,是不需要维度的,如果要看具体某一个维度,就需要groupby了,指标就变成了按机构维度看AUM,即groupbyorg。
限定词就是要看某个具体分行,比如上海分行所有客户的AUM,SQL语句里就需要加上whereorg021。
不论怎么定义,大家可以发现,每一个环节都是陈述事实,实际的数值是多少就是多少,指标只是按不同的方式展示这个值,这也带来指标的另一个特征:指标基本都是数值型。
当然,不排除有些定性指标,比如在KPI中,有的考核指标描述为:某项工作是否完成,不过绝大多数核心指标,都应该是量化的。
标签往往存在人为划分
与指标不同,标签是存在人为划分的。
比如AUM100万在某些银行就是私行客户了,但是在大行估计就是个高净值客户。
标签通常是描述某些具体实体的,比如AUM100万,你一定可以挑出一些客户满足这个特征,但是指标陈述的通常是抽象概念,比如AUM本身,你没法对应到一个或者一群具体客户身上。
有些标签看上去人为定义的成分比较少,也是基于事实进行定义的,比如性别标签,车辆品牌标签,车主客户标签,代发客户标签
所以我在标题里加了往往,遇到这类标签的时候,我们的直觉也会告诉我们,这是标签,而不是指标,原因参考指标的另一个特征。
对,指标基本都是数值型,而标签基本都不是数值型。
哪怕是基于数值型的标签,一定也要有个人为划分的定义。
比如上面提到的,基于AUM构建客户等级标签,AUM是个数值型的指标,标签定义为AUM等于、大于或小于某一个值,人为划分了客户的等级。
因此标签可以基于指标来定义,那么指标可不可以基于标签来定义呢?
当然可以,比如私行客户转化数量,这里用到了一个标签私行客户,私行客户本身又依赖于AUM等指标。
所以标签和指标可以相互转化。分类
指标的分类
指标的分类相对还是比较统一的,通常划分为原子指标、派生指标、衍生指标。
原子指标不叠加任何维度,仅是对业务事实的最基本描述,通常是一些整体指标,通过SQL直接统计出来的,比如客户数、留存率、交易量
但是实际业务使用中,更关心某一特定维度的指标,比如手机银行客户数、7日留存率、长尾客群交易量
因此我们有了派生指标。派生指标就是原子指标叠加一个或多个维度。
手机银行客户数是客户数叠加产品或渠道维度;7日留存率是留存率叠加时间维度;长尾客群交易量是交易量叠加客群维度(这里客群是一个标签)。
仅仅叠加维度还不够,有时候我们还需要不同指标之间互相计算,最常见的就是求人均和比率,比如客群AUM、存贷比
这就是衍生指标,即通过原子指标或派生指标互相加工而来。
标签的分类
标签由于其人为划分的特性,分类就没那么统一,比较常见的一种划分为事实标签、规则统计标签、模型标签。
事实标签也是描述实体的客观事实,比如上文提到的性别、车主等等,描述一些具体实体的特征。
规则统计标签是基于事实的统计结果结合一些人为判断生成的,比如青年客户(年龄在18到35之间)、中年客户(年龄在36到55之间)、老年客户(年龄55)等等。
模型标签就比较主观了,是通过事实标签和规则统计标签,抽象出来的群体特征,其划分的群体通常比上两类标签更细。比如月光一族,消费达人等。应用场景
现在大家已经对标签和指标有了相对明确的概念,我们来看看两者的应用场景有何差别。
指标的应用场景
通常拆解使用
指标的使用场景,一般都是一个大指标,拆解到某个或多个维度,附加一个或多个限定词
用于经营分析、监测、评价、建模
在经营分析中,用于监测和评价业务效果、考核情况等,所有的KPI都是指标用于评价和监测业务效果。
标签的应用场景
需要不断归纳和抽象
标签是基于底层数据的归纳和抽象,希望刻画某一群实体的特征,通过标签,一定可以定位一群具体的实体,可能是客户,也可能是产品。
用于标注、分类、刻画群体特征
标签的核心其实是分类,针对每一个分类,希望能够给予不同的营销策略、产品策略、触达策略等。
不过,由于标签和指标可以互相转化,因此在实际运用中,也不用过多纠结两者的区别,因为两者通常是结合起来使用的。总结
总结一下,指标描述客观事实,通常是抽象的概念,以量化指标为主,拆解到不同维度,用于经营分析、监测、评价和建模;
标签人为划分,描述特定群体的实体特征,可以定位到具体实体,难以量化,归纳和抽象形成,用于标注、分类、刻画群体特征。
那么,如何构建一套指标和标签体系呢?请期待后续的文章。
为什么说爱读书的人更好命呢?头条创作挑战赛茶可醉人何必酒,书能香我无须花,这是一句出自清代醉月山人先生的诗词。读的书多,心藏诗书,眼里有光,话里有料,沉淀下来的便是一种气质与魅力。读书是气质精神永葆青春的源泉
人生最好的状态好好吃饭,慢慢相遇,保持热爱有句话说得好人生天地之间,如白驹过隙,忽然而已,我们每个人的一生,都不过短短数十载,如何找寻最好的状态,每个人都有自己的考量。细细想来,的确如此。人生之路千万条,每个人的境遇不同,
直击拉萨年货市场(下)藏历新年吃货必备美食中国西藏网讯临近藏历新年,家家户户忙于置办年货。2月10日,记者来到位于西藏拉萨市的八廓商城冲赛康雪新村等各年货市场,各店铺早已备好精品年货,前来选购的市民络绎不绝,现场十分热闹。
美丽的东方第一哨抚远抚远市属三江平原的一部分,为低平辽阔的沉降平原,其外围有局部丘陵分布地质构造上属中生代同江内陆断陷次级单位抚远凹陷的中部,自中生代以来处于下沉为主的间歇性沉降运动中,形成巨厚的新生
赏美景泡温泉!鼓楼5条徒步精品线路新鲜出炉为了促进文旅市场回暖复苏推广福文化以及大众旅游全民健身理念,2023年2月10日,登名山泡温泉游最美窗口2023鼓楼区新春文化旅游月暨徒步旅游活动启动仪式在乌山隆重举行。本次活动由
明年开园!就在深圳!全球最大的乐高乐园要来了!全球最大的乐高乐园度假区深圳乐高乐园度假区建设进程引人关注最近深圳乐高乐园再迎新进展!据了解,度假区内3家主题酒店建设主体工程已过半计划2024年乐园建成开园!据了解,深圳乐高乐园
周六说买机票的省钱小套路,越绕越省!高端玩家们以后都不会在周六点开我的文章了。指定动作周六说前言想了一下,打算试试看把周六的推送都变成类科普的形式。毕竟我之前发的一些内容里,总会有不少读者留言表示看不懂。那既然这样的
恩施大峡谷最全避坑指南,真美,真累,真坑!恩施被誉为世界硒都,位于湖北省西南部,是湖北省唯一的少数民族自治州。恩施大峡谷则是恩施旅游的第一张明信片,被专家赞誉可与美国科罗拉多大峡谷媲美。峡谷中有百里绝壁千丈瀑布原始森林远古
复苏从津起,2023年旅游市场喜迎开门红品橙旅游在国内防疫政策调整初期,各级政府与海内外旅游企业动作频频,势要抓住得来不易的时机一飞冲天。其中,以天津为代表的以传统民俗乡村年味为优势的传统目的地不仅不落京冀下风,更被视为
福建赏梅图鉴来啦!这个周末走起冬春之际,万物复苏梅花盛开,绿芽冒出福建许多地方花开正浓快来一起看看吧福州鼓山风景名胜区鼓山是国家级风景名胜区,国家4A级旅游景区,植梅历史悠久。鼓山梅里作为福州著名的探梅胜地,早
骑行新藏线,废弃厕所为何不能去?驴友说出了背后缘由!俗话说,人有三急。上厕所是我们解决一些问题的唯一方法,尤其是在一些关键时刻。但有时在荒野中,如果遇到三急也管不了那么多,随便找个地方方便一下就行。如果野外正好有一些厕所的话,人们也