童话说说技术创业美文职业
投稿投诉
职业母婴
职场个人
历史治疗
笔记技能
美文纠纷
幽默家庭
范文作文
乐趣解密
创业案例
社会工作
新闻家居
心理安全
技术八卦
仲裁思考
生活时事
运势奇闻
说说企业
魅力社交
安好健康
传统笑话
童话初中
男女饮食
周易阅读
爱好两性

关于数据埋点,你需要了解这些基本知识

9月1日 多上心投稿
  本文作者从工作实践出发,梳理总结了关于数据埋点的相关基本知识,与大家分享。
  产品汪每天都在和数据打交道,你知道数据来自哪里吗?
  移动app端内的用户行为数据大多来自埋点,了解一些埋点知识,能和数据分析师、技术侃大山,参与到前期的数据采集,更重要是让最终的埋点数据能为我所用,否则可怜巴巴等上几个月是常有的事。
  埋点类型
  根据埋点方式,可以区分为:
  手动埋点
  半自动埋点
  全自动埋点
  秉承“任何事物都有两面性”的道理:自动程度高的,能解决通用统计,便于统一化管理,但个性化定制需求难满足,成本较低;偏手动的,能满足个性化需求,但容易出错和疏漏,成本较高。
  上报方式:
  客户端上报
  服务端上报
  客户端能记录一些通用页面PV、UV、点击等信息,但更多细节无法覆盖,用户购买了什么、订单金额、成交单数,用户看了哪个视频、视频物理时长是多少等信息则需要服务端回传,服务端上报有上线灵活、不随版本、丢失率较低的优点。
  客户端上报埋点数据流转如下图:
  (客户端上报埋点数据流转)
  埋点在个性化推荐系统(详见下一篇推送)中扮演着先头兵的角色,采集的数据的准确性将直接影响策略方向。
  端数据
  由于不同端的用户具有不同用户特征,往往会有不同的做功点,因此,采集数据时需要区分端数据,可以通过appid区分产品不同端,如iOS、Android、iPad、PC各端。
  埋点事件
  如果作为数据分析师,思考角度较高,输出的埋点需要有“可扩展、可维护、易用性、高效性”,字少事大的典型。产品汪可降低要求,只要能看懂埋点文档,正确提出埋点需求、知道哪些数据对应哪些埋点即可。
  (埋点文档示例)
  根据场景,同一属性的行为往往会归为同一类埋点,成为“同一事件”,同一事件下会有相应的扩展字段来承接相关的细节信息。
  事件字段
  以资讯app(如今日头条、腾讯新闻、网易新闻)为例,按漏斗思维和用户的行为路径拆解,有哪些数据可能需要获取?
  打开APP人数(客户端登录损耗)首页栏目访问人数(访问占比)刷新或点击人数(刷新或点击人数占比)点击人数(点击率)阅读时长停留时长(读完率、阅读进度)跟帖收藏分享等互动行为(互动率)回流人数(回流率、病毒传播系数)
  以上环节怎么对应上埋点?
  根据行为属性,埋点事件大致分为以下几类,并不唯一:
  埋点事件下的信息怎么看?如itemid:”114774”,冒号前是字段(key),冒号后是值(value),后的是注释。
  以视频浏览事件(vdE)为例:
  字段注意点和应用场景:
  itemid:内容id,易错传为序列id
  type:内容类型,如图文、视频、音频,可区分内容类型作分析
  refererid:上一页面内容id,可用于相关推荐业务的分析
  ptpipm系列:定位页面和模块,可用于不同业务线的分析,例如首页、要问频道、正文页等
  pre系列:追踪了上一级页面,可用于用户行为路径分析
  除了关注字段的定义和场景外,还需留意上报时机,定义尽可能周全,就以此视频浏览事件为例:
  页面退出(销毁)时:点击返回等
  切换到其他视频:点击上下集,点击相关视频等
  按home键退出时
  锁屏时
  app杀死时
  以刷新事件(fsE)为例:
  direction:可供产品汪区分上拉、下拉作刷新行为的分析。你可能会发现,除自动刷新外,大部分用后喜欢上拉刷新,但下拉刷新的广告位更值钱(有问题存在就有工作要做了)。
  autotype:在新session,打开app到达首页会有一次自动刷新(即用户没有手动操作),可用于分析用户主动刷新的行为。
  以评论事件(cmE)为例:
  从以上埋点,我们能获取哪些数据?
  每篇内容的评论数,可区分内容类型、栏目、评论类型、位置;结合获取到的用户id,还可以从用户维度分析。
  以上埋点字段仅做示例说明,需要根据实际的数据需要来增删字段,定义要明确,场景要详尽,避免出现“想要分析次均阅读进度,却发现没有相关字段”的窘境。
  五花八门的用户id
  用户id是用户的唯一标识,是该用户在应用里活动的“身份证”,但它在获取的时候可是五花八门的,曾经某产品汪提供的deviceid和数据分析师手上的uuid完全对不上,ab实验得重做,所以懂多点儿概念提前问一问准没错。
  (用户id获取示例)
  以iOS系统的用户id获取为例,先补充几个概念。
  IDFA(广告标识符,AdvertisingIdentifier),是苹果公司提供的用于追踪用户的广告ID,同一手机的不同APP对应着相同的IDFA,IDFA可通过以下步骤重置:设置隐私广告还原广告标识符。因为IDFA会存在取不到的情况,因此需要选用其他的ID作为DeviceID。在取不到IDFA的情况下,选用IDFV。
  IDFV(Vindor标示符,IdentifierForVendor),一般用于追踪用户在应用内的行为,每个设备在所属同一个Vender的应用里值是相同的。如果用户删掉了该vender的所有APP,IDFV将会被重置。
  UUID(通用唯一标识码,UniversallyUniqueIdentifier),通用唯一识别码,每次生成均不一样;第1次生成后UUID后,需要保存到钥匙串(keyChain)中;应用被删除再重装时,仍然可以从钥匙串得取到UUID;在一台设备上,同一个开发者账号的所有APP,可获取到相同的UDID;刷机或者重新安装系统后,UUID将重新生成。
  鉴于没有任何一种标识符能百分百准确获取,且为了尽可能获取用户id,会有一个退而求其次的获取逻辑,即先取IDFA的值,取不到IDFA时去取IDFV的值,再取不到时IDFA时,则生成UUID。
  获取用户id逻辑示例:
  iOS:先取userDA;如果userDA为空或者为00000000000000000000000000000000,取userDV;如果userDV为空,取deviceid
  Android:先取如果imei为空或者为02:00:00:00:00:00,取deviceid
  埋点踩过的坑
  字段和值
  id字段指内容id,错传序列id,导致无法读取用户浏览的内容,丢失用户阅读历史(影响个性化推荐)。
  当内容是合集时,itemid传合集id还是主视频id需提前定义
  上报时机
  需明确定义,如:不同端的文章浏览事件切换前后台时的上报时机需统一,Android切前后台都上报,iOS仅切前台时上报,导致两端的人均阅读数差异大。
  需正确上报,如:视频浏览事件出现同一个用户的同一条数据重复上报(事件、时间戳、用户id等都相同),使统计的浏览量偏大。
  统计
  栗子1:过滤浏览事件中时长10ms和时长10000000ms的异常数据。
  栗子2:过滤刷新事件中单个用户每天几千几万次刷新的异常数据。
  埋点注意点
  埋点问题需跟版本修复,bug修复周期长:手动埋点如果出现漏埋或埋错的情况,必须依赖下一个版本发版,才能看到数据(发版还需时间覆盖,很伤),想周全多测试高效率
  定义明确,格式规范,正确上报
  测试环节很重要(老生常谈)
  日常反馈bug姿势
  产品汪反馈bug是家常便饭,甩个bug截图可能会被忙碌精分的开发直接无视,掌握反馈bug的正确姿势:
  截图
  提供自己的app账号或手机信息
  Android:提供imei(手机数入06可自助查询)
  iOS:提供idfa(抓包查询)
  说明时间和场景,给开发补充上下文,方便定位问题
  走上述流程,开发一定觉得你可爱无比。
  结语
  只要产品仍在迭代,就需要更新埋点以供数据分析使用,可以说埋点将伴随产品终生,携手埋点,头发也将越来越少,且行且珍惜。
投诉 评论 转载

看一个武侠故事,明白权限的那些事儿在武侠故事里,功能权限和数据权限体系的解说由“李平”之口娓娓道来。01:大理寺官衙的一棵古树下,一位青衣书生正拿着一篇案牍在读。丝丝凉风吹过,腰间的半片古玉随风飘荡……轻教育知识服务行业的破局之路本文从3个角度入手,分析了传统教育模式和互联网教育模式的不同利弊,探索了新的破局方向,即轻教育能成为突破知识服务行业瓶颈的路径?从2018年下半年起,知识服务行业面临了增……OTA实战分解(1):快速阅读API及场景应用如何快速阅读一个API并且转化为线上场景应用,这应该是产品经理尤其是B端产品经理必备的技能。本系列文章将从笔者亲身的一些OTA旅游产品对接经历入手,分享一些踩过的坑,背过的锅。……海外销售业务流程分析:产品继之前讲述的海外销售业务流程中的客户管理部分,笔者将继续来讲讲海外销售业务流程中的产品部分。一、SPU及SKU销售系统同样离不开产品,以“货”为中心,即要管理好销售……关于数据埋点,你需要了解这些基本知识本文作者从工作实践出发,梳理总结了关于数据埋点的相关基本知识,与大家分享。产品汪每天都在和数据打交道,你知道数据来自哪里吗?移动app端内的用户行为数据大多来自埋点……关于弹窗四大控件的3个问题本文作者对弹窗4大控件进行了对比分析,非常好地阐释了不同控件的应用场景,并通过案例进一步加深了对控件应用的理解。大家平时做完一个项目有没有总结的习惯呢?最近我一直在分析弹……订单履约:商品配送时效如何展示?本文将为大家介绍不同平台计算配送时效的方式,以及订单履约过程中的种种与配送时效相关的问题。天天问问题:《“次日达”、“半日达”和“1小时达”“2小时达”真的会影响你的购买……弹窗设计的基本样式和10大应用场景作者对弹窗的基本样式进行了分析梳理,并总结了使用上需要注意的要点,与大家分享。在设计Dialog弹窗时,我们大多时候直接拖控件,直接提交一个基础的规范给前端,甚至只是给几……类图是怎样炼成的?类图可以用来展示类的结构和与其他类的关系,是一个重要的结构建模的工具。01:学过UML的人对类图想必都不陌生,作为结构建模的核心工具,类图充当着沟通现实世界与概念世……iOS13,暗黑模式不是所有产品都适合iOS13带来暗黑模式,这样的设计对于用户体验有什么作用呢?产品如何要适配暗黑模式,有哪些问题需要注意呢?其实是想更新一篇长文,但是呢,为了让自己看起来经常更新,所以我把……如何从0到1打造一款AI产品?随着AI技术的不断发展,我们看到有越来越多成功的AI产品被研发出来,它们有效地改善了人们的生活与工作。在这样的背景下,AI产品设计正在成为一项重要的技能,被人们所关注。笔……掌握四个交互方式,提升用户体验交互设计常常出现在产品经理的工作中,关乎用户体验的交互设计可以从哪些角度进行优化呢?产品经理经常会提到交互设计这个词,那么什么是交互设计呢?交互设计,又称互动设计,……
用创意思维做产品02:米哈尔科九法则五个方面总结我一年产品工作一个耍流氓的PM,才会没有目标如何写版本的数据分析报告产品经理知识体系之产品运营(四)产品思维:走钢丝式的平衡为什么我坚持手绘原型图?实例分析:如何运用金字塔原理解决产品问题产品经理的“元需求”:如何提出对需求本身的需求?你距离一个伟大的产品经理有多远?探索技术管理与敏捷管理的一年:到底如何做技术管理和敏捷管理?关于产品和商业的28条唠叨
上升天蝎座性格优缺点(上升星座天蝎)什么东西加速肌肤老化房屋常识如何申请提取住房公积金需要什么手续爆逗,一个个的可真会损友爱我爱柘林湖优秀作文农村山上到处都是的松树,听说松针可以泡茶是真的吗?有哪些功效沈萌成本上涨难以支撑茅台涨价理由小学生作文我家幸福年固态电池有什么优势和缺点固态电池安全性更高小学六年级教学工作计划你是我最想遇见的人

友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找作文动态热点娱乐育儿情感教程科技体育养生教案探索美文旅游财经日志励志范文论文时尚保健游戏护肤业界