童话说说技术创业美文职业
投稿投诉
职业母婴
职场个人
历史治疗
笔记技能
美文纠纷
幽默家庭
范文作文
乐趣解密
创业案例
社会工作
新闻家居
心理安全
技术八卦
仲裁思考
生活时事
运势奇闻
说说企业
魅力社交
安好健康
传统笑话
童话初中
男女饮食
周易阅读
爱好两性

【AB测试算法大揭秘】第五篇:少了它,版本决策将毫无意义

9月13日 尘世客投稿
  从一切的根基中心极限定理,到如何根据数据分析解读最终选出真正意义上的最优版本,相信大家能够对AB测试的原理有一个大概的了解。
  关于如何避免假设检验中第I类错误,我们引入了Pvalue和置信区间的概念。而想要降低假设检验中第II类错误的出现概率(Beta),就需要了解今天文章中讲解的另一个检验工具统计功效。
  什么是统计功效
  在假设检验中,第II类错误的定义是:当原假设为假时没有拒绝原假设。也就是说,当两个版本确实有比较显著的差异时,我们并没有判断这两个版本有区别。
  统计学中,将第II类错误的概率命名为(Beta),统计功效Power就是我们没有犯第II类错误的概率(1)。换句话说,我们设计了两个版本,需要对比两个版本带来的效应差异,如果假定的效应差异的确存在,在给定的置信水平下,我们有多大的概率能得到统计显著性的结果,或者说我们有多大概率能发现这个差异。
  为了提高原假设为假时我们做出正确判断(拒绝原假设)的概率,使结果更加可靠,统计功效的值越大越好。一般来说,当统计功效取到8095时,结果就是比较可信的了。
  统计功效的意义
  由统计功效的计算公式可知,统计功效的值与样本量、方差、效应大小以及显著性标准相互关联。换句话说,只要得知上述公式中的几个数据值,就可以根据公式推导,计算出想要探求的数值。
  例如:通过给定的统计功效值,就可以推算出AB测试中每个版本样本用户数的最小值。之后,将计算出的最小样本数与版本的实际用户数量进行对比。若版本用户数超过最小样本数,则说明统计功效足够,可以得出试验的最后结论。
  究竟哪个版本才是值得发布的
  上一章中,我们讲述了如何判断试验版本的结果是否是统计显著的。然而,只有当试验版本的结果兼备统计显著和效果显著两个特征时,才说明这个试验的结束时机已经成熟,该版本是真正值得发布的。因此,我们需要引入一个“最小重要变化”的概念来帮助我们判断和决策。
  用白话翻译一下,就好比:你前期先投入了50块钱置办设备,每个包子定价5元。所以,只有在卖掉了10个包子(收入50元)之后,你策划并实施的这个事件才正式进入了盈利阶段。道理很简单,其实就是回本了嘛!那么在整个事件里,“收入50元”就是这个事件中的“最小重要变化”,也就是一个最小的可接受效果标准。
  同理推论到企业的AB测试,就更需要考虑相关的成本问题(有时甚至远不止于此)。因此,只有检测到的效果差异在“最小重要变化”的标准之上,我们才认为这个版本是有实际价值的。这个标准通常由指标的具体意义和我们的优化需求来确定,例如1或者5。
  下面我们来看一个具体案例:
  这是5个不同版本的试验数据,在最小重要变化为5的情况下,我们可以应用这个标准来对试验数据做进一步的判断:
  首先,观察每个版本的置信区间,发现Case4和Case5的置信区间不闭合,所以方案不可用,而Case13的置信区间上下限均为正,说明这三个版本相比原始版本来说都有提升。再引入最小重要变化5,可以看到只有Case1的区间下限高于标准值。因此,我们判断,在最小重要变化为5的情况下,只有Case1是实际效果最佳的版本。
  关于置信区间的系列讲解到今天就算告一段落了,从一切的根基中心极限定理,到如何根据数据分析解读最终选出真正意义上的最优版本,相信大家能够对AB测试的原理有一个大概的了解。
投诉 评论

直播平台也做企业公众号?听起来不错近日,斗鱼宣布完成15亿元C轮融资到账,从三月份至今,累计募资超过20亿人民币。纵观斗鱼发展历程,最初以游戏直播作为切入口,为全国亿万游戏用户提供向大神学习、交流的机会而……出行需求解析:出行需求链及目的地解析一、出行需求链的顶端出行从来都不是目的。所以,出行都是另有目的的。这些目的可以是去上班,可以是去某个景点玩,可以是去某个饭馆吃饭,可以是去某个地方出差,可以是过年回家等等……你能找到的最深入的留存分析文章:留存、增长、MagicNum本文会从什麽是活跃用户,什麽是留存,为什麽要做留存分析,活跃、留存和产品增长之间的关系,以及怎麽做留存分析,来给大家展开话题。活跃用户与留存是什么?在互联网行业里,……需求DNA检测:如何判断一个功能是否值得做面对来自客服、运营、竞品、市场、用户调研等各个渠道的海量需求,哪些应该放到产品会议中PK、哪些应该直接pass,产品经理该如何抉择?完成“需求采集”后,在召开产品会议进行“需求……【AB测试算法大揭秘】第五篇:少了它,版本决策将毫无意义从一切的根基中心极限定理,到如何根据数据分析解读最终选出真正意义上的最优版本,相信大家能够对AB测试的原理有一个大概的了解。关于如何避免假设检验中第I类错误,我们引入了P……【天天问每周精选】第二期:产品经理面试会遇到哪些问题?叮时间到!一批又一批新鲜出炉的蛋挞。。啊不对是大学毕业生,带着稚嫩可口的香气要离开温暖舒适的校园迈进诡谲现实的社会中去了,想到这你是否打了个激灵,挺直腰杆打醒十二分精神准备迎接……当进行敏捷开发时,你的PRD应该怎么写?敏捷开发,并不意味着产品经理在写PRD的时候就可以偷工减料,相反,这更考验产品经理的功力,因为产品经理需要精简信息,将真正的有效信息简单且清晰地传达给PRD阅读者,从而真正达到……产品之器Keynote这篇文章是产品之器系列的第三篇,写在两周前的周末午后,中间删减无数次,保证文中不涉及公司和业务。去年年底,我在中山大学等四所高校做分享,很多同学觉得我的Keynote很酷……产品思考:星巴克的移动支付生态星巴克当然希望更多的用户使用移动支付,因为他方便快捷,提升了收银的效率。而暂时没有接入三方支付的原因可能也很多,如结算清算,资金流等更多负责的原因,从用户体验来说,只打开一个A……产品经理,你真的懂热图吗?一图胜千言!产品经理经常使用各式图表来提取或者表达信息,其中热图是常见的一种;尤其是在站点管理、界面优化、交互设计等场合,热图更是被产品经理们广泛应用。然而产品经理,你真的懂热……产品经理的术与器:从想法到产品原型工欲善其事,必先利其器。从idea,到product,中间的可谓要经历几番曲折,产品定位确定决定产品的生死,产品功能需求的确定决定着开发的周期和试错的成本,互联网拼的就是……项目推动一直没有进展,你是否试过这4个小技巧?不论是做人还是做事,一定要充满真诚,正所谓“金城所至金石为开”,相信你的真诚与努力肯定会得到应有的回报。而一味地从自身目的出发,不考虑双方整体利益,往往是双方最终没有谈拢的重要……
从体验角度看电商前端订单状态流转与后台联动B端产品的安全性设计如何从0到1设计电商评价产品?用“心理账户”进行产品设计信息设计:从交互到产品的利刃向游戏学习提升如何用户体验保险公司如何提升在线使用体验?运输管理系统(TMS)运单系统从产品角度出发,如何搭建会员积分体系?汽车行业:车牌信息输入组件设计全链路创新项目之初,要把用户增长考虑在前B端技术常识:软件工程的“搭积木”设计教师党员关于年主题教育学习体会中国史上最牛外交官是谁到底有多牛猴年迎春纳福对联汇总我国社区矫正工作的完善建议这是男人的底线,千万不能碰研究表明自2019年开始北京进入了新一轮地震活跃时期出朝赋归来好其十佟丽娅离婚后首拍性感大片!穿细吊带锁骨深凹,脸上黑痣十分撩人产品经理周报第10期马化腾:错过新零售,就会失去竞争力诺基亚925需要剪卡吗大学四年里哪一年最重要?荒园

友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找作文动态热点娱乐育儿情感教程科技体育养生教案探索美文旅游财经日志励志范文论文时尚保健游戏护肤业界