童话说说技术创业美文职业
快好知
职业母婴
职场个人
历史治疗
笔记技能
美文纠纷
幽默家庭
范文作文
乐趣解密
创业案例
社会工作
新闻家居
心理安全
技术八卦
仲裁思考
生活时事
运势奇闻
说说企业
魅力社交
安好健康
传统笑话
童话初中
男女饮食
周易阅读
爱好两性

AB测试中12个常见的误区(上)

12月12日 顾昀汐投稿
  文章为大家梳理一些运用AB测试时12个常见的误区,本文为上篇,一起看看
  AB测试是一项很有趣的测试内容,使用者可以通过优质的工具去完成产品中的AB测试。但其实,AB测试并不仅仅是建立一个测试,很多公司在使用AB测试时都存在一定的误区,都在不经意间浪费着时间和金钱且不自知。
  下面,本文将为大家梳理一些运用AB测试时常见的误区:
  一、太早停止AB测试
  如果样本量足够大,统计显著性是版本A优于版本B的最好证据,50的统计显著性代表一种随机的结果。如果你只要求有50的统计显著性,那么你可能要考虑离职了,因为其实这个数字达到75也不能说明什么。
  任何一个经验丰富的测试人员都有过这样的经历,你通过AB测试去检测你的产品功能,最终将一个置信度达到80的产品推向各大市场,但最终发现,市场却并不买账。于是你想,那下次把数字达到90怎么样?这样就会很好了吧?其实比达到90更重要的是,你要找到其中的真相。
  真相胜利
  作为一个专业的职场人士,你的工作就是找出真相。你必须先把自我放在一边,执着于你的假设或设计是人之常情,如果当你的假设没有出现显著的差异性时,这可能会对你造成很严重的打击。真理高于一切,否则一切都失去了意义。
  这里有一个常见的场景,即使对于经常进行AB测试的公司也是如此,公司进行一个又一个的测试,持续了12个月,好不容易挑选出“获胜者”,然后将它们推出市场。结果一年后发现,他们网站的转化率和刚开始时一样
  为什么?基本是因为测试停止得太早或样本量太小。这里有一个关于何时停止AB测试解释,简而言之需要满足这三个条件,才能说明测试已经完成:
  足够的样本大小。实验要有足够的被试参与,你需要为你的AB测试预先估算出足够的样本量。
  要运行多个销售周期(通常为24周)。如果你只是在几天内就停止测试(或者在达到所需的样本量之后就停止),那么你获得的这个样本结果,并不具有代表性。
  统计学的显著性至少要达到95(p0。05)。值得注意的是,p值没有办法告诉我们B比A的方案好。
  这里有一个经典的例子来说明我的观点,下表为开始测试两天后的结果:
  图1。图片来源于网络
  我构建的新版本损失惨重,我构建的版本并没有太大的优势,而我的客户也已经开始准备停用这个方案。但是,由于样本量太小(每次变化只有100多次访问),通过我的坚持不懈,这是10天后的结果:
  图2。图片来源于网络
  你没看错,我制造的版本现在以95的置信率获胜。
  有些AB测试结束得过早,这就需要我们仔细检查各种数据。而最糟糕的事情就是,因为不准确的数据,让你损失了大量的时间与金钱。
  需要多大的样本量?
  通过上面的介绍,我们都不希望根据较小的样本量得出结论。理想的状态下,一个好的测试版本最好能发生至少350400次转换数据。但是,这个数字不是定值。我们不要被一个号码困住,因为我们手中的是科学,而不是魔术。
  所以,你一定要提前估算出测试所需要的样本量。那么即使这样做了,但置信度还是低于95怎么办?那么可以从细分领域下手,但你仍需要为每个测试的细节提供足够的样本量。无论如何,你都需要不断修改你的假设并进行新的测试。
  二、测试的单位不是“周”
  假设你有一个高流量网站,你在三天内实现了98的置信度,并且每次都发生了至少350次的转换数据。
  这样能算完成了测试吗?不,我们需要排除周期性因素并测试整整一周。如果你从上周一开始测试,那么这个测试需要在下周一停止。
  为什么?因为你的转化率可能会因“今天是星期几”而有很大差异。如果你一次不测试整整一周,那么你的结果就会出现偏差。所以,你需要以“周”为单位,在你的网站上运行“每日转化次数”的报告,观察到底能产生多少波动。
  下面是一个例子:
  图3。图片来源于网络
  你看到上表中的内容了吗?
  星期四的收入比星期六和星期日的总和还多出2倍,星期四的转换率几乎是星期六的2倍。如果我们没有以“周”为单位进行测试,那么结果将是不准确的,所以,必须开始一次运行七天的测试。如果在这七天内没有出现差异显著的结果,则再运行七天。如果14天都没有达到,那么就运行到第21天。
  多数情况下,你需要至少运行两周的测试(我的个人最低时间是四周,因为两周通常是不准确的),然后,如果你需要延长测试时间,则应用七天规则逐步叠加。
  注意外部因素
  如果你在双十一等一些购物季获得了良好的测试结果,那么你一定要在购物季结束后再次进行重复的测试。另外,如果你的公司铺设了一些电视广告或者其他大型活动,都可能会影响你的测试结果。你必须要了解你的公司正在做什么,因为外部因素会影响到你的测试结果。
  三、没有足够的流量也进行AB测试
  如果你每月只能完成一次或两次销售,然后进行测试,结果显示B方案比A方案的转化率高15,这样的结果准确吗?
  当然不。许多人都喜欢用AB测试来验证假设,但流量较小的情况下,即使版本B的效果再好,也可能需要数月才能达到统计显著性。
  不基于假设就进行测试
  我喜欢意大利面,但我对意大利面条柔韧度的测试却没多大兴趣,比如将它扔在墙上,看它是否粘住墙壁?
  这其实是一种随意的测试想法,而测试这种随机想法需要付出巨大代价,它会浪费你宝贵的时间和流量,所以永远不要那样做。你需要有一个假设。假设的提出要根据有限的证据,这个证据可以通过实验去被证明,并且作为一个新的研究起点。
  如果你在没有明确假设的情况下进行AB测试,然后发现B方案的转化率高了15,可是你从中学到了什么?
  什么没有。我们需要了解我们的受众,获得合理的假设,这将有助于我们更好地改进贴合实际的测试。
  四、不利用大数据分析平台
  测试的平均值往往包含着谎言。如果A方案比B方案的转化率高出10,但也并不能代表全部。你需要将其中的指标再次进行分割测试,去分析其中的各项细分指标。你可以使用一些优质的大数据分析工具,利用各种分析模型,对数据进行细致地分析和处理。
  图4。图片来源于神策数据
  五、为了不值得的问题进行测试
  你测试过用户喜欢什么颜色,对吗?
  请赶快停止吧。世界上哪里有最好的颜色,因为颜色始终与视觉层次结构有关。当然,你可以在网上找到有人通过测试颜色从而获得收益,但这些结果很多都是显而易见的,所以,不要把时间浪费在这些测试上。
  余下的6个误区,未完待续,欢迎大家持续关注。
  
  原文来源:https:conversionxl。com
投诉 评论 转载

一份全面的“界面设计论述”是怎样的?本文以界面设计为题,介绍了界面设计中不同板块的内容与设计要点,同时还向我们介绍了如何进行界面设计的优化。1。什么是界面设计用户与软件系统交互信息的媒介。1。1……设计师专业表达指南形式篇之前花了三篇小文(链接在文末),讲述如何提升设计师设计作品的内在含金量,今天,我们将重点聊聊如何提升设计作品的外在专业性交互文档的呈现形式。形式感的重要性交互文档是……用户体验:表单设计中的注意事项在下面的这篇文章中,我们来看看有助于你设计不同可用性表单的10个最佳实践,希望它对设计人员和开发人员都有用,玩得开心。好吧,让我们开始吧!“表单”是什么意思,它在哪……从上瘾模型,看产品设计的那些“套路”好产品不只是满足功能,还要反映人性。撩动了用户情感的产品,就占据了用户的心智。当产品进入用户的习惯区间,就可以获得持续的生命力。关于如何让用户习惯于使用某款产品,畅销书《……弹出窗口:10个代表性问题及其替代方案通过观察弹窗,我们会发现大多数弹窗都存在着破坏用户体验,降低用户好感度的效果。因此本文结合这一现象,讲具体分析背后的原理以及避免的方法。无论是否使用弹出窗口,大多数窗口叠……价值驱动设计如何有意识地平衡美与归属感?本文中将分享:我们是如何定义Airbnb里包容性设计的产出方式?我们如何持续为全球社区提供设计解决方案?以及,我们在设计过程中所学到的经验教训?“作为设计师,当我们做得不……百度网盘10。0:服务升级背后的故事本文是关于百度网盘10。0的一个复盘,这次10。0结合着产品最新的“服务”理念以及百度UXC最新设计语言D20,进行全新升级,致力于为用户提供更优质的使用体验。项目背景……AB测试中12个常见的误区(上)文章为大家梳理一些运用AB测试时12个常见的误区,本文为上篇,一起看看AB测试是一项很有趣的测试内容,使用者可以通过优质的工具去完成产品中的AB测试。但其实,AB测试并不……支付系统详解:清结算系统清结算系统是支付系统的一个子系统,本文重点介绍清结算中的系统设计和与对账系统的关系。清结算系统是第三方支付系统按照与商户的协议,将一个结算周期内的收付款项汇总轧差生成待结……如何让按钮设计更迷人按钮在UI界面设计中是不可或缺的元素之一,这篇文章我们将介绍不同类型的按钮包括按钮的状态和交互。我们介绍的都是日常界面中使用的普通按钮,并不包括单选按钮、选项卡、复选框等其他类……如何搭建设计中台,解决B端多产品线的设计困境在B端产品多产品线的设计中,经常会遇到成本与质量问题,而搭建设计中台会是一个策略。因此,本文就向我们介绍了搭建设计中台的方法、原则与常见误区。01多产品线的设计困境……为何SaaS模式能成主流?什么是SaaS模式?SaaS模式到底有什么优势?传统模式向SaaS模式过渡,又将面临什么样的挑战和问题?在进入正题之前,我们先聊一点题外话,就在我写这篇文章的这一天(20……
需求分析师如何撰写需求规格说明书?确定需求优先级:矩阵思维作为产品经理,如何分配你的工作时间?产品迭代缩影:PRD的撰写与迭代赠书福利产品经理需要懂技术吗?它可能是最适合你的答案产品规划阶段多人协作,如何才能提高效率?闲置玩具回收、仓储平台市场需求文档(MRD)互联网大数据发展下的信用体系建设现状(另附线性回归模型建模方产品故事:如何打造一个有故事的产品?致产品主管,产品总监:为什么你招不到好的产品经理?不打杂的实习总结:PM新人的踩坑心得与行业认知产品经理沟通法则:取势、明道、优术
避开数据海洋的暗礁识别用户异常行为年轻人流行各种摆摊真能赚到钱吗?热博聚热点网 幽明录主要内容简介及赏析车厘子补铁?检测阳性还能吃吗?关于车厘子的4个误区小小幸福家乡的变化被申请人拒绝履行行政复议决定怎么处理2017年黑龙江各市人均GDP排行榜从管理学中吸取养分,助力研究生教育实践【已发表】27岁儿童发型设计小公主发型图片高阳台夜雨不寐教育与班主任工作计划

友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找作文动态热点娱乐育儿情感教程科技体育养生教案探索美文旅游财经日志励志范文论文时尚保健游戏护肤业界