童话说说技术创业美文职业
投稿投诉
职业母婴
职场个人
历史治疗
笔记技能
美文纠纷
幽默家庭
范文作文
乐趣解密
创业案例
社会工作
新闻家居
心理安全
技术八卦
仲裁思考
生活时事
运势奇闻
说说企业
魅力社交
安好健康
传统笑话
童话初中
男女饮食
周易阅读
爱好两性

新手教程如何撰写你的第一份数据报告

3月3日 浅时光投稿
  你是一个在校学生,上着自己喜欢或不喜欢的课,闲来无事,你打开知乎,看到了数据分析话题,你下定决心要成为一个数据分析师,你搞来一堆学习资料和在线课程,看完之后自信满满,准备去投简历,然后发现不清楚各种工具和模型的适用范围,也不知道数据报告需要包括哪些内容,面试的感觉就是一问三不知
  你是一个工作了一段时间的白领,你觉得现在这份工作不适合你,你下班以后去逛知乎上,看到很多人在说大数据代表未来,数据分析师是21世纪最性感的十大职业之一你激动了,你也要成为数据分析师,你利用空余时间补上了统计知识,学了分析工具,然后发现自己目前的工作跟数据分析没啥关系,觉得没有相关经验没公司要你
  这些问题的根源是什么?一句话可以概括:你没有办法在最短的时间内向招聘者展示,你能够胜任数据分析这项工作。
  我在知乎的回答如何快速成为数据分析师?陈丹奕的回答中,提出过一个“100小时学习计划”,在开始投简历前的最后一步,我建议用25个小时占整个计划的四分之一,来做一份数据报告,这个步骤至少能为你带来三个好处:
  检验你的学习成果数据分析是一门实用学科,能灵活运用学到的知识做出成果,比通过任何考试都重要;
  测试你是否真的想做适合做数据分析工作比起你转行后用半年或是一年时间来发现自己的真实想法,不如在此之前就看看你能否做好这份工作,或是从其中得到乐趣;
  展示你具有的能力程序员的世界里讲究“Nomoretalk,Showmethecode”,数据分析师同样可以“Showmethereport”,一份内容完整的数据报告,能帮你的面试官省下很多判断评估纠结的时间,给你更多的机会。
  写了一大堆做数据报告的好处,那么以一个初学者的水平,如何去做一份数据报告呢?下文细说。
  制作数据报告的流程
  先放一张图(不许抱怨配色丑!)
  可以很清楚的看到,一个数据报告(副本)依据需求不同,有普通难度(蓝橙绿红),也有英雄难度(蓝橙绿黄红),这次我们先讲普通难度的攻略,英雄难度放到下次讲。
  普通难度的数据报告要经历7个步骤:
  Step1:目标确定
  这一步在工作中通常是由你的客户上级其他部门同事合作方提出来的,但第一次的数据报告中,需要你自己来提出并确定目标。
  选择目标时,请注意以下几点:
  选择一个你比较熟悉,或者比较感兴趣的领域行业;
  选择一个范围比较小的细分领域细分行业作为切入点;
  确定这个领域行业有公开发表的数据可以获取的UGC内容(论坛帖子,用户点评等)。
  逐一分析上面三个注意点:
  选择熟悉感兴趣的领域行业,是为了保证你在后续的分析过程中能够真正触及事情的本质这一过程通常称为洞察而不是就数字论数字;
  选择细分领域行业作为切入点,是为了保证你的报告能够有一条清晰的主线,而非单纯堆砌数据;
  确定公开数据UGC内容,是为了保证你有数据可以分析,可以做成报告,你说你是个军迷,要分析一下美国在伊拉克的军事行动与基地组织恐怖活动之间的关系找到了数据麻烦告诉我一声,我叫你一声大神
  不管用什么方法,你现在有了一个目标,那么就向下个阶段迈进吧。
  Step2:数据获取
  目标定下来了,接下来要去找相应的数据。如果你制定目标时完全遵循了第一步的三个注意点,那么你现在会很明确要找哪些数据。如果现在你还不确定自己需要哪些数据,那么回到第一步重来吧。
  下面我总结一下,在不依赖公司资源,不花钱买数据的情况下,获取目标数据的三类方法:
  一是从一些有公开数据的网站上复制下载,比如统计局网站,各类行业网站等,通过搜索引擎可以很容易找到这些网站。举例:要找汽车销量数据,在百度输入“汽车销量数据查询”关键字,结果如下:
  我打码的那个链接,也就是第三个链接(第一个非推广链接)就是要找的结果,点进去可以看到各月的汽车销量,但只是全国数据,没有分省统计数据。
  当然不会每次找数据都这么顺利,这里只是告诉你:要善用搜索引擎。
  二是通过一些专门做数据整理打包的网站api来下载,如果你要找金融类的数据,这种方法比较实用。其他类型的数据也有人做,但通常要收费。
  三是自行收集所需数据,比如用爬虫工具爬取点评网站的商家评分、评价内容等,或是直接自己人肉收集(手工复制下来),亦或是找一个免费问卷网站做一份问卷然后散发给你身边的人,都是可以的。这种方式受限制较少,但工作量实现难度相对较大。
  如果你是在职人员或是实习生,我建议你不要用任何现在公司的数据。保证数据的安全性,不对外泄露公司的任何非公开数据,是数据分析师的基本职业道德。实在非要用(例如你要在面试中展示你在以前公司做过的数据报告),请将一切有意义的内容,包括但不限于各种数字、竞品及本品名称、时间、用户属性全部打码并转成pdf格式,只留图形和叙事逻辑描述内容。
  Step3:数据清洗
  在工作中,90以上的情况,你拿到的数据都需要先做清洗工作,排除异常值、空白值、无效值、重复值等等。这项工作经常会占到整个数据分析过程将近一半的时间。
  如果在上一步中,你的数据是通过手工复制下载获取的,那么通常会比较干净,不需要做太多清洗工作。但如果数据是通过爬虫等方式得来,那么你需要进行清洗,提取核心内容,去掉网页代码、标点符号等无用内容。
  无论你采用哪一种方式获取数据,请记住,数据清洗永远是你必须要做的一项工作。
  Step4:数据整理
  清洗过后,需要进行数据整理,即将数据整理为能够进行下一步分析的格式,对于初学者,用Excel来完成这一工作就OK。
  如果你的数据已经是表格形式,那么计算一些二级指标就好,比如用今年销量和去年销量算出同比增长率。鉴于你是第一次做数据报告,建议你不要计算太多复杂的二级指标,基本的同比、环比、占比分布这些就OK。
  如果你收集的是一些非数字的数据,比如对商家的点评,那么你进行下一步统计之前,需要通过“关键词标签”方式,将句子转化为标签,再对标签进行统计。
  Step5:描述分析
  描述分析是最基本的分析统计方法,在实际工作中也是应用最广的分析方法。描述统计分为两大部分:数据描述和指标统计。
  数据描述:用来对数据进行基本情况的刻画,包括:数据总数、时间跨度、时间粒度、空间范围、空间粒度、数据来源等。如果是建模,那么还要看数据的极值、分布、离散度等内容。这次我们是零基础做数据报告,那么就不用考虑后一类数据了。
  指标统计:用来作报告,分析实际情况的数据指标,可粗略分为四大类:变化、分布、对比、预测;
  变化:指标随时间的变动,表现为增幅(同比、环比等);
  分布:指标在不同层次上的表现,包括地域分布(省、市、区县、店网点)、用户群分布(年龄、性别、职业等)、产品分布(如动感地带和全球通)等;
  对比:包括内部对比和外部对比,内部对比包括团队对比(团队A与B的单产对比、销量对比等)、产品线对比(动感地带和全球通的ARPU、用户数、收入对比);外部对比主要是与市场环境和竞争者对比;这一部分和分布有重叠的地方,但分布更多用于找出好或坏的地方,而对比更偏重于找到好或坏的原因;
  预测:根据现有情况,估计下个分析时段的指标值。
  以上部分引用自我的一个回答面试中针对一个企业的数据分析场景应该怎么去分析?应届生还不懂怎么结合企业业务做系统的分析,求指点陈丹奕的回答,希望进一步了解的话,可以进这个答案。描述分析的产出是图表,下一个步骤的内容将基于这些图表产出。
  Step6:洞察结论
  这一步是数据报告的核心,也是最能看出数据分析师水平的部分。一个年轻的分析师和一个年迈的分析师拿到同样的图表,完全有可能解读出不同的内容。
  举个栗子:
  年轻的分析师:2013年1月销售额同比上升60,迎来开门红。2月销售额有所下降,3月大幅回升,4月持续增长。
  年迈的分析师:2013年1月、2月销售额去除春节因素后,1月实际同比上升20,2月实际同比上升14,3月、4月销售额持续增长。
  看到两者的区别了吗?2013年春节在2月,2012年则在1月,因此需要各去除一周的销售额,再进行比较。如果不考虑这一因素,那么后续得出的所有结论都是错的。挖掘数字变化背后的真正影响因素,才是洞察的目标。
  再举个栗子:
  这张图是一个用户行为聚类的结果,人群被聚成四类。前三类人群可以很清楚的得出结论:他们是某一种游戏主机的用户。那么第四类人群,是什么人群呢?
  年轻的分析师:第四类人群是游戏主机的狂热爱好者,他们交易频率远高于一般用户。
  年迈的分析师:第四类人群是二手贩子,否则谁没事一年内会搞将近7台索尼主机放家里。
  很明显,年迈的分析师由于具备丰富的行业经验,能迅速看穿数据背后的真实情况,得出正确的洞察结论,这也是为什么我在step1里一再强调要找你熟悉或感兴趣的领域行业,缺乏业务经验,很可能你的洞察结果是完全错误的。
  以上这两个洞察的例子本身比较简单,但通常来说,即使是复杂的数据报告,也是由一个个相对简单的洞察结论组成的,这其中涉及到问题的分拆,逻辑线的建立等一系列内容。作为初学者,做到自己力所能及的程度就好。
  总结一下,所谓洞察,就是要越过数据,去推测和理解真实情况。单纯描述数据,谁都会做,根据数据得出有价值的结论,报告才有意义。
  Step7:报告撰写
  都到这一步了,相信各位对数据报告也不再陌生了。这一步中,需要保证的是数据报告内容的完整性。
  一个完整的数据报告,应至少包含以下六块内容:
  报告背景
  报告目的
  数据来源、数量等基本情况
  分页图表内容及本页结论
  各部分小结及最终总结
  下一步策略或对趋势的预测
  其中,背景和目的决定了你的报告逻辑(解决什么问题);数据基本情况告诉对方你用了什么样的数据,可信度如何;分页内容需要按照一定的逻辑来构建,目标仍然是解决报告目的中的问题;小结及总结必不可少;下一步策略或对趋势的预测能为你的报告加分。
  还觉得复杂么?我再换一种说法:
  各位应该都写过议论文,一份好的数据分析报告其实就是一篇好的议论文,立论(背景)破题(目的)列举论据(图表结论)论证论点(小结及总结)结题(策略或预测)。按照这个逻辑去组织你的报告,你的论点就很容易被人接受,自然能得高分喽。
  QA
  Q1:我按照数据收集的方法去找了,但还是找不到数据怎么办?
  A1:确定你是否认真找了,如果确实没有,那么换个领域。
  Q2:不知道怎么做数据清洗?
  A2:把收集来的数据先看一遍(如果太多就抽样),肉眼识别一些脏数据,记录下来,然后从中抽取清洗规则,清洗一遍,再继续看,直到认为足够干净了为止。这一步不做的话,主要影响结论的正确性。
  那么,普通难度的数据报告做法就讲到这里,下次我们来聊聊看似高深的建模。
投诉 评论 转载

数据挖掘与预测分析术语总结数据挖掘目前在各类企业和机构中蓬勃发展。因此我们制作了一份此领域常见术语总结,希望你喜欢。分析型客户关系管理(AnalyticalCRMaCRM)用于支持决策,改善……什么是产品调研,为什么它需要在MVP之前进行?作为产品经理,在推出新产品之前的最后一个工作是验证自己是否在正确的轨道上面。之前很多时候都把建立一个MVP与“精益创业”看得十分重要,人们可能会认为这将是为建设一个想法的简化的……坚持换不来好结果,产品经理在工作中如何沟通?作为一名PM,你也许花了许多时间在学习如何提升产品设计,需求处理和战略规划的能力上,最后却发现在这些高大上的工作最后都回归到了沟通。你开始向聆听者讲述自以为满意的产出物(……产品如何阅读如何排除一本坏书读书已经是我等小产品汪的日常必修课了。行业飞速发展,职业本身的概念比较模糊,这些原因都让我们在惶恐中不断督促自己读书学习。可惜的是,这个世界上,总有些书写出来不是为了让认读的,……离开学校,入职4月的产品汪感想我不知道其它入职到这个时期的PM是怎么样的。但是由于我的老大(聪哥),就坐在我身边,每天经常能看到他在做些什么,自己有时也会默默记下来他在做什么,所以有时就会摸不清看不透自己现……【Mary带你逛起点】遇见你,真好在这样一个复杂的时代,在这样一个交替变换的季节。有人突然发现原本精心选择的专业毕业后居然不再热门;也有人惊觉原本以为很懂产品,在实践的时候却没有了前行的思路;更有人顿悟自己在创……作为产品经理,我学到了什么我一直觉得,不管做什么事情、在社会中扮演什么角色,都要定期或不定期的回顾一下,看看自己在一段过程中得到了什么、失去了什么。明确目标是为了不忘记方向,回头看看是防止丢了自己。……【Lisa带你逛起点】兴趣是最好的老师松下幸之助曾说:“全心全意地投入工作,要靠浓厚兴趣的支持。”有了兴趣,我们就有了动力;有了兴趣,我们才觉得生活是美好的,因此兴趣具有独一无二的必要作用。爱因斯坦曾说:兴趣是最好……如何在数字时代创造出成功的产品?(一)伟大的数码产品不可能突然无端出现在某处。事实上,它们是复杂的“文物”,经过一个细致的产品发现过程,而成功地成长为伟大的产品。它们创造了美好的用户体验,且是易用的,美观的,为它们……【干货】创业提案的逻辑最近花了大量时间在自己新的内部创业项目,免不了给各种不同的人(内部或外部)进行商业提案(BusinessProposal)的工作,同时也在帮助湾区一些社会企业包装面向投资人的P……新手教程如何撰写你的第一份数据报告你是一个在校学生,上着自己喜欢或不喜欢的课,闲来无事,你打开知乎,看到了数据分析话题,你下定决心要成为一个数据分析师,你搞来一堆学习资料和在线课程,看完之后自信满满,准备去投简……如何在评审会议中正确撕逼?这是一个熟悉的场景:有的时候每个月一次,但往往是每周一次,产品经理和职能负责人聚集在一处。有些人会通过电话参与会议,这意味着他们需要不断的努力去听,经常会被要求“静音”来掩盖背……
简单的职场的语录职场的语录58条简洁的职场正能量的语录职场心灵鸡汤语录经典职场的语录60条简洁的职场的语录58条职场正能量的语录职场正能量的语录45条职场的语录65条职场的语录70条职场的语录49条职场正能量的语录68条

友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找作文动态热点娱乐育儿情感教程科技体育养生教案探索美文旅游财经日志励志范文论文时尚保健游戏护肤业界