童话说说技术创业美文职业
投稿投诉
职业母婴
职场个人
历史治疗
笔记技能
美文纠纷
幽默家庭
范文作文
乐趣解密
创业案例
社会工作
新闻家居
心理安全
技术八卦
仲裁思考
生活时事
运势奇闻
说说企业
魅力社交
安好健康
传统笑话
童话初中
男女饮食
周易阅读
爱好两性

【技术分享】大众点评数据平台架构变迁

12月4日 夜未央投稿
  最近和其他公司的同学对数据平台的发展题做了一些沟通,发现各自遇到的问题都类似,架构的变迁也有一定的相似性。
  以下从数据架构应用的角度对2012。072014。12期间大众点评数据平台的架构变迁做一个概括性的总结,希望对还处在数据平台发展初期的同学有一些帮助,欢迎线下沟通。
  1。0(2012。07)
  1。1数据:
  以支持用户报表需求为主
  初步沉淀出了一些底层模型
  模型计算程序以python为主
  1。2架构:
  存储和计算都在GreenPlum
  GreenPlum采用双集群热备,一大一小,部分关键报表数据同时在两个集群存储、计算。
  传输:公司的DBA同学将数据从Mysql、SQLServer拉出来,落地成文件。传输程序每天凌晨解析落地的文件,然后将数据load到greenplum
  调度:使用Quartz框架,依赖关系存放到表中,将依赖检查做成一个脚本,下游job调用方法check上游任务是否完成
  监控:用户程序自主判断异常,邮件、手机报警。
  1。3数据应用:
  报表数据以邮件的形式发送给用户
  用户可以使用自定义sql的web查询工具主动查询数据
  2。0(2013。04)
  2。1数据:
  1。有了明确的模型分层:
  ODS:存放从原系统采集来的原始数据
  DW:保存经过清洗,转换和重新组织的历史数据,数据将保留较长时间,满足系统最细粒度的查询需要
  DM:数据集市。基于部门或某一特定分析主题需要
  RPT:直接面向用户的报表
  2。形成了流量、团购、信息三大基础模型及构建于三大基础模型之上的数据集市
  3。基于volocity开发了canaan计算框架。
  4。开发了一些自定义的UDF
  2。2架构:
  1。存储和计算都基于HIVE
  2。GREENPLUM作为HIVE的“cache”存在,供用户做一些小数据的快查询,报表存储。
  3。调度:和canaan框架进行整合,支持用户快速新增任务,并自动导入任务依赖。
  4。主数据:保存了数据仓库元数据信息,供用户查询和系统内部各个模块交互。
  5。ACL:构建了数据仓库数据访问权限控制,包括用户权限申请、审批者审批、数据赋权等。
  6。传输:
  参考阿里DataX的设计,实现了点评的异构数据离线传输工具wormhole
  可视化界面,用户通过界面操作,方便的将数据导入导出数据
  和调度、主数据等系统打通
  7。监控:由于任务数量增长较快(2000),运维已经是个问题此外,因此,我们花了较大精力做了可视化的工作:
  2。3数据应用
  运营工具:用户自定义SQL,存储基于HIVE
  指标(KPI):用户自定义SQL,计算基于HIVE,结果放到GREENPLUM中,用户可以根据指标通过时间拼接成报表
  HIVEWEB:非常便捷的HIVEWEB工具,可用性可以甩hive原生的web界面HWI几条街了
  3。0(2013。12)
  3。1数据:
  有了明确的上层数据集市,各层数据集市打通,例如团购数据和流量数据打通
  形成了用户集市、商户集市两大主题
  和算法团队合作建设推荐系统
  提供框架和工具支持,引入外部数据开发者
  3。2架构:
  引入mysql、hbase,支持线上服务
  数据访问接口支持:API、QueryEngine、RPCService
  引入shark支持临时查询,出于稳定性考虑,牺牲性能,sharkspark集群和hadoophive集群物理隔离
  数据质量:用户指定以条件,对计算结果做检查
  3。3数据产品:
  支持DashBoard
  4。0(2014。12)
  4。1数据:
  持续扩充完善数据模型
  数据规范化,主要包括:APP日志、渠道
  完善数据开发平台,其他部门数据开发者100
  4。2架构:
  建设RedisCluster,支持实时推荐、用户画像等服务
  Hadoop升级到YARN
  引入Storm支持实时计算
  推出类Kafka的分布式消息系统,结合日志框架,支持日志数据的快速低成本接入
  建设元数据中心
  4。3数据产品:
  推出专有数据产品,包括:运营效果评估、流量分析产品等。
投诉 评论 转载

作为产品经理的你,这些前端知识你都知道吗?如果评选近几年互联网行业最火的职位,产品经理一定可以排到前三。到如今,很多人毕业之后直接担任了产品经理助理的岗位,这也得益于产品岗俨然已成为了很多企业校招时的重头戏。与直……三步轻松做出靠谱需求分析认清现象和原因的不同。从证实假设到导出结论的过程中,最重要的就是弄清楚发生问题的原因是什么,但是大多数经营者和企业经理人只看到问题的现象,却看不到产生问题的原因。现象终究只是现……致剁手党:浅谈用户消费心理前言:在昨天的双11剁手节,马云又一次创造了历史。先罗列一下相关数据:第18秒,交易额就超1亿元!1分12秒,销售额破10亿元!12分28秒破了100亿元!9……外卖产品(饿了么、美团外卖、百度外卖)竞品分析民以食为天,餐饮行业从古至今都在社会生活中占有重要的位置。国家统计局数据显示,2014年中国餐饮行业市场规模为2。79万亿元。而今的餐饮服务不仅仅满足人的“吃”这一基本需求,在……“社交产品都得死”?对也不对,活得起的社交产品长啥样?一、风口已经过去?近段时间以来,资本寒冬论甚嚣尘上,在O2O们从云端摔回地面的同时,社交产品创业者们也纷纷被打入冷宫。“社交啊,现在就是个坑。”“这个时候,谁还看社交啊?……产品经理3000问专业、高逼格的产品经理成长秘籍很多新人在产品之路上不知道如何入门,也有很多产品人在工作中会遇到各种无法解决的问题,会有很多困惑,这时候要是能有个有经验的人,分享自己的解决之道,成长方法,成长的脚步无疑会快很……这个双十一,换一种方式过!11月3日,京东向工商总局实名举报,状告淘宝行业垄断,双十一来了;苏宁一大波“老板若是真的强,头条何须老板娘”广告刷爆朋友圈,双十一来了;疑似京东回击“若是老板真的……【技术分享】大众点评数据平台架构变迁最近和其他公司的同学对数据平台的发展题做了一些沟通,发现各自遇到的问题都类似,架构的变迁也有一定的相似性。以下从数据架构应用的角度对2012。072014……深度揭秘如何抓住用户需求,从2C到2B拓展做产品,要满足用户的需求,解决用户的痛点,那么究竟该如何做?滴滴如何从一个只是简单的打车软件,快速成长为现在涉及众多业务线的出行平台?关于互联网创业,他说一定要有梦想,寒冬下2……项目延期:4种情况与解决之道在项目管理中,项目延期是很常见但又不希望发生的事情。很多时候说产品经理不但要能说而且要会做,这里的做包含了推动项目按期完成的能力。在和一些老产品人交流时经常会听到他们调侃说遇到……为什么周鸿祎们要求产品经理分分钟变小白?如果你是一个产品经理,或者正在努力成为一个产品经理,对于周鸿祎、张小龙和马化腾都提到的“变小白”观点可能并不陌生。周鸿祎喜欢用“一分钟变小白”来作为评价产品经理能力的一个……从产品经理的角度谈谈“沙丁鱼式的高峰地铁体验”的可优化性众所周知,一线城市的地铁在早晚高峰的时候是非常拥挤的,那景象就好比地铁车厢是一个沙丁鱼罐头,里面装载的乘客紧紧贴着车厢的门,而人与人之间也几乎没有间隙,这样的距离已经远远超过了……
交互原型工具:好的工具是利器,坏的工具是钝器超大触摸屏设计的7大注意事项banner设计思路全总结听Apple的设计师讲设计案例解析如何设计一个专业的产品着陆页?Banner设计宝典01:玩转9种最常见的设计风格一个专业易用的健身APP,要如何规划它的功能和UI?设计师如何管理自己的文档产品设计:关于产品节日主题设计的思考B端产品设计中,弹窗可以做哪些事情?交互设计中的“无意识错误”:如何帮助用户防错为吸引用户而存在:界面中CTA按钮的设计有何讲究
欠缺,永远的不完美卫生间漏电防护措施厨房排风系统如何设计俄乌跌倒,印度吃饱,GDP增长世界第一,2022成了印度崛起生活知识科普胖大海菊花茶禁忌秋季护肤常识女人秋季如何护肤无糖茶刮起新旋风,未来百亿赛道还能卷出什么新花样?热评聚热点 谦让是褒义词吗应届生简历模板亚马逊的AppStore首次出现在MicrosoftStor丑娘张少华被儿子啃老83岁离世,晚年生活引人反思华光环能拟参股汕头益鑫投建天然气分布式能源项目总投资11。8

友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找作文动态热点娱乐育儿情感教程科技体育养生教案探索美文旅游财经日志励志范文论文时尚保健游戏护肤业界