MRSApacheZeppelin,让数据分析更便捷
摘要:选择轻量化、免运维、低成本的大数据云服务是业界趋势,如果搭建Zeppelin再同步自建一套Hadoop生态成本太高!因此我们通过结合华为云MRS服务构建数据中台。
本文分享自华为云社区《MRS大数据平台结合Apache Zeppelin让数据分析更便捷-云社区-华为云》,作者: dullman。
Apache Zeppelin:一款大数据分析和可视化工具,可以让数据分析师在一个基于Web的notebook中,采用不同语言对不同数据源中的数据进行交互式分析,并对结果进行可视化图表的展示。
云服务MRS:华为云提供的一站式大数据平台,包含Hudi、ClickHouse、Spark、Flink、Kafka、Hive、HBase等丰富的大数据组件,完全兼容开源生态。 本文介绍如何搭建Zeppelin并连接Hive、HBase进行简单的数据开发。 为什么写这篇文章?Zeppelin相关的文章虽然很多,但是都没有与实际大数据平台结合的实践案例指导。 Zeppelin的搭建存在不少坑,因此记录下部署中的各个问题,为后人填坑。 选择轻量化、免运维、低成本的大数据云服务是业界趋势,如果搭建Zeppelin再同步自建一套Hadoop生态成本太高!因此我们通过结合华为云MRS服务构建数据中台。 环境准备Apache Zeppelin 0.9.0安装包 MRS 3.1.0普通集群 (包含Hive、HBase组件) ECS centos7.6 安装MRS客户端
MRS客户端提供java、python开发环境,也提供开通集群中各组件的环境变量:Hadoop、Hive、HBase、flink等。
参见登录ECS安装集群外客户端 安装Zeppelin使用Xftp等工具导入主机并采用以下命令安装在/opt/zeppelin目录。 tar -zxvf zeppelin-0.9.0-bin-all.tgz mv zeppelin-0.9.0-bin-all /opt/zeppelin配置Zeppelin环境变量,在profile文件中加入变量 vi /etc/profile export ZEPPELIN_HOME=/opt/zeppelin export PATH=ZEPPELIN_HOME/bin:ZEPPELINHOME/bin:PATH导入环境变量 source /etc/profile编辑zeppelin-env.sh文件,加入JAVA_HOME,这里需要替换成自己的环境变量 cd /opt/zeppelin/conf/ cp zeppelin-env.sh.template zeppelin-env.sh source /opt/hadoopclient/bigdata_env echo "export JAVA_HOME=/opt/hadoopclient/JDK/jdk-8u201">>zeppelin-env.sh编辑zeppelin-site.xml文件,将zeppelin.server.port 8080替换成18081(可自定义,也可以不改);将zeppelin.anonymous.allowed参数的true修改为false cd /opt/zeppelin/conf cp zeppelin-site.xml.template zeppelin-site.xml vi zeppelin-site.xml zeppelin.server.port 18081 Server port. zeppelin.anonymous.allowed falase Anonymous user allowed by default 编辑shiro.ini文件,新增用户developuser cp shiro.ini.template shiro.ini vi shiro.ini
在[users]下新增用户developuser,密码Huawei@123,权限admin developuser=Huawei@123, admin
运行Zeppelin(并检查启动参数) cd /opt/zeppelin bin/zeppelin-daemon.sh start
ps ef | grep zeppelin
关闭防火墙,允许端口18081(此为测试环境,生产环境建议采取更安全措施) systtemctl stop firewalld 完成以上配置,并启动成功后,在浏览器中输入地址zeppelin_ip:18081(zeppelin_ip为安装zeppelin的HD客户端IP),即可看到如下界面。
使用developuser登录,就可以基于note进行大数据的交互式开发了!
Zeppelin连接Hive
1、将Zeppelin中jdbc依赖的jar包替换成MRS客户端中Hive/Beeline/lib中的jar包,保证hive Interpreter依赖的Jar包存在 cp -f /opt/Bigdata/client/Hive/Beeline/lib/*.jar /opt/zeppelin/interpreter/jdbc/
2、修改Zeppelin配置,添加Client Hive Url
查询CLIENT_HIVE_URL source /opt/hadoopclient/bigdata_env echo $CLIENT_HIVE_URI
编辑interpreter.json,位置/usr/zeppelin/conf/interpreter.json,修改JDBC default.url,default.driver. "jdbc": { "id": "jdbc", "name": "jdbc", "group": "jdbc", "properties": { "default.url": { "name": "default.url", "value": "jdbc:hive2://192.168.1.188:24002,192.168.1.234:24002,192.168.1.241:24002/;serviceDiscoveryMode=zooKeeper;zooKeeperNamespace=hiveserver2", "type": "string", "description": "The URL for JDBC." }, "default.user": { "name": "default.user", "value": "gpadmin", "type": "string", "description": "The JDBC user name" }, "default.password": { "name": "default.password", "value": "", "type": "password", "description": "The JDBC user password" }, "default.driver": { "name": "default.driver", "value": "org.apache.hive.jdbc.HiveDriver", "type": "string", "description": "JDBC Driver Name" }
3、重启zeppelin bin/zeppelin-daemon.sh restart
4、创建Notebook,选择default interpreter 为jdbc
5、在notebook上使用Hive SQL进行查询 查询数据库 %jdbc show databases;
创建Hive表 %jdbc create external table stu (s_id string,s_name string) row format delimited fields terminated by ‘ ’;
Zeppelin连接HBase
1、将Zeppelin中hbase依赖的jar包替换成MRS客户端中HBase中的jar包,保持jar的一致 先将/opt/zeppelin/interpreter/hbase/目录下原本的Jar包移走 cd /opt/zeppelin/interpreter/hbase mkdir hbase_old_jar mv hbase*.jar hbase_old_jar mv hadoop*.jar hbase_old_jar mv zookeeper-3.4.6.jar hbase_old_jar再将/opt/hadoopclient/HBase/hbase/lib/下的jar包拷贝至/opt/zeppelin/interpreter/hbase/。 cp -f /opt/hadoopclient/HBase/hbase/lib/*.jar /usr/zeppelin/interpreter/hbase/
2、修改Zeppelin配置
编辑zeppelin-env.sh,加入hbase环境变量 export HBASE_HOME=/opt/hadoopclient/HBase/hbase
编辑interpreter.json,位置/opt/zeppelin/conf/interpreter.json,修改hbase.home "hbase.home": { "name": "hbase.home", "value": "/opt/hadoopclient/HBase/hbase", "type": "string" }
3、重启zeppelin bin/zeppelin-daemon.sh restart
4、配置Interpreter
从web界面右上角菜单中Interpreter中进入,配置Interpreter
选择Hbase,修改如下配置,并保存配置。 hbase.home : /opt/client/HBase/hbase
5、创建note进行数据开发
页面选择Notebook →create new note
自定义Note名称,例如hbaseNote,并指定Interpreter为HBase。
编辑Note,点击右侧"执行"按钮(三角标志) %hbase create ‘test6’, ‘cf’ put ‘test6’, ‘row1’, ‘cf:a’, ‘value1’
若在创建Interpreter未指定default Interpreter,需要在note最前面加上%hbase进行指定。
6、在FusionInsight客户端下查看刚刚通过Zeppelin创建的hbase表test6和数据
其他Hadoop生态组件在云服务MRS上的实践参考
使用商业智能软件Superset分析MRS数据之最佳实践
基于云服务MRS构建DolphinScheduler2调度系统
开源工作流引擎Azkaban在MRS中的实践
分布式调度平台Airflow在华为云MRS中的实践
点击下方,第一时间了解华为云新鲜技术~
华为云博客_大数据博客_AI博客_云计算博客_开发者中心-华为云
按中人退休好还是按新人退休好?个人不能选择。是中人就按中人退休,是新人就按新人退休。大家好,我是社保专家思之想之,按中人退休好还是按新人退休好?个人不能选择退休身份你有一个误解,以为你可以自由选择按照中人还是新
面试一个5年经验的java,不知数据结构,却大谈分布式,这样的候选人能要吗?我估计你是问了人家jdk各种数据结构底层实现原理,其实我一直很纳闷啊,知道底层实现原理这当然很OK很加分,但若是不是那么知道,那又怎样呢?人家知道哪些数据结构适合哪些场景并能熟练使
复读,每天都努力,但是到现在成绩还是上不去,特别是数学只有30多分,自己感到很迷茫,想问得怎么做?先说一下目前正规高中高考复习是怎么操作的,然后再说一下你应该怎么做,希望有点作用。目前的高考,学生就像运动员,活跃在前台,但是要出成绩,学生后面的两个团队至关重要。一个是教师团队,
初二成绩一般,初三努力能否提升?可以肯定的告诉你,初三只要努力,成绩一定能够有所提升的。从初中数学的角度来看,初中数学的难点基本上都在初三,初一,初二的知识比较简单,是为初三打基础的,初一初二的知识点在中考当中会
初中到底要多努力才能考上省重点高中?这个问题我有发言权,我家孩子就是从普通的九年制义务教育学校考入市重点高中的。首先要说明的是,有考入重点高中的决心,你就已经成功了一半。进入初中阶段之后,学科一下子多起来,很多学生无
在杭州月收入5500是什么水平?我在滨江上班,目前工资扣掉最低标准的五险一金,实际到手5000块,我住在萧山义桥,每天公交一个小时上班,车费十几块,中午公司食堂十几块,公婆都在杭州,两个孩子上幼儿园,还好不用掏房
刮刮乐有中奖窍门吗?2020年7月12号,拥有49万粉丝的网红博主做了个挑战实验,花费13000元清空了一家彩票店的刮刮乐!PS视频素材来源于网红大胡子魏如有侵权,请联系我删除!我曾经有一个梦想,就是
我追尾别人,对方喝酒,对方给我3万元,第二天告我敲诈,怎么办?以下几点,若符合,你案子赢面不大1。你收的不是现金,对方是转账给你并留有记录钱保不住2。你主动索要高额赔偿并留下了证据敲诈勒索的要件之一3。你明确告知警方证人或当时证据显示你完全知
现在都是高楼,人死后在哪里办葬礼?城市城市住在高楼小区,是没办法在家里办葬礼,更不允许在小区举行葬礼。往往老人许多都是在医院病逝的,然后联系火葬场的专车直接送往火葬场的。(付费)。火化前穿衣并请美容师美容(付费)。
父母寿命越长,其儿女寿命也长吗?人的寿命长短,和父母的遗传基因有很大关系!就算你父母都是过百岁的寿星,但他们的后辈都不一定能长寿,因为遗传同你父母对待孩子一样,有时都会很偏心的。在这我说一件真实的事,有一对夫妻都
决定百万考生命运的高考试卷是如何命题的?感谢悟空问答小秘书头条教育邀请。我是一叶知秋有仙则名,我来回答这个问题。题主问决定百万考生的高考试卷是如何命题的?其实,参加高考的人数远超百万,2019年参加高考的考生突破千万,高
你听过哪些非常震惊的真实案件?女大学生从城市被拐卖到深山,成为老丑男的妻子,遭到强奸毒打囚禁!深山里的恶人,日复一日的折磨着女大学生。而深山里的好人,在竭尽全力的帮助女大学生走出深山。总的来说,女大学生在深山里
现在河北保定普遍人均工资多少?基本最低工资1500元。基本工资奖金,纯到手的国企普通职工一般2000元左右。基层领导3000元左右。中层领导6000左右。中层干部7000左右。高层1万以上至无限,一个县分公司一
为什么现在一些普通列车停运了?一方面是因为疫情的影响,很多普通客车以及一些动车组列车停运,没有客流所以就暂时不开行了,同时也减少疫情传播的风险。而另一方面,今年10月铁路运行图调整不仅停运了很多普速客车,一些运
中年失业,你到底输在哪里?输在没有含着金汤匙出生,输在没有带血的第一桶金,输在爹妈没有遗传高智商,当然也输在自己不努力输在年轻的时候得过且过。年轻人努力上进的只是少数,中年混的风生水起的也是少数输在了中年人
你为彩票捐的钱是否得到了回报?你觉得买彩票值得吗?感谢邀请!其实啊,不想再写这个题目,再回答这个问题!因为我以前写过。但是,为了让彩友,条友们买彩票时有个参考,就再谈谈我买彩的光辉历程!要说买彩票,已经有二十余年的历史了,时间要追
南京和武汉相比,哪个城市更宜居?我觉得我会选择南京,单不从经济体量上来讨论,就宜居来说,南京无论是惬意还是环境,都比武汉舒服。武汉最近几年都在搞大开发,随处可见施工工地或者环境堪忧的地方,南京相对于开发来说已经进
90后城市新型穷人,城市真的比农村好吗?讲件真实的事1990年,我在贵州省的省会,贵阳市公安局当警察。某天,在电视上看到一部纪录片。纪录了北京召开亚运会时,一群北京郊县的农民舞龙队,从训练采排到参加亚运会开幕式,表演圆满
表哥把买房首付款用来买下村里彩票点的所有彩票,结果全部拆开只中了50元,他错在哪里?你这个故事,我以前听过另外一个版本,说有兄弟两去买车,想买个好的,钱不够。兄弟两一商量,决定去彩票店赌一把,多赢点钱,买辆好车,可惜,全搭进去了,血本无归呀!我以前干过彩票店,其中
一直很好奇注册会计师待遇如何?在事务所的年薪能到30万以上吗?感谢悟空邀请!本人是注册会计师,在会计师事务所从事审计工作16年。注册会计师在会计行业算是一个非常炙手可热的证书,考试难度非常大。最近几年注册会计师考试单科平均及格率大概在20左右
彩票双色球中了5700万,要多久才能拿到全部奖金?5700万永远也不可能中,就算是中了也永远拿不到,除非内部的人,普通人就别想中,中了也别想拿到。我先研究一下怎么中5700万,然后领了奖就知道了,在回来告诉你详细流程呲牙来看我来看
谈谈你对买彩票的理解?(一)不买不中,买也不中,干脆不买!(二)不买不中,一买都中,那是做梦!(三)一注彩票寄希望,休闲娱乐渡时光!(四)任凭你千算万算,庄家是一夫当关。(五)彩票是公益,大投损身体!(