专栏电商日志财经减肥爱情
投稿投诉
爱情常识
搭配分娩
减肥两性
孕期塑形
财经教案
论文美文
日志体育
养生学堂
电商科学
头戴业界
专栏星座
用品音乐

MRSApacheZeppelin,让数据分析更便捷

  摘要:选择轻量化、免运维、低成本的大数据云服务是业界趋势,如果搭建Zeppelin再同步自建一套Hadoop生态成本太高!因此我们通过结合华为云MRS服务构建数据中台。
  本文分享自华为云社区《MRS大数据平台结合ApacheZeppelin让数据分析更便捷云社区华为云》,作者:dullman。
  ApacheZeppelin:一款大数据分析和可视化工具,可以让数据分析师在一个基于Web的notebook中,采用不同语言对不同数据源中的数据进行交互式分析,并对结果进行可视化图表的展示。
  云服务MRS:华为云提供的一站式大数据平台,包含Hudi、ClickHouse、Spark、Flink、Kafka、Hive、HBase等丰富的大数据组件,完全兼容开源生态。本文介绍如何搭建Zeppelin并连接Hive、HBase进行简单的数据开发。为什么写这篇文章?Zeppelin相关的文章虽然很多,但是都没有与实际大数据平台结合的实践案例指导。Zeppelin的搭建存在不少坑,因此记录下部署中的各个问题,为后人填坑。选择轻量化、免运维、低成本的大数据云服务是业界趋势,如果搭建Zeppelin再同步自建一套Hadoop生态成本太高!因此我们通过结合华为云MRS服务构建数据中台。环境准备ApacheZeppelin0。9。0安装包MRS3。1。0普通集群(包含Hive、HBase组件)ECScentos7。6安装MRS客户端
  MRS客户端提供java、python开发环境,也提供开通集群中各组件的环境变量:Hadoop、Hive、HBase、flink等。
  参见登录ECS安装集群外客户端安装Zeppelin使用Xftp等工具导入主机并采用以下命令安装在optzeppelin目录。tarzxvfzeppelin0。9。0binall。tgzmvzeppelin0。9。0binalloptzeppelin配置Zeppelin环境变量,在profile文件中加入变量vietcprofileexportZEPPELINHOMEoptzeppelinexportPATHZEPPELINHOMEbin:ZEPPELINHOMEbin:PATH导入环境变量sourceetcprofile编辑zeppelinenv。sh文件,加入JAVAHOME,这里需要替换成自己的环境变量cdoptzeppelinconfcpzeppelinenv。sh。templatezeppelinenv。shsourceopthadoopclientbigdataenvechoexportJAVAHOMEopthadoopclientJDKjdk8u201zeppelinenv。sh编辑zeppelinsite。xml文件,将zeppelin。server。port8080替换成18081(可自定义,也可以不改);将zeppelin。anonymous。allowed参数的true修改为falsecdoptzeppelinconfcpzeppelinsite。xml。templatezeppelinsite。xmlvizeppelinsite。xmlpropertynamezeppelin。server。portnamevalue18081valuedescriptionServerport。descriptionpropertypropertynamezeppelin。anonymous。allowednamevaluefalasevaluedescriptionAnonymoususerallowedbydefaultdescriptionproperty编辑shiro。ini文件,新增用户developusercpshiro。ini。templateshiro。inivishiro。ini
  在〔users〕下新增用户developuser,密码Huawei123,权限admindevelopuserHuawei123,admin
  运行Zeppelin(并检查启动参数)cdoptzeppelinbinzeppelindaemon。shstart
  psefgrepzeppelin
  关闭防火墙,允许端口18081(此为测试环境,生产环境建议采取更安全措施)systtemctlstopfirewalld完成以上配置,并启动成功后,在浏览器中输入地址zeppelinip:18081(zeppelinip为安装zeppelin的HD客户端IP),即可看到如下界面。
  使用developuser登录,就可以基于note进行大数据的交互式开发了!
  Zeppelin连接Hive
  1、将Zeppelin中jdbc依赖的jar包替换成MRS客户端中HiveBeelinelib中的jar包,保证hiveInterpreter依赖的Jar包存在cpfoptBigdataclientHiveBeelinelib。jaroptzeppelininterpreterjdbc
  2、修改Zeppelin配置,添加ClientHiveUrl
  查询CLIENTHIVEURLsourceopthadoopclientbigdataenvechoCLIENTHIVEURI
  编辑interpreter。json,位置usrzeppelinconfinterpreter。json,修改JDBCdefault。url,default。driver。jdbc:{id:jdbc,name:jdbc,group:jdbc,properties:{default。url:{name:default。url,value:jdbc:hive2:192。168。1。188:24002,192。168。1。234:24002,192。168。1。241:24002;serviceDiscoveryModezooKeeper;zooKeeperNamespacehiveserver2,type:string,description:TheURLforJDBC。},default。user:{name:default。user,value:gpadmin,type:string,description:TheJDBCusername},default。password:{name:default。password,value:,type:password,description:TheJDBCuserpassword},default。driver:{name:default。driver,value:org。apache。hive。jdbc。HiveDriver,type:string,description:JDBCDriverName}
  3、重启zeppelinbinzeppelindaemon。shrestart
  4、创建Notebook,选择defaultinterpreter为jdbc
  5、在notebook上使用HiveSQL进行查询查询数据库jdbcshowdatabases;
  创建Hive表jdbccreateexternaltablestu(sidstring,snamestring)rowformatdelimitedfieldsterminatedby‘’;
  Zeppelin连接HBase
  1、将Zeppelin中hbase依赖的jar包替换成MRS客户端中HBase中的jar包,保持jar的一致先将optzeppelininterpreterhbase目录下原本的Jar包移走cdoptzeppelininterpreterhbasemkdirhbaseoldjarmvhbase。jarhbaseoldjarmvhadoop。jarhbaseoldjarmvzookeeper3。4。6。jarhbaseoldjar再将opthadoopclientHBasehbaselib下的jar包拷贝至optzeppelininterpreterhbase。cpfopthadoopclientHBasehbaselib。jarusrzeppelininterpreterhbase
  2、修改Zeppelin配置
  编辑zeppelinenv。sh,加入hbase环境变量exportHBASEHOMEopthadoopclientHBasehbase
  编辑interpreter。json,位置optzeppelinconfinterpreter。json,修改hbase。homehbase。home:{name:hbase。home,value:opthadoopclientHBasehbase,type:string}
  3、重启zeppelinbinzeppelindaemon。shrestart
  4、配置Interpreter
  从web界面右上角菜单中Interpreter中进入,配置Interpreter
  选择Hbase,修改如下配置,并保存配置。hbase。home:optclientHBasehbase
  5、创建note进行数据开发
  页面选择Notebookcreatenewnote
  自定义Note名称,例如hbaseNote,并指定Interpreter为HBase。
  编辑Note,点击右侧执行按钮(三角标志)hbasecreate‘test6’,‘cf’put‘test6’,‘row1’,‘cf:a’,‘value1’
  若在创建Interpreter未指定defaultInterpreter,需要在note最前面加上hbase进行指定。
  6、在FusionInsight客户端下查看刚刚通过Zeppelin创建的hbase表test6和数据
  其他Hadoop生态组件在云服务MRS上的实践参考
  使用商业智能软件Superset分析MRS数据之最佳实践
  基于云服务MRS构建DolphinScheduler2调度系统
  开源工作流引擎Azkaban在MRS中的实践
  分布式调度平台Airflow在华为云MRS中的实践
  点击下方,第一时间了解华为云新鲜技术
  华为云博客大数据博客AI博客云计算博客开发者中心华为云

海绵宝宝宇宙摇摆明年1。31推出新预告发布发行商THQ宣布海绵宝宝宇宙摇摆将于2023年1月31日发售,登陆PS4XboxOneSwitch和Steam平台,并公开了一则预告,游戏目前已上线Steam,支持中文。海绵宝宝宇冯小刚葛优再合作,手机2令人期待,却因女主无法播出冯小刚和葛优是一对合作多年的老搭档,两人曾一起拍摄过天下无贼甲方乙方还有大腕等多部作品。前几年两人再度携手,拍摄了手机2,大部分观众对此都期待不已,但因为女主角的缘故,这部作品杀青香港学与教博览开幕聚焦元宇宙等创新教育资源香港第十二届学与教博览在会展中心举行开幕仪式。主办方供图中新网香港12月7日电由香港教育城(教城)与BaileyCommunicationsHK合办的第十二届学与教博览自7日起,一你知道影响网站打开速度的原因有哪些吗?在网站优化中,网站的打开速度是举足轻重的,倘若打开网站需要三秒以上,通常人会直接关掉,等于把大半的客户拒之门外,网速不够快也十分影响客户的体验,需要进行优化,所以,今天小编就为大家胎记暗示前世死法?网友讨论引争议,这些揣测都是谣言头号有新人转载文糯豆包妈妈胎记是婴儿出生后身体上带有的颜色一样的斑,根据统计,出生的宝宝里面大约有百分之十的宝宝都会有胎记。有的在腿上,有的在手上,有的在脸上,还有的在其他地方,总生命的意义在于活着,活着的意义在于责任,比责任更高意义是使命1。3责任就是意义学者季羡林先生说,根据我个人的观察,对世界上绝大多数人来说,人生一无意义,二无价值。他们也从来不考虑这样的哲学问题。(季羡林谈人生)别人的人生真的就没有意义吗?古大雪节气,建议中老年人4种食物多吃,增强抵抗,健康过寒冬日子到了大雪节气,也来到了深冬季节,天气愈加寒冷,是各类病痛感冒的高发期,想要身体好起来,首先要增强自身的抵抗力。抵抗力强了,才能抵抗外界病菌的侵袭,最简单的方法是从一日三餐中获取完美暴露身体缺陷,明星拉胯红毯造型,看完我忍不住笑出了声红毯如战场百花争奇斗艳,每次一举行活动,明星们就会花好几个月精心挑选衣服,只为了在红毯上展示最迷人的一面,若是一走成名可能会带来不少商业价值。然而众多明星也有翻车的时候,精心挑选的南半球最大射电望远镜加入搜寻外星生命行动再添神器据美国趣味科学网站12月5日报道,新望远镜加入后,搜寻外星生命的范围扩大了1000倍。搜寻可能是外星生命迹象的无线电信号的天文学家刚刚能够使用南非MeerKAT射电望远镜。Meer口罩放开后,老人冬季健康要点现在关于各地放开的消息充斥着整个网络,总体来说,放开是大势所趋,任何人都无法阻挡。我不想就放开再发表什么言论了,家中都有老人和孩子,今天我先说一下老人在这个特殊的寒冬里应该注意点什自由属于我们自由,是社会主义核心价值观基本内容之一。据报,北京时间12月6日凌晨,2022世界杯淘汰赛,随着巴西队战胜韩国队,卡塔尔的974球场完成了它的历史使命。卡塔尔世界杯足球体育场这座主
火速!TopazAI全家桶8门神器中文解锁版,WinMac系统全覆盖为大家带来TopazLabs人工智能全家桶2022年最新版本,利用人工智能和自动算法加持,2022全新版本拥有强大的图片和视频编辑功能,一键轻松达到优秀的后期效果。领取提示评论区任真正见过世面的中年男人,很少穿这3条裤子,容易拉低档次显油腻中年男性的穿衣打扮讲究一个整体性,从上衣的选择到下装的搭配,要合身合理合适才称得上是完整的LOOK。可是很多中年男性在穿衣的时候,很容易流失造型平衡状态,不是忽略了上半身,就是忽略为什么说射门时力量是最不重要的大家好,今天我们分享为什么说射门时力量是最不重要的,希望大家喜欢!今天我们谈论射门的力量的问题,因为每个任似乎都认为射门越有力,得分就越容易,其实那不是真的,我们真正需要的是精确准奥运金牌最多的运动员,北京奥运会独揽八金奥运会历来是万众瞩目的世界级运动盛会,奥运会金牌的含金量也堪称运动届各类金牌之首。那么,你知道谁是世界上奥运金牌最多的运动员吗?奥运金牌最多的运动员他就是美国游泳运动员迈克尔菲尔普RedmiG2022游戏本正式亮相搭载12代酷睿处理器和RTX3050Ti显卡今天,Redmi正式上线了全新的电竞游戏本RedmiG游戏本2022,这款游戏本约2。4Kg重,配有180W电源适配器,预装Windows11操作系统,起售价是6299元,将在7月苹果发布iOS15。6正式版,修复37个漏洞今天凌晨苹果发布了iOS15。6正式版,这次的更新与上一个版本发布仅相隔4天时间。除了iOS15。6正式版之外,苹果还发布了iPadOS15。6MacOS12。5TvOS15。6w全场22次失误,怎能不输?中国男篮何时才能学会在国际赛场上真正对抗?!失误确实太多了,总觉得这个孙铭徽打球有点不动动脑子,一根筋,明明是打不了内线,非要把球运到死角再传,结果就失误了。三次致命的失误,唉!按17年的肯塔基三杰如今发展如何?有人24岁拿底薪,两人成亿元先生对于NBA来说,要想保证联赛的长盛不衰,那么必然是要发掘天赋出众的新人的。自从禁止高中生直接进入NBA之后,NCAA无疑成为了球探们发掘天才们的主战场,而像杜克北卡这样的传统名校,光刻机巨头ASML限制对华出口DUV,全球供应链将中断文观察者网吕栋当地时间7月20日,荷兰光刻机巨头阿斯麦(ASML)在披露财报时发出警告称,如果美国迫使该公司停止向中国大陆销售其主流光刻设备,全球半导体供应链将面临中断。我认为我们俄媒称中国或在美后院修运河,投资至少500亿,要防美国抢劫据俄罗斯媒体消息,日前中国与拉美国家尼加拉瓜,宣布启动自贸协定谈判。尼加拉瓜这个国家,在与中国大陆建交的拉美国家中比较特殊,中尼两国最早建交始于1985年,但其后没几年工夫,尼加拉浙江与山东,中国第三强省份之争一个地区的实力高低,首先必须参考各类总量指标,再来考虑人均数据。所有比较,如果脱离总量,那肯定是相当片面的。所以在长时间的发展过程中,山东的综合实力还是值得肯定的。在上世纪80年代
友情链接:快好找快生活快百科快传网中准网文好找聚热点快软网