范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

大数据入门HDFS文件管理系统简介

  Hadoop作为大数据主流的基础架构选择,至今仍然占据着重要的地位,而基于Hadoop的分布式文件系统HDFS,也在大数据存储环节发挥着重要的支撑作用。今天的大数据入门分享,我们就主要来讲讲HDFS分布式文件管理系统。
  一、HDFS文件管理系统
  根据物理存储形态,数据存储可分为集中式存储与分布式存储两种。集中式存储以传统存储阵列(传统存储)为主,分布式存储(云存储)以软件定义存储为主。
  传统存储:一向以可靠性高、稳定性好,功能丰富而著称,但与此同时,传统存储也暴露出横向扩展性差、价格昂贵、数据连通困难等不足,容易形成数据孤岛,导致数据中心管理和维护成本居高不下。
  分布式存储:将数据分散存储在网络上的多台独立设备上,一般采用标准x86服务器和网络互联,并在其上运行相关存储软件,系统对外作为一个整体提供存储服务。
  数据量越来越多,在一个操作系统管辖的范围存不下了,那么就分配到更多的操作系统管理的磁盘中,但是不方便管理和维护,因此需要一种系统来管理多台机器上的文件,这就是分布式文件管理系统。
  常见的分布式文件系统有GFS、HDFS、Lustre、Ceph、GridFS、mogileFS、TFS、FastDFS等,而HDFS作为Hadoop的核心组件之一,在市场主流的使用非常普遍。
  二、HDFS文件系统的特点
  优点:
  (1)高容错性。数据自动保存多个副本。通过增加副本的形式,提高容错性,某一个副本丢失,可以自动恢复。
  (2)适合大规模的数据、文件处理。
  (3)采用流式的数据访问方式,一次存入多次读取,存入的数据只能追加,不能修改。
  (4)可以部署在廉价的机器上。
  缺点:
  (1)不适合低延时的数据访问,对延时要求在毫秒级别的应用,不适合采用HDFS。HDFS是为高吞吐数据传输设计的,因此可能牺牲延时。HBase更适合低延时的数据访问。
  (2)无法高效地对大量小文件进行存储。文件的元数据(如目录结构,文件block的节点列表,block-node mapping)保存在NameNode的内存中,整个文件系统的文件数量会受限于NameNode的内存大小。
  (3)无法支持并发写入。一个文件只能有一个写,不允许多个线程同时写入。
  (4)不支持文件随机修改,仅支持文件追加。
  五、HDFS文件系统常用命令
  命令行的交互主要通过hadoop fs来操作。
  1、显示目录信息
  #显示根目录下所有文件和目录
  hadoop fs-ls/
  #递归显示根目录下所有文件和目录
  hadoop fs-ls-R/
  2、将本地文件或目录上传到HDFS
  #hdfs dfs-put<本地文件路径>
  hdfs dfs-put ceshi.txt/opt/data
  copyFromLocal命令同样用于上传文件
  hdfs dfs-copyFromLocal./ceshi.txt/opt/data
  3、将文件或目录从HDFS中的路径拷贝到本地
  hdfs dfs-get/opt/data/ceshi.txt/usr/local
  copyToLocal命令同样可以实现从HDFS中的路径拷贝到本地
  hdfs dfs-copyToLocal/opt/data/ceshi.txt/usr/local
  4、将文件或目录从HDFS的源路径移动到目标路径
  不允许跨文件系统移动文件。
  hdfs dfs-mv/opt/data/ceshi.txt/opt/local
  5、将文件或目录复制到目标路径下
  hdfs dfs-cp[-f][-p|-p[topax]]URI[URI…]
  选项:
  -f选项覆盖已经存在的目标。
  -p选项将保留文件属性[topx](时间戳,所有权,权限,ACL,XAttr)。
  6、删除一个文件或目录
  hdfs dfs-rm[-f][-r|-R][-skipTrash]URI[URI…]
  选项:
  如果文件不存在,-f选项将不显示诊断消息或修改退出状态以反映错误。
  -R选项以递归方式删除目录及其下的任何内容。
  -r选项等效于-R。
  -skipTrash选项将绕过垃圾桶(如果已启用),并立即删除指定的文件。当需要从超配额目录中删除文件时,这非常有用。
  7、追加一个文件到已存在的文件末尾
  hadoop fs-appendToFile...
  hadoop fs-appendToFile./ce.txt/opt/data/ceshi.txt
  8、显示文件内容-cat
  9、显示文件的末尾-tail
  10、合并下载多个文件
  #将HDFS的/opt/data目录下的文件合并为hb.txt文件并下载到本地
  hadoop dfs-getmerge/opt/data/hb.txt
  合并后的文件位于当前目录,不在hdfs中,是本地文件。
  11、统计文件系统的可用空间信息-df
  12、显示给定目录中包含的文件和目录的大小或文件的长度
  hdfs dfs-du/opt/data/
  关于大数据入门,HDFS文件管理系统,以上就为大家做了简单的介绍了。HDFS作为Hadoop原生的核心组件之一,也是大数据学习当中的一块重点,分布式文件管理系统HDFS,需要深入去理解和掌握。

干货丨常见的特定可视化类型有哪些?可视化从广义上来讲,指的就是一切可以创建图形表格甚至动画的技术,利用这些创建出来的影像可以帮助受众更好的理解所要表达的意思。人们每天会看到数十种常见的数据可视化类型,有些很漂亮但缺干货丨Hadoop安装步骤!详解各目录内容及作用Hadoop是Apache基金会面向全球开源的产品之一,任何用户都可以从ApacheHadoop官网下载使用。今天,播妞将以编写时较为稳定的Hadoop2。7。4版本为例,详细讲解华为天才少年自制机械臂,网友一年200万还是给少了关于机械臂,我们生活中见到的不多,但在各行业领域的运用中却也不少。比如工业领域的自动化设备,服务业领域的机器人等。工业机械臂那么如果想要自制一个机械臂,会做成什么样子呢?B站up主程序员是如何卷死其它程序员的?看完上头!这人无敌了社会生活中内卷化现象可以说无处不在。不知道大家看过下方这张照片没有,拍摄于北京理工大学图书馆,内卷的厉害啊宁可累死自己,也要卷死同学。图片来源于网络,如侵删对于不少在在互联网公司工干货丨什么是大数据系统存储及管理?根据数据存储和管理的内容范围,大数据存储及管理技术需要重点研究,如何解决大数据的可存储可表示可处理可靠性及有效传输等问题。在大数据存储和管理发展过程中,出现了几种较为有效的存储和管程序员三个月没拿工资还被以薪水过高解雇,删除数据予以反击程序员删库的事件频频发生,明知道删库会惹来一堆麻烦事,为什么程序员还会选择删库的方式呢?真的是程序员一方的问题吗?最近,又有一件删库事件引起大家注意,主人公叫Paul(当然是化名)女友给程序员老公买假发,火遍全网!网友沸腾了现如今,程序员已成为互联网里不可或缺的角色,谈到程序员往往会让人联想到秃头,网上也充斥着程序员秃头的各种梗。近日,网传江苏南京一女子见程序员老公写代码太辛苦,特意给他煮了鸡汤补补。荣耀X30Max首发评测,极致大屏究竟是什么体验?近几年随着全面屏手机市场的逐渐成熟,手机屏幕开始越做越大,手机大屏化也成为了市场的主流。但目前手机屏幕的尺寸似乎也达到了一个瓶颈期,大部分手机的屏幕大小似乎也被定格在了6英寸左右,微信之父张小龙年薪3亿,曾独自一人完成7万行代码程序员改变世界,原来这些大佬都是程序员出身,如今他们身价过亿。互联网新时代,IT大有可为。上次我们讲到劳模雷军,今天的主人公则是当年差点被雷军以15万元收购的Foxmail的开发者5G手机中的巨无霸,荣耀X30Max高清图赏,一眼可见的大进入2021年,5G网络已成普及之势,视频时代也已经到来,而想要拥有更好的视频体验,只有5G网络,流畅的播放是不行的,还需要有更大的屏幕,这才能让我们拥有更好的视觉体验。也因此,手小马智行楼教主,一人挑一队,被称编程第一人程序员改变世界,原来这些大佬都是程序员出身,如今他们身价过亿。互联网新时代,IT大有可为。有这样一位年轻人。他在著名的软件开发网站TopCoder的电脑编程竞赛上,位居中国区第一名
手机上的电话号码本误删后怎样恢复?方法一iCloud恢复苹果手机拥有其独立的云端系统,打开功能后它会在后台对数据进行备份。当然,它支持不同的软件选择,比如你想备份通讯录或者微信数据,打开其允许备份功能即可。一般默认女性社交应用Peanut推出新产品,将女性与心理学治疗师等结合Peanut是一款面向女性的社交网络应用,目前它正在推出一个新的PeanutPro扩展包,旨在让女性能够从值得信赖的专家那里获得信息。该公司已与其现有网络中的100位专家合作,其中iPhoneSE3备受吐槽,却在日本卖爆!日本用户因为便宜苹果今年在春季发布会上推出了第三代SE机型,也就是iPhoneSE3,这款手机在各项配置上还是很厚道的,无论是iPhone13同款处理器A15,还是5G的加入,都成为了亮点。不仅如天猫家装升级本地服务,消费者可在淘宝云逛近4万家线下门店家装产业高度倚重线下门店的体验和安装服务。日前,天猫家装本地服务再次升级。天猫联合箭牌欧派东鹏索菲亚大自然皮阿诺好莱客玛格等49个家装重点品牌,围绕内容服务和全域生意,升级本地化服为什么俄罗斯芯片不怕卡脖子说来惭愧,因为没有脖子可卡乌克兰和俄罗斯的冲突愈演愈烈,冲突背后,科技战金融战等比军事战争更激烈。多数西方国家一边倒支持乌,西方国家对俄罗斯的制裁从机构个人金融交易系统到芯片技术越来越多,包括但不仅限于芯片传OPPO首款自研AP明年量产,2024年将推整合5G基带的SoC芯片4月5日消息,据台湾媒体报道,智能手机大厂OPPO继去年成功推出首款自研的影像NPU芯片MariSiliconX之后,旗下的芯片设计子公司上海哲库将于2023年量产推出自研的应用处蒋凡卸任淘宝天猫董事长,现任海外业务总裁4月6日消息,有媒体报道,蒋凡已不再担任浙江淘宝网络有限公司浙江天猫网络有限公司法定代表人董事长兼总经理,不再担任阿里巴巴迅犀(杭州)数字科技有限公司的法定代表人及董事长。记者从阿苹果多次削减iPhone订单OPPO首款自研AP明年量产OPPO首款自研AP明年量产近日,据台媒报道称,OPPO继去年推出首款自行研发的影像处理神经网络运算(NPU)芯片后,旗下IC设计子公司上海哲库已展开应用处理器(AP)及手机系统单外观即将大改!iPhone14Pro系列,售价可能要上调了虽然距离iPhone14系列发布还有半年时间,但关于苹果新品的爆料向来都是提前很久,今年要发布的iPhone14系列也不例外,现在网上已经曝光了诸多关于iPhone14系列的信息。一加10Pro突然尴尬,Reno8外观曝光门板合页设计绿厂的Reno系列发布从2019年发布以来,更新迭代的速度着实有点快,高产似母猪,这不今年就已经要出到Reno8了,三年产八代。数码闲聊站今天也曝光了新机的相关渲染图正面为6。55为什么老外几十年前就有bb84协议,量子通信还被中国领先?这个问题提得很专业,大多数人可能都看不懂题目说的是什么。背景是这样的量子通信是一个大的研究领域,包括量子密码术(又称为量子保密通信或者量子密钥分发)量子隐形传态(就是科幻电影中的传