范文健康探索娱乐情感热点
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

腾讯存储往事

  QZone 告急,临危受命
  2005 年,是中国第二次互联网浪潮的发始之年。刚刚从破碎泡沫中走出的互联网产业,逐渐迎来了 "web 2.0"时代。
  这个时代的特征,就是去中心化、开放和共享。
  越来越多的互联网用户,开始以兴趣为聚合点,组成社群,分享生活,发表观点。他们积极参与话题讨论,渴望获得关注和认同。
  在这样的背景下,社交网络应用开始迅速崛起。最具代表性的,就是腾讯推出的 QQ 空间(QZone)。
  QQ 空间,作为 "展示自我和与他人互动的平台",推出之后获得了极好的反馈,用户数量快速增长,平台活跃度不断攀升。
  根据当时的数据统计,QQ 空间上线的 3 个季度,注册用户数就突破了 5000 万,月活跃用户数约 2300 万,日访问人数超过 1300 万。
  用户数量的增长,意味着内容的增长。当时,用户在 QQ 空间上传的海量图片、文件、头像等 UGC 数据,对腾讯的存储能力提出了巨大的考验。
  当时的腾讯,并没有统一的存储产品和技术平台,各个业务部门都是自建存储系统,自给自足。
  这种方式,对于 QQ 空间这种爆款产品来说,显然是无法满足要求。它带来的直接后果就是,空间开启速度越来越慢,用户体验越来越差,投诉也越来越多。
  当时,业务团队购买存储服务器的速度,根本赶不上用户增长的速度。
  最典型的例子,就是那时候 QQ 空间只允许所有用户每天上传 800 万张图片,只有黄钻用户才可以无限上传。
  与此同时,竞争对手窥觑 QQ 空间的业务增长,很快推出了相应的竞品,意图趁机抢夺用户。
  内忧外患之下,一支新成立的年轻团队站了出来,勇挑重担。
  这个团队,就是后来被誉为腾讯公司内部 "黄埔军校"的存储技术团队。团队的首任组长,就是现在的集团副总裁姚星。
  团队成立之后的首要任务,就是解决 QQ 空间发展所带来的存储瓶颈问题。
  当时,面对海量数据存储的难题,不仅是国内,就连海外也没有什么可供参考的成熟经验。唯一可供存储技术团队借鉴的,就是此前谷歌公司发表的那几篇关于 BigTable、GFS 和 MapReduce 的论文。
  如果稍微了解一点大数据知识,就会知道,这几篇论文是海量数据存储技术的经典之作。谷歌作为一家搜索引擎公司,当时的主要目的,是从昂贵的企业级存储转向大规模廉价分布式存储,以更低的成本,满足搜索引擎业务的需求。
  这个目的,显然和腾讯存储技术团队是一致的。
  借鉴经验之后,也是团队成立的第二年,他们就上线了自主研发的 TFS 存储系统,全面接管了 QQ 空间的相册业务。
  TFS 系统上线之后,虽然缓解了业务部门的存储压力,但并没有彻底解决问题。当时,系统仍然会出现比较高的延迟,影响用户的体验。
  高延时的原因,主要是因为相册业务和搜索引擎业务之间存在区别。相册业务中,图片的数据体量更小,索引密集度更高,所以难度更大,完全照搬搜索引擎模式并不可行。
  于是,存储技术团队在 TFS 系统基础上进行持续改进,推出了适合不同图片存储场景的系统。其中包括支持实时回收的 CTFS 系统、基于 HDD 的键值对 TDB 存储平台等。
  终于,在持续的改进下,存储技术团队彻底解决了 QQ 空间的存储瓶颈问题。
  2009 年,QQ 空间成为排在网络游戏之后的腾讯第二大收入贡献部门,并且获得了该年度的腾讯合作文化奖。
  这个成绩的背后,存储技术团队功不可没。
  ▲2009 年腾讯存储技术团队合影
  2009 年,SNS 游戏 QQ 农场正式推出,掀起了全民偷菜的热潮。当时,农场的访问量巨大,在每秒数万的并发访问下,腾讯的底层存储系统的延时和请求吞吐压力非常大,服务器数度崩溃。
  当时的腾讯,基本上把公司所有闲置服务器都用在 QQ 农场上,但仍远远不够,需要大量采购服务器 。
  存储技术团队一方面疯狂扩容设备,另一方面基于数据规模不太大但是访问量极高的业务特点,快速研发了全内存的分布式存储系统。在保障数据安全可靠的前提下,系统的并发访问性能得到极大提升。
  快速上线、快速验证、完全自研,存储技术团队 "hold"住了局面,再立大功。▉ 一波渐平,一波又起
  第一阶段使命的完成,使得存储技术团队积累了丰富的经验。团队成员的架构设计能力和开发能力也得到了充分的锻炼。
  很快,他们又迎来了一项新的挑战。这次遇到的,是带宽问题。
  2011 年,在 QQ 相册等大体量业务快速增长的刺激下,腾讯的数据存储量达到了 50PB。
  这是一个标志性的事件。
  当时,腾讯所有的数据中心都在深圳。那时候骨干网络的带宽很小,QQ 相册高峰时占用 40-50Gbps,而 1G 的流量对公司的网络就已经是很大的负担了。
  于是,腾讯必须将海量的业务数据分散到全国各地,缓解访问带宽的压力,同时降低成本。
  存储平台当时启动了相册一通点等项目,海量业务数据开始从深圳向西安、杭州、广州、上海等地数据迁移,访问带宽也同时调度到天津、南京、东莞等成本更低的一通机房。
  当时存储技术团队搬迁的第一台设备,数据量是 100TB。在现在看来,100TB 并不是很大,但是当时已经是腾讯有史以来最大的一次数据搬迁了。
  更让人意料之外的是,存储团队搬迁这些数据的方法,并不是通过专线(因为怕影响公司正常业务),而是通过后半夜闲时的公网出口。他们采用蚂蚁搬家式的数据迁移方法,一点一点把数据拷贝到异地数据中心。
  后来,随着数据迁移工作的逐步完成,腾讯存储网络的带宽压力明显缓解,成本也得到了有效控制。
  到了 2015 年左右,腾讯存储技术团队又迎来了一个新的问题——数据太多了。
  那时候,腾讯的数据总量逐渐到了 500PB 的量级。随着时间的推移,此前用户上传的大量数据,都成了冷数据。所谓冷数据,就是很少去读取的数据。
  这些冷数据占用了大量的存储空间,为了容灾,还进行多重备份,更加消耗资源。
  于是,存储技术团队就开始做分级存储。他们优化了系统的分布式存储架构,研发 BTFS 平台,把数据从三副本降到 1.33 份的纠删存储。他们将 QQ 相册、微云,邮件附件等产品中的历史数据放到 BTFS 里面去,以此来降低存储成本。
  除此之外,他们还在数据访问量不大的存储服务器上做虚拟化,利用空闲的 CPU 资源跑计算负载,例如图片的编解码等,充分提升资源的利用率。▉ 微信崛起,存储助力
  在 QQ 空间之后,腾讯 TFS 系统逐渐开始为 QQ、邮箱、微云等提供存储服务,成为整个腾讯的基础数据存储平台。
  2013 年,腾讯正式发布了微信,开启了新一轮的移动社交网络大战。微信的数据存储需求,同样依赖于 TFS 系统。
  用户使用微信,除了文字之外,还会发送海量的图片、音频、视频,甚至红包。这些操作全部离不开对存储系统的读写。发朋友圈也是一样,背后离不开存储系统的支持。
  2014 年的春节,用户数快速增长的微信,以及它背后的 TFS,迎来了一场载入中国互联网发展史册的大考——有史以来第一次的红包大战。这场大战当时有 800 万用户参与,业务团队和存储技术团队感受到了前所未有的压力。
  压力最大的时刻,就是大年三十晚上 12 点那个时间段,数以亿计的用户会发送祝福,造成井喷级的高并发数据读写需求。如果系统能力不足以应对,就会全面崩溃,影响用户体验,损害腾讯和微信在用户心中的形象,失去用户的信赖。
  为了应对这种情况,存储技术团队对系统进行了能力深度挖潜,竭尽全力将磁盘的读写能力开发到极致。与此同时,他们联合微信团队制定了各种柔性策略,开发了很多定制化的服务,也专门开发了服务于微信业务的系统。最终,他们承受住了考验,涉险过关。
  后来,到了 2015 年春节,微信月活跃用户达到 5 亿,激烈的红包大战再次打响。这次,积累了丰富经验的存储技术团队胸有成竹,交上了更完美的答卷。▉ 业务开放,发力 B 端
  随着腾讯存储系统的不断成熟,加之 2012 年之后逐渐开始的云计算趋势,腾讯开始考虑将 TFS 存储业务面向外部开放,服务第三方业务,争夺 B 端企业用户市场。
  初期腾讯云基于已有的存储访问接口和平台架构对外提供服务。经过一段时间的运营,腾讯云发现外部第三方业务在体验、可用性、成本等诸多运营方面有极高的要求。
  因此,为支撑云的需求场景,腾讯云对存储的接入层和索引层架构进行重构,架构扁平,模块精简。同时,腾讯云存储开始舍弃私有接口,转为兼容 AWS S3 接口与功能。
  重构后,存储架构的开放能力得到了进一步提升,支撑了腾讯云 COS(Cloud Object Storage)业务近几年的发展。
  在腾讯看来,对云的理解是不断加深的过程。他们认识到,仅有不错的存储平台并不够,必须深入研究各个行业的需求场景,提供功能、性能、质量和价格要求不同的服务,才能够获得用户的认可。▉ Yotta 问世,无限赋能
  2017 年,腾讯云的数据量突破一个 EB,成为腾讯存储历史上的一个标志性节点。
  为了应对未来云计算业务的挑战,腾讯存储团队开始了一个宏大的计划——启动全新的存储架构平台 YottaStore 的开发。
  最开始的时候,存储团队内部打算给新平台取名为 BlobStorage。Blob 的意思是一大块连续的二进制数据,像一个视频文件就是一个 Blob 数据。
  显然,这是大家印象中程序员的"正常操作",但最终这个名字被确定为 YottaStore。
  对于做存储的同学来说,经常会跟 GB、TB、PB、EB 这些概念打交道。现在全球互联网巨头公司的数据量基本都是在 EB 这个量级。EB 上面是 ZB,全球互联网巨头数据加起来也就几个 ZB。ZB 再往上,就是 YB,也就是 YottaByte。目前全世界所有的数据加起来,也不超过一个 YottaByte。
  毫无疑问,这个名字体现了腾讯对这个系统的期待,寄予了厚望。
  除了足够大之外,Yotta 的中文译名是 "有他",可以给人安全可靠放心的感觉。在腾讯内部,就有 "存储有他,能力无限"的说法。
  YottaStore 从 2018 年开始启动研发,2019 年正式上线,完全由腾讯自主研发完成。上线同年,就获得了公司级的业务突破奖。
  作为一个云存储系统,YottaStore 的能力可以说是非常强悍:
  集群规模
  YottaStore 是一个云原生的数据存储系统,这个系统的理论极限是一个集群可以管理超上千万台服务器。而要管理这上千万台的机器,元数据管理只需要用 600G 左右的空间,仅用一台机器就能存下索引结构,这在业界绝无仅有。
  资源利用率
  当集群规模非常大的时候,1% 的剩余空间量都非常大。所以,YottaStore 将硬盘利用率提升到很高的水平,配合实时回收机制,有效数据占比达 90% 以上。这在业界非常少见。
  另外,由于大集群的全集群均衡能力,服务器资源使用均衡,所以资源使用率也可以做得很高。服务器硬件可以最低位配置,所有尖峰流量在这个超大的池子里,波澜不惊。
  所以,无论是成本,还是服务能力,都很大程度受益于超大规模集群带来的红利。
  灵活性
  YottaStore 单集群可以零研发成本同时支持各种不同的冗余模式,像两副本、三副本、四副本、五副本,任意的 EC 编码,任意的 M、加任意的 N、任意的算法;单 AZ、双 AZ、多 AZ,也都可以灵活支持。
  另外,整个集群可以自适应各种各样不同的机型,包括 JBOD;各种硬盘介质,如磁带、HDD、SSD 等,存储的拓扑结构、混合部署也都可以任意指定。
  这样的灵活性在业界首屈一指。
  运营能力
  以存储节点迭代升级为例,十万百万规模的一个集群,上线升级速度都是一样的。如果是同构的数据格式,分钟级就可以完成整个升级过程。如果是异构的数据格式,集群可以在短时间内自动将数据格式透明收敛到最新版。
  可用性
  可用性达到 "数个 9"很容易,但是达到 100% 非常难。例如机房网络抖动,如果容错做的不够好,就很容易出现失败。
  YottaStore 开始上线大规模支撑业务的前三个月,一直维持 100% 的可用性。到现在一年半了,系统一直单人值周零故障运行,在业界是极少见的。
  成本控制
  基于前文所述的在超大规模集群和超高资源利用率上的技术突破,随着资源利用率的增高,YottaStore 的单位存储成本不断降低。
  磁盘容量扩大,单机磁盘数变多,密度增高,成本也随之降低。此外,CPU、网卡等新硬件的变化都会导致成本降低。
  针对海量小文件的用户场景,YottaStore 采用多种冗余和数据组织策略持续优化成本。
  综上所述,YottaStore 是一个拥有强大能力的超级存储架构平台。目前,YottaStore 已经全面上线并支撑腾讯内外部的存储业务,运行质量远超 SLA。
  基于 YottaStore 存储系统的腾讯云对象存储 COS 平台,正在为快手、OPPO、小红书、海康、猎豹、58 同城等几十多万个企业客户提供可靠的存储服务,整体数据量高达 EB 级别。▉ 结语
  回顾腾讯存储技术的整个发展历程,不由令人心生感慨。
  15 年前,腾讯存储团队成立的时候,一定不曾想到,自己会走过这么蜿蜒曲折的发展之路。
  他们不会想到,自己所在的公司会推出比 QQ 空间更爆款的产品,自己会面对更严峻的考验。
  他们不会想到,自己的使命,从服务内部,到服务外部,从服务 C 端,到服务 B 端,不断转变。
  他们不会想到,自己开发的存储系统,数据体量规模竟然会从 PB 到 EB,覆盖全球范围内 30 多个 region,拥有上万台服务器。
  他们不会想到,自己所在的团队,会成为整个公司的 "黄埔"军校,走出了无数的技术专家和管理干部。
  时代就是这样,前进的步伐太快,永远超出常人的想象。
  能够拥有这样的成绩并非偶然。成绩的背后,既离不开他们对用户需求的精准把握,也离不开对产品性能的极致挖潜,更离不开对技术梦想的执着追求。
  存储的战争还没有结束,只是进入了一个新的阶段。
  未来,有新的挑战在等待着他们。也有新的机遇,在召唤着他们。再过 15 年,又会发生什么样的故事?不如让时间来告诉我们答案吧。

运营商Orange副CEO支持与华为5G合作在供应链中仍占重要地位Orange副首席执行官最近被任命为除法国之外欧洲业务负责人的玛丽诺埃尔杰戈拉维西埃尔(MariNoelleJegoLaveissiere)坚称,华为仍是该公司在欧洲大陆的主要合作华为发布全新机器人流程自动化产品可721524小时不间断运行IT之家12月10日消息在月初举行的技术服务伙伴大会上,华为发布了机器人流程自动化AntRobotRPA2。0(RoboticProcessAutomation,机器人流程自动化)华为运动健康科学实验室官宣,将于明日在西安举办开放日IT之家12月9日消息昨日华为多个官方账号在微博发布海报,暗示重磅新成员将入驻华为。今天华为官方宣布,华为运动健康科学实验室正式亮相,将于12月10日在西安举办开放日活动。根据此前金士顿HyperXPulsefireHaste游戏鼠标发布搭载TTC防尘金微动,重量仅为59gIT之家12月5日消息金士顿旗下的电竞品牌HyperX近日发布了其首款洞洞鼠PulsefireHaste,该鼠标为了减轻重量采用了双面打孔镂空设计,其不含线质量仅为59g,相比传统当年意气风发单挑微软的他们,现在却无奈投奔巨头四年前,他们还是硅谷最炙手可热的行业新宠,意气风发地要单挑巨人微软一年前,他们还对前景充满自信,抛开华尔街选择了最不寻常的上市道路。然而,在新冠疫情带来的巨大机遇面前,本该得天独厚因收集信息,法国罚谷歌1亿欧元罚亚马逊3500万12月10日,法国数据隐私监管机构CNIL周四表示,对Alphabe公司旗下谷歌处以1亿欧元(约合1。21亿美元)的罚款处罚,原因是谷歌的搜索引擎在管理Cookie网络跟踪功能方面亚马逊AWS将成立新的亚太地区部门,选址澳大利亚墨尔本据报道,AWS宣布将在澳大利亚开设第二个基础设施区域。新的AWS亚太(墨尔本)区域计划在2022年下半年开放,将由三个可用区组成。截止目前,AWS在亚太地区共有8个区域,位于澳大利吃下苹果,全球第一的亚马逊AWS依然不敢放松全球第一的云计算平台的大会,今年也上云了。2020年12月2日凌晨,亚马逊reInvent全球大会正式开启。不同于以往七届大会,今年不但是亚马逊有史以来首次在线上举办reInven亚马逊云计算业务CEO目前全球仅4企业使用云计算服务TechWeb12月7日消息,据国外媒体报道,云计算在近几年快速发展,亚马逊谷歌阿里巴巴等云计算业务的营收,持续增长,其中亚马逊云计算业务的营收已连续3个季度超过100亿美元。而从世界最大的多人在线创作游戏平台Roblox将在明年进行IPO据报道,内部备忘录显示,美国游戏平台Roblox已将IPO计划推迟至明年,因为该公司正在与顾问合作以改善员工和投资者的利益。Roblox首席执行官戴维巴斯祖基(DavidBaszu美国科技公司上市步伐加快,10大科技公司IPO今年占3席就融资额而言,美国10大科技IPO(首次公开招股)中,有3个是今年发生的,其中本周就发生了两个。12月9日和10日,DoorDash和Airbnb分别开始上市交易。此外,软件销售商
华中科技大学与华为签署战略合作协议IT之家5月23日消息昨日,华中科技大学在官方微信公众号宣布,已于月初与华为签署了战略合作协议。双方将进一步深化在人才培养科学研究成果转化等方面的合作。华为公司董事战略研究院院长徐ZAO更新用户协议,删除可免费使用用户肖像权条款IT之家9月5日消息日前,在用户协议条款引发大量争议后,AI换脸AppZAO更新了隐私协议以及用户协议。新版用户协议删除可免费使用用户肖像权条款。在新版协议中,受争议的授予ZAO及TCL华星发布全球首款MLED星曜屏IT之家8月31日消息昨日,TCL华星在深圳正式发布全球首款MLED星曜屏。据介绍,新品采用全新AMMiniLED技术,在HDR亮度能耗对比度边框等方面具有优势,拥有1000nitTCL电子公布上半年财报电视机出货量稳居全球第二IT之家8月29日消息TCL电子(01070。HK)现已公布了上半年财报,财报显示TCL电子全球电视机整体销售量再创新高达1,553万台,出货量市占率达14。3,稳居全球前二。根据联想quot老兵quot陈劲回归,出任联想中国区手机业务总经理9月4日晚间消息,联想中国区今日确定陈劲加入联想中国区消费事业部,任中国区手机业务部总经理一职,向中国区消费业务副总裁张华汇报。联想A6Note陈劲曾担任联想手机业务的营销负责人,vivo否认布局自研芯片,年底将首发与三星合作的5G芯片凤凰网科技讯(作者刘正伟)9月23日消息,vivo执行副总裁胡柏山今天下午在东莞接受凤凰网科技采访表示,vivo从一年多以前开始规划深入到手机SoC的定义当中,今年年底会有产品首发三星遭澳洲监管机构起诉,因夸大手机防水功能北京时间4日消息,澳大利亚公平竞争和消费者委员会(ACCC)对三星电子澳大利亚子公司提起诉讼,指控该公司在广告中夸大Galaxy智能手机的防水功能,吹嘘能在游泳和冲浪时使用,涉嫌误支柱业务芯片供应过剩,三星第二季度营业利润或暴跌50北京时间7月3日消息,数据显示,随着三星电子面向华为的存储芯片出货量下降加剧了价格挤压导致的供应过剩情况,当三星在周五发布第二季度初步业绩时,该公司很可能预计第二季度营业利润下降5英国Three正逐步将三星设备替换为华为设备飞象网讯ThreeUK正在剥离三星的4G无线设备,并从华为引进设备,以确保其4G和5G网络之间具有互操作性。这家运营商运营着英国4个移动网络中最小的一个,在4G时代转向三星之前,曾三星Exynos标识更新升级为X型点阵新标识IT之家6月25日消息三星Exynos官网今日更新了Exynos标识,更新为X型点阵新标识。三星官方表示,新的品牌符号由相互连接的方点组成,每个点代表一种先进的新技术,点阵网络展示三星崔元俊5G技术持平华为爱立信,5G终端领先苹果至少一年IT之家6月25日消息据外媒消息,在韩国科技情报通信部主办的KRnet2019会议上,三星电子无线事业部专务崔元俊就5G方面的相关问题发表了自己的看法。崔元俊表示,在5G网络技术上