详情介绍
TDW是腾讯最大的离线数据处理平台。本文主要从需求、挑战、方案和未来计划等方面,介绍了TDW在建设单个大规模集群中采取的JobTracker分散化和NameNode高可用两个优化方案。
TDW(Tencent distributed Data Warehouse,腾讯分布式数据仓库)基于开源软件Hadoop和Hive进行构建,打破了传统数据仓库不能线性扩展、可控性差的局限,并且根据腾讯数据量大、计算复杂等特定情况进行了大量优化和改造。
腾讯大规模Hadoop集群实践
TDW服务覆盖了腾讯绝大部分业务产品,单集群规模达到4400台,CPU总核数达到10万左右,存储容量达到100PB;每日作业数100多万, 每日计算量4PB,作业并发数2000左右;实际存储数据量80PB,文件数和块数达到6亿多;存储利用率83%左右,CPU利用率85%左右。经过四年 多的持续投入和建设,TDW已经成为腾讯最大的离线数据处理平台。
TDW(Tencent distributed Data Warehouse,腾讯分布式数据仓库)基于开源软件Hadoop和Hive进行构建,打破了传统数据仓库不能线性扩展、可控性差的局限,并且根据腾讯数据量大、计算复杂等特定情况进行了大量优化和改造。
腾讯大规模Hadoop集群实践
TDW服务覆盖了腾讯绝大部分业务产品,单集群规模达到4400台,CPU总核数达到10万左右,存储容量达到100PB;每日作业数100多万, 每日计算量4PB,作业并发数2000左右;实际存储数据量80PB,文件数和块数达到6亿多;存储利用率83%左右,CPU利用率85%左右。经过四年 多的持续投入和建设,TDW已经成为腾讯最大的离线数据处理平台。
下载地址
下载错误?【投诉报错】
人气书籍
下载声明
☉ 解压密码:www.jb51.net 就是本站主域名,希望大家看清楚,[ 分享码的获取方法 ]可以参考这篇文章
☉ 推荐使用 [ 迅雷 ] 下载,使用 [ WinRAR v5 ] 以上版本解压本站软件。
☉ 如果这个软件总是不能下载的请在评论中留言,我们会尽快修复,谢谢!
☉ 下载本站资源,如果服务器暂不能下载请过一段时间重试!或者多试试几个下载地址
☉ 如果遇到什么问题,请评论留言,我们定会解决问题,谢谢大家支持!
☉ 本站提供的一些商业软件是供学习研究之用,如用于商业用途,请购买正版。
☉ 本站提供的腾讯大规模HADOOP集群实践 中文PDF版资源来源互联网,版权归该下载资源的合法拥有者所有。














![数学之美(第二版) PDF扫描版[45MB]](http://img.jbzj.com/do/uploads/litimg/150709/1616142R204.png)
![计算机组成原理(第2版)(唐朔飞著) PDF扫描版[9MB]](http://img.jbzj.com/do/uploads/litimg/141021/16131RTZ4.png)

![计算机组成与体系结构:性能设计(原书第8版) 中文 PDF版 [93M]](http://img.jbzj.com/do/uploads/litimg/120924/145340161941.jpg)

![算法导论(原书第3版) PDF扫描版[101MB]](http://img.jbzj.com/do/uploads/litimg/150625/1AQHR033.png)
![大话设计模式 程杰 著 中文 PDF版 [70M]](http://img.jbzj.com/do/uploads/litimg/120917/151555161064.jpg)

![Docker技术入门与实战 完整版 pdf扫描版[47MB]](http://img.jbzj.com/do/uploads/litimg/160621/1G9222H5b.jpg)
