china-pub  
您的位置:china-pub网上书店 > 计算机 > Hadoop权威指南类图书

Hadoop权威指南类图书

互动出版网为您真诚推荐数据库存储与管理书籍:Hadoop权威指南等

《Hadoop权威指南(第2版)》

   《hadoop权威指南(第2版)》从hadoop的缘起开始,由浅入深,结合理论和实践,全方位地介绍hadoop这一高性能处理海量数据集的理想工具。全书共16章,3个附录,涉及的主题包括:haddoop简介;mapreduce简介;hadoop分布式文件系统;hadoop的i/o、mapreduce应用程序开发;mapreduce的工作机制;mapreduce的类型和格式;mapreduce的特性;如何构建hadoop集群,如何管理hadoop;pig简介;hbase简介;hive简介;zookeeper简介;开源工具sqoop,最后还提供了丰富的案例分析。
  《hadoop权威指南(第2版)》是hadoop权威参考,程序员可从中探索如何分析海量数据集,管理员可以从中了解如何安装与运行hadoop集群。畅销书。
   google帝国的基石是什么?mapreduce算法!开源项目hadoop作为它的一个具体实现,可以轻松用于构建和维护一个可靠性高、伸缩性强的分布式系统。
  作者tomwhite作为hadoop的项目负责人,通过自己对hadoop和hadoop社区的理解,化繁为简,用浅显易懂的语言介绍了hadoop能做什么,怎么做才能充分发挥hadoop的优势,hadoop能够和哪些开源工具结合使用。这是一本主题丰富、讲解透彻的权威参考书,可帮助程序员了解分析海量数据集的细枝末节,帮助管理员掌握搭建和运行hadoop集群的具体过程。
  经过修订和更新的第2版概述了hadoop的最新动态,例如hive、sqoop和avro等。书中还提供了案例分析来帮助读者了解如何用hadoop来解决具体的问题。如果想充分利用数据,从中挖掘出有价值的见解或者观点,毫无疑问,这本书将是您不可或缺的重要参考。
  使用hadoop分布式文件系统(hdfs)来存储大型数据集,然后用mapreduce对这些数据集执行分布式计算
   hadoop的数据和i/o构建块(用子压缩、数据完整性、序列化和持久处理)
  探究mapreducc应用开发中常见的陷阱和高级特性
  设计,构建和管理门adoop专用集群或在云上运行hadoop
  使用pig这种高级的查询语言来进行大规模数据处理
  使用hive(hadoop的数据仓库系统)来分析数据集
  使用hbase(hadoop的数据库)来处理结构化数据和半结构化数据
  深入介绍zookeeper,一个用子构建分布式系统的协作类型工具箱

《Hadoop 权威指南》(英文影印版第3版修订版)

  《hadoop 权威指南(英文影印版第3版修订版)》内容简介:准备好释放数据的力量了吗?在这本全面的指南中,你将学会运用apache hadoop构建和维护可靠、可伸缩的分布式系统。对于寻求分析任意规模数据集的程序员和想要安装并运行hadoop集群的管理员来说,本书是理想的参考读物。
  你可以在本图书中找到富有启发意义的实际案例分析,它们展示了hadoop用于解决特定问题的各种方式。第三版涵盖了hadoop近期更新内容,包括新的mapreduce api相关资料,还有mapreduce 2及其更加灵活的执行模型(yarn)。
  使用hadoop分布式文件系统(hdfs)保存大数据
  使用mapreduce运行分布式计算
  使用hadoop的数据和i/o构件实现压缩、数据完整性、序列化(包括avro)和持久化
  了解常见的陷阱和高级特性,以编写实用的mapreduce程序
  设计、构建和管理专用的hadoop集群——或者在云中运行hadoop
  使用sqoop从关系型数据库载人数据到hdfs
  使用pig查询语言进行大规模数据处理
  使用hadoop的数据仓库系统hive分析数据集
  利用hbase处理结构化和半结构化数据,以及利用zookeeper构建分布式系统

《Hadoop权威指南(英文影印版)(第二版 修订版)》

  揭示了apache hadoop如何为你释放数据的力量。这本内容全面的书籍展示了如何使用hadoop架构搭建和维护可靠、可伸缩的分布式系统。hadoop架构是mapreduce算法的一种开源应用,是google开创其帝国的重要基石。程序员可从中探索如何分析海量数据集,管理员可以了解如何建立与运行hadoop集群。
  《hadoop权威指南(英文影印版)(第二版 修订版)》涵盖了hadoop最近的更新,包括诸如hive、sqoop和avro之类的新特性。它也提供了案例学习来展示hadoop如何解决特殊问题。期待尽情享受你的数据?这就是你要的书。
   ·使用hadoop分布式文件系统(hdfs)来存储海量数据集,通过mapreduce对这些数据集运行分布式计算
   ·熟悉hadoop的数据和i/o构件,用于压缩、数据集成、序列化和持久处理
   ·洞悉编写mapreduce实际应用程序时的常见陷阱和高级特性
   ·设计、构建和管理专用的hadoop集群或在云上运行hadoop
   ·使用pig这种高级的查询语言来处理大规模数据
   ·使用hive、hadoop的数据仓库系统来分析数据集
   ·利用hbase这个hadoop数据库来处理结构化和半结构化数据
   ·学习zookeeper,这是一个用于构建分布式系统的协作原语工具箱

分享到:
上一篇:Hadoop数据库存储与管理类图书
下一篇:(特价书)Hadoop实战

推荐图书频道