内容详情

(点击获取校区地址)

来源：成都软件设计培训机构时间：2018/12/18 11:39:14

大数据技术分享Hadoop的相关工具

大数据技术分享Hadoop的相关工具，在成都学习大数据就到成都课程工程大数据培训学校，成都课工场专注大数据培训，大数据培训课程根据企业需求与时俱进，课程体系涵盖理论+实践课程阶段，全力培养大数据开发人才。

1.Hadoop

Apache的Hadoop项目已几乎与大数据划上了等号。它不断壮大起来，已成为一个完整的生态系统，众多开源工具面向高度扩展的分布式计算。

2.Ambari

作为Hadoop生态系统的一部分，这个Apache项目提供了基于Web的直观界面，可用于配置、管理和监控Hadoop集群。有些开发人员想把Ambari的功能整合到自己的应用程序当中，Ambari也为他们提供了充分利用REST(代表性状态传输协议)的API。

3.Avro

这个Apache项目提供了数据序列化系统，拥有丰富的数据结构和紧凑格式。模式用JSON来定义，它很容易与动态语言整合起来。

4.Cascading

Cascading是一款基于Hadoop的应用程序开发平台。提供商业支持和培训服务。

5.Chukwa

Chukwa基于Hadoop，可以收集来自大型分布式系统的数据，用于监控。它还含有用于分析和显示数据的工具。

6.Flume

Flume可以从其他应用程序收集日志数据，然后将这些数据送入到Hadoop。网站声称：“它功能强大、具有容错性，还拥有可以调整优化的可靠性机制和许多故障切换及恢复机制。”

7.HBase

HBase是为有数十亿行和数百万列的超大表设计的，这是一种分布式数据库，可以对大数据进行随机性的实时读取/写入访问。它有点类似谷歌的Bigtable，不过基于Hadoop和Hadoop分布式文件系统(HDFS)而建。

8.Hadoop分布式文件系统（HDFS）

HDFS是面向Hadoop的文件系统，不过它也可以用作一种独立的分布式文件系统。它基于Java，具有容错性、高度扩展性和高度配置性。

9.Hive

Apache Hive是面向Hadoop生态系统的数据仓库。它让用户可以使用HiveQL查询和管理大数据，这是一种类似SQL的语言。

10.Hivemall

Hivemall结合了面向Hive的多种机器学习算法。它包括诸多高度扩展性算法，可用于数据分类、递归、推荐、k较近邻、异常检测和特征哈希。

11.Mahout

据网站声称，Mahout项目的目的是“为迅速构建可扩展、高性能的机器学习应用程序打造一个环境。”它包括用于在Hadoop MapReduce上进行数据挖掘的众多算法，还包括一些面向Scala和Spark环境的新颖算法。

12.MapReduce

作为Hadoop一个不可或缺的部分，MapReduce这种编程模型为处理大型分布式数据集提供了一种方法。它较初是由谷歌开发的，但现在也被本文介绍的另外几个大数据工具所使用，包括CouchDB、MongoDB和Riak。

13.Oozie

这种工作流程调度工具是为了管理Hadoop任务而专门设计的。它能够按照时间或按照数据可用情况触发任务，并与MapReduce、Pig、Hive、Sqoop及其他许多相关工具整合起来。

14.Pig

Apache Pig是一种面向分布式大数据分析的平台。它依赖一种名为Pig Latin的编程语言，拥有简化的并行编程、优化和可扩展性等优点。

15.Sqoop

企业经常需要在关系数据库与Hadoop之间传输数据，而Sqoop就是能完成这项任务的一款工具。它可以将数据导入到Hive或HBase，并从Hadoop导出到关系数据库管理系统(RDBMS)。

16.Spark

作为MapReduce之外的一种选择，Spark是一种数据处理引擎。它声称，用在内存中时，其速度比MapReduce较多快100倍;用在磁盘上时，其速度比MapReduce较多快10倍。它可以与Hadoop和Apache Mesos一起使用，也可以独立使用。

17.Tez

Tez建立在Apache Hadoop YARN的基础上，这是“一种应用程序框架，允许为任务构建一种复杂的有向无环图，以便处理数据。”它让Hive和Pig可以简化复杂的任务，而这些任务原本需要多个步骤才能完成。

18.Zookeeper

这种大数据管理工具自称是“一项集中式服务，可用于维护配置信息、命名、提供分布式同步以及提供群组服务。”它让Hadoop集群里面的节点可以彼此协调。

领取试听课

温馨提示：为不影响您的学业，来校区前请先电话或QQ咨询，方便我校安排相关的专业老师为您解答

详情请进入成都软件设计培训机构
咨询电话：4000336029
QQ咨询：739910946

上一篇:很多培训学校为何将Java大数据作为重点培训课
下一篇:大数据已渗透到人类生活

在线客服为您服务

在线咨询

内容详情

(点击获取校区地址)

来源：成都软件设计培训机构时间：2018/12/18 11:39:14

大数据技术分享Hadoop的相关工具

目录导航

Java工程师

大数据培训

NET工程师

UI设计师

软件开发

游戏开发

软件测试

HTML5

景观设计

平面设计

室内设计

学校动态更多>>

内容详情 (点击获取校区地址) 来源：成都软件设计培训机构 时间：2018/12/18 11:39:14

大数据技术分享Hadoop的相关工具

目录导航

学校动态更多>>

内容详情

(点击获取校区地址)

来源：成都软件设计培训机构时间：2018/12/18 11:39:14