HIVE 搭建实战 Hive是基于Hadoop的一个数据仓库,将SQL语句转换为MapReduce任务来执行,是一个非实时、批处理工具。 2019-07-19 Linux Hadoop生态 大数据 Hive
Hadoop HA(高可用)分布式搭建实战 Hadoop是一个分布式系统基础架构,包含了一个分布式计算框架(MapReduce)和一个分布式文件系统(HDFS)。高可用分布式是级别较高的一种集群方式,也是在生产环境中最常用的一种方式。 2019-07-13 Linux Hadoop生态 Hadoop 大数据 Hadoop高可用分布式
Hadoop全分布式搭建实战 Hadoop是一个分布式系统基础架构,包含了一个分布式计算框架(MapReduce)和一个分布式文件系统(HDFS)。全分布式是级别较低的一种集群方式。 2019-07-04 Linux Hadoop生态 Hadoop 大数据 Hadoop全分布式
Hadoop本地伪分布式搭建实战 Hadoop是一个分布式系统基础架构,包含了一个分布式计算框架(MapReduce)和一个分布式文件系统(HDFS)。本地伪分布式是提供给开发者在本地测试应用程序的一种搭建模式,不推荐在生产环境中使用这种搭建方式。 2019-06-29 Linux Hadoop生态 Hadoop 大数据 Hadoop伪分布式
Zookeeper集群搭建实战 Zookeeper是一个是开源的分布式应用协调系统,是一个简单、快速、高性能的协调器。它在CAP模型中,选择了CP(一致性、分区容错性)。 2019-06-26 Linux Hadoop生态 Hadoop 大数据 Zookeeper
什么是YARN(MRv2) MRv2的基本思想是将JobTracker的两个主要功能,资源管理和作业调度/监视拆分成两个单独的守护进程。 2019-05-24 Linux Hadoop生态 Hadoop 大数据 YARN MRv2
Hadoop生态常见端口 在学习过程中遇到了一些组件,这里将他们的端口号和对应的功能记录下来,将来可能会用得到。 2019-05-22 Linux Hadoop生态 Hadoop 大数据 Hadoop生态端口