Hadoop概述
Hadoop 是一个由 Apache 基金会所开发的 分布式系统基础架构 。主要解决,海量数据的 存储 和海量数据的 分析计算 问题。广义上来说, Hadoop 通常是指一个更广泛的概念 —— Hadoop 生态圈 。
Hadoop优势
高可靠性:Hadoop底层维护多个数据副本,所以即使Hadoop某个计算元素或存储出现故障,也不会导致数据的丢失。
高扩展性:在集群间分配任务数据,可方便的扩展数以干计的节点。
高效性:在MapReduce的思想下,Hadoop是并行工作的,以加快任务处理速度。
高容错性:能够自动将失败的任务重新分配。