千锋教育-做有情怀、有良心、有品质的职业教育机构
Hive作业的运行,资源调度是YARN,数仓存储是HDFS,他们两个都是分布式的集群。 对于Hive你可以简单理解成就是负责将你的SQL转换为MR,当然也提供元数据管理(metastore),我们使用Hive时只需要一个客户端即可,对于Hive MetaStore和HiveServer2服务,可以构建一个高可用的(HA)。
因此这个问题Hive 需要有搭建集群的必要吗?答案是不需要,再看一下Hive的架构你会更加理解。
相关推荐