【大数据 复习】第9章 数据仓库分析工具Hive
创始人
2025-01-16 10:38:09
0

一、概念

1.概述

(1)Hive是一个构建于Hadoop顶层的数据仓库工具。数据仓库只用于分析数据,以及输出分析结果。

(2)某种程度上可以看作是用户编程接口,本身不存储和处理数据。

(3)依赖分布式文件系统HDFS存储数据。

(4)依赖分布式并行计算模型MapReduce处理数据。

(5)定义了简单的类SQL 查询语言——HiveQL,用户可以通过编写的HiveQL语句运行MapReduce任务。

(6)Hive需要把HiveQL语句转换成MapReduce任务进行运行。

2.联系:

(1)Hive依赖于HDFS 存储数据。

(2)Hive依赖于MapReduce 处理数据。

(3)Pig可以作为Hive的替代工具。

        pig是一种数据流语言和运行环境,适合用于查询半结构化数据集。

        常用于ETL过程的一部分,即将外部数据装载到Hadoop集群中,然后转换为用户期待的数据格式。

(4)HBase 提供数据的实时访问,而Hive只能处理静态数据,主要是BI报表数据,所以HBase与Hive的功能是互补的。

3.Hive与传统数据库的对比

4.Hive组成模块

(1)用户接口模块

(2)驱动模块:包括编译器、优化器、执行器等。

(3)元数据存储模块(Metastore):是一个独立的关系型数据库,通常是与MySQL数据库连接后创建的一个MySQL实例,也可以是Hive自带的derby数据库实例。

二、习题

1.判断题 (1分)

Hive中的元数据存储模块是一个独立的关系型数据库。( )

正确答案: 正确

2.判断题 (1分)

Hive需要把HiveQL语句转换成MapReduce任务进行运行。( )

正确答案: 正确

3.判断题 (1分)

传统的数据库提供分区功能来改善大型表以及具有各种访问模式的表的可伸缩性,可管理性和提高数据库效率。Hive不支持分区功能,不使用分区使用索引可以加快数据的查询速度。( )

正确答案: 错误

Hive支持分区功能

4.判断题 (1分)

Hive同时支持导入单条数据和批量数据。( )

正确答案: 错误

支持分区是指将表中的数据根据某些列的值进行分割存储,以提高查询效率。

5.判断题 (1分)

Hive是一个构建于Hadoop顶层的数据仓库工具,本身不存储和处理数据。( )

正确答案: 正确

相关内容

热门资讯

相较于以往!闲聚鱼虾蟹软件脚本... 相较于以往!闲聚鱼虾蟹软件脚本辅助器(辅助挂)原来真的有挂(分享开挂辅助下载)-哔哩哔哩一、闲聚鱼虾...
出乎意料的是!欢乐掌心辅助(辅... 出乎意料的是!欢乐掌心辅助(辅助挂)一贯有挂(了解开挂辅助下载)-哔哩哔哩进入游戏-大厅左侧-新手福...
迎来新发展!枫叶辅助官网下载(... 迎来新发展!枫叶辅助官网下载(辅助挂)果然真的有挂(曝光开挂辅助下载)-哔哩哔哩1、迎来新发展!枫叶...
截至发稿!七千在线辅助(辅助挂... 截至发稿!七千在线辅助(辅助挂)一贯真的有挂(传授开挂辅助神器)-哔哩哔哩1、七千在线辅助透视辅助简...
迎来新发展!超级三加一辅助工具... 迎来新发展!超级三加一辅助工具安装(辅助挂)一贯是有挂的(实测开挂辅助工具)-哔哩哔哩1、每一步都需...
在玩家背景下!雀友会免费自动挂... 在玩家背景下!雀友会免费自动挂机脚本(辅助挂)原来真的有挂(通报开挂辅助软件)-哔哩哔哩1、每一步都...
反观!上品游戏辅助器(辅助挂)... 您好,上品游戏辅助器这款游戏可以开挂的,确实是有挂的,需要了解加去威信【136704302】很多玩家...
记者获悉!随意玩透视辅助软件(... 记者获悉!随意玩透视辅助软件(辅助挂)原来确实有挂(细节开挂辅助安装)-哔哩哔哩1)随意玩透视辅助软...
现有关情况通报如下!鸿狐辅助开... 现有关情况通报如下!鸿狐辅助开挂透视(辅助挂)一直真的有挂(盘点开挂辅助脚本)-哔哩哔哩1、任何鸿狐...
据通报!起点休闲辅助(辅助挂)... 据通报!起点休闲辅助(辅助挂)一直有挂(通报开挂辅助下载)-哔哩哔哩;据通报!起点休闲辅助(辅助挂)...