当前位置：首页 > news >正文

【大数据分布并行处理】单元测试（三）

news 来源：原创 2024/5/13 3:00:51

文章目录

第三单元
- 单选题
- 多选题

第三单元

单选题

HDFS的命名空间不包含：
A. 块
B. 目录
C. 字节
D. 文件
正确答案： C
对HDFS描述错误的是:
A. HDFS是一个开源框架
B. 2004年，Doug Cutting发布了第一个版本HDFS
C. HDFS是 Hadoop大数据生态系统的底层核心子项目
D. HDFS通过构建在普通PC设备上的集群环节，以较低成本完成大规模数据存储任务
正确答案： B
‏采用多副本冗余存储的优势不包含：
A. 容易检查数据错误
B. 节约存储空间
C. 加快数据传输速度
D. 保证数据可靠性
正确答案： B
分布式文件系统HDFS采用了主从结构模型，由计算机集群中的多个节点构成的，这些节点分为两类，一类存储元数据叫 ____ ，另一类存储具体数据叫 ____：
A. 名称节点，主节点
B. 名称节点，数据节点
C. 从节点，主节点
D. 数据节点，名称节点
正确答案： B
下面关于分布式文件系统HDFS的描述正确的是：
A. 分布式文件系统HDFS是一种关系型数据库
B. 分布式文件系统HDFS比较适合存储大量零碎的小文件
C. 分布式文件系统HDFS是谷歌分布式文件系统GFS（Google File System）的一种开源实现
D. 分布式文件系统HDFS是Google Bigtable的一种开源实现
正确答案： C
‍分布式文件系统HDFS 中的 block 默认保存几份？
A. 1份
B. 2份
C. 3份
D. 不确定
正确答案： C
‍HDFS是基于流数据模式访问和处理超大文件的需求而开发的，具有高容错、高可靠性、高可扩展性、高吞吐率等特征，适合的读写任务是？
A. 一次写入，少次读取
B. 多次写入，少次读取
C. 一次写入，多次读取
D. 多次写入，多次读取
正确答案： C
下列关于HDFS说法不正确的是？
A. 适合大数据的处理
B. 不适合处理低延迟数据访问
C. 支持多用户写入和追加文件内容
D. 无法高效存储大量小文件
正确答案： C
下列关于HDFS目标描述不正确的是:
A. 运行在低廉的商用硬件集群上，出现故障能继续运行，不让用户察觉到中断
B. 移动数据比移动计算代价低，移动数据到计算附近
C. 支持大规模文件存储
D. 对文件实行一次写入，多次读取的访问模式
正确答案： B
‍下述关于HDFS体系结构描述不正确的是？
A. 名称节点负责管理文件系统的命名空间及客户端对文件的访问
B. NameNode负责文件元数据的操作，DataNode负责处理文件内容的读写请求
C. 读取文件时，NameNode让用户随机读取DataNode中的一个副本
D. 副本存放在哪些DataNode上由NameNode来控制，根据全局情况做出块放置决定
正确答案： C
HDFS首先把大数据文件拆分成若干个小的数据块，再把这些数据块写入到不同的节点上，这些负责保存文件数据的节点被称为？
A. NameNode
B. DataNode
C. SecondaryNameNode
D. Block
正确答案： B
Hadoop与HDFS文件系统交互的API是一个抽象类，该类只能通过自身的get方法得到具体实现类的实例对象，这个抽象类是？
A. Configuration类
B. FileSystem类
C. Path类
D. InputStream类
正确答案： B
NameNode的Web界面默认占用哪个端口号？
A. 18088
B. 18030
C. 50070
D. 18040
正确答案： C
HDFS的错误检测不包括？
A. NameNode错误检测
B. DataNode错误检测
C. 数据块错误检测
D. 数据块冗余检测
正确答案： D
下面与HDFS类似的框架是？
A. HBase
B. NTFS
C. BigTable
D. GFS
正确答案： D
下列关于配置机架感知的相关描述哪项不正确：
A. 如果一个机架出问题，不会影响数据读写和正确性
B. 写入数据的时候多个副本会写到不同机架的 DataNode 中
C. MapReduce 会根据机架的拓扑获取离自己比较近的数据块
D. 数据块的第一个副本会优先考虑存储在客户端所在节点
正确答案： B
下列命令可以显示出HDFS文件系统中/user/root/目录情况的是：
A. hdfs dfs -dir /user/root/
B. hdfs dfs -ls /user/root/
C. hadoop fs -cat /user/root/
D. hdfs dfs -display /user/root/
正确答案： B
以下命令可以将HDFS文件系统/user/root/目录下word.txt文件下载到本地/opt目录的是：
A. hdfs dfs -put /user/root/word.txt /opt
B. hdfs dfs -get /user/root/word.txt /op
C. hdfs dfs -cp /user/root/word.txt /op
D. hdfs dfs -mv /user/root/word.txt /op
正确答案： B
HDFS集群中的NameNode职责不包括：
A. 维护HDFS集群的目录树结构
B. 维护HDFS集群的所有数据块的分布、副本数和负载均衡
C. 负责保存客户端上传的数据
D. 响应客户端的所有读写数据请求
正确答案： C
在HDFS中，put命令用于：
A. 将文件或者目录从本地文件系统拷贝到HDFS
B. 将文件从HDFS拷贝到本地文件系统
C. 将文件或目录从HDFS拷贝到本地文件系统
D. 将文件从本地文件系统拷贝到HDFS
正确答案： A

多选题

以下对数据节点理解正确的是:
A. 数据节点用来存储具体的文件内容
B. 每个数据节点的数据实际上保存在本地Linux文件系统中
C. 数据节点在名称节点的统一调度下进行数据块的创建、删除和复制等操作
D. 数据节点向名称节点定期发送自己所存储的块的列表。
正确答案： ABCD
你的作答： ABCD
下列关于名称节点描述正确的是:
A. 名称节点保存了两个核心的数据结构：FsImage和EditLog
B. FsImage包含 Hadoop 文件系统中的所有目录和文件元数据信息和文件块位置的信息。
C. EditLog存放的是 Hadoop 文件系统的所有更改操作（文件创建，删除或修改）的日志
D. 文件系统客户端执行的更改操作首先会被记录到 FsImage文件中
正确答案： AC
下列关于第二名称节点描述正确的是：
A. 第二名称节点就是用来解决名称节点运行期间EditLog不断变大的问题
B. 第二名称节点实现的是热备份
C. 第二名称节点主要用于同步元数据信息，辅助名称节点对FsImage和EditLog进行合并
D. 当第二名称节点将FsImage和EditLog复制之后，名称节点会生成一个新的操作日志文件EditLog.new,FsImage和EditLog合并完成之后，原有EditLog删除，EditLog.new重命名为EditLog
正确答案： ACD
下列关于SecondaryNameNode描述不正确的是：
A. 它是名称节点的热备
B. 它对内存没有要求
C. 它的任务是帮助NameNode合并编辑日志，减少NameNode的启动时间
D. SecondNameNode与NameNode部署在同一个节点上
正确答案： ABD
下列关于HDFS运行原理描述正确的是：
A. HDFS采用一种称为机架感知的策略来改进数据的可靠性、可用性和网络带宽的利用率
B. 心跳机制是每隔一段时间连接一次的机制
C. 同一个机架内的两台机器间的带宽会比不同机架的两台机器间的带宽小
D. HDFS支持数据均衡策略，如果某个数据节点上的空闲空间低于特定的临界点，按照均衡策略系统自动地将数据从这个数据节点移动到其他空闲的数据节点
正确答案： ABD