skystar 发表于 2021-3-17 14:26:07

[南开大学]20春学期《大数据开发技术(一)》在线作业(答案100分)


-[南开大学]20春学期(1709、1803、1809、1903、1909、2003)《大数据开发技术(一)》在线作业
试卷总分:100    得分:100# d/ @& z1 v- w
第1题,Modest Maps是哪种可视化工具()) f8 z: ]& V6 l2 |* c
A、信息图表8 \( Q" TP+ M' V, H+ @
B、地图工具
C、时间线工具
D、分析工具
正确答案:


第2题,UMP系统借助于()来实现分布式数据库服务1 j5 z& b- Z" ~( u! I( j. R
A、Mnesia
B、LVS2 G$ h, L$ l0 j# r% a6 T
C、RabbitMQ7 j, t0 s, t]0 }
D、Zookeeper
正确答案:
. V& o2 E$ K' h, ?/ I

第3题,Hbase中采用()保证系统出错时及时恢复
A、MemStore- s0 L7 z' d# X+ |% z8 T
B、Hlog
C、StoreFile
D、客户端
正确答案:


第4题,以下亚马逊的产品中哪个是数据仓库
A、ElastiCache
B、RDS
C、DynamoDB
D、Redshift) u/ ~. M; p$ d) x1 f4 c4 ~
正确答案

4 ^- [; h9 b! A0 q
答案来源:谋学网(www.mouxue.com),HDFS中ClientProtocal的()方法可以查找下一个数据块0 I& L# j0 e: C2 c. O! ?
A、getBlock' x; W" \: G, f& ]6 j, C% G
B、getBlockLocations
C、getLocation7 [$ ?% f# {5 ?
D、nextBlock
正确答案:/ o9 W+ A) l+ ?/ b: C9 d

, |- Xv, c6 L& f
第6题,对于不同顶点之间的信息交换,Pregel采用了(), N- S& z8 D- j) V
A、远程数据读取5 [4 g+ [* k% G/ G) k- x( }
B、共享内存# k. \: f( H: E- g# S
C、纯消息传递模型( w3 w8 d0 i# K- ~
D、共享消息% _0 I) O2 ]$ z5 x# i; K6 @' ^: X
正确答案:6 U8 _8 T" ?* P8 D
, y7 I5 Z* X9 rA

第7题,UMP系通过()来实现实现集群成员管理、元数据存储、MySQL实例管理、故障恢复、备份、迁移、扩容等功能0 T% L% J# X9 X5 j2 P+ i5 T
A、Controller服务器! G# W" `6 L! ?* b
B、Procy服务器
C、愚公系统9 O# k2 d& X! d- Q4 ]# s6 a
D、Agent服务器
正确答案:
$ x- z) |9 Q+ J% f8 ~l

第8题,批处理系统关注(),流处理系统关注()。
A、吞吐率,延时
B、延时,吞吐率
C、延时,速度
D、速度,吞吐率* Ry7 P" `7 k8 T% |
正确答案:

8 ~$ w) {# U. J! `& {
第9题,()是一个通用文件系统的抽象基类,可以被分布式文件系统继承
A、DistributedFileSystem! i& E' O* L% Z6 ]7 {
B、GFSSystem, o# [8 E" PO
C、FileSystem/ N4 a/ `: E% G1 \9 w
D、HDFSSystem
正确答案:0 ]9 o3 m2 V+ p- X. D0 v+ Ty
$ H& {3 m. y?{: m- r9 w
; R3 e( ~/ X9 v% |& ^- c& a
答案来源:谋学网(www.mouxue.com),UMP系通过()来实现实现在不停机的情况下动态扩容、缩容和迁移; t/ A) wf{% N' k7 _
A、Controller服务器# j; |' f, U; q
B、Procy服务器
C、愚公系统hd8 L# F1 U" I
D、Agent服务器- b4 `- X7 t3 y+ R# F" S
正确答案:


第11题,列式数据库采用()存储模型9 W9 V# K, C+ |6 B+ x
A、NSM- U8 y8 R' @0 u& T3 p4 U
B、DSM, c! u1 Y! z$ S' x9 L- [
C、Hbase
D、MySQL
正确答案:
2 |6 y6 @- e9 l3 M0 ]8 V$ i

答案来源:谋学网(www.mouxue.com),应用于涉及频繁读写、拥有简单数据模型的应用,内容缓存,比如会话的数据库是哪种()1 x6 {, KI4 X3 h- T- ^% \?
A、列族数据库
B、键值数据库1 L3 h6 Q8 o8 d# c, |& C
C、图数据库
D、文档数据库
正确答案:
+ h+ `8 a1 `5 F+ r]2 [; j% l3 _

第13题,UMP系统借助于()来实现高效和可靠的协同工作1 W" [% `, P& m6 f
A、Mnesia
B、LVS
C、RabbitMQ
D、Zookeeper
正确答案9 `. S2 q2 Z' U- C& A7 j. j
% F6 C" G$ c, b- t7 T( T
/ w+ f, Bg) Q& ]- d6 W
第14题,UMP系统中面对分库分表用户如何进行资源调度()
A、可以共享同一个MySQL实例5 Q* F/ p5 a9 g0 T
B、每个用户独占一个MySQL实例# oi( g; i0 _/ ^k9 Z6 F
C、会占用多个独立的MySQL实例
D、随机分配MySQL实例
正确答案:. j0 t: s' @+ }$ g( {0 u" }9 v+ [


答案来源:谋学网(www.mouxue.com),Storm中如果要让每一个Task都会收到所有的Tuple,应该采用哪种Stream Groupings()。0 Q2 U# N) Z# u% _
A、ShuffleGrouping
B、AllGrouping0 ]) j3 i7 R2 N1 K& t" w
C、GlobalGrouping& M+ P8 s- e$ o+ S& ^
D、FiedlsGrouping" I' S$ q- F" K, [: f* \$ O2 V. ?
正确答案:9 G' q7 d, A4 c1 ?J7 W; n! c* i

$ o" M! P6 d' X5 Y: c1 m2 R% O
第16题,关于Hadoop集群网络拓扑,以下说法错误的是()。& M" e3 h& H, J4 @+ F; Q( @0 Q3 G
A、普通的Hadoop集群结构由一个两阶网络构成
B、Hadoop集群中每个机架有30-40个服务器,配置一个1GB的交换机,并向上传输到一个核心交换机或者路由器# m% Q4 d% n* D% U% |6 j+ d7 L2 V! W
C、在相同的机架中的节点间的带宽的总和,要等于不同机架间的节点间的带宽总和
D、一般来说机架内部网络环境比机架间网络环境好
正确答案:8 o7 q& W* F0 p# F

# ]" Z1 `# [2 w2 ?+ g, _
第17题,Gephi是哪种可视化工具(); w5 K; h4 {* T" z* k2 w) V) Hw( x
A、信息图表" R* S8 v9 S+ F. @4 Q# J8 z
B、地图工具
C、时间线工具
D、分析工具+ PX, ?+ A# @+ e5 b
正确答案3 ^- FL) k! W) ^* e' X8 B
( x/ g! U9 ]( J7 Y; d! o

第18题,MapReduce设计的一个理念就是(),因为移动数据需要大量的网络传输开销。
A、数据向计算靠拢
B、计算向数据靠拢* t1 u) V9 n7 K/ H# W
C、计算向网络靠拢
D、计算与数据并行
正确答案:


第19题,Storm中如果要让所有的Tuple都发送到同一个Task中,应该采用哪种Stream Groupings()。
A、ShuffleGrouping
B、AllGrouping9 X6 Y: t- n# C+ }
C、GlobalGrouping
D、FiedlsGrouping& {+ O! o* c! o4 n, J
正确答案:
3 f# K1 B6 M. j$ H; u
8 M$ P/ `8 q$ i, z! M) B' _
答案来源:谋学网(www.mouxue.com),以下哪个是HDFS的局限性()。
A、吞吐率, B- G/ W, L) W" M" X
B、数据集' w; c$ t& D/ [4 z
C、兼容性
D、延迟& C, L/ @' N; ~: fY& F
正确答案E4 M" D9 \( g$ H5 u8 q
* [6 b5 t- ?, U3 c5 X8 {4 W

第21题,HBase的客户端并不依赖Master,而是通过()来获得Region位置信息,大多数客户端甚至从来不和Master通信,这种设计方式使得Master负载很小
A、Master2 Z$ j( J5 C* H# p
B、Region
C、Zookeeper) j0 G* x% l0 U* f: `- R
D、Chubby
正确答案:
5 K0 b5 r% `, h% |8 s
" c4 @9 o5 {8 q+ S
第22题,优点是性能好(高并发),灵活性高,复杂性低,数据结构灵活
提供嵌入式文档功能的数据库是()9 n: Q0 z1 E3 P/ @
A、列族数据库
B、键值数据库+ r1 J; Y8 n. j# G2 ^) k4 c
C、图数据库
D、文档数据库" c7 \! Q0 k, d' c
正确答案
1 ]+ M% L. ?+ n, X2 ~9 a
5 W" b1 X3 l# U% u: G; j
第23题,MapReduce中()会周期性地通过"心跳"将本节点上资源的使用情况和任务的运行进度汇报给JobTracker,同时接收JobTracker 发送过来的命令并执行相应的操作。/ l: T+ G* M" F7 r0 W2 O% t' s
A、Client" q; W/ S( E7 x9 bh4 _; h- w& x
B、Job Tracker
C、Task
D、Task Tracker
正确答案

8 a; d# v+ v/ b8 l7 BQ
第24题,Storm中如果要随机分发Stream中的Tuple,保证每个Bolt的Task接收Tuple数量大致一致,应该采用哪种Stream Groupings()。
A、ShuffleGrouping
B、AllGrouping" {' m' h* z( Z- k4 `
C、GlobalGrouping; ~! |8 h- x! t
D、FiedlsGrouping
正确答案:
( O# {" @* J0 v) o) y& A- p. o' P
0 [0 D. o4 Q: c' v+ q3 F8 I
答案来源:谋学网(www.mouxue.com),Hbase中主服务器Master主要负责表和Region的管理工作+ J3 v% G: Z5 {$ Q) \4 y
A、Master
B、Slaver1 Q; I: D1 [& E, ?( t/ _2 y
C、Region5 i, tM^% u& r
D、客户端+ q8 O. E4 l0 q. e4 o
正确答案:' K* O2 D, ~+ k* l' c6 I
- S; I$ {0 s" l; K

第26题,以下哪个是通过JDBS和关系数据库进行交互的()。
A、Ambari. N, @% S: |3 T8 v3 Pk
B、Oozie
C、Hive- _' `: _1 {4 q! k+ u! U
D、Sqoop, D! o1 T, {! N$ z1 o! E
正确答案
( ]# l+ sw# {/ h: [

第27题,UMP系通过()来实现实现管理每台物理机上的MySQL实例
A、Controller服务器$ a/ k+ f& P# Z1 X% F' f- P' s
B、Procy服务器* \7 z6 t6 P$ E( L' ^- V
C、愚公系统
D、Agent服务器
正确答案
) H5 d3 b$ W% u], {" b
" x- St- D, U9 h* k2 {
第28题,()可解决HDFS中名称节点运行期间EditLog不断变大的问题- W2 A0 t2 x- k4 v, c! A
A、NameNode1 H, z8 l* K! ~1 W, {3 e
B、SecondaryNameNode- R5 I+ ]1 L% C! G( g( q4 Y7 F5 V
C、DataNode
D、Block
正确答案:

) g+ {6 B7 i' }3 G
第29题,Hbase中Zookeeper可以帮助选举出一个()作为集群的总管' g7 U8 B7 o8 H& e" z' {
A、MasterP% U8 |6 V% A# v3 k
B、Slaver9 p& T9 K6 k- B+ t+ B8 T6 C
C、Region5 G! l9 S* |) e9 G; q# I
D、客户端9 e# I, U2 e; Kc! G, s
正确答案:3 N! e7 S. [$ W
4 f( {9 t9 g2 T2 u; p! Q
6 `( ]# M( s5 M$ Q( C- G- \
答案来源:谋学网(www.mouxue.com),Pregel计算模型以()作为输入
A、有向图& f! U9 c5 {: S7 l* K# D/ c
B、无向图/ v# X4 G9 T1 E6 p/ L3 x% }! }
C、矢量图
D、树( r7 y! \) A3 I* ?+ N' zQ' `9 b
正确答案:
& G/ S$ _0 F3 w" n9 J" Z

第31题,以下哪个不是云数据库的特点( n0 E) P* i% O' M, B: I
A、高可扩展性' a: v' ]3 n8 y) |8 p
B、高可用性
C、支持资源有效分发
D、本地存储0 P6 ?4 @5 Z' _8 N+ ]5 m
正确答案) d- M: L! s, ]0 i& I" y(
9 v2 }! e3 k' U2 T" {3 W) z

第32题,以下哪些属于典型的大数据应用()。' l; N% G* m3 C, ^9 p, F, J
A、谷歌搜索$ T6 gV/ B! {: [# j
B、谷歌流感趋势
C、谷歌统计
D、《纸牌屋》制作
E、《黑镜子》制作8 U8 p6 c8 R3 v0 L$ u
正确答案:,D

# Z/ ]8 Gf( e2 m
第33题,MapReduce可以解决哪些计算问题()。) h* Z4 [Z: ~8 _) h6 e2 G/ ^- [
A、矩阵乘法- Y% A% H; h* OJ$ L( s+ P
B、关系代数运算" j4 M8 I$ O6 i$ w. E+ m" a% \
C、聚合运算
D、关系投影运算+ V1 i0 t/ f& x/ u. T- O4 b- s
正确答案:,B,C,D

8 W+ |5 N! o5 [) q6 [) p
第34题,流计算系统的需求有()。- N) J4 B8 Q& z5 sK
A、实时性/ |+ u' M6 d0 n
B、廉价
C、高性能
D、高带宽. ^0 ~: b' W- }, [/ l& r0 X6 c
E、分布式
正确答案:,C,E" Q8 D& c6 L$ S
4 a, ]- B8 Lb; R/ Q
* T3 L) A8 ~& T/ @' P2 x- y
第35题,以下属于Hadoop的安装方式的有()。" \' w4 A0 K5 D! J- E& VY1 U$ N1 w
A、单机模式
B、多机模式
C、分布式模式- q( ZZ! {AOM9 J
D、并行模式
E、伪分布式模式2 P5 ?3 C8 W; `
正确答案:,C,E/ _: }( K7 R. F$ O+ F% h

: v0 r2 m0 ?$ c& ~' }6 q
第36题,已得到广泛应用的分布式文件系统主要包括()。* |% {* c# V: H! d1 u" l5 M& T
A、GFS
B、MapReduce" y* \7 \. U6 y/ y! u
C、Hbase3 Y6 N! V8 E& m9 D4 B
D、HDFS
正确答案:,D
' F/ V# J* R: i& C7 Z
1 c. b0 k3 ]8 ~
第37题,Hbase中Zookeeper提供了()
A、分布式同步0 K7 I+ U& AF
B、组服务
C、域名服务
D、配置维护! u7 s0 v7 ~% [4 @8 `; s
正确答案:,B,C,D" _. ]4 @5 z7 D" z+ a* E
- ~% p( h1 o* o& ~

第38题,关系数据库与NoSQL数据库相比适用于哪些领域(). V: |6 R+ T! k
A、电信
B、银行
C、互联网企业大数据处理
D、传统企业的数据分析+ i7 Z$ ~, c# E- E8 j$ c! d
正确答案:,B+ W3 d; O) ^; {# g1 }& g5 H( n


第39题,NoSQL数据库与关系数据库相比有哪些优势()
A、支持事务ACID四性
B、可以支持超大规模数据存储
C、以完善的关系代数理论作为基础
D、具有强大的横向扩展能力! L# e. N/ t" i$ Y6 j( w) }# E0 q
正确答案:,D+ Z0 w7 ^" i8 q7 ]# {


第40题,流计算处理流程三个主要阶段是()。$ x1 J- W5 i) ?1 Q[" t7 t6 ]5 a/ T
A、实时采集
B、实时存储! w4 x" P* l8 Q) M- d
C、实时计算
D、实时查询- g& Q# Qf9 q4 t3 T
正确答案:,C,D; ?" Y/ {# }3 `& \' A4 `+ x8 y" e


第41题,HDFS集群中的数据节点一般是一个节点运行多个数据节点进程,负责处理文件系统客户端的读/写请求。& v/ r$ g* Js3 v3 Y
T、对
F、错/ q4 u, r9 S) f* I9 o' J" `( k
正确答案:F
- e4 U' M. K. X& }! j" {9 L! C

第42题,HDFS使用的是传统的分级文件体系,因此,用户可以像使用普通文件系统一样,创建、删除目录和文件,在目录间转移文件,重命名文件等
T、对( O/ s, [- n# e, u6 H0 o. p' ^
F、错* x6 j. S% W! I9 J$ p) W' [) ?5 W% v
更多答案下载:谋学网(www.mouxue.com)

3 `& Y8 _p$ s7 j$ ]8 y# `n% q
第43题,云数据库不可以满足企业动态变化的数据存储需求2 Q* \; `! s6 b$ X
T、对. |- `9 B+ ]. A- Y$ [
F、错
正确答案:F
8 \% j0 jJ9 J5 S7 T2 m1 X
; B7 y8 q- C! Z. J9 \) d
第44题,HBase中包含了丰富的操作,其中会涉及复杂的多表连接。
T、对
F、错4 r3 P+ f. c2 I4 v, R
正确答案:FQ5 S2 o" G* N3 f& P& y
4 y+ G" L1 y2 W! Q" g

第45题,MapReduce中TaskTracker使用"slot"等量划分本节点上的资源量。
T、对
F、错' ^1 {, Y0 G8 v/ y: a/ L
更多答案下载:谋学网(www.mouxue.com)
8 g( l: L; j2 }0 q
4 C6 {% X" o! F. `7 A4 }/ A1 F
第46题,云数据库不可以满足大企业的海量数据存储需求
T、对
F、错
正确答案:F
4 _. i" w0 i. y. p4 P' P
. U0 ]+ i- p( ]5 ]0 _% ~
第47题,HBase中执行更新操作时,并不会删除数据旧的版本,而是生成一个新的版本,旧有的版本仍然保留0 }9 \9 N, s2 P3 M: q* R5 c2 a
T、对
F、错3 k0 T2 ^4 ]- Jt3 g% o
更多答案下载:谋学网(www.mouxue.com)

! n: k- l4 x; d/ [
第48题,HDFS中的NameNode的EditLog用于维护文件系统树以及文件树中所有的文件和文件夹的元数据
T、对( u3 b) i6 G, G8 c, t9 y
F、错/ n* y9 |$ q) b
正确答案:F4 W{% m1 A( K8 k8 L, u' \( y: C9 v( [
+ t! {! `$ Q8 qr( }
5 V9 c5 ?7 o9 [& s
第49题,Hadoop可以在单节点上以伪分布式的方式运行,Hadoop进程以分离的Java进程来运行,节点既作为NameNode也作为DataNode,同时,读取的是HDFS中的文件。
T、对, z9 k, G9 G2 \6 @
F、错



,Hbase中表在垂直方向由一个或者多个列族组成,一个列族中可以包含任意多个列,同一个列族里面的数据存储在一起8 U! g& R) O4 r, N4 x: b
T、对8 f% h; d4 e& A2 c! x! EM
F、错* J& Y/ ]/ G5 \^
正确答案:F
页: [1]
查看完整版本: [南开大学]20春学期《大数据开发技术(一)》在线作业(答案100分)