|
[南开大学]20春学期(1709、1803、1809、1903、1909、2003)《大数据开发技术(二)》在线作业, T/ s9 b6 y! c6 d4 @; v
试卷总分:100 得分:1009 K% s" M" M8 G, j, p
第1题,Spark中DataFrame的()方法是进行条件查询! j. e3 C8 `3 U4 s6 P
A、where
B、join
C、limit
D、apply
正确答案:
1 W. Q" U' v* t7 C! E V
第2题,Dstream输出操作中print方法在Driver中打印出DStream中数据的()元素。0 t3 j) |! U% q
A、第一个6 T9 _( {# e) `; |) J0 c1 Y. @& |
B、所有& o0 d8 C6 F/ J
C、前10个 v( ^ T* U" J
D、前100个
正确答案:% {% W* T' ~8 C0 `4 Z# |) K
* n4 q/ _$ J/ c( V+ m! H* A
第3题,Scala元组的值是通过将单个的值包含在()中构成的
A、小括号* \4 }) G$ M; F
B、中括号
C、大括号
D、尖括号
正确答案:/ k9 R- l7 i# \! _4 F
" g0 d8 L& L! }% Y- ^9 `
% O& m$ `6 N# A( i5 ]
第4题,当需要将一个普通的RDD转化为一个PairRDD时可以使用()函数来进行操作
A、transfer" z5 t* `6 Z* p! O- K1 ~7 _
B、change* ?& \; K, {% {+ [
C、map7 i) q# ?: [0 N) W) L
D、build* O3 x! w$ l0 S
正确答案:1 g4 s3 y+ Z: q, X2 x
/ y5 E9 |+ _- C3 Z* q; @1 G
答案来源:谋学网(www.mouxue.com),以下哪个函数可以求两个RDD交集 ()
A、union
B、substract% H/ j9 ?5 d( x
C、intersection6 h+ r) U6 O; n
D、cartesian( |- I3 }# r+ F, `- m; C9 M
正确答案:4 \% {$ N$ g9 R7 \5 Q+ ]
+ S2 }7 t% p- ~( D; u T. V
第6题,以下哪个函数可以求两个RDD差集 ()* \. q: A! M, J8 e4 v
A、union) ^, r# ^. f# I2 M6 F r/ P
B、substract" b* j0 y4 O5 P% p3 a4 n
C、intersection
D、cartesian
正确答案:; o% V, L! x e; V3 P: ~( x3 B, {2 n
8 N& t% ]3 D0 F( Q! K/ K. I0 S
# R% g) V* V) D, @# t- K
第7题,spark-submit配置项中()表示executor使用的总核数
A、--num-executors NUM/ k1 {: s$ B9 a5 m% O% D: P2 Q5 `
B、--executor-memory MEM% A5 @( `. w- Z* a: D
C、--total-executor-cores NUM
D、--executor-coures NUM
正确答案 Z. N5 Y" Y& |' d3 }/ m
3 d" B! f, d: |+ g3 M5 S
$ U# o/ j& T# I& n7 Z
第8题,GraphX中()方法可以释放顶点缓存/ }- J5 c, f- f( n) H1 n
A、cache
B、presist
C、unpersistVertices
D、edges.unpersist- [6 S- G! v% O3 n( [
正确答案:3 E6 V/ L" ^5 k- m# ^6 C ?
第9题,以下哪个方法可以从外部存储中创建RDD()$ ^( ~/ V; O8 y# f! C; }
A、parallelize* ?8 T9 s- x7 q: E5 D5 }) K
B、makeRDD/ p/ h ~" Z7 _ D
C、textFile' a7 a8 T3 i+ m5 O
D、loadFile
正确答案: S8 L; H1 h( P& R
( ]% u% P* B+ x& B" n" @& W6 f# @
答案来源:谋学网(www.mouxue.com),Scala可以使用()关键字实现单例模式8 W0 R; |% |9 Q% i
A、object* B C; N W( p# z; A4 V
B、static& g- X8 [1 J, Q. l- `# t- W) a0 U. e9 x
C、private
D、public
正确答案:
$ K, p" q9 q/ {
第11题,以下哪个不是Scala的数据类型()3 z$ ]' h$ k7 B( Y, N$ E) H' ]
A、Int" b7 c/ e- p2 o4 ?9 r! { A
B、Short Int" Q% ^$ V; F& m+ R- N- l7 c$ s
C、Long$ x1 b3 f4 |" x
D、Any
正确答案:
/ E9 g- S& ^1 b1 ]# |+ u
! p7 O. @6 I4 U7 G4 M! n
答案来源:谋学网(www.mouxue.com),Mllib中metrics.precisionByThreshold表示()指标& `$ C7 w& `$ {# x
A、准确度
B、召回率6 Z6 z8 q& ?( W& G9 m: O
C、F值* |7 U3 m. M0 \: Z) C( |
D、ROC曲线8 r, N4 u. ]+ W) r
正确答案:
第13题,图的结构通常表示为:G(V,E),其中,E是图G中()8 Z2 C& \9 ^0 l/ D( N
A、顶点
B、顶点的集合+ A" b, z) t+ F% g6 @/ m
C、边
D、边的集合% m- x3 X7 d% \
正确答案
第14题,请问RDD的()操作用于将相同键的数据聚合( v3 d& M I6 Q% ^' J$ I
A、join; \0 n0 @ p, u9 ?
B、zip. |7 J9 i. h) O, f# t% e& o) c
C、combineByKey
D、collect! M7 X! y; q' q! T. s
正确答案:6 y1 I5 K4 K+ i/ r2 P8 _/ z
% ~% h; i' Z, w1 t `- K+ ]( t8 J
答案来源:谋学网(www.mouxue.com),Mllib中metrics.recallByThreshold9 m E/ W/ i5 f: H
表示()指标
A、准确度1 i+ p& t' L! E" f3 L1 ~+ F" e1 q
B、召回率* M( d. r6 Z- K/ T" R. Y q
C、F值
D、ROC曲线 S; X) J6 `" C
正确答案:
# S7 U# K' S- d1 `8 I
第16题,GraphX中EdgeRDD继承自()3 M' G% i; C& [* M9 ^/ z
A、EdgeRDD5 u" X+ T, q$ A# k/ h
B、RDD[Edge]" H3 C+ ^- w7 v. u
C、VertexRDD[VD]& z7 A- e) n2 b; P; i
D、RDD[(VertexId,VD)]
正确答案:
# d$ f! V q1 I1 F* U! F4 _
, ?% X" {7 T6 |# ]2 e
第17题,Dstream输出操作中()方法将DStream中的内容以文本的形式保存为文本文件
A、print
B、saveAsTextFiles: D# w7 d5 z. N7 _" ]
C、saveAsObjectFiles
D、saveAsHadoopFiles8 k8 Y9 f8 A4 Q3 d6 u8 q- O& {5 A+ ?
正确答案:
& c& a# h% [- F1 V5 y( J$ p! b; x
第18题,GraphX中()方法可以查询顶点信息7 V/ c+ r- }( N! V
A、numVertices5 I0 A" J- C4 k1 w
B、numEdges# p3 `5 M) {8 e
C、vertices
D、edges; m& t9 a" K/ s3 s4 C, H
正确答案:; U* Z+ _' \$ a* ?2 L
1 v" I! `& M$ y4 R; o
7 ~) i# p4 G, {1 N; J! E* M- o, U
第19题,Scala通过()来定义变量
A、val
B、val \( }# Q' j: L! K: X5 i
C、define" c" E) U% f- l0 ?1 S3 X( s0 S9 _
D、def$ {# ~' A7 ^9 s) k
正确答案:
/ Y+ L* D. T' p0 S6 K( J9 X
# O4 s: s9 R! @' i8 E
答案来源:谋学网(www.mouxue.com),Mllib中线性会馆算法中的参数reParam表示()! G8 K- Z+ ~9 ]
A、要运行的迭代次数
B、梯度下降的步长6 P% m6 F; _. B3 d6 `; b, D' p
C、是否给数据加干扰特征或者偏差特征) b: L; E s, A- Q$ A! y/ U* h) I
D、Lasso 和ridge 的正规化参数& d' Q" A4 R( B `, z1 [
正确答案1 w0 i& g% Z4 q- o Y
5 M, y8 V* G# l
第21题,Scala中()方法返回Map所有的value' N) u; h5 C X$ C7 F6 b+ L$ b
A、key; n( B4 k& z, A& U2 D
B、keys" l4 H3 K: l' y. a' N: x
C、value* M$ x6 N9 K8 g
D、values
正确答案5 z0 R" e0 o( d3 `. l0 \
% t" w9 }- x/ B9 I4 n+ f
' F# Y, }; D, L! f0 ~4 U" P7 d' b
第22题,Scala列表方法中返回所有元素,除了最后一个的方法是()
A、drop
B、head
C、filter
D、init
正确答案
3 m3 R' r! T1 L
% t4 }: I( A+ J' D# _7 k: H
第23题,Spark Streming中()函数可以使用func将源DStream中的每个元素进行聚合操作,返回一个内部所包含的RDD只有一个元素的新DStream
A、union N6 E. Q0 V$ o9 n8 a* E% G% |
B、reduce7 ]0 W+ p( Y! }2 k3 M& M& Z
C、join
D、cogroup6 \, Y8 W! Q j' R
正确答案:9 |& r* l; p3 p! @% C4 e
2 Q% M/ y9 J/ v; s. `
. [* _& j1 L0 _) x# }
第24题,PairRDD可以通过()获得仅包含键的RDD
A、key3 \" Q* s' M O- t2 {- D0 l) o9 i) U
B、keys" ^9 _& V& I5 Z0 Z
C、value
D、values3 r6 u; r" f5 u7 K5 `0 }
正确答案:
; ~$ `1 e- g! R
答案来源:谋学网(www.mouxue.com),Scala中()方法返回Map所有的key6 h4 j5 R+ t* x* d, v
A、key! I: @' S7 J" B$ U9 B5 F# \
B、keys
C、value
D、values& |* X1 Q4 D$ D! i- G% ^- U6 e- n
正确答案 e \: W. F7 x+ Q8 ~7 t' ?4 L9 D
% Q$ ?' L6 n+ c& O# ]
第26题,以下哪个是Scala的数据类型()
A、Any
B、NULL
C、Nothing( G9 D" E7 l+ K/ ]. n
D、AnyRef1 {. b& }* k3 X6 `- F
正确答案:,B,C,D! b9 ]! F/ Y+ f" C( t1 m- e E
第27题,以下算法中属于分类算法的是()
A、KNN算法$ l, r! G) b$ ^ l0 x7 A5 q8 ?
B、逻辑回归3 K( z! ]( k) w. z6 B
C、随机森林+ S! \1 j, a+ @7 ]" Z0 d
D、Kmeans
正确答案:,B,C
, _, Q# \" t/ O& w% g6 i) D
+ J* b4 u! s. I
第28题,Spark的RDD持久化操作有()方式
A、cache6 m1 i8 f' t! K T# g) r, X
B、presist H4 n8 \) B$ `- E0 V5 \
C、storage
D、long% J* s# b* b9 M; H( s( V
正确答案:,B$ D) |5 O* L) |/ c* p/ W- a
+ C5 I1 m A5 {( F# v4 H
) g& P5 X4 b1 X& a0 T
第29题,Spark Streaming的特点有()
A、单极性
B、可伸缩
C、高吞吐量
D、容错能力强& |' @5 u2 _, G5 X6 M! w: A8 U
正确答案:,C,D
' r0 ~! r3 I- D
答案来源:谋学网(www.mouxue.com),Spark Streaming能够和()无缝集成2 ^" [6 u) g# o& v$ @% g+ {
A、Hadoop" M' p& p& T4 i) n
B、Spark SQL4 O+ ]: F6 _& {" U! C
C、Mllib
D、GraphX
正确答案:,C,D
0 [0 O1 _* P7 E6 s
第31题,Scala系统支持()作为对象成员
A、通用类
B、内部类
C、抽象类- g8 A/ W8 i" u: _/ z
D、复合类
正确答案:,B,C,D
第32题,Scala中可以用()方法来连接两个或多个列表
A、::
B、#:: f& `; t- z# M; u
C、List.:
D、List.concat()
正确答案:,C,D
第33题,Spark DataFrame中()方法可以返回一个List6 U4 E# B% ~( N! g+ g8 Q
A、collect7 Q8 j" F. R0 j+ @6 C
B、take, g, _* _4 d- i( \9 j6 n! Y% n
C、takeAsList
D、collectAsList
正确答案:,D# d1 A, B; t* d M
第34题,Spark DataFrame中()方法可以返回一个Array对象0 Q( X: Q6 K& N- Z
A、collect5 f' T2 `6 B% K* G
B、take0 N6 z; [' q# j* d( b
C、takeAsList
D、collectAsList S4 A$ q. B! i) n+ z& |- ^: f
正确答案:,B0 l; T! i" F6 R
5 O4 f C" }9 e5 w; L
第35题,Spark可以通过哪些外部存储创建RDD()
A、文本文件, P8 d n! g+ @1 ]9 `3 B8 l
B、目录; S# I! G( r; I6 A; K
C、压缩文件
D、通配符匹配的文件 D; A5 J$ h0 j h- v9 X
正确答案:,B,C,D/ r: c8 Y5 L; j' x4 \, m: q
第36题,Spark只有键值对类型的RDD才能设置分区方式/ r" l- H8 C7 D; h* G- d0 d; z
T、对
F、错
更多答案下载:谋学网(www.mouxue.com)
1 {. n3 N {. f: x+ X) S
第37题,Scala中列表是可变的2 z3 T% r. d" a6 x/ ~8 ~1 e
T、对1 B8 E! X& ?' X
F、错
正确答案:F
3 h) R/ C, m- V+ d [
; @( R; F* B) o7 ?1 g
第38题,RDD的转换操作是用于触发转换操作的操作,这个时候才会真正开始进行计算。& c# }2 u- E6 T Q9 j* ?+ m/ V; H
T、对0 h1 q. j; w2 X( C! ]/ z
F、错
正确答案:F# _% @, ]6 r/ h% Q
第39题,Spark取代Hadoop仅仅是取代MapReduce这种计算框架,Spark可以取代HDFS吗1 j/ }+ `* v. c: I5 y( R& w
T、对* g1 j! N- W8 Y4 K2 `8 m8 t5 |
F、错$ U% x! C! H5 V% K
正确答案:F; N' b% V' _# L- J
第40题,Spark在同一个应用中不能同时使用Spark SQL和Mllib
T、对
F、错) s( P* f% ?. [7 R$ Q
正确答案:F( k7 Q- X' H+ M3 N1 A M
第41题,val如同Java里面的非final变量,可以在它的声明周期中被多次赋值。
T、对& N6 }8 t, u% J
F、错( W% y# D* |& A/ E
正确答案:F
第42题,Scala 配备了一种表现型的系统,它以静态的方式进行抽象,以安全和连贯的方式进行使用。0 c- c% s8 U$ F) ~6 G" E7 m6 m
T、对, S q7 z& n2 \ [% ~8 e
F、错0 I# S5 A0 r+ A9 J7 L8 E) O7 K0 \
更多答案下载:谋学网(www.mouxue.com)
第43题,RDD的mapPartitions操作会导致Partitions数量的变化: m; l' Q# L+ r
T、对5 G+ T9 P ^# P5 k0 o R
F、错
正确答案:F
6 ]8 Z$ u- C. ]9 D0 h) Z# {
第44题,RDD的flatMap操作是将函数应用于RDD 之中的每一个元素,将返回的迭代器(数组、列表等)中的所有元素构成新的RDD 。
T、对/ D8 t6 t- g! d# v6 E& Q
F、错
更多答案下载:谋学网(www.mouxue.com)1 |6 I! _% J( x) R" b7 j' W
$ h9 O! h' J+ ~
第45题,RDD的subtract用于用于将前一个RDD 中在后一个RDD 出现的元素删除9 b: H1 w/ C# q) M( D \
T、对
F、错
更多答案下载:谋学网(www.mouxue.com)
/ E0 t) P, f5 k$ s- R3 r
第46题,MLlib中StandardScaler处理的对象是每一列,也就是每一维特征,将特征标准化为单位标准差或是0均值,或是0均值单位标准差。) s" M4 p8 d, U
T、对; e1 q/ u& G6 G- P/ ~! U
F、错
更多答案下载:谋学网(www.mouxue.com)( p. a3 h3 \) n0 l1 ~' |
. l9 U! F% e8 |' s x8 f) l1 J9 T# {
第47题,RDD的filter函数返回一个存储符合过滤条件的所有元素的新RDD( d" I, u8 b% p7 z; C2 I4 U& R4 X
T、对
F、错8 Y9 Q' ?3 C: V3 u" a
第48题,用户可以在Apache Mesos上运行Spark8 u- y4 r# B) Q M6 h; O3 c* C
T、对
F、错
第49题,RDD中join操作根据键对两个RDD进行内连接,将两个RDD 中键相同的数据的值相加。2 E3 f- q c. s
T、对' F! _* G/ P1 R& n( B
F、错& Q1 T6 o4 n, \: W& K
正确答案:F+ X6 C3 m5 s8 w3 Y8 m
4 Y! P6 }5 c& ]' z
PairRDD中groupByKey是对具有相同键的值进行分组
T、对
F、错 |
|