[南开大学]20春学期《大数据导论》在线作业(答案100分)
-[南开大学]20春学期(1709、1803、1809、1903、1909、2003)《大数据导论》在线作业: l# g* I+ R8 Z: {/ Q( _/ [8 e
试卷总分:100 得分:100
第1题,PaaS是()的简称, E, Q- q4 X3 H7 S* ^7 Y6 L6 y. ]" P' R& T
A、软件即服务, A8 a( t4 B8 A$ F5 }4 a* @
B、平台即服务
C、基础设施即服务
D、硬件即服务
正确答案:
第2题,基础设施即服务的英文简称是
A、IaaS
B、PaaS
C、SaaS. V" IK6 a6 @* w8 z: `% \
正确答案:
& _9 b" P0 O& Z$ j) f$ [2 l
第3题,数据清洗的方法不包括
A、缺失值处理8 A+ S7 \9 F: v
B、噪声数据清除
C、一致性检查: |# f# _4 A, p5 s* [7 g
D、重复数据记录处理
正确答案2 W4 s; H1 \8 a. _
) k7 H/ u, }! h8 g# _8 C+ P' C+ A! `
第4题,下列哪个R语言扩展包可以创建带有点和边的网络图()! z- q4 V& r2 E: ~( v' |8 ]
A、ggplot2
B、network
C、ggmaps# F" Z7 H3 u! H$ I( G
D、animation
正确答案:; w% e& J% R0 _5 f4 c, |6 l
) x. I2 x5 g/ ?8 v6 A
答案来源:谋学网(www.mouxue.com),下列哪个R语言扩展包可以制作一系列的图像并将它们串联起来做成动画()
A、ggplot2* m7 |4 k" C7 j7 P6 X
B、network: V( d" o) h6 s1 \: Y$ x
C、ggmaps
D、animation
正确答案
+ \$ J; S! ^7 Iv: A8 i
7 W1 l: Z# c" I2 V8 @: h+ C
第6题,GFS中的文件切分成()的块进行存储9 f. Z* U3 n3 i4 u6 I: |* u
A、32MB
B、64MB" d7 l9 M! S; L0 @
C、128MB
D、1G
正确答案 C6 |4 v6 N+ O' m- m) l
% M! T# l! u" A
+ l9 C; w* {9 m7 n
第7题,数据产生方式变革中数据产生方式是主动的主要是来自哪个阶段()。, }1 P# @0 G6 K
A、运营式系统阶段
B、用户原创内容阶段% J; @: i+ |6 q
C、感知式系统阶段1 K2 M( a% [; F@. \4 k9 q0 M
正确答案:: @) K5 `3 n3 z3 K' G* C
第8题,下列不属于商业大数据类型的是
A、传统企业数据% S; z$ J/ ?' |& g
B、机器和传感器数据1 J7 Z- R/ x' d! U- E1 L
C、社交数据
D、电子商务数据
正确答案:: W# N/ u. M/ B3 g8 A8 k5 B5 y
6 t6 V' A+ X* e3 S?
; n: A# ~4 f' }- l! E) N
第9题,用于描述相等时间间隔下连续数据随时间变化趋势的是()) a' d& |; @) r& W" W
A、折线图5 k5 T2 h8 @{% M+ h+ i
B、散点图9 O* ?: w5 j3 |* X
C、条形图: d& q7 a5 k. J- ~" X
D、饼图+ I) U. i" p1 }2 `6 A[
正确答案:
5 U/ s: ?9 ZU( ~2 [- z
答案来源:谋学网(www.mouxue.com),数据仓库是随着时间变化的,下列不正确的是()
A、数据仓库随时间变化不断增加新内容
B、捕捉到的新数据会覆盖原来的快照( {' E3 ~4 ?" x( Ch8 z
C、数据仓库随事件变化不断删去旧的数据内容
D、数据仓库中包含大量的综合数据,这些综合数据会随时间的变化不断进行重新综合
正确答案:
8 x/ x! u& r% J2 n: R* x
% ^- m1 @9 g- F- e. u) a
第11题,以下不是数据仓库基本特征的是()
A、数据仓库是面向主题的; H+ r: }U1 g5 J
B、数据仓库是面向事务的
C、数据仓库的数据是相对稳定的
D、数据仓库的数据是反映历史变化的
正确答案:
4 ~! V7 V" c5 ~* n
答案来源:谋学网(www.mouxue.com),哪个选项不属于大数据4V特点?' V- E. d" VM1 a
A、Volume
B、Valid' j7 E) dE7 H$ S& C( q: ~5 k: W
C、Variety
D、Value: s$ J9 c5 k. l* ^! C0 }
正确答案:
4 [: q. }+ l0 w* q3 w: I1 V6 f+ l
第13题,以下哪项不是数据可视化工具的特性()5 d7 H) t% @" U0 D7 P. h! D
A、实时性
B、简单操作
C、更丰富的展现
D、仅需一种数据支持方式即可2 M$ a: ^7 a! y" [
正确答案. f5 o* M) d) A) S# Z2 p2 O0 j+ M
5 Q, p8 Jx. r9 R3 F, A
第14题,数据产生方式变革中数据产生方式是自动的主要是来自哪个阶段()。
A、运营式系统阶段5 h/ @9 C4 G9 h& ?0 N. P
B、用户原创内容阶段
C、感知式系统阶段6 yw) [$ M% e% G' w
正确答案:
& T9 x& _, h2 [4 r
答案来源:谋学网(www.mouxue.com),大数据的特点不包含" [$ G# o; C1 d% \8 L, ]/ H( B! f
A、数据体量大
B、价值密度高
C、处理速度快+ H$ |3 V* t" q% U' W
D、数据不统一2 x2 ^& y" K$ {) o/ E! N8 T
正确答案
. }d# ~9 Wu. ]+ a4 Z
第16题,大数据在社交网络中的应用5 i) @# P" n+ {# H4 h! F& R
A、用户偏好、情感、社交网络结构
B、用户画像、精准推荐
C、舆情监控、突发事件预警
D、预测外部趋势+ Z5 d# ?, p: U* V3 p
正确答案:,B,C,D% H) V; H0 I0 b: x, c
3 b/ ^8 b$ i: {4 \" x* D
" p/ n( G1 U6 s. H" `
第17题,离群点检测的应用包括()等。9 p! ~1 v2 o! wr) M* |: E5 T
A、欺诈检测4 K5 q* \r9 ^$ K8 @
B、入侵检测
C、故障检测1 S5 T; k* u% L; ]
D、疾病的不寻常模式8 B% R" x, V% ~
正确答案:,B,C,D
第18题,百度大数据引擎主要包含三大组件()5 ]+ \2 Y) s+ T
A、开放云+ f- p8 e4 S" J: S
B、数据工厂
C、百度大脑。; d0 d% R* a* n) a; D, y; @
正确答案:,B,C
) r+ s7 ~: k: C# ]& }
# g+ e2 v% V$ S( I% k+ N
第19题,KNIME(Konstanz Information Miner)是一个对用户友好的、智能、开源的平台。该平台包括了##、##、##、##。$ g) ^9 [% p" Y/ a
A、数据集成
B、数据处理
C、数据分析8 ]4 {: @: K$ @; ?" |9 _
D、数据挖掘1 h5 y: y3 k# L; ^3 _* \
正确答案:,B,C,D
8 w3 G2 ?) P7 a3 d1 Z
答案来源:谋学网(www.mouxue.com),可视化工具包括()
A、Excel, N3 c5 F+ |- Z: Gs5 Q% u! w
B、Google Chart+ U) k4 `: R' u) }?5 Q
C、Gephi9 ~) j( g# w' @3 ~. E, m
D、ppt
正确答案:,B,C
+ v1 G# M% ]& ?- ?2 a' T% ~
第21题,云计算是##,##,##的发展 ,是虚拟化、效用计算、 IaaS(基础设施即服务)、PaaS(平台即服务)、Saas(软件即服务)等概念混合演进并跃升的结果。
A、流计算' R! g' _0 c) U% T1 A( Q& `$ \
B、分布式计算9 f/ N7 N# h. S' _$ _% e
C、并行计算$ Y- n8 U4 b4 p, n
D、网络计算6 J& D" v5 i1 _) x" j0 k% N9 H" O! W
正确答案:,C,D
# P( S+ q1 Z1 _8 ]% Q; H$ f: [' y
第22题,医疗领域如何利用大数据& n: H4 p' g! V: t
A、临床决策支持
B、个性化医疗
C、社保资金安全3 y: r! ^* V8 f7 }7 I4 Z- N' Y1 J; R
D、用户行为分析7 I4 K8 ~2 U; S: o9 K
正确答案:,B,C,D
第23题,可使用##,##,##进行光滑。' k1 O+ D$ `, id
A、最大值
B、箱中位数8 ^`9 N" dU- Q; @2 p
C、箱边界
D、箱均值, P?/ d6 d* |% A
正确答案:,C,D3 L8 E. \& t2 V) T0 J# s
; A# U7 H; n) g* w6 ]* u
第24题,大数据智能感知层:主要包括()及软硬件资源接入系统p, G) E$ ^. s; @' R
A、数据传感体系
B、网络通信体系
C、传感适配体系( x' k, W; s) O) n
D、智能识别体系$ D& [" v' Y) T+ j) _* @4 _$ ^3 u
正确答案:,B,C,D: R6 KW1 I. \3 \0 k
& x3 R% C8 w, Q3 \
0 c& \9 V% ~9 k. [. N) o, p
答案来源:谋学网(www.mouxue.com),下列属于传统统计学展示方法的是()+ J# J" {7 x2 g& }/ Q0 ]
A、柱状图
B、饼状图: B' k* ^$ x% k6 p0 q) g- O) u
C、曲线图1 m7 T: Jl, _4 [) M1 N1 t
D、网络图3 K& z0 j+ o) F* [7 b0 Q( d" O
正确答案:,B,C
& o6 k7 _0 g' a* P
第26题,层次方法可以分为(), J3 W: m$ \; S/ c9 ~1 a5 _
A、K均值算法
B、K中心点算法
C、凝聚法
D、分裂法
正确答案:,D
0 W3 w0 F4 r4 u1 |8 W2 F9 Z% ?
第27题,一个HDFS集群由一个##和##构成。此外,还有与这两个角色之间作为沟通桥梁的客户端(Client)。6 Y, J]! I+ ^% t
A、一个名字节点# p; @8 s6 v' p' [
B、若干个名字节点7 T& ~" ?1 T" e9 K6 ~2 i6 ?( _
C、一个数据节点! D, B' U3 F! M) ]1 N% P
D、若干个数据节点
正确答案:,D
6 y3 s; l- t8 V3 U5 v
第28题,交通数据分析可用于:
A、交通流量实时分析
B、合理进行道路规划! `# ?" J5 |, Q
C、信号灯智能调度
D、实时路况查询播报( ^* ^% T* w5 k' n7 _; j9 }% i
正确答案:,B,C,D
% F* S# {U4 H- M
第29题,数据变换(Data Transformation)的方法有()- Q! `: K9 R, m9 j8 T) s$ }
A、光滑6 w! B+ a" Z9 f( W) p3 s
B、聚集6 j, g( Q7 X* x! q7 S" ^
C、数据泛化
D、规范化7 Vh- Nz- c5 \. J. u( ]/ y
正确答案:,B,C,D
1 i) n/ `: yU7 S' R) w- e% Y
答案来源:谋学网(www.mouxue.com),医疗大数据特点:除了包含了大数据4个"V" 的特点之外还有()- R* P8 w' p! i+ s8 B
A、多态性1 d3 r) i* l' N: v3 \
B、时效性4 E& O. i, Z1 q" Y5 v! C5 {7 C% S% ?
C、不完整性, |. e/ E% f/ f4 o2 j* G
D、冗余性
正确答案:,B,C,D
5 c( q) V5 a! R' P
第31题,在现有大数据的存储中,结构化数据仅有20%,其余80%则在存在于物联网、电子商务、社交网络等 领域的半结构化数据和非结构化数据) \I9 y% r1 E/ l, E
T、对
F、错9 V: `% c- b" [1 N
更多答案下载:谋学网(www.mouxue.com)2 Y% ]! t; P, Z1 ]7 j+ |7 K! q
第32题,Flume的数据流由RDD贯穿始终。
T、对
F、错
正确答案:F
6 C* V' }. q! j& n; X- k5 L9 c0 S1 @
第33题,ID3算法的核心思想就是以信息增益度量属性选择
T、对
F、错
更多答案下载:谋学网(www.mouxue.com)
: V9 B$ L0 o5 P2 Q* |
第34题,大数据数据量一定是PB,TB级的
T、对
F、错
正确答案:F0 m& Q! h0 o7 U# t6 [: [
/ h# {" f0 o- JL: U
第35题,网络数据采集是利用互联网搜索引擎技术对数据进行针对性、行业性、精准性的抓取,并按照一定规则和筛选标准将数据进行归类,形成数据库文件的一个过程。; j* ^2 k) L: T! I: z1 @) [' x& f4 _
T、对
F、错# Z8 o3 d$ @4 N# [4 J
更多答案下载:谋学网(www.mouxue.com)
% o8 d& X+ a4 q
第36题,规则性分析(Prescriptive Analysis)用于解决决策制定和提高分析效率
T、对
F、错6 b; O0 j9 N* j
更多答案下载:谋学网(www.mouxue.com)
) D" MT2 s, a. VB# [
第37题,数据分析是大数据发展面临的挑战w# v2 Q9 m- y# i1 _
T、对
F、错
更多答案下载:谋学网(www.mouxue.com)4 t; m0 f& S/ ?/ F4 f: p
) d7 f: M0 M% S7 x% q0 O& P3 s
第38题,直接拿 Python 输出的图片用于印刷效果很好: H. d. @" ?) X( `7 h3 T2 d# y( v
T、对
F、错& \( g_7 t* o: n* C* G
正确答案:F. ?+ R+ E5 S1 ?
第39题,通常将统计指标的数值按时间顺序排列所形成的数列,称为时间序列。; f& F9 |8 s' z9 A
T、对
F、错( ]1 |& U& a; _. ?. t
更多答案下载:谋学网(www.mouxue.com)8 N# x3 W5 C1 P6 ?
第40题,结构化数据是用excel结构表现的数据
T、对' d6 Y( l: B) F$ X, |
F、错0 `& `+ a. G0 M0 j1 p
正确答案:F
6 c3 y' ^& _0 j2 c
第41题,多维数据指的是具有多个维度属性的数据变量。
T、对' {8 F, i3 f: L# m- t
F、错
更多答案下载:谋学网(www.mouxue.com)
. d) n/ W$ r! m3 s# W9 |, I
第42题,时间序列分析是对随时间变化的数据对象的变化规律和演化趋势进行建模分析
T、对
F、错* W9 G0 x8 g- M
更多答案下载:谋学网(www.mouxue.com)C% m/ f; T$ r& O: e1 B2 r$ H
第43题,BI分析适用于总数据量在集群内存的最大级别以内的情况,使用内部数据库技术,适合实时业务分析需求。
T、对5 E) ?; D3 {8 jw" D" A( ^: h) m
F、错
正确答案:F
& s5 M$ H; b3 K" V3 V6 _. ?
第44题,基于大数据研究个体或群体行为,发现活动中蕴含的空间认知规律及空间行为和交互模式,建立以人为本的地理信息服务,进而支持个体或群体时空行为决策。
T、对
F、错
更多答案下载:谋学网(www.mouxue.com)- V$ C6 X* C. ]/ p; f
% \+ z* F7 N& s9 G
第45题,利用大数据技术对电子病历中的数字化信息进行分析处理,既能够让医生的诊疗有迹可循,还可以发现最有效的临床路径,从而及时为医生提供最佳的诊疗建议。* A) d7 T$ ~" v' {2 ?
T、对
F、错
更多答案下载:谋学网(www.mouxue.com). \1 Y( M/ A! b0 R5 P
. \) P' |8 ~4 Y' x+ Q7 L* {
第46题,数据分析是大数据价值链中最终和最重要的阶段,其目的是挖掘数据中潜在的价值以提供相应的建议或决策。通过分析不同领域中的数据集可以使数据在不同层面发挥最大价值。3 H& V6 U/ v8 ^! e7 v& Y
T、对
F、错
更多答案下载:谋学网(www.mouxue.com)2 N" {- I+ r9 f6 O) n2 _) @
6 E: n0 S3 v& b0 M
8 j5 O( M$ `3 ^
第47题,数据表达是通过计算机图形图像技术来更加友好地展示数据信息,方便人们阅读、理解和运用数据
T、对% }4 S7 `9 [* S6 x* {2 {1 ^+ I
F、错
更多答案下载:谋学网(www.mouxue.com)- H2 L3 z# h, C1 u
+ \. l+ H- O: P2 s- h+ J# S
第48题,数据采集,又称数据获取,是大数据生命周期的第一个环节,通过RFID射频识别技术、传感器、交互型社交网络以及移动互联网等方式获得的各种类型的结构化、半结构化及非结构化的海量数据。
T、对
F、错+ _, ?/ c0 x4 [0 \+ `
7 y& h2 F( ^1 S# w1 ^( n: b$ }: {
第49题,大数据的挑战仅仅来自于数据的增长。
T、对
F、错8 _9 W5 q$ C. h/ H! R
正确答案:F9 o% Y; {0 u' _4 k5 R- X" j, D
! U# C% U) n2 @$ y* T
2 H! j) n# k4 |3 B
Gartner研究机构给出的大数据定义是大数据一般会涉及两种或两种以上的数据形式,它需要收集超过100TB的数据,并且是高速实时数据流;或者是从小数据开始,但数据每年增长速率至少为60%。! s% X' _' b6 F
T、对
F、错2 ]9 x' v0 w. ?( ~9 c
正确答案:F
页:
[1]