[南开大学]20春学期《大数据导论》在线作业-1(答案100分)
-[南开大学]20春学期(1709、1803、1809、1903、1909、2003)《大数据导论》在线作业
试卷总分:100 得分:1008 K: B; L5 a% ]4 H" f. {* c* h
第1题,大数据的特点不包含) v8 k7 O# B+ v% ?* z
A、数据体量大
B、价值密度高
C、处理速度快
D、数据不统一U7 K+ D3 m4 R: ?, y- c9 \( [8 e
正确答案0 \# n4 {+ g5 {
, P; v8 q& b. c! w. `
第2题,基础设施即服务的英文简称是; I* e" R8 h& o' ?0 P* z+ n
A、IaaS
B、PaaS/ n7 k& c" q( f( ~2 T% w
C、SaaS, L2 Y; u$ ], n0 A
正确答案:2 r$ W& C1 l# I. K+ G3 P% S
+ w3 J2 k& ^5 X: B- l: q5 @
第3题,下面哪一项不是中国发展大数据产业的基础()。\3 H5 }' G$ O, j' x" ~
A、信息化积累了丰富的数据资源
B、大数据技术创新取得明显突破3 k5 N8 O/ o, |
C、大数据应用推动势头良好
D、大数据产业支撑薄弱7 a& E. J- v7 N6 F5 Y
正确答案
第4题,数据清洗的方法不包括' |/ |7 B8 m3 d0 l* a
A、缺失值处理" j) h/ g5 i. L: ]' A9 `! b9 [
B、噪声数据清除. M4 ]1 l9 ~5 u* e( y
C、一致性检查! Q; x* E, O- U& V
D、重复数据记录处理7 z* z6 ^$ Y2 _* U% p3 o
正确答案
3 Z( v" C4 K. j* F
答案来源:谋学网(www.mouxue.com),以下不是数据仓库基本特征的是()2 Q0 Y% m% ~+ u$ j/ z- n' q) }
A、数据仓库是面向主题的
B、数据仓库是面向事务的
C、数据仓库的数据是相对稳定的
D、数据仓库的数据是反映历史变化的7 D/ e* Q8 f5 |: _* d6 Q& `# v
正确答案:
第6题,数据产生方式变革中数据产生方式是被动的主要是来自哪个阶段()。& t% G. x+ v5 o, ~* x
A、运营式系统阶段6 n& W# T1 N- T2 a7 _
B、用户原创内容阶段
C、感知式系统阶段
正确答案:& ?# V1 |" U+ f1 |) M7 i+ t( Y
9 K% _" ^& `) r/ s( T$ a. b
$ t6 tP8 L6 d" Y* s
第7题,数据产生方式变革中数据产生方式是自动的主要是来自哪个阶段()。
A、运营式系统阶段
B、用户原创内容阶段
C、感知式系统阶段
正确答案:" A, s# B+ P' d: \9 P
: w- B8 z1 c1 \3 m+ m- ~2 W3 ~
+ j: v. ]* |0 C5 _b
第8题,数据仓库是随着时间变化的,下列不正确的是()
A、数据仓库随时间变化不断增加新内容
B、捕捉到的新数据会覆盖原来的快照0 [# F# Y% j1 f# J/ t
C、数据仓库随事件变化不断删去旧的数据内容9 R$ V. i+ |5 S' e6 q. S. P
D、数据仓库中包含大量的综合数据,这些综合数据会随时间的变化不断进行重新综合
正确答案:
1 _3 v0 V2 R* X5 i& d6 R
第9题,购物篮问题是##的典型案例
A、数据变换2 @+ P7 c4 z$ K0 A
B、关联规则挖掘
C、数据分类
正确答案:
/ D* M! b0 C* p1 Z
答案来源:谋学网(www.mouxue.com),PaaS是()的简称
A、软件即服务
B、平台即服务1 ]$ k% s7 i: {
C、基础设施即服务$ Z4 nS& B% A
D、硬件即服务
正确答案:
第11题,下列哪个R语言扩展包可以制作一系列的图像并将它们串联起来做成动画()
A、ggplot2
B、network
C、ggmaps
D、animation
正确答案; w- ?- S$ k! S( H9 m4 T+ X
# o7 c" l5 [$ U% E! @" `
答案来源:谋学网(www.mouxue.com),数据产生方式变革中数据产生方式是主动的主要是来自哪个阶段()。. q0 R! k) O# }& }, B) ~
A、运营式系统阶段
B、用户原创内容阶段
C、感知式系统阶段) n+ c5 g6 C5 s+ `4 f; c
正确答案:
/ n2 ]6 x8 ^3 T% z; B4 v
第13题,哪个选项不属于大数据4V特点?
A、Volume
B、Valid1 v3 t/ h% N% J' W% ]
C、Variety
D、Value( D0 R: N( ]' ?
正确答案:
4 W% Vr3 a; N3 J- W
" [$ O4 S! M( U9 G3 S; [
第14题,以下哪项不是数据可视化工具的特性()) r! k& j, j. ]+ e
A、实时性
B、简单操作
C、更丰富的展现
D、仅需一种数据支持方式即可
正确答案* ~- j7 Y& j; I. Q4 z: S
) v8 O6 GT" n: q- u, F* i: W" ?
答案来源:谋学网(www.mouxue.com),()是Microsoft Office的核心组件
A、SQL; H* |7 r& Z9 V
B、WORD- [- H/ z4 g7 V& D4 ^
C、PPT
D、EXCEL0 s" z2 a! g: K% M5 v; Y' }
正确答案
& O7 x6 @/ S/ [6 N% T- U4 l5 j
第16题,云计算的特点是()
A、大规模8 ^+ \. Z4 s; {7 j
B、高扩展性. V6 n! p4 |1 @! X) Q
C、虚拟化+ D) l! P! pE6 p) e
D、按需分配
正确答案:,B,C,D
* l. `9 V9 X# u, w
9 \! g2 x/ [6 P! T2 d7 N8 V\
第17题,大数据时代预测人类移动行为的数据来源有4 W( w/ s, y9 \+ K9 o( a; L" K
A、志愿者定位数据2 E+ j& R* X4 [6 }
B、装有导航设备的出租车轨迹数据
C、手机终端定位于通讯记录
D、社会网络签到数据# W0 w, V+ q" |7 `% o
正确答案:,B,C,D
4 e- b$ M0 d# u
第18题,百度大数据引擎主要包含三大组件()$ |4 ?$ V; J+ B/ s' @: {# _0 ^
A、开放云9 Si* R) J9 l
B、数据工厂
C、百度大脑。4 t3 v+ xw/ f- Q' M2 M6 \
正确答案:,B,C! K9 ?0 S/ e& p1 r& ]7 ^* S
' L* }" I% N8 K1 x2 \^
第19题,KNIME(Konstanz Information Miner)是一个对用户友好的、智能、开源的平台。该平台包括了##、##、##、##。
A、数据集成
B、数据处理) Z7 p# s) d0 k
C、数据分析
D、数据挖掘$ U/ j5 r; y: k$ }, Q1 \# k8 U7 e
正确答案:,B,C,D
答案来源:谋学网(www.mouxue.com),大数据时代预测人类移动行为的数据特点是( d1 g+ r, w! Y8 r! Z
A、多样化& |* r/ I% h5 ^# U/ M- w
B、数据量大. m% E5 ]0 e: \+ b' i
C、维数高. ~6 Q* \& X; E
D、变化快/ v4 t+ @7 g/ t9 N7 Tq
正确答案:,C,D
第21题,大数据采集主要包括()四种。6 P0 q1 r, J$ p
A、系统日志采集
B、网络数据采集
C、数据库采集2 M4 m5 E. P3 |& {" G5 z
D、其他数据采集; a+ I9 T: X8 }; a; [
正确答案:,B,C,D
第22题,数据工厂包括$ l$ F. n4 d* a
A、低能耗数据中心
B、超大规模讲分布式架构
C、新一代智能自动化运维5 bL4 V( }5 c
D、超强云安全
正确答案:,B,C,D
% Q, K7 S- @8 d' P- P" W; l
第23题,数据分析的类型根据数据分析深度可以分为()
A、描述性分析* S( \" U* b, PE: V
B、预测性分析s
C、规则性分析
正确答案:,B,C# Q$ _" I9 A9 |: N7 x5 ~- a* l3 `
5 e0 ~; ^2 k) e2 m
4 g! m, E/ q( `" w/ c4 F
第24题,主流分布式计算平台有()
A、google+ e# n# t% {& y6 R8 D$ e+ |7 w
B、IBM
C、baidu2 k8 D; i+ R" J
D、Amazon/ E1 j/ `: S( s- q
正确答案:,B,D
& C) a8 b( _, X0 k5 eh: U
答案来源:谋学网(www.mouxue.com),交通数据分析可用于:7 |5 o% W( e: w- S
A、交通流量实时分析5 `% cE1 \& r) s& Q. V
B、合理进行道路规划
C、信号灯智能调度
D、实时路况查询播报8 w8 F) G" [) ~7 c3 C/ l* R( [
正确答案:,B,C,D
; [5 w6 x" S, X, z% T+ I8 F
第26题,互连网上出现的海量信息可以划分为三种,分别为( )
A、结构化信息
B、非结构化信息0 r2 _) Z. s" y' |2 Y
C、半结构化信息, [. ~7 w, A! S) l( f4 u
D、特殊化信息
正确答案:,B,C" G4 n0 |4 x5 t: c0 g
' ^- I/ v$ B! Q, n
第27题,一个HDFS集群由一个##和##构成。此外,还有与这两个角色之间作为沟通桥梁的客户端(Client)。. v1 j0 x. B- u: M) p
A、一个名字节点8 v2 H~* e) t! {[7 E
B、若干个名字节点6 r: ^, Z+ Y& c) J0 P' }5 h
C、一个数据节点
D、若干个数据节点
正确答案:,D
: ~# Y% Sb' s, ]+ f8 C; Q0 Z
第28题,大数据在社交网络中的应用
A、用户偏好、情感、社交网络结构
B、用户画像、精准推荐
C、舆情监控、突发事件预警5 i& v7 ?2 Q; c
D、预测外部趋势
正确答案:,B,C,D
第29题,开放云()
A、价值呈现:大数据应用价值呈现和创新不足3 C' d! e1 z" l5 t5 J7 _; t6 @
B、应用建设:周期长、门槛高、多冗余、体验差' R1 H& z. K+ m9 W7 e# l
C、组织流程:应用跨部门,缺乏流程贯串和使能业务生产3 I2 \! m/ V( I3 z9 }5 K8 v; B
D、生态建设:无法有效构建和融入新的数字生态圈2 K; t) U$ I0 B" F( O
正确答案:,B,C,D
; j, v( A. W0 N3 Hs2 p' {
答案来源:谋学网(www.mouxue.com),大数据在电信中的应用有" `. T! h2 }' e2 Z
A、基于用户、业务及流量分级的多维管控机制
B、精准的客户分析及营销
C、利用位置和轨迹信息服务社会9 e+ W; D& Dt0 a6 g
正确答案:,B,C4 M. x9 t5 E7 D2 z, M6 y& I2 }
& j* [1 ?9 `, x" w& kc
* G9 H* m( W4 c2 d5 l2 u+ v
第31题,数据存在形式包括结构化数据和结构化数据* o0 C+ Ku% a* |) ^
T、对
F、错* k+ ^) i2 Z4 X+ I! [
正确答案:F. P% B+ }- J" p/ ~# R* h
0 a4 c- ?: p" }% d+ z0 t0 O$ A2 j- ]% |
第32题,数据可视化。将大型数据集中的数据通过图形图像方式表示,并利用数据分析和开发工具发现其中未知信息。
T、对. F( x7 L% T, }2 f
F、错M3 O2 K* D" j1 O# \7 E
更多答案下载:谋学网(www.mouxue.com)
第33题,Spark是基于内存的大数据并行计算框架2 |- s' e; e- [" G9 B5 o
T、对, E1 d( N' D# r0 ]1 |' y
F、错
更多答案下载:谋学网(www.mouxue.com)
第34题,非结构化数据是指非纯文本类数据,没有标准格式,无法直接解析出相应的值
T、对
F、错; q" p$ S[7 C_+ _* c8 S
更多答案下载:谋学网(www.mouxue.com)# q, mE6 H! |
# i' O9 D% T- _/ ng
第35题,箱式图用于描述数据的分散情况,主要数据节点包括:均值、中值、等中心值的度 量,标准偏差、方差等可变性度量。
T、对8 k+ u7 @% ]i9 O
F、错
更多答案下载:谋学网(www.mouxue.com)3 H4 z( _! ]$ q
- t( O, ^! Z% I4 X$ y' @
第36题,Pentaho是最流行的开源商业智能软件之一
T、对+ P! ?, J+ I6 q/ K
F、错
更多答案下载:谋学网(www.mouxue.com)& ?& M; f' a7 S: ~1 y) J8 L) ~
第37题,网络数据采集是利用互联网搜索引擎技术对数据进行针对性、行业性、精准性的抓取,并按照一定规则和筛选标准将数据进行归类,形成数据库文件的一个过程。4 D0 aw- x' m! F% C
T、对( b$ y, b8 K% h% n6 g_
F、错
更多答案下载:谋学网(www.mouxue.com)
第38题,云存储不仅是存储设备或技术,更是一种服务的创新。
T、对
F、错( U5 [3 n/ Mk" C8 |; o4 U
更多答案下载:谋学网(www.mouxue.com)/ |5 p) e, C9 f* \( ]; I* o
1 x4 d/ i1 \/ O& RV
第39题,当数据量表完全超过BI和传统关系数据库的能力时,我们将用到海量数据分析。
T、对w/ c: P6 L2 Q( RH! B
F、错, q9 `1 a6 W7 \+ }
更多答案下载:谋学网(www.mouxue.com)
4 N& [" X# s. U5 @4 s6 K! Z
第40题,IDC给出的大数据定义是大数据(Big Data)是需要新的处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。( J% v0 S; g) a" L0 G$ r% v
T、对+ |1 E9 S) n( s: |; W, Z
F、错
正确答案:F5 [: |+ g: R; m: Vu2 B3 Y
0 a# x: {- [& f9 r( d
第41题,Paas:软件即服务。它是一种通过Internet提供软件的模式,用户无需购买软件,而是向提供商租用基于Web的软件,来管理企业经营活动。
T、对* v5 [4 s2 j" w1 G3 N
F、错
正确答案:F
[3 v6 j( O) h' W0 {
第42题,关联分析是在数据集D中找出大于用户所给定的最大支持度阈值和最大置信度阈值的关联规则。; B) r/ L* N4 z4 ?: e# Y
T、对
F、错
正确答案:F$ S. E+ t* ]eu6 L
/ F) \% g* R! [, I3 s
第43题,数据的大量聚集,使得黑客一次成功的攻击能够获得更多的数据,无形中降低了黑客的进攻成本,增加了"收益率"。6 b& _# ir( d( B* t( k& g
T、对
F、错
更多答案下载:谋学网(www.mouxue.com)
- ^( s" h5 P) z2 X. Q5 U- t
第44题,数据采集,又称数据获取,是大数据生命周期的第一个环节,通过RFID射频识别技术,传感器,交互型社交网络,移动互联网等方式获得的各种类型的结构化、半结构化及非结构化的海量数据。( l* o7 K+ |7 L6 U6 Y) ~, Q4 ^
T、对
F、错R: ]: S, T`- G( b
更多答案下载:谋学网(www.mouxue.com)
第45题,社交网络一一通常由通过一些特定类型的相互依赖关系(例如,亲属关系、友谊、共同兴趣、信念或金融交换)链接的社会实体(例如,个人、公司、集体社会单位或组织)组成。- ]/ o" ~$ b* U- q% L
T、对
F、错
更多答案下载:谋学网(www.mouxue.com)9 K2 c6 o- O8 H' b. q
' W( n4 d0 o2 E: [# O9 @3 I# Z
" H: r' d0 p. G- K# Q
第46题,数据表达是通过计算机图形图像技术来更加友好地展示数据信息,方便人们阅读、理解和运用数据
T、对
F、错% Z1 O7 f3 f% U# d& i1 U+ r' x* g
更多答案下载:谋学网(www.mouxue.com)
/ N( R0 ]" n* E* Z
4 l$ |5 b7 c7 `3 C8 Z0 \
第47题,时空数据是指带有地理位置与时间标签的数据。
T、对3 O" K3 |! b- O2 ^2 ~
F、错
第48题,大数据从概念化走向价值化是大数据的发展趋势. \: p& x+ C3 }; t" i% q
T、对
F、错6 {4 \1 X7 W8 I1 @; n
第49题,大数据的应用之一是,促进健康管理的个性化和多元化。
T、对
F、错
FP-growth算法需要对数据库进行三次扫描9 o( Q" G2 h4 M/ ^- R/ ~' R
T、对1 U; n4 r9 a# T7 W
F、错
正确答案:F
页:
[1]