南开大学《商务智能方法与技术》课程复习资料
《商务智能方法与技术》课程复习资料一、客观部分:(判断、不定项选择)
(一)、判断部分
★ 考核知识点:商务智能系统
附 1.1.1(考核知识点解释):
商务智能是企业利用现代信息技术收集、管理和分析结构化和非结构化的商务数据和信息,创造和累计商务知识和见解,改善商务决策水平,采取有效的商务行动,完善各种商务流程,提升各方面商务绩效,增强综合竞争力的智慧和能力。
商务智能不是通常的业务处理。它的目标是如何更快、更容易地做更好的决策。
IBM商务智能解决方案远远不只是数据和技术的组合,BI帮助用户获得正确的数据,发现它的价值,并共享价值。
★ 考核知识点:知识概念
附 1.1.2(考核知识点解释):
知识就是对信息进行的提炼、比较、挖掘、分析、概括、判断和推论。知识分为事实性知识和经验知识。事实性知识是人类对于客观事物和现象的认识结果。经验知识多事一种隐性知识,是存储在人们大脑中的经历、经验、技巧、体会和感悟等尚未公开的知识。
隐性知识和显性知识之间是可以相互转化的。
★考核知识点:元数据
附 1.1.3(考核知识点解释):
元数据管理包括对开发、管理数据仓库时所用的技术元数据和支持业务人员的业务元数据进行管理,它对数据仓库的设计和维护具有重要的作用。
数据仓库的所有数据都要通过元数据来管理和控制。元数据描述关于源数据的说明,包括源数据的来源、源数据的名称、源数据的定义、源数据的创建时间等对源数据进行管理所需要的信息。
源数据的来源说明源数据是从哪个系统、哪个历史数据、哪个办公数据、哪个Web页、哪个外部系统抽取而来。源数据说明源数据在数据仓库的作用、用途、数据类型和长度等。
元数据:是用来描述数据的数据。它描述和定位数据组件、它们的起源及它们在数据仓库进程中的活动;关于数据和操作的相关描述(输入、计算和输出)。元数据可用文件存在元数据库中。元数据反映数据仓库中的数据项是从哪个特定的数据源填充的,经过哪些转换、集成过程。
要有效的管理数据仓库,必须设计一个描述能力强、内容完善的元数据。
★ 考核知识点:数据分析
附 1.1.4(考核知识点解释):
在线分析处理比较常用的操作包括对多维数据的切片与切块、等。
切片和切块(Slice and Dice):
在多维数据结构中,按二维进行切片,按三维进行切块,可得到所需要的数据。如在“城市、产品、时间”三维立方体中进行切块和切片,可得到各城市、各产品的销售情况。
钻取(Drill):
钻取包含向下钻取(Drill-down)和向上钻取(Drill-up)/上卷(Roll-up)操作,钻取的深度与维所划分的层次相对应。
★ 考核知识点:数据集市
附 1.1.5(考核知识点解释):
数据仓库是企业级的,能为整个企业各部门的运行提供决策支持手段。而数据集市( Data Mart )是部门级别的,一般只能为某个局部范围内的管理人员服务,也称为部门级的数据仓库。
数据集市有两种:独立的数据集市和从属的数据集市。
★ 考核知识点:知识管理
附 1.1.8(考核知识点解释):
知识管理综合运用战略、组织、流程、技术、变化等多种措施和管理工具,以富有效率的方式组织资源实现其管理目标。
★ 考核知识点:OLAP与OLTP
附 1.1.9(考核知识点解释):
OLAP的目标是满足决策支持或多维环境特定的查询和报表需求,它的技术核心是“维”这个概念,因此OLAP也可以说是多维数据分析工具的集合。
快速性:用户对OLAP的快速反应能力有很高的要求。系统应能在5秒内对用户的大部分分析要求做出反应。客户/服务器体系结构-两层或三层C/S结构。
可分析性:OLAP系统应能处理与应用有关的任何逻辑分析和统计分析。
多维性:多维性是OLAP的关键属性。系统必须提供对数据的多维视图和分析,包括对层次维和多重层次维的完全支持。
信息性:不论数据量有多大,也不管数据存储在何处,OLAP系统应能及时获得信息,并且管理大容量信息。
★ 考核知识点:商务智能
附 1.1.10(考核知识点解释):
商务智能的主要功能包括:数据集成,(找到特定商业问题所有的相关信息经常是一件困难而费力的事情)、信息呈现 、经营分析、战略决策支持。
(二)、不定项选择部分
★ 考核知识点: 知识管理系统
附 1.2.1(考核知识点解释):
知识管理系统是收集、处理、分享一个组织的全部知识的信息系统,通常有计算机系统支持。它包括数据库、人、数据仓库、互联网。
★ 考核知识点:维的概念
附 1.2.3(考核知识点解释):
维:是人们观察数据的特定角度,是考虑问题时的一类属性 (时间维、地理维等)。
维的层次:人们观察数据的某个特定角度(即某个维)还可以存在细节程度不同的各个描述方面(时间维:日期、月份、季度、年)。
维的成员:维的一个取值。是数据项在某维中位置的描述。(“某年某月某日”是在时间维上位置的描述)
★ 考核知识点:日志挖掘
附 1.2.4(考核知识点解释):
Web日志挖掘是从用户访问日志(包括搜索引擎日志等)中获取有价值的信息,即通过分析Web日志数据,发现访问者存取Web页面的模式。
理解用户的行为,改进站点结构,发现潜在用户,为用户提供个性化的服务,增强网站的竞争力。
★ 考核知识点:商务智能
附 1.2.6(考核知识点解释):
商务智能的主要功能包括:数据集成,(找到特定商业问题所有的相关信息经常是一件困难而费力的事情)、信息呈现 、经营分析、战略决策支持。
★ 考核知识点:决策的过程
二、主观部分(填空题、名词解释、简答题)
简答题
1、简述数据规约的几种策略。
2、试画图说明从属数据集市的含义。
3、画图说明数据挖掘的过程。
4、请简述商务智能的作用。
5、试画图说明决策的过程。
6. 画表格简述数据库和数据仓库的关系。
7、Apriori算法是数据挖掘中挖掘频繁项集的关键算法,请回答下列问题:
(1)请解释什么是频繁项集(假设目标集合中只有正例和反例)。(2分)
(2)请写出Apriori算法的伪代码。(10分)
8、K-means是最基本的聚类算法,请回答下列问题:
(1)K-means算法适用于哪类数据,局限性在哪里,改进算法有哪些。
(2)简述算法过程
9、试画图说明独立数据集市的含义。
10、决策树是分类算法中一种非常有效的算法,请回答下列问题:
(1)决策树中的信息增益,即熵,如何计算,请写出计算公式(假设目标集合中只有正例和反例)。
(2)写出ID3算法的伪代码。
页:
[1]