本书从维度建模的基本知识入手,通过给出零售、库存、采购、订单管理、客户关系管理、账目、人力资源管理、财经服务、电信与公用事业、交通、教育、卫生护理、电子商务以及保险等方面的实例研究,全面、深入、透彻与具体地介绍了利用维度模型设计与开发数据仓库的综合技术知识。同时,本书对数据仓库在当前社会与技术背景下的发展前景进行了很有远见的探索。本书先介绍基本知识,然后逐个讨论具体实例内容,最后进行综合总体分析,在内容的结构方面很有特色。
本书主要是为数据仓库设计人员、技术人员以及管理人员而写的。此外,对于积极参与数据仓库初期规划工作的业务分析人员来说,本书也有很高的学习价值。
第1章 维度建模初步
1.1 信息应用的不同领域
1.2 数据仓库的最终目标
1.3 数据仓库的组成
1.4 维度建模词汇表
1.5 关于维度建模的神话
1.6 总结
第2章 零售营销
2.1 四步维度设计过程
2.2 零售实例的研究
2.3 维度表属性
2.4 零售方案的运用
2.5 零售方法的扩展
2.6 经受住安逸诱惑的考验
2.7 代理关键字
2.8 市场篮子分析
2.9 总结
第3章 库存
3.1 值链的引入
3.2 库存模型
3.3 值链的集成
3.4 数据仓库总线结构
3.5 总结
第4章 采购
4.1 采购案例研究
4.2 采购事务
4.3 渐变维度
4.4 混合渐变维度处理方法
4.5 快变维度
4.6 总结
第5章 订单管理
5.1 订单管理的引入
5.2 订单事务
5.3 订单任务流水线累积快照
5.4 事实表的比较
5.5 实时分区的设计
5.6 总结
第6章 客户关系管理
6.1 CRM概述
6.2 客户维度
6.3 多业务处理的客户数据分析
6.4 总结
第7章 账目
7.1 账目案例研究
7.2 一般分类总账方面的数据
7.3 预算处理
7.4 OLAP与封装分析型方案的角色
7.5 总结
第8章 人力资源管理
8.1 维度中时间标记事务的跟踪
8.2 审计维度
8.3 关键词支架维度
8.4 调查表数据
8.5 总结
第9章 财经服务
9.1 银行业案例研究
9.2 维度精选
9.3 事实的自由值分段
9.4 时间点结余
9.5 异构产品方案
9.6 总结
第10章 电信与公用事业
10.1 电信实例研究
10.2 设计复查要考虑的一般因素
10.3 草案设计活动的讨论
10.4 地理位置维度
10.5 总结
第11章 交通
11.1 飞机常客实例研究
11.2 向其他行业的扩展
11.3 将微型维度组合成超级维度
11.4 日期与时间方面更多的考虑
11.5 总结
第12章 教育
12.1 大学实例研究
12.2 用于维度跟踪的累积快照
12.3 非事实型事实表
12.4 其他领域的分析兴趣
12.5 总结
第13章 卫生保健
13.1 卫生保健值环
13.2 卫生保健单据
13.3 复杂卫生保健事件
13.4 医药记录
13.5 内容回顾
13.6 总结
第14章 电子商务
14.1 Web客户-服务器交互指南
14.2 为什么点击流并不仅仅是另外一种数据源
14.3 用于整个会话的点击流事实表
14.4 用于单个页面事件的点击流事实表
14.5 聚集点击流事实表
14.6 将点击流数据中心集成到企业数据仓库
14.7 商务利润率数据中心
14.8 总结
第15章 保险
15.1 保险实例研究
15.2 保单事务
15.3 保单周期快照
15.4 更多的保险实例研究背景
15.5 索赔事务
15.6 索赔累积快照
15.7 保险/索赔合并快照
15.8 非事实型事故事件
15.9 维度建模要避免的常见错误
15.10 总结
第16章 建立数据仓库
16.1 业务维度生命周期路线图
16.2 项目规划与管理
16.3 业务需求定义
16.4 生命周期技术路径
16.5 技术体系设计
16.6 产品选购与安装
16.7 生命周期数据路径
16.8 维度建模
16.9 物理设计
16.10 数据转储系统的设计与开发
16.11 生命周期分析型应用路径
16.12 配发
16.13 维护与扩展
16.14 建立数据仓库需要避免的常见错误
16.15 总结
第17章 相关知识与展望
17.1 正在出现的技术进步
17.2 安全需求与隐私影响方面的政治压力
17.3 精心设计而避免出现灾难性的失败
17.4 知识产权与公平使用
17.5 数据仓库应用方面的文化取向
17.6 结束语
术语表
读者对象
本书主要是为数据仓库设计人员、技术人员以及管理人员而写的。此外,对于积极参与数据仓库初期规划工作的业务分析人员来说,本书也有很高的学习价值。
即使不直接负责维度模型的开发工作,但作为数据仓库项目组的成员,每个人对维度建模的概念有所了解也是非常重要的。维度模型对数据仓库实施的多个方面都有影响,这些方面涵盖从业务需求转换开始,经过数据转储,最后到通过分析型应用对数据仓库进行揭示等环节。由于这些工作涉及面十分广泛,因此项目团队需要对维度建模非常精通,而不管各自的主要职责内容是项目管理、业务需求分析、数据体系结构、数据库设计、数据转储、分析型应用还是培训与保障等。本书的写作就考虑了读者在这些方面的广泛需要。
对于已经阅读过本书第一版的读者来说,将会看到有些熟悉的案例研究重新出现在了本书中,不过,本书还是对它们进行了很大的更新,并增加了更为丰富的内容。书中为包括卫生护理、电信与电子商务等在内的新行业,开发了一些简单的应用。此外,本书也为诸如人力资源、账目管理、采购与客户关系管理这样的业务功能,引入了较多的可跨行业横向使用的案例研究。
本书略微涉及了一些技巧性的内容。维度建模主要是以关系型数据库作为背景来进行讨论的,并假定读者已经具备了诸如表、行、关键字与连接之类的关系型数据库概念方面的基本知识。这样做是考虑到如果不以一门特定技术为背景,而只是对维度模型进行泛泛的讨论,就不可能深入到具体的物理设计内容中去,从而也就不可能为任何一种数据库管理系统提供统一的指导。
各章预览
本书是围绕一系列业务的简单应用或者案例研究来组织内容的。我们认为,对照实例来开发设计技术是特别有效的方法,因为这可以使人体会到实实在在的启发。虽然并不打算将这些实例当做完整的应用或者行业方案,但它们也确实起到了作为讨论维度建模中出现的模式框架的作用。经验表明,通过从所有自己过于熟悉的应用复杂性中挣脱出来而考虑另外的业务,通常就更容易抓住设计技术的主要部分。第一版的读者已经对这种方法表示出浓
厚的兴趣。
本书各章是相互照应的。翻开书本首先看到的是些基本概念,然后才逐步引入比较高级的内容。每位读者最好按顺序来阅读所有各章。比如说,除非已经阅读了前面介绍零售、采购、订单管理与客户关系管理等内容的几章,否则对于第15章描述保险的内容是很难理解的。
看过第一版的读者可能倾向于跳过本书的开头几章。虽然前面关于事实与维度的背景知识可能是你再熟悉不过的草根皮,但还是希望你不要跑得太过于靠前。例如,尽管第一个实例研究确实像第一版所做的那样,将注意力集中在零售行业方面,但是,该版本却推出一种全新的方法,并用它来给出一个致力于处理机构原子型基本数据的更为全面的实例。如果你向前跳得太快,就会错过这样的原理性内容以及针对基本概念做出的其他更新。
导读内容
本书用提示、关键概念与各章指南等内容对正文进行了修饰,以帮助现在的阅读和将来更容易的查阅。此外,本书还提供了一个经过扩展的术语表。
总结
本书的目标是为维度数据仓库的设计介绍一套标准的技术方法。简略地说,作为读者,如果通过本书的阅读能建立起数据仓库必须由业务用户的需要来驱动,并因此从一个简单的维度视角来建立与展示数据仓库这样的理念,那么本书就达到目的了。我们深信,有了这些前提,你已向成功的数据仓库设计迈出了一大步。
到此为止,你应该知道我们要努力实现的目标了,当然该是深入讨论细节内容的时候了。第1章将从维度建模的初步知识开始介绍,以便统一给出一些关键的术语与有关体系结构的概念。随后,将从屡试不爽的零售业入手,讨论维度建模的基本技术方法。