设计数据仓库
数据源集成性问题
- 相同数据,不同名字
- 不同数据,相同名字
- 这里的数据不在其他地方出现
- 不同关键字,相同的数据
一些注意事项
- 操作环境到仓库环境,存在技术上的变化,例如,不同的 DBMS 系统。
- 从操作环境选择数据的复杂性。选择哪些数据,字段?避免在操作窗口抽取数据。
- 数据的转换/标准化/验证。
- 数据源的区分。
数据建模
高层建模
聚焦于实体,关系。实体关系图 (ERD)
不同用户观点 ERD 结合,构造出了企业 ERD。
中间层建模
- 识别主要主题域
- 扩展每个主题域,形成各自的中间层模型(DIS)。
- DIS 中的实体可以连接到主题域。从 DDD 的角度,可以理解为聚合中,指向其他聚合根的引用。
物理层建模
物理数据模型从中间层而来,扩充其物理特性(库表设计,性能考量)。