手记

数据仓库-DW/BI架构对比-读书笔记二

Kimball的DW/BI架构

Kimball DW/BI 架构的核心元素


    Kimball 分工明确,资源占用更加合理,调用链路少,整个DW/BI系统更加稳定、高效、有保障。
    ETL系统高度关注数据质量、完整性、一致性。输入数据在进入时要检查其质量。一致的获取增值度量和属性的业务规则由ETL系统中的有技能的专业人员开发,这样会给客户发布更好的、保持一致性的产品。
    展现区根据客户要求使用统一维度组织数据。方便,高效为BI应用提供数据服务。

独立数据集市架构

简化的独立数据集市架构


    优点:不需要考虑跨组织的数据控制和协调的问题,从短期效果来看,有利于较低成本实现快速开发。
    缺点:从长远来看,从相同的数据源重复获取数据,由于分析数据的冗余存储造成浪费和低效。
    没有从全局考虑问题,会导致大量不同解决方案,这些方案参杂了对组织指标互不兼容的视图,将会导致企业无休止的争吵和不协调

辐射装企业信息工厂Inmon架构

简化的辐射状企业信息工厂架构

    这种架构中企业数据仓库规范化是强制性的构件。但是这种规范化仅仅是建立在实现多对一关系的物理表。
    Kimball架构关注解决数据不一致性,但并未明确提出需要规范化。此种架构包含聚集数据(不是原子级细节数据),不够灵活。

混合辐射状架构与Kimball架构

包含第3范式结构和维度Kimball展现区的混合架构


    如果组织已经对企业做了投入,客户也不期望更加灵活实现报表和分析,这种方式可能非常适合。
    如果组织什么也没有,混合方法可能需要更多的开销和事件,无论是在开发期间还是运行期间,因为数据需要多次移动。原子细节数据冗余存储。
    成本高,开发周期长。



作者:数据僧
链接:https://www.jianshu.com/p/560752a6c67f


0人推荐
随时随地看视频
慕课网APP