三分钟读懂数据仓库分层架构

作者:finedatalink

发布时间:2023.7.7

阅读次数:536 次浏览

数据仓库分层的设计

数据仓库一般分为三层,分别为数据进出口贴源层ODS,Operation Data Store)、数据公共层CDM,Common Data Model)和数据应用层ADS,Application Data Service)。其中CDM层又分为DWD明细层DWS轻度汇总层DIM维度层

数据仓库分层架构

ODS层

数据仓库ODS层将业务数据几乎无处理地同步备份到数据仓库里,后续所有的数据计算都不会影响原来的业务系统。它的主要作用是分离业务库和分析库,不影响业务系统正常使用,同时保证数据的完整性。所以数据仓库ODS层面临的挑战就是数据源多样、数据结构多样、增量变化的获取等。

CDM层

DWD层DWD是数据仓库的建设核心,因为我们需要将数据仓库ODS层的原样数据按照主题去建立相应的数据模型,对原数据进行清洗和一致性处理,存放明细事实数据像跨表跨库的格式规范统一、脏数据的清洗等都会在DWD层搞定,或者和DMI层进行关联匹配、维度增加。

DWS层在DWS层,就会以分析对象为建模驱动,把DWD清理好的一些表进行跨关联,建立面向业务主题的大宽表模型,为应用层提供统一的计算口径和数据标准,提高效率。

DIM层:在DIM层需要通过添加维度属性、关联维度等定义计算逻辑,完成属性定义的过程并建立一致的数据分析维度表

ADS层

这一层根据业务需要来存放个性化的报表数据,可以直接为前端的报表提供查询和展现的服务。

ADS和DWS的不同之处在于, DWS是总结数据共性力度的业务大宽表。比如应用BI的时候,可能会对大宽表做条件的筛选,或者再一次进行维度匹配等。但ADS层存放结果数据,前端可以不经过任何的数据处理直接读取并且直接使用,通常会应用于大屏或移动端报表看板上。

数据仓库分层的好处

1. 清晰数据结构:每一个数据分层都有它的作用域,在使用表的时候能更方便地定位和理解。

2. 统一数据口径:通过数据分层,提供统一的数据出口,统一对外输出的数据口径。

3. 减少重复开发:规范数据分层,开发一些通用的中间层数据,能够减少极大的重复计算。

4. 把复杂问题简单化:将一个复杂的任务分解成多个步骤来完成,每一层只处理单一的步骤,而且便于维护数据的准确性。

fdl-etl

数据仓库分层的实现

FineDataLink是一款低代码/高时效数据集成产品,可以实时采集、处理和存储数据,并提供强大的ETL功能和多种技术架构支持,可以帮助企业实现数据仓库分层

同时,FineDataLink还提供了丰富的功能和工具,例如数据可视化应用开发数据质量管理和安全管理等,帮助企业更好地管理和利用数据。它的优势在于连接、高效、易用,通过快速连接、高时效融合多种异构数据,提供低代码Data API敏捷发布平台,帮助企业解决数据孤岛问题,提升企业数据价值。

fdl-免费试用

数据集成平台产品更多介绍:www.finedatalink.com

                         

上一篇: 下一篇: