作者:finedatalink
发布时间:2023.7.7
阅读次数:535 次浏览
数据仓库一般分为三层,分别为数据进出口贴源层(ODS,Operation Data Store)、数据公共层(CDM,Common Data Model)和数据应用层(ADS,Application Data Service)。其中CDM层又分为DWD明细层、DWS轻度汇总层和DIM维度层。
数据仓库ODS层将业务数据几乎无处理地同步备份到数据仓库里,后续所有的数据计算都不会影响原来的业务系统。它的主要作用是分离业务库和分析库,不影响业务系统正常使用,同时保证数据的完整性。所以数据仓库ODS层面临的挑战就是数据源多样、数据结构多样、增量变化的获取等。
DWD层:DWD是数据仓库的建设核心,因为我们需要将数据仓库ODS层的原样数据按照主题去建立相应的数据模型,对原数据进行清洗和一致性处理,存放明细事实数据。像跨表跨库的格式规范统一、脏数据的清洗等都会在DWD层搞定,或者和DMI层进行关联匹配、维度增加。
DWS层:在DWS层,就会以分析对象为建模驱动,把DWD清理好的一些表进行跨关联,建立面向业务主题的大宽表模型,为应用层提供统一的计算口径和数据标准,提高效率。
DIM层:在DIM层需要通过添加维度属性、关联维度等定义计算逻辑,完成属性定义的过程并建立一致的数据分析维度表。
这一层根据业务需要来存放个性化的报表数据,可以直接为前端的报表提供查询和展现的服务。
ADS和DWS的不同之处在于, DWS是总结数据共性力度的业务大宽表。比如应用BI的时候,可能会对大宽表做条件的筛选,或者再一次进行维度匹配等。但ADS层存放结果数据,前端可以不经过任何的数据处理直接读取并且直接使用,通常会应用于大屏或移动端报表看板上。
1. 清晰数据结构:每一个数据分层都有它的作用域,在使用表的时候能更方便地定位和理解。
2. 统一数据口径:通过数据分层,提供统一的数据出口,统一对外输出的数据口径。
3. 减少重复开发:规范数据分层,开发一些通用的中间层数据,能够减少极大的重复计算。
4. 把复杂问题简单化:将一个复杂的任务分解成多个步骤来完成,每一层只处理单一的步骤,而且便于维护数据的准确性。
FineDataLink是一款低代码/高时效数据集成产品,可以实时采集、处理和存储数据,并提供强大的ETL功能和多种技术架构支持,可以帮助企业实现数据仓库分层。
同时,FineDataLink还提供了丰富的功能和工具,例如数据可视化、应用开发、数据质量管理和安全管理等,帮助企业更好地管理和利用数据。它的优势在于连接、高效、易用,通过快速连接、高时效融合多种异构数据,提供低代码Data API敏捷发布平台,帮助企业解决数据孤岛问题,提升企业数据价值。
数据集成平台产品更多介绍:www.finedatalink.com