作者:finedatalink
发布时间:2023.7.13
阅读次数:625 次浏览
设计思路:将原始数据几乎无处理地存放在数据仓库系统中,结构上与源系统基本保持一致
主要作用:
命名规则:层缩写_源系统_源系统表名 ods_my_order
挑战:
⭐️ 五种增量更新模式:
时间戳、日志、全表比对、MD5比对、触发器
演示附件:
1.1 多源数据连接
1.2 数据比对更新
1.3 数据管道-异构多源数据实时增量同步(基于日志)
设计思路:核心设计层,将从ODS层中获得的数据按照主题建立数据模型,对原始数据进行清洗和一致性处理,存放明细事实数据。
主要作用:
命名规则:层缩写_主题缩写_存储内容全称 dwd_mkt_sign
建设重点:数据清洗和一致性处理
演示附件:包含API的JSON解析、数据关联、SparkSQL等操作
设计思路:以分析对象作为建模驱动,基于上层的应用和产品的共性需求,构建公共粒度的汇总指标表。以宽表化手段物理化模型,为应用层提供统一计算口径和数据标准,提高效率。
主要作用:
命名规则:层缩写_主题缩写_存储内容全称 dws_mkt_order
建设重点:
演示附件:处理后的大宽表直接给到BI公共数据集
设计思路:通过添加维度属性、关联维度等定义计算逻辑,完成属性定义的过程并建立一致的数据分析维表。
主要作用:
命名规则:层缩写_维度定义_自定义命名标签 dim_asale_itm
挑战:
演示附件: 拉链表的建设(拉链表不仅仅在DIM缓慢变化维使用,在ODS、DWD均有使用)
设计思路:根据业务需要,存放数据产品个性化的报表数据,可以直接提供查询展现,保证效率。
主要作用:
命名:层缩写_主题缩写_表单全称 ADS/DM_mkt_XSJSC
建设重点:
演示附件:任务调度,输出结果数据给到报表/查询使用
数据集成平台产品更多介绍:www.finedatalink.com
上一篇: 关于离线数仓和准实时数仓的8大关键把控下一篇: 数据调度工具推荐!值得收藏!