`
seaflower
  • 浏览: 5103 次
  • 来自: ...
最近访客 更多访客>>
文章分类
社区版块
存档分类
最新评论

ETL架构中的38个子系统(二)

阅读更多

The 38 Subsystems of ETL

?

By Ralph Kimball, 20044

?

1.抽取系统(Extract System

?

主要功能包括源数据的适配器,推//搬运数据的工作调度,对源数据的过滤和排序功能,数据格式的转换,迁移到ETL环境后的数据暂存功能。

?

2.变化数据捕获系统(Change Data Capture System

?

主要功能包括对源数据日志文件的阅读功能,源数据日期和序列号的过滤功能,基于CRC算法的记录比较功能。

?

3.数据概况分析系统(Data Profiling System

?

主要功能包括字段属性分析,如参照域的分析;结构分析,如主外键关系分析;数据规则分析;值规则分析等。

?

4.数据清洗系统(Data Cleansing System

?

主要功能包括一个典型的数据字典驱动的系统,用于解析个体和组织的名称、地址等信息,也用来解析产品、场所等内容;一个“De-duplication”系统,用于鉴别和移除个体和组织信息,也用于产品和场所;一个“Surviving”系统,使用特定的数据合并逻辑,用来保存特定数据源的指定字段,这个特定数据源的数据将成为数据仓库的最终版本;为所有的数据源维护后台数据的对应关系,如自然键和代理键对应关系等内容。

?

5.数据一致性处理系统(Data Conformer System

?

主要功能包括标识和生成专用的一致性维度属性、一致性事实的度量属性,这两组属性作为数据整合工作的基础,用来支持跨多个数据源的数据集成工作。

?

原文请参阅这里<!----><o:p></o:p>

<o:p>?</o:p>

?

分享到:
评论

相关推荐

    ETL架构中的38个子系统1

    1.抽取系统(Extract System) 2.变化数据捕获系统(Change Data Capture System) 3.数据概况分析系统(Data Pr

    ETL架构师面试题

    1.什么是逻辑数据映射?它对ETL项目组的作用是什么?...28.简述在架构实时ETL时的可以选择的架构部件。 29.简述几种不同的实时ETL实现方法以及它们的适用范围。 30.简述实时ETL的一些难点及其实现方法。 ......

    商场数据仓库ETL系统架构设计.pdf

    商场数据仓库ETL系统架构设计.pdf商场数据仓库ETL系统架构设计.pdf商场数据仓库ETL系统架构设计.pdf商场数据仓库ETL系统架构设计.pdf商场数据仓库ETL系统架构设计.pdf商场数据仓库ETL系统架构设计.pdf商场数据仓库...

    ETL架构师面试题目

    ETL架构师必须掌握的知识,对希望从事ETL架构开发的工程师有用!

    分布式ETL体系架构,大数据,ETL

    分布式ETL体系架构设计,帮助你了解构建分布式数据抽取处理系统架构

    ETL 架构师面试题 数据仓库

    ETL 架构师面试题 数据仓库与PowerCenter相关的,可以一看。

    ETL架构师面试题.docx

    ETL架构师面试题.docxETL架构师面试题.docxETL架构师面试题.docxETL架构师面试题.docxETL架构师面试题.docxETL架构师面试题.docxETL架构师面试题.docxETL架构师面试题.docx

    ETL架构师面试题及答案

    ETL架构必备知识!

    ETL架构师面试题.pdf

    ETL架构师面试题.pdfETL架构师面试题.pdfETL架构师面试题.pdfETL架构师面试题.pdfETL架构师面试题.pdfETL架构师面试题.pdfETL架构师面试题.pdfETL架构师面试题.pdf

    ETL架构师常问问题.pdf

    ETL架构师常问问题.pdfETL架构师常问问题.pdfETL架构师常问问题.pdfETL架构师常问问题.pdfETL架构师常问问题.pdfETL架构师常问问题.pdfETL架构师常问问题.pdfETL架构师常问问题.pdf

    大唐ODS&ETL架构图.zip

    大唐ODS&ETL架构图

    ETL架构师面试题+PowerCenter+数据仓库

    ETL架构师面试题+PowerCenter+数据仓库 ETL架构师面试题+PowerCenter+数据仓库

    系统中ETL和数据集市的架构设计和实现(PPT)

    简介:作者结合实际工作的需求,在设计和实现某公司商务部分析报表系统的过程中对ETL与数据集市的架构进行了研究。该系统是某大型外资企业进行商务决策过程所需的分析报表系统,该系统能向相关部门提供每日更新、...

    基于Flink Hudi的增量ETL架构

    基于Flink Hudi的增量ETL架构

    BI ETL ELT Kettle 基础知识中文文档汇总

    ETL_调度系统技术方案说明书_V1.0.pdf ETL中的数据清洗设计.pdf ETL交流.pdf ETL培训.ppt ETL工具比较.pdf ETL应用浅析.pdf ETL开发实施中质量保证的关键要素V1.0.pdf ETL数据增量抽取方案.pdf ETL数据集成...

    ETL架构师常问问题.docx

    ETL架构师常问问题.docxETL架构师常问问题.docxETL架构师常问问题.docxETL架构师常问问题.docxETL架构师常问问题.docxETL架构师常问问题.docxETL架构师常问问题.docxETL架构师常问问题.docx

    python 实现ETL处理 架构

    python 实现ETL 处理 架构 1.可以处理数据装载的过程 2.实现SQL执行的函数封装 3.实现数据加工的模板

Global site tag (gtag.js) - Google Analytics