`

数据仓库事实表分类

阅读更多

1)在数据仓库领域有一个概念叫Transaction fact table,中文一般翻译为事务事实表

事务事实表是维度建模的数据仓库中三种基本类型事实表中的一种,另外两种分别是周期快照事实表和累积快照事实表。 

事务事实表与周期快照事实表、累积快照事实表使用相同的一致性维度,但是它们在描述业务事实方面是有着非常大的差异的。

事务事实表记录的事务层面的事实,保存的是最原子的数据,也称原子事实表事务事实表中的数据在事务事件发生后产生,数据的粒度通常是每个事务一条记录。一旦事务被提交,事实表数据被插入,数据就不再进行更改,其更新方式为增量更新。 

事务事实表的日期维度记录的是事务发生的日期,它记录的事实是事务活动的内容。用户可以通过事务事实表对事务行为进行特别详细的分析。

通过事务事实表,还可以建立聚集事实表,为用户提供高性能的分析。

2)在数据仓库领域有一个概念叫Periodicsnapshot fact table,中文一般翻译为周期快照事实表

周期快照事实表以具有规律性的、可预见的时间间隔来记录事实,时间间隔如每天、每月、每年等等。典型的例子如销售日快照表、库存日快照表等。

周期快照事实表的粒度是每个时间段一条记录,通常比事务事实表的粒度要粗,是在事务事实表之上建立的聚集表。周期快照事实表的维度个数比事务事实表要少,但是记录的事实要比事务事实表多。

周期快照事实表的日期维度通常是记录时间段的终止日,记录的事实是这个时间段内一些聚集事实值。事实表的数据一旦插入即不能更改,其更新方式为增量更新。

3)在数据仓库领域有一个概念叫Accumulatingsnapshot fact table,中文一般翻译为累积快照事实表

累积快照事实表和周期快照事实表有些相似之处,它们存储的都是事务数据的快照信息。但是它们之间也有着很大的不同,周期快照事实表记录的确定的周期的数据,而累积快照事实表记录的不确定的周期的数据。 

累积快照事实表代表的是完全覆盖一个事务或产品的生命周期的时间跨度,它通常具有多个日期字段,用来记录整个生命周期中的关键时间点。另外,它还会有一个用于指示最后更新日期的附加日期字段。由于事实表中许多日期在首次加载时是不知道的,所以必须使用代理关键字来处理未定义的日期,而且这类事实表在数据加载完后,是可以对它进行更新的,来补充随后知道的日期信息。

举例来说,

订货日期
预定交货日期
实际发货日期
实际交货日期
数量
金额
运费 

区别比较:

根据Kimball的数据仓库理论,事实表分为三种类型:交易事实表、周期快照事实表和累积快照事实表。以下是这几种事实表之间的区别。

特点

交易事实

周期快照事实

累积快照事实

时间/时期

时间

时期

时间跨度较短的多个时点

粒度

每行代表一个交易事件

每行代表一个时间周期

每行代表一个业务周期

事实表加载

新增

新增

新增和修改

事实表更新

不更新

不更新

新事件产生时更新

时间维

业务日期

时期末

多个业务过程的完成日期

事实

交易活动

时间周期内的绩效

限定多个业务阶段内的绩效

分享到:
评论

相关推荐

    数据仓库-关于数据仓库维度数据处理的方法探究系列

    它们是事实数据表中用来描述数据的分类的有组织层次结构(级别)。这些分类和级别描述了一些相似的成员集合,用户将基于这些成员集合进行分析。(此概念引之于SQLServer2000联机帮助) 所有维度均直接或间接地基于表。...

    大数据集市建设、数据质量及数据管理方法.pdf

    – 定义数据模型 实现原则: – 统一构建 – 总体指导 – 稳定性 – 可适应性 – 可扩展性 数据分层架构 数据 业务数据 业务数据 业务数据 外部数据 数据仓库 应用数 据层 元数据 基础数据层 事实、维 集市 集市 ...

    提议的身份验证算法的集成,用于数据仓库中的最终用户数据导航-研究论文

    数据仓库概括了源自不同基础的各种数据库。 它们在组织内具有凝聚力,可用于使故障失效并提供适当的声明。... 各种各样的组织将教学机构,商业团体,治疗性主动行动,具有微妙事实的保管局,主动行动分类等结合起来。

    大数据BI框架知识点备注.pdf

    数据仓库建模: 1、此处通常采⽤hive进⾏数据仓库的建模,即⽤hive的hsql语句创建事实表、维度表等; 2、⼀个⽐较重要的⼯作是利⽤hive进⾏ETL,例如缺字段、归⼀化(⽐如8000和8K、杭州和杭州市、惠普和HP等)、...

    数据分析与挖掘感悟.docx

    数据仓库,简单地说,就是搜集来自其它系统的有用数据,存放在一整合的储存区内。所以其实就是一个经过处理整合,且容量特别大的关系型数据库,用以储存决策支持系统所需的数据,供决策支持或数据分析使用。 数据挖掘的...

    大数据下的智能数据分析技术研究.pdf

    传统的数据分析领域,如 知识库系统、 数据仓库、 数据挖掘等已经积 累了很多优秀的理论和技术,下面对其中 的一些典型理论和技术的梳理。 1.1 决策树 决策树(Decision Tree)是在已知各种情 况发生概率的基础上,通过...

    阿里巴巴大数据之路-大数据领域建模综述.pdf

    维度模型 简述 维度模型是数据仓库领域的 Ralph Kimball ⼤师所倡导的,他的 The Data 阳rehouse 岛olkit-The Complete Guide to Dimensional Modeling 是 数据仓库⼯程领域最流⾏的数据仓库建模的经典。...

    大数据处理框架.pdf

    还集成了众多优秀的产品如⾮关系数据库HBase、数据仓库Hive、数据处理⼯具Sqoop、机器学习算法库 Mahout、⼀致性服务软件ZooKeeper、管理⼯具Ambari等,形成了相对完整的⽣态圈和分布式计算事实上的标准。...

    超旺软件最新单机版

    在进行系统初始数据建立之前,需要对基本资料>>中的“商品分类”、“商品档案”、“供应商档案”、“客户档案”、“员工档案”等内容搭建一个基本的框架。 2.2.2 基本资料—商品分类 进入《基本信息》—商品分类...

    商务智能方法概论.pptx

    目 录 引言 商务智能过程 数据仓库 商务智能应用 构建商务智能环境 关联规则 分类分析 聚类分析 概念描述 商务智能方法概论全文共221页,当前为第2页。 目 录 引言 商务智能简介 商务智能与信息社会 商务智能与企业...

    视频图matlab代码-CSCI-4502-Data-Mining:CSCI-4502-数据挖掘

    数据处理/清理和数据仓库: MySQL:主要的处理和分析工具图生成Matlab:主要的绘图工具R:在地图上绘制图表分类/集群: 威卡 数据集链接 说明视频链接 (解释Matlab代码) (解释其他东西) 项目链接

    SQL Server 2008商业智能完美解决方案 3/3

    1.3.1 数据仓库 9 1.3.2 数据市场 10 1.3.3 多维数据集 11 1.3.4 决策支持系统 11 1.3.5 数据挖掘系统 11 1.3.6 提取、转换和加载系统 12 1.3.7 报表处理系统 12 1.3.8 关键绩效指标 12 1.4 Microsoft BI解决方案的...

    SQL Server 2008商业智能完美解决方案 2/3

    1.3.1 数据仓库 9 1.3.2 数据市场 10 1.3.3 多维数据集 11 1.3.4 决策支持系统 11 1.3.5 数据挖掘系统 11 1.3.6 提取、转换和加载系统 12 1.3.7 报表处理系统 12 1.3.8 关键绩效指标 12 1.4 Microsoft BI解决方案的...

    SQL Server 2008商业智能完美解决方案 1/3

    1.3.1 数据仓库 9 1.3.2 数据市场 10 1.3.3 多维数据集 11 1.3.4 决策支持系统 11 1.3.5 数据挖掘系统 11 1.3.6 提取、转换和加载系统 12 1.3.7 报表处理系统 12 1.3.8 关键绩效指标 12 1.4 Microsoft BI解决方案的...

    SQL Server 2008 商业智能完美解决方案(3)

    1.3.1 数据仓库 9 1.3.2 数据市场 10 1.3.3 多维数据集 11 1.3.4 决策支持系统 11 1.3.5 数据挖掘系统 11 1.3.6 提取、转换和加载系统 12 1.3.7 报表处理系统 12 1.3.8 关键绩效指标 12 1.4 Microsoft BI...

    Oracle SQL高级编程(资深Oracle专家力作,OakTable团队推荐)--随书源代码

     RIYAJ SHAMSUDEEN 专注于性能/数据恢复/电子商务的咨询公司OraInternals的首席数据库管理员和董事长。有近20年使用Oracle技术产品以及Oracle数据库管理员/Oracle数据库应用管理员的经验,是真正应用集群、性能...

    matlab提取股票数据代码-covis-worker:同事

    COVIS数据文件在MongoDB实例中分类。 该数据库是非权威的---事实是存储在磁盘上的内容,d / b只是这些内容的便捷索引。 通过与磁盘进行比较,可以随时对其进行重建。 。 所有文件I / O通过一个或多个实例提供的S3-...

    templates:由The Good Docs Project创建的模板-满足您所有的技术写作需求

    关于模板仓库该存储库包含最佳实践模板,以帮助构建开源软件的文档,顺便说一句,该文档也... 参考部分应全面分类数据,例如功能及其参数,返回代码和错误消息。 它们通常以表格,项目符号列表或示例脚本的形式呈现。

Global site tag (gtag.js) - Google Analytics