根据星型模式建模数据

Explore discuss data innovations to drive business efficiency forward.
Post Reply
Bappy11
Posts: 453
Joined: Sun Dec 22, 2024 9:32 am

根据星型模式建模数据

Post by Bappy11 »

由于缺乏增量检测导致数据量巨大
由于 BI 工具并未针对增量检测(哪些行发生了变化)进行优化,因此通常需要刷新所有数据。这通常会导致您传输大量数据而没有发生任何更改。

为了避免上述缺点,最好使用数据仓库作为数据源和 BI 工具之间的中间层。

BI 工具中的数据转换
如果将 BI 工具直接链接到数据,则必须首先转换数据,以便以星型模式对数据进行建模。然后应用业务规则。此外,通过转换数据,您还可以添加或编辑某些值。考虑添加计算字段或聚合数据。

这将丰富和改进仪表板。如果不转换数据,仪表板可能包含很少有用的信息。

1. 转换数据
数据转换是指将原始数据转换并修改为结构化、优化形式的过程。经过数据转换后,原始数据适合进一步处理、分析和报告。当需要在 BI 工具中执行许多数据转换时,这通常会导致更长的刷新时间,从而导致仪表板变慢。

数据仓库确保数据存储和处理在数据库中而不是在 BI 工具中进行。数据库旨在存储和处理大量数据,而BI工具在这方面的功能通常较弱。 BI 工具功能不够强大,难以处理大量数据。


Power BI 星型模式是 Power BI 中的一种数据模型,由连接到多个维度表的单个中心事实表组成。由于这些表之间的关系具有这样的形状,因此它被称为星型模式。事实表位于星形的中心,维度表位于射线的末端。

如果没有良好建模的数据,您需要复杂的计算规则才能在仪表板上显示正确的数字。这通常会导致仪表板运行缓慢。

Power BI 中的星型模型
Power BI 中星型模型的一个示例。客户、商店、产品、日期和收货特征只需记录一次,然后链接到正确的收货行。
3. 应用业务规则
通过在数据仓库中应用业务规则,数据被预先计算和存储。这使得 BI 工具能够更快地检索和呈现数据。但是,如果在BI 荷兰电报数据 工具中应用业务规则,则每次查询数据时都必须重新执行计算。这将导致仪表板性能较差。

BI 工具本身的数据转换的缺点
性能问题
BI 工具并非设计用于处理和存储大量数据,因此无法有效地做到这一点。 Hiredoor 经常发现数据量超出了 BI 工具中的可用空间,导致仪表板或报告的性能令人失望。

有限的转换功能
在转换数据方面,BI 工具并不像数据仓库那样全面。这减少了操纵或丰富数据的选项。此外,由于需要进行所有转换,刷新数据可能需要很长时间。为此,最好使用数据仓库的计算能力而不是 BI 工具。

版本历史
Post Reply