如果对原始数据的这种

Explore discuss data innovations to drive business efficiency forward.
Post Reply
asimj1
Posts: 198
Joined: Tue Jan 07, 2025 4:41 am

如果对原始数据的这种

Post by asimj1 »

就像 提取和加载,数据湖通常分为三个不同的领域。然而,在命名上却没有任何统一意见:

第一个区域:着陆区、原始区、青铜区、池塘区或沼泽区
第二区:勘探、银矿、精炼厂或沙箱
第三区:运营区、消费者区、黄金区、精炼区或泻湖区
让我们看看每个区域的用途是什么并分配它们的基本职责。

着陆区
着陆 区通常是 IT 的王国。IT 负责维护向该区域填充原始数据的所有流程。

由于数据仅在少数情况下为原始格式,因 捷克共和国电话号码数据 此分析师可以访问着陆区。这些例外通常与分析师需要探索“暗数据”的情况有关。 工作为公司带来了经常性的价值,那么 IT 部门需要通过其他两个阶段制定正式流程。在这种情况下,IT 部门可能会在工作完成后删除对着陆区的访问权限。

探索区
探索区是将数据转换为可用表并进行基本清理的地方。虽然 IT 负责维护所有数据管道,但数据所有者在定义和构建数据方面发挥着重要作用。此外,数据所有者要确保 IT 能够很好地理解数据。探索表应用于探索性分析和任何零星使用。

作战区
操作区 是发布最终表格的地方,因此会应用严格的质量和监管规则。数据与其他数据实体“协调”处理,以确保生成的产品可用。生成的表格必须针对具体用例进行优化。

希望这篇短文有助于澄清涉及数据湖的基本概念和角色。如需澄清和后续内容,请使用下面的评论部分。
Post Reply