数据需要提取、处理和提炼才能发挥作用。就像石油可以提炼成不同类型的燃料一样,在分析和人工智能方面,数据也可以准备用于不同的用途。
概述您的组织如何选择为这些不同用途准备数据,从报告到分析再到人工智能。大多数数据资产分为三个不同的层:数据湖、数据仓库和数据集市。
数据湖: 此层主要面向数据科学家等高级用户,他 哥斯达黎加电话号码数据 们对原始数据执行各种类型的分析以寻找异常和模式,并最终执行机器学习。此层支持快速从所有数据源提取原始数据并将其导入 数据湖或 数据库。
数据仓库: 原始数据不是业务用户(例如业务分析师)的最佳选择。这些用户需要经过清理、丰富和合理化的数据(在现代数据仓库中)。在分层数据架构中,此数据仓库将来自数据湖,但放置在基于 的数据库中,其中半结构化数据转换为结构化数据以供分析。
数据集市: 数据集市通过从数据仓库中提供相关数据集来支持普通用户,实现跨多个分析工具的针对业务线或特定功能视图的自助分析,以便业务用户可以安全高效地探索数据。
云、本地还是混合?
您肯定不希望数据资产最终成为一项昂贵的维护工作。有些人认为,要管理成本,他们只需“迁移到云”。相反,要评估云、本地或混合云的利弊。要仔细考虑,明确迁移到云的目的和具体需求,而不是简单地部署。