Loading
0

数据仓库与数据集市之间的区别

在很多人的IT职业生涯的早期,是没有组织数据共享的概念的,也没有了解数据对企业的全球价值的概念。IT商店设计并管理了专注于日常业务运营的应用程序。尽管有报告和应用程序可以帮助决策,但是当查询开始对我们的操作系统的性能产生负面影响时,数据仅在单独的环境中卸载。

随着报告系统的成熟和在各业务部门之间的普及度飙升,企业意识到收集的数据的真正价值在于其促进运营,战术和战略决策的能力。一旦IT部门意识到不同的部门数据存储是战略性企业资产,可以在组织层面提供内在的利益,他们便开始收集和合并其信息,并将其存储在数据仓库(最终是数据集市)中。

数据仓库和数据集市都是专用平台,旨在吸收,存储和促进处理大量信息。主要区别在于数据仓库是集中式存储库,用于存储来自多个业务线和主题领域的数据。数据仓库以其最纯粹的形式促进了企业级的决策制定。

尝试定义和比较数据仓库与数据集市的挑战在于,将它们进行分类的标准可能有些不稳定。有些部门系统包含来自不同来源的信息并存储大量数据。尽管它们可能满足向特定部门提供决策信息的数据集市标准,但庞大的规模和详细程度也可以将它们归类为数据仓库。

数据仓库

数据仓库的目标是提供一个中央数据存储库,以促进在企业级做出明智而有见地的决策。 从C级高管到运营业务部门,数据仓库为广泛且多样化的用户群提供服务。实际上,组织存储的所有数据都可能被提取到数据仓库中。数据仓库专家经常执行高级别的分析,以识别和评估潜在的输入源。数据仓库的主要优势在于它们能够提供具有跨多个业务关系的客户,供应商,服务提供商和业务合作伙伴的全局视图。

数据集市

数据集市的主要用例是满足需要访问更精细主题区域的用户的需求。数据集市的目标是为那些用户提供对与其需求最相关的数据的快速访问。

一个很好的例子是组织的销售部门。部门经理需要访问产品,客户和销售团队的绩效指标。与访问专门为满足部门特定业务需求而设计的存储库相比,访问和分析企业数据仓库中的数据所花费的时间更长,效率更低。

除了更加集中的受众和使用意图之外,数据集市通常在存储数据的类型方面与数据仓库有所不同。数据集市通常包含摘要数据,以加快分析和报告速度。数据是经过专门定制的,可以满足目标受众的特定需求。管理员可以构建其他逻辑和物理结构,以加快数据访问性能。他们还进一步完善数据以促进和加速决策。

数据集市的传统来源之一是数据仓库。由于数据仓库包含企业级别的数据,因此它们是数据集市的绝佳信息来源。但是数据集市通常会从其他决策数据存储和操作系统中获取提要。

数据仓库与数据集市

确定数据仓库与数据集市是否最能满足您的需求是一个相当简单的过程。下表将帮助您进行决策。

由于他们的行业新闻广泛,大多数管理团队对数据仓库及其提供的好处有基本的了解。 IT部门面临的最大挑战是估算和证明高昂的启动和持续支持成本。建立数据仓库通常是一个庞大的预算,多年的项目。除了高昂的后端管理和基础架构成本之外,大数据专家还不断从整个企业中识别出新的输入源并完善现有数据。

如果您的组织已经有一个数据仓库,则证明构建和支持其他商业智能数据存储(例如数据集市)的成本是一项挑战。决策者通常会问的第一个问题是,为什么不能只使用数据仓库。您的团队需要描述两个数据存储之间的差异,并教育决策者如何更精细地关注数据集市如何满足目标组的独特需求。


关于慧都数仓建模大师

慧都数仓建模大师能够快速、高效地帮助客户搭建数据仓库供企业决策分析之用。满足数据需求效率、数据质量、扩展性、面向主题等特点。基于企业的业务目标,进行数据理解、数据准备、数据建模,最后进行评价和部署,真正实现数据驱动业务决策。更多详情,请联系我们