如果谈到购买家具,不可避免会想到的一个词就是宜家,但是大家都知道,宜家的家具很多都是拆分运输到家再组装,但是现在的家具可以组装好再运输过来直接使用,在企业分析和数据管理平台方面,组织也经历了相似的阶段。
传统的Cloudera和Hortonworks平台在Arun Murthy的“ Hadoop:十年零零零二”博客上松散地构建,有点像以前的家具结构。建立组织的分析功能的所有组件都在那里,只需将它们连接起来即可。尽管这项工作比最初将构成发行版的开源项目放在一起要复杂得多,但必须先完成这项工作,然后才能放开数据以获取见识和价值。这也意味着客户彼此独立,各自使用该平台组装自己的数据仓库,他们自己的机器学习,数据工程,多阶段数据管道,以覆盖整个数据生命周期。
当我们构建新的Cloudera数据平台(CDP)时,这一实现是关键考虑因素。当然,其坚实的基础始终是企业数据云:
- 提供从边缘到AI的完整数据生命周期分析
- 灵活部署到云和数据中心
- 在所有方面都具有一致的数据安全性和治理
- 100%基于开源和开放标准
但是,要明白我们主要目标之一是使部署特定分析更加容易,并消除与自组装相关的开销和工作量。
Office应用程序(如Microsoft PowerPoint)中的模板在创建新材料时不仅提供了巨大的加速器,还确保了一致性并利用了最佳实践。群集定义与CDP等效,使组织可以使用默认包含的一种说明性群集定义或利用自己的自定义定义快速创建群集。从不断增长的列表中选择一个,CDP会在其运行时自行组装正确的项目。您是否需要数据集市?-很容易选择和配置Apache Hue和Apache Impala。您希望它是实时的?-HDFS,Apache Kudu,Apache Spark和YARN会自动添加。适用于所有数据生命周期分析的儿童游戏,并已部署到任何云中。当然,IT团队仍然可以采用高级选项来调整那些必要的选项。
CDP分析经验使授权的最终用户能够启动自己的分析集群,从而进一步迈出了这一步。选择更加直接:选择感兴趣的分析功能(数据仓库和机器学习很快就会与其余的数据生命周期分析结合在一起:数据流,数据工程和运营数据库),然后选择所需的T恤大小的容量(S / M / L)。同样,可以根据需要调整元素的高级配置,例如自动缩放,尽管大多数用户对默认设置感到很自在。
两种方法都可以帮助组织更快地发展-从面向开发人员的方法到数据和分析,再到面向企业解决方案的焦点。业务用户可以在企业IT设置的边界和防护范围内自助访问数据和分析,并确保安全性和合规性。数据和分析的这种转变正是Gartner在描述Cloud Data Ecosystems时确定的,Cloudera Data Platform是他们所谓的独立ISV生态系统的完美示例。
关于Cloudera
在 Cloudera,我们相信数据可以使今天的不可能,在明天成为可能。我们使人们能够将复杂的数据转换为清晰而可行的洞察力。Cloudera 为任何地方的任何数据从边缘到人工智能提供企业数据云平台服务。在开源社区不懈创新的支持下,Cloudera推动了全球最大型企业的数字化转型历程。
发表评论