Loading
0

英特尔和Cloudera携手合作,为客户带来性能强悍的傲腾™DC持续性内存

Cloudera和英特尔有悠久的创新合作历史,通过无与伦比的性能和安全性将大数据分析和机器学习推向企业。

我们很高兴能够通过我们在英特尔®傲腾™DC持续性内存上的合作来迈向这一目标。英特尔®傲腾™DC持续性内存可供运行第二代英特尔®至强®可扩展处理器的客户使用,可显著提高实时和流媒体应用的性能。数据驱动的企业, 尤其是那些利用物联网的组织,需要低延迟,高性能的计算来处理边缘数据,以便做出更快,更明智的决策。

英特尔傲腾™ DC持续性内存是内存和存储层次结构中的一个新层,位于DRAM和固态驱动器之间,延迟时间更接近DRAM。它将高容量,低延迟和非易失性独特地结合到一个软件包中,提供128GB,256GB和512GB模块,与大型DRAM DIMM相比,预计每GB的成本更低,内存容量更大。

英特尔傲腾™ DC持续性内存在设计时考虑了易用性,因此可以配置为两种不同的操作模式:

  1. 内存模式
  2. app直接模式

内存模式

在内存模式下,通过简单的BIOS更改完成,操作系统只是将内存视为类似于DRAM的大型易失性内存池。当发出数据请求时,内存控制器将首先检查DRAM中的数据,如果不存在,再检查Intel 傲腾™ DC持续性内存,只有一点点的延迟。处于内存模式时,如果断电,则不会保存数据。

在app直接模式下,应用程序可以将DRAM用于需要低延迟且无持续性的操作,并使Intel 傲腾™ DC持续性内存以内存总线速度处理大型数据结构而不会出现易失。可以启用持续性内存的一部分为app直接模式,而另一部分以内存模式运行。

希望在运行应用的方式和位置方面具有更大灵活性的Cloudera客户也可以从英特尔傲腾™ DC持续性内存中受益。企业数据云的一个关键特性是它能够在共享数据上运行多个工作负载而不会遇到“嘈杂的邻居”问题。这是通过从根本上将计算与存储分开的架构实现的。英特尔傲腾™ DC持续性内存可缓解与这些分叉环境相关的I/O瓶颈。

Apache HBase®是众多分析应用之一,受益于英特尔傲腾™ DC持续性内存的功能。HBase是一个分布式,可扩展的NoSQL数据库,企业用它来为需要对半结构化数据进行随机,实时读/写访问的应用程序提供支持。

企业使用HBase进行低延迟存储,需要实时访问自定义应用程序的场景,将机器学习/人工智能应用于实际问题,以及支持数据的实时分析。它支持一系列从Web和移动应用到操作物联网数据的各种用例。从技术角度来看,从Hadoop分布式文件系统读取的数据缓存在HBase的BucketCache中。

APP直接模式

BucketCache是一种内存管理实现,用于减少随机读取的延迟(相对于直接从磁盘读取数据)以及提供更高的吞吐量。在典型部署中,节点中的BucketCache大小受可用的DRAM大小的限制。使用app直接模式,英特尔傲腾™ DC持续性内存可以成为HBase BucketCache的替代目标,提供比DRAM更大的缓存。 123Analysis表明,配置了相同容量的英特尔傲腾™ DC持续性内存和DRAM的系统使性能差异仅降低5%,与DRAM相比却可能节省21%的成本。 “基于我们的初步测试,HBase上的客户应用程序可以通过使用英特尔傲腾™ DC持续性内存实现bucket cache实现效率提升”Cloudera工程经理Amit Virmani说道。

Cloudera计划在即将发布的版本中支持Intel 傲腾™ DC持续性内存作为HBase BucketCache的替代目标。

英特尔和Cloudera将携手合作,通过创新技术为我们的客户带来价值和性能,从而实现我们的企业数据云愿景。我们正在评估一些英特尔傲腾™ DC持续性内存加速我们客户的能力的应用,推动新的解决方案。

欢迎拨打慧都热线023-68661681或咨询慧都在线客服,我们将帮您转接大数据专业团队,并发送相关资料给您!