Loading
0

IBM BigInsights for Apache Hadoop

InfoSphere BigInsights Enterprise Edition:


提供基于 Hadoop 技术的高级分析功能

  • 为复杂的文本分析提供大型提取器库,能够从大量的本机文本数据中获得洞察。
  • 允许您使用内置 Hadoop 分发版功能或使用其他选择,如 Apache Hadoop 的 Hadoop Cloudera 分发版 (CDH)。

专为高性能和易用性而设计

  • 包括一个 MapReduce 框架,该框架可根据用户需求和系统工作负载优化处理过程。
  • 提供工作负载调度程序,以根据用户选择的指标优化和控制作业调度。
  • 包括 IBM BigSheets,这是一个类似电子表格的工具,使业务用户能够仔细查看 IBM BigInsights 集群,无需编写代码即可创建分析查询。
  • 针对设计、开发和部署应用程序提供集成开发环境 (IDE)。
  • 包括 Jaql(一种说明性查询语言),能简化结构化和非结构化数据的分析过程。类似 SQL 的界面使开发人员更便于操作,有助于简化与关系数据库的集成过程。

提供管理、安全性与可靠性功能

  • 提供预定义规则和注释器,且随时可用,能加速文本分析过程。
  • 包括内置轻量级目录访问协议 (LDAP) 支持,管理员可以将访问权仅限于具有适当权限的用户。
  • 提供一个基于 Web 的管理控制台,可以提供一个有关 BigInsights 环境的集中化视图。

与 IBM 及其他信息解决方案相集成

  • 包括用于数据仓库设备的 IBM Netezza® 产品家族、IBM DB2®、IBM InfoSphere Warehouse、IBM InfoSphere Streams、IBM InfoSphere Information Server 和 IBM Smart Analytics System 的高速接口。
  • 提供标准的 Java 数据库连接 (JDBC) 接口,使多种应用程序(包括商业智能产品和数据系统)能够访问数据。

BigInsights 功能部件和体系结构

BigInsights提供不同功能,以用于发现和分析隐藏在大量数据中的商业洞察。这些技术和功能部件组合到一起,从它们进入到您的企业那一刻就开始帮助您的组织管理数据。

大数据学习

通过组合这些技术,BigInsights 扩展 Hadoop 开放式源代码框架(提供企业级别的安全性、控制、可用性、至现有数据存储的集成、用于简化开发者工作的工具及其他)。