InfoSphere DataStage

集成分布式和大型机平台上所有类型的数据

  • 产品类型:软件
  • 产品功能:BI/算法
  • 产品编号:13763

InfoSphere DataStage

InfoSphere DataStage功能特性:

功能强大的可扩展 ETL 平台

  • 管理近乎实时到达的数据,以及定期或按计划收到的数据。

  • 对海量数据进行高性能处理。

  • 利用多处理器硬件平台的并行处理功能,帮助您管理不断增长的数据量以及日益缩短的批处理时间窗口。

  • 在单个作业中支持异构数据源和目标,包括文本文件、XML、ERP 系统、大多数数据库(包括分区数据库)、Web 服务和商业智能工具。

支持大数据和 Hadoop

  • 包括对 IBM InfoSphere BigInsights、Cloudera、Apache 和 Hortonworks Hadoop Distributed File System (HDFS) 的支持。

  • 提供 Balanced Optimization for Hadoop 功能,来推进数据处理,提高效率。

  • 支持大数据监管,包括影响分析和数据沿袭之类的功能。

工作负载和业务规则管理

  • 帮助支持策略驱动的系统资源控制,以及不同类别工作负载的优先级划分。

  • 帮助优化硬件利用率和划分任务优先级,控制资源超过指定阈值的作业活动,并在将作业提交至队列中时评估并重新分配作业优先级。

  • 集成了 IBM Operational Decision Management(前称为 ILOG JRules),使您能够在 IBM InfoSphere Information Server 中实施决策逻辑。

近乎实时的数据集成

  • 使用 Java 消息服务 (JMS) 或 WebSphere MQ 适配器从面向消息的中间件 (MOM) 队列捕获消息,使您能够将数据组合成遵循标准的操作和历史分析透视图。

  • 提供面向服务架构 (SOA),用于将数据集成逻辑发布为可在企业中复用的共享服务。

  • 可同时支持事务处理的高速、高可靠性要求,以及批处理的大批量数据要求。

易于使用

  • 包含用于并行作业的操作控制台和交互式调试器,帮助您提高工作效率并加快解决问题。

  • 通过简化管理和最大化开发资源,帮助缩短数据集成项目的开发和维护周期。

  • 提供操作智能功能、元数据和元数据导入的智能管理以及并行调试功能,帮助提高处理分区数据时的工作效率。

上一个:
下一个: