InfoSphere DataStage功能特性:
功能强大的可扩展 ETL 平台
- 管理近乎实时到达的数据,以及定期或按计划收到的数据。
- 对海量数据进行高性能处理。
- 利用多处理器硬件平台的并行处理功能,帮助您管理不断增长的数据量以及日益缩短的批处理时间窗口。
- 在单个作业中支持异构数据源和目标,包括文本文件、XML、ERP 系统、大多数数据库(包括分区数据库)、Web 服务和商业智能工具。
支持大数据和 Hadoop
- 包括对 IBM InfoSphere BigInsights、Cloudera、Apache 和 Hortonworks Hadoop Distributed File System (HDFS) 的支持。
- 提供 Balanced Optimization for Hadoop 功能,来推进数据处理,提高效率。
- 支持大数据监管,包括影响分析和数据沿袭之类的功能。
工作负载和业务规则管理
- 帮助支持策略驱动的系统资源控制,以及不同类别工作负载的优先级划分。
- 帮助优化硬件利用率和划分任务优先级,控制资源超过指定阈值的作业活动,并在将作业提交至队列中时评估并重新分配作业优先级。
- 集成了 IBM Operational Decision Management(前称为 ILOG JRules),使您能够在 IBM InfoSphere Information Server 中实施决策逻辑。
近乎实时的数据集成
- 使用 Java 消息服务 (JMS) 或 WebSphere MQ 适配器从面向消息的中间件 (MOM) 队列捕获消息,使您能够将数据组合成遵循标准的操作和历史分析透视图。
- 提供面向服务架构 (SOA),用于将数据集成逻辑发布为可在企业中复用的共享服务。
- 可同时支持事务处理的高速、高可靠性要求,以及批处理的大批量数据要求。
易于使用
- 包含用于并行作业的操作控制台和交互式调试器,帮助您提高工作效率并加快解决问题。
- 通过简化管理和最大化开发资源,帮助缩短数据集成项目的开发和维护周期。
- 提供操作智能功能、元数据和元数据导入的智能管理以及并行调试功能,帮助提高处理分区数据时的工作效率。
发表评论