IBM InfoSphere DataStageのポイント
- 並列処理技術を使って膨大な量のデータを高速処理
- データ統合に関する処理をGUIツールで開発できる
- 並列処理や分割処理をパラメータの設定のみで実装可能
IBM InfoSphere DataStageの製品解説
日本IBMの「IBM InfoSphere DataStage」は、並列処理技術を使って膨大な量のデータを高速処理するデータ連携(ETL)ツールだ。データウェアハウスやデータマートの構築、データ移行、システム間連携などにおけるデータの転送や変換を支援する。
データ統合に関する処理をGUIツールで開発できる。“ステージ”と呼ばれる処理アイコンを配置してジョブを設計する。開発生産性と保守性を向上させられる。並列処理や分割処理をパラメータの設定のみで実装可能。ジョブを改修せずにスケールアップやスケールアウトに対応できる。
テキストファイル、統合基幹業務システム(ERP)、データベース、ビジネスインテリジェンス(BI)ツール、ウェブサービスなどの多種多様なデータを統合可能。Hadoopベースのデータ分析ツール「IBM InfoSphere BigInsights」、分散ファイルシステム「Hadoop Distributed File System(HDFS)」にも対応する。
用途と機能 | 並列処理技術を使って膨大な量のデータを高速処理するETLツール |
---|---|
特徴 | データ統合に関する処理をGUIツールで開発できる。並列処理や分割処理をパラメータの設定のみで実装可能。ジョブを改修せずにスケールアップやスケールアウトに対応できる |