ミドルウェア 日本アイ・ビー・エム

IBM BigInsights for Apache Hadoop:Hadoop/Spark活用のデータ分析ミドル

 日本IBMの「IBM BigInsights for Apache Hadoop」は、大量データを分析するシステムをオープンソースの分散処理ソフトである「Apache Hadoop」で構築、運用するためのミドルウェア。IBM版のHadoopディストリビューションに相当し、企業向けに各種ツール群をパッケージ化している。

 数種類のパッケージ製品として提供し、Hadoopシステムの構築と運用に役立つツール群を一通り取り揃えている。例えば、Hadoop独自の情報処理プロセス(MapReduce処理)を扱いやすくするOSSの上位言語(Pig、Hiveなど)、SQLでHadoopにアクセスする独自の「Big SQL」、表計算に似た独自のデータ分析画面「BigSheets」、インストーラ、統合開発環境、ジョブスケジューラ、ワークフローエンジン――などがある。

BigInsights for Apache Hadoop V4.1の概要
BigInsights for Apache Hadoop V4.1の概要(日本IBM提供)

 例えば、BigSheetsを使うと、Hadoopのデータを表計算ソフトのように分析できる(バックエンドではApache Pigを利用している)。ウェブブラウザから表計算のGUIを操作するだけで、分析ジョブを定義、実行、視覚化できる。Javaで直接MapReduce処理を実装したり、Apache HiveやApache Pigなどの上位言語ツールを使って分析プログラムを開発したりする必要がない。

 現行版(V4.1)では、Hadoopに代わる新たな分析エンジンとしてクラスタコンピューティングフレームワーク「Apache Spark」を利用できるようにした。Sparkを使うと、HadoopのファイルシステムであるHDFSにあるデータをメモリにロードして高速に分散処理できる。これにより、Hadoopが得意なバッチ処理だけでなく、リアルタイムなデータ変換処理も高速に処理できるようになる。データサイエンティスト向けの機能も強化し、Hadoop環境でオープンソースの統計解析用言語Rを実行する「Big R」、Big R上での機械学習機能を追加した。

IBM BigInsights for Apache Hadoop V4.1の概要
用途と機能データ分析システムを構築するためのミドルウェア
ソフトウェア構成分散処理ソフトのHadoopとSparkを中核にデータ分析を支援する機能群で構成
独自に用意した主なHadoopデータ分析機能Big SQL=SQL言語
BigSheets=表計算のGUI
Big R=R言語
税別参考価格21万6200円から。機能を限定した無償版「Quick Start Edition」も用意
発表日2015年7月8日
出荷日2015年7月

編集部おすすめ

ピックアップ製品

サーバ
PC・モバイル
ストレージ
ネットワーク
仮想化
クラウドサービス
OS・ミドルウェア
OS
ミドルウェア
アプリケーションサーバ
開発
データベース
運用
セキュリティ
新興技術
財務・経理
人事・労務
マーケ・営業
購買・調達
生産・製造
データ分析
コミュニケーション
通信・通話
文書・コンテンツ
サイト構築
PCソフト
学習

ベンダー座談会

Follow TechRepublic Japan