Actian Vector in Hadoopのポイント
- クラスタにVectorHの処理エンジンを組み込み、SQLエンジンを配置
- 他のSQL on Hadoopの最大30倍以上のクエリ性能
- GUIベースの前処理ツールで4週間かかっていた工程を30分に
Actian Vector in Hadoopの製品解説
インサイトテクノロジーが日本の総代理店となっている「Actian Vector in Hadoop」(VectorH)は、分散並列処理プログラミングフレームワーク「Apache Hadoop」にあるデータに標準的なSQLクエリをかけられるようになる分析基盤ソフトウェア。Hadoopを利用することによる、安価にスケーラブルな大量データを処理する基盤を得るというメリットはそのままに、MapReduceを利用するよりも、簡単に素早く分析を開始できるようになる。
Hadoopの各クラスタにVectorHの処理エンジンを組み込み、1台にVectorH本体のSQLエンジンを配置する。VectorHのデータファイルを分散ファイルシステム「HDFS(Hadoop Distributed File System)」に設置する。
ANSI SQL 92をフルサポート。ユーザーはHadoopを意識することなく、RDBMSと同じような操作でSQLクエリをかけられる。他のSQL on Hadoopと比較して、最大で30倍以上のクエリ性能を実現するという。
多くの企業がビッグデータ分析プロジェクトで苦労している、MapReduceのスキルを持つエンジニアの確保は不要。従来MapReduceを利用してしかアクセスできなかったHadoop上のデータへ、より簡単かつ柔軟にアクセスできるようになる。
GUIベースのデータ前処理ツールが付属。4週間程度かかっていた、データの前処理を30分で実現できるとしている。
用途と機能 | Hadoopにあるデータに標準的なSQLクエリをかけられるようになる分析基盤ソフト |
---|---|
特徴 | ANSI SQL 92をフルサポート。MapReduceのスキルを持つエンジニアの確保は不要。4週間程度かかっていた、データの前処理を30分で実現 |