ETL アシスト

Paxata:データ分析の準備を支援するデータプレパレーション基盤--Hadoopやインメモリを利用

データプレパレーション基盤の「Paxata」は、HadoopやSparkによる分散コンピューティング、機械学習、インメモリ技術などを活用して、分析に必要とされるデータの準備作業を効率化する。

Paxataのポイント

  • 分析に必要とされるデータを準備し、アナリストやビジネスユーザーに提供
  • 分散コンピューティング、機械学習、インメモリ技術などを活用
  • SQLやプログラムを使用せずにデータを整形できる

Paxataの製品解説

 アシストの「Paxata(パクサタ)」は、データ分析に必要な準備作業を支援するデータプレパレーション基盤だ。HadoopやSparkによる分散コンピューティング、機械学習、インメモリ技術などを活用して、分析に必要とされるデータをすばやく準備し、アナリストやビジネスユーザーに提供する。

編集部おすすめの関連記事

 経営におけるデータ活用のニーズが拡大する一方で、データの量の増大や多様化が加速し、分析のためのデータの準備が追いつかなくなっている。Paxataはデータレイクやデータベース、クライアントPCにあるローカルデータを取得して、加工や変換などさまざまデータ処理を実行し、分析にそのまま利用できるデータを生成する。

 リレーショナルデータベースやNoSQLなどのデータベース(JDBC経由)のほか、CSV、Excelなどのファイル、Hadoopといったデータソースに対応。データのヒストグラムを自動作成したり、整形や統合などのデータ処理を行ったりできる。

 データの整形は、SQLやプログラムを使用せずに実行でき、整形した結果はリアルタイムに画面上で確認できる。クロス集計表を通常のテーブル形式へ置き換えたり、詳細データを集計した結果をテーブルとして用意したりすることも可能。特定のキー情報に基づいて、複数のデータセットを1つのテーブルに統合することもできる。

 処理を実行した結果の「アンサーセット」は、CSVやExcelなどのファイルやHDFSの形式でエクスポートできる。管理者は、ユーザー間でアンサーセットを共有したり、各ユーザーが利用可能なデータセットを制限したりすることで、共有とガバナンスを行える。

 サブスクリプションライセンスで年間のソフトウェア使用料金とサポート料金を含めて提供する。データ加工と変換処理を実施する「Pipeline Worker Servers」のコア数に応じて課金される。サーバの設置先はオンプレミス、クラウドを問わない。

Paxataの処理フロー
Paxataの処理フロー(アシスト提供)
Paxataのまとめ
用途と機能データ分析に必要な準備作業を支援するデータプレパレーション基盤
特徴HadoopやSparkによる分散コンピューティング、機械学習、インメモリ技術などを活用して、分析に必要とされるデータをすばやく準備し、アナリストやビジネスユーザーに提供する
税別価格16コア:960万円(使用権+サポートの年間サブスクリプション)。追加は1コアあたり60万円
発表日2016年8月29日
導入企業(ユーザー)スタンダードチャータード銀行(シンガポール)、など

関連記事

ホワイトペーパーランキング

  1. 報告: IT部門と事業部門の「境目」が消え始めた!?世界のITリーダーが回答
  2. 実はオンプレより、クラウドの方が安全!?情シス マサシと一緒に考えるクラウドのメリット/デメリット
  3. “収益10億円への道”を具体的に描く、世界のSaaSビジネス成功企業からの指南書
  4. 日揮やグリーも活用--世界7万6千社で使われるBox事例集
  5. Boxをビジネスに活⽤するために-業種、職種別のユースケース

編集部おすすめ

ピックアップ製品

サーバ
PC・モバイル
ストレージ
ネットワーク
仮想化
クラウドサービス
OS・ミドルウェア
開発
データベース
RDBMS
NoSQL
その他データベース
DWH
ETL
EAI/ESB
運用
セキュリティ
新興技術
財務・経理
人事・労務
マーケ・営業
購買・調達
生産・製造
データ分析
コミュニケーション
通信・通話
文書・コンテンツ
サイト構築
PCソフト
学習

ベンダー座談会

Follow TechRepublic Japan