BI

Pentaho:HadoopやDWH、NoSQLにも対応のBI--ETLでデータ品質も担保

BIツール「Pentaho」は、基幹系システムなどからデータを抽出、変換してクレジングするETLも利用可能。インメモリキャッシングを活用。マウスでのドリルスルーやフィルタコントールが可能。

Pentahoのポイント

  • マウスのドラッグ&ドロップで分析データパイプラインを作成
  • 基本的なデータプロファイリングや文字列操作などの品質向上ツールも用意
  • インメモリキャッシングを活用、ドリルスルーなども可能

Pentahoの製品解説

 「Pentaho」はビジネスインテリジェンス(BI)ツール。基幹系システムなどからデータを抽出、変換してクレジングするETLなどの「Pentaho Data Integration」とデータを分析するための「Pentaho Business Analytics」で構成される。

編集部おすすめの関連記事

 対応するリレーショナルデータベース(RDBMS)はOracle DatabaseやIBM DB2、Microsoft SQL Server、MySQL。HadoopディストリビューションはClouderaやHortonworks、MapR、Amazon Elastic MapReduce(EMR)。NoSQLではMongoDBやCassandra、HBaseに対応。Apache SparkやApache Kafkaにも対応する。

 データウェアハウスはVerticaやGreenplum、Teradata、SAP HANA、Amazon Redshift。SalesforceやGoogle Analyticsなどのアプリケーションからも取り込める。XMLやJSON、Excel、CSV、テキストなどのファイルも取り込める。

 マウスのドラッグ&ドロップで分析データパイプラインを作成可能。RDBMSなどのデータソースは、データを抽出、準備、ブレンドするためのライブラリが用意され、ユーザー企業ごとにカスタマイズできる。データ準備プロセスでは任意のポイントでチャートや可視化、レポーティングが可能。

 行数カウントや数学関数など基本的なデータプロファイリング機能と文字列操作やマッピング関数、フィルタリング、並べ替えなどのデータ品質に関する機能も提供される。データ品質では、統一されていないデータや重複データの比重複化とクレンジング、住所やメールアドレス、電話番号の検証や標準化などに対応している。

 データ分析のユーザーインターフェース(UI)はウェブブラウザベースに対応。レポーティングやダッシュボードといった機能が利用できる。レポーティングではインメモリキャッシング技術を活用して、エンドユーザーの思考に追い付くようにしている。ダッシュボードはマウスでのドリルスルーやフィルタコントロールなどが可能となっている。

Pentahoのまとめ
用途と機能BIツール
特徴データソースは、データを抽出、準備、ブレンドするためのライブラリが用意され、ユーザー企業ごとにカスタマイズ。データ品質では、統一されていないデータや重複データの比重複化とクレンジング、住所やメールアドレス、電話番号の検証や標準化などに対応。ダッシュボードはマウスでのドリルスルーやフィルタコントロールなどが可能
導入企業BT、Caterpillar Marine Asset Intelligence、NASDAQなど

CNET_IDを登録して全ての記事を読む
(登録3分、無料)

CNET_IDはTechRepublic Japan/CNET Japan/ZDNet Japanでご利用いただける共通IDです。CNET_IDを登録することで、TechRepublic Japanの全ての記事を読むことができます。人気の記事にはこのようなものがあります。

「BI」で読まれている記事

TechRepublic Japanで人気の記事

編集部オススメ

トレンドまるわかり![PR]

財務・経理
人事・労務
マーケ・営業
購買・調達
生産・製造
データ分析
統計解析
テキストマイニング
ソーシャルメディア分析
BI
コミュニケーション
通信・通話
文書・コンテンツ
PC・モバイル
新興技術
ITインフラ
クラウドサービス
OS・ミドルウェア
開発
データベース
運用
セキュリティ

ホワイトペーパーランキング

  1. AWS、Microsoft、Googleがリード!パブリッククラウドコンテナプラットフォーム市場分析
  2. ウィズコロナ時代はあと2年は続く?!アフターデジタル時代の4つの重要ポイント
  3. 2021年のサイバー脅威予測が明らかに─将来の攻撃に企業はいかに備えるべきか
  4. “テレワークだからこそ”デスクトップPCを利用すべき?!ノートPCにはない魅力の数々に迫る
  5. 7つの視点で解説するデータベース構築・運用ー誰でもわかるSQL Serverストレージガイド

Follow TechRepublic Japan

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]