BI PaaS 日本オラクル

ビッグデータ活用を成功に導くクラウド利用のすすめ(後編)

ビッグデータという言葉の認知度は上がっているものの、多くの企業にとってコストやスキル面でのハードルはまだ高い。後編では、RDBMSとHadoopを中心としたそれぞれのアプローチとクラウド活用について解説する。

 前編はこちら

RDBMS中心のアプローチ

 これはRDBMSのSQLクエリエンジンをメインに利用するアプローチです。SQLのクエリを使ってHadoop上のデータにもアクセスするという考え方です。SQL(Oracle SQL)に関する既存の知識やスキルでHadoop上のデータを扱えるため、データ活用のハードルを大きく下げられます。日本オラクルでは、NoSQLやHadoopに対してSQLでアクセスできるようにするソフトウェア「Oracle Big Data SQL」を提供しています。


 Oracle Big Data SQLは、データベース専用機「Oracle Exadata Database Machine」と連携させることで、SQLを介してHadoop上の非構造化データを操作可能にする技術です。Hadoopのメタデータを使って外部表を生成し、その表に対してSQLでアクセスすると、外部表の背後にあるHadoopノード上の実データにアクセスできるという仕組みです。

 Oracle SQLの構文をそのまま使えるため、「Oracle Database」の分析関数も活用できます。“SQLの弱点”とされてきた時系列データを分析するための分析関数も含まれており、パターンマッチング関数を使えば各種デバイスが出力する稼働ログから特定の波形パターンを検出し、機器の故障を早期に検知することも可能です。

 また、Oracle Exadataで培ってきた高速化技術「Smart Scan」をHadoop上で動作させることでデータノード側でデータを絞り込み、データ転送量の極小化とクエリ処理の高速化を図ることができます。


 さらにもう1つの高速化技術「Storage Index」もHadoop上で動作可能です。データブロックごとのインデックスの最大値と最小値を作成し、スキャン前に目的のデータがブロック内にあるか確認、クエリに必要なデータブロックのみをスキャンする。クエリ時間の短縮とデータI/Oの削減を可能にし、日本オラクルの検証では平均65%、最大100倍の高速化を実現しました。


 SQLクエリはOracle Databaseを介して発行されるため、データマスキングやアクセス制御といったセキュリティ機能をHadoop上のデータに対しても適用できます。セキュリティ管理を統合し、シンプル化します。


Hadoop中心のアプローチ

 RDBMS中心のアプローチとは逆の方法であり、HadoopからRDBMSのデータにもアクセスできるようにするという考え方です。

 例えば、Hadoop上でウェブログを分析する際、顧客IDなどのマスタデータをRDBMS側に保持したまま処理させられます。これまではRDBMS上のデータをHadoop側に移動し、結合する必要がありました。データの移動には時間とコストを要するだけでなく、セキュリティの観点でも大きな懸念がありました。

 日本オラクルでは、Hadoop中心のアプローチとして「Oracle Table Access for Hadoop and Spark」という機能を提供しています。Oracle Database上のデータをHiveの外部表として定義することで、SQLライクな「Hive SQL」や「Spark SQL」からOracle Database上のデータへアクセス可能にします。JDBCによるデータアクセスを並列化するため高速にデータ連携できます。


 日本オラクルでは、上記2つのアプローチのほかにも、Hadoopを活用するためのハードルを下げたり、HadoopとRDBMSをより密に連携させたりするための製品やサービスを提供しています。


関連記事

一緒に見られている製品

編集部おすすめ

ピックアップ製品

サーバ
PC・モバイル
ストレージ
ネットワーク
仮想化
クラウドサービス
クラウドストレージ
IaaS
PaaS
プライベートクラウド
OS・ミドルウェア
開発
データベース
運用
セキュリティ
新興技術
財務・経理
人事・労務
マーケ・営業
購買・調達
生産・製造
データ分析
統計解析
テキストマイニング
ソーシャルメディア分析
BI
コミュニケーション
通信・通話
文書・コンテンツ
サイト構築
PCソフト
学習

ベンダー座談会

Follow TechRepublic Japan