BI PaaS 日本オラクル

ビッグデータ活用を成功に導くクラウド利用のすすめ(後編)

ビッグデータという言葉の認知度は上がっているものの、多くの企業にとってコストやスキル面でのハードルはまだ高い。後編では、RDBMSとHadoopを中心としたそれぞれのアプローチとクラウド活用について解説する。

 前編はこちら

RDBMS中心のアプローチ

 これはRDBMSのSQLクエリエンジンをメインに利用するアプローチです。SQLのクエリを使ってHadoop上のデータにもアクセスするという考え方です。SQL(Oracle SQL)に関する既存の知識やスキルでHadoop上のデータを扱えるため、データ活用のハードルを大きく下げられます。日本オラクルでは、NoSQLやHadoopに対してSQLでアクセスできるようにするソフトウェア「Oracle Big Data SQL」を提供しています。


 Oracle Big Data SQLは、データベース専用機「Oracle Exadata Database Machine」と連携させることで、SQLを介してHadoop上の非構造化データを操作可能にする技術です。Hadoopのメタデータを使って外部表を生成し、その表に対してSQLでアクセスすると、外部表の背後にあるHadoopノード上の実データにアクセスできるという仕組みです。

 Oracle SQLの構文をそのまま使えるため、「Oracle Database」の分析関数も活用できます。“SQLの弱点”とされてきた時系列データを分析するための分析関数も含まれており、パターンマッチング関数を使えば各種デバイスが出力する稼働ログから特定の波形パターンを検出し、機器の故障を早期に検知することも可能です。

 また、Oracle Exadataで培ってきた高速化技術「Smart Scan」をHadoop上で動作させることでデータノード側でデータを絞り込み、データ転送量の極小化とクエリ処理の高速化を図ることができます。


 さらにもう1つの高速化技術「Storage Index」もHadoop上で動作可能です。データブロックごとのインデックスの最大値と最小値を作成し、スキャン前に目的のデータがブロック内にあるか確認、クエリに必要なデータブロックのみをスキャンする。クエリ時間の短縮とデータI/Oの削減を可能にし、日本オラクルの検証では平均65%、最大100倍の高速化を実現しました。


 SQLクエリはOracle Databaseを介して発行されるため、データマスキングやアクセス制御といったセキュリティ機能をHadoop上のデータに対しても適用できます。セキュリティ管理を統合し、シンプル化します。


Hadoop中心のアプローチ

 RDBMS中心のアプローチとは逆の方法であり、HadoopからRDBMSのデータにもアクセスできるようにするという考え方です。

 例えば、Hadoop上でウェブログを分析する際、顧客IDなどのマスタデータをRDBMS側に保持したまま処理させられます。これまではRDBMS上のデータをHadoop側に移動し、結合する必要がありました。データの移動には時間とコストを要するだけでなく、セキュリティの観点でも大きな懸念がありました。

 日本オラクルでは、Hadoop中心のアプローチとして「Oracle Table Access for Hadoop and Spark」という機能を提供しています。Oracle Database上のデータをHiveの外部表として定義することで、SQLライクな「Hive SQL」や「Spark SQL」からOracle Database上のデータへアクセス可能にします。JDBCによるデータアクセスを並列化するため高速にデータ連携できます。


 日本オラクルでは、上記2つのアプローチのほかにも、Hadoopを活用するためのハードルを下げたり、HadoopとRDBMSをより密に連携させたりするための製品やサービスを提供しています。


「BI」で読まれている記事

TechRepublic Japanで人気の記事

編集部オススメ

トレンドまるわかり![PR]

財務・経理
人事・労務
マーケ・営業
購買・調達
生産・製造
データ分析
統計解析
テキストマイニング
ソーシャルメディア分析
BI
コミュニケーション
通信・通話
文書・コンテンツ
PC・モバイル
新興技術
ITインフラ
クラウドサービス
クラウドストレージ
IaaS
PaaS
プライベートクラウド
OS・ミドルウェア
開発
データベース
運用
セキュリティ

ホワイトペーパーランキング

  1. AWSが提唱する、モダン分析プラットフォームのアーキテクチャと構築手法
  2. AWS資料、ジョブに特化した目的別データベースを選定するためのガイド
  3. Zero Trust Workbook--ゼロ トラストの先にある世界を知るためのガイダンス
  4. 「ゼロトラスト」時代のネットワークセキュリティの思わぬ落とし穴に注意せよ
  5. データ駆動型の組織でビジネスの俊敏性を実現するには?戦略的な意思決定とイノベーションを両立へ

Follow TechRepublic Japan

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]