データのストリーミングは大きな見返りが期待できる。しかし、その取り扱いは容易でない。
バッチ指向のプログラミングモデルであるMapReduceが何年にもわたって中心的な役割を担ってきた、と主張する人はいるものの、ストリームデータ処理への移行は着実に進んでいる。GartnerアナリストのMerv Adrian氏は、ビッグデータ関連イベントのStrataに参加して「どちらを向いても、ビッグデータ業界がすぐに移動できる状態のデータ(Data in Motion)を軸足にしつつあることは明白」との見解を述べた。
このストリーミングへの流れを推し進めている企業の1社が、インメモリデータベースの生みの親であるMemSQLだ。同社は、目新しいオープンソースツールStreamlinerの開発プロジェクトで主要コミッタを務めている。ちなみにStreamlinerは、分散データ処理ソフトウェアSparkとリアルタイムパイプラインのデプロイメントを省力化するためのツールだ。本記事では、ストリームデータ処理へ向かうこの流れを詳しく調べるため、MemSQL技術担当バイスプレジデント、Ankur Goyal氏の発言を追ってみた。
残り本文:約2016文字 ログインして続きを読んでください。