Verticaのポイント
- 必要な列のブロックだけを読み込むことでディスクの入出力を削減可能
- シェアードナッシング方式でノード数に比例して性能も向上
- 「SQL99」に準拠、JDBCやODBC、ADO.netの各ドライバに対応
Verticaの製品解説
「Vertica」はデータウェアハウス(DWH)向け列指向型データベース。全社的なビッグデータ分析基盤としても活用できる。
列単位で物理的にデータを格納し、必要な列のブロックだけを読み込むことでディスクの入出力を削減可能。列指向に最適化されたデータベースエンジンを搭載しており、汎用的なリレーショナルデータベース(RDB)に比べてクエリを50~1000倍高速化可能としている。
データの属性に応じた圧縮アルゴリズムでデータを最大90%圧縮できると説明。圧縮した状態で内部演算処理するため、物理ストレージの使用容量も削減できる。
分散コンピューティング環境で各ノードがリソースを共有せずにそれぞれが独立して自律的に動くシェアードナッシング方式を採用しており、ノード数に比例して性能も向上可能。全てのノードが同じ役割を実行することでノードの拡張時にもオーバーヘッドは発生しないという。
3ノード以上の構成でレプリカを保持可能。自動レプリケーションで障害が発生した場合でもサービスは継続できる。データをロードするときはSQLを書かずにそのままディスクに書き込むバルクロードを使用することで高速にロード可能と説明する。
業界標準の「SQL99」に準拠しており、JDBCやODBC、ADO.netの各ドライバに対応、ビジネスインテリジェンス(BI)などともスムーズに連携できる。Apache HadoopやApache Spark、Apache Kafkaとも連携できる。
対話形式のGUIツール「Database Designer」を利用すれば、データ圧縮や列の並び替えなど検索に最適なデータ配置が短時間で自動的に可能。GUIベースの管理ツール「Management Console」はクラスタのリソース状況やデータベースの管理、アクセスが集中する時間帯やサーバ負荷が高い時間帯のドリルダウン、ピークタイムの傾向分析などができる。
用途と機能 | 列指向型データベース |
---|---|
特徴 | データの属性に応じた圧縮アルゴリズムでデータを最大90%圧縮。ノード数に比例して性能も向上可能。自動レプリケーションで障害が発生した場合でもサービスは継続 |