統合アーキテクチャー: Hive ベースの Hadoop および Campaign
IBM® Campaign と Hive ベースの Hadoop ユーザー・データ・ソースの統合アーキテクチャーを以下の図に示します。
Apache Hive データウェアハウス・ソフトウェアを使用すれば、分散ストレージに格納されている大規模なデータ・セットの照会と管理の作業を簡略化できます。Apache Hadoop を基盤とする Hive には、以下の機能が用意されています。
- データの抽出/変換/ロード (ETL) を簡単に実行するためのツール
- さまざまなデータ・フォーマットに構造を適用するためのメカニズム
- Apache HDFS に直接格納されているファイルや、Apache HBase などの他のデータ・ストレージ・システムに格納されているファイルへのアクセス
- MapReduce による照会の実行
Hive では、SQL のようなスタイルのシンプルな照会言語が定義されています。SQL に慣れているユーザーがデータ照会のために使用できる HiveQL (または HQL) という照会言語です。
Hue エディター (Hadoop UI) を使用してビッグデータ・インスタンスを処理できます (例えば、テーブルやデータベースへの接続、表示、作成など)。