2012/03/28

CloudianにおけるNOSQL活用事例(プレゼンテーション)

2012年3月18日開催の産業技術大学院大学主催、InfoTalkにおけるCloudianにおけるNOSQL活用事例のプレゼンテーション資料です。

S3 REST APIに完全準拠のクラウドストレージ構築ソフトウェア、CloudianにはCassandraとRedisを実装しています。さらに独自開発のHyperStoreにより性能とディスクの利用効率を高めています。このHyperStoreを開発する背景となったNOSQLデータベースの性能試験結果についてもご紹介しています(プレゼン資料12頁と20頁)。

この性能試験結果は、先日お知らせいたしました4月末にリックテレコム社より発売予定の「NOSQLの基礎知識」にて解説しています。



Cloudian nosql casestudy_20120318
View more presentations from geminimobile

2012/03/27

「NOSQLの基礎知識(ビッグデータを活かすデータベース技術)」

Geminiのメンバーが執筆したNOSQLの入門書、「NOSQLの基礎知識(ビッグデータを活かすデータベース技術)」が本年4月末には全国有名書店で発売されることになりました。

NOSQLの基礎知識(ビッグデータに備える これからのデータベース技術)




本書の主な内容(目次)は以下のとおりです。

 はじめに
 序章 ビックデータの時代
 0.1 ビックデータとNOSQLの登場

 第1章 NOSQLとは何か?
 1.1 NOSQLは新しいムーブメント
 1.2 SQLだけではダメなのか?
 1.3 用途を絞り込んだデータベース
 1.4 NOSQLとSQLの使い分け
 まとめ

 第2章 NOSQLのデータモデル
 2.1 NOSQLデータベースは世界に100種以上
 2.2 NOSQLをデータモデルから分類する
 2.3 キー・バリュー型の特徴
 2.4 カラム指向型の特徴
 2.5 ドキュメント指向型の特徴
 2.6 グラフ型の特徴
 まとめ

 第3章 アーキテクチャの基本概念と技術
 3.1 マスタ型とP2P型
 3.2 データの整合性に関する概念と技術
 3.3 データ分割・割り当ての技術
 3.4 ストレージレイアウトの技術
 3.5 メンバーシップと障害検知
 3.6 API:PutとGetのオペレーション
 3.7 CAS操作
 まとめ

 第4章 HadoopはNOSQL?
 4.1 Hadoopはデータベースに非ず
 4.2 Hadoop MapReduce
 4.3 エンタープライズで使われ始めたHadoop
 まとめ

 第5章 主なNOSQLデータベース製品
 5.1 データモデルとアーキテクチャによる分類
 5.2 マスタ型のキー・バリューストア
 5.3 P2P型のキー・バリューストア
 5.4 オンメモリのイネーブラ型KVS
 5.5 オンディスクのイネーブラ型KVS
 5.6 カラム指向のマスタ型データストア
 5.7 カラム指向のP2P型データストア
 5.8 グラフ型のデータストア
 5.9 ドキュメント指向型のデータストア
 まとめ

 第6章 NOSQLデータベースの選択基準
 6.1 NOSQL製品を選ぶ視点
 6.2 技術的特性からの評価
 6.3 性能面からの評価
 6.4 ビジネス適用を想定した評価
 まとめ
 6.補 性能テストの実例

 第7章 NOSQLを使うビジネス
 7.1 オープンソースのビジネスモデル
 7.2 OSSに依拠したサポートビジネス
 7.3 NOSQLの適用領域
 まとめ
 さいごに
 謝辞
 参考文献・参考資料 索引 プロフィール

 コラム一覧
 Column BBCのNOSQL活用
 Column NewYork TimesのNOSQL活用
 Column 市民権を得始めた「ビッグデータ」
 Column NOSQLの語が日本で浸透し始めた契機
 Column エンタープライズの領域でも「ビッグデータ」
 Column Netflixの事例
 Column TwitterのNOSQL活用
 Column FacebookのNOSQL活用
 Column StumbleUponの事例
 Column DiggによるCassandra活用

NOSQLの入門書として、データモデルやBigtableとDynamoの論文に触発された多くのNOSQLデータベースに共通するアーキテクチャについて、できる限りわかりやすい解説になるよう心がけました。
また、Cassandra、HBase、Riak、Hibariの性能についても補論として紹介しています。

3月18日開催のInfotalkにてCloudianの紹介をいたしましたが、このなかでこの性能試験結果についても一部説明しました。当日の模様はUstreamでご覧になれます。Cloudianは01:50:00位に開始、性能試験結果は02:10:00あたりからです。