2012/09/13

「なんちゃってクラウド」から本物のクラウドストレージへ

  最近、ビッグデータやクラウドに関する記事を見かけることが増えました。このいずれも専門用語のようですが明確な定義がないバズワードです。著者の場合は、ビッグデータとは、インターネットの技術者たちが突然押し寄せる大波(Big Wave)になぞらえ、大量に(Volume)、かつ迅速に(Velocity)に処理する必要性がある構造化されていない多種多様なデータ(Variety)を表現していると理解しています。

 しかし、どうもサービス企画関係者は利用履歴等の大量データ分析に基づくリコメンデーションといった、以前にはWeb2.0と呼ばれたサービスのビジネスモデルの総称として、また制度関係者はプライバシー侵害の代名詞のように「ビッグデータ」という言葉を使用していると聞いたことがあります。

 また、クラウドとは、クラウド・コンピューティングに由来しており、大規模分散処理のソフトウェア技術を利用しているべきと考えています。そうでない自称クラウドは、「なんちゃってクラウド」だと観ています。

 実際のところ、代表的なクラウドサービスを提供するGoogle、Amazon、Facebook、Twitter等々、「本物のクラウド」は、このビッグデータに対応するため、大規模分散処理技術による高い拡張性と経済性を備えたオブジェクトストレージを採用しています。これは「クラウドストレージ」とも呼ばれており、日本においても本物のクラウドストレージサービスが開始されています。また、プライベートクラウドやエンタープライズのためのストレージとしても高い関心を集めています。その特徴をここで紹介したいと思います。

高い拡張性と経済性
 「拡張性」とは、ある日突然想定もしないデータの波が押し寄せたとしても、柔軟にシステム全体が処理できるデータ容量を増やすことができるという性質です。従来型のNASやSANといった専用ストレージ装置は、その「箱」のサイズで格納できるデータ量が決まります。その箱が一杯になれば大きな箱に買換え、サービス停止が絶対に起こらないよう慎重に中身を移し替えるというサイクルを繰り返します。

 しかし、GoogleやAmazonといった代表的なインターネット企業達は、汎用的に利用される数テラバイトから数十テラバイトの内蔵ディスクをもつIAサーバーと、NOSQL(Not Only SQL)と総称される大規模分散処理のソフトウェア技術を使っています。最初は数台のサーバーから始め、データが増えるとともに数十台から数百台と追加し、それらを仮想的に統合して、たとえばシステム全体として数百テラバイトやペタバイトといったデータサイズをもつストレージとして利用しています。

 ここでは、ソフトウェアがデータを複数個に自動複製し他のサーバーにも格納することで、一部のサーバーが故障した際のデータ消失を防いでいます。また、新しいサーバーを追加、置換するだけで、自動的にデータの再配置や負荷の分散を行います。つまり、堅牢で高価なハードウェアを利用するのではなく複数の安価なハードウェアを分散、並列して利用し、「絶対に壊れない」ではなく「故障しても取り替えれば良い」という発想の転換により「経済性」を実現しています。

図1:大規模分散処理のイメージ



オブジェクトストレージである利点
 クラウドストレージは高い拡張性と経済性を備えることに加え、オブジェクトストレージが主流と言えます。オブジェクトとはテクスト、写真、動画、音楽、アプリケーション等々、構造が一定ではない多種多様なデータやファイル類です。オブジェクトストレージには、それぞれのオブジェクトが属性情報を示すメタデータを持ち、オブジェクトの認証IDがHTTPであり、階層構造ではなくフラットな構造にオブジェクトを格納します。

 特に、このフラットな構造は、頂点がサーバーやデータセンターの場所を示すことからデータ移動を柔軟に行いにくい階層構造と異なり、クラウドのように大量のファイルが自由自在に移動する可能性のある環境に適しています。また、オブジェクトを認証するIDがhttp://s3.cloudian.com/123456/abcdef/といったHTTPであることから、WAN(広帯域ネットワーク)経由で複数データセンター間におけるデータのやり取りを容易にしています。

図2:オブジェクトストレージの構造はフラット


クラウドストレージが日本でも本格化します
 このような特徴を持つクラウドストレージの代表的なサービスがAWS(Amazon Web Service)のAmazon S3(Simple Storage Service)です。2012年6月には1兆個のオブジェクトをストレージしていると発表したように、目覚ましい成長を見せています。

 日本でも昨年9月よりニフティが「ニフティクラウドストレージ」、本年9月にはYahoo!が「Yahooクラウドストレージ」を開始しています。このいずれもが高い拡張性と経済性をもつ本格的なクラウドストレージです。これらが本物のクラウドであることはAmazon S3と同様に1GB(ギガバイト)あたり10円~20円といった従量制の課金体系であることからもわかります。「なんちゃってクラウド」の場合は、ユーザー毎に「箱」を用意せざるを得ないため、提供する容量に制限があり、また使う使わないに限らず100GB単位や1TB単位といった「箱」のサイズを意識した課金単位となっています。

 クラウドストレージの分野は今後にぎやかになりそうです。GoogleやAmazonは自社開発したソフトウェアを利用していますが、”Cloudian(クラウディアン)は、Amazon S3のようなクラウドストレージを簡単に短期間に構築できるパッケージソフトウェア製品です。このCloudianはプライベートクラウドやエンタープライズの分野でも利用できます。そのため、様々な分野でクラウドストレージの採用事例が登場しそうです。今後しばらくこの動向に注目してみてはどうでしょう。

*クラウディアン株式会社執筆のホワイトペーパー「クラウドストレージの基礎知識」で、クラウドストレージについてわかりやすく解説しています。TechTargetジャパン又はZDNetZDNet Japanからダウンロードできます。ぜひご利用ください。