2013/03/29

ストレージ市場の俯瞰とその新潮流 - 空気を読まない「破壊(disrupt)」



ビッグデータとクラウド・ストレージ」 連載 第十二回

トレンド編6: ストレージ市場の俯瞰とその新潮流 - 空気を読まない「破壊(disrupt)」


エノテック・コンサルティング代表
海部美知

この連載、続きものとしてはいったん今回にて終了、今後は不定期の掲載となる。連載の最後として、少々まとめ的に、ストレージ市場を俯瞰的に見ておくことにしよう。


◆ サーバー人とストレージ人の顔ぶれ


連載ではクラウド・ストレージについて主に書いてきたが、エンタープライズのインフラではまだまだ、自前で機器を購入して運用するケースのほうが多い。こうした機器の市場では、連載第七回に書いたように「サーバー人」と「ストレージ人」が別々の顔ぶれだが、いずれも大きなベンダーがしっかり市場を押さえている。

IDCの最近の発表によると、企業向けサーバーのベンダー上位は、IBMがシェア37%で圧倒的トップ、これにHP、デル、オラクル、富士通が続き、上位3社で市場の75%を占める。

同じくIDCの調査で、企業向けストレージ製品の上位は、EMCが24%でやはり圧倒的トップであり、これにIBM、HP、デル、ネットアップが続き、上位3社のシェアが65%だ。

こうしたストレージ機器は、堅牢・高価・高マージンというのが相場。この市場を、空気を読まないアマゾンが低マージンの「クラウド・サービス」で破壊(disrupt)しようとしていることになる。


◆ 大容量化・高速化の流れ


といっても、アマゾンは単に同じもののマージンを削って安値攻勢をしているのではなく、ワケあって安い。というより、重視する要素が異なる、別物といったほうがよく、ストレージのニーズによって、どれを選ぶべきかは異なる。

InfoWorld掲載のストレージの新技術潮流についてまとめた記事では、いくつかの企業の事例とそれに合う技術の進展状況が挙げられている。

例えば、HD監視カメラの映像データが増えすぎて悲鳴をあげている物流会社のケースでは、コストを抑えてひたすら物量を溜め込めるシステムが欲しい。ただし、アクセス速度も可用性もあまり重要ではない。こうした用途向けには、ディスクの材料や保存方式の技術革新により、将来的には現在主流となっている方式の5~6倍程度まで容量をあげる技術がいくつか開発されている。また、ソリッドステートドライブ(SSD)では、容量そのものを増やすだけでなく、オーバーヘッドを減らすことで実質的に容量をあげることも行われている。

また、この場合は連載第九回で述べた重複排除(de-dupe)とデータ圧縮によって、保存データを減らす機能も効果的だ。特に、データを保存する前に重複排除する「in-line de-dupe」を使えば、いったん保存してから圧縮するよりも最初から容量が少なくて済むため、使える容量が5~10倍増えるのと同じ効果がある。重複排除はストレージ製品には不可欠な機能となりつつある。

一方、大量のデータを高速で処理する必要のある大学の研究設備では、アクセス速度を重視して、NAS機器をより高性能のものにアップグレードした。ただし、扱っているのはトランザクション・データではないので、データの書き換えはほとんど起こらず、書き込みの可用性は問題にならない。


◆ クラウド・ストレージはどう違うのか


これに対し、企業のマーケティング情報管理をSaaS方式で提供するオンライン・サービスでは、従来型の高性能システムから、安価なコモディティのハードウェアに分散管理能力にすぐれたソフトウェアを載せる方式で、コスト削減と速度・可用性・スケーラビリティの向上とディザスター・リカバリーを同時に実現したという。

この企業のケースでは、デルの安価なハードとNOSQLのCassandraを使っている。先刻のde-dupeとは逆に、データセットの複数のコピーをネットワーク内の別の場所に保管する。「書き込みの可用性」を優先して、どのコピーにもいつでも書き込みができるようにし、コピー同士の同期は後で解決する。この企業の業務ニーズからすると、それほどの頻度でデータが書き換えられるわけではないので、この間数ミリ秒はデータが完全にアップデートされていなくても問題がない。(ただし、金融取引システムなどのように、非常に高頻度でデータ書き換えが起こる場合にはこの方式は使えない。)

もともとハードウェアの故障が多いことを想定しているため、ディザスター・リカバリーの仕組みが内在されている。複数コピーの保存・管理により、一部が壊れたり復旧したりしてもすぐに元に戻るのだ。災害でなくても、わざとハードを増やしたり減らしたりする作業も同じ仕組みで簡単にできるので、急激なデータの増減に容易に対応できるスケーラビリティが実現できる。

え・・あれ?この仕組みはどこかで聞いたことがあるような・・と思われたかもしれない。そう、これはアマゾンと同じ考え方、つまり「クラウド・ストレージ」のコンセプトだ。使うソフトにより多少の違いがあるが、なにしろ「ソフトによる分散管理」と、それに伴う「スケールアウト能力」が、連載第二回で紹介した「クラウド・ストレージ」の最重要ポイントだ。

このオンラインサービス企業の場合は、自前でこのシステムを構築した「プライベート・クラウド」であるが、アマゾンはこれらの特徴を活かして、もとは自社用に作ったシステムを、マルチテナントで外部企業にも貸し出しているというわけだ。

これらの特徴のうち、「高速」という部分を外せば、さらに安価なアーカイブ向けのサービスが可能となる。昨年11月に発表された、データの取り出しに3~5時間かかるアマゾンのGlacierでは、なんとギガバイト当たり月額1セントである。アクセス時間もテープ並だが、料金もテープと十分競争できるレベルと言われている。

アマゾンが「ワケあって安い」というのは、こういった背景がある。従来型の企業向けストレージ製品をデータセンターに置いてネットでつないだとしても、それは「ホスティング」であって、上記のような「クラウド」とは違う。


◆ アマゾンと対抗陣営たち


このアマゾン・ウェブ・サービス(AWS)のS3が、クラウド・ストレージ市場の60%のシェアを持っており、事実上の標準となっていることは何度も述べたとおりだ。しかし当然、冒頭に挙げたような大手ベンダーは、空気を読まないアマゾンを面白くないと思うので、なんとか対抗しようという動きが見られる。

クラウド・ストレージにはCDMIという国際標準規格が採択されているが、このメンバーはEMCなどの既存ストレージ・ベンダーであり、アマゾンははいっていない。

また、連載第五回で報告したOpenStackやCloudStackなどのオープンソース勢力も頑張っている。NASAを源流とするOpenStack勢では、今年の1月にIBMが自社サービスをOpenStackで構築すると発表している。大手各社は、いずれも自社製品のAPIによるエコシステム構築を目指すはずだ。

このように、陣取り合戦は激化しているが、それでもS3が強いという事実は無視できない。連載第十回で話されているように、一部をS3で、別の一部はプライベート・クラウドで、という「ハイブリッドクラウド」や、すでにS3で作ったシステムを移し替える場合、S3と他のクラウドをつなげて使う場合など、いろいろな場面が想定できる。その場合に、S3に対応していなければ、つなげるためにアプリケーションに手を加えたり、ミドルウェアで差分を吸収したり、ユーザー側のインターフェースが面倒になったり、などといった余計な手間がかかる。

このため、OpenStackなどの製品でも、「S3との互換性」をうたっているケースが大半だ。現代の国際社会と同じで、相互依存関係が強くなり、たとえ相手を面白くないと思っても、なんとか共存していくのが得策なのだ。

シリーズ・スポンサーのクラウディアンは、S3陣営の一角でもあり、従来型の企業自前の設備と、アマゾン型のパブリック・クラウドとの間のギャップを埋める存在である。前述の例にあげたオンライン・マーケティング管理企業のように、自前でスケーラブルなプライベート・クラウドを構築できればよいのだが、一般企業ではなかなか難しいので、その場合はクラウディアンのような、新しいタイプのクラウド・ベンダーを活用すればよい。

ストレージ業界の「破壊(disrupt)」とは、単なる価格破壊ではない。種々の企業のそれぞれのニーズに合わせて、有効な選択肢が増えるということだ。データ量の爆発的な増加や、データ分野の新しいビジネスモデルの登場はますます加速していくと予想される中、企業ユーザーの間でもクラウド・ストレージの重要性はますます高まっていくだろう。

海部美知(かいふ・みち)


エノテック・コンサルティングCEO(最高経営責任者)。ホンダを経て1989年NTT入社。米国の現地法人で事業開発を担当。96年米ベンチャー企業のネ クストウエーブで携帯電話事業に携わる。98年に独立し、コンサルティング業務を開始。米国と日本の通信・IT(情報技術)・新 技術に関する調査・戦略提案・提携斡旋などを手がける。シリコンバレー在住。子育て中の主婦でもある。ブログ:Tech Mom from Silicon Valley。Twitter ID:@MichiKaifu。 著書に『パラダイス鎖国 忘れられた大国・日本』(アスキー新書)がある。

2013/03/28

Cloudian Video「なぜオブジェクトストレージを使うのか?」

先日、クラウディアンのUSチームがCloudian(クラウディアン)を紹介するビデオを作成し、YouTubeで公開しています。ここでは日本語訳をご紹介します。






  • なぜ、オブジェクトストレージを使うべきなのでしょう?
  • 物理的にオブジェクトベースのストレージは、他のSANのようなスタックできる内蔵型ディスクアレイからなります。
  • 伝統的なストレージアレイとは異なり、オブジェクトベースのストレージはHTTP経由でアクセスします。
  • このアクセス方法とペタバイト級に拡張できる能力が、オブジェクトベースのシステムをパブリックとプライベートクラウドソリューションにとっての良い選択とします。
  • また、異種のノードを簡単に組み合わせることができるオブジェクトストレージクラスタ全体は、オンラインで高い拡張性を有するファイル保管庫となります。
  • オブジェクトストレージは、静的で高拡張性が要求されるアーカイブ保存のユースケースや仮想サーバーをホストするためのSANとしての利用、または、コストを抑えた動的なアプリケーションシステムとして最適です。
  • 加え、データアーカイブのテープや光学ディスクの代替としても利用できます。これらのメディアは遅く、拡張性が無く、読み出しが難しいです。
  • Cloudianは素早く展開でき、高い拡張性を有し、小さな10テラバイトのシステムから数ペタバイトのシステムまで利用でき、汎用コストを使用し、Amazon S3に互換するオブジェクトストレージ基盤なのです。

2013/03/10

昼食も並列分散処理?「リアルタイム系ビッグデータ」への注目~シリコンバレー「Strata」会議から


「ビッグデータとクラウド・ストレージ」 連載 第十一回


イベント・企業編6: 「リアルタイム系ビッグデータ」への注目 ~ シリコンバレー「Strata」会議から


エノテック・コンサルティング代表
海部美知

ビッグデータの会議Strataの米国開催分については、私は今のところ開始以来の皆勤賞で、もう5回目となる。昨年秋のニューヨークでの様子もこのコラムでもご紹介したので「またか」と思われるかもしれないが、今回はまた別の面白さがあったので、「西」バージョンのStrataの様子をお伝えしたい。


◆ 昼食も「並列分散処理」!?


カンファレンスは相変わらずの賑わいで、チュートリアル中心の初日はコーヒーの在庫が底をつき、空のカップを持ったままウロウロ歩きまわるコーヒー難民が続出したが、本プログラムの2日目・3日目は、昨年までと比べ、やや落ち着いた感じがあった。私はそれを「地に足がついてきた」と受け取った。

2011年はキックオフの年でもあり、主催者オライリーメディアのトップ、ティム・オライリー自身も何度も登壇し、著名人ゲストスピーカーを並べた華やかなラインアップで、ビッグデータの概念や理念を語る講演が多かった。次の2012年は、著名人は姿を消し、メインスポンサーであるHadoopやCassandra系のソフト/サポートベンダーの話が多くを占め、提供側の販売や求人のための技術中心イベントという色が強く感じられた。

これに対し、今年も引き続きオライリー自身も来ず、著名人ゲストもいなかったが、企業での利用事例の講演が大幅に増え、経営の視点からの話もあり、より多彩で現実に近い話が多かった。

もちろんそれだけでなく、主催者側が運営に慣れてきたという要因もあるだろう。参加者の数はおそらく昨年とほぼ同等と思われたが、昨年のような会場での渋谷駅的混雑はなかった。近い内容の講演を近い場所に集める「行動予測」、昼食では広いホールの片側に全く同じ内容のバイキング式テーブルを大量に横にならべて一気に人を流す「大量並列分散処理」など、「ビッグデータ」の考え方をカンファレンス運営でもようやく取り入れたようだ。

展示会場では常連であるClouderaやDatastaxなどのビッグデータ系ソフトウェア・ベンダーや、エンタープライズ分野のIBM、マイクロソフト、VMware、データ解析ソフトのベンチャーなど、大小さまざまな企業が賑やかに出展。日本企業もようやく初登場、NSKという中堅ソフトウェアベンダーが企業ユーザー向けの超高速データ処理システムを展示していた。


◆ 赤ちゃん事例対決のゆくえ


グーグルやアマゾンなどのいわゆる「ネット企業」でなく、リアルとのつながりが強い場面での応用事例は面白いものがたくさんあり、どれをここでご紹介すべきか迷ったのだが、「赤ちゃん関連」の二つを例としてご紹介してみよう。

一つは、ベビー肌着に仕込んだセンサーで、赤ちゃんの呼吸状況と体温を計測し、サーバー側で処理してユーザーのiPhoneに表示するハイテク・ベビーモニターのRest Devicesというベンチャーだ。同社は最初、睡眠時無呼吸症候群対策のための大人用Tシャツを開発し、その後ベビーモニターに展開したという。フィットネス向けのウェアラブル・センサーはすっかり普及して競争も激しく、一方でセンサーではありとあらゆるデータが採取できるが、同社では赤ちゃんの親が一番知りたがっている「睡眠と温度」の二つに絞り込んで見やすくしている。センサーによる「睡眠状況の監視」の解析のノウハウを蓄積していることもあり、はっきりとした特徴を打ち出している。

今のところ月額サービス料金はなく、センサーつきのベビー肌着3枚と読取送信ユニットのスターター・キットが200ドル、追加のベビー服を20ドル程度で販売している。なるほど、大人用のTシャツは一枚売ったら終わりだが、赤ちゃんはどんどん大きくなるので肌着は2~3ヶ月ごとには買い換えなければいけない。しかもベビー服には「ギフト」の需要もあり、少々高額でもそれほど違和感はない。これはなかなか、いいところに目をつけたと感心した。



データ量は一晩でだいたい600MB、ユーザーはまだそれほど多くないが、「M2M(マシン・ツー・マシン)/IoT(モノのインターネット)」としての新しい事例で、「コネクテッド・ワールド」というシリーズの一つであった。「リアルとの結びつき」部分にセンサーを活用したビッグデータ応用例は、現在注目の的だ。

もう一つの赤ちゃん関連事例は、病院の未熟児用ICUにおけるデータ解析プラットフォームで、こちらはIBMが「医療分野でのビッグデータ応用」の例として挙げていたものだ。ICUや手術室では、さまざまな高度医療機器が利用され、データが刻々とそれぞれの画面に表示されているのだが、すべて別々のベンダーで別々のデータフォーマットで別々に動いており、吐き出されるデータはほとんど使われずに流れていってしまう。これを集めて解析し、容態の変化を統合的に可視化して、問題に早めに対応したり、あとで解析に利用したりすることができるようにしたシステムだ。

ぜんぜん違うモノのように見えて、意外にこの二つは共通点がある。IBMのほうも、医療機器が連続的に吐き出すデータを扱う「M2M/IoT」であり、また両者ともに「リアルタイム処理」を重視する点が共通しているのだ。従来のビッグデータ事例は、過去から蓄積された大量データをバッチ処理するタイプのものが多かったが、最近では、新しいデータを高速で取り入れて解析する「リアルタイム型」がIoTとの関連で特に注目されている。

センサー系サービスはお話としても面白いものが多く、前者のベンチャーのほうがマスコミ的には話題になりそうに思うが、聴衆の数は実は後者のほうが圧倒的に多く、今回のカンファレンス中唯一、席が足りず立ち見で聞いた講演だ。ビッグデータの業界人から見ると、奇抜なアイディアよりも病院システムのほうが市場規模が大きく、しっかり儲かる可能性も高い。

新しくセンサーを人につけさせてデータを作り出すためには、まずはどうやってセンサーをつけてもらうかという「猫に鈴」問題を乗り越えなければならない。その前に、すでに企業の中で無駄に捨てられたり放置されたりしているデータは実は多く、このゴミ屋敷をビッグデータ手法を使って宝の山に変えるというのが、英語のイディオムでいえば「low hanging fruit(低いところになっている果実=簡単に入手できる成果)」と見られているわけだ。

◆ 企業クラウドを支えるインフラ


どちらかと言えば「バッチ処理系」に強いHadoopに対し、こうした「リアルタイム系」のためのデータベースとしては、アマゾンDynamoの流れをくむオープンソースCassandraが向いていると言われている。

これらのNOSQLデータベースは他にも多数あり、その一つであるRiakを擁したBashoが今回は初めてこの展示会でブースを出していた。RiakはCassandraよりももっとDynamoの考え方に忠実であり、リアルタイム・モバイルメッセージ・サービスとして著名なVoxerのバックエンドとして使われていると説明していた。同社はこのRiakを中心に事業を展開していたが、最近ではCloudianに追随して分散型オブジェクトストレージの領域に進 出してきている。

話題ばかり先行していたIoTだが、スケールアウトしやすいインフラ技術で種々の環境が整ったために、地道なエンタープライズでの活用法としても、いよいよ本格的に力を発揮できるようになってきたようだ。

海部美知(かいふ・みち)

エノテック・コンサルティングCEO(最高経営責任者)。ホンダを経て1989年NTT入社。米国の現地法人で事業開発を担当。96年米ベンチャー企業のネ クストウエーブで携帯電話事業に携わる。98年に独立し、コンサルティング業務を開始。米国と日本の通信・IT(情報技術)・新 技術に関する調査・戦略提案・提携斡旋などを手がける。シリコンバレー在住。子育て中の主婦でもある。ブログ:Tech Mom from Silicon Valley。Twitter ID:@MichiKaifu。 著書に『パラダイス鎖国 忘れられた大国・日本』(アスキー新書)がある。

2013/03/04

Cloudian(クラウディアン)紹介記事のまとめ


新年を迎えて以降、Cloudian(クラウディアン)からの発表が相次いだこともあり、多くのメディア記事でご紹介いただきました。本当にありがとうございます。CloudianのFacebookページCloudianのTwitterで、可能な限りタイムリーにニュースをご紹介していますので、Facebookページに「いいね!」またはTwitterで「フォロー」いただければうれしいです。


今回は本年1月と2月のCloudian(クラウディアン)関連記事をまとめてご紹介したいと思います。


2013年1月11日@IT「知らないなんて言えないNoSQLまとめ(3):カラム指向型データベース(HBase、Hypertable、Cassandra)編」
クラウディアンのメンバーが執筆した「NOSQLの基礎知識(ビッグデータを活かすデータベース技術)」から主な内容をわかりやすく抜粋し、連載紹介しています。今回はカラム指向型データベースの概要です。


2013年1月12日CloudTweaks 「Top 25 European Rising Stars 2012 – LunaCloud」
欧州にてCloudianを採用しているLunaCloud(ルナクラウド)が経済的にS3 APIのクラウドストレージサービスを提供するためにCloudianを採用していると紹介されました。


2013年1月30日ビジネスネットワーク.jp 「Amazon S3準拠のオブジェクトストレージ「Cloudian」をNSSOLが販売開始」
2013年1月30日クラウドWatch 「NSSOL、オブジェクトストレージ「Cloudian」を用いた企業向けサービスを展開」
2013年1月30日BCN Bizline 「クラウディアン、「Cloudian」のパートナーに新日鉄住金ソリューションズが参加」
2013年1月30日日経電子版 「新日鉄住金ソリューションズなど、S3オブジェクトストレージ製品の企業向けサービスを提供」
新日鉄住金ソリューションズ様が新たにCloudianのパートナー企業に参加したことが紹介されています。


2013年2月7日ビジネスネットワーク.jp 「Amazon S3互換のストレージ構築ソフト「Cloudian」をCommVault社が公式認定」
CommVaultは世界で16000社が利用するバックアップ/アーカイブソフトウェア製品です。この相互接続性の公式認定により、CloudianのS3 APIとの互換性の高さを実証することができました。



2013年2月8日@IT 「知らないなんて言えないNoSQLまとめ(4):
グラフ型NoSQLデータベース(Neo4j、InfiniteGraph)編 」

クラウディアンのメンバーが執筆した「NOSQLの基礎知識(ビッグデータを活かすデータベース技術)」から主な内容をわかりやすく抜粋し、連載紹介しています。今回はグラフ型データベースの概要です。


2013年2月12日ビジネスネットワーク.jp 「Amazon S3と同等のストレージシステムは一般企業でも実現できる」――クラウディアン太田社長インタビュー
クラウディアンのインタビュー記事です。インタビューのさいごに語る「アマゾンやグーグルが商用サービスに最大限活用している安くて良い技術があるのに、知らないから使わないというのでは、彼らに大きく引き離されてしまいます。そして、もう1つ重要なポイントは、この安くて良い技術は、ビッグデータを持っていなくても、“スモールデータ”でも非常にメリットがあるということです。」が印象に残る記事でした。



2013年2月20日ビジネスネットワーク.jp 「Amazon S3と同等のシステムを自社構築、企業のストレージコストは大幅に削減できる」
Cloudianの製品解説記事です。これまでCloudianの説明はエンジニア寄りの説明が多く難しいという声をいただくことがありました。この製品解説記事は、たいへんに平易に説明されており、Cloudianが企業でも利用できることや、そのメリットを多くの方にご理解いただけると思います。



2013年2月26日ビジネスネットワーク.jp 「クラウディアンのオブジェクトストレージとCAのバックアップ製品が相互接続性を確認」
2013年2月26日クラウドWatch 「CA、クラウドストレージや最新Windows環境へ対応したバックアップソフト「CA ARCserve r16.5」
2013年2月26日ITPro 「CA TechnologiesがARCserveに新版、S3/Azureに加えCloudianに保存可能に」
2013年2月26日ASCII.jp 「国産クラウドサービスに対応した「CA ARCserve r16.5」」
2013年2月26日@IT 「Cloudianの標準バックアップ製品に認定:
Windows Server 2012やWindows 8に対応した新ARCserve」

日本でもっとも使われているバックアップ/リストア・ソフトウェア製品であるCA ARCserveとCloudianの接続性を相互確認したことに関する記事です。これまで、バックアップはテープかディスクへのストレージを前提とすることが一般的でしたが、Cloudianを採用するニフティクラウドストレージやNTTコミュニケーションズの「Biz ホスティング Cloudn Object Storage」をバックアップ先として利用できるようになることが実証されました。


2013年2月28日BCN Bizline 「「Amazon S3」準拠のストレージシステム構築ソフト「Cloudian」、エンタープライズに向けた販売を強化」
実は昨年12月、クラウディアンはプレスカンファレンスを開催し、今後、エンタープライズとグローバル展開を目指すとお話しました。その具体策として、企業向けクラウドビジネスを展開する新日鉄住金ソリューションズ様とのパートナーシップ、ガートナーの調査ではザ・リーダーと評価されるCommVault Simpana、日本でもっとも利用されているCA ARCserveとCloudianとの相互接続性について相次いで発表してきました。Amazon S3をはじめとするクラウドストレージは、Webサービスのためのストレージと観られることが多いようですが、最近では多くの企業向け製品でもクラウドストレージへのインターフェースを具備しています。Cloudianとそれら製品との利用事例を紹介することで、企業のクラウド利用が促進されるとうれしいと考えているところです。


2013年2月29日クラウドWatch 「Cloud Days Tokyoレポート」
Cloudianは、「多くのパートナーや商用実績を持つS3互換オブジェクトストレージ」としてCloudDaysへの出展が紹介されています。「実運用で直面する問題を超えてきた実績が特徴」という締めの引用は、社内はもちろんお世話になっている多くの関係者を感激させました。