2013/03/10

昼食も並列分散処理?「リアルタイム系ビッグデータ」への注目~シリコンバレー「Strata」会議から


「ビッグデータとクラウド・ストレージ」 連載 第十一回


イベント・企業編6: 「リアルタイム系ビッグデータ」への注目 ~ シリコンバレー「Strata」会議から


エノテック・コンサルティング代表
海部美知

ビッグデータの会議Strataの米国開催分については、私は今のところ開始以来の皆勤賞で、もう5回目となる。昨年秋のニューヨークでの様子もこのコラムでもご紹介したので「またか」と思われるかもしれないが、今回はまた別の面白さがあったので、「西」バージョンのStrataの様子をお伝えしたい。


◆ 昼食も「並列分散処理」!?


カンファレンスは相変わらずの賑わいで、チュートリアル中心の初日はコーヒーの在庫が底をつき、空のカップを持ったままウロウロ歩きまわるコーヒー難民が続出したが、本プログラムの2日目・3日目は、昨年までと比べ、やや落ち着いた感じがあった。私はそれを「地に足がついてきた」と受け取った。

2011年はキックオフの年でもあり、主催者オライリーメディアのトップ、ティム・オライリー自身も何度も登壇し、著名人ゲストスピーカーを並べた華やかなラインアップで、ビッグデータの概念や理念を語る講演が多かった。次の2012年は、著名人は姿を消し、メインスポンサーであるHadoopやCassandra系のソフト/サポートベンダーの話が多くを占め、提供側の販売や求人のための技術中心イベントという色が強く感じられた。

これに対し、今年も引き続きオライリー自身も来ず、著名人ゲストもいなかったが、企業での利用事例の講演が大幅に増え、経営の視点からの話もあり、より多彩で現実に近い話が多かった。

もちろんそれだけでなく、主催者側が運営に慣れてきたという要因もあるだろう。参加者の数はおそらく昨年とほぼ同等と思われたが、昨年のような会場での渋谷駅的混雑はなかった。近い内容の講演を近い場所に集める「行動予測」、昼食では広いホールの片側に全く同じ内容のバイキング式テーブルを大量に横にならべて一気に人を流す「大量並列分散処理」など、「ビッグデータ」の考え方をカンファレンス運営でもようやく取り入れたようだ。

展示会場では常連であるClouderaやDatastaxなどのビッグデータ系ソフトウェア・ベンダーや、エンタープライズ分野のIBM、マイクロソフト、VMware、データ解析ソフトのベンチャーなど、大小さまざまな企業が賑やかに出展。日本企業もようやく初登場、NSKという中堅ソフトウェアベンダーが企業ユーザー向けの超高速データ処理システムを展示していた。


◆ 赤ちゃん事例対決のゆくえ


グーグルやアマゾンなどのいわゆる「ネット企業」でなく、リアルとのつながりが強い場面での応用事例は面白いものがたくさんあり、どれをここでご紹介すべきか迷ったのだが、「赤ちゃん関連」の二つを例としてご紹介してみよう。

一つは、ベビー肌着に仕込んだセンサーで、赤ちゃんの呼吸状況と体温を計測し、サーバー側で処理してユーザーのiPhoneに表示するハイテク・ベビーモニターのRest Devicesというベンチャーだ。同社は最初、睡眠時無呼吸症候群対策のための大人用Tシャツを開発し、その後ベビーモニターに展開したという。フィットネス向けのウェアラブル・センサーはすっかり普及して競争も激しく、一方でセンサーではありとあらゆるデータが採取できるが、同社では赤ちゃんの親が一番知りたがっている「睡眠と温度」の二つに絞り込んで見やすくしている。センサーによる「睡眠状況の監視」の解析のノウハウを蓄積していることもあり、はっきりとした特徴を打ち出している。

今のところ月額サービス料金はなく、センサーつきのベビー肌着3枚と読取送信ユニットのスターター・キットが200ドル、追加のベビー服を20ドル程度で販売している。なるほど、大人用のTシャツは一枚売ったら終わりだが、赤ちゃんはどんどん大きくなるので肌着は2~3ヶ月ごとには買い換えなければいけない。しかもベビー服には「ギフト」の需要もあり、少々高額でもそれほど違和感はない。これはなかなか、いいところに目をつけたと感心した。



データ量は一晩でだいたい600MB、ユーザーはまだそれほど多くないが、「M2M(マシン・ツー・マシン)/IoT(モノのインターネット)」としての新しい事例で、「コネクテッド・ワールド」というシリーズの一つであった。「リアルとの結びつき」部分にセンサーを活用したビッグデータ応用例は、現在注目の的だ。

もう一つの赤ちゃん関連事例は、病院の未熟児用ICUにおけるデータ解析プラットフォームで、こちらはIBMが「医療分野でのビッグデータ応用」の例として挙げていたものだ。ICUや手術室では、さまざまな高度医療機器が利用され、データが刻々とそれぞれの画面に表示されているのだが、すべて別々のベンダーで別々のデータフォーマットで別々に動いており、吐き出されるデータはほとんど使われずに流れていってしまう。これを集めて解析し、容態の変化を統合的に可視化して、問題に早めに対応したり、あとで解析に利用したりすることができるようにしたシステムだ。

ぜんぜん違うモノのように見えて、意外にこの二つは共通点がある。IBMのほうも、医療機器が連続的に吐き出すデータを扱う「M2M/IoT」であり、また両者ともに「リアルタイム処理」を重視する点が共通しているのだ。従来のビッグデータ事例は、過去から蓄積された大量データをバッチ処理するタイプのものが多かったが、最近では、新しいデータを高速で取り入れて解析する「リアルタイム型」がIoTとの関連で特に注目されている。

センサー系サービスはお話としても面白いものが多く、前者のベンチャーのほうがマスコミ的には話題になりそうに思うが、聴衆の数は実は後者のほうが圧倒的に多く、今回のカンファレンス中唯一、席が足りず立ち見で聞いた講演だ。ビッグデータの業界人から見ると、奇抜なアイディアよりも病院システムのほうが市場規模が大きく、しっかり儲かる可能性も高い。

新しくセンサーを人につけさせてデータを作り出すためには、まずはどうやってセンサーをつけてもらうかという「猫に鈴」問題を乗り越えなければならない。その前に、すでに企業の中で無駄に捨てられたり放置されたりしているデータは実は多く、このゴミ屋敷をビッグデータ手法を使って宝の山に変えるというのが、英語のイディオムでいえば「low hanging fruit(低いところになっている果実=簡単に入手できる成果)」と見られているわけだ。

◆ 企業クラウドを支えるインフラ


どちらかと言えば「バッチ処理系」に強いHadoopに対し、こうした「リアルタイム系」のためのデータベースとしては、アマゾンDynamoの流れをくむオープンソースCassandraが向いていると言われている。

これらのNOSQLデータベースは他にも多数あり、その一つであるRiakを擁したBashoが今回は初めてこの展示会でブースを出していた。RiakはCassandraよりももっとDynamoの考え方に忠実であり、リアルタイム・モバイルメッセージ・サービスとして著名なVoxerのバックエンドとして使われていると説明していた。同社はこのRiakを中心に事業を展開していたが、最近ではCloudianに追随して分散型オブジェクトストレージの領域に進 出してきている。

話題ばかり先行していたIoTだが、スケールアウトしやすいインフラ技術で種々の環境が整ったために、地道なエンタープライズでの活用法としても、いよいよ本格的に力を発揮できるようになってきたようだ。

海部美知(かいふ・みち)

エノテック・コンサルティングCEO(最高経営責任者)。ホンダを経て1989年NTT入社。米国の現地法人で事業開発を担当。96年米ベンチャー企業のネ クストウエーブで携帯電話事業に携わる。98年に独立し、コンサルティング業務を開始。米国と日本の通信・IT(情報技術)・新 技術に関する調査・戦略提案・提携斡旋などを手がける。シリコンバレー在住。子育て中の主婦でもある。ブログ:Tech Mom from Silicon Valley。Twitter ID:@MichiKaifu。 著書に『パラダイス鎖国 忘れられた大国・日本』(アスキー新書)がある。