IoT時代に求められるストレージとは

IoT時代の到来

「クラウド」や「ビッグデータ」といったキーワードも登場した当初には、これらは一時的な流行り言葉で終わるのではないかとも言われていましたが、今やIT業界の基本的なコンセプトのひとつとしてすっかり定着しました。AWSをはじめとするパブリッククラウドは市場で確固たる地位を築き、ストレージ需要の中の一部を取り込んでいます。

そして今、IoTというキーワードが大きな盛り上がりを見せています。2020年にはインターネットに接続されるデバイスが500億台にもなると予測されており、それらが送るデータが絶えず分析され、フィードバックされるIoT時代が到来するといわれています。今回は、これまで以上のデータの急激な増加は予想される、IoT時代のストレージのあり方について考えてみたいと思います。

そもそもクラウドの台頭の一因は、ネットワークインフラの進化といえます。クラウドの大きなメリットのひとつといえる、リソース集約によるコスト低減も、かつては高額なネットワークコストを相殺できるような状態ではありませんでした。一昔前では静止画を一枚送るのにも何秒も待つのが常識でしたが、ネットワークコストは時とともに下がり続け、今やNetflixなどは4k動画をストリーミング配信する時代となっています。無数のクラウドサービスとそれを支えるインフラが存在する今だからこそ、折からのデバイスやセンサーの小型化、量産化のトレンドともマッチして、IoT時代が到来するといわれています。わかりやすいところでは自動車との連携による自動運転、天気、医療、警備等々、IoTの適用範囲は多岐に渡ります。

クラウドの限界

さて、これらのIoT時代を支えるインフラとして、今現在のクラウドインフラは十分なものでしょうか。IoT時代にはこれまで想定していなかったような500億台ものデバイスが絶えずデータを生成し、分析を待つといわれています。いくらネットワークコストが下がったとはいえ、500億台のデバイスとなると、それだけでもネットワーク帯域がひっ迫してしまいそうです。単純な文字データ等であればまだいいですが、近年の映像技術の進化に伴い、将来的には4k,8kといった超高精細化映像が全世界のデバイスで生成され、無限にその数を増やしていくかもしれません。そして残念ながら、データの伝送速度には光速という越えがたい壁があり、日本 – アメリカ間であれば100msec以上の伝送遅延が存在します。今後どれだけ技術が進歩したとしても、巨大なデータを物理的距離を無視して瞬時に転送できる未来はなかなか到来しそうにありません。

ネットワークコストは今後も下がっていくことが予想されますが、一方で、生成されるデータはそれに反比例して増加していきます。今現在においてもオンプレミスに対してパブリッククラウドが指摘される、インターネット越しのアクセスによるリアルタイム性の欠如という問題は、今後も構造的に残っていくのではないでしょうか。

IoTが求めるインフラ

前述の問題を前提としたとき、すべてのIoTデバイスがクラウドに接続されるという形態を想像すると、現状のITインフラにおいてどういった限界が想定できるでしょうか。IoTデバイスには、その処理にリアルタイム性を求めるものが一定の割合存在します。たとえば自動車の自動運転で、すぐに解析結果をフィードバックしなければならない場合、しかもそれが高精細な映像に基づいていたとしたら、おそらくクラウドにデータを送信して処理を待つ余裕は無いでしょう。クラウドへのデータ送信だけを前提としたインフラは、IoTの持つ可能性を狭めてしまうおそれがあります。

こうした構造的問題から、IoT時代に見合ったインフラのありかたとして、フォグコンピューティングやエッジコンピューティングといったコンセプトが提唱されています。内容としてはどちらもよく似ており、端的にいえば、クラウドへのコンピューティングリソースの集中によるリアルタイム性の低下を、よりユーザに近い場所へコンピューティングリソースを配置することで回避するという思想です。クラウドを、ネットワークのエッジに拡張する、より身近なリソースという意味で「フォグ」という呼称が使われています。

このコンセプトの利点として、ネットワーク負荷の低減や処理の高速化が挙げられています。クラウドとフォグはシームレスに連携し、適切な役割分担を行います。フォグは高速にサービスを提供し、クラウドは必要なデータを必要なタイミングでフォグから吸い上げ、分析します。まさしくIoTに求められるインフラの要件をすべて叶えるように見えるコンセプトです。

ストレージの観点から

やはりIoTは現実世界へ分析結果をフィードバックする、「サービス」の文脈で語られることが多いせいか、上記のフォグコンピューティングが論じられるとき、大抵の場合はサーバーサイドの観点が注目され、データを保管するストレージのレイヤについては無視されがちです。

ここではSDSベンダとして、フォグコンピューティングの概念に合うストレージについて考えてみます。

例として、多くのIT管理者が頭を悩ましているであろう「野良NAS」問題を挙げてみます。本来中央拠点のIT管理者としてはすべてのデータを一元管理したいものですが、一方で、地理的に離れたブランチオフィスでは中央のストレージにVPN接続するのは性能面でストレスがあり、かつ面倒なことでもあるため、自らストレージリソースを持ちたがることがしばしばあります。メーカーなど、各地に多数の拠点を持つ業界では頻繁に耳にするケースです。当然ながらデータの可用性や、全体のIT管理者から見たセキュリティと運用性、ビッグデータ解析等の面から見ると多くの問題を内包していますが、ブランチオフィスのユーザから見れば、自前のストレージリソースへ高速にローカルアクセスでき、使い勝手が良いことは、前述のデメリットを覆い隠すほどのメリットとなっています。

上記はIoTのように先進的で耳目を集めるような話というわけでもなく、非常に身近で見られる問題ではありますが、クラウドへの集約からフォグコンピューティングの提唱までの流れに出てきたすべての要点が含まれています。リソースの集約は全体最適ではありますが、ブランチオフィスにとっての局所最適からはかけはなれてしまっているのです。

これを解決するためにストレージに求められることとは、ブランチオフィスでもローカルと変わらない使い勝手で利用でき、可用性も確保でき、全体のIT管理者としても地理的に分散したデータを容易に掌握、活用できることです。つまり、フォグコンピューティングに求められる要件である、「クラウドとフォグのシームレスな連携」こそが解決の鍵なわけです。では、ストレージがこの要件を満たすためにはどのようなことが求められるでしょうか。

IzumoFSが用意するひとつの回答は、ノードを広域に配置してのクラスタリングです。DRのブログ記事でも触れましたが、IzumoFSは広域配置したノードで構成されるストレージを単一ネームスペースで使用できます。物理的に離れたノードをActive-Activeで利用でき、また、書き込み保証ポリシーの設定によってWANによるパフォーマンス低下もある程度抑制できます。従来型ストレージのようなActive-Standbyの構成では、メインのストレージは一箇所に集中しており、「フォグ」は存在しません。

メリットばかりにも思える広域クラスタリングですが、ネットワーク環境は重要です。メタデータは最優先で同期されますので、ユーザからはあたかも瞬時にデータが転送されているように見えることもあります。しかし、もしもブランチ – 中央間のネットワーク帯域が細ければ、たとえば巨大な動画等アップした際など、実データの同期にはかなりの時間がかかってしまうことも予測されます。

従来、ユーザが中央のストレージに直接アクセスすることで性能が悪いと感じていた部分を、IzumoFSを使うことである程度隠蔽することが可能です。しかしながら、メタデータの同期によって見かけ上は分散が完了しているように見えていても、実際に可用性が確保されるまでにはネットワーク環境に応じたタイムラグが生じてきます。IzumoFSがユーザエクスペリエンスを犠牲にしない実装にしているからこそ、広域構成では性能要件に応じた設計と運用が重要です。

さいごに

このように慎重な設計が求められる広域クラスタリングではありますが、フォグコンピューティングに求められるストレージの要素を考えると、極めて重要な技術だといえます。クラウドとフォグの連携を前提として設計されていない従来型のストレージでは、IoTの持つ可能性を狭めてしまうかもしれません。

広域クラスタリングを前提に考えたとき、候補に上がるストレージは、多くの場合分散ストレージになってきます。昨今、分散ストレージを出自とする製品が多いSDSの市場が盛り上がりつつあるのは、近い将来やってくるであろうIoTの時代ともマッチしているといえるのではないでしょうか。