1. MetaStep TOP
  2. ビジネス活用を学ぶ
  3. クラウド型データ管理にはリスクあり!?時代は「分散型」ストレージへ

2024.05.16

クラウド型データ管理にはリスクあり!?時代は「分散型」ストレージへ

現在、広く用いられているデータ保存手法であるクラウドストレージ。読者の皆さんもGoogleドライブやOneDrive、iCloud Driveなどを使って写真やファイルを保存している人も多いのではないでしょうか?実はクラウドストレージはその構造上、さまざまなリスクを抱えています。その対策に期待されているのが「分散型ストレージ」です。

社内ネットワーク参加者のパソコン(社員用PCなど)やスマホの空き容量を利用してデータを保存する技術で、これまでのクラウドストレージ型のように「企業や組織が運営するサーバー」を使いデータを管理する方式とは違っています。巨大テクノロジー企業に一極集中しているデータ管理のあり方を変える可能性があります。

そのあり方を変える必要なんてないと思った方もいるでしょう。安全だと思いがちな所にも意外な穴があったりします。この記事では、従来のクラウドストレージ型の課題に言及した上で、分散型ストレージの特徴や期待される役割について解説します。

従来のクラウドストレージの課題

クラウドストレージとは、インターネット上でデジタルデータを保管する仕組みのことです。具体的には、以下のような特徴を持ったサービスを指します。

●企業などの中央集権的な管理者がデータサーバーを用意している
ユーザーはデータサーバーにアクセスし、自身のデータを保管する
サーバーには複数のデバイスからアクセスでき、データの同期も容易
Googleドライブ、OneDrive、iCloud Driveなどが代表的なサービス

現在では日常生活からビジネスに至るまで、非常に多くのユーザーがクラウドストレージを利用しています。どのデバイスからでも最新のデータにアクセスでき、とても便利なサービスだと言えます。

(引用:写真AC

ところがクラウドストレージは、特定のサーバーに集約してデータを管理しているため、以下のような課題も抱えています。

データ消失のリスク
管理者によるデータ閲覧、改ざん、悪用のリスク
データ保存にかかるコスト

クラウドストレージでは、特定の企業が管理する一か所(多くとも数か所)のサーバーにデータが保存されています。もし、そのサーバーがハッキングにあったり、火災などで物理的な被害にあったりすると、保存されているすべてのデータが消失してしまう可能性があります。

クラウドストレージを採用していたがゆえに、実際に起きてしまったセキュリティ事故の事例には以下のようなものがあります。

国内大手企業が運営するサービスによる個人情報の流出(2011年)

2011年には、日本の大手企業が提供するサービスにおいて個人情報の流出が確認されました。原因はサイバー攻撃によるもので、サーバーの異常な動きを検知して調査した結果、情報が流出したことが判明したのです。

漏洩したのは、名前、住所、メールアドレス、生年月日などのアカウント登録情報です。何人の情報が流出したのかは明らかにされていませんが、流出当時7,700万人のユーザーがいたため、最大でそれだけの情報が流出した可能性があるとされています。もしこれだけの人数が流出したのであれば、個人情報が流出した事件として大規模なものです。

引用元:NTTコミュニケーションズ

また、データを扱う企業の内部に悪意を持った人間がいた場合、ユーザーが保存しているデータの中身を勝手に閲覧したり、時には改ざんや悪用したりされる可能性もあります。

さらに、データ保存にかかるコストも膨大になる恐れがあります。サーバーには物理的な容量の制約があるため、無尽蔵にデータを保管することはできません。保存データが増えるほど、サーバーを増設したり、維持管理のコストも増加したりするなど、費用負担も際限なく増加していきます。

分散型ストレージの仕組み

企業のサーバーでデータを一括管理しているクラウドストレージに対し、分散型ストレージはまったく異なるアプローチでのデータ保管を実現しています。分散型ストレージの具体的な特徴は以下の通りです。

●ネットワーク参加者が、自身のデバイスの空き容量をストレージとして提供する
利用者は、各参加者が提供した空きストレージにデータを保存する
各利用者の端末はピア・ツー・ピア(=以下、P2P)※のネットワークで接続されている

※特にこの「P2P」の仕組みを理解する事が重要です。要は、サーバーを介さずに端末(PC、スマホなど)同士で直接データのやり取りを行う通信方式です。ネットワーク参加者のパソコンやスマートフォンの保存場所を提供してもらい、そこに暗号化したデータファイルを分散させて保存するという仕組みです。空き容量を提供した側は報酬も得られます。

このような形態を取ることで、クラウドストレージに比べると、分散型ストレージは以下のような強みを持っていると言えます。

データの保管場所が一か所に集中しない
→ハッキングや事故でデータが消失するリスクが減る
●管理者がいないため、データを悪用されるリスクが低減
データ保存コストの削減

分散型ストレージでは、「データの保存場所=世界中のユーザーが保有しているデバイスの空きストレージ」となります。そのため、データの保存場所は一か所に集中せず、分散的なデータ保管が実現します。

データが分散して保管されることで、特定のサーバーを狙ったハッキングを行うことはできません。また、ネットワーク上のすべてのデバイスが同時に火災にあうようなことも現実的にはありえないため、物理的にデータが消失してしまうリスクを抑制できます。

さらに、分散型ストレージにはそもそも中央集権的な管理者が存在しないため、恣意的なデータの閲覧や悪用のリスクも軽減します。

また、すでに述べた通り、デジタルデバイスを所有しているユーザー全員が、自身のストレージを常に容量いっぱいまで使用しているといったことも起こりえません。したがって、分散型ストレージはそれほどコストをかけることなく、新たな空き容量を確保することができます。

(引用:写真AC

なぜ分散型ストレージが必要なのか

分散型ストレージは、クラウドストレージよりも優れた点がいくつもあります。

しかし、読者の方の中には「利便性ではクラウドストレージの方がはるかに勝るのではないか?」と考える人もいるかも知れません。ゆえに、分散型ストレージの必要性に懐疑的な気持ちを持つ人もいるでしょう。そこでここからは、「なぜ分散型ストレージが必要なのか」という問いについて、実際に世界で起こっている問題を取り上げて解説します。

ウィキペディアの閲覧制限(トルコ)

トルコでは2017年、政府によって国内からのWikipediaの閲覧が制限されました。ここでポイントなのがWikipediaの情報は特定のサーバーで一括管理されていたことです。政府はそのサーバーにさえ制限をかければ、情報の閲覧を妨げることができたのです。

これに対し、ユーザーは政府によるサーバーへの制限をかいくぐるため、「IPFS」という分散型ストレージを用いてトルコ語版Wikipediaのコピーが作成されました。

分散型ストレージはP2Pシステムで構成されているため、暗号化されたWikiPediaデータが参加者のサーバ内で分け合って保有されています。これにより、

スペインでは、カタルーニャ州の独立に関する住民投票が行われた際、政府にとって不都合な情報を掲載したサイトの多くが、政府の圧力によって閉鎖されました。そこで人々は、住民投票に関連する情報をIPFS上に公開することで、政府の検閲を逃れて、誰もが必要な情報にアクセスできるような環境を作り上げました。

さきほどのトルコの例と同様に、主に「巨大な権力(政府など)」の横暴に対抗する手段として、分散型ストレージは有効に機能すると言えます。

代表的な分散型ストレージのプロジェクト

代表的な分散型ストレージは、いくつかの暗号資産プロジェクトによって開発・運営が行われています。

代表的な分散型ストレージサービスには、以下のようなものがあります。

●IPFS(暗号資産は伴わない)
Filecoin
Arweave(アーウィーブ)
ICP

各サービスの詳細な仕様は異なりますが、「空き容量を提供することで独自の暗号資産を受け取れる」などの仕組みは概ね共通しています。分散型ストレージ運用の肝となる「空き容量」の提供者を増やすために、様々なインセンティブをユーザーに提供しているケースが多く見られます。

分散型のメリットを知った上で、どちらを選ぶか決める

ここまで話してきましたが、分散型ストレージはまだ発展途上にある技術です。例えば、ファイルが不特定多数のユーザーに保存されていること自体、データの安全性が担保されないという意見もあります。また、「空き容量の提供者=マイナー」が確保できないサービスは機能しなくなるリスクもあります。

とはいえ、分散型ストレージ大手の「Filecoin」が2020年にローンチしてからもう4年が経過。すでに多くの導入検討が繰り返され、十分なケーススタディが為されてきました。分散型とクラウド型のメリット・デメリットも大方浮き彫りとなっています。導入検討をする際は、既に存在する多くの前例から学び、自社に適切なストレージサービスを選べるはずです。時には、場面によって使い分ける必要性もあるかもしれません。両ストレージサービスの特徴を正しく理解し、最適な選択をしていきましょう。