データマネジメント データマネジメント記事一覧へ

[データマネジメント2018]

IoT、AI、4K/8K映像時代における新たなデータマネジメントのあり方

2018年4月9日(月)

4K/8Kといった高解像度の映像データを24時間365日にわたって集め続ける、AIによる画像認識の精度向上のために大量データで学習を繰り返すなど、IoTやAIの進化に伴って必要とされるデータ量は、従来型のITインフラが想定してきたユースケースをはるかに超えるペースで増大している。もはや予測不可能なデータ増に対応するためには、最初から容量制限を気にせずにデータの保存および管理を行えるオブジェクトストレージを導入しておくことだ。「データマネジメント2018」のセッションで、クラウディアンが新たなデータマネジメントのあり方について解説した。

AIによる学習には膨大なデータが必要となる

クラウディアン 取締役 COO 本橋信也氏

 IoTへの関心が急速に高まり、実際にシステムを導入する企業が増えている。現在のところそこで主に扱われているのは各種センサーから収集した小粒な数値データが中心だが、今後さらにIoTデバイスが拡大・多様化していくに従い、扱うデータの内容も大きく変わっていくことになるだろう。

 クラウディアン 取締役 COOの本橋信也氏は、「過去インターネットや携帯において映像・画像コンテンツが需要を喚起したのと同様、IoTのキラーアプリケーションも映像・画像に移行していくことが容易に想像できます」と語った。

 しかもそれらの映像はHDから4K、8Kへと高精細化、あるいは360度やVR、80fpsなどへと高機能化し、データ容量はますます増大していく傾向にある。現在の映像コンテンツ1時間あたりに必要なデータ量は約5TBだが、7年後には14倍の70TBに増大するという調査結果も示されている。

 加えて最近では、IoTで収集したさまざまなデータを分析する手法として、マシンラーニング(機械学習)やディープラーニング(深層学習)を中心としたAI(人工知能)も注目され始めた。この動きもまたデータ量の増大にさらに拍車をかけているのだ。

 「マシンラーニングやディープラーニングによる学習精度を高めるには膨大なデータが必要とされます。たとえば映像に捉えられた個々のモノを正しく認識させるには、実際の判定時撮影での背景や撮影アングルに左右されないように、背景や写り方のバリエーションを人為的に変換した映像データを付与して学習を行う必要があります。加えて、効率的な学習を行うために映像データにタグ付けされるメタデータも無制限に増えていきます」と本橋氏は説明した。

 実際、クラウディアンがある製造業の依頼を受けて実施した数千種類のパーツの自動判別を行う実証実験では、ディープラーニングのシステムに読み込ませる映像データを増やすほど、認識精度を95.98%(1,000件)から98.28%(5,000件)、99.85%(1万件)へと向上することができたという。

理論的には容量無制限のストレージの拡張性を得られる

 もはやデータの増加量を予測することさえ困難な状況であり、「容量に制約のあるストレージではスケールアップ時にデータ移行の多大な手間が発生するため、最初から容量無制限にデータの保存および管理を行える仕組みを導入しておくのが理想的です」と本橋氏は語った。

 そのニーズに応えるべくクラウディアンが提供しているのが、ソフトウェアベースのオブジェクトストレージ製品「CLOUDIAN HYPERSTORE」である。汎用的なx86サーバー(IAサーバー)を多数並べ、その内蔵ディスクをSDS(Software-Defined Storage)の仕組みによって仮想的に束ねると共に、必要に応じてサーバーをそのプールに追加することができる。その結果、理論的には容量無制限のストレージの拡張性を得られるという。

 加えてオブジェクトストレージならではの特長として、HYPERSTOREは画像や映像といった、データそのもの(BLOB)とデータのデータとなるメタデータをセットで扱うことができる。たとえば映像データに対して、ファイル名や撮影日、サイズ、アクセス権といったメタデータはシステムが自動的に付与するが、そこに写っているモノや種類、数量、場所などのメタデータをユーザーが独自に付与することも可能だ。

事例:米国コメディ番組の映像データのアーカイブにHYPERSTOREを導入
拡大画像表示

 「このメタデータにより、従来は人の目で見ないと何が写っているかがわからない映像・画像の自動分類整理や検索が可能になり、無制限に増大するデータを効率的に管理できる」と本橋氏は強調した。

マルチクラウドでデータのサイロ化を解消

 さらにHYPERSTOREで特筆すべきが「マルチ-XXX」の特長である。

 ひとつはマルチデータセンターで、離れた複数のデータセンターに配置したHYPERSTORE間でデータを自動的に数秒単位で複製して保護する。「激甚災害や事故によって1か所のデータセンターが停止した場合でも、ほぼリアルタイムにサービスを継続することができます」と本橋氏は訴求した。

 もうひとつはマルチクラウドで、一定期間アクセスがなかったHYPERSTORE上のデータをより保存コストの安いパブリッククラウドのストレージに自動的に移動することや、データの種類に応じてオンプレミスとパブリッククラウドを使い分けてデータ保存するといったことが可能となる。

 もともとHYPERSTOREはクラウドストレージ「Amazon S3」に完全準拠する形で設計されたAPIを実装しており、Amazon Web Service(AWS)とのシームレスな連携が可能だったが、現在では対象クラウドサービスをGoogle Cloud PlatformやMicrosoft Azureにも拡大しているのだ。Google CloudやAzureにデータを転送したあとは、それぞれのAPIでデータを呼びだすことができるマルチモーダル対応しており、これまでオンプレミスと複数のクラウドでサイロ化していたデータマネジメントの課題を解決することができるという。

マルチクラウドとマルチモーダルに対応するHYPERSTORE
拡大画像表示

 また、2018年1月には新たにHYPERSTOREを企業で一般的に使われているファイルプロトコルでデータを読み書きできる「CLOUDIAN HyperFile」の提供を開始。SMB/NFSプロトコルによるファイルアクセス、スナップショット、WORMなどのエンタープライズNAS機能を、従来比3分の1のコストで実現するという。

 データ増加量が予測不能なIoT、AI時代に向けて、CLOUDIAN HYPERSTOREはますます存在感を高めつつある。


●お問い合わせ先

クラウディアン株式会社

〒150-0002 東京都渋谷区渋谷2-11-6 ラウンドクロス渋谷6階
TEL:03-6418-6466
URL:https://cloudian.com/jp/

 

バックナンバー
データマネジメント2018一覧へ
関連記事

IoT、AI、4K/8K映像時代における新たなデータマネジメントのあり方4K/8Kといった高解像度の映像データを24時間365日にわたって集め続ける、AIによる画像認識の精度向上のために大量データで学習を繰り返すなど、IoTやAIの進化に伴って必要とされるデータ量は、従来型のITインフラが想定してきたユースケースをはるかに超えるペースで増大している。もはや予測不可能なデータ増に対応するためには、最初から容量制限を気にせずにデータの保存および管理を行えるオブジェクトストレージを導入しておくことだ。「データマネジメント2018」のセッションで、クラウディアンが新たなデータマネジメントのあり方について解説した。

PAGE TOP