PR

これだけは知っておきたい、7つのストレージ技術

仮想化は、ごく最近の技術トレンドととらえがちだが、ストレージにはかなり早期から適用されてきた。物理ディスクを論理的に区分けしたり、複数のディスクを束ねて論理ボリューム(1つの管理単位)を形成するといった手法はその一例だ。冗長性確保の文脈で語られることの多いRAIDにしても、技術的には仮想化そのものである。

物理ディスクをまとめるところから始まったストレージ仮想化は、時代とともに上位レイヤーへと適用が進んだ。以前、サーバーとストレージは1:1で紐付いていた。複数のサーバーに付属するストレージの未使用領域を合算するとかなりの容量になってムダが多い。バックアップなど運用の手間も負担になる。そこでサーバーからストレージを切り離し、複数のシステムで共用する取り組みが進んだ。SANの登場には、こうした背景がある。

仮想化の適用は定番
実用期に入るSSDも影響大

ITが事業活動の隅々に浸透するにつれ、企業がハンドリングするデータの種類はログデータや音声、動画など多様になり、量も膨れ上がった。何しろ現在、1日に生み出されるデータは2.5エクサバイト(10の18乗、100京バイト)。西暦2000年までに記録されたデータの総量が12エクサバイトといわれるので(米カリフォルニア大の調査)、すさまじさが分かる。

その勢いは今後さらに加速する。だからストレージにはさらなる弾力性や拡張性が求められる。運用はできるだけ楽をしたいという条件付きだ。こういった背景があってHDDを基本とするストレージ技術は今も日々、進化している(仮想化を中心とした技術動向の詳細はhttp://www.snia.org/sites/default/files/sniavirt.pdfに詳しい、図3-1)。

図3-1 ストレージは様々な領域と実装方法で仮想化が進んできた。地色は最近の注目分野
図3-1 ストレージは様々な領域と実装方法で仮想化が進んできた。地色は最近の注目分野
出典:SNIA Techinical Tutorial “Strage Virtualization”を元に編集部が作成

一方、よりすさまじい勢いで進化しているのが、半導体技術をベースにしたSSDである。パート1でガートナーの鈴木氏も指摘しているようにエンタープライズ用途で使えるSSDが実用期に差し掛かってきたことは、ITインフラのデザインに大きく影響を与えそうだ。システムの性能を語る時に、必ずといっていいほど、ハードディスクのI/Oスピードの限界が取り沙汰されてきたのは周知の通りだからである。

何よりも、HDDでは様々なチューニングが欠かせなかった諸問題を、SSDでは一掃できる可能性がある。一部にSSDを採用し自動階層化(これも一種の仮想化技術である)で運用するだけでも、かなりの実効性があるはずだ。

データ量が激増する時代に注目技術への理解を深める

「ビッグデータに対応する」ことの意味は、必ずしも「自社が保有する大量のデータのすべてを対象にして分析・活用すること」を指し示すものではない。むしろ「いつか役立つかもしれないデータも含めて、どんどん蓄えておける環境を用意する」ということに近いものと言えるだろう。「将来、あの時のこんなデータが必要だと分かったとしても、データを取得していなければ何もできない。今はともかく蓄積することが優先であり、技術的にもそれが可能だ」(米大手ネット事業者、eBay)。スケールアウトNASやオブジェクトストレージなどは、そうした観点で存在感が増してくる。

ストレージの巨大な単一リソースプールを用意し、用途やデータタイプ、アクセス方法などを問わず、アプリケーションが必要とする容量を随時提供する─。これが1つの理想だが、今はまだ実現困難。例えば、アクセス速度を重視する基幹業務処理、大量データの分析処理、多種多様な非定型データのアーカイブなどの使途別にストレージを構成するのが、現実解だ。

ではそれぞれの領域でどんな技術が“エマージング”なのか。本パートでは、昨今、動きが活発な技術領域にスポットを当ててトピックを追っていく。

図3-2 “動的最適化”がストレージの理想像
図3-2 “動的最適化”がストレージの理想像

フルフラッシュストレージ

半導体メモリーの超高速性を活かす
大手ベンダーも新興市場に名乗り

技術解説

物理的な記憶媒体として、ハードディスクではなくフラッシュメモリー(SSD)を使う動きが加速している。ケタ違いに高速で消費電力も少ないという特性を活かすためだ。ネックは容量当たりの単価がまだ高いこと。コンシューマ分野の製品でも10倍以上の開きがあり、信頼性を求められるエンタープライズ向けではさらに差が開く。現実解として、右ページで解説するの「自動階層化」の上位レイヤーに位置付けたり、DBMSとストレージの間に配置してキャッシュとして使う試みがされてきた。

しかし、SSDの価格は下落傾向にあり、フルフラッシュで構成するストレージも次第に現実味を帯びてきている。

ユーザーのメリット

即応性を最優先するDB処理や、ECサイトの検索処理…。レスポンスを追求するために、従来はDB周りをチューニングしたり、並列分散処理をしたりするのが通例だった。それでも、とかくボトルネックになるのがヘッドのシーク/サーチ時間に起因するハードディスクのI/Oスピードだった。

フラッシュストレージを適用すれば、大幅な改善が見込める。すべてをフルフラッシュ装置でまかなう時代はまだ先のことだが、業務要件によっては実用期に差し掛かっている。

製品動向

ネットアップのフラッシュストレージ「EF540シリーズ」 ネットアップのフラッシュストレージ「EF540シリーズ」

製品化では米国のベンチャーが先行した。Pure StorageやViolin Memory、XtremIO(EMCが買収)といった企業だ。だが、ここにきて大手も動きだし、にわかに活気づいている。

ネットアップが2013年2月22日に発表したのが「EF540」。30万IOPS以上というアクセス速度とミリ秒以下のレイテンシを両立する。2Uの筐体に800GBの2.5インチSSDを24個搭載。最大容量は19.2TBだ。最小構成での価格は2054万円。

EMCはフルフラッシュの製品系列として「ProjectX」と呼ぶ開発案件を進めてきた。買収したXtremIOの技術がベースとなる。製品名も「XtremIOとし、年内には正式に市場投入する見込みである。

他の大手も追随するだろう。フラッシュの高速性を活かしながら容量単価が高い欠点を補うため、データの重複排除/圧縮などの技術と組み合わせ、より多くのデータを扱えるようにする工夫が焦点の1つとなりそうだ。

「サーバーサイドフラッシュも活況に」

ストレージというと、サーバーと別建てで設置する装置(つまりはディスクアレイ)を想起しがちだ。だが、フルフラッシュの文脈で語られるアプローチはこれだけではない。PCIeカードの形でサーバーに内蔵するタイプの製品があり、ローカルストレージ、あるいは外部ストレージのキャッシュとして使うことでデータへの高速アクセスを実現している。

この分野の先駆的存在がベンチャーのFusion-io。そのほかEMCがXtremSFとして展開、IBMは買収したTexas Memory Systemsのラインナップを持つ。サーバー内のフラッシュ活用もまたホットな市場となりそうだ。

自動階層化

データのアクセス頻度に応じて
格納先を自律的に最適化

技術解説

図3-3  自動階層化のイメージ 図3-3  自動階層化のイメージ

アクセススピードや容量あたりのコストなど、特性の異なる複数のストレージデバイスを組み合わせ、ホットデータ(アクセス頻度の高いデータ)は高速デバイスに、コールドデータ(アクセス頻度の低いデータ)は低速なデバイスに自動的に配置する技術。アプリケーションやミドルウェアなど、ストレージにアクセスしてくる側には、物理デバイスの違いは隠蔽される。

最近のストレージでいえば、デバイスの対象としては「SSD」「SAS HDD」「SATA HDD」が挙がる。記録媒体の回転やヘッドシークなどメカニカルな動きを伴わないSSDは高速だが高価、HDDは一般にSAS→SATAの順で容量単価が安くなるが低速になる。

ストレージを階層化する考え方は古くからあるが、当初は(1)データの移行がボリューム単位に限られたこと、(2)専用ツールを使ってマニュアルで対処する必要があったこと、などが理由で制約が多かった。それが、ボリュームよりもっと細かい単位(Sub-LUNなど)で自律的に再配置する技術が登場したことで実用度が増した。

関心が高まっている一因にSSDの進歩がある。需要に呼応した量産効果もあり、SSDの価格は下落傾向。既存ストレージ環境にSSDを追加する敷居は低くなっており、それに伴って自動階層化もトピックになっている。

ユーザーのメリット

SSDのように相対的に高価だがI/O速度が出るデバイスを一部に組み入れることで、ストレージ全体の性能を引き上げられる。つまり、限られた予算内で性能を最適化する現実解になる。

一般に、企業システムにおいて頻繁にアクセスされるデータは全体の数パーセント、多くて一割程度とも言われる。HDDベースのストレージの場合、RAIDレベル等の設定でチューニングしようにも飛躍的に性能を上げるのは難しい。ホットデータ(の一部)だけでもSSDに配置できれば、大きな性能改善が見込める。

一方で、アクティブではないデータを下位の階層に位置するデバイスに再配置し、重複排除なども組み合わせればSATA HDDなど低価格大容量のディスク台数を減らせることも期待できる。装置本体や電力も含めてコスト削減につながる。

視野を広げれば、データの発生から廃棄までの一連のサイクルを効率的に管理する考え方「ILM:Information Lifecycle Management」に沿ったストレージ運用につながる。

製品動向

大手ストレージベンダーは、主にハイエンド〜ミッドレンジに位置する製品に実装している。マネジメントソフトウェア(ストレージOSとも呼ぶ)の機能の1つとして提供するものが多い。

EMCは「FAST(Fully Automated Storage Tiering)」と呼ぶソフトで自動階層化を実装。2012年の年次カンファレンスでは大幅な機能拡張を発表し、旧製品や他社製品も含めて自動階層化を具現化できることを訴求した。

デルは買収したCompellentの技術などを使って自動階層化を強化。SSD、SAS、SATAといったそれぞれの特性を活かすのはもちろん、HDDに配置する場合も使用頻度が高いデータはシークタイムの速い外周部を優先するといった細かい制御を実現している。

自動階層化の導入時には、実運用しながらデータの格納場所を最適化していくのが一般的だが、「IBM Storwize V7000」のように、当初のデータ格納場所を任意に指定できるものもある。

スケールアウトNAS

ファイルストレージをクラスター化
性能も容量もリニアに拡張

技術解説

NAS(Network Attached Storage)は、その名の通りにネットワークに直接つないで使うストレージで、一般にはファイルサーバーとして使う。実体としては、コントローラとストレージデバイス(多くはHDD)で構成される。

容量が限界に近づいた時、NASを別途増設すると管理の手間が増えるし、ユーザーもどこにファイルを保管するかを常に意識しなければならない。そこで、コントローラ配下のディスクを追加する対処法がかつての主流だった。ただし、この場合、容量は増えてもアクセス速度は1つのコントローラに依存するので性能上のボトルネックとなりがちである。

ここで出てきたのがスケールアウトNASというアプローチだ。簡単に言えばNASをクラスター構成にする技術である。コントローラ+ディスクで構成される筐体が増えても、使う側からは1台のNASとして見える。コントローラが増えるので、容量を増やしても性能がほとんど低下しない上、単一システムゆえ、運用管理も容量にかかわらずシンプルになる。

ユーザーのメリット

スケールアウトNASは当初、放送事業者やメディア/エンターテインメント系ネット事業者などが先行して導入した。音声にしてもビデオ/スチルにしても高解像度化に拍車がかかり、データは肥大化の一途。事前にサイジングしてストレージ容量を計画的に使っていくという従来スタイルが馴染まず、都度、効率的に拡張していきたいというニーズに合致したためだ。

他の一般企業にしても、いわゆるビッグデータの取り込みが欠かせなくなってくる。大量多種かつ多頻度で発生するデータの格納先として、スケールアウトNASという選択肢は現実的だ。Hadoopの分散ファイルシステムの代替や、他のデータ処理系との組み合わせも含め、スケールアウトNASにかかわる技術進歩はますます加速すると見られる。

製品動向

スケールアウトNAS関連の主要製品を表3-1にまとめた。

この分野で先鞭をつけたのがアイシロン。2010年にEMCが買収したことで話題を巻いた。ランダムアクセス性能を重視した「Sシリーズ」など、利用シーンに応じて大きく3タイプの製品を提供している。OneFSと呼ぶストレージOSはすべてに共通しており、追装時の自動クラスタリングなどを制御する。IBM、デル、HPなど他のストレージベンダーも追随するようにラインナップを揃えた。

他とはやや異なるアプローチを見せるのがレッドハットだ。同社が2011年に買収したGlusterのソフトウェア「GlusterFS」技術を採用し、x86サーバーに導入することで、ファイル/非定型データ向けのストレージ環境を低コストで実現するというもの。ストレージ搭載のx86サーバーをハードとして使うスケールアウトNASの一種である。

製品名(提供元) 特記事項
Isilonシリーズ(EMC) アクセスタイプなどによって3シリーズを展開
ARX(F5ネットワークスジャパン) ファイルサーバーの仮想化に焦点を当てたアプライアンス
sStorNext(クアンタム) NASコントローラソフトとして提供。クラスタ化に対応する
FileStor(シマンテック) NASコントローラソフトをOEM提供。富士通などが製品展開
EqualLogic FSシリーズ(デル) 買収したExaneの技術がベース
SONAS(日本IBM) 自動階層化や差分バックアップにも注力
X9000シリーズ(日本ヒューレット・パッカード) 買収したIBRIXの技術がベース
Data ONTAP<Cluster-mode>(NetApp) ストレージOSにクラスター化の機能を実装
Hitachi NAS Platform(日立製作所) 米日立データシステムズが買収したBlueArcの技術がベース
Red Hat Storage Server(レッドハット) 買収したGlusterの技術がベース

オブジェクトストレージ

ビッグデータをため込む新機軸
単一アドレス空間でデータを管理

技術解説

ビッグデータやソーシャルなどのキーワードが象徴する“インターネットと深く結び付いた”データをどうハンドリングするか。企業システムが直面する新たなテーマである。既に触れたスケールアウトNASは、既存技術をベースに、この要請に応えるアプローチと言える。

だがNASにはファイルシステムが介在する。つまりデータの格納位置を特定するのに、階層型のパス指定によるネームスペース(名前空間)を用いる。それが存在する限り、ファイル数やユーザー数の増加に伴って処理の複雑性が増すのは避けらない。容量増大につれコントローラが増えるので価格が高くなるし、故障の可能性も増える。もっとシンプルでインターネット系技術に最適化したストレージのあり方があるのでは─。そうして登場したのがオブジェクトストレージだ。

オブジェクトストレージはこの問題の解決を図るべく、クラスター構成を採ることを前提に以下の特性を備えているのが一般的である。

  • データはフラットなアドレスルールで管理する。具体的には、どのノードのどの位置にあるかを示すIDを使う
  • 個別データにメタデータをキメ細かく付与できる
  • インターネットで使われるHTTPやRESTなどをインタフェースとする
  • ノード間で互いに複製をとりながらデータを保全する
  • ノードの追加によって容量を適宜増やせるようにする

これら5つを受け、誤解を恐れずに言えば、コモディティ化したソフト/ハード技術を最大限に活かし、非定型のデータをどんどん詰め込んでいくための器をコスト効率よく用意する技術である。

ユーザーのメリット

ソーシャルメディア、M2M(Machine to Machine)、位置データ…。多種多様かつ高頻度で発生するデータを分析・活用することで、“次の一手”の精度アップが期待できる。

そうした取り組みを進めていくには、“使えるかもしれないデータはとにかく蓄積しておく”ことが大切になる。その格納場所としてオブジェクトストレージは1つの有力な選択肢となり得る。まだ歴史が浅く発展途上の段階にあるが、引き続きウォッチしていきたい技術領域だ。

製品動向

図3-3  自動階層化のイメージ デルのオブジェクトストレージ「DX 6000シリーズ」

EMCの「Atmosシリーズ」、デルの「EqualLogic DXシリーズ」、ネットアップの「NetApp StorageGRIDシリーズ」などがメジャーどころ。いずれも、データの数や個別容量が多い医療研究機関やコンテンツプロバイダーなどを顧客として持っている。

普段意識することは少ない、Amazon S3など、クラウドサービスとして提供されるストレージ機能も実体としてはオブジェクトのアプローチを採っているものが多い。国内でいえば、IIJ GIO、NTTコミュニケーションズのCloudn、ニフティクラウドなども同様だ。

ソフトウェアスタックをOSSとして公開する動きもある。STF、Swift、LeoFSが代表格。商用ソフトとしては、Cloudian、Riak CSなどの名が挙がる。

ユニファイドストレージ

SAN/NASの両プロトコルに対応
大企業での用途も見込んで進化

技術解説

ストレージを、格納するデータのハンドリング方法で分類するとブロックストレージとファイルストレージにざっくり分けることができる。

前者は、固定長でサイズが小さな「ブロック」単位でデータを読み書きするもの。業務アプリケーションがDBMSにデータを保存するといった用途で使われる。一般に、SANを構成するのはブロックストレージ。構造化されたデータの高速処理に向く。使われるプロトコルはFCやiSCSIなどだ。

後者の対象は、可変長でサイズが大きくなることも多い「ファイル」。ストレージのOS(ファイルシステム)により名前解決(ルートからのパス指定によるファイル特定)が図られ、それを読み書きする。NASはこのタイプに属する。オフィス文書や、画像や動画といった非定型のデータ管理に適している。プロトコルには、NFSや CIFSなどが使われる。

用途の違いから、従来はそれぞれに最適化したストレージが提供されてきた。しかし、2010年ころから、1台のストレージ装置で双方に対応する製品が続々と登場し始めた。「ユニファイドストレージ」である。配下にあるディスク容量を融通しつつ、ブロックアクセス向けのボリュームを切り出したり、ファイルアクセス用の領域を用意してクライアントにマウントさせたりといったことが可能となる。

ユーザーのメリット

ユニファイドストレージは当初、規模がさほど大きくない企業での導入を想定した製品が主流だった。基幹系システムのデータ処理量がさほど多くなく、社内にファイルサーバーをいくつか運用しているような企業であれば、ユニファイドストレージに統合できるからだ。結果として、装置コスト、運用コスト、設置場所や電力消費のコストなどの削減につなげられる。これからIT基盤を整えるというスタートアップ企業にとっても、ブロックとファイルの双方を1台でまかなえるユニファイドストレージは有効な選択肢だ。

だが最近では、大手企業もユニファイドストレージに食指を伸ばし始めている。オープン化の時代、業務別や部門別にシステムを次々に構築した結果として社内に幾つものストレージ資産を抱えている企業は少なくない。その一部でも統合していきたいという場合、例えば、営業部門の業務システムとファイルサーバーのストレージを統合するといった対策が考えられる。こうしたケースでユニファイドストレージの導入が候補に挙がる。性能や容量を段階的に拡張できるよう工夫を凝らした製品が一部に登場してきたことが、大手企業への導入を後押ししている。

製品動向

写真はNetAppのFAS3200シリーズ 写真はNetAppのFAS3200シリーズ

ユニファイドストレージという言葉の定着に一役買ったのが、この市場で先陣を切ったネットアップだ。NASのベンチャーとして90年代の初頭に登場。ストレージ製品「FASシリーズ」全モデルに共通する専用OS(DataONTAP)は、NASのみならずFCやiSCSIといったブロック(SAN)のプロトコルに対応する。

EMC「VNXシリーズ」、デル「PowerVault NX36x0シリーズ」、IBM「Storwize V7000 Unified」、オラクル「Sun ZFS Storage Appliance」などメジャーベンダーもラインアップを用意。国産勢では日立製作所が「Hitachi Unified Storage」として展開するほか、コアマイクロシステムズの「Prime STORシリーズ」などがある。

シンプロビジョニング

サーバーに割り振る“容量”を仮想化
スモールスタートでROIを高める

技術解説

ブロックストレージを例にとると、サーバー(アプリケーション)に割り当てるストレージ領域は「ボリューム」(論理的な管理単位)であり、物理的なディスクのどれを使っているかは隠蔽されている。この意味でストレージには仮想化の概念が早期から取り入れられていた。だが仮に10TBのボリュームを割り当てるには、合計10TBの物理ディスクを用意しなけなければならないことは変わらなかった。中途半端な仮想化だったのである。

そこでサーバーに割り当てる容量を仮想化し、論理的には10TBだが、物理的には2TBだけで済ませるといったアプローチが考えられた。シンプロビジョニングである。複数のストレージ装置のディスクを束ねてリソースプールを用意し、その中から必要分を切り出すといった考えとセットで登場した技術だ。ストレージの容量設計では、将来のデータ増加を見越して余裕分を確保するのが常。これを逆手にとるアプローチとも言える。

それでは先の例で2TB以上の容量が必要になればどうするのか?その場合、リソースプールから、必要容量を割り当てればいいだけだ。例えば2TB分のディスクをアロケートするわけである。容量不足の検知やディスクのアロケートは事前に設定した閾値などにより自律的に行われる。

ユーザーのメリット

煩わしい、あるいは高度なスキルを必要とするキャパシティプランニングから開放されるのが大きなメリットとなる。

数年後のデータ増加を見越して、緻密にキャパシティプランニングするのは困難だ。だからといって後からディスクを追加購入して実装、各種設定をするのは、データの再配置を含め手間がかかるし、システム停止の必要もある。結局、十分以上の余裕を持った容量のストレージを用意していた。ぎりぎりの容量で運用して、トラブルを起こすよりマシだからだ。

シンプロビジョニングを使えば、システム要件に照らして十分な容量を確保しておける。実使用されるディスクは当面必要な分だけなので、投資を抑えながらスモールスタートできる効果を見込める。ただしメリットを得られるのは、相当規模のストレージを運用しているケースに限られる。

製品動向

この数年のストレージ分野で主要な技術であり、ベンダー各社ともシンプロビジョニング機能の実装・強化に余念がない。当初、ハイエンド機を中心に位置付けられていたが、ミッドレンジ機にも広がっているのが近年の傾向だ。

ディスク単位ではなく、より小さな単位で融通すれば、全体最適化が進む。この分野の草分け的存在なのがHPが買収した3PAR。16KBという極小サイズの動的配置を専用ASICで担う点が特徴。また容量を増やしていくだけではなく、実情に合わせて減らすといった縮退運用にも力を注いでいる。

図3-4 ストレージ容量を仮想化するシンプロビジョニング
図3-4 ストレージ容量を仮想化するシンプロビジョニング

 

Webサイトの記事の一部は、IT Leaders 雑誌版、電子雑誌版から転載しています。

» IT Leaders 雑誌版、電子雑誌版 無料購読お申し込みはこちら。