[インタビュー]

「データサイロの背景にある“スキーマの呪縛”を新世代DBで解き放つ」──米MarkLogicのCEO

2017年12月22日(金)川上 潤司(IT Leaders編集部)

データ活用の巧拙がビジネスに直接的に影響を与えることは言を俟たない。それは百も承知でありながら、目の前の“データサイロ”を御せず悪戦苦闘する企業が引きも切らないのが現実だ。この構図に一石を投じる新しいタイプのデータベースを提供しているのがMarkLigicだ。同社のCEOを務めるゲイリー・ブルーム(Gary Bloom)氏に、昨今の状況と同社の戦略を聞いた(聞き手はIT Leaders編集部)。

検索エンジンとデータベースを融合した新機軸

 創業者のクリストファー・リンドブラッド(Christopher Lindblad)は、かつて米インフォシークで、検索エンジン技術をベースに企業内サイトでの高速検索を具現化するUltraseek Serverの開発にチーフアーキテクトとして携わっていたエンジニアだ。インターネットの世界には検索エンジンがあり、各サイトの構造に“口出し”することなく、欲しい時に欲しい情報を探し出すことを可能にしている。対して、企業内では欲しいデータへのアクセスがままならない現実がある。ならば、知見を活かして自らチャレンジしてみようと思い立ったのが起点だ。

 企業内のデータを縦横無尽に扱う検索エンジン的なものを創ろうという発想がベースにあり、そもそもデータの入れ方とかを変えないと理想系には近付かないことに思い当たった。平たく言えば、検索エンジンとデータベースを融合させたような製品を開発しようとコーディングに勤しみ、MarkLogicを生み出したのである。

 こうして出来上がったプロダクトは、昨今の技術的なカテゴライズで言うならNoSQL型のデータベースということになる。もっとも、開発当初から高可用性やスケーラビリティ、データの一貫性を担保するトランザクション処理、セキュリティやディザスタリカバリといったエンタープライズで求められる要件への対応を視野に入れているので、一般的なNoSQLデータベースとは一線を画するとも言えるだろう。

 このアイデアは、シリコンバレーの著名VCであるセコイア・キャピタル (Sequoia Capital) の目にとまって出資が決まり、本格的な事業が動き始めた。アーリーアダプターの取り組みを介して価値を世に示すことが必要という段になった時、とある大手メディア企業が採用を決め、懸案となっていたデータ統合を短期間のうちに成し遂げた。それが一つの契機となって広く知られるようになったし、これは行けるという当社の自信にもつながたった。

 折しも同時多発テロの悲劇が起こり、それ以降、いくつもの政府機関に分散している情報を統合する動きも活発になった。ここでもMarkLogicが採用されたことで知名度も信頼度も上がり、顧客からの引き合いが増加。数々の実績を積み上げながら今日に至っている。

-MarkLogicは既存のRDBを置き換えることを狙っているのか、それとも既存システムを活かしながらデータを統合することに軸足を置いているのか

 実際にはどちらもできるのだが、市場が受け入れる初期段階としては後者が中心になるだろう。多くの企業は、過去30年くらいの間に様々な業務システムを構築してきた結果としてのRDB資産を持っている。限界を感じてテクノロジーを変えようとしても、実務を支えている以上は、そのシステムを止められないというのが現実だ。目の前にあるのはデータを統合するという切実な問題であり、この解決のためにMarkLogicを活用してほしい。

 当社はこうした用途への適用形態を「オペレーショナルデータハブ」と呼んでいる。とりあえず、今持っているデータを“As-Is”で読み込んで使えるようにしようというアプローチだ。MarkLogicは、RRBのテーブルであれ、XMLやJSONなどの形式であれ、あらゆるデータをロードする時に、ユニバーサルインデックスと呼ぶ独自のインデックスを付け、すぐさまクエリーをかけられるようにするのが最大の特徴だ。RDBの場合、スキーマがバラバラでももちろん構わない。さらに、データの元々の構造や、どこからやって来たのかも併せて管理している。

 技術的な詳細を解説する時間がないので割愛するが、こうした特性によって、多種多様なデータを取り込んだ上で、すぐさま目的に応じた検索をすることができる。すなわち、一筋縄ではいかなかった「複数のデータセットに横串を刺す」ことが可能になるのだ。

 オペレーショナルデータハブで積年の夢を叶え、その環境を使い込むうちに、それまで特定のデータ統合のためだけに使っていたRDBが不要であることに気付いたり、ある業務システムのRDBをMarkLogicに切り替えた方が得策であることに気付いたりすることだろう。近い将来に、RDBをリプレースする目的でも使われることになると見ている。

 テクノロジーには自信を持っており、ある意味ではDistuptiveなものと言えるが、我々は顧客企業が現存の業務を止められないという現実をわきまえている。旧来型のシステムを、どうやって安く安全に短期間でモダナイズしていくか。そこの解を提供するのが使命と考えている。

─実際の事例をもう少し詳しく知りたい。特に関心を示しているような業界はあるか。

 例えば米国の金融機関では、規制当局からの各種の報告要件が複雑さを増している。銀行業界ひとつとっても、大手によるM&Aを軸とした合従連衡が繰り返されてきたのは知っての通りだ。当然のことながら、膨大な数のシステムが乱立しており、求められる水準のデータを集約してレポートにまとめるのに、ただならぬ労力を強いられている。そのために大規模DHWを構築したとしても、規制の強化や緩和が頻繁に行われるたびに手直し、そして投資が必要となる。バンドエイド的なやり方ではラチが明かないことを悟った企業が、ブレークスルーとなるテクノロジーを探し始め、そこにMark Logicがうまくはまっている。

 一つ、具体例を紹介しよう。米国の医療保険制度改革、一般にはオバマケアとして知られる枠組みの中で、政府は「HealthCare.gov」というサイトで対象者への保険登録を促すこととなった。複数の公的機関が保有する個人情報や、保険会社の商品プランなど、関係各所の膨大なデータを統合してガイドしなければならない大規模かつ複雑なプロジェクトだった。当初、RDBとETLとの組み合わせで臨んだものの2年が経過しても先が見えず暗礁に乗り上げた。残り1年となったところでMarkLogicへの切替を決断し、限られた期間の中で要件を満たすことに成功した。

 JPモルガン・チェースにおける個人情報の統合やドイツ銀行グループにおけるレポート作成など金融業界での採用事例には事欠かないし、大手メディア企業や、国際的な自動車メーカーなど、他の業界への導入やPoC(実証実験)にも裾野が広がっている。データ分析という画一的な使い方ではなく、日々のオペレーショナルな領域に適用しようとの動きが顕著だ。

 先のHealthCare.govのプロジェクトが象徴するように、RDBを前提にすると3~4年もかかってしまう案件を短期間のうちに解決のメドをつけられることが評価されている。通常、最初の1カ月で、対象領域にどのようなデータがあるかを細かく洗い出し、続く3~4週間で基本施策をまとめる。今回できることは「ここ」とスコープを定め、数カ月で実績を出すのが我々のやり方だ。何しろ、企業を取り巻く環境の変化は早い。大上段に構えずにアジャイルに動くのが理にかなっている。

 後々になって処理量が増えるかもしれないし、さらに他のデータを統合したいといいうニーズが出てくるのもよくあることだ。コモディティサーバーで稼働するMarkLogicの場合はスケールアウトさせやすいし、代表的なクラウド環境で動かすこともできる。その柔軟性やコストパフォーマンスも、ユーザーのメリットと言えよう。

─これからの時代を支えるデータベースとして、およそ必要となる機能は実装しきったと言えるのか。まだミッシングピースはあるのだろうか。

 創業者のクリスが起業を決意した際に脳裏に描いていた青写真に照らせば、胸を張れる水準に達していると言えるのではないだろうか。もっとも、技術は進歩するし企業を取り巻く環境も変わるので、完成度に磨きをかける努力はこれからも続けなければならない。顧客が使いやすいように、一方では安心して使えるようにすることが中心となる。

関連記事

Special

-PR-

「データサイロの背景にある“スキーマの呪縛”を新世代DBで解き放つ」──米MarkLogicのCEO [ 2/3 ] データ活用の巧拙がビジネスに直接的に影響を与えることは言を俟たない。それは百も承知でありながら、目の前の“データサイロ”を御せず悪戦苦闘する企業が引きも切らないのが現実だ。この構図に一石を投じる新しいタイプのデータベースを提供しているのがMarkLigicだ。同社のCEOを務めるゲイリー・ブルーム(Gary Bloom)氏に、昨今の状況と同社の戦略を聞いた(聞き手はIT Leaders編集部)。

PAGE TOP