[新製品・サービス]

SAP、企業データを高速に集計・加工するミドルウェア「SAP Data Hub」を発表

2017年11月7日(火)日川 佳三(IT Leaders編集部)

SAPジャパンは2017年11月7日、WebログやSNSデータなどの日々発生するビッグデータやDWHに格納されている業務データなど、様々なデータを引っ張ってきて集計・加工して活用できるようにするミドルウェア「SAP Data Hub」を発表した。ビッグデータ処理用のインメモリー型分散処理エンジンとして「SAP Vora」のコンポーネントを組み込んでいる。

 SAP Data Hubは、企業内の様々なデータを引っ張ってきて集計・加工して活用できるようにするミドルウェアである。個々の部門の業務ユーザーが必要とするデータを、GUIベースの簡単なデータ設計ツールによって、個々の部門の業務ユーザーに提供できるようになる。

図1●SAP Data Hubのシステム構成。インメモリー型の分散処理エンジン「SAP Vora」を組み込んでいる。ETLソフトと組み合わせることでビッグデータ以外の各種データもSAP Vora上で扱えるようになる(出所:SAPジャパン)図1●SAP Data Hubのシステム構成。インメモリー型の分散処理エンジン「SAP Vora」を組み込んでいる。ETLソフトと組み合わせることでビッグデータ以外の各種データもSAP Vora上で扱えるようになる(出所:SAPジャパン)
拡大画像表示

 特徴は、インメモリーで動作する分散データ処理エンジンであるSAP Voraをデータ処理のエンジンとして使っていること。これにより、高速に集計・加工できる。また、機械学習ライブラリをデータ処理のフローに組み込むなど、データ処理のパイプラインを設計できる。データ処理は、トリガー駆動やスケジュール駆動ができる。

図2●SAP Voraの概要。Hadoop上のデータやAmazon S3上のデータソースに対して、Dokerコンテナを使ってインメモリーで分散処理する(出所:SAPジャパン)図2●SAP Voraの概要。Hadoop上のデータやAmazon S3上のデータソースに対して、Dokerコンテナを使ってインメモリーで分散処理する(出所:SAPジャパン)
拡大画像表示

 ビッグデータのデータソースとして、SAP VoraのデータソースであるHadoppとAmazon S3ストレージを利用できる(今後、Azure Data Lakeに対応予定)。別途ETL(抽出/加工/格納)ソフトである「SAP Data Services」と組み合わせることで、RDBMS(リレーショナルデータベース管理システム)など各種のデータを引っ張ってきてSAP Vora上で処理できる。

 SAP Data Hubの背景には、マーケティング部門やビッグデータ分析部門を介することなく、これらの部門が扱っているビッグデータにアクセスして活用できるようにしたいという需要がある。業務部門は、SAP Data Hubを使うことで、これらビッグデータと業務データを組み合わせて分析できるようになる。

関連記事

SAP、企業データを高速に集計・加工するミドルウェア「SAP Data Hub」を発表 SAPジャパンは2017年11月7日、WebログやSNSデータなどの日々発生するビッグデータやDWHに格納されている業務データなど、様々なデータを引っ張ってきて集計・加工して活用できるようにするミドルウェア「SAP Data Hub」を発表した。ビッグデータ処理用のインメモリー型分散処理エンジンとして「SAP Vora」のコンポーネントを組み込んでいる。

PAGE TOP