[新製品・サービス]

機械学習の学習データをすばやく準備、アシストとDataRobotが協業

2018年11月13日(火)日川 佳三(IT Leaders編集部)

アシストは2018年11月13日、DataRobot Japanとの間で、両社の製品を組み合わせてユーザーに提案することで協業したと発表した。DataRobot Japanは、機械学習を自動化するソフト「DataRobot」を販売している。アシストは、DataRobotの学習データを整備する目的に適したデータ・プレパレーションソフト「Paxata(パクサタ)」を提供している。

 アシストは、データ分析の前処理として、データを実際に使える状態へと加工・変換するデータプレパレーションソフト「Paxata」を提供している。Hadoop/Sparkをベース技術としており、企業内外にある生データを収集して加工・変換し、分析できる状態に整える機能を提供する。

図1:DataRobotとPaxataの連携イメージ(出典:アシスト)図1:DataRobotとPaxataの連携イメージ(出典:アシスト)
拡大画像表示

 Paxataの特徴は、分析用のデータを業務ユーザーみずからノンプログラミングで用意できることである。利用したいデータを表形式で表示しながら、マウス操作で作業できる。また、精度の高いデータに加工する作業を支援する仕掛けとして機械学習を採用している。表記ゆれの統一など、データ加工の推奨パターンを提示する。

 一方のDataRobotは、機械学習を用いた予測モデルの作成を自動化するソフトである。学習データ(教師データ)さえ用意すれば、データサイエンティストでなくても、簡単に機械学習を用いて予測モデルを作成できる。複数のアルゴリズムを使ってモデルを生成し、より精度の高いモデルを自動で採用する。

 今回、アシストとDataRobot Japanは、互いの製品を組み合わせて使うことをユーザーに提案することで協業した。DataRobotの学習データをPaxataで整備するという使い方になる。PaxataからDataRobotへのデータの受け渡し手段として、Amazon S3などを利用できる。

 背景には、機械学習を自動化できても、学習データの整備に時間がかかっている、という状況がある。アシストによれば、ユーザーの声として、「DataRobotにデータを入れると10分で予測モデルを作成できるのに、データの準備に80時間もかかっている」という状況がある。これをPaxataで解決する。

関連記事

Special

-PR-

機械学習の学習データをすばやく準備、アシストとDataRobotが協業アシストは2018年11月13日、DataRobot Japanとの間で、両社の製品を組み合わせてユーザーに提案することで協業したと発表した。DataRobot Japanは、機械学習を自動化するソフト「DataRobot」を販売している。アシストは、DataRobotの学習データを整備する目的に適したデータ・プレパレーションソフト「Paxata(パクサタ)」を提供している。

PAGE TOP