[新製品・サービス]

マシンラーニングの学習データをすばやく準備、アシストとDataRobotが協業

2018年11月13日(火)日川 佳三(IT Leaders編集部)

アシストは2018年11月13日、DataRobot Japanとの間で、両社の製品を組み合わせてユーザーに提案することで協業したと発表した。DataRobot Japanは、機械学習を自動化するソフト「DataRobot」を販売している。アシストは、DataRobotの学習データを整備する目的に適したデータ・プレパレーションソフト「Paxata(パクサタ)」を提供している。

 アシストは、データ分析の前処理として、データを実際に使える状態へと加工・変換するデータプレパレーションソフト「Paxata」(パクサタ)を提供している。Apache Hadoop/Sparkをベース技術としており、企業内外にある生データを収集して加工・変換し、分析できる状態に整える機能を提供する。

図1:DataRobotとPaxataの連携イメージ(出典:アシスト)図1:DataRobotとPaxataの連携イメージ(出典:アシスト)
拡大画像表示

 Paxataの特徴は、分析用のデータを業務ユーザーみずからノンプログラミングで用意できることである。利用したいデータを表形式で表示しながら、マウス操作で作業できる。また、精度の高いデータに加工する作業を支援する仕掛けとしてマシンラーニング(機械学習)を採用している。表記ゆれの統一など、データ加工の推奨パターンを提示する。

 一方のDataRobotは、機械学習を用いた予測モデルの作成を自動化するソフトである。学習データ(教師データ)さえ用意すれば、データサイエンティストでなくても、簡単に機械学習を用いて予測モデルを作成できる。複数のアルゴリズムを使ってモデルを生成し、より精度の高いモデルを自動で採用する。

 今回、アシストとDataRobot Japanは、互いの製品を組み合わせて使うことをユーザーに提案することで協業した。DataRobotの学習データをPaxataで整備するという使い方になる。PaxataからDataRobotへのデータの受け渡し手段として、Amazon S3などを利用できる。

 製品提供の背景について同社は、機械学習を自動化できても、学習データの整備に時間がかかっていることを挙げている。アシストによれば、ユーザーの声として、「DataRobotにデータを入れると10分で予測モデルを作成できるのに、データの準備に80時間もかかっている」という。これをPaxataで解決する。

関連キーワード

アシスト / マシンラーニング / DataRobot / Hadoop / OSS / データプレパレーション / Paxata / Apache Spark

関連記事

トピックス

[Sponsored]

マシンラーニングの学習データをすばやく準備、アシストとDataRobotが協業アシストは2018年11月13日、DataRobot Japanとの間で、両社の製品を組み合わせてユーザーに提案することで協業したと発表した。DataRobot Japanは、機械学習を自動化するソフト「DataRobot」を販売している。アシストは、DataRobotの学習データを整備する目的に適したデータ・プレパレーションソフト「Paxata(パクサタ)」を提供している。

PAGE TOP