[市場動向]

PFN、深層学習プロセッサ「MN-Core」を発表、2020年春に2EFLOPSの大規模クラスタを構築

2018年12月12日(水)日川 佳三(IT Leaders編集部)

Preferred Networks(PFN)は2018年12月12日、ディープラーニング(深層学習)の学習工程を高速化する用途に特化したプロセッサ「MN-Core」(エムエヌ・コア)を発表した。消費電力あたりの半精度浮動小数点演算性能は1ワットあたり1テラFLOPSを見込む。2020年春にはMN-Coreを搭載した大規模クラスター「MN-3」を構築する。MN-3の計算速度は、最終的に半精度で2エクサFLOPS(1秒に200京回の浮動小数点演算)まで拡大する。

 PFNが開発するプロセッサ「MN-Core」は、ディープラーニング(深層学習)の学習工程を高速化する用途に特化したプロセッサである(写真1)。行列演算器を高密度に実装し、条件分岐がない完全SIMD動作をするシンプルなアーキテクチャとした。1つのパッケージは4ダイで構成し、ダイにつき512個、計2048個の行列演算ブロックを集積している。チップあたりのピーク性能は、深層学習でよく使う半精度浮動小数点演算で524テラFLOPS(1秒あたり524兆回)。

写真1:ディープラーニング(深層学習)の学習工程を高速化する用途に特化したプロセッサ「MN-Core」の外観写真1:ディープラーニング(深層学習)の学習工程を高速化する用途に特化したプロセッサ「MN-Core」の外観
拡大画像表示

 特徴は、電力性能(消費電力あたりの演算性能)を高めたことである(表1)。半精度浮動小数点演算において、世界最高クラスの1ワットあたり1テラFLOPS(1秒あたり1兆回)を実現できる見込みとしている。最小限の機能に特化することで、コストを抑えながら、深層学習における実効性能を高めることが可能である(関連記事:ディープラーニングでデバイスの制御にまで踏み込む――Preferred Networksが事業を説明

表1:MN-Coreチップのスペック
製造プロセス TSMC 12nm
消費電力(W、予測値) 500
ピーク性能(TFLOPS) 32.8(倍精度)
131(単精度)
524(半精度)
電力性能(TFLOPS/W、予測値) 0.066(倍精度)
0.26(単精度)
1.0(半精度)

 提供方法として、PCサーバーに搭載するためのPCI Express接続型のボード「MN-Core Board」(写真2)を用意する。専用設計のヒートシンクとブロアファンによって、高温になるMN-Coreを確実に冷却するとしている。

写真2:PCI Express接続型のボード「MN-Core Board」の外観写真2:PCI Express接続型のボード「MN-Core Board」の外観
拡大画像表示

 MN-Core Boardを搭載するためのPCサーバー機「MN-Core Server」(写真3)も用意する。高さ7Uのラックマウント型のきょう体に、4枚のMN-Core Boardを搭載できる。MN-Core Boardを4枚搭載した場合の1ノードあたりの計算速度は、半精度演算でおよそ2ペタFLOPS(1秒あたり2000兆回)となる。

写真3:MN-Core Boardを搭載するために開発したPCサーバー機「MN-Core Server」の外観写真3:MN-Core Boardを搭載するために開発したPCサーバー機「MN-Core Server」の外観
拡大画像表示

 2020年春には、MN-Core Server×1000ノードを超える大規模クラスター「MN-3」(写真4)を構築する予定である。MN-3の計算速度は、最終的に2エクサFLOPS(1秒に200京回)まで拡大することを目標としている。MN-3以降は、それぞれ得意分野が異なるMN-CoreとGPGPU(GPUによる汎用計算)を組み合わせて利用することで、より効率的な計算環境の構築を目指す。

写真4:1000ノードを超える大規模クラスター「MN-3」のイメージ写真4:1000ノードを超える大規模クラスター「MN-3」のイメージ
拡大画像表示
関連キーワード

ディープラーニング / プロセッサ / Preferred Networks

関連記事

PFN、深層学習プロセッサ「MN-Core」を発表、2020年春に2EFLOPSの大規模クラスタを構築Preferred Networks(PFN)は2018年12月12日、ディープラーニング(深層学習)の学習工程を高速化する用途に特化したプロセッサ「MN-Core」(エムエヌ・コア)を発表した。消費電力あたりの半精度浮動小数点演算性能は1ワットあたり1テラFLOPSを見込む。2020年春にはMN-Coreを搭載した大規模クラスター「MN-3」を構築する。MN-3の計算速度は、最終的に半精度で2エクサFLOPS(1秒に200京回の浮動小数点演算)まで拡大する。

PAGE TOP