発表資料 - コンピューティクスによる物質デザイン:複合相関と非平衡

コンピューティクスによる物質デザイン:複合相関と非平衡ダイナミクス
高性能並列固有値計算アルゴリズムの開発
櫻井鉄也1), 2), 二村保徳1),前田恭行1),矢野貴大1),
Du Lei1), 2),今倉暁1),多田野寛人1)
1)筑波大学大学院システム情報工学研究科
2)科学技術振興機構CREST
新学術領域「コンピューティクスによる物質デザイン:複合相関と非平衡ダイナミクス」
研究課題
n  研究課題名
Ø  計算量子科学のニーズに対応した高性能固有値計算
アルゴリズムの開発
n  体制
Ø  代表者 櫻井鉄也(筑波大学)
Ø  連携研究者 多田野寛人,今倉暁(筑波大学)
Ø  研究協力者 Du Lei,二村保徳,前田恭行,矢野貴大(筑波大学)
n  主な実施課題
Ø  階層型固有値解法によるバンド構造計算法の高性能化
Ø  確率的推定法を利用した状態密度計算法の開発
Ø  計算量子科学分野で現れるさまざまな固有値計算への展開
Ø  実問題での性能評価とボトルネックの改善
新学術領域「コンピューティクスによる物質デザイン:複合相関と非平衡ダイナミクス」
関連プロジェクト:CREST
n  「ポストペタスケールに対応した階層モデルによる超並列列
固有値解析エンジンの開発」
Ø  主たる共同研究者
-  張(名古屋大),今村(理研),山本(神戸大),
藏増(筑波大),星(鳥取大)
Ø  アーキテクチャの超並列性を活用する階層型並列アルゴリズム
-  密行列・疎行列に対応
Ø  共通基盤技術としての線形計算手法・実装技術開発
-  高性能な線形計算手法,性能予測モデルによる評価,
GPU/メニーコア向け実装
Ø  実問題での利用技術の開発
-  基礎科学・ナノ物質分野での実問題に適用・高度利用技術を開発
新学術領域「コンピューティクスによる物質デザイン:複合相関と非平衡ダイナミクス」
関連プロジェクト:CREST
n  超並列固有値エンジン:z-Pares, EigenExa
•  GPU・MIC向け実装技術
・ポストペタ環境での精度解析
・耐故障性技術
•  ポストペタ環境での
性能予測モデル
•  「京」での検証
2015
エクサへ
ポストペタ環境へ
の移行・性能評価
ポストペタ環境に向けた
実装技術の開発
ポストペタ環境での
性能予測
•  実アプリで求められる問題
京での実装・性能評価
2011
規模での性能評価
•  各種アプリへの適用技術
の開発
•  H25.12 「z-Pares」公開
•  H25.8 「EigenExa」公開
新学術領域「コンピューティクスによる物質デザイン:複合相関と非平衡ダイナミクス」
固有値解析エンジンの開発
n  開発ソフトウェア(疎⾏行行列列向け)
Ø  z-Pares
-  Fortran90, MPI
-  大規模分散並列環境での利用
-  アプリケーションへの組み込みを想定し,Reverse
Communicationインターフェース(RCI)を備える
Ø  CISS
-  C, SLEPc
-  分散並列環境でのアプリケーションに対応した手法の有
効性評価
Ø  SSEIG
-  MATLAB
-  1ノード規模でのアプリケーションに対応した手法の有効
性評価
新学術領域「コンピューティクスによる物質デザイン:複合相関と非平衡ダイナミクス」
CISS (Contour Integral Spectral Slicing) in SLEPc
n  SLEPc:
Scalable Library for Eigenvalue Problem
Computations
新学術領域「コンピューティクスによる物質デザイン:複合相関と非平衡ダイナミクス」
周回積分を用いた固有値解法
Im
n  基本アイディア:有理式に対する周回積分
! "
n
"
1
νi
dz =
νi
2πi Γ i=1 z − λi
Γ
G
λ1
λ2
λ3
λi ∈G
Re
n  行列
A のレゾルベント
(zI − A)
−1
=
n
!
i=1
Pi
,
z − λi
Pi = ui uH
i
λi : 固有値, ui : 固有ベクトル
(ここでは簡単のため A は実対称とし,固有値は相異なるとする)
周回積分によるスペクトル射影
!
"
1
−1
(zI − A) dz =
Pi
2πi Γ
λi ∈G
新学術領域「コンピューティクスによる物質デザイン:複合相関と非平衡ダイナミクス」
周回積分を用いた固有値解法
n  疎行列向け超並列固有値解法
Ø  複素平面上の特定領域内部の固有ベクトル成分を抽出
Ø  周回積分は数値積分で近似
(各積分点では線形方程式を解く)
新学術領域「コンピューティクスによる物質デザイン:複合相関と非平衡ダイナミクス」
階層的なアルゴリズム
n  周回積分を利用
固有値問題
反復復による
部分空間の構成
A B
並列列性能が得にくい
部分空間
従来法
数値積分による
部分空間の構成
S
固有対
周回積分による解法
新学術領域「コンピューティクスによる物質デザイン:複合相関と非平衡ダイナミクス」
階層的なアルゴリズム
n  超並列固有値エンジンの階層性
Ø  ポストペタ環境で想定される階層型ハードウェア構成で、
性能を発揮する階層的アルゴリズム
z-Pares
周回積分に基づき
指定領域内部の固有対を抽出
各積分点での計算は
独立した線形方程式の求解
ハードウェアの階層性
アルゴリズムの階層性に併せて
計算リソースを割り当てる
新学術領域「コンピューティクスによる物質デザイン:複合相関と非平衡ダイナミクス」
固有値数の推定
n  領域内の固有値数の確率的推定
Ø  Γ 内の固有値数:
1
m=
2πi
!
tr(zB − A)−1 B)dz
Γ
Ø  逆行列のトレースを以下のように近似する
L
!
1
tr((zB − A)−1 B) ≈
vlT (zB − A)−1 Bvl
L
l=1
ここでベクトル vl の要素は 1 または -1 を等確率にとる
GEP: Futamura, et al. (2010), NEP: Maeda et al. (2011)
n  Sylvester慣性則による固有値番号の計算
新学術領域「コンピューティクスによる物質デザイン:複合相関と非平衡ダイナミクス」
計算例:RSDFT
n  実空間密度汎関数法(RSDFT,
Iwata et al.)
Ø  シリコンナノワイヤー9,924原子
-  行列サイズ:8,719,488次元,「京」 27,648コア
-  バンドギャップ付近の固有値を計算
Futamura, et al. (2013)
新学術領域「コンピューティクスによる物質デザイン:複合相関と非平衡ダイナミクス」
数値例:RSDFT
}  RSDFT(シリコンナノワイヤ 39,696 原子)
Ø  行列の次元:34,877,952
Ø  区間:[-0.7, 0],約80,000個の固有値がこの区間に存在
Ø  「京」4,800 nodes (38,400 cores)
Eigenvalue Density
Computational time: 7,461 sec
Futamura, et al. (in preparation)
新学術領域「コンピューティクスによる物質デザイン:複合相関と非平衡ダイナミクス」
数値例:CONQUEST
n  CONQUEST
(Miyazaki et al.)
Ø  SS法による固有値計算とシルベスター慣性則による
固有値番号の組み合わせ
Ø  区間 [0, 0.2] 指定した区間内の固有値のみを計算
Ø  対象:
固有値
残差
番号
cDZP DNA+H2O
Ø  行列:15,776次元
Ø  言語:MATLAB
0.036698335
6.40E-11
4823
0.038558045
5.80E-11
4824
0.039932115
5.40E-11
4825
0.040855165
7.60E-11
4826
・・・
・・・
・・・
0.199354252
2.90E-13
5230
0.199492964
7.10E-13
5231
0.199610069
2.60E-13
5232
0.199879801
6.40E-13
5233
新学術領域「コンピューティクスによる物質デザイン:複合相関と非平衡ダイナミクス」
数値例:ELSES
n  ELSES
lculation time [sec]
100
80
60
120
100
80
60
40
20
0
Computation with distributed GPUs
120
fact
solve
SVD
RR
misc
fact
solve
SVD
RR
misc
100
Calculation time [sec]
120
金ナノワイヤー (AuNW) (Hoshi, et al.)
一般化固有値問題:9,180
バンドギャップ近傍の約1%の固有対を計算
GPUによる計算(MAGMA)
Elapsed time [sec.]
Ø 
Ø 
Ø 
Ø 
80
60
40
20
0
1
1
2
2
4
4
# GPU
8
8
Number of GPUs
16
16
(Yano et al.,2013)
新学術領域「コンピューティクスによる物質デザイン:複合相関と非平衡ダイナミクス」
40
数値例:非線形固有値問題
n  リニアコライダ設計:
平方根が現れる
T (z) = K − z 2 M + i
t "
!
z 2 − σj2 Wj ,
j=1
Ø  Cray-XT4 at NERSC @Berkeley
Ø  行列:2,738,556次元
http://www.linearcollider.org/
#cores
256
512
1024
2048
time(sec.)
2513
1273
661
334
speedup
-
1.97
1.93
1.92
(Yamazaki et al., 2013)
新学術領域「コンピューティクスによる物質デザイン:複合相関と非平衡ダイナミクス」
おわりに
n  大規模並列で性能を発揮する解法の開発
Ø  周回積分により固有成分をフィルタリング
Ø  階層構造による高い並列性
n  高性能ソフトウェアの開発
Ø  z-Pares,CISS,SSEIG
n  実アプリケーションへの適用
Ø  RSDFT,CONQUEST,ELSES
n  今後の課題
Ø  さまざまなタイプの内部固有値問題に対応
-  直線上,円弧,リング状領域,et.c
Ø  計算量子科学分野で現れるさまざまな固有値計算への適用
新学術領域「コンピューティクスによる物質デザイン:複合相関と非平衡ダイナミクス」