Skip to content

Commit

Permalink
modify README.m
Browse files Browse the repository at this point in the history
  • Loading branch information
subarutaro committed Aug 6, 2020
1 parent 5f7b996 commit dd3e641
Showing 1 changed file with 2 additions and 4 deletions.
6 changes: 2 additions & 4 deletions README.md
Original file line number Diff line number Diff line change
Expand Up @@ -61,13 +61,11 @@ N体計算カーネルのシングルスレッド性能をアセンブラレベ

| | AVX2 | AVX-512 | ARM SVE |
|----|------|---------|---------|
| Ref| 7.86 |
|----|------|---------|---------|
| PG| 59.4 | 97.0 | N/A |
|PIKG| 66.8 | 108.6 | 34.3 |

性能計測にはFDPSのサンプル「nbody」を利用.
AVX2/AVX-512の計測ではIntel Xeon Gold 6140を,ARM SVEでの計測にはFujitsu A64FXを利用.単位はGflops.n_group_limit(FDPSに渡されるパラメータ.この数までの粒子の相互作用リストを一つにまとめる)は512.
性能計測にはFDPSのサンプル「nbody」を利用.最適化カーネルを用いないリファレンスコードの場合の性能は7.86 Gflops.
リファレス及びAVX2/AVX-512の計測ではIntel Xeon Gold 6140を,ARM SVEでの計測にはFujitsu A64FXを利用.単位はGflops.n_group_limit(FDPSに渡されるパラメータ.この数までの粒子の相互作用リストを一つにまとめる)は512.
ARM SVEに関しては,A64FX向けに専用の最適化オプションやプラグマを利用(詳しくは仕様書を参照).

# TODO
Expand Down

0 comments on commit dd3e641

Please sign in to comment.