コンテナベンチマーク - kojetteの研磨日記

いくつかのコンテナについて、アクセス時間を測定した。
$92^4$ 要素の頭から尻尾まで異なる値を代入するのにかかった時間を64回計測し、中央値を採用。
Ubuntu 10.04 (LTS) 64bit, Core i7-960, g++ 4.4.3, -O3

さすがに1変数で回すのが最も速い。4変数で回す場合、自前のアドレス計算でもmulti_array任せでも同じ。forループはi,j,k,lの順に回している。アクセスがメモリ上連続になるようにforループを組んでおかないと、かなり性能が落ちているのが分かる。

ちなみに最適化無しだと A.data()[raw] が0.87秒、A[i][j][k][l]が12秒。

	秒
A[i].data()[j]	0.725252
A[i][j][k][l]	1.0169

multi_arrayをvectorでくるむと、少し遅い。それぞれ、1.24倍と1.48倍。

valarrayとvectorは似たようなもの。

…multi_array.data()[raw]が一番速いのはなんでだろ