| 24小時(shí)熱門(mén)版塊排行榜 |
| 3 | 1/1 | 返回列表 |
| 查看: 2803 | 回復(fù): 2 | ||
| 【獎(jiǎng)勵(lì)】 本帖被評(píng)價(jià)1次,作者onesupeng增加金幣 0.8 個(gè) | ||
onesupeng金蟲(chóng) (職業(yè)作家)
|
[資源]
【原創(chuàng)】并行平臺(tái)構(gòu)建與管理[8]:并行測(cè)試 GotoBLAS+hpl測(cè)試之L.dat各行意義及其設(shè)置
|
|
|
HPL.dat文件見(jiàn)附件 下面說(shuō)說(shuō)每行的意思和設(shè)置方法 1、2行,這個(gè)是說(shuō)明性語(yǔ)句,不用更改。 3、4行,指定輸出方式,加入4行選擇file輸出,則3表示輸出文件名,這個(gè)名字可以根據(jù)你自己的習(xí)慣更改。比如,你測(cè)試16節(jié)點(diǎn),為了區(qū)分其他測(cè)試,可以改為16nodes.out等等。 5、6行,5行相當(dāng)于說(shuō)你要測(cè)試的矩陣個(gè)數(shù),第6行則是矩陣規(guī)模,第六行設(shè)置的數(shù)字必須不小于5行的大小。第6行的設(shè)置原則是:N^2*64=節(jié)點(diǎn)內(nèi)存*節(jié)點(diǎn)數(shù)*8,N=0.8~0.9N。舉個(gè)例子,我每節(jié)點(diǎn)有2G內(nèi)存,4節(jié)點(diǎn),N的算法為:N^2*64=1024*1024*1024*2*4*8,-〉N=32000~33000,再*0.8~0.9即可。按照經(jīng)驗(yàn),在0.9左右效果會(huì)更好。 7、8行設(shè)置矩陣分塊方法。第7行是指分塊方法的種數(shù),第八行是指分塊的大小,根據(jù)經(jīng)驗(yàn),對(duì)于GotoBLAS在AMD4000+上,用196,232,256效果比較好,當(dāng)然其他也有一些說(shuō)法,不過(guò)本人覺(jué)得經(jīng)驗(yàn)性比較強(qiáng),所以多試試總會(huì)有很好的結(jié)論。 9行是HPL 1.0a的新增項(xiàng),是選擇處理器陣列是按列的排列方式還是按行的排列方式。 10~12行說(shuō)明二維處理器網(wǎng)格(P×Q)。二維處理器網(wǎng)格(P×Q)的要遵循以下幾個(gè)要求:P×Q=進(jìn)程數(shù)。這是HPL的硬性規(guī)定;P×Q=系統(tǒng)CPU數(shù)=進(jìn)程數(shù)。一般來(lái)說(shuō)一個(gè)進(jìn)程對(duì)于一個(gè)CPU可以得到最佳性能。對(duì)于Intel Xeon來(lái)說(shuō),關(guān)閉超線程可以提高HPL性能;P≤Q,這是一個(gè)測(cè)試經(jīng)驗(yàn)值,一般來(lái)說(shuō),P的值盡量取得小一點(diǎn),因?yàn)榱邢蛲ㄐ帕浚ㄍㄐ糯螖?shù)和通信數(shù)據(jù)量)要遠(yuǎn)大于橫向通信.等等這些,需要測(cè)試者多摸索。 后面的可以不用修改。 13行說(shuō)明閾值。 第14~21行指明L分解的方式。 附件: HPLinpack benchmark input file Innovative Computing Laboratory, University of Tennessee HPL.out output file name (if any) 6 device out (6=stdout,7=stderr,file) 4 # of problems sizes (N) 10000 10000 10000 10000 Ns 4 # of NBs 1 2 3 4 NBs 0 PMAP process mapping (0=Row-,1=Column-major) 3 # of process grids (P x Q) 1 1 1 Ps 1 1 1 Qs 16.0 threshold 3 # of panel fact 0 1 2 PFACTs (0=left, 1=Crout, 2=Right) 2 # of recursive stopping criterium 2 4 NBMINs (>= 1) 1 # of panels in recursion 2 NDIVs 3 # of recursive panel fact. 0 1 2 RFACTs (0=left, 1=Crout, 2=Right) 1 # of broadcast 0 BCASTs (0=1rg,1=1rM,2=2rg,3=2rM,4=Lng,5=LnM) 1 # of lookahead depth 0 DEPTHs (>=0) 2 SWAP (0=bin-exch,1=long,2=mix) 64 swapping threshold 0 L1 in (0=transposed,1=no-transposed) form 0 U in (0=transposed,1=no-transposed) form 1 Equilibration (0=no,1=yes) 8 memory alignment in double (> 0) |
木蟲(chóng) (著名寫(xiě)手)
金蟲(chóng) (職業(yè)作家)
| 3 | 1/1 | 返回列表 |
| 最具人氣熱帖推薦 [查看全部] | 作者 | 回/看 | 最后發(fā)表 | |
|---|---|---|---|---|
|
[考研]
|
Gymno 2026-03-30 | 5/250 |
|
|---|---|---|---|---|
|
[考研] 一志愿鄭大材料工程290求調(diào)劑 +12 | Youth_ 2026-03-30 | 12/600 |
|
|
[考研] 生物考研337分求調(diào)劑 +3 | cgxin 2026-03-30 | 4/200 |
|
|
[考研] 哈爾濱工業(yè)大學(xué)材料與化工專碩378求調(diào)劑 +3 | 塔比烏斯 2026-03-30 | 3/150 |
|
|
[考研] 材料化工340求調(diào)劑 +3 | jhx777 2026-03-30 | 3/150 |
|
|
[考研] 化學(xué)308分調(diào)劑 +7 | 你好明天你好 2026-03-30 | 8/400 |
|
|
[考研] 085602 化學(xué)工程專碩 340分求調(diào)劑 +4 | qianbai11 2026-03-29 | 4/200 |
|
|
[考研] 375求調(diào)劑 +6 | 雨夏整夜 2026-03-29 | 6/300 |
|
|
[考研] 327求調(diào)劑 +6 | 汲亦昊 2026-03-29 | 6/300 |
|
|
[考研] 330分求調(diào)劑 +5 | qzenlc 2026-03-29 | 5/250 |
|
|
[考研] 一志愿太原理工安全工程300分,求調(diào)劑 +5 | 0857求調(diào)劑. 2026-03-24 | 6/300 |
|
|
[考研] 304求調(diào)劑 +6 | 曼殊2266 2026-03-27 | 6/300 |
|
|
[考研] 322求調(diào)劑 +5 | 舊吢 2026-03-24 | 5/250 |
|
|
[考研] 070300求調(diào)劑306分 +4 | 26要上岸 2026-03-27 | 4/200 |
|
|
[考研] 081200-314 +3 | LILIQQ 2026-03-27 | 4/200 |
|
|
[考研] 復(fù)試調(diào)劑,一志愿南農(nóng)083200食品科學(xué)與工程 +5 | XQTJZ 2026-03-26 | 5/250 |
|
|
[考研] 一志愿鄭大085600,310分求調(diào)劑 +5 | 李瀟可 2026-03-26 | 5/250 |
|
|
[考研] 調(diào)劑 +4 | 柚柚yoyo 2026-03-26 | 4/200 |
|
|
[考研] 考研一志愿蘇州大學(xué)初始315(英一)求調(diào)劑 +3 | sbdksD 2026-03-24 | 4/200 |
|
|
[考研] 調(diào)劑 +4 | 13853210211 2026-03-24 | 4/200 |
|