| 3 | 1/1 | 返回列表 |
| 查看: 2804 | 回復(fù): 2 | ||
| 【獎勵】 本帖被評價1次,作者onesupeng增加金幣 0.8 個 | ||
onesupeng金蟲 (職業(yè)作家)
|
[資源]
【原創(chuàng)】并行平臺構(gòu)建與管理[8]:并行測試 GotoBLAS+hpl測試之L.dat各行意義及其設(shè)置
|
|
|
HPL.dat文件見附件 下面說說每行的意思和設(shè)置方法 1、2行,這個是說明性語句,不用更改。 3、4行,指定輸出方式,加入4行選擇file輸出,則3表示輸出文件名,這個名字可以根據(jù)你自己的習(xí)慣更改。比如,你測試16節(jié)點,為了區(qū)分其他測試,可以改為16nodes.out等等。 5、6行,5行相當(dāng)于說你要測試的矩陣個數(shù),第6行則是矩陣規(guī)模,第六行設(shè)置的數(shù)字必須不小于5行的大小。第6行的設(shè)置原則是:N^2*64=節(jié)點內(nèi)存*節(jié)點數(shù)*8,N=0.8~0.9N。舉個例子,我每節(jié)點有2G內(nèi)存,4節(jié)點,N的算法為:N^2*64=1024*1024*1024*2*4*8,-〉N=32000~33000,再*0.8~0.9即可。按照經(jīng)驗,在0.9左右效果會更好。 7、8行設(shè)置矩陣分塊方法。第7行是指分塊方法的種數(shù),第八行是指分塊的大小,根據(jù)經(jīng)驗,對于GotoBLAS在AMD4000+上,用196,232,256效果比較好,當(dāng)然其他也有一些說法,不過本人覺得經(jīng)驗性比較強,所以多試試總會有很好的結(jié)論。 9行是HPL 1.0a的新增項,是選擇處理器陣列是按列的排列方式還是按行的排列方式。 10~12行說明二維處理器網(wǎng)格(P×Q)。二維處理器網(wǎng)格(P×Q)的要遵循以下幾個要求:P×Q=進程數(shù)。這是HPL的硬性規(guī)定;P×Q=系統(tǒng)CPU數(shù)=進程數(shù)。一般來說一個進程對于一個CPU可以得到最佳性能。對于Intel Xeon來說,關(guān)閉超線程可以提高HPL性能;P≤Q,這是一個測試經(jīng)驗值,一般來說,P的值盡量取得小一點,因為列向通信量(通信次數(shù)和通信數(shù)據(jù)量)要遠大于橫向通信.等等這些,需要測試者多摸索。 后面的可以不用修改。 13行說明閾值。 第14~21行指明L分解的方式。 附件: HPLinpack benchmark input file Innovative Computing Laboratory, University of Tennessee HPL.out output file name (if any) 6 device out (6=stdout,7=stderr,file) 4 # of problems sizes (N) 10000 10000 10000 10000 Ns 4 # of NBs 1 2 3 4 NBs 0 PMAP process mapping (0=Row-,1=Column-major) 3 # of process grids (P x Q) 1 1 1 Ps 1 1 1 Qs 16.0 threshold 3 # of panel fact 0 1 2 PFACTs (0=left, 1=Crout, 2=Right) 2 # of recursive stopping criterium 2 4 NBMINs (>= 1) 1 # of panels in recursion 2 NDIVs 3 # of recursive panel fact. 0 1 2 RFACTs (0=left, 1=Crout, 2=Right) 1 # of broadcast 0 BCASTs (0=1rg,1=1rM,2=2rg,3=2rM,4=Lng,5=LnM) 1 # of lookahead depth 0 DEPTHs (>=0) 2 SWAP (0=bin-exch,1=long,2=mix) 64 swapping threshold 0 L1 in (0=transposed,1=no-transposed) form 0 U in (0=transposed,1=no-transposed) form 1 Equilibration (0=no,1=yes) 8 memory alignment in double (> 0) |
金蟲 (職業(yè)作家)
| 3 | 1/1 | 返回列表 |
| 最具人氣熱帖推薦 [查看全部] | 作者 | 回/看 | 最后發(fā)表 | |
|---|---|---|---|---|
|
[考研] 070300化學(xué)279求調(diào)劑 +5 | 哈哈哈^_^ 2026-03-31 | 7/350 |
|
|---|---|---|---|---|
|
[考研]
|
Gymno 2026-03-30 | 6/300 |
|
|
[考研] 本科211總分289,08工學(xué)真心求調(diào)劑 +3 | utopiaE 2026-03-30 | 3/150 |
|
|
[考研] 抱歉 +4 | 田洪有 2026-03-30 | 4/200 |
|
|
[考研] 367求調(diào)劑 +5 | 芋泥啵! 2026-03-28 | 5/250 |
|
|
[考研] 各位老師好,我的一志愿為北京科技大學(xué)085601材料專碩 +10 | Koxui 2026-03-28 | 10/500 |
|
|
[考研] 求調(diào)劑 +10 | 家佳佳佳佳佳 2026-03-29 | 10/500 |
|
|
[考研] 286求調(diào)劑 +5 | Faune 2026-03-30 | 5/250 |
|
|
[考研] 化學(xué)0703 調(diào)劑 306分 一志愿211 +8 | 26要上岸 2026-03-28 | 8/400 |
|
|
[考研] 317求調(diào)劑 +10 | 蛋黃咸肉粽 2026-03-26 | 10/500 |
|
|
[考研] 求調(diào)劑 +4 | QiMing7 2026-03-25 | 5/250 |
|
|
[考研] 327求調(diào)劑 +6 | 汲亦昊 2026-03-29 | 6/300 |
|
|
[碩博家園] 招收生物學(xué)/細胞生物學(xué)調(diào)劑 +4 | IceGuo 2026-03-26 | 5/250 |
|
|
[考研] 071000生物學(xué)求調(diào)劑,初試成績343 +7 | 小小甜面團 2026-03-25 | 7/350 |
|
|
[考研] 320分,材料與化工專業(yè),求調(diào)劑 +9 | 一定上岸aaa 2026-03-27 | 13/650 |
|
|
[考研] 299求調(diào)劑 +7 | 嗯嗯嗯嗯2 2026-03-27 | 7/350 |
|
|
[考研] 266分,求材料冶金能源化工等調(diào)劑 +7 | 哇呼哼呼哼 2026-03-27 | 9/450 |
|
|
[考研] 081200-11408-276學(xué)碩求調(diào)劑 +4 | 崔wj 2026-03-26 | 4/200 |
|
|
[考研] 總分322求生物學(xué)/生化與分子/生物信息學(xué)相關(guān)調(diào)劑 +5 | 星沉uu 2026-03-26 | 6/300 |
|
|
[考研] 網(wǎng)絡(luò)空間安全0839招調(diào)劑 +4 | w320357296 2026-03-25 | 6/300 |
|