| 2 | 1/1 | 返回列表 |
| 查看: 628 | 回復(fù): 1 | ||
| 本帖產(chǎn)生 1 個(gè) 1ST強(qiáng)帖 ,點(diǎn)擊這里進(jìn)行查看 | ||
[求助]
Parallel options設(shè)置求助
|
||
|
siesta-3.1 Parallel options cpu:i7 2600 4核 看了手冊(cè)上關(guān)于BlockSize 和 ProcessorY的說(shuō)明,請(qǐng)問(wèn)這兩項(xiàng)應(yīng)該怎么設(shè)置啊? 我用的默認(rèn)設(shè)置,計(jì)算時(shí)輸出文件顯示 這兩項(xiàng)分別是24 和 2 如果自己指定應(yīng)該設(shè)為什么? 此外 編譯設(shè)定 single precision 和 double precision 哪個(gè)計(jì)算更快? |

木蟲 (著名寫手)
|
我所了解的siesta的并行有三個(gè)地方: 1.是基函數(shù)的并行 2.是grid的并行 3.是k點(diǎn)的并行 首先說(shuō)說(shuō)第3中,這種并行效率非常高,但是前提是k點(diǎn)的數(shù)目比起所用的核數(shù)要多的多,這種情況一般出現(xiàn)在對(duì)于金屬體系的計(jì)算上:體系比較小,因此基函數(shù)比較少,而要想得到比較好的結(jié)果,需要的k點(diǎn)數(shù)目非常多,所以這個(gè)時(shí)候k點(diǎn)一般來(lái)說(shuō)是比核數(shù)多的多(起碼比起基函數(shù)相對(duì)于核數(shù)來(lái)說(shuō)要多的多),這種情況下,建議用Diag.ParallelOverK T. 但是采用了這個(gè)選項(xiàng)不是說(shuō)所有的地方都是采用k點(diǎn)并行了,如果涉及到計(jì)算“能帶”,“體系的波函數(shù)”這些計(jì)算的時(shí)候,程序還是采用的是對(duì)于軌道的并行。如果你的體系設(shè)置了NonCollinearSpin T,那么也不能使用這個(gè)選項(xiàng)。 從上面來(lái)看,用戶碰到的大多數(shù)的計(jì)算的并行應(yīng)該是在(1)基函數(shù)的并行框架下。 基函數(shù)的并行下,需要確定每一個(gè)核上面分得的基函數(shù)的數(shù)目,這個(gè)量是由BlockSize控制的。程序會(huì)將計(jì)算中用到的基函數(shù)的數(shù)目按照BlockSize的數(shù)目依次打包,并且輪回地發(fā)送到各個(gè)核上去計(jì)算。如果這個(gè)數(shù)目太小,那么這個(gè)分發(fā)將會(huì)很頻繁,大家之后,在并行計(jì)算的時(shí)候,如果每次分給核的任務(wù)太少,那么這個(gè)分發(fā)任務(wù)的時(shí)間就顯得很大,這個(gè)就降低了計(jì)算效率。但是如果每次給核分配的任務(wù)太多,對(duì)于依賴于基函數(shù)的計(jì)算來(lái)說(shuō),計(jì)算量的大小并不是嚴(yán)格與基函數(shù)的數(shù)目成正比。所以會(huì)出現(xiàn)雖然基函數(shù)的數(shù)目每一個(gè)核上一樣多,但是計(jì)算量卻相差很大,這也出現(xiàn)了負(fù)載不均衡,造成并行效率不高。因此這個(gè)數(shù)目需要合適的選擇。如果輸入文件中沒(méi)有設(shè)置該選項(xiàng)的話,程序?qū)τ谶@個(gè)參數(shù)會(huì)做一個(gè)選擇: 如果基函數(shù)數(shù)目>24*np,那么BlockSize為24, 如果基函數(shù)數(shù)目<=24*np,那么BlockSize=(基函數(shù)數(shù)目-1)/np+1 其中np表示核的數(shù)目。 同時(shí),有些數(shù)據(jù)是grid類型的,也就是說(shuō)是空間格點(diǎn)的文件。對(duì)于這些數(shù)據(jù)的計(jì)算,并行是針對(duì)格點(diǎn)并行的,因?yàn)槊恳粋(gè)格點(diǎn)上面的數(shù)據(jù)會(huì)和每一個(gè)基函數(shù)相關(guān)。程序會(huì)把整個(gè)體系的大小按照LatticeVectors的形狀和大小以及Meshcutoff的值來(lái)沿著三個(gè)晶包矢量對(duì)體系打網(wǎng)格。而格點(diǎn)對(duì)于各個(gè)核的分配是在Y和Z方向的劃分。所以將核的數(shù)目也做成一個(gè)2D的網(wǎng)格,要求ProcessorY能夠被核數(shù)整除因?yàn)镻rocessorZ的值由np/ProcessorY得到。具體的再怎么將grid格點(diǎn)分配到各個(gè)節(jié)點(diǎn),這個(gè)我還不懂。你可以看看程序。對(duì)于ProcessorY的尋找,程序也會(huì)自動(dòng)給出一個(gè)值,但是只對(duì)np是2或3或5的倍數(shù)的np起作用,否則ProcessorY=1。 對(duì)于這兩個(gè)參數(shù),我都是讓程序自動(dòng)給出。這個(gè)參數(shù)不同的任務(wù)應(yīng)該是不同的。如果想找最優(yōu)值的話,估計(jì)任務(wù)都算出來(lái)好幾遍了。 上面僅僅是個(gè)人的理解,如有理解不對(duì)的地方,請(qǐng)專家指教. [ Last edited by fzx2008 on 2012-5-4 at 20:59 ] |

| 2 | 1/1 | 返回列表 |
| 最具人氣熱帖推薦 [查看全部] | 作者 | 回/看 | 最后發(fā)表 | |
|---|---|---|---|---|
|
[考研]
|
孅華 2026-03-22 | 4/200 |
|
|---|---|---|---|---|
|
[考研] 350求調(diào)劑 +6 | weudhdk 2026-03-19 | 6/300 |
|
|
[考研] 276求調(diào)劑。有半年電池和半年高分子實(shí)習(xí)經(jīng)歷 +8 | 材料學(xué)257求調(diào)劑 2026-03-23 | 9/450 |
|
|
[考研] 263求調(diào)劑 +6 | yqdszhdap- 2026-03-22 | 9/450 |
|
|
[考研] 北科281學(xué)碩材料求調(diào)劑 +8 | tcxiaoxx 2026-03-20 | 9/450 |
|
|
[考研]
求調(diào)劑材料學(xué)碩080500,總分289分
5+3
|
@taotao 2026-03-19 | 21/1050 |
|
|
[考研] 324求調(diào)劑 +6 | lucky呀呀呀鴨 2026-03-20 | 6/300 |
|
|
[考研] 生物學(xué)調(diào)劑 +5 | Surekei 2026-03-21 | 5/250 |
|
|
[基金申請(qǐng)] 山東省面上項(xiàng)目限額評(píng)審 +4 | 石瑞0426 2026-03-19 | 4/200 |
|
|
[考研] 材料學(xué)碩301分求調(diào)劑 +7 | Liyouyumairs 2026-03-21 | 7/350 |
|
|
[考研] 求調(diào)劑 +4 | 要好好無(wú)聊 2026-03-21 | 4/200 |
|
|
[考研] 268求調(diào)劑 +9 | 簡(jiǎn)單點(diǎn)0 2026-03-17 | 9/450 |
|
|
[考研] 265求調(diào)劑 +3 | Jack?k?y 2026-03-17 | 3/150 |
|
|
[考研] 303求調(diào)劑 +5 | 睿08 2026-03-17 | 7/350 |
|
|
[考研] 294求調(diào)劑材料與化工專碩 +15 | 陌の森林 2026-03-18 | 15/750 |
|
|
[考研] 一志愿 西北大學(xué) ,070300化學(xué)學(xué)碩,總分287,雙非一本,求調(diào)劑。 +4 | 晨昏線與星海 2026-03-19 | 4/200 |
|
|
[考研] 一志愿蘇州大學(xué)材料求調(diào)劑,總分315(英一) +5 | sbdksD 2026-03-19 | 5/250 |
|
|
[考研] 求調(diào)劑一志愿南京航空航天大學(xué)289分 +3 | @taotao 2026-03-19 | 3/150 |
|
|
[考研] 295材料求調(diào)劑,一志愿武漢理工085601專碩 +5 | Charlieyq 2026-03-19 | 5/250 |
|
|
[考博] 26博士申請(qǐng) +3 | 1042136743 2026-03-17 | 3/150 |
|