| 6 | 1/1 | 返回列表 |
| 查看: 1736 | 回復(fù): 5 | ||
沐心精靈木蟲 (正式寫手)
|
[求助]
求助:Rocks 6.1集群搭建不能跨節(jié)點(diǎn)并行 已有2人參與
|
|
有沒有大神知道用Rocks 6.1搭建集群時不能跨節(jié)點(diǎn)并行的原因啊? 集群由4臺服務(wù)器組成,其中一個為前端節(jié)點(diǎn),剩下的為計算節(jié)點(diǎn)。安裝按照Rocks 6.1手冊,并結(jié)合網(wǎng)上的一些教程,鏡像全部為Rocks官方的。安裝完前端節(jié)點(diǎn)和計算節(jié)點(diǎn)后,在、share/apps目錄下安裝了OpenMP(不用自帶的)和intel Fortran,并設(shè)置環(huán)境變量等,同步到計算節(jié)點(diǎn),并source環(huán)境變量。 按照上面的安裝,CFD程序(自己的,包括CFL3D)可以編譯,由SGE可提交至計算節(jié)點(diǎn)正常并行計算。但是問題是,當(dāng)并行線程數(shù)超過某個計算節(jié)點(diǎn)的總線程數(shù)時,qstat給的結(jié)果是分配到兩臺節(jié)點(diǎn)上,但是到分配的節(jié)點(diǎn)top時發(fā)現(xiàn),其實(shí)只在一個節(jié)點(diǎn)上并行而已。 例如,用64個線程運(yùn)行程序,用命令qsub -pe mpich 64 RUN_Script在前端節(jié)點(diǎn)提交,剛好分配到了兩臺計算節(jié)點(diǎn)(總線程數(shù)分別為24和40),如下所示: [user01@cluster src]$ qstat -f queuename qtype resv/used/tot. load_avg arch states --------------------------------------------------------------------------------- all.q@compute-0-15.local BIP 0/40/40 0.00 linux-x64 129 0.55500 RUN_Script user01 r 02/14/2014 09:28:38 40 --------------------------------------------------------------------------------- all.q@compute-0-4.local BIP 0/24/24 0.07 linux-x64 129 0.55500 RUN_Script user01 r 02/14/2014 09:28:38 24 但是ssh到compute-0-15和compute-0-4上top看時,只有一個節(jié)點(diǎn)上有程序運(yùn)行。我的任務(wù)腳本文件 RUN_Script內(nèi)容如下: #!/bin/bash # #$ -cwd #$ -j y #$ -S /bin/bash # mpirun -machinefile $TMPDIR/machines -np $NSLOTS \ /home/user01/AxisJet/src/JET 集群內(nèi)的計算節(jié)點(diǎn)和前端節(jié)點(diǎn)可以無密碼ssh登錄。搞了幾天,實(shí)在是不知道問題何在!求蟲友們指點(diǎn)啊,問題能解決,再追加賞幣! |
鐵桿木蟲 (正式寫手)
木蟲 (正式寫手)
鐵桿木蟲 (正式寫手)
金蟲 (初入文壇)
| 6 | 1/1 | 返回列表 |
| 最具人氣熱帖推薦 [查看全部] | 作者 | 回/看 | 最后發(fā)表 | |
|---|---|---|---|---|
|
[考研] 07化學(xué)280分求調(diào)劑 +4 | 722865 2026-03-23 | 4/200 |
|
|---|---|---|---|---|
|
[考研] 279分求調(diào)劑 一志愿211 +17 | chaojifeixia 2026-03-19 | 19/950 |
|
|
[考研] 361求調(diào)劑 +3 | Glack 2026-03-22 | 3/150 |
|
|
[考研] 一志愿重慶大學(xué)085700資源與環(huán)境,總分308求調(diào)劑 +7 | 墨墨漠 2026-03-23 | 8/400 |
|
|
[考研] 0703化學(xué)求調(diào)劑 +4 | 奶油草莓. 2026-03-22 | 5/250 |
|
|
[考研] 一志愿陜師大生物學(xué)071000,298分,求調(diào)劑 +3 | SYA! 2026-03-23 | 3/150 |
|
|
[考研] 336求調(diào)劑 +4 | 收到VS 2026-03-20 | 4/200 |
|
|
[考研] 316求調(diào)劑 +7 | 梁茜雯 2026-03-19 | 7/350 |
|
|
[考研] 350求調(diào)劑 +6 | weudhdk 2026-03-19 | 6/300 |
|
|
[考研] 263求調(diào)劑 +6 | yqdszhdap- 2026-03-22 | 9/450 |
|
|
[考研] 298求調(diào)劑 +8 | 上岸6666@ 2026-03-20 | 8/400 |
|
|
[考研] 求調(diào)劑院校信息 +6 | CX 330 2026-03-21 | 6/300 |
|
|
[考研] 求調(diào)劑 +3 | 13341 2026-03-20 | 3/150 |
|
|
[考研] 0805材料320求調(diào)劑 +3 | 深海物語 2026-03-20 | 3/150 |
|
|
[考研] 265求調(diào)劑 +12 | 梁梁校校 2026-03-19 | 14/700 |
|
|
[考研] 求調(diào)劑 +3 | Ma_xt 2026-03-17 | 3/150 |
|
|
[考研] 290求調(diào)劑 +7 | ^O^乜 2026-03-19 | 7/350 |
|
|
[考研] 求調(diào)劑 +3 | @taotao 2026-03-20 | 3/150 |
|
|
[論文投稿]
申請回稿延期一個月,編輯同意了。但系統(tǒng)上的時間沒變,給編輯又寫郵件了,沒回復(fù)
10+3
|
wangf9518 2026-03-17 | 4/200 |
|
|
[考研] 085600材料與化工求調(diào)劑 +6 | 緒幸與子 2026-03-17 | 6/300 |
|