| 2 | 1/1 | 返回列表 |
| 查看: 1964 | 回復(fù): 1 | |||
weitong金蟲 (正式寫手)
|
[求助]
作業(yè)管理torque和maui使用問題:error while loading shared libraries: libimf.so
|
|
嘗試組建一個集群,按照網(wǎng)上的安裝過程http://blog.csdn.net/educast/article/details/7168467,安裝了Torque2.5.13和Maui3.3.1,并且參考了南開大學(xué)張鋆的集群構(gòu)建教程,安了了mpiexec 0.84替代pbs_sched. 在主機(jī)root下將pbs_server,pbs_mom,maui都正常啟動了,子節(jié)點上pbs_mon也正常啟動了。 pbsnodes可以看到各個節(jié)點的情況。 但是測試一個任務(wù)時$ qsub submit.pbs, terminal下沒有出錯信息,但是result文件是空的。查看了first_task.o0,發(fā)現(xiàn)里面有出錯信息 /usr/local/sbin/pbs_iff: error while loading shared libraries: libimf.so: cannot open shared object file: No such file or directory mpiexec: Error: get_hosts: pbs_connect: Unauthorized Request . 查找libimf.so,發(fā)現(xiàn)在/opt/intel/composer_xe_2013.3.163/compiler/lib/intel64,/opt/intel/composer_xe_2013.3.163/compiler/lib/ia32,/opt/intel/composer_xe_2013.3.163/compiler/lib/mic里面都有,嘗試將他們都在/etc/profile和/etc/bashrc里面添到到LD_LIBRARY_PATH,并且source了一下。但是仍然沒決決問題。 其實這 個libimf.so找到到,還發(fā)生在$sudo /etc/init.d/pbs_server start時。只有在su登錄后,才能正常啟動。 [root@magnetics weitong]# /etc/init.d/pbs_server start /var/spool/torque/server_priv/serverdb Starting TORQUE Server: [確定] [weitong@magnetics ~]$ sudo /etc/init.d/pbs_server start [sudo] password for weitong: /var/spool/torque/server_priv/serverdb Starting TORQUE Server: /usr/local/sbin/pbs_server: error while loading shared libraries: libimf.so: cannot open shared object file: No such file or directory [失敗] *附***submit.pbs***** #!/bin/sh #PBS -l nodes=mag02:ppn=8+magnetics:ppn=8 (使用mag02上8個CPU和magnetics上8個CPU) #PBS -q batch #PBS -j oe #PBS -N first_task (任務(wù)名字,隨便取) cd /home/weitong /usr/local/mpitorque/bin/mpiexec ./Work/Computing/hellocluster > result |
金蟲 (正式寫手)
|
問題解決,根本原因是計算節(jié)點slave上的so文件路徑不全,要修改補充計算節(jié)點上/etc/ld.so.conf,以及/etc/ld.so.conf.d/里面的conf文件。 附上解決過程: 主機(jī)上: [root@magnetics ld.so.conf.d]# scp torque.conf mag02:/etc/ld.so.conf.d/ 在計算節(jié)點mag02機(jī)子上: [weitong@mag02 etc]$ sudo /sbin/ldconfig /etc/ld.so.conf (新新so路徑) 在主機(jī)上: [weitong@magnetics Computing]$ qsub submit.pbs 61.magnetics 出現(xiàn)新的錯誤first_task.o61, 說明上面通過conf文件添加so路徑的方法奏效了。 /usr/local/sbin/pbs_iff: error while loading shared libraries: libtorque.so.2: cannot open shared object file: No such file or directory mpiexec: Error: get_hosts: pbs_connect: Unauthorized Request . 查找發(fā)現(xiàn)libtorque.so.2在/usr/local/lib里面 在計算節(jié)點mag02機(jī)子上: [weitong@mag02 etc]$ sudo vim ld.so.conf,加入/usr/local/lib include ld.so.conf.d/*.conf /usr/local/lib 主上上: [root@magnetics ld.so.conf.d]# scp mpitorque.conf mag02:/etc/ld.so.conf.d/ 在計算節(jié)點mag02機(jī)子上: [weitong@mag02 etc]$ sudo /sbin/ldconfig /etc/ld.so.conf *************Done,解決問題。原來要將找不到的so文件路徑加入到conf文件中。 ************* |
| 2 | 1/1 | 返回列表 |
| 最具人氣熱帖推薦 [查看全部] | 作者 | 回/看 | 最后發(fā)表 | |
|---|---|---|---|---|
|
[有機(jī)交流]
高溫高壓反應(yīng)求助
10+4
|
chibby 2026-03-25 | 4/200 |
|
|---|---|---|---|---|
|
[考研] 求調(diào)劑推薦 材料 304 +14 | 荷包蛋hyj 2026-03-26 | 14/700 |
|
|
[考研] 一志愿哈爾濱工業(yè)大學(xué)材料與化工方向336分 +4 | 辰沐5211314 2026-03-26 | 4/200 |
|
|
[考研] 308求調(diào)劑 +6 | 墨墨漠 2026-03-27 | 6/300 |
|
|
[考研] 08開頭275求調(diào)劑 +4 | 拉誰不重要 2026-03-26 | 4/200 |
|
|
[考研] 085600材料與化工306 +10 | z1z2z3879 2026-03-21 | 11/550 |
|
|
[考研] 考研調(diào)劑 +9 | 小蠟新筆 2026-03-26 | 9/450 |
|
|
[考研] 材料求調(diào)劑 +5 | .m.. 2026-03-25 | 5/250 |
|
|
[考研] 081200-11408-276學(xué)碩求調(diào)劑 +3 | 崔wj 2026-03-26 | 3/150 |
|
|
[考研] 343求調(diào)劑 +4 | 贈我一本書 2026-03-23 | 4/200 |
|
|
[考研] 349求調(diào)劑 +4 | 李木子啊哈哈 2026-03-25 | 4/200 |
|
|
[考研] 324求調(diào)劑 +4 | wysyjs25 2026-03-21 | 4/200 |
|
|
[考研] 一志愿北京化工大學(xué)材料與化工(085600)296求調(diào)劑 +9 | 稻妻小編 2026-03-26 | 9/450 |
|
|
[考研] 尋找調(diào)劑 +5 | 倔強(qiáng)芒? 2026-03-21 | 8/400 |
|
|
[考研] 考研調(diào)劑 +6 | 來好運來來來 2026-03-21 | 7/350 |
|
|
[考研] 285求調(diào)劑 +3 | AZMK 2026-03-24 | 3/150 |
|
|
[考研] 求調(diào)劑一志愿武漢理工大學(xué)材料工程(085601) +5 | WW.' 2026-03-23 | 7/350 |
|
|
[考研] 一志愿國科過程所081700,274求調(diào)劑 +3 | 三水研0水立方 2026-03-23 | 3/150 |
|
|
[考研] 接收2026碩士調(diào)劑(學(xué)碩+專碩) +4 | allen-yin 2026-03-23 | 6/300 |
|
|
[考研] 330求調(diào)劑0854 +3 | assdll 2026-03-21 | 3/150 |
|