| 2 | 1/1 | 返回列表 |
| 查看: 1963 | 回復(fù): 1 | ||
weitong金蟲 (正式寫手)
|
[求助]
作業(yè)管理torque和maui使用問題:error while loading shared libraries: libimf.so
|
|
嘗試組建一個集群,按照網(wǎng)上的安裝過程http://blog.csdn.net/educast/article/details/7168467,安裝了Torque2.5.13和Maui3.3.1,并且參考了南開大學(xué)張鋆的集群構(gòu)建教程,安了了mpiexec 0.84替代pbs_sched. 在主機root下將pbs_server,pbs_mom,maui都正常啟動了,子節(jié)點上pbs_mon也正常啟動了。 pbsnodes可以看到各個節(jié)點的情況。 但是測試一個任務(wù)時$ qsub submit.pbs, terminal下沒有出錯信息,但是result文件是空的。查看了first_task.o0,發(fā)現(xiàn)里面有出錯信息 /usr/local/sbin/pbs_iff: error while loading shared libraries: libimf.so: cannot open shared object file: No such file or directory mpiexec: Error: get_hosts: pbs_connect: Unauthorized Request . 查找libimf.so,發(fā)現(xiàn)在/opt/intel/composer_xe_2013.3.163/compiler/lib/intel64,/opt/intel/composer_xe_2013.3.163/compiler/lib/ia32,/opt/intel/composer_xe_2013.3.163/compiler/lib/mic里面都有,嘗試將他們都在/etc/profile和/etc/bashrc里面添到到LD_LIBRARY_PATH,并且source了一下。但是仍然沒決決問題。 其實這 個libimf.so找到到,還發(fā)生在$sudo /etc/init.d/pbs_server start時。只有在su登錄后,才能正常啟動。 [root@magnetics weitong]# /etc/init.d/pbs_server start /var/spool/torque/server_priv/serverdb Starting TORQUE Server: [確定] [weitong@magnetics ~]$ sudo /etc/init.d/pbs_server start [sudo] password for weitong: /var/spool/torque/server_priv/serverdb Starting TORQUE Server: /usr/local/sbin/pbs_server: error while loading shared libraries: libimf.so: cannot open shared object file: No such file or directory [失敗] *附***submit.pbs***** #!/bin/sh #PBS -l nodes=mag02:ppn=8+magnetics:ppn=8 (使用mag02上8個CPU和magnetics上8個CPU) #PBS -q batch #PBS -j oe #PBS -N first_task (任務(wù)名字,隨便取) cd /home/weitong /usr/local/mpitorque/bin/mpiexec ./Work/Computing/hellocluster > result |
金蟲 (正式寫手)
|
問題解決,根本原因是計算節(jié)點slave上的so文件路徑不全,要修改補充計算節(jié)點上/etc/ld.so.conf,以及/etc/ld.so.conf.d/里面的conf文件。 附上解決過程: 主機上: [root@magnetics ld.so.conf.d]# scp torque.conf mag02:/etc/ld.so.conf.d/ 在計算節(jié)點mag02機子上: [weitong@mag02 etc]$ sudo /sbin/ldconfig /etc/ld.so.conf (新新so路徑) 在主機上: [weitong@magnetics Computing]$ qsub submit.pbs 61.magnetics 出現(xiàn)新的錯誤first_task.o61, 說明上面通過conf文件添加so路徑的方法奏效了。 /usr/local/sbin/pbs_iff: error while loading shared libraries: libtorque.so.2: cannot open shared object file: No such file or directory mpiexec: Error: get_hosts: pbs_connect: Unauthorized Request . 查找發(fā)現(xiàn)libtorque.so.2在/usr/local/lib里面 在計算節(jié)點mag02機子上: [weitong@mag02 etc]$ sudo vim ld.so.conf,加入/usr/local/lib include ld.so.conf.d/*.conf /usr/local/lib 主上上: [root@magnetics ld.so.conf.d]# scp mpitorque.conf mag02:/etc/ld.so.conf.d/ 在計算節(jié)點mag02機子上: [weitong@mag02 etc]$ sudo /sbin/ldconfig /etc/ld.so.conf *************Done,解決問題。原來要將找不到的so文件路徑加入到conf文件中。 ************* |
| 2 | 1/1 | 返回列表 |
| 最具人氣熱帖推薦 [查看全部] | 作者 | 回/看 | 最后發(fā)表 | |
|---|---|---|---|---|
|
[考研]
|
18419759900 2026-03-25 | 7/350 |
|
|---|---|---|---|---|
|
[考研] 一志愿北京化工大學(xué)材料與化工 264分各科過A區(qū)國家線 +6 | 哈哈157349 2026-03-21 | 6/300 |
|
|
[考研] 308求調(diào)劑 +5 | 墨墨漠 2026-03-25 | 5/250 |
|
|
[考研] 機械學(xué)碩總分317求調(diào)劑!。! +4 | Acaciad 2026-03-25 | 4/200 |
|
|
[考研] 329求調(diào)劑 +3 | 鈕恩雪 2026-03-25 | 3/150 |
|
|
[考研] 材料調(diào)劑 +3 | iwinso 2026-03-23 | 3/150 |
|
|
[考研] 考研化學(xué)308分求調(diào)劑 +10 | 你好明天你好 2026-03-23 | 11/550 |
|
|
[考研] 289材料與化工(085600)B區(qū)求調(diào)劑 +4 | 這么名字咋樣 2026-03-22 | 5/250 |
|
|
[考研] 300分,材料,求調(diào)劑,英一數(shù)二 +5 | 超贊的 2026-03-24 | 5/250 |
|
|
[考研] 化工專碩求調(diào)劑 +3 | question挽風(fēng) 2026-03-24 | 3/150 |
|
|
[考研] 一志愿211 初試270分 求調(diào)劑 +5 | 谷雨上岸 2026-03-23 | 6/300 |
|
|
[考研] 【雙一流院校新能源、環(huán)境材料,材料加工與模擬招收大量調(diào)劑】 +4 | Higraduate 2026-03-22 | 7/350 |
|
|
[考研] 求調(diào)劑 +7 | 十三加油 2026-03-21 | 7/350 |
|
|
[考研] 材料/農(nóng)業(yè)專業(yè),07/08開頭均可,過線就行 +3 | 呵唔哦豁 2026-03-23 | 4/200 |
|
|
[考研] 384求調(diào)劑 +3 | 子系博 2026-03-22 | 6/300 |
|
|
[考研] 生物學(xué)一志愿985,分?jǐn)?shù)349求調(diào)劑 +6 | zxts12 2026-03-21 | 9/450 |
|
|
[考研] 291求調(diào)劑 +5 | 孅華 2026-03-22 | 5/250 |
|
|
[考研] 求調(diào)劑院校信息 +6 | CX 330 2026-03-21 | 6/300 |
|
|
[考研] 303求調(diào)劑 +5 | 安憶靈 2026-03-22 | 6/300 |
|
|
[考研] 求調(diào)劑 +4 | 要好好無聊 2026-03-21 | 4/200 |
|