| 24小時(shí)熱門版塊排行榜 |
| 1 | 1/1 | 返回列表 |
| 查看: 1478 | 回復(fù): 0 | ||
wangxn06金蟲(chóng) (正式寫手)
|
[求助]
mpi并行計(jì)算,錯(cuò)誤提示“p1_xxxxx: p4_error: interrupt SIGSEGV: 11”是什么意思?
|
|
MPI并行計(jì)算的程序,之前在另一臺(tái)集群上跑是可以的,當(dāng)時(shí)用的是intel 編譯器,MPICH2,LINUX系統(tǒng)的版本不太清楚,F(xiàn)在換了一個(gè)集群也是linux系統(tǒng),編譯器為GNU,編譯命令為mpif77,但是作業(yè)提交后總是出現(xiàn)這樣的錯(cuò)誤 p1_xxxxx: p4_error: interrupt SIGSEGV: 11 在網(wǎng)上搜了一下,這種叫 段錯(cuò)誤,與內(nèi)存有關(guān)。找到的3種解決辦法(具體情況不同): 1. http://old.blog.edu.cn/user1/11542/archives/2007/1652099.shtml 在并行作業(yè)中可能會(huì)遇到"p1_xxxxx: p4_error: interrupt SIGSEGV: 11"的錯(cuò)誤,而且作業(yè)會(huì)停止。 這個(gè)錯(cuò)誤可能是因?yàn)槟硞(gè)進(jìn)程中出現(xiàn)了段錯(cuò)誤引起的,出現(xiàn)了 illegally read/write not-owned memory location的情況。解決的一種辦法是:如果內(nèi)存容量比較大,通過(guò)設(shè)置環(huán)境變量P4_GLOBMEMSIZE 增加其值,比如: export P4_GLOBMEMSIZE=536870912增加到使用512M的內(nèi)存。 2. http://www.gaoyang168.com/bbs/viewthread.php?tid=1542953 最后發(fā)現(xiàn)是數(shù)據(jù)長(zhǎng)度的問(wèn)題,這是由于編譯MPI自動(dòng)識(shí)別的整數(shù)型長(zhǎng)度是4位的,而我在編譯VASP.5.LIB時(shí)沒(méi)有刪掉PGF后面的-i8選項(xiàng),結(jié)果兩邊沖突,導(dǎo)致內(nèi)存故障報(bào)錯(cuò)。重新編譯VASP.5.LIB,然后編譯VASP,測(cè)試成功 3. http://blog.sina.com.cn/s/blog_40bf31b5010003cu.html p1_xxxxx: p4_error: interrupt SIGSEGV: 11 這個(gè)錯(cuò)誤可能是因?yàn)槟硞(gè)進(jìn)程中出現(xiàn)了段錯(cuò)誤引起的, 自己出現(xiàn)過(guò)的錯(cuò)誤: 1.只在一個(gè)進(jìn)程中給指針申請(qǐng)空間,而在其他進(jìn)程沒(méi)有申請(qǐng),所以在廣播的時(shí)候出錯(cuò) 2.在一個(gè)進(jìn)程中聯(lián)接mysql數(shù)據(jù)庫(kù),而在所有的進(jìn)程中斷開(kāi)數(shù)據(jù)庫(kù)的聯(lián)接 網(wǎng)上有個(gè)人說(shuō)的很好: "There are 2 things to check. * Run one of the test programs like pi3.f or cpi.c to see whether your cluster's OK. * if it is, the fault is in your code. See if you're exceeding array bounds or accessing memory which you haven't allocated, There's a SIGSEGV error - that's a segmentation violation. That might explain stuff like bm_list_21829: p4_error: interrupt SIGINT: 2 Once you have a seg. violation, all the 4 processors are sent a signal to interrupt the process (SIGINT). Signals are defined in /usr/include/sys/signal.h (at least on the SGIs; might be different on other systems). " 2. p1_10401: p4_error: : 14 1 - MPI_BCAST : Message truncated [1] Aborting program ! [1] Aborting program! 這個(gè)也是由于mpi_bcast的接收空間不夠引起的,要在mpi_bcast之前分配足夠大的空間,這樣就不會(huì)truncated了 請(qǐng)問(wèn)各位怎么對(duì)程序做改動(dòng),才能避免問(wèn)題的出現(xiàn)?什么是段錯(cuò)誤? [ Last edited by wangxn06 on 2012-3-19 at 21:55 ] |
找到一些相關(guān)的精華帖子,希望有用哦~
| 1 | 1/1 | 返回列表 |
| 最具人氣熱帖推薦 [查看全部] | 作者 | 回/看 | 最后發(fā)表 | |
|---|---|---|---|---|
|
[考研] 0817 化學(xué)工程 299分求調(diào)劑 有科研經(jīng)歷 有二區(qū)文章 +17 | rare12345 2026-03-18 | 17/850 |
|
|---|---|---|---|---|
|
[考研] 324分 085600材料化工求調(diào)劑 +3 | llllkkkhh 2026-03-18 | 3/150 |
|
|
[考研] 求調(diào)劑,一志愿:南京航空航天大學(xué)大學(xué) ,080500材料科學(xué)與工程學(xué)碩,總分289分 +3 | @taotao 2026-03-19 | 3/150 |
|
|
[考研] 材料考研調(diào)劑 +3 | xwt。 2026-03-19 | 3/150 |
|
|
[考研] 一志愿985,本科211,0817化學(xué)工程與技術(shù)319求調(diào)劑 +10 | Liwangman 2026-03-15 | 10/500 |
|
|
[考研] 332求調(diào)劑 +3 | ydfyh 2026-03-17 | 3/150 |
|
|
[考研] 0817調(diào)劑 +3 | 沒(méi)有答案_ 2026-03-14 | 3/150 |
|
|
[考研] 本科鄭州大學(xué)物理學(xué)院,一志愿華科070200學(xué)碩,346求調(diào)劑 +4 | 我不是一根蔥 2026-03-18 | 4/200 |
|
|
[考研] 08工科 320總分 求調(diào)劑 +5 | 梨花珞晚風(fēng) 2026-03-17 | 5/250 |
|
|
[考研] 材料專碩306英一數(shù)二 +10 | z1z2z3879 2026-03-16 | 13/650 |
|
|
[考研] 312求調(diào)劑 +8 | 陌宸希 2026-03-16 | 9/450 |
|
|
[考研] 280求調(diào)劑 +6 | 咕嚕曉曉 2026-03-18 | 7/350 |
|
|
[考研] 0703化學(xué)調(diào)劑 +3 | 妮妮ninicgb 2026-03-17 | 3/150 |
|
|
[考研] 268求調(diào)劑 +6 | 簡(jiǎn)單點(diǎn)0 2026-03-17 | 6/300 |
|
|
[碩博家園] 湖北工業(yè)大學(xué) 生命科學(xué)與健康學(xué)院-課題組招收2026級(jí)食品/生物方向碩士 +3 | 1喜春8 2026-03-17 | 5/250 |
|
|
[考研] 材料專碩326求調(diào)劑 +6 | 墨煜姒莘 2026-03-15 | 7/350 |
|
|
[考研] 290求調(diào)劑 +3 | p asserby. 2026-03-15 | 4/200 |
|
|
[基金申請(qǐng)]
今年的國(guó)基金是打分制嗎?
50+3
|
zhanghaozhu 2026-03-14 | 3/150 |
|
|
[考研] 327求調(diào)劑 +6 | 拾光任染 2026-03-15 | 11/550 |
|
|
[考研] 復(fù)試調(diào)劑 +3 | 呼呼?~+123456 2026-03-14 | 3/150 |
|