| 5 | 1/1 | 返回列表 |
| 查看: 1567 | 回復: 8 | |||
| 當前只顯示滿足指定條件的回帖,點擊這里查看本話題的所有回帖 | |||
湖人湖人鐵桿木蟲 (小有名氣)
|
[求助]
請幫忙編寫一個perl程序處理文本(提取GI號) 已有1人參與
|
||
|
現(xiàn)在我碰到這樣一個問題,我有一個文本文件1.txt,是Blastx的結(jié)果,內(nèi)容如下: gi|293567070|gb|FS329526.1|FS329526,gi|219980050|emb|CAX06392.1|,33.96,106,70,0,406,723,256,361,5e-014,72.0 gi|293567070|gb|FS329526.1|FS329526,gi|219980050|emb|CAX06392.1|,30.43,161,107,3,244,711,28,188,7e-013,68.2 gi|293567070|gb|FS329526.1|FS329526,gi|219980050|emb|CAX06392.1|,32.31,130,84,2,334,711,180,309,1e-012,67.4 gi|293567065|gb|FS329521.1|FS329521,gi|388506924|gb|AFK41528.1|,42.27,220,115,1,107,766,67,274,9e-043, 167 gi|293567064|gb|FS329520.1|FS329520,gi|388510998|gb|AFK43565.1|,80.84,167,32,0,239,739,16,182,1e-079, 289 。。。。。。 后面還有很多序列,總共大概3M左右。 現(xiàn)在想提取前面核酸序列的GI號:gi|293567070,gi|293567065。。。輸出為txt文本,其中重復的只輸出一個, 另外,再輸出一個文本,提取后面蛋白序列的GI號:gi|219980050,gi|388506924。。。重復的也是只輸出一個。 各位大蝦,請問怎樣編寫一個perl程序處理上面的問題。恐x謝了! |
木蟲 (小有名氣)
|
#!/usr/bin/perl -w open IN,"<1.txt"; my (@nuclearacid,@protein,@nuclearacidnew,@proteinnew); my %hash; while (<IN> {my @abc=split /\|gb\|/,$_; push @nuclearacid,$abc[0]; my @def=split /,/,$abc[1]; push @protein,$def[1]; } close IN; open OUT1,">out1.txt"; foreach (@nuclearacid) { print OUT1 "$_\n" unless $hash{$_}++; } close OUT1; open OUT2,">out2.txt"; foreach (@protein) { print OUT2 "$_\n" unless $hash{$_}++; } close OUT2; |
鐵桿木蟲 (正式寫手)
木蟲 (正式寫手)
|
#!/usr/bin/perl use strict; use warnings; open (IN, "<1.txt" ;open (OUT, ">>out.txt" ;while (my $line= my @cut=split("|gb|",$line); print OUT $cut[0]."\n"; } close IN; close OUT; 去重的話用EXCEL吧,一下就搞定了,不用寫程序。 |
至尊木蟲 (著名寫手)
驃騎將軍

| 最具人氣熱帖推薦 [查看全部] | 作者 | 回/看 | 最后發(fā)表 | |
|---|---|---|---|---|
|
[考研] 322求調(diào)劑:一志愿湖南大學 材料與化工(085600),已過六級。 +4 | XX小鄧 2026-03-29 | 4/200 |
|
|---|---|---|---|---|
|
[考研] 求調(diào)劑 +9 | 張zz111 2026-03-27 | 10/500 |
|
|
[考研] 一志愿雙一流機械285分求調(diào)劑 +4 | 幸運的三木 2026-03-29 | 5/250 |
|
|
[考研] 343求調(diào)劑 +6 | 愛羈絆 2026-03-29 | 6/300 |
|
|
[考研] 332求調(diào)劑 +8 | 蕉蕉123 2026-03-28 | 8/400 |
|
|
[考研] 各位老師好,我的一志愿為北京科技大學085601材料專碩 +8 | Koxui 2026-03-28 | 8/400 |
|
|
[考研] 330分求調(diào)劑 +5 | qzenlc 2026-03-29 | 5/250 |
|
|
[考研] 295求調(diào)劑 +4 | wei-5 2026-03-26 | 4/200 |
|
|
[考研] 食品工程專碩一志愿中海洋309求調(diào)劑 +4 | 小張zxy張 2026-03-26 | 8/400 |
|
|
[考研] 一志愿北京工業(yè)大學,324分求調(diào)劑 +4 | 零八# 2026-03-28 | 4/200 |
|
|
[考研] 求調(diào)劑 +3 | QiMing7 2026-03-25 | 4/200 |
|
|
[考研] 299求調(diào)劑 +7 | 嗯嗯嗯嗯2 2026-03-27 | 7/350 |
|
|
[考研] 085701環(huán)境工程,267求調(diào)劑 +16 | minht 2026-03-26 | 16/800 |
|
|
[考研] 352分 化工與材料 +5 | 海納百川Ly 2026-03-27 | 5/250 |
|
|
[考研] 265求調(diào)劑 +8 | 小木蟲085600 2026-03-27 | 8/400 |
|
|
[碩博家園] 北京林業(yè)大學碩導招生廣告 +6 | kongweilin 2026-03-26 | 8/400 |
|
|
[考研] 一志愿陜師大生物學071000,298分,求調(diào)劑 +5 | SYA! 2026-03-23 | 5/250 |
|
|
[考研] 325求調(diào)劑 +5 | 李嘉圖·S·路 2026-03-23 | 5/250 |
|
|
[考研] 環(huán)境專碩324分求調(diào)劑推薦 +5 | 軒小寧—— 2026-03-26 | 5/250 |
|
|
[考研] 機械學碩總分317求調(diào)劑。。! +4 | Acaciad 2026-03-25 | 4/200 |
|