| 8 | 1/1 | 返回列表 |
| 查看: 2022 | 回復: 7 | ||
amo11000金蟲 (小有名氣)
|
[求助]
編寫一個程序處理文本內(nèi)容,刪除長度<10,開頭的,不以CTG結尾的那些序列
|
|
我有一個文本文件1.txt,內(nèi)容如下:>序列名字1(序列名字可以任意長度)ATGgcggggccccATAGGGGGGTTCCUTG>序列名字2ATGgcggggccccAgTAGGGGGGTTCCUTG>序列名字3CTGgggggggccccccgggggutg。。。。。。后面還有很多序列 要求刪除那些長度<10,不以ATG開頭的,不以CTG結尾的那些序列。名字不包括在序列的長度內(nèi),最后得到的文件內(nèi)容應該是: >序列名字1(序列名字可以任意長度)ATGgcggggccccATAGGGGGGTTCCUTG>序列名字2ATGgcggggccccAgTAGGGGGGTTCCUTG。。。。。。后面還有很多序列。 由于序列3的開頭字符不是ATG,而是CTG,所以被刪除掉了。 誰能幫忙編寫一個vb程序處理上面的問題啊?謝謝了 |
金蟲 (正式寫手)
Holy Shit

木蟲 (著名寫手)

木蟲 (正式寫手)
木蟲 (正式寫手)
|
用perl腳本吧,很方便,我寫了一個大概,要根據(jù)自己的序列格式更改一下(也可能有一些小錯誤),你的格式應該是fasta格式的測序序列,>文件名應該是單獨一行。 #!/usr/bin/perl use strict; use warnings; open (INFILE,"<1.txt" ;open (OUTFILE,">>out.txt" ;while (my $line=<> { my $num=length($line); if (($num>9)&&(~m/^ATG/)&&(CTG$)) { print OUTFILE $line; } if (~m/^>/) { print OUTFILE $line; #這個地方要加一個怎樣判斷序列名稱和你輸出序列 的對應的語句。不然每個文件名都會輸出,時間有限,我就這樣簡寫了,抱歉了…… } } close INFILE; close OUTFILE; |
| 8 | 1/1 | 返回列表 |
| 最具人氣熱帖推薦 [查看全部] | 作者 | 回/看 | 最后發(fā)表 | |
|---|---|---|---|---|
|
[考研] 070300化學求調(diào)劑 +4 | 起個名咋這么難 2026-03-27 | 4/200 |
|
|---|---|---|---|---|
|
[考研] 086000調(diào)劑 +3 | 7901117076 2026-03-26 | 3/150 |
|
|
[考研] 求調(diào)劑 +4 | 零八# 2026-03-27 | 4/200 |
|
|
[考研] 272求調(diào)劑 +7 | 腳滑的守法公民 2026-03-27 | 7/350 |
|
|
[考研] 081200-11408-276學碩求調(diào)劑 +3 | 崔wj 2026-03-26 | 3/150 |
|
|
[考研] 343求調(diào)劑 +4 | 贈我一本書 2026-03-23 | 4/200 |
|
|
[考研] 325求調(diào)劑 +3 | Aoyijiang 2026-03-23 | 3/150 |
|
|
[考研] 329求調(diào)劑 +5 | 1() 2026-03-22 | 5/250 |
|
|
[考研] 化學工程085602 305分求調(diào)劑 +17 | RichLi_ 2026-03-25 | 17/850 |
|
|
[考研] 297求調(diào)劑 +6 | 田洪有 2026-03-26 | 6/300 |
|
|
[考研] 考研調(diào)劑 +6 | 來好運來來來 2026-03-21 | 7/350 |
|
|
[考研] 293求調(diào)劑 +7 | 加一一九 2026-03-24 | 7/350 |
|
|
[考研]
|
黃粱一夢千年 2026-03-24 | 3/150 |
|
|
[考研] 求調(diào)劑一志愿武漢理工大學材料工程(085601) +5 | WW.' 2026-03-23 | 7/350 |
|
|
[考研]
|
13659058978 2026-03-24 | 4/200 |
|
|
[基金申請] 請教下大家 2026年國家基金申請是雙盲審嗎? +3 | lishucheng1 2026-03-22 | 5/250 |
|
|
[考研] 341求調(diào)劑(一志愿湖南大學070300) +5 | 番茄頭--- 2026-03-22 | 6/300 |
|
|
[考研] 工科0856求調(diào)劑 +5 | 沐析汀汀 2026-03-21 | 5/250 |
|
|
[考研] 280分求調(diào)劑 一志愿085802 +4 | PUMPT 2026-03-22 | 7/350 |
|
|
[考研] 315分,誠求調(diào)劑,材料與化工085600 +3 | 13756423260 2026-03-22 | 3/150 |
|