| 5 | 1/1 | 返回列表 |
| 查看: 2028 | 回復: 7 | |||
| 當前只顯示滿足指定條件的回帖,點擊這里查看本話題的所有回帖 | |||
amo11000金蟲 (小有名氣)
|
[求助]
編寫一個程序處理文本內(nèi)容,刪除長度<10,開頭的,不以CTG結(jié)尾的那些序列
|
||
|
我有一個文本文件1.txt,內(nèi)容如下:>序列名字1(序列名字可以任意長度)ATGgcggggccccATAGGGGGGTTCCUTG>序列名字2ATGgcggggccccAgTAGGGGGGTTCCUTG>序列名字3CTGgggggggccccccgggggutg。。。。。。后面還有很多序列 要求刪除那些長度<10,不以ATG開頭的,不以CTG結(jié)尾的那些序列。名字不包括在序列的長度內(nèi),最后得到的文件內(nèi)容應該是: >序列名字1(序列名字可以任意長度)ATGgcggggccccATAGGGGGGTTCCUTG>序列名字2ATGgcggggccccAgTAGGGGGGTTCCUTG。。。。。。后面還有很多序列。 由于序列3的開頭字符不是ATG,而是CTG,所以被刪除掉了。 誰能幫忙編寫一個vb程序處理上面的問題?謝謝了 |
木蟲 (正式寫手)
|
用perl腳本吧,很方便,我寫了一個大概,要根據(jù)自己的序列格式更改一下(也可能有一些小錯誤),你的格式應該是fasta格式的測序序列,>文件名應該是單獨一行。 #!/usr/bin/perl use strict; use warnings; open (INFILE,"<1.txt" ;open (OUTFILE,">>out.txt" ;while (my $line=<> { my $num=length($line); if (($num>9)&&(~m/^ATG/)&&(CTG$)) { print OUTFILE $line; } if (~m/^>/) { print OUTFILE $line; #這個地方要加一個怎樣判斷序列名稱和你輸出序列 的對應的語句。不然每個文件名都會輸出,時間有限,我就這樣簡寫了,抱歉了…… } } close INFILE; close OUTFILE; |
金蟲 (正式寫手)
Holy Shit

木蟲 (著名寫手)

| 最具人氣熱帖推薦 [查看全部] | 作者 | 回/看 | 最后發(fā)表 | |
|---|---|---|---|---|
|
[考研] 085600 295分求調(diào)劑 +12 | W55j 2026-03-30 | 14/700 |
|
|---|---|---|---|---|
|
[考研] 362求調(diào)劑 +6 | 西南交材料專碩3 2026-03-31 | 6/300 |
|
|
[考研] 085404 22408 315分 +4 | zhuangyan123 2026-03-31 | 4/200 |
|
|
[考研] 274求調(diào)劑 +6 | xiao愛同學 2026-03-30 | 6/300 |
|
|
[考研] 293分求調(diào)劑,外語為俄語 +5 | 加一一九 2026-03-31 | 5/250 |
|
|
[考研] 材料求調(diào)劑 一志愿哈工大總分298分,前三科223分 +10 | dongfang59 2026-03-27 | 10/500 |
|
|
[考研] 一志愿中海洋材料357 +3 | 麥恩莉. 2026-03-30 | 3/150 |
|
|
[考研] 277跪求調(diào)劑 +8 | 1915668 2026-03-27 | 12/600 |
|
|
[考研] 一志愿南昌大學324求調(diào)劑 +9 | hanamiko 2026-03-27 | 9/450 |
|
|
[考研] 309求調(diào)劑 +15 | 誰不是少年 2026-03-29 | 15/750 |
|
|
[考研] 284求調(diào)劑 +14 | junqihahaha 2026-03-26 | 15/750 |
|
|
[考研] 求調(diào)劑,一志愿 南京航空航天大學大學 ,080500材料科學與工程學碩 +6 | @taotao 2026-03-26 | 7/350 |
|
|
[考研] 375求調(diào)劑 +6 | 雨夏整夜 2026-03-29 | 6/300 |
|
|
[考研] 求調(diào)劑 +4 | QiMing7 2026-03-25 | 5/250 |
|
|
[考研] 0856求調(diào)劑 +13 | zhn03 2026-03-25 | 14/700 |
|
|
[考研] 調(diào)劑考研 +3 | 王杰一 2026-03-29 | 3/150 |
|
|
[考研] 330一志愿中國海洋大學 化學工程 085602 有讀博意愿 求調(diào)劑 +3 | wywy.. 2026-03-27 | 4/200 |
|
|
[考研] 復試調(diào)劑,一志愿南農(nóng)083200食品科學與工程 +5 | XQTJZ 2026-03-26 | 5/250 |
|
|
[考研] 085600,材料與化工321分調(diào)劑 +4 | 大饞小子 2026-03-27 | 6/300 |
|
|
[考研] 考研調(diào)劑 +10 | 呼呼?~+123456 2026-03-24 | 10/500 |
|