| 8 | 1/1 | 返回列表 |
| 查看: 2023 | 回復: 7 | ||
amo11000金蟲 (小有名氣)
|
[求助]
編寫一個程序處理文本內容,刪除長度<10,開頭的,不以CTG結尾的那些序列
|
|
我有一個文本文件1.txt,內容如下:>序列名字1(序列名字可以任意長度)ATGgcggggccccATAGGGGGGTTCCUTG>序列名字2ATGgcggggccccAgTAGGGGGGTTCCUTG>序列名字3CTGgggggggccccccgggggutg。。。。。。后面還有很多序列 要求刪除那些長度<10,不以ATG開頭的,不以CTG結尾的那些序列。名字不包括在序列的長度內,最后得到的文件內容應該是: >序列名字1(序列名字可以任意長度)ATGgcggggccccATAGGGGGGTTCCUTG>序列名字2ATGgcggggccccAgTAGGGGGGTTCCUTG。。。。。。后面還有很多序列。 由于序列3的開頭字符不是ATG,而是CTG,所以被刪除掉了。 誰能幫忙編寫一個vb程序處理上面的問題。恐x謝了 |
金蟲 (正式寫手)
Holy Shit

木蟲 (著名寫手)

木蟲 (正式寫手)
木蟲 (正式寫手)
|
用perl腳本吧,很方便,我寫了一個大概,要根據(jù)自己的序列格式更改一下(也可能有一些小錯誤),你的格式應該是fasta格式的測序序列,>文件名應該是單獨一行。 #!/usr/bin/perl use strict; use warnings; open (INFILE,"<1.txt" ;open (OUTFILE,">>out.txt" ;while (my $line=<> { my $num=length($line); if (($num>9)&&(~m/^ATG/)&&(CTG$)) { print OUTFILE $line; } if (~m/^>/) { print OUTFILE $line; #這個地方要加一個怎樣判斷序列名稱和你輸出序列 的對應的語句。不然每個文件名都會輸出,時間有限,我就這樣簡寫了,抱歉了…… } } close INFILE; close OUTFILE; |
| 8 | 1/1 | 返回列表 |
| 最具人氣熱帖推薦 [查看全部] | 作者 | 回/看 | 最后發(fā)表 | |
|---|---|---|---|---|
|
[考研] 壓國家一區(qū)線,求導師收留,有恩必謝! +7 | 迷人的哈哈 2026-03-28 | 7/350 |
|
|---|---|---|---|---|
|
[考研] 本科新能源科學與工程,一志愿華理能動285求調劑 +3 | AZMK 2026-03-27 | 5/250 |
|
|
[考研] 317求調劑 +6 | 十閑wx 2026-03-24 | 6/300 |
|
|
[考研] 求調劑 +6 | 蘆lty 2026-03-25 | 7/350 |
|
|
[考研] 311求調劑 +9 | lin0039 2026-03-26 | 9/450 |
|
|
[考研] 材料與化工(0856)304求B區(qū)調劑 +8 | 邱gl 2026-03-27 | 8/400 |
|
|
[考研] 266分,求材料冶金能源化工等調劑 +7 | 哇呼哼呼哼 2026-03-27 | 9/450 |
|
|
[考研] 藥學105500求調劑 +3 | Ssun。。 2026-03-28 | 3/150 |
|
|
[考研] 328求調劑 +7 | 嗯滴的基本都 2026-03-27 | 7/350 |
|
|
[考研] 291求調劑 +7 | 孅華 2026-03-22 | 7/350 |
|
|
[考研] 一志愿上海理工能源動力(085800)310分求調劑 +3 | zhangmingc 2026-03-27 | 4/200 |
|
|
[考研] 085600,材料與化工321分,求調劑 +9 | 大饞小子 2026-03-27 | 9/450 |
|
|
[碩博家園] 北京林業(yè)大學碩導招生廣告 +6 | kongweilin 2026-03-26 | 8/400 |
|
|
[考研]
材料學碩,求調劑
6+5
|
糖葫蘆888ll 2026-03-22 | 10/500 |
|
|
[考研] 材料調劑 +8 | 匹克i 2026-03-23 | 8/400 |
|
|
[考研] 求調劑,一志愿 南京航空航天大學大學 ,080500材料科學與工程學碩 +4 | @taotao 2026-03-26 | 5/250 |
|
|
[考研] 317求調劑 +7 | 蛋黃咸肉粽 2026-03-26 | 7/350 |
|
|
[考研] 336材料求調劑 +7 | 陳瀅瑩 2026-03-26 | 9/450 |
|
|
[考研] 機械學碩310分,數(shù)一英一,一志愿211本科雙非找調劑信息 +3 | @357 2026-03-25 | 3/150 |
|
|
[考研] 081700 調劑 267分 +11 | 迷人的哈哈 2026-03-23 | 11/550 |
|