| 17 | 1/1 | 返回列表 |
| 查看: 3429 | 回復: 16 | |||
[交流]
用Trinity進行de novo拼裝
|
|||
| 最近在公司做了轉錄組測序,植物樣本,illumina Hiseq2000,三個樣本共100M的clean reads,一起拼接。該公司用Trinity軟件進行de novo拼接,拼出來contigs達40多萬條,后來又用CD-HIT進行聚類,結果仍有30多萬條,其中包含很多轉錄本的存在。從文獻中看一般植物轉錄組de novo拼接也就幾萬條序列,太多的轉錄本會影響到后面表達量的比較。不知道是由于Trinity這個拼接軟件的原因還是其他什么原因。 |
» 搶金幣啦!回帖就可以得到:
+1/228
+2/130
+1/92
+1/84
+1/80
+1/48
+2/44
+1/31
+1/29
+1/29
+1/19
+1/19
+1/18
+1/14
+1/7
+1/5
+1/5
+1/5
+1/1
+1/1
|
我看到你的測序結果后感到很奇怪,有幾個問題想問你: (1)你的三個樣本的reads長度是多少?如果reads太短,也會導致拼接的結果變化。還有就是你用哪種方式建庫,single-end,mated-paired 和 paired-end?一般,如果用paired-end技術,可能拼接結果會更好點。 (2)你的三個樣本是混在一起建庫后測序的嗎?還是分別建成三個庫,分別加三個不同barcode的加以區(qū)別嗎?如果是后者,我有一個問題,一般Hiseq 2000的一個lane可以獲得5-30G左右的數(shù)據(jù),而且一個lane里面最多也就可以加到24樣品啊,一般的公司在一個lane最多也就加到8個樣品,所以你的一個樣品獲得數(shù)據(jù)5G/24=210Mb左右才對啊,三個樣品應該是至少也應該是600Mbp左右啊!如果你的reads總共才100Mbp的話,拼接成這樣,應該是因為你的測序depth太低(因為植物的基因很大,除了擬南芥小點(125Mb)外,一般都大于400Mbp)。你的植物的物種是木本,還是草本植物;如果是木本植物,它的基因組可能會更大點,也會影響你的測序depth。 (3)在使用Tiniity拼接時,你輸出的最小的contig長度是多少呢(即“--min_contig_length”參數(shù)設置為多少,程序默認200bp)? (4)在使用Tiniity拼接時,他使用哪個方法拼接的:Inchworm、 Chrysalis 和Butterfly (A)Inchworm assembles the RNA-seq data into the unique sequences of transcripts, often generating full-length transcripts for a dominant isoform, but then reports just the unique portions of alternatively spliced transcripts. (B) Chrysalis clusters the Inchworm contigs into clusters and constructs complete de Bruijn graphs for each cluster. Each cluster represents the full transcriptonal complexity for a given gene (or sets of genes that share sequences in common). Chrysalis then partitions the full read set among these disjoint graphs. (C)Butterfly then processes the individual graphs in parallel, tracing the paths that reads and pairs of reads take within the graph, ultimately reporting full-length transcripts for alternatively spliced isoforms, and teasing apart transcripts that corresponds to paralogous genes. 三種方法得到的結果也是有所不同的。 |
| 17 | 1/1 | 返回列表 |
| 最具人氣熱帖推薦 [查看全部] | 作者 | 回/看 | 最后發(fā)表 | |
|---|---|---|---|---|
|
[考研] 300分,材料,求調(diào)劑,英一數(shù)二 +5 | 超贊的 2026-03-24 | 5/250 |
|
|---|---|---|---|---|
|
[考研]
|
黃粱一夢千年 2026-03-24 | 3/150 |
|
|
[考研] 292求調(diào)劑 +4 | 鵝鵝鵝額額額額?/a> 2026-03-24 | 4/200 |
|
|
[考研] 材料專碩英一數(shù)二306 +8 | z1z2z3879 2026-03-18 | 8/400 |
|
|
[考研] 一志愿武理材料工程348求調(diào)劑 +6 |  ̄^ ̄゜汗 2026-03-19 | 9/450 |
|
|
[考研] 328求調(diào)劑 +4 | LHHL66 2026-03-23 | 4/200 |
|
|
[考研] 0854電子信息求調(diào)劑 324 +3 | Promise-jyl 2026-03-23 | 3/150 |
|
|
[考研]
求調(diào)劑材料學碩080500,總分289分
5+3
|
@taotao 2026-03-19 | 21/1050 |
|
|
[考研] 一志愿西安交通大學材料工程專業(yè) 282分求調(diào)劑 +11 | 楓橋ZL 2026-03-18 | 13/650 |
|
|
[考研] 308求調(diào)劑 +3 | 墨墨漠 2026-03-21 | 3/150 |
|
|
[考研] 一志愿中南化學(0703)總分337求調(diào)劑 +9 | niko- 2026-03-19 | 10/500 |
|
|
[考研] 298求調(diào)劑一志愿211 +3 | 上岸6666@ 2026-03-20 | 3/150 |
|
|
[考研] 285求調(diào)劑 +6 | ytter 2026-03-22 | 6/300 |
|
|
[考研] 085600材料與化工306 +4 | z1z2z3879 2026-03-21 | 4/200 |
|
|
[考研] 296求調(diào)劑 +4 | www_q 2026-03-20 | 4/200 |
|
|
[考研] 330求調(diào)劑0854 +3 | assdll 2026-03-21 | 3/150 |
|
|
[考研] 一志愿 西北大學 ,070300化學學碩,總分287,雙非一本,求調(diào)劑。 +3 | 晨昏線與星海 2026-03-18 | 3/150 |
|
|
[考研] 290求調(diào)劑 +7 | ^O^乜 2026-03-19 | 7/350 |
|
|
[考研] 一志愿 南京航空航天大學大學 ,080500材料科學與工程學碩 +5 | @taotao 2026-03-20 | 5/250 |
|
|
[考研] 一志愿西安交通大學 學碩 354求調(diào)劑211或者雙一流 +3 | 我想要讀研究生 2026-03-20 | 3/150 |
|