| 17 | 1/1 | 返回列表 |
| 查看: 3428 | 回復(fù): 16 | |||
[交流]
用Trinity進行de novo拼裝
|
|||
| 最近在公司做了轉(zhuǎn)錄組測序,植物樣本,illumina Hiseq2000,三個樣本共100M的clean reads,一起拼接。該公司用Trinity軟件進行de novo拼接,拼出來contigs達40多萬條,后來又用CD-HIT進行聚類,結(jié)果仍有30多萬條,其中包含很多轉(zhuǎn)錄本的存在。從文獻中看一般植物轉(zhuǎn)錄組de novo拼接也就幾萬條序列,太多的轉(zhuǎn)錄本會影響到后面表達量的比較。不知道是由于Trinity這個拼接軟件的原因還是其他什么原因。 |
» 搶金幣啦!回帖就可以得到:
+1/456
+2/130
+1/85
+1/77
+1/75
+1/73
+2/44
+1/31
+1/26
+1/19
+1/14
+1/11
+1/10
+1/10
+1/6
+1/6
+1/5
+1/4
+1/2
+1/1
|
我看到你的測序結(jié)果后感到很奇怪,有幾個問題想問你: (1)你的三個樣本的reads長度是多少?如果reads太短,也會導(dǎo)致拼接的結(jié)果變化。還有就是你用哪種方式建庫,single-end,mated-paired 和 paired-end?一般,如果用paired-end技術(shù),可能拼接結(jié)果會更好點。 (2)你的三個樣本是混在一起建庫后測序的嗎?還是分別建成三個庫,分別加三個不同barcode的加以區(qū)別嗎?如果是后者,我有一個問題,一般Hiseq 2000的一個lane可以獲得5-30G左右的數(shù)據(jù),而且一個lane里面最多也就可以加到24樣品啊,一般的公司在一個lane最多也就加到8個樣品,所以你的一個樣品獲得數(shù)據(jù)5G/24=210Mb左右才對啊,三個樣品應(yīng)該是至少也應(yīng)該是600Mbp左右。∪绻愕膔eads總共才100Mbp的話,拼接成這樣,應(yīng)該是因為你的測序depth太低(因為植物的基因很大,除了擬南芥小點(125Mb)外,一般都大于400Mbp)。你的植物的物種是木本,還是草本植物;如果是木本植物,它的基因組可能會更大點,也會影響你的測序depth。 (3)在使用Tiniity拼接時,你輸出的最小的contig長度是多少呢(即“--min_contig_length”參數(shù)設(shè)置為多少,程序默認200bp)? (4)在使用Tiniity拼接時,他使用哪個方法拼接的:Inchworm、 Chrysalis 和Butterfly (A)Inchworm assembles the RNA-seq data into the unique sequences of transcripts, often generating full-length transcripts for a dominant isoform, but then reports just the unique portions of alternatively spliced transcripts. (B) Chrysalis clusters the Inchworm contigs into clusters and constructs complete de Bruijn graphs for each cluster. Each cluster represents the full transcriptonal complexity for a given gene (or sets of genes that share sequences in common). Chrysalis then partitions the full read set among these disjoint graphs. (C)Butterfly then processes the individual graphs in parallel, tracing the paths that reads and pairs of reads take within the graph, ultimately reporting full-length transcripts for alternatively spliced isoforms, and teasing apart transcripts that corresponds to paralogous genes. 三種方法得到的結(jié)果也是有所不同的。 |
|
我個人感覺數(shù)據(jù)可靠性的高低,和你的contig長度/數(shù)量沒有直接關(guān)系呢? 你現(xiàn)在contig比較多的原因是因為:1 通量不足以拼的好;2 二代高通量讀長比較短; 3 轉(zhuǎn)錄組本身de novo拼接就不好弄,并不能看出來怎么質(zhì)量就不好了。 極端一點,絲毫不去拼接,直接拿reads去做定量,也沒有問題。ú贿^一般是在有ref的情況下) 你是不是多慮了? |
| 17 | 1/1 | 返回列表 |
| 最具人氣熱帖推薦 [查看全部] | 作者 | 回/看 | 最后發(fā)表 | |
|---|---|---|---|---|
|
[考研] 材料292調(diào)劑 +8 | 橘頌思美人 2026-03-23 | 8/400 |
|
|---|---|---|---|---|
|
[考研] 求調(diào)劑一志愿武漢理工大學(xué)材料工程(085601) +5 | WW.' 2026-03-23 | 7/350 |
|
|
[考研] 321求調(diào)劑 +4 | Ymlll 2026-03-24 | 4/200 |
|
|
[考研]
|
13659058978 2026-03-24 | 4/200 |
|
|
[考研] 一志愿吉大化學(xué)322求調(diào)劑 +4 | 17501029541 2026-03-23 | 6/300 |
|
|
[考研] 269求調(diào)劑 +4 | 我想讀研11 2026-03-23 | 4/200 |
|
|
[考研] 求老師收我 +3 | zzh16938784 2026-03-23 | 3/150 |
|
|
[考研] 323求調(diào)劑 +6 | 洼小桶 2026-03-18 | 6/300 |
|
|
[考研] 280分求調(diào)劑 一志愿085802 +4 | PUMPT 2026-03-22 | 7/350 |
|
|
[考研] 一志愿西安交通大學(xué)材料工程專業(yè) 282分求調(diào)劑 +11 | 楓橋ZL 2026-03-18 | 13/650 |
|
|
[考研] 一志愿華中農(nóng)業(yè)071010,總分320求調(diào)劑 +5 | 困困困困坤坤 2026-03-20 | 6/300 |
|
|
[考研] 尋找調(diào)劑 +4 | 倔強芒? 2026-03-21 | 4/200 |
|
|
[考研] 求調(diào)劑院校信息 +6 | CX 330 2026-03-21 | 6/300 |
|
|
[考研] 311求調(diào)劑 +3 | 26研0 2026-03-20 | 3/150 |
|
|
[考研] 材料求調(diào)劑 +5 | @taotao 2026-03-21 | 5/250 |
|
|
[考研] 278求調(diào)劑 +9 | 煙火先于春 2026-03-17 | 9/450 |
|
|
[考研] 268求調(diào)劑 +9 | 簡單點0 2026-03-17 | 9/450 |
|
|
[考研] 330求調(diào)劑0854 +3 | assdll 2026-03-21 | 3/150 |
|
|
[考研] 294求調(diào)劑材料與化工專碩 +15 | 陌の森林 2026-03-18 | 15/750 |
|
|
[考博] 26博士申請 +3 | 1042136743 2026-03-17 | 3/150 |
|