| 5 | 1/1 | 返回列表 |
| 查看: 2387 | 回復(fù): 4 | ||
| 當(dāng)前只顯示滿足指定條件的回帖,點(diǎn)擊這里查看本話題的所有回帖 | ||
[求助]
測(cè)轉(zhuǎn)錄組遇到的一個(gè)問題 求高手解答 已有1人參與
|
||
|
最近在華大測(cè)了個(gè)轉(zhuǎn)錄組,基本所有東西都是分析好的 在看數(shù)據(jù)的時(shí)候遇到一個(gè)問題: 沒有參考基因組,得到幾萬個(gè)unigene,F(xiàn)在用Nr數(shù)據(jù)庫(kù)注釋到的基因比如是n個(gè),但是同時(shí)用Nr數(shù)據(jù)庫(kù)預(yù)測(cè)CDS的時(shí)候,居然<n,這種情況怎么理解 我想的是基因注釋做blast,unigene和NR庫(kù)里的數(shù)據(jù)比對(duì),哪怕不在CDS區(qū)也算是注釋上?可能在非編碼區(qū)比對(duì)上了也就算注釋上了。 還有 我得到的cds序列不是從起始密碼子開始,是不是轉(zhuǎn)錄組CDS預(yù)測(cè)不一定得到完整的cds 因?yàn)樯婕暗綌?shù)據(jù)注釋的一些問題了,也不太了解,求高手解答 |
金蟲 (小有名氣)
|
第一,ncbi nr數(shù)據(jù)庫(kù)不是萬能的,很多基因,尤其是近年來高通量測(cè)序得到的基因并不包含在該數(shù)據(jù)庫(kù)中。 第二,unigene是用轉(zhuǎn)錄組測(cè)序的結(jié)果直接拼接然后去冗余得到的,在進(jìn)行注釋的時(shí)候,不僅僅是參考nr數(shù)據(jù)庫(kù)。在數(shù)據(jù)庫(kù)中沒有同源序列,但有RNA-Seq數(shù)據(jù)支持的也算unigene,注釋可能就是unknown protein. 第三,RNA-Seq是要把cDNA打斷后建立短片段測(cè)序文庫(kù),因此不一定能拼接出完整的轉(zhuǎn)錄本。另一方面,真實(shí)的cDNA也是有UTR的,不是從ATG開始。 |
金蟲 (小有名氣)
| 最具人氣熱帖推薦 [查看全部] | 作者 | 回/看 | 最后發(fā)表 | |
|---|---|---|---|---|