| 3 | 1/1 | 返回列表 |
| 查看: 1733 | 回復: 2 | |||
[交流]
如何通過RNA-Seq了解轉錄本的結構
|
|
測序轉錄組的方法可不止一種。一些研究人員的目標是計數(shù)轉錄本,評估表達水平,則測序可代替DNA芯片。而另一些研究人員感興趣的是轉錄本的結構。大家都知道,真核生物的基因常常經過選擇性剪接。是否包含特定的外顯子,這有著深遠的生物學影響。 前一個應用比較簡單,也更加廣泛。它與Illumina測序平臺的特征相吻合,這些平臺提供了短的RNA序列,但每次有數(shù)十億個。而對于后一個陣營的研究人員而言,生物信息學工具和長讀取計數(shù)才是問題的關鍵。 長長短短的讀取 據(jù)Pacific Biosciences的首席科學官Jonas Korlach介紹,哺乳動物的轉錄本大約在1,000至3,000個堿基,并以多種形式存在。例如,一個基因有5個外顯子,則可能出現(xiàn)各種配置,如12345、1245、1345、245等等。弄清這些不同形式的結構和豐度應該不是什么難事,只要測序每個RNA分子并計算其數(shù)量。然而,問題在于目前的測序技術無法做到這一點。 Illumina的HiSeq v4試劑每次運行大約產生40億個高度準確的讀取,這對轉錄組測序而言是足夠了。然而,每個雙端讀取的長度在2 x 125 bp,這就難以確定哪些片段是在一起的。如果這些讀取中包含重復元件,則很難定位到基因組中。 斯坦福大學遺傳學教授Michael Snyder在接受采訪時表示:“你仔細想想,我們研究轉錄組的方式是瘋狂的。我們得到RNA,將其炸成碎片,然后又嘗試將它們組合回去,了解轉錄組一開始是個什么樣子。這是一種可怕的方式。” Pacific Biosciences的單分子測序系統(tǒng)PacBio RS II產生了平均長度在8,500 bp的讀取,這足以覆蓋大多數(shù)的轉錄本。但RS II的每個SMRT Cell只產生50,000至80,000個讀取,這對于全面讀取每個轉錄本而言還是太少。 混合方法 對于許多研究人員來說,兩全的解決方案就是將兩種方法相結合。在最近一項發(fā)表于PNAS上的研究中,Snyder的研究團隊采用混合策略,利用PacBio的長讀取和Illumina的短數(shù)據(jù)來測序一位兒童及其父母的淋巴母細胞轉錄組。同時,Illumina的讀取也能用來檢查PacBio堿基檢出的錯誤[1]。 華盛頓大學西北基因組中心的技術開發(fā)主任Jason Underwood也在H1人胚胎干細胞系的轉錄組分析中采用了這種策略[2]。他們的“混合測序(hybrid sequencing)”方法鑒定出H1細胞中表達的數(shù)百個新基因/長鏈非編碼RNA(lncRNA)以及數(shù)千個已知基因的異構體。 不過,Underwood并不總是利用短讀取來進行錯誤校正,在分析雞的轉錄組結構時,他只使用了長讀取技術[3]。他利用SMRT測序來產生雞胚胎心臟的全長cDNA,鑒定出9,000多個新穎的轉錄異構體,以及Ensembl注釋中未包含的500多個基因。 據(jù)Korlach介紹,PacBio的技術讓研究人員能捕獲全部的轉錄本多樣性。在這種稱為Iso-Seq的方法中,用戶合成cDNA并篩分,創(chuàng)建出不同長度的文庫,然后環(huán)化并測序。PacBio的SMRT分析軟件對相同結構的轉錄本進行聚類,從而最大限度減少測序錯誤;パa的策略是環(huán)化測序(circular consensus sequencing,CCS),其中cDNA被環(huán)化并反復測序,以產生更加準確的平均讀取。 鑒于PacBio的讀取次數(shù)相對較低,一些研究人員將這種技術與選擇一些基因的方法相結合。在一項最新的研究中,瑞士巴塞爾大學Peter Scheiffele領導的研究團隊利用PacBio方法,對成年小鼠大腦中的370,000個軸突蛋白轉錄本進行測序,鑒定出這個家族中近1,400個獨特的異構體[4]。 分析工具 為了理解那些數(shù)據(jù),Scheiffele的團隊使用了一種稱為GMAP的算法程序,這也是Underwood使用的。分析轉錄本結構的其他生物信息學工具包括Cufflinks、SpliceMap和 SigFuge。SigFuge由北卡羅來納大學教堂山分校D. Neil Hayes副教授的實驗室開發(fā),是一種鑒定有趣的結構變異的工具。Hayes則使用它來鑒定數(shù)千個患者樣本中的癌癥標志物。“如果變異很重要,那么它應當是經常性的,”他解釋道。有了SigFuge,“我們能夠檢測RNA結構中經常性的結構變異! 但是你需要多少序列才能找到它們呢?Hayes認為沒有簡單的答案!耙话銇碚f,越多越好。但是你測序越多,研究就越昂貴!彼J為每個腫瘤轉錄組需要6000萬個Illumina讀取。 作為一般準則,Underwood建議對全轉錄組分析感興趣的用戶至少分析每個樣品的100萬個讀取!白畹秃妥罡弑磉_的RNA之間可能相差5至6個數(shù)量級,”他說。因此,即使是最稀有的轉錄本,100萬個讀取應該也夠了。這大約需要PacBio儀器上的20個SMRT cell,或每次運行8個cell,2.5次運行。(Jeffrey M. Perkel ) 參考文獻 [1] Tilgner, H, et al., “Defining a personal, allele-specific, and single-molecule long-read transcriptome,” Proc Natl Acad Sci USA, 111:9869-74, 2014. [PubMed ID: 24961374] [2] Au, KF, et al., “Characterization of the human ESC transcriptome by hybrid sequencing,” Proc Natl Acad Sci USA, 110:E4821–30, published online November 26, 2013, doi: 10.1073/pnas.1320101110. [PubMed ID: 24282307] [3] Thomas, S, et al., “Long-read sequencing of chicken transcripts and identification of new transcript isoforms,” PLoS ONE, 9:e94650, 2014. [PubMed ID: 24736250] [4] Schreiner, D, et al., “Targeted combinatorial alternative splicing generates brain region-specific repertoires of neurexins,” Neuron, in press, 2014. [DOI: 10.1016/j.neuron.2014.09.011] |
至尊木蟲 (文壇精英)
Tortoise

| 3 | 1/1 | 返回列表 |
| 最具人氣熱帖推薦 [查看全部] | 作者 | 回/看 | 最后發(fā)表 | |
|---|---|---|---|---|
|
[考研] 310求調劑 +3 | baibai1314 2026-03-16 | 3/150 |
|
|---|---|---|---|---|
|
[考研] 070300化學319求調劑 +7 | 錦鯉0909 2026-03-17 | 7/350 |
|
|
[考研] 265求調劑 +3 | Jack?k?y 2026-03-17 | 3/150 |
|
|
[考研] 一志愿中國石油大學(華東) 本科齊魯工業(yè)大學 +3 | 石能偉 2026-03-17 | 3/150 |
|
|
[考研] 一志愿武理材料305分求調劑 +6 | 想上岸的鯉魚 2026-03-18 | 7/350 |
|
|
[考研] 一志愿 西北大學 ,070300化學學碩,總分287,雙非一本,求調劑。 +3 | 晨昏線與星海 2026-03-18 | 3/150 |
|
|
[考研] 323求調劑 +3 | 洼小桶 2026-03-18 | 3/150 |
|
|
[考研] 317求調劑 +5 | 申子申申 2026-03-19 | 9/450 |
|
|
[考研] 290求調劑 +7 | ^O^乜 2026-03-19 | 7/350 |
|
|
[考研] 一志愿福大288有機化學,求調劑 +3 | 小木蟲200408204 2026-03-18 | 3/150 |
|
|
[考研] 材料工程專碩調劑 +5 | 204818@lcx 2026-03-17 | 6/300 |
|
|
[考研] 311求調劑 +6 | 26研0 2026-03-15 | 6/300 |
|
|
[考研] 材料,紡織,生物(0856、0710),化學招生啦 +3 | Eember. 2026-03-17 | 9/450 |
|
|
[考博] 26博士申請 +3 | 1042136743 2026-03-17 | 3/150 |
|
|
[考研] 085601求調劑 +4 | Du.11 2026-03-16 | 4/200 |
|
|
[考研] 材料工程專碩274一志愿211求調劑 +6 | 薛云鵬 2026-03-15 | 6/300 |
|
|
[考研] 326求調劑 +4 | 諾貝爾化學獎覬?/a> 2026-03-15 | 7/350 |
|
|
[考研] 277材料科學與工程080500求調劑 +3 | 自由煎餅果子 2026-03-16 | 3/150 |
|
|
[考研] 070305求調劑 +3 | mlpqaz03 2026-03-14 | 4/200 |
|
|
[考研] 288求調劑 +4 | 奇點0314 2026-03-14 | 4/200 |
|