| 3 | 1/1 | 返回列表 |
| 查看: 1732 | 回復(fù): 2 | |||
[交流]
如何通過RNA-Seq了解轉(zhuǎn)錄本的結(jié)構(gòu)
|
|
測序轉(zhuǎn)錄組的方法可不止一種。一些研究人員的目標是計數(shù)轉(zhuǎn)錄本,評估表達水平,則測序可代替DNA芯片。而另一些研究人員感興趣的是轉(zhuǎn)錄本的結(jié)構(gòu)。大家都知道,真核生物的基因常常經(jīng)過選擇性剪接。是否包含特定的外顯子,這有著深遠的生物學(xué)影響。 前一個應(yīng)用比較簡單,也更加廣泛。它與Illumina測序平臺的特征相吻合,這些平臺提供了短的RNA序列,但每次有數(shù)十億個。而對于后一個陣營的研究人員而言,生物信息學(xué)工具和長讀取計數(shù)才是問題的關(guān)鍵。 長長短短的讀取 據(jù)Pacific Biosciences的首席科學(xué)官Jonas Korlach介紹,哺乳動物的轉(zhuǎn)錄本大約在1,000至3,000個堿基,并以多種形式存在。例如,一個基因有5個外顯子,則可能出現(xiàn)各種配置,如12345、1245、1345、245等等。弄清這些不同形式的結(jié)構(gòu)和豐度應(yīng)該不是什么難事,只要測序每個RNA分子并計算其數(shù)量。然而,問題在于目前的測序技術(shù)無法做到這一點。 Illumina的HiSeq v4試劑每次運行大約產(chǎn)生40億個高度準確的讀取,這對轉(zhuǎn)錄組測序而言是足夠了。然而,每個雙端讀取的長度在2 x 125 bp,這就難以確定哪些片段是在一起的。如果這些讀取中包含重復(fù)元件,則很難定位到基因組中。 斯坦福大學(xué)遺傳學(xué)教授Michael Snyder在接受采訪時表示:“你仔細想想,我們研究轉(zhuǎn)錄組的方式是瘋狂的。我們得到RNA,將其炸成碎片,然后又嘗試將它們組合回去,了解轉(zhuǎn)錄組一開始是個什么樣子。這是一種可怕的方式! Pacific Biosciences的單分子測序系統(tǒng)PacBio RS II產(chǎn)生了平均長度在8,500 bp的讀取,這足以覆蓋大多數(shù)的轉(zhuǎn)錄本。但RS II的每個SMRT Cell只產(chǎn)生50,000至80,000個讀取,這對于全面讀取每個轉(zhuǎn)錄本而言還是太少。 混合方法 對于許多研究人員來說,兩全的解決方案就是將兩種方法相結(jié)合。在最近一項發(fā)表于PNAS上的研究中,Snyder的研究團隊采用混合策略,利用PacBio的長讀取和Illumina的短數(shù)據(jù)來測序一位兒童及其父母的淋巴母細胞轉(zhuǎn)錄組。同時,Illumina的讀取也能用來檢查PacBio堿基檢出的錯誤[1]。 華盛頓大學(xué)西北基因組中心的技術(shù)開發(fā)主任Jason Underwood也在H1人胚胎干細胞系的轉(zhuǎn)錄組分析中采用了這種策略[2]。他們的“混合測序(hybrid sequencing)”方法鑒定出H1細胞中表達的數(shù)百個新基因/長鏈非編碼RNA(lncRNA)以及數(shù)千個已知基因的異構(gòu)體。 不過,Underwood并不總是利用短讀取來進行錯誤校正,在分析雞的轉(zhuǎn)錄組結(jié)構(gòu)時,他只使用了長讀取技術(shù)[3]。他利用SMRT測序來產(chǎn)生雞胚胎心臟的全長cDNA,鑒定出9,000多個新穎的轉(zhuǎn)錄異構(gòu)體,以及Ensembl注釋中未包含的500多個基因。 據(jù)Korlach介紹,PacBio的技術(shù)讓研究人員能捕獲全部的轉(zhuǎn)錄本多樣性。在這種稱為Iso-Seq的方法中,用戶合成cDNA并篩分,創(chuàng)建出不同長度的文庫,然后環(huán)化并測序。PacBio的SMRT分析軟件對相同結(jié)構(gòu)的轉(zhuǎn)錄本進行聚類,從而最大限度減少測序錯誤。互補的策略是環(huán)化測序(circular consensus sequencing,CCS),其中cDNA被環(huán)化并反復(fù)測序,以產(chǎn)生更加準確的平均讀取。 鑒于PacBio的讀取次數(shù)相對較低,一些研究人員將這種技術(shù)與選擇一些基因的方法相結(jié)合。在一項最新的研究中,瑞士巴塞爾大學(xué)Peter Scheiffele領(lǐng)導(dǎo)的研究團隊利用PacBio方法,對成年小鼠大腦中的370,000個軸突蛋白轉(zhuǎn)錄本進行測序,鑒定出這個家族中近1,400個獨特的異構(gòu)體[4]。 分析工具 為了理解那些數(shù)據(jù),Scheiffele的團隊使用了一種稱為GMAP的算法程序,這也是Underwood使用的。分析轉(zhuǎn)錄本結(jié)構(gòu)的其他生物信息學(xué)工具包括Cufflinks、SpliceMap和 SigFuge。SigFuge由北卡羅來納大學(xué)教堂山分校D. Neil Hayes副教授的實驗室開發(fā),是一種鑒定有趣的結(jié)構(gòu)變異的工具。Hayes則使用它來鑒定數(shù)千個患者樣本中的癌癥標志物。“如果變異很重要,那么它應(yīng)當是經(jīng)常性的,”他解釋道。有了SigFuge,“我們能夠檢測RNA結(jié)構(gòu)中經(jīng)常性的結(jié)構(gòu)變異! 但是你需要多少序列才能找到它們呢?Hayes認為沒有簡單的答案!耙话銇碚f,越多越好。但是你測序越多,研究就越昂貴!彼J為每個腫瘤轉(zhuǎn)錄組需要6000萬個Illumina讀取。 作為一般準則,Underwood建議對全轉(zhuǎn)錄組分析感興趣的用戶至少分析每個樣品的100萬個讀取!白畹秃妥罡弑磉_的RNA之間可能相差5至6個數(shù)量級,”他說。因此,即使是最稀有的轉(zhuǎn)錄本,100萬個讀取應(yīng)該也夠了。這大約需要PacBio儀器上的20個SMRT cell,或每次運行8個cell,2.5次運行。(Jeffrey M. Perkel ) 參考文獻 [1] Tilgner, H, et al., “Defining a personal, allele-specific, and single-molecule long-read transcriptome,” Proc Natl Acad Sci USA, 111:9869-74, 2014. [PubMed ID: 24961374] [2] Au, KF, et al., “Characterization of the human ESC transcriptome by hybrid sequencing,” Proc Natl Acad Sci USA, 110:E4821–30, published online November 26, 2013, doi: 10.1073/pnas.1320101110. [PubMed ID: 24282307] [3] Thomas, S, et al., “Long-read sequencing of chicken transcripts and identification of new transcript isoforms,” PLoS ONE, 9:e94650, 2014. [PubMed ID: 24736250] [4] Schreiner, D, et al., “Targeted combinatorial alternative splicing generates brain region-specific repertoires of neurexins,” Neuron, in press, 2014. [DOI: 10.1016/j.neuron.2014.09.011] |
至尊木蟲 (文壇精英)
Tortoise

| 3 | 1/1 | 返回列表 |
| 最具人氣熱帖推薦 [查看全部] | 作者 | 回/看 | 最后發(fā)表 | |
|---|---|---|---|---|
|
[考研] 279分求調(diào)劑 一志愿211 +13 | chaojifeixia 2026-03-19 | 14/700 |
|
|---|---|---|---|---|
|
[考研] 332求調(diào)劑 +3 | 鳳凰院丁真 2026-03-20 | 3/150 |
|
|
[考研] 316求調(diào)劑 +6 | 梁茜雯 2026-03-19 | 6/300 |
|
|
[考研] 301求調(diào)劑 +10 | yy要上岸呀 2026-03-17 | 10/500 |
|
|
[考研] 化學(xué)求調(diào)劑 +4 | 臨澤境llllll 2026-03-17 | 5/250 |
|
|
[考研] 297求調(diào)劑 +9 | 戲精丹丹丹 2026-03-17 | 9/450 |
|
|
[考研] 280求調(diào)劑 +7 | 咕嚕曉曉 2026-03-18 | 8/400 |
|
|
[考研] 324分 085600材料化工求調(diào)劑 +4 | llllkkkhh 2026-03-18 | 4/200 |
|
|
[考研] 287求調(diào)劑 +7 | 晨昏線與星海 2026-03-19 | 8/400 |
|
|
[考研] 290求調(diào)劑 +7 | ^O^乜 2026-03-19 | 7/350 |
|
|
[考研] 0817 化學(xué)工程 299分求調(diào)劑 有科研經(jīng)歷 有二區(qū)文章 +22 | rare12345 2026-03-18 | 22/1100 |
|
|
[考研] 260求調(diào)劑 +3 | 朱芷琳 2026-03-20 | 3/150 |
|
|
[考研] 一志愿 南京航空航天大學(xué)大學(xué) ,080500材料科學(xué)與工程學(xué)碩 +5 | @taotao 2026-03-20 | 5/250 |
|
|
[考博] 申博26年 +3 | 八6八68 2026-03-19 | 3/150 |
|
|
[考研] 085600材料與化工調(diào)劑 324分 +10 | llllkkkhh 2026-03-18 | 12/600 |
|
|
[考研] 一志愿985,本科211,0817化學(xué)工程與技術(shù)319求調(diào)劑 +10 | Liwangman 2026-03-15 | 10/500 |
|
|
[考研] 334求調(diào)劑 +3 | 志存高遠意在機?/a> 2026-03-16 | 3/150 |
|
|
[考研] 材料工程專碩274一志愿211求調(diào)劑 +6 | 薛云鵬 2026-03-15 | 6/300 |
|
|
[考研] 中科院材料273求調(diào)劑 +4 | yzydy 2026-03-15 | 4/200 |
|
|
[考研] 26考研一志愿中國石油大學(xué)(華東)305分求調(diào)劑 +3 | 嘉年新程 2026-03-15 | 3/150 |
|