| 5 | 1/1 | 返回列表 |
| 查看: 1735 | 回復(fù): 2 | |||
| 當(dāng)前只顯示滿足指定條件的回帖,點(diǎn)擊這里查看本話題的所有回帖 | |||
[交流]
如何通過RNA-Seq了解轉(zhuǎn)錄本的結(jié)構(gòu)
|
|||
|
測序轉(zhuǎn)錄組的方法可不止一種。一些研究人員的目標(biāo)是計(jì)數(shù)轉(zhuǎn)錄本,評估表達(dá)水平,則測序可代替DNA芯片。而另一些研究人員感興趣的是轉(zhuǎn)錄本的結(jié)構(gòu)。大家都知道,真核生物的基因常常經(jīng)過選擇性剪接。是否包含特定的外顯子,這有著深遠(yuǎn)的生物學(xué)影響。 前一個應(yīng)用比較簡單,也更加廣泛。它與Illumina測序平臺的特征相吻合,這些平臺提供了短的RNA序列,但每次有數(shù)十億個。而對于后一個陣營的研究人員而言,生物信息學(xué)工具和長讀取計(jì)數(shù)才是問題的關(guān)鍵。 長長短短的讀取 據(jù)Pacific Biosciences的首席科學(xué)官Jonas Korlach介紹,哺乳動物的轉(zhuǎn)錄本大約在1,000至3,000個堿基,并以多種形式存在。例如,一個基因有5個外顯子,則可能出現(xiàn)各種配置,如12345、1245、1345、245等等。弄清這些不同形式的結(jié)構(gòu)和豐度應(yīng)該不是什么難事,只要測序每個RNA分子并計(jì)算其數(shù)量。然而,問題在于目前的測序技術(shù)無法做到這一點(diǎn)。 Illumina的HiSeq v4試劑每次運(yùn)行大約產(chǎn)生40億個高度準(zhǔn)確的讀取,這對轉(zhuǎn)錄組測序而言是足夠了。然而,每個雙端讀取的長度在2 x 125 bp,這就難以確定哪些片段是在一起的。如果這些讀取中包含重復(fù)元件,則很難定位到基因組中。 斯坦福大學(xué)遺傳學(xué)教授Michael Snyder在接受采訪時表示:“你仔細(xì)想想,我們研究轉(zhuǎn)錄組的方式是瘋狂的。我們得到RNA,將其炸成碎片,然后又嘗試將它們組合回去,了解轉(zhuǎn)錄組一開始是個什么樣子。這是一種可怕的方式! Pacific Biosciences的單分子測序系統(tǒng)PacBio RS II產(chǎn)生了平均長度在8,500 bp的讀取,這足以覆蓋大多數(shù)的轉(zhuǎn)錄本。但RS II的每個SMRT Cell只產(chǎn)生50,000至80,000個讀取,這對于全面讀取每個轉(zhuǎn)錄本而言還是太少。 混合方法 對于許多研究人員來說,兩全的解決方案就是將兩種方法相結(jié)合。在最近一項(xiàng)發(fā)表于PNAS上的研究中,Snyder的研究團(tuán)隊(duì)采用混合策略,利用PacBio的長讀取和Illumina的短數(shù)據(jù)來測序一位兒童及其父母的淋巴母細(xì)胞轉(zhuǎn)錄組。同時,Illumina的讀取也能用來檢查PacBio堿基檢出的錯誤[1]。 華盛頓大學(xué)西北基因組中心的技術(shù)開發(fā)主任Jason Underwood也在H1人胚胎干細(xì)胞系的轉(zhuǎn)錄組分析中采用了這種策略[2]。他們的“混合測序(hybrid sequencing)”方法鑒定出H1細(xì)胞中表達(dá)的數(shù)百個新基因/長鏈非編碼RNA(lncRNA)以及數(shù)千個已知基因的異構(gòu)體。 不過,Underwood并不總是利用短讀取來進(jìn)行錯誤校正,在分析雞的轉(zhuǎn)錄組結(jié)構(gòu)時,他只使用了長讀取技術(shù)[3]。他利用SMRT測序來產(chǎn)生雞胚胎心臟的全長cDNA,鑒定出9,000多個新穎的轉(zhuǎn)錄異構(gòu)體,以及Ensembl注釋中未包含的500多個基因。 據(jù)Korlach介紹,PacBio的技術(shù)讓研究人員能捕獲全部的轉(zhuǎn)錄本多樣性。在這種稱為Iso-Seq的方法中,用戶合成cDNA并篩分,創(chuàng)建出不同長度的文庫,然后環(huán)化并測序。PacBio的SMRT分析軟件對相同結(jié)構(gòu)的轉(zhuǎn)錄本進(jìn)行聚類,從而最大限度減少測序錯誤;パa(bǔ)的策略是環(huán)化測序(circular consensus sequencing,CCS),其中cDNA被環(huán)化并反復(fù)測序,以產(chǎn)生更加準(zhǔn)確的平均讀取。 鑒于PacBio的讀取次數(shù)相對較低,一些研究人員將這種技術(shù)與選擇一些基因的方法相結(jié)合。在一項(xiàng)最新的研究中,瑞士巴塞爾大學(xué)Peter Scheiffele領(lǐng)導(dǎo)的研究團(tuán)隊(duì)利用PacBio方法,對成年小鼠大腦中的370,000個軸突蛋白轉(zhuǎn)錄本進(jìn)行測序,鑒定出這個家族中近1,400個獨(dú)特的異構(gòu)體[4]。 分析工具 為了理解那些數(shù)據(jù),Scheiffele的團(tuán)隊(duì)使用了一種稱為GMAP的算法程序,這也是Underwood使用的。分析轉(zhuǎn)錄本結(jié)構(gòu)的其他生物信息學(xué)工具包括Cufflinks、SpliceMap和 SigFuge。SigFuge由北卡羅來納大學(xué)教堂山分校D. Neil Hayes副教授的實(shí)驗(yàn)室開發(fā),是一種鑒定有趣的結(jié)構(gòu)變異的工具。Hayes則使用它來鑒定數(shù)千個患者樣本中的癌癥標(biāo)志物!叭绻儺惡苤匾敲此鼞(yīng)當(dāng)是經(jīng)常性的,”他解釋道。有了SigFuge,“我們能夠檢測RNA結(jié)構(gòu)中經(jīng)常性的結(jié)構(gòu)變異! 但是你需要多少序列才能找到它們呢?Hayes認(rèn)為沒有簡單的答案!耙话銇碚f,越多越好。但是你測序越多,研究就越昂貴!彼J(rèn)為每個腫瘤轉(zhuǎn)錄組需要6000萬個Illumina讀取。 作為一般準(zhǔn)則,Underwood建議對全轉(zhuǎn)錄組分析感興趣的用戶至少分析每個樣品的100萬個讀取!白畹秃妥罡弑磉_(dá)的RNA之間可能相差5至6個數(shù)量級,”他說。因此,即使是最稀有的轉(zhuǎn)錄本,100萬個讀取應(yīng)該也夠了。這大約需要PacBio儀器上的20個SMRT cell,或每次運(yùn)行8個cell,2.5次運(yùn)行。(Jeffrey M. Perkel ) 參考文獻(xiàn) [1] Tilgner, H, et al., “Defining a personal, allele-specific, and single-molecule long-read transcriptome,” Proc Natl Acad Sci USA, 111:9869-74, 2014. [PubMed ID: 24961374] [2] Au, KF, et al., “Characterization of the human ESC transcriptome by hybrid sequencing,” Proc Natl Acad Sci USA, 110:E4821–30, published online November 26, 2013, doi: 10.1073/pnas.1320101110. [PubMed ID: 24282307] [3] Thomas, S, et al., “Long-read sequencing of chicken transcripts and identification of new transcript isoforms,” PLoS ONE, 9:e94650, 2014. [PubMed ID: 24736250] [4] Schreiner, D, et al., “Targeted combinatorial alternative splicing generates brain region-specific repertoires of neurexins,” Neuron, in press, 2014. [DOI: 10.1016/j.neuron.2014.09.011] |
至尊木蟲 (文壇精英)
Tortoise

| 最具人氣熱帖推薦 [查看全部] | 作者 | 回/看 | 最后發(fā)表 | |
|---|---|---|---|---|
|
[考研] 求調(diào)劑 +4 | 要好好無聊 2026-03-21 | 4/200 |
|
|---|---|---|---|---|
|
[考研] 化學(xué)調(diào)劑 +4 | yzysaa 2026-03-21 | 4/200 |
|
|
[考研] 278求調(diào)劑 +9 | 煙火先于春 2026-03-17 | 9/450 |
|
|
[考研] 求調(diào)劑 +3 | .m.. 2026-03-21 | 4/200 |
|
|
[考研] 材料與化工(0856)304求 B區(qū) 調(diào)劑 +3 | 邱gl 2026-03-21 | 3/150 |
|
|
[考研] 一志愿山大07化學(xué) 332分 四六級已過 本科山東雙非 求調(diào)劑! +3 | 不想理你 2026-03-16 | 3/150 |
|
|
[考研] 310求調(diào)劑 +3 | baibai1314 2026-03-16 | 3/150 |
|
|
[考研] 一志愿西南交大,求調(diào)劑 +5 | 材化逐夢人 2026-03-18 | 5/250 |
|
|
[考研] 一志愿武理材料工程348求調(diào)劑 +3 |  ̄^ ̄゜汗 2026-03-19 | 4/200 |
|
|
[考研] 289求調(diào)劑 +6 | 懷瑾握瑜l 2026-03-20 | 6/300 |
|
|
[考研] 一志愿 南京航空航天大學(xué)大學(xué) ,080500材料科學(xué)與工程學(xué)碩 +5 | @taotao 2026-03-20 | 5/250 |
|
|
[考研] 085410人工智能專碩317求調(diào)劑(0854都可以) +4 | xbxudjdn 2026-03-18 | 4/200 |
|
|
[考研] 081700化工學(xué)碩調(diào)劑 +3 | 【1】 2026-03-16 | 3/150 |
|
|
[考研]
|
不想起名字112 2026-03-19 | 3/150 |
|
|
[考研] 288求調(diào)劑,一志愿華南理工大學(xué)071005 +5 | ioodiiij 2026-03-17 | 5/250 |
|
|
[考研] 085601求調(diào)劑 +4 | Du.11 2026-03-16 | 4/200 |
|
|
[考研] 290求調(diào)劑 +3 | p asserby. 2026-03-15 | 4/200 |
|
|
[考研] 考研調(diào)劑 +3 | 淇ya_~ 2026-03-17 | 5/250 |
|
|
[考研] 333求調(diào)劑 +3 | 文思客 2026-03-16 | 7/350 |
|
|
[考研] 0856專碩279求調(diào)劑 +5 | 加油加油!? 2026-03-15 | 5/250 |
|