亭亭五月天在线观看,亭亭五月天在线观看,国产最新av一区二区,国产 高清 中文字幕,99re热久久亚洲综合精品成人,熟妇 一区二区三区,一级做a爰片性色毛片武则天,美女的骚穴视频播放,国产美女午夜免费视频

24小時熱門版塊排行榜    

查看: 13224  |  回復(fù): 87

BlueGuy

榮譽版主 (正式寫手)

懶懶的小蟲蟲

[交流] 生物信息學(xué)專題-生物版,醫(yī)學(xué)版和信息科學(xué)版共同創(chuàng)建 已有2人參與

為進一步建好小木蟲的專業(yè)學(xué)科版,現(xiàn)由生物版、醫(yī)學(xué)版和信息科學(xué)版共同創(chuàng)建生物信息學(xué)專題,歡迎大家積極參與!
引用回帖:

友情鏈接:生物版碩博研究生入學(xué)考試專題!重金懸賞!更新中......
http://www.gaoyang168.com/bbs/viewthread.php?tid=95236&fpage=2

[ Last edited by fishery on 2005-6-16 at 21:05 ]
回復(fù)此樓

» 收錄本帖的淘帖專輯推薦

生物信息學(xué) 高通量測序 生物信息-分析與挖掘 ENVIRON TECHNOL
劉安安

» 本帖已獲得的紅花(最新10朵)

» 猜你喜歡

» 本主題相關(guān)價值貼推薦,對您同樣有幫助:

已閱   回復(fù)此樓   關(guān)注TA 給TA發(fā)消息 送TA紅花 TA的回帖
回帖支持 ( 顯示支持度最高的前 50 名 )

miRNA

至尊木蟲 (職業(yè)作家)

水王之王(愚愚學(xué)園管理員)


BlueGuy(金幣+1):好!
序列搜索和檢索

★Integrated Database Retrieval Systems

★Entrez
http://www.ncbi.nlm.nih.gov/Entrez/default.htm  

★Sequence Retrieval System (SRS)
http://www.seqnet.dl.ac.uk/srs/srsc   

★The Institute for Genomic Research (TIGR), Human Gene Index (HGI) Sequence Search
4-1-2-DDPDE/USA
http://www.tigr.org/tdb/hgi/searching/hgi_seq_search.html  
Search for nucleotides and peptides.

★TIGR HGI Reports
3-1-2-DDcW/USA
http://www.tigr.org/tdb/hgi/searching/hgi_info.html  
Retrieve sequences identified by EST ID, GenBank number etc.

★TIGR HGI Gene Expression Data
4-2-1-DDcW/USA
http://www.tigr.org/tdb/hgi/searching/hgi_xpress_search.html  
Search for tissue specific transcripts e.g. "lung". cDNA libraries can also be searched.


★TIGR HGI Name Search
5-1-2-DDW/USA
http://www.tigr.org/tdb/hgi/searching/hgi_name_search.html  
Search for a sequence by the name of a gene product e.g. insulin.

★Genome Database (GDB)
http://hgmp.mrc.ac.uk/gdb or http://gdbwww.gdb.org/default.htm  
Funding for this project has been withdrawn. This valuable database will remain online, but it should be noted that no new entries will be recorded after 31st July 1998.


序列列線
★Analysis and Annotation Tool for Finding Genes in Genomic Sequences
5-3-2-DcDPDFWE/USA
http://genome.cs.mtu.edu/aat.html  
Identifies genes in a DNA sequence by comparing it to cDNA and protein sequence databases (including those at HGI, TIGR, dbEST, Swiss-Prot and nr).

★Pairwise Sequence Alignment
3-4-2-DcUPUFWE/USA
http://genome.cs.mtu.edu/align/align.html  
Computes the global alignment between two sequences. Compare DNA with DNA, cDNA or protein. For DNA and cDNA, settings (gap open penalty, gap extension etc.) can be defined.

★Multiple Sequence Alignemnt with MAP
4-3-2-DcUPUFWE/USA
http://genome.cs.mtu.edu/map/map.html  
Calculates the global alignment of DNA or protein sequences using an algorithm which computes the best overlapping alignment without penalising terminal gaps. Long internal gaps in short sequences are not penalised.

★Network Protein Sequence Analysis
5-4-1-PUW/France
http://pbil.ibcp.fr/NPSA/npsa_clustalw.html  
ClustalW multiple sequence alignment.

★ALIGN
5-1-1-DUPUWE/France
http://www2.igh.cnrs.fr/bin/align-guess.cgi  or http://genome.eerie.fr/fasta/align-query.html  
Applies the BLOSUM50 matrix to deduce the optimal alignment between two sequences.

★Multiple Sequence Alignment with Hierarchial Clustering
5-5-3-PUW/France
http://www.toulouse.inra.fr/multalin.html  
Sequence alignment with a colour output where differing or similar amino acids in the alignment can be highlighted.

★Colour INteractive Editor for Multiple Alignments (CINEMA)
http://www.biochem.ucl.ac.uk/bsm/dbbrowser/CINEMA2.1/default.htm  
A comprehensive and popular site. Allows the user to visualise and manipulate aligned protein sequences.
Makes use of Java. I recommend you access this site from a fast workstation!

★VSNS BioComputing Division Multiple Alignment Resource Page
http://www.techfak.uni-bielefeld.de/bcd/Curric/MulAli/default.htm  
An excellent, comprehensive resource for multiple sequence alignment, software and tutorials.  


新序列發(fā)送:

★EMBL
http://www.ebi.ac.uk/subs/emblsubs.html  

★BankIt (GenBank)
http://www.ncbi.nlm.nih.gov/default.htm

[ Last edited by miRNA on 2005-6-7 at 22:19 ]
〖愚愚學(xué)園〗http://www.scifans.net免費代理|免費期刊|ezproxy|文獻檢索|學(xué)術(shù)資源|免費資源
20樓2005-06-07 22:13:09
已閱   回復(fù)此樓   關(guān)注TA 給TA發(fā)消息 送TA紅花 TA的回帖
普通回帖

BlueGuy

榮譽版主 (正式寫手)

懶懶的小蟲蟲


miRNA(金幣+1):謝謝!
不錯的高通量表達譜分析講座(轉(zhuǎn)自dxy)
2樓2005-06-07 16:23:53
已閱   回復(fù)此樓   關(guān)注TA 給TA發(fā)消息 送TA紅花 TA的回帖

BlueGuy

榮譽版主 (正式寫手)

懶懶的小蟲蟲

★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ...
miRNA(金幣+2):謝謝!!
liubird(金幣+50):支持斑竹開展有意義的活動!
概述

當(dāng)前人類基因組研究已進入一個重要時期,2004年已獲得人類基因組的全部序列,這是基因組研究的轉(zhuǎn)折點和關(guān)鍵時刻,意味著人類基因組的研究將全面進入信息提取和數(shù)據(jù)分析階段,即生物信息學(xué)發(fā)揮重要作用的階段。到1999年12月15日發(fā)布的第115版為止,GenBank中的DNA堿基數(shù)目已達46億5千萬,DNA序列數(shù)目達到535萬;其中EST序列超過339萬條; UniGene的數(shù)目已達到7萬個;已有25個模式生物的完整基因組被測序完成,另外的70個模式生物基因組正在測序當(dāng)中;到2005年初為止,人類基因組的序列完成測定;同時功能基因組和蛋白質(zhì)組的大量數(shù)據(jù)已開始涌現(xiàn)。如何分析這些數(shù)據(jù),從中獲得生物結(jié)構(gòu)、功能的相關(guān)信息是基因組研究取得成果的決定性步驟。

生物信息學(xué)是在此背景下發(fā)展起來的綜合運用生物學(xué)、數(shù)學(xué)、物理學(xué)、信息科學(xué)以及計算機科學(xué)等諸多學(xué)科的理論方法的嶄新交叉學(xué)科。生物信息學(xué)是內(nèi)涵非常豐富的學(xué)科,其核心是基因組信息學(xué),包括基因組信息的獲取、處理、存儲、分配和解釋;蚪M信息學(xué)的關(guān)鍵是“讀懂”基因組的核苷酸順序,即全部基因在染色體上的確切位置以及各DNA片段的功能;同時在發(fā)現(xiàn)了新基因信息之后進行蛋白質(zhì)空間結(jié)構(gòu)模擬和預(yù)測,然后依據(jù)特定蛋白質(zhì)的功能進行藥物設(shè)計。了解基因表達的調(diào)控機理也是生物信息學(xué)的重要內(nèi)容,根據(jù)生物分子在基因調(diào)控中的作用,描述人類疾病的診斷、治療內(nèi)在規(guī)律。它的研究目標是揭示"基因組信息結(jié)構(gòu)的復(fù)雜性及遺傳語言的根本規(guī)律",解釋生命的遺傳語言。生物信息學(xué)已成為整個生命科學(xué)發(fā)展的重要組成部分,成為生命科學(xué)研究的前沿。

近來的研究表明,基因組不僅是基因的簡單排列,它有其特有的組織結(jié)構(gòu)和信息結(jié)構(gòu),這種結(jié)構(gòu)是在長期的演化過程中產(chǎn)生的,也是基因發(fā)揮其功能所必須的。弄清楚生物體基因組特有的組織結(jié)構(gòu)和信息結(jié)構(gòu),解譯生命的遺傳語言的關(guān)鍵。

目前在數(shù)據(jù)庫中已經(jīng)有越來越多的模式生物全基因組序列,第一個人類染色體全序列--第22號染色體的測序工作已經(jīng)在1999年12月完成,整個人類基因組計劃工作草圖將在最近完成。這無疑給基因組組織結(jié)構(gòu)和信息結(jié)構(gòu)的研究工作提供了大量的第一手材料,同時也為基因組研究取得突破性進展提供了可能。人類對基因的認識,將從以往的對單個基因的了解,上升到在整個基因組水平上考察基因的組織結(jié)構(gòu)和信息結(jié)構(gòu),考察基因之間在位置、結(jié)構(gòu)和功能上的相互關(guān)系。

從目前生物信息學(xué)的研究情況來看,國際上公認的生物信息學(xué)的研究內(nèi)容,大致包括以下幾個方面:

生物信息的收集、存儲、管理與提供。包括建立國際基本生物信息庫和生物信息傳輸?shù)膰H聯(lián)網(wǎng)系統(tǒng);建立生物信息數(shù)據(jù)質(zhì)量的評估與檢測系統(tǒng);生物信息的在線服務(wù);生物信息可視化和專家系統(tǒng)。
基因組序列信息的提取和分析。包括基因的發(fā)現(xiàn)與鑒定,如利用國際EST 數(shù)據(jù)庫 (dbEST) 和各自實驗室測定的相應(yīng)數(shù)據(jù),經(jīng)過大規(guī)模 并行計算發(fā)現(xiàn)新基因和新SNPs以及各種功能位點;基因組中非編碼區(qū)的信息結(jié)構(gòu)分析,提出理論模型,闡明該區(qū)域的重要生物學(xué)功能;進行模式生物完整基因組的信息結(jié)構(gòu)分析和比較研究;利用生物信息研究遺傳密碼起源、基因組結(jié)構(gòu)的演化、基因組空間結(jié)構(gòu)與DNA折疊的關(guān)系以及基因組信息與生物進化關(guān)系等生物學(xué)的重大問題。
功能基因組相關(guān)信息分析。包括與大規(guī)模基因表達譜分析相關(guān)的算法、軟件研究,基因表達調(diào)控網(wǎng)絡(luò)的研究;與基因組信息相關(guān)的核酸、蛋白質(zhì)空間結(jié)構(gòu)的預(yù)測和模擬,以及蛋白質(zhì)功能預(yù)測的研究。
生物大分子結(jié)構(gòu)模擬和藥物設(shè)計。包括RNA(核糖核酸)的結(jié)構(gòu)模擬和反義RNA的分子設(shè)計;蛋白質(zhì)空間結(jié)構(gòu)模擬和分子設(shè)計;具有不同功能域的復(fù)合蛋白質(zhì)以及連接肽的設(shè)計;生物活性分子的電子結(jié)構(gòu)計算和設(shè)計;納米生物材料的模擬與設(shè)計;基于酶和功能蛋白質(zhì)結(jié)構(gòu)、細胞表面受體結(jié)構(gòu)的藥物設(shè)計;基于DNA結(jié)構(gòu)的藥物設(shè)計等。
生物信息分析的技術(shù)與方法研究。包括發(fā)展有效的能支持大尺度作圖與測序需要的軟件、數(shù)據(jù)庫以及若干數(shù)據(jù)庫工具,諸如電子網(wǎng)絡(luò)等遠程通訊工具;改進現(xiàn)有的理論分析方法,如統(tǒng)計方法、模式識別方法、隱馬爾科夫過程方法、分維方法、神經(jīng)網(wǎng)絡(luò)方法、復(fù)雜性分析方法、密碼學(xué)方法、多序列比較方法等;創(chuàng)建一切適用于基因組信息分析的新方法、新技術(shù)。包括引入復(fù)雜系統(tǒng)分析技術(shù)、信息系統(tǒng)分析技術(shù)等;建立嚴格的多序列比較方法;發(fā)展與應(yīng)用密碼學(xué)方法以及其他算法和分析技術(shù),用于解釋基因組的信息,探索DNA序列及其空間結(jié)構(gòu)信息的新表征;發(fā)展研究基因組完整信息結(jié)構(gòu)和信息網(wǎng)絡(luò)的研究方法等;發(fā)展生物大分子空間結(jié)構(gòu)模擬、電子結(jié)構(gòu)模擬和藥物設(shè)計的新方法與新技術(shù)。
應(yīng)用與發(fā)展研究。匯集與疾病相關(guān)的人類基因信息,發(fā)展患者樣品序列信息檢測技術(shù)和基于序列信息選擇表達載體、引物的技術(shù),建立與動植物良種繁育相關(guān)的數(shù)據(jù)庫以及與大分子設(shè)計和藥物設(shè)計相關(guān)的數(shù)據(jù)庫。
利用生物信息學(xué)方法進行結(jié)構(gòu)功能預(yù)測要注意的是同一問題采用不同算法,可能產(chǎn)生相同或不同的結(jié)果。因此,必要弄清楚某種方法的基本原理,而不是僅把算法當(dāng)作一個“黑箱”。因為一種方法可能對特定實例很合適,而對另一個則完全不對。因此,本章采用原理和實用方法并重的原則進行介紹。因生物信息學(xué)覆蓋面廣,限于篇幅,本章并未將生物信息學(xué)的全部內(nèi)容詳細加以講述,僅針對與目前分子生物學(xué)實驗數(shù)據(jù)分析密切相關(guān)的生物信息學(xué)策略及實用工具進行扼要介紹,文中涉及問題的更詳細信息可參考相關(guān)網(wǎng)站。

[ Last edited by BlueGuy on 2005-6-7 at 16:47 ]
3樓2005-06-07 16:44:41
已閱   回復(fù)此樓   關(guān)注TA 給TA發(fā)消息 送TA紅花 TA的回帖

BlueGuy

榮譽版主 (正式寫手)

懶懶的小蟲蟲

★ ★
miRNA(金幣+1):謝謝。
zhlpower(金幣+1):繼續(xù)加油
2 生物信息數(shù)據(jù)庫與查詢

近年來大量生物學(xué)實驗的數(shù)據(jù)積累,形成了當(dāng)前數(shù)以百計的生物信息數(shù)據(jù)庫。它們各自按一定的目標收集和整理生物學(xué)實驗數(shù)據(jù),并提供相關(guān)的數(shù)據(jù)查詢、數(shù)據(jù)處理的服務(wù)。隨著因特網(wǎng)的普及,這些數(shù)據(jù)庫大多可以通過網(wǎng)絡(luò)來訪問,或者通過網(wǎng)絡(luò)下載。

一般而言,這些生物信息數(shù)據(jù)庫可以分為一級數(shù)據(jù)庫和二級數(shù)據(jù)庫。一級數(shù)據(jù)庫的數(shù)據(jù)都直接來源于實驗獲得的原始數(shù)據(jù),只經(jīng)過簡單的歸類整理和注釋;二級數(shù)據(jù)庫是在一級數(shù)據(jù)庫、實驗數(shù)據(jù)和理論分析的基礎(chǔ)上針對特定目標衍生而來,是對生物學(xué)知識和信息的進一步整理。國際上著名的一級核酸數(shù)據(jù)庫有Genbank數(shù)據(jù)庫、EMBL核酸庫和DDBJ庫等;蛋白質(zhì)序列數(shù)據(jù)庫有SWISS-PROT、PIR等;蛋白質(zhì)結(jié)構(gòu)庫有PDB等。國際上二級生物學(xué)數(shù)據(jù)庫非常多,它們因針對不同的研究內(nèi)容和需要而各具特色,如人類基因組圖譜庫GDB、轉(zhuǎn)錄因子和結(jié)合位點庫TRANSFAC、蛋白質(zhì)結(jié)構(gòu)家族分類庫SCOP等等。

下面將順序簡要介紹一些著名和有特色的生物信息數(shù)據(jù)庫。

2.1 基因和基因組數(shù)據(jù)庫

1. Genbank

Genbank庫包含了所有已知的核酸序列和蛋白質(zhì)序列,以及與它們相關(guān)的文獻著作和生物學(xué)注釋。它是由美國國立生物技術(shù)信息中心(NCBI)建立和維護的。它的數(shù)據(jù)直接來源于測序工作者提交的序列;由測序中心提交的大量EST序列和其它測序數(shù)據(jù);以及與其它數(shù)據(jù)機構(gòu)協(xié)作交換數(shù)據(jù)而來。Genbank每天都會與歐洲分子生物學(xué)實驗室(EMBL)的數(shù)據(jù)庫,和日本的DNA數(shù)據(jù)庫(DDBJ)交換數(shù)據(jù),使這三個數(shù)據(jù)庫的數(shù)據(jù)同步。到1999年8月,Genbank中收集的序列數(shù)量達到460萬條,34億個堿基,而且數(shù)據(jù)增長的速度還在不斷加快。Genbank的數(shù)據(jù)可以從NCBI的FTP服務(wù)器上免費下載完整的庫,或下載積累的新數(shù)據(jù)。NCBI還提供廣泛的數(shù)據(jù)查詢、序列相似性搜索以及其它分析服務(wù),用戶可以從NCBI的主頁上找到這些服務(wù)。

Genbank庫里的數(shù)據(jù)按來源于約55,000個物種,其中56%是人類的基因組序列(所有序列中的34%是人類的EST序列)。每條Genbank數(shù)據(jù)記錄包含了對序列的簡要描述,它的科學(xué)命名,物種分類名稱,參考文獻,序列特征表,以及序列本身。序列特征表里包含對序列生物學(xué)特征注釋如:編碼區(qū)、轉(zhuǎn)錄單元、重復(fù)區(qū)域、突變位點或修飾位點等。所有數(shù)據(jù)記錄被劃分在若干個文件里,如細菌類、病毒類、靈長類、嚙齒類,以及EST數(shù)據(jù)、基因組測序數(shù)據(jù)、大規(guī)模基因組序列數(shù)據(jù)等16類,其中EST數(shù)據(jù)等又被各自分成若干個文件。

(1)Genbank數(shù)據(jù)檢索

NCBI的數(shù)據(jù)庫檢索查詢系統(tǒng)是Entrez。Entrez是基于Web界面的綜合生物信息數(shù)據(jù)庫檢索系統(tǒng)。利用Entrez系統(tǒng),用戶不僅可以方便地檢索Genbank的核酸數(shù)據(jù),還可以檢索來自Genbank和其它數(shù)據(jù)庫的蛋白質(zhì)序列數(shù)據(jù)、基因組圖譜數(shù)據(jù)、來自分子模型數(shù)據(jù)庫(MMDB)的蛋白質(zhì)三維結(jié)構(gòu)數(shù)據(jù)、種群序列數(shù)據(jù)集、以及由PubMed獲得Medline的文獻數(shù)據(jù)。

Entrez提供了方便實用的檢索服務(wù),所有操作都可以在網(wǎng)絡(luò)瀏覽器上完成。用戶可以利用Entrez界面上提供的限制條件(Limits)、索引(Index)、檢索歷史(History)和剪貼板(Clipboard)等功能來實現(xiàn)復(fù)雜的檢索查詢工作。對于檢索獲得的記錄,用戶可以選擇需要顯示的數(shù)據(jù),保存查詢結(jié)果,甚至以圖形方式觀看檢索獲得的序列。更詳細的Entrez使用說明可以在該主頁上獲得。

(2)向Genbank提交序列數(shù)據(jù)

測序工作者可以把自己工作中獲得的新序列提交給NCBI,添加到Genbank數(shù)據(jù)庫。這個任務(wù)可以由基于Web界面的BankIt或獨立程序Sequin來完成。

BankIt是一系列表單,包括聯(lián)絡(luò)信息、發(fā)布要求、引用參考信息、序列來源信息、以及序列本身的信息等。用戶提交序列后,會從電子郵件收到自動生成的數(shù)據(jù)條目,Genbank的新序列編號,以及完成注釋后的完整的數(shù)據(jù)記錄。用戶還可以在BankIt頁面下修改已經(jīng)發(fā)布序列的信息。BankIt適合于獨立測序工作者提交少量序列,而不適合大量序列的提交,也不適合提交很長的序列,EST序列和GSS序列也不應(yīng)用BankIt提交。BankIt使用說明和對序列的要求可詳見其主頁面。

大量的序列提交可以由Sequin程序完成。Sequin程序能方便的編輯和處理復(fù)雜注釋,并包含一系列內(nèi)建的檢查函數(shù)來提高序列的質(zhì)量保證。它還被設(shè)計用于提交來自系統(tǒng)進化、種群和突變研究的序列,可以加入比對的數(shù)據(jù)。Sequin除了用于編輯和修改序列數(shù)據(jù)記錄,還可以用于序列的分析,任何以FASTA或ASN.1格式序列為輸入數(shù)據(jù)的序列分析程序都可以整合到Sequin程序下。在不同操作系統(tǒng)下運行的Sequin程序都可以在ftp://ncbi.nlm.nih.gov/sequin/下找到,Sequin的使用說明可詳見其網(wǎng)頁。

NCBI的網(wǎng)址是:http://www.ncbi.nlm.nih.gov

Entrez的網(wǎng)址是:http://www.ncbi.nlm.nih.gov/entrez/。

BankIt的網(wǎng)址是:http://www.ncbi.nlm.nih.gov/BankIt

Sequin的相關(guān)網(wǎng)址是:http://www.ncbi.nlm.nih.gov/Sequin/。

2. EMBL核酸序列數(shù)據(jù)庫

EMBL核酸序列數(shù)據(jù)庫由歐洲生物信息學(xué)研究所(EBI)維護的核酸序列數(shù)據(jù)構(gòu)成,由于與Genbank和DDBJ的數(shù)據(jù)合作交換,它也是一個全面的核酸序列數(shù)據(jù)庫。該數(shù)據(jù)庫由Oracal數(shù)據(jù)庫系統(tǒng)管理維護,查詢檢索可以通過通過因特網(wǎng)上的序列提取系統(tǒng)(SRS)服務(wù)完成。向EMBL核酸序列數(shù)據(jù)庫提交序列可以通過基于Web的WEBIN工具,也可以用Sequin軟件來完成。

數(shù)據(jù)庫網(wǎng)址是:http://www.ebi.ac.uk/embl/

SRS的網(wǎng)址是:http://srs.ebi.ac.uk/。

WEBIN的網(wǎng)址是:http://www.ebi.ac.uk/embl/Submission/webin.html。

3. DDBJ數(shù)據(jù)庫

日本DNA數(shù)據(jù)倉庫(DDBJ)也是一個全面的核酸序列數(shù)據(jù)庫,與Genbank和EMBL核酸庫合作交換數(shù)據(jù)?梢允褂闷渲黜撋咸峁┑腟RS工具進行數(shù)據(jù)檢索和序列分析?梢杂肧equin軟件向該數(shù)據(jù)庫提交序列。

DDBJ的網(wǎng)址是:http://www.ddbj.nig.ac.jp/。

4. GDB

基因組數(shù)據(jù)庫(GDB)為人類基因組計劃(HGP)保存和處理基因組圖譜數(shù)據(jù)。GDB的目標是構(gòu)建關(guān)于人類基因組的百科全書,除了構(gòu)建基因組圖譜之外,還開發(fā)了描述序列水平的基因組內(nèi)容的方法,包括序列變異和其它對功能和表型的描述。目前GDB中有:人類基因組區(qū)域(包括基因、克隆、amplimers PCR 標記、斷點breakpoints、細胞遺傳標記cytogenetic markers、易碎位點fragile sites、EST序列、綜合區(qū)域syndromic regions、contigs和重復(fù)序列);人類基因組圖譜(包括細胞遺傳圖譜、連接圖譜、放射性雜交圖譜、content contig圖譜和綜合圖譜等);人類基因組內(nèi)的變異(包括突變和多態(tài)性,加上等位基因頻率數(shù)據(jù))。GDB數(shù)據(jù)庫以對象模型來保存數(shù)據(jù),提供基于Web的數(shù)據(jù)對象檢索服務(wù),用戶可以搜索各種類型的對象,并以圖形方式觀看基因組圖譜。

GDB的網(wǎng)址是:http://www.gdb.org。

GDB的國內(nèi)鏡像是:http://gdb.pku.edu.cn/gdb/

2.2 蛋白質(zhì)數(shù)據(jù)庫

1. PIR和PSD

PIR國際蛋白質(zhì)序列數(shù)據(jù)庫(PSD)是由蛋白質(zhì)信息資源(PIR)、慕尼黑蛋白質(zhì)序列信息中心(MIPS)和日本國際蛋白質(zhì)序列數(shù)據(jù)庫(JIPID)共同維護的國際上最大的公共蛋白質(zhì)序列數(shù)據(jù)庫。這是一個全面的、經(jīng)過注釋的、非冗余的蛋白質(zhì)序列數(shù)據(jù)庫,包含超過142,000條蛋白質(zhì)序列(至99年9月),其中包括來自幾十個完整基因組的蛋白質(zhì)序列。所有序列數(shù)據(jù)都經(jīng)過整理,超過99%的序列已按蛋白質(zhì)家族分類,一半以上還按蛋白質(zhì)超家族進行了分類。PSD的注釋中還包括對許多序列、結(jié)構(gòu)、基因組和文獻數(shù)據(jù)庫的交叉索引,以及數(shù)據(jù)庫內(nèi)部條目之間的索引,這些內(nèi)部索引幫助用戶在包括復(fù)合物、酶-底物相互作用、活化和調(diào)控級聯(lián)和具有共同特征的條目之間方便的檢索。每季度都發(fā)行一次完整的數(shù)據(jù)庫,每周可以得到更新部分。

PSD數(shù)據(jù)庫有幾個輔助數(shù)據(jù)庫,如基于超家族的非冗余庫等。PIR提供三類序列搜索服務(wù):基于文本的交互式檢索;標準的序列相似性搜索,包括BLAST、FASTA等;結(jié)合序列相似性、注釋信息和蛋白質(zhì)家族信息的高級搜索,包括按注釋分類的相似性搜索、結(jié)構(gòu)域搜索GeneFIND等。

PIR和PSD的網(wǎng)址是:http://pir.georgetown.edu/。

數(shù)據(jù)庫下載地址是:ftp://nbrfa.georgetown.edu/pir/。

2. SWISS-PROT

SWISS-PROT是經(jīng)過注釋的蛋白質(zhì)序列數(shù)據(jù)庫,由歐洲生物信息學(xué)研究所(EBI)維護。數(shù)據(jù)庫由蛋白質(zhì)序列條目構(gòu)成,每個條目包含蛋白質(zhì)序列、引用文獻信息、分類學(xué)信息、注釋等,注釋中包括蛋白質(zhì)的功能、轉(zhuǎn)錄后修飾、特殊位點和區(qū)域、二級結(jié)構(gòu)、四級結(jié)構(gòu)、與其它序列的相似性、序列殘缺與疾病的關(guān)系、序列變異體和沖突等信息。SWISS-PROT中盡可能減少了冗余序列,并與其它30多個數(shù)據(jù)建立了交叉引用,其中包括核酸序列庫、蛋白質(zhì)序列庫和蛋白質(zhì)結(jié)構(gòu)庫等。

利用序列提取系統(tǒng)(SRS)可以方便地檢索SWISS-PROT和其它EBI的數(shù)據(jù)庫。

SWISS-PROT只接受直接測序獲得的蛋白質(zhì)序列,序列提交可以在其Web頁面上完成。

SWISS-PROT的網(wǎng)址是:http://www.ebi.ac.uk/swissprot/

3. PROSITE

PROSITE數(shù)據(jù)庫收集了生物學(xué)有顯著意義的蛋白質(zhì)位點和序列模式,并能根據(jù)這些位點和模式快速和可靠地鑒別一個未知功能的蛋白質(zhì)序列應(yīng)該屬于哪一個蛋白質(zhì)家族。有的情況下,某個蛋白質(zhì)與已知功能蛋白質(zhì)的整體序列相似性很低,但由于功能的需要保留了與功能密切相關(guān)的序列模式,這樣就可能通過PROSITE的搜索找到隱含的功能motif,因此是序列分析的有效工具。PROSITE中涉及的序列模式包括酶的催化位點、配體結(jié)合位點、與金屬離子結(jié)合的殘基、二硫鍵的半胱氨酸、與小分子或其它蛋白質(zhì)結(jié)合的區(qū)域等;除了序列模式之外,PROSITE還包括由多序列比對構(gòu)建的profile,能更敏感地發(fā)現(xiàn)序列與profile的相似性。PROSITE的主頁上提供各種相關(guān)檢索服務(wù)。

PROSITE的網(wǎng)址是:http://www.expasy.ch/prosite/。

4. PDB

蛋白質(zhì)數(shù)據(jù)倉庫(PDB)是國際上唯一的生物大分子結(jié)構(gòu)數(shù)據(jù)檔案庫,由美國Brookhaven國家實驗室建立。PDB收集的數(shù)據(jù)來源于X光晶體衍射和核磁共振(NMR)的數(shù)據(jù),經(jīng)過整理和確認后存檔而成。目前PDB數(shù)據(jù)庫的維護由結(jié)構(gòu)生物信息學(xué)研究合作組織(RCSB)負責(zé)。RCSB的主服務(wù)器和世界各地的鏡像服務(wù)器提供數(shù)據(jù)庫的檢索和下載服務(wù),以及關(guān)于PDB數(shù)據(jù)文件格式和其它文檔的說明,PDB數(shù)據(jù)還可以從發(fā)行的光盤獲得。使用Rasmol等軟件可以在計算機上按PDB文件顯示生物大分子的三維結(jié)構(gòu)。

RCSB的PDB數(shù)據(jù)庫網(wǎng)址是:http://www.rcsb.org/pdb/。

5. SCOP

蛋白質(zhì)結(jié)構(gòu)分類(SCOP)數(shù)據(jù)庫詳細描述了已知的蛋白質(zhì)結(jié)構(gòu)之間的關(guān)系。分類基于若干層次:家族,描述相近的進化關(guān)系;超家族,描述遠源的進化關(guān)系;折疊子(fold),描述空間幾何結(jié)構(gòu)的關(guān)系;折疊類,所有折疊子被歸于全α、全β、α/β、α+β和多結(jié)構(gòu)域等幾個大類。SCOP還提供一個非冗余的ASTRAIL序列庫,這個庫通常被用來評估各種序列比對算法。此外,SCOP還提供一個PDB-ISL中介序列庫,通過與這個庫中序列的兩兩比對,可以找到與未知結(jié)構(gòu)序列遠緣的已知結(jié)構(gòu)序列。

SCOP的網(wǎng)址是:http://scop.mrc-lmb.cam.ac.uk/scop/。

6. COG

蛋白質(zhì)直系同源簇(COGs)數(shù)據(jù)庫是對細菌、藻類和真核生物的21個完整基因組的編碼蛋白,根據(jù)系統(tǒng)進化關(guān)系分類構(gòu)建而成。COG庫對于預(yù)測單個蛋白質(zhì)的功能和整個新基因組中蛋白質(zhì)的功能都很有用。利用COGNITOR程序,可以把某個蛋白質(zhì)與所有COGs中的蛋白質(zhì)進行比對,并把它歸入適當(dāng)?shù)腃OG簇。COG庫提供了對COG分類數(shù)據(jù)的檢索和查詢,基于Web的COGNITOR服務(wù),系統(tǒng)進化模式的查詢服務(wù)等。

COG庫的網(wǎng)址是:http://www.ncbi.nlm.nih.gov/COG。

下載COG庫和COGNITOR程序在:ftp://ncbi.nlm.nih.gov/pub/COG。

2.3 功能數(shù)據(jù)庫

1. KEGG

京都基因和基因組百科全書(KEGG)是系統(tǒng)分析基因功能,聯(lián)系基因組信息和功能信息的知識庫;蚪M信息存儲在GENES數(shù)據(jù)庫里,包括完整和部分測序的基因組序列;更高級的功能信息存儲在PATHWAY數(shù)據(jù)庫里,包括圖解的細胞生化過程如代謝、膜轉(zhuǎn)運、信號傳遞、細胞周期,還包括同系保守的子通路等信息;KEGG的另一個數(shù)據(jù)庫是LIGAND,包含關(guān)于化學(xué)物質(zhì)、酶分子、酶反應(yīng)等信息。KEGG提供了Java的圖形工具來訪問基因組圖譜,比較基因組圖譜和操作表達圖譜,以及其它序列比較、圖形比較和通路計算的工具,可以免費獲取。

KEGG的網(wǎng)址是:。

2. DIP

相互作用的蛋白質(zhì)數(shù)據(jù)庫(DIP)收集了由實驗驗證的蛋白質(zhì)-蛋白質(zhì)相互作用。數(shù)據(jù)庫包括蛋白質(zhì)的信息、相互作用的信息和檢測相互作用的實驗技術(shù)三個部分。用戶可以根據(jù)蛋白質(zhì)、生物物種、蛋白質(zhì)超家族、關(guān)鍵詞、實驗技術(shù)或引用文獻來查詢DIP數(shù)據(jù)庫。

DIP的網(wǎng)址是:http://dip.doe-mbi.ucla.edu/

3. ASDB

可變剪接數(shù)據(jù)庫(ASDB)包括蛋白質(zhì)庫和核酸庫兩部分。ASDB(蛋白質(zhì))部分來源于SWISS-PROT蛋白質(zhì)序列庫,通過選取有可變剪接注釋的序列,搜索相關(guān)可變剪接的序列,經(jīng)過序列比對、篩選和分類構(gòu)建而成。ASDB(核酸)部分來自Genbank中提及和注釋的可變剪接的完整基因構(gòu)成。數(shù)據(jù)庫提供了方便的搜索服務(wù)。

ASDB的網(wǎng)址是:http://cbcg.nersc.gov/asdb。

4. TRRD

轉(zhuǎn)錄調(diào)控區(qū)數(shù)據(jù)庫(TRRD)是在不斷積累的真核生物基因調(diào)控區(qū)結(jié)構(gòu)-功能特性信息基礎(chǔ)上構(gòu)建的。每一個TRRD的條目里包含特定基因各種結(jié)構(gòu)-功能特性:轉(zhuǎn)錄因子結(jié)合位點、啟動子、增強子、靜默子、以及基因表達調(diào)控模式等。TRRD包括五個相關(guān)的數(shù)據(jù)表:TRRDGENES(包含所有TRRD庫基因的基本信息和調(diào)控單元信息);TRRDSITES(包括調(diào)控因子結(jié)合位點的具體信息);TRRDFACTORS(包括TRRD中與各個位點結(jié)合的調(diào)控因子的具體信息);TRRDEXP(包括對基因表達模式的具體描述);TRRDBIB(包括所有注釋涉及的參考文獻)。TRRD主頁提供了對這幾個數(shù)據(jù)表的檢索服務(wù)。

TRRD的網(wǎng)址是:http://wwwmgs.bionet.nsc.ru/mgs/dbases/trrd4/。

5. TRANSFAC

TRANSFAC數(shù)據(jù)庫是關(guān)于轉(zhuǎn)錄因子、它們在基因組上的結(jié)合位點和與DNA結(jié)合的profiles的數(shù)據(jù)庫。由SITE、GENE、FACTOR、CLASS、MATRIX、CELLS、METHOD和REFERENCE等數(shù)據(jù)表構(gòu)成。此外,還有幾個與TRANSFAC密切相關(guān)的擴展庫:PATHODB庫收集了可能導(dǎo)致病態(tài)的突變的轉(zhuǎn)錄因子和結(jié)合位點;S/MART DB收集了與染色體結(jié)構(gòu)變化相關(guān)的蛋白因子和位點的信息;TRANSPATH庫用于描述與轉(zhuǎn)錄因子調(diào)控相關(guān)的信號傳遞的網(wǎng)絡(luò);CYTOMER庫表現(xiàn)了人類轉(zhuǎn)錄因子在各個器官、細胞類型、生理系統(tǒng)和發(fā)育時期的表達狀況。TRANSFAC及其相關(guān)數(shù)據(jù)庫可以免費下載,也可以通過Web進行檢索和查詢。

TRANSFAC的網(wǎng)址是:http://transfac.gbf.de/TRANSFAC/。

2.4 其它數(shù)據(jù)庫資源

1. DBCat

DBCat是生物信息數(shù)據(jù)庫的目錄數(shù)據(jù)庫,它收集了500多個生物信息學(xué)數(shù)據(jù)庫的信息,并根據(jù)它們的應(yīng)用領(lǐng)域進行了分類。包括DNA、RNA、蛋白質(zhì)、基因組、圖譜、蛋白質(zhì)結(jié)構(gòu)、文獻著作等基本類型。數(shù)據(jù)庫可以免費下載或在網(wǎng)絡(luò)上檢索查詢。

DBCat的網(wǎng)址是:http://www.infobiogen.fr/services/dbcat/

下載DBCat在:ftp://ftp.infobiogen.fr/pub/db/dbcat。

2. PubMed

PubMed是NCBI維護的文獻引用數(shù)據(jù)庫,提供對MEDLINE、Pre-MEDLINE等文獻數(shù)據(jù)庫的引用查詢和對大量網(wǎng)絡(luò)科學(xué)類電子期刊的鏈接。利用Entrez系統(tǒng)可以對PubMed進行方便的查詢檢索。

PubMed的網(wǎng)址是:http://www.ncbi.nlm.nih.gov/。

除了以上提及的數(shù)據(jù)之外,還有許許多多的專門生物信息數(shù)據(jù)庫,涉及了目前生物學(xué)研究的各個層面和領(lǐng)域,由于篇幅所限無法一一詳述。國內(nèi)也有一些大數(shù)據(jù)庫的鏡像站點和自己開發(fā)的有特色的數(shù)據(jù)庫,如歐洲分子生物學(xué)網(wǎng)絡(luò)組織EMBNet中國節(jié)點北京大學(xué)分子生物信息鏡像系統(tǒng),上海博容基因公司與上海嘉瑞軟件公司合作開發(fā)的國產(chǎn)漢化基因數(shù)據(jù)庫及分析管理系統(tǒng),同時國家級的生物信息學(xué)中心也在籌建之中。我們期待國內(nèi)能有更多高質(zhì)量和使用便利的數(shù)據(jù)庫資源,推動我國生物信息學(xué)和整個生命科學(xué)的發(fā)展。

清華大學(xué)生物信息學(xué)研究所網(wǎng)址:http://bioinfo.tsinghua.edu.cn

北京大學(xué)生物信息鏡像系統(tǒng)網(wǎng)址:http://cbi.pku.edu.cn
4樓2005-06-07 16:46:06
已閱   回復(fù)此樓   關(guān)注TA 給TA發(fā)消息 送TA紅花 TA的回帖

BlueGuy

榮譽版主 (正式寫手)

懶懶的小蟲蟲

★ ★
miRNA(金幣+2):謝謝!!
3 序列比對和數(shù)據(jù)庫搜索

比較是科學(xué)研究中最常見的方法,通過將研究對象相互比較來尋找對象可能具備的特性。在生物信息學(xué)研究中,比對是最常用和最經(jīng)典的研究手段。

最常見的比對是蛋白質(zhì)序列之間或核酸序列之間的兩兩比對,通過比較兩個序列之間的相似區(qū)域和保守性位點,尋找二者可能的分子進化關(guān)系。進一步的比對是將多個蛋白質(zhì)或核酸同時進行比較,尋找這些有進化關(guān)系的序列之間共同的保守區(qū)域、位點和profile,從而探索導(dǎo)致它們產(chǎn)生共同功能的序列模式。此外,還可以把蛋白質(zhì)序列與核酸序列相比來探索核酸序列可能的表達框架;把蛋白質(zhì)序列與具有三維結(jié)構(gòu)信息的蛋白質(zhì)相比,從而獲得蛋白質(zhì)折疊類型的信息。

比對還是數(shù)據(jù)庫搜索算法的基礎(chǔ),將查詢序列與整個數(shù)據(jù)庫]的所有序列進行比對,從數(shù)據(jù)庫中獲得與其最相似序列的已有的數(shù)據(jù),能最快速的獲得有關(guān)查詢序列的大量有價值的參考信息,對于進一步分析其結(jié)構(gòu)和功能都會有很大的幫助。近年來隨著生物信息學(xué)數(shù)據(jù)大量積累和生物學(xué)知識的整理,通過比對方法可以有效地分析和預(yù)測一些新發(fā)現(xiàn)基因的功能。

3.1 序列兩兩比對

序列比對的理論基礎(chǔ)是進化學(xué)說,如果兩個序列之間具有足夠的相似性,就推測二者可能有共同的進化祖先,經(jīng)過序列內(nèi)殘基的替換、殘基或序列片段的缺失、以及序列重組等遺傳變異過程分別演化而來。序列相似和序列同源是不同的概念,序列之間的相似程度是可以量化的參數(shù),而序列是否同源需要有進化事實的驗證。在殘基-殘基比對中,可以明顯看到序列中某些氨基酸殘基比其它位置上的殘基更保守,這些信息揭示了這些保守位點上的殘基對蛋白質(zhì)的結(jié)構(gòu)和功能是至關(guān)重要的,例如它們可能是酶的活性位點殘基,形成二硫鍵的半胱氨酸殘基,與配體結(jié)合部位的殘基,與金屬離子結(jié)合的殘基,形成特定結(jié)構(gòu)motif的殘基等等。但并不是所有保守的殘基都一定是結(jié)構(gòu)功能重要的,可能它們只是由于歷史的原因被保留下來,而不是由于進化壓力而保留下來。因此,如果兩個序列有顯著的保守性,要確定二者具有共同的進化歷史,進而認為二者有近似的結(jié)構(gòu)和功能還需要更多實驗和信息的支持。通過大量實驗和序列比對的分析,一般認為蛋白質(zhì)的結(jié)構(gòu)和功能比序列具有更大的保守性,因此粗略的說,如果序列之間的相似性超過30%,它們就很可能是同源的。

早期的序列比對是全局的序列比較,但由于蛋白質(zhì)具有的模塊性質(zhì),可能由于外顯子的交換而產(chǎn)生新蛋白質(zhì),因此局部比對會更加合理。通常用打分矩陣描述序列兩兩比對,兩條序列分別作為矩陣的兩維,矩陣點是兩維上對應(yīng)兩個殘基的相似性分數(shù),分數(shù)越高則說明兩個殘基越相似。因此,序列比對問題變成在矩陣里尋找最佳比對路徑,目前最有效的方法是Needleman-Wunsch動態(tài)規(guī)劃算法,在此基礎(chǔ)上又改良產(chǎn)生了Smith-Waterman算法和SIM算法。在FASTA程序包中可以找到用動態(tài)規(guī)劃算法進行序列比對的工具LALIGN,它能給出多個不相互交叉的最佳比對結(jié)果。

在進行序列兩兩比對時,有兩方面問題直接影響相似性分值:取代矩陣和空位罰分。粗糙的比對方法僅僅用相同/不同來描述兩個殘基的關(guān)系,顯然這種方法無法描述殘基取代對結(jié)構(gòu)和功能的不同影響效果,纈氨酸對異亮氨酸的取代與谷氨酸對異亮氨酸的取代應(yīng)該給予不同的打分。因此如果用一個取代矩陣來描述氨基酸殘基兩兩取代的分值會大大提高比對的敏感性和生物學(xué)意義。雖然針對不同的研究目標和對象應(yīng)該構(gòu)建適宜的取代矩陣,但國際上常用的取代矩陣有PAM和BLOSUM等,它們來源于不同的構(gòu)建方法和不同的參數(shù)選擇,包括PAM250、BLOSUM62、BLOSUM90、BLOSUM30等。對于不同的對象可以采用不同的取代矩陣以獲得更多信息,例如對同源性較高的序列可以采用BLOSUM90矩陣,而對同源性較低的序列可采用BLOSUM30矩陣。

空位罰分是為了補償插入和缺失對序列相似性的影響,由于沒有什么合適的理論模型能很好地描述空位問題,因此空位罰分缺乏理論依據(jù)而更多的帶有主觀特色。一般的處理方法是用兩個罰分值,一個對插入的第一個空位罰分,如10-15;另一個對空位的延伸罰分,如1-2。對于具體的比對問題,采用不同的罰分方法會取得不同的效果。

對于比對計算產(chǎn)生的分值,到底多大才能說明兩個序列是同源的,對此有統(tǒng)計學(xué)方法加以說明,主要的思想是把具有相同長度的隨機序列進行比對,把分值與最初的比對分值相比,看看比對結(jié)果是否具有顯著性。相關(guān)的參數(shù)E代表隨機比對分值不低于實際比對分值的概率。對于嚴格的比對,必須E值低于一定閾值才能說明比對的結(jié)果具有足夠的統(tǒng)計學(xué)顯著性,這樣就排除了由于偶然的因素產(chǎn)生高比對得分的可能。

Genbank、SWISS-PROT等序列數(shù)據(jù)庫提供的序列搜索服務(wù)都是以序列兩兩比對為基礎(chǔ)的。不同之處在于為了提高搜索的速度和效率,通常的序列搜索算法都進行了一定程度的優(yōu)化,如最常見的FASTA工具和BLAST工具。FASTA是第一個被廣泛應(yīng)用的序列比對和搜索工具包,包含若干個獨立的程序。FASTA為了提供序列搜索的速度,會先建立序列片段的“字典”,查詢序列先會在字典里搜索可能的匹配序列,字典中的序列長度由ktup參數(shù)控制,缺省的ktup=2。FASTA的結(jié)果報告中會給出每個搜索到的序列與查詢序列的最佳比對結(jié)果,以及這個比對的統(tǒng)計學(xué)顯著性評估E值。FASTA工具包可以在大多提供下載服務(wù)的生物信息學(xué)站點上找到。

BLAST是現(xiàn)在應(yīng)用最廣泛的序列相似性搜索工具,相比FASTA有更多改進,速度更快,并建立在嚴格的統(tǒng)計學(xué)基礎(chǔ)之上。NCBI提供了基于Web的BLAST服務(wù),用戶可以把序列填入網(wǎng)頁上的表單里,選擇相應(yīng)的參數(shù)后提交到數(shù)據(jù)服務(wù)器上進行搜索,從電子郵件中獲得序列搜索的結(jié)果。BLAST包含五個程序和若干個相應(yīng)的數(shù)據(jù)庫,分別針對不同的查詢序列和要搜索的數(shù)據(jù)庫類型。其中翻譯的核酸庫指搜索比對時會把核酸數(shù)據(jù)按密碼子按所有可能的閱讀框架轉(zhuǎn)換成蛋白質(zhì)序列。

BLAST對序列格式的要求是常見的FASTA格式。FASTA格式第一行是描述行,第一個字符必須是“>”字符;隨后的行是序列本身,一般每行序列不要超過80個字符,回車符不會影響程序?qū)π蛄羞B續(xù)性的看法。序列由標準的IUB/IUPAC氨基酸和核酸代碼代表;小寫字符會全部轉(zhuǎn)換成大寫;單個“-”號代表不明長度的空位;在氨基酸序列里允許出現(xiàn)“U”和“*”號;任何數(shù)字都應(yīng)該被去掉或換成字母(如,不明核酸用“N”,不明氨基酸用“X”)。此外,對于核酸序列,除了A、C、G、T、U分別代表各種核酸之外,R代表G或A(嘌呤);Y代表T或C(嘧啶);K代表G或T(帶酮基);M代表A或C(帶氨基);S代表G或C(強);W代表A或T(弱);B代表G、T或C;D代表G、A或T;H代表A、C或T;V代表G、C或A;N代表A、G、C、T中任意一種。對于氨基酸序列,除了20種常見氨基酸的標準單字符標識之外,B代表Asp或Asn;U代表硒代半胱氨酸;Z代表Glu或Gln;X代表任意氨基酸;“*”代表翻譯結(jié)束標志。

BLAST的當(dāng)前版本是2.0,它的新發(fā)展是位點特異性反復(fù)BLAST(PSI-BLAST)。PSI-BLAST的特色是每次用profile搜索數(shù)據(jù)庫后再利用搜索的結(jié)果重新構(gòu)建profile,然后用新的profile再次搜索數(shù)據(jù)庫,如此反復(fù)直至沒有新的結(jié)果產(chǎn)生為止。PSI-BLAST先用帶空位的BLAST搜索數(shù)據(jù)庫,將獲得的序列通過多序列比對來構(gòu)建第一個profile。PSI-BLAST自然地拓展了BLAST方法,能尋找蛋白質(zhì)序列中的隱含模式,有研究表明這種方法可以有效的找到很多序列差異較大而結(jié)構(gòu)功能相似的相關(guān)蛋白,甚至可以與一些結(jié)構(gòu)比對方法,如threading相媲美。PSI-BLAST服務(wù)可以在NCBI的BLAST主頁上找到,還可以從NCBI的FTP服務(wù)器上下載PSI-BLAST的獨立程序。

NCBI的BLUST網(wǎng)址是:http://www.ncbi.nlm.nih.gov/BLAST/。

下載BLUST的網(wǎng)址是:ftp://ncbi.nlm.nih.gov/blast/

下載FASTA的網(wǎng)址是:ftp://ftp.virginia.edu/pub/fasta/。

 

3.2 多序列比對

顧名思義,多序列比對就是把兩條以上可能有系統(tǒng)進化關(guān)系的序列進行比對的方法。目前對多序列比對的研究還在不斷前進中,現(xiàn)有的大多數(shù)算法都基于漸進的比對的思想,在序列兩兩比對的基礎(chǔ)上逐步優(yōu)化多序列比對的結(jié)果。進行多序列比對后可以對比對結(jié)果進行進一步處理,例如構(gòu)建序列模式的profile,將序列聚類構(gòu)建分子進化樹等等。

目前使用最廣泛的多序列比對程序是CLUSTALW(它的PC版本是CLUSTALX)。CLUSTALW是一種漸進的比對方法,先將多個序列兩兩比對構(gòu)建距離矩陣,反應(yīng)序列之間兩兩關(guān)系;然后根據(jù)距離矩陣計算產(chǎn)生系統(tǒng)進化指導(dǎo)樹,對關(guān)系密切的序列進行加權(quán);然后從最緊密的兩條序列開始,逐步引入臨近的序列并不斷重新構(gòu)建比對,直到所有序列都被加入為止。

CLUSTALW的程序可以自由使用,在NCBI的FTP服務(wù)器上可以找到下載的軟件包。CLUSTALW程序用選項單逐步指導(dǎo)用戶進行操作,用戶可根據(jù)需要選擇打分矩陣、設(shè)置空位罰分等。EBI的主頁還提供了基于Web的CLUSTALW服務(wù),用戶可以把序列和各種要求通過表單提交到服務(wù)器上,服務(wù)器把計算的結(jié)果用Email返回用戶。

CLUSTALW對輸入序列的格式比較靈活,可以是前面介紹過的FASTA格式,還可以是PIR、SWISS-PROT、GDE、Clustal、GCG/MSF、RSF等格式。輸出格式也可以選擇,有ALN、GCG、PHYLIP和GDE等,用戶可以根據(jù)自己的需要選擇合適的輸出格式。

用CLUSTALW得到的多序列比對結(jié)果中,所有序列排列在一起,并以特定的符號代表各個位點上殘基的保守性,“*”號表示保守性極高的殘基位點;“.”號代表保守性略低的殘基位點。

EBI的CLUSTALW網(wǎng)址是:http://www.ebi.ac.uk/clustalw/。

下載CLUSTALW的網(wǎng)址是:ftp://ftp.ebi.ac.uk/pub/software/。
5樓2005-06-07 16:50:28
已閱   回復(fù)此樓   關(guān)注TA 給TA發(fā)消息 送TA紅花 TA的回帖

BlueGuy

榮譽版主 (正式寫手)

懶懶的小蟲蟲


miRNA(金幣+1):謝謝。
4 核酸與蛋白質(zhì)結(jié)構(gòu)和功能的預(yù)測分析

人們獲得各種核酸和蛋白質(zhì)序列的目的是了解這個序列在生物體中充當(dāng)了怎樣的角色。例如,DNA序列中重復(fù)片段、編碼區(qū)、啟動子、內(nèi)含子/外顯子、轉(zhuǎn)錄調(diào)控因子結(jié)合位點等信息;蛋白質(zhì)的分子量、等電點、二級結(jié)構(gòu)、三級結(jié)構(gòu)、四級結(jié)構(gòu)、膜蛋白的跨膜區(qū)段、酶的活性位點、以及蛋白質(zhì)之間相互作用等結(jié)構(gòu)和功能信息。雖然用實驗的方法是多年以來解決這類問題的主要途徑,但新的思路是利用已有的對生物大分子結(jié)構(gòu)和功能特性的認識,用生物信息學(xué)的方法通過計算機模擬和計算來“預(yù)測”出這些信息或提供與之相關(guān)的輔助信息。由于生物信息學(xué)的特點,可以用較低的成本和較快的時間就能獲得可靠的結(jié)果。近10年來生物學(xué)序列信息的爆炸性增長大大促進了各種序列分析和預(yù)測技術(shù)的發(fā)展,目前已經(jīng)可以用理論預(yù)測的方法獲得大量的結(jié)構(gòu)和功能信息。要注意的是,盡管各種預(yù)測方法都基于現(xiàn)有的生物學(xué)數(shù)據(jù)和已有的生物學(xué)知識,但在不同模型或算法基礎(chǔ)上建立的不同分析程序有其一定的適用范圍和相應(yīng)的限制條件,因此最好對同一個生物學(xué)問題盡量多用幾種分析程序,綜合分析各種方法得到的結(jié)果和結(jié)果的可靠性。此外,生物信息學(xué)的分析只是為生物學(xué)研究提供參考,這些信息能提高研究的效率或提供研究的思路,但很多問題還需要通過實驗的方法得到驗證。

4.1 針對核酸序列的預(yù)測方法

針對核酸序列的預(yù)測就是在核酸序列中尋找基因,找出基因的位置和功能位點的位置,以及標記已知的序列模式等過程。在此過程中,確認一段DNA序列是一個基因需要有多個證據(jù)的支持。一般而言,在重復(fù)片段頻繁出現(xiàn)的區(qū)域里,基因編碼區(qū)和調(diào)控區(qū)不太可能出現(xiàn);如果某段DNA片段的假想產(chǎn)物與某個已知的蛋白質(zhì)或其它基因的產(chǎn)物具有較高序列相似性的話,那么這個DNA片段就非常可能屬于外顯子片段;在一段DNA序列上出現(xiàn)統(tǒng)計上的規(guī)律性,即所謂的“密碼子偏好性”,也是說明這段DNA是蛋白質(zhì)編碼區(qū)的有力證據(jù);其它的證據(jù)包括與“模板”序列的模式相匹配、簡單序列模式如TATA Box等相匹配等。一般而言,確定基因的位置和結(jié)構(gòu)需要多個方法綜合運用,而且需要遵循一定的規(guī)則:對于真核生物序列,在進行預(yù)測之前先要進行重復(fù)序列分析,把重復(fù)序列標記出來并除去;選用預(yù)測程序時要注意程序的物種特異性;要弄清程序適用的是基因組序列還是cDNA序列;很多程序?qū)π蛄虚L度也有要求,有的程序只適用于長序列,而對EST這類殘缺的序列則不適用。

1. 重復(fù)序列分析

對于真核生物的核酸序列而言,在進行基因辨識之前都應(yīng)該把簡單的大量的重復(fù)序列標記出來并除去,因為很多情況下重復(fù)序列會對預(yù)測程序產(chǎn)生很大的擾亂,尤其是涉及數(shù)據(jù)庫搜索的程序。常見的重復(fù)序列分析程序有CENSOR和RepeatMasker等,可以在Web界面上使用這些程序,或者用Email來進行。如果有大量序列需要處理,可以使用XBLAST程序,它可以從Internet上下載得到。XBLAST中以及包含了由程序作者收集整理的一些重復(fù)序列,此外還可以從Repbase中找到更多的重復(fù)序列。還可以把克隆載體也加入重復(fù)序列中,這樣就可以在處理重復(fù)序列時順便把克隆載體也一同除去。經(jīng)處理的序列中重復(fù)序列所在位置會一律由“X”代替。

CENSOR和Repbase的網(wǎng)址是:http://www.girinst.org/

CENSOR的Email服務(wù)地址是:censor@sharon.lpi.org。

RepeatMasker的網(wǎng)址是:http://ftp.genome.washington.edu/cgi-bin/RepeatMasker。

下載XBLAST的網(wǎng)址是:ftp://ncbi.nlm.nih.gov/pub/jmc。

下載Repbase的網(wǎng)址是:ftp://ncbi/nlm.nih.gov/repository/repbase/REF

2. 數(shù)據(jù)庫搜索

把未知核酸序列作為查詢序列,在數(shù)據(jù)庫里搜索與之相似的已有序列是序列分析預(yù)測的有效手段,在上一節(jié)中已經(jīng)專門介紹了序列比對和搜索的原理和技術(shù)。但值得注意的是,由相似性分析作出的結(jié)論可能導(dǎo)致錯誤的流傳;有一定比例的序列很難在數(shù)據(jù)庫里找到合適的同源伙伴。對于EST序列而言,序列搜索將是非常有效的預(yù)測手段。

3. 編碼區(qū)統(tǒng)計特性分析

統(tǒng)計獲得的經(jīng)驗說明,DNA中密碼子的使用頻率不是平均分布的,某些密碼子會以較高的頻率使用而另一些則較少出現(xiàn)。這樣就使得編碼區(qū)的序列呈現(xiàn)出可察覺的統(tǒng)計特異性,即所謂的“密碼子偏好性”。利用這一特性對未知序列進行統(tǒng)計學(xué)分析可以發(fā)現(xiàn)編碼區(qū)的粗略位置。這一類技術(shù)包括:雙密碼子計數(shù)(統(tǒng)計連續(xù)兩個密碼子的出現(xiàn)頻率);核苷酸周期性分析(分析同一個核苷酸在3,6,9,...位置上周期性出現(xiàn)的規(guī)律);均一/復(fù)雜性分析(長同聚物的統(tǒng)計計數(shù));開放可讀框架分析等。

常見的編碼區(qū)統(tǒng)計特性分析工具將多種統(tǒng)計分析技術(shù)組合起來,給出對編碼區(qū)的綜合判別。著名的程序有GRAIL和GenMark等,GRAIL提供了基于Web的服務(wù)。

GRAIL的網(wǎng)址是:http://compbio.ornl.gov/Grail-1.3/。

4. 啟動子分析

啟動子是基因表達所必需的重要序列信號,識別出啟動子對于基因辨識十分重要。有一些程序根據(jù)實驗獲得的轉(zhuǎn)錄因子結(jié)合特性來描述啟動子的序列特征,并依次作為啟動子預(yù)測的依據(jù),但實際的效果并不十分理想,遺漏和假陽性都比較嚴重?偟膩碚f,啟動子仍是值得繼續(xù)研究探索的難題。

5. 內(nèi)含子/外顯子剪接位點

剪接位點一般具有較明顯的序列特征,但是要注意可變剪接的問題。由于可變剪接在數(shù)據(jù)庫里的注釋非常不完整,因此很難評估剪接位點識別程序預(yù)測剪接位點的敏感性和精度。如果把剪接位點和兩側(cè)的編碼特性結(jié)合起來分析則有助于提供剪接位點的識別效果。

常見的基因識別工具很多都包含了剪接位點識別功能,獨立的剪接位點識別工具有NetGene等。

NetGene服務(wù)的Email地址是:netgene@cbs.dtu.dk。

6. 翻譯起始位點

對于真核生物,如果已知轉(zhuǎn)錄起始點,并且沒有內(nèi)含子打斷5'非翻譯區(qū)的話,“Kozak規(guī)則”可以在大多數(shù)情況下定位起始密碼子。原核生物一般沒有剪接過程,但在開放閱讀框中找正確的起始密碼子仍很困難。這時由于多順反操縱子的存在,啟動子定位不象在真核生物中起關(guān)鍵作用。對于原核生物,關(guān)鍵是核糖體結(jié)合點的定位,可以由多個程序提供解決方案,可以參考下面的綜述。

Gelfand, M. S. (1995). Prediction of function in DNA sequence analyis. J. Comput. Biol. 2, 87-115.

7. 翻譯終止信號

PolyA和翻譯終止信號不象起始信號那么重要,但也可以輔助劃分基因的范圍。

8. 其它綜合基因預(yù)測工具

除了上面提到的程序之外,還有許多用于基因預(yù)測的工具,它們大多把各個方面的分析綜合起來,對基因進行整體的分析和預(yù)測。多種信息的綜合分析有助于提高預(yù)測的可靠性,但也有一些局限:物種適用范圍的局限;對多基因或部分基因,有的預(yù)測出的基因結(jié)構(gòu)不可靠;預(yù)測的精度對許多新發(fā)現(xiàn)基因比較低;對序列中的錯誤很敏感;對可變剪接、重疊基因和啟動子等復(fù)雜基因語法效果不佳。

相對不錯的工具有GENSCAN,可以通過Web頁面或Email獲得GENSCAN服務(wù)。

GENSCAN的網(wǎng)址是:http://ccr-081.mit.edu/GENSCAN.html。

9. tRNA基因識別

tRNA基因識別比編碼蛋白質(zhì)的基因識別簡單,目前基本已經(jīng)解決了用理論方法預(yù)測tRNA基因的問題。tRNAscan-SE工具中綜合了多個識別和分析程序,通過分析啟動子元件的保守序列模式、tRNA二級結(jié)構(gòu)的分析、轉(zhuǎn)錄控制元件分析和除去絕大多數(shù)假陽性的篩選過程,據(jù)稱能識別99%的真tRNA基因?梢栽赪eb上使用這個工具,也可以下載這個程序。

tRNAscan-SE的網(wǎng)址是:http://www.genetics.wustl.edu/eddy/tRNAscan-SE/。

4.2 針對蛋白質(zhì)的預(yù)測方法

傳統(tǒng)的生物學(xué)認為,蛋白質(zhì)的序列決定了它的三維結(jié)構(gòu),也就決定了它的功能。由于用X光晶體衍射和NMR核磁共振技術(shù)測定蛋白質(zhì)的三維結(jié)構(gòu),以及用生化方法研究蛋白質(zhì)的功能效率不高,無法適應(yīng)蛋白質(zhì)序列數(shù)量飛速增長的需要,因此近幾十年來許多科學(xué)家致力于研究用理論計算的方法預(yù)測蛋白質(zhì)的三維結(jié)構(gòu)和功能,經(jīng)過多年努力取得了一定的成果。

1. 從氨基酸組成辨識蛋白質(zhì)

根據(jù)組成蛋白質(zhì)的20種氨基酸的物理和化學(xué)性質(zhì)可以分析電泳等實驗中的未知蛋白質(zhì),也可以分析已知蛋白質(zhì)的物化性質(zhì)。ExPASy工具包中提供了一系列相應(yīng)程序:

AACompIdent:根據(jù)氨基酸組成辨識蛋白質(zhì)。這個程序需要的信息包括:氨基酸組成、蛋白質(zhì)的名稱(在結(jié)果中有用)、pI和Mw(如果已知)以及它們的估算誤差、所屬物種或物種種類或“全部(ALL)”、標準蛋白的氨基酸組成、標準蛋白的SWISS-PROT編號、用戶的Email地址等,其中一些信息可以沒有。這個程序在SWISS-PROT和(或)TrEMBL數(shù)據(jù)庫中搜索組成相似蛋白。

AACompSim:與前者類似,但比較在SWISS-PROT條目之間進行。這個程序可以用于發(fā)現(xiàn)蛋白質(zhì)之間較弱的相似關(guān)系。

除了ExPASy中的工具外,PROPSEARCH也提供基于氨基酸組成的蛋白質(zhì)辨識功能。程序作者用144種不同的物化性質(zhì)來分析蛋白質(zhì),包括分子量、巨大殘基的含量、平均疏水性、平均電荷等,把查詢序列的這些屬性構(gòu)成的“查詢向量”與SWISS-PROT和PIR中預(yù)先計算好的各個已知蛋白質(zhì)的屬性向量進行比較。這個工具能有效的發(fā)現(xiàn)同一蛋白質(zhì)家族的成員?梢酝ㄟ^Web使用這個工具,用戶只需輸入查詢序列本身。

ExPASy的網(wǎng)址是:http://www.expasy.ch/tools/。

PROSEARCH的網(wǎng)址是:http://www.embl-heidelberg.de/prs.html

2. 預(yù)測蛋白質(zhì)的物理性質(zhì)

從蛋白質(zhì)序列出發(fā),可以預(yù)測出蛋白質(zhì)的許多物理性質(zhì),包括等電點、分子量、酶切特性、疏水性、電荷分布等。相關(guān)工具有:

Compute pI/MW:是ExPASy工具包中的程序,計算蛋白質(zhì)的等電點和分子量。對于堿性蛋白質(zhì),計算出的等電點可能不準確。

PeptideMass:是ExPASy工具包中的程序,分析蛋白質(zhì)在各種蛋白酶和化學(xué)試劑處理后的內(nèi)切產(chǎn)物。蛋白酶和化學(xué)試劑包括胰蛋白酶、糜蛋白酶、LysC、溴化氰、ArgC、AspN和GluC等。

TGREASE:是FASTA工具包中的程序,分析蛋白質(zhì)序列的疏水性。這個程序延序列計算每個殘基位點的移動平均疏水性,并給出疏水性-序列曲線,用這個程序可以發(fā)現(xiàn)膜蛋白的跨膜區(qū)和高疏水性區(qū)的明顯相關(guān)性。

SAPS:蛋白質(zhì)序列統(tǒng)計分析,對提交的序列給出大量全面的分析數(shù)據(jù),包括氨基酸組成統(tǒng)計、電荷分布分析、電荷聚集區(qū)域、高度疏水區(qū)域、跨膜區(qū)段等等。

ExPASy的網(wǎng)址是:http://www.expasy.ch/tools/

下載FASTA的網(wǎng)址是:ftp://ftp.virginia.edu/pub/fasta/。

SAPS的網(wǎng)址是:http://www.isrec.isb-sib.ch/software/SAPS_form.html

3. 蛋白質(zhì)二級結(jié)構(gòu)預(yù)測

二級結(jié)構(gòu)是指α螺旋和β折疊等規(guī)則的蛋白質(zhì)局部結(jié)構(gòu)元件。不同的氨基酸殘基對于形成不同的二級結(jié)構(gòu)元件具有不同的傾向性。按蛋白質(zhì)中二級結(jié)構(gòu)的成分可以把球形蛋白分為全α蛋白、全β蛋白、α+β蛋白和α/β蛋白等四個折疊類型。預(yù)測蛋白質(zhì)二級結(jié)構(gòu)的算法大多以已知三維結(jié)構(gòu)和二級結(jié)構(gòu)的蛋白質(zhì)為依據(jù),用過人工神經(jīng)網(wǎng)絡(luò)、遺傳算法等技術(shù)構(gòu)建預(yù)測方法。還有將多種預(yù)測方法結(jié)合起來,獲得“一致序列”?偟膩碚f,二級結(jié)構(gòu)預(yù)測仍是未能完全解決的問題,一般對于α螺旋預(yù)測精度較好,對β折疊差些,而對除α螺旋和β折疊等之外的無規(guī)則二級結(jié)構(gòu)則效果很差。

nnPredict:用神經(jīng)網(wǎng)絡(luò)方法預(yù)測二級結(jié)構(gòu),蛋白質(zhì)結(jié)構(gòu)類型分為全α蛋白、全β蛋白和α/β蛋白,輸出結(jié)果包括“H”(螺旋)、“E”(折疊)和“-”(轉(zhuǎn)角)。這個方法對全α蛋白能達到79%的準確率。

PredictProtein:提供了序列搜索和結(jié)構(gòu)預(yù)測服務(wù)。它先在SWISS-PROT中搜索相似序列,用MaxHom算法構(gòu)建多序列比對的profile,再在數(shù)據(jù)庫中搜索相似的profile,然后用一套PHD程序來預(yù)測相應(yīng)的結(jié)構(gòu)特征,包括二級結(jié)構(gòu)。返回的結(jié)果包含大量預(yù)測過程中產(chǎn)生的信息,還包含每個殘基位點的預(yù)測可信度。這個方法的平均預(yù)測準確率達到72%。

SOPMA:帶比對的自優(yōu)化預(yù)測方法,將幾種獨立二級結(jié)構(gòu)預(yù)測方法匯集成“一致預(yù)測結(jié)果”,采用的二級結(jié)構(gòu)預(yù)測方法包括GOR方法、Levin同源預(yù)測方法、雙重預(yù)測方法、PHD方法和SOPMA方法。多種方法的綜合應(yīng)用平均效果比單個方法更好。

nnPredict的網(wǎng)址是:http://www.cmpharm.ucsf.edu/~nomi/nnpredict.html。

PredictProtein的網(wǎng)址是:http://cubic.bioc.columbia.edu/predictprotein/。

PredictProtein的國內(nèi)鏡像在:http://www.cbi.pku.edu.cn/predictprotein/。

SOPMA的網(wǎng)址是:http://pbil.ibcp.fr/。

4. 其它特殊局部結(jié)構(gòu)

其它特殊局部結(jié)構(gòu)包括膜蛋白的跨膜螺旋、信號肽、卷曲螺旋(Coiled Coils)等,具有明顯的序列特征和結(jié)構(gòu)特征,也可以用計算方法加以預(yù)測。

COILS:卷曲螺旋預(yù)測方法,將序列與已知的平行雙鏈卷曲螺旋數(shù)據(jù)庫進行比較,得到相似性得分,并據(jù)此算出序列形成卷曲螺旋的概率。

TMpred:預(yù)測蛋白質(zhì)的跨膜區(qū)段和在膜上的取向,它根據(jù)來自SWISS-PROT的跨膜蛋白數(shù)據(jù)庫Tmbase,利用跨膜結(jié)構(gòu)區(qū)段的數(shù)量、位置以及側(cè)翼信息,通過加權(quán)打分進行預(yù)測。

SignalP:預(yù)測蛋白質(zhì)序列中信號肽的剪切位點。

COILS的網(wǎng)址是:http://www.ch.embnet.org/software/COILS_form.html。

TMpred的網(wǎng)址是:http://www.ch.embnet.org/software/TMPRED_form.html

SignalP的網(wǎng)址是:http://www.cbs.dtu.dk/services/SignalP/。

5. 蛋白質(zhì)的三維結(jié)構(gòu)

蛋白質(zhì)三維結(jié)構(gòu)預(yù)測時最復(fù)雜和最困難的預(yù)測技術(shù)。研究發(fā)現(xiàn),序列差異較大的蛋白質(zhì)序列也可能折疊成類似的三維構(gòu)象,自然界里的蛋白質(zhì)結(jié)構(gòu)骨架的多樣性遠少于蛋白質(zhì)序列的多樣性。由于蛋白質(zhì)的折疊過程仍然不十分明了,從理論上解決蛋白質(zhì)折疊的問題還有待進一步的科學(xué)發(fā)展,但也有了一些有一定作用的三維結(jié)構(gòu)預(yù)測方法。最常見的是“同源模建”和“Threading”方法。前者先在蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫中尋找未知結(jié)構(gòu)蛋白的同源伙伴,再利用一定計算方法把同源蛋白的結(jié)構(gòu)優(yōu)化構(gòu)建出預(yù)測的結(jié)果。后者將序列“穿”入已知的各種蛋白質(zhì)的折疊子骨架內(nèi),計算出未知結(jié)構(gòu)序列折疊成各種已知折疊子的可能性,由此為預(yù)測序列分配最合適的折疊子結(jié)構(gòu)。除了“Threading”方法之外,用PSI-BLAST方法也可以把查詢序列分配到合適的蛋白質(zhì)折疊家族,實際應(yīng)用中發(fā)現(xiàn)這個方法的效果也不錯。

SWISS-MODEL:自動蛋白質(zhì)同源模建服務(wù)器,有兩個工作模式:第一步模式(First Approach mode)和優(yōu)化模式(Optimise mode)。程序先把提交的序列在ExPdb晶體圖像數(shù)據(jù)庫中搜索相似性足夠高的同源序列,建立最初的原子模型,再對這個模型進行優(yōu)化產(chǎn)生預(yù)測的結(jié)構(gòu)模型。

CPHmodels:也是利用神經(jīng)網(wǎng)絡(luò)進行同源模建預(yù)測蛋白質(zhì)結(jié)構(gòu)的方法。

SWISS-MODEL的網(wǎng)址是:http://www.expasy.ch/swissmod/SWISS-MODEL.html。

CPHmodels的網(wǎng)址是:http://www.cbs.dtu.dk/services/CPHmodels/。
6樓2005-06-07 17:13:00
已閱   回復(fù)此樓   關(guān)注TA 給TA發(fā)消息 送TA紅花 TA的回帖

BlueGuy

榮譽版主 (正式寫手)

懶懶的小蟲蟲


miRNA(金幣+1):謝謝!
5 分子進化

分子進化鐘的發(fā)現(xiàn)與中性理論的提出,極大地推動了進化尤其是分子進化研究,填補了人們對分子進化即微觀進化認識上的空白,推動進化論的研究進入分子水平,并建立了一套依賴于核酸、蛋白質(zhì)序列信息的理論方法。分子進化研究有助于進一步闡明物種進化的分子基礎(chǔ),探索基因起源機制,從基因進化的角度研究基因序列與功能的關(guān)系。

5.1 分子進化鐘與中性理論

60年代早期“分子進化鐘”的發(fā)現(xiàn)與60年代末期“中性理論”的提出是本世紀進化學(xué)的重大事件,是古老的進化學(xué)與新生的分子生物學(xué)兩者“雜交”的產(chǎn)物。它們的相繼問世極大地推動了進化尤其是分子進化研究,填補了人們對分子進化即微觀進化認識上的空白,并在生物醫(yī)學(xué)等領(lǐng)域產(chǎn)生了廣泛影響。

隨著不同生物來源的大量蛋白質(zhì)序列的確定,Zucherkandl等發(fā)現(xiàn):某一蛋白在不同物種間的取代數(shù)與所研究物種間的分歧時間接近正線性關(guān)系,進而將分子水平的這種恒速變異稱為“分子鐘”。

支持進化鐘存在的證據(jù)來自哺乳動物與其它脊椎動物諸如血清白蛋與轉(zhuǎn)鐵蛋白等的免疫學(xué)(如微量補體固定)定量比較。人們發(fā)現(xiàn)多肽間的免疫距離(如抗原性)與其氨基酸取代百分數(shù)成良好的線性相關(guān),如鳥溶菌酶、哺乳動物RNase、細胞色素C與白蛋白、大腸桿菌色氨酸合成酶等。雖然這種相關(guān)性的分子基礎(chǔ)尚不清楚,但這種客觀存在經(jīng)過反復(fù)驗證后是不容置疑的。免抗血清由此成為初步估算球形單體蛋白間序列差異的有效工具,但其適用范圍0-30%的氨基酸差異。

自從進化鐘假設(shè)提出之后,存在許多反駁它的相反事實與異議。這些異議主要針對序列進化的恒速。分子進化鐘的最明顯的例外之一是分子序列證據(jù)與化石證據(jù)在人類起源時間上的差異。60年代中期,許多人類學(xué)家認為人類在3000年前與我們最近的親屬-- 非洲猿分歧。根據(jù)分子鐘假設(shè),分歧3000萬年的物種氨基酸序列差異的應(yīng)達4-5%、非重復(fù)序列DNA差異應(yīng)約為8%,但實測值分別為0.8%與1.1%。對這種6倍左右的差別有兩種解釋。許多人類學(xué)家傾向于懷疑鐘的存在,并認為在高等靈長類中分子進化速率下降?傊,雖然大部分分子進化學(xué)家同意序列進化與分歧時間密相關(guān),但進化是以年限還是以代限為刻度則仍有分歧與爭議;而且因為縱多因素的影響,與進化鐘相左的數(shù)據(jù),無論是用氨基酸、核苷酸序列差異、免疫學(xué)距離,還是用DNA雜交復(fù)性等參數(shù),均不斷有所報道,其論爭預(yù)計將繼續(xù)下去。

. 自從60年代初發(fā)現(xiàn)分子進化鐘--“分子進化速率在不同種系中恒定”以來,人們又陸續(xù)發(fā)現(xiàn)蛋白質(zhì)中氨基酸的置換是隨機而非模式性的;DNA在哺乳動物種系的總變異速率遠遠高于形態(tài)上的變異速率并遠遠超出人們的預(yù)期的大于0.5核苷酸/ 基因組/ 年;蛋白質(zhì)電泳表明物種內(nèi)存在大量的變異即廣泛的種內(nèi)多態(tài)性,且這些多態(tài)性并無可見的表型效應(yīng),與環(huán)境條件亦無明顯相關(guān)。以上這些都是新達爾文主義與綜合進化理論所難以解釋的。

面對上述問題,日本群體遺傳學(xué)家木村資生(Motoo Kimura)提出:(1) 進化過程中的核苷酸置換其絕大部分是中性或近似中性的突變隨機固定的結(jié)果而不是正向達爾文選擇的結(jié)果:(2) 許多蛋白質(zhì)多態(tài)性必須在選擇上為中性或近中性,并在群體中由突變引入與隨機滅絕間兩者的平衡維持。

上述論著問世遭遇到經(jīng)典進化學(xué)家的強烈批判。他們認為新的分子生物學(xué)數(shù)據(jù)完全可以用新達爾文主義的原理來解釋。直至現(xiàn)在,選擇論者與中性論者的議爭仍在繼續(xù)。這兩大學(xué)派的本質(zhì)區(qū)別可通過它們各自對突變基因如何在物種內(nèi)置換老基因這一進化過程的不同解釋來洞悉。每一置換剛出現(xiàn)時在群體內(nèi)均為稀有的突變等位基因,隨后擴散至個群體并被固定,即頻率達100%。選擇論者認為:一個突變的等位基因在物種內(nèi)擴散,就必需具有某些選擇上的優(yōu)勢,如在選擇上為中性,就必需與一選擇上具優(yōu)勢的基因緊密連鎖,通過“搭車”而達到較高頻率。與此相反,中性論者認為:一些突變在沒有任何選擇優(yōu)勢的情況下也能自身在群體中擴散。如果一突變體在選擇上等同于已存在的等位基因,其命運將取決于機會-隨機,其頻率存在上下起伏,因為在每代每一雌、雄個體所生的大量配子中只有很少數(shù)配子最終被“采用”以形成合子以及相應(yīng)的個體,并出現(xiàn)在下一代中。在這種隨機漂變(random drift)中,絕大部分突變等位基因隨機丟失,但有一少部分在群體中被固定下來。如果中性突變在分子水平上普遍存在,且隨機漂變在很長時間(如百萬年)一直延續(xù),群體的遺傳組成將發(fā)生顯著性改變。群體中出現(xiàn)的任何中性突變其最終固定的概率都等于其原始頻率,其固定的平均時間四倍于有效群體的大。ㄋ频扔诿恳淮鷧⑴c繁殖的個體數(shù),通常遠小于物種的個體總數(shù))。中性理論并非認為中性基因無功能,而僅是認為不同的等位基因在促進個體的生存與生殖方面是有等同的效果。此外,還需強調(diào)個體基因突變與群體基因置換的差別,因為只有后者才與分子進化相關(guān)。

自Zuckerkandl與Pauling的早期工作以來,已經(jīng)知道在蛋白質(zhì)進化中結(jié)構(gòu)和化學(xué)性質(zhì)上相似的氨基酸間的替換比不相似間的替換更為頻繁。他們認為,這種“保守的”的替換看來只造成分子功能的微小改變,因而更容易“被自然選擇接受”。同時他們指出,關(guān)于氨基酸殘基的最重要性質(zhì)是什么,“化學(xué)家和生物學(xué)家間顯然沒有同樣的見解”。從中性學(xué)說的立場看,保守替換的性質(zhì),只需注意到兩種氨基酸間的差異越小,它們等于選擇等價而不是突變有害的概率就越大,就很容易加以解釋。因此,選擇上呈中性的替換在得類似的氨基酸間則概率越高,而這類氨基酸的進化替換由于隨機遺傳漂變則出現(xiàn)得更為頻繁。

在闡明分子進化中突變型替換的保守性的同時,有越來越多的證據(jù)表明,功能上較不重要的分子或某一分子較不重要的部分,其進化(以突變型替換表示)比那些較重要的要快些。中性論和選擇論間的差別,在它們對快速進化的分子(如血纖蛋白肽)或分子的某部分(如胰島素原的C肽)進行解釋時,可以最清楚地看出,按中性學(xué)說解釋,它們在功能上不重要,因而大多數(shù)突變是中性的,突變通過隨機漂變而迅速積累。另一方,選擇論的解釋是,快速進化的分子或分子的某部分或許有某些尚不知道的功能,并且通過積累許多由正達爾文選擇產(chǎn)生的較微有利的突變,而經(jīng)歷了迅速的適應(yīng)性方面的改善。這兩種解釋那一種更為恰當(dāng)還有待積累更多數(shù)據(jù)以后才能判定。為了加深我們對分子進化機制的理解,很有必要研究突變型替換的模式與分子的三級結(jié)構(gòu)和功能的相互關(guān)系。

綜上,中性學(xué)說(或者更確切地說是中性突變-隨機漂變假說)是分子生物學(xué)與群體遺傳學(xué)交融的產(chǎn)物。它不象傳統(tǒng)的綜合理論(或新達爾文派的觀點),它明確主張:進化中大多數(shù)突變型的置換,不是由于正達爾文選擇,而是由選擇上呈中性或近中性的突變型的隨機固定所致。它還斷言,分子水平上大多數(shù)種內(nèi)遺傳多態(tài)性,象以蛋白質(zhì)多態(tài)性形式展現(xiàn)出來的那樣,是選擇上呈中性或近中性的,并靠著突變輸入和等位基因的隨機清除或固定這兩者之間的平衡而在物種中維持。應(yīng)該說,這一理論對于人們所認識的分子進化眾多現(xiàn)象與規(guī)律的闡釋比新達爾文更為科學(xué),且提出的多項預(yù)測被隨后的實驗研究所證實。問題是,它作為一種更基本層次-分子水平的進化理論未能給更高層次的進化提供理性闡釋與描寫。中性論者過多地注目于與功能無關(guān)的分子進化,而忽視了與功能相關(guān)的分子進化現(xiàn)象與規(guī)律的探索,這恐怕是中性理論之所以能問世,但同時又先天性地帶上無視宏觀進化,對宏觀進化束手無策這一天然缺陷的癥結(jié)所在。

5.2 進化樹

分子鐘的發(fā)現(xiàn)對于進化研究具有十分重要的意義。它不僅能用于粗略估計不同類群生物間的進化時間,亦可用于構(gòu)建進化樹。實際上,分子鐘發(fā)現(xiàn)不久,蛋白質(zhì)序列分析即被廣泛用于生物的長時進化研究。

根據(jù)蛋白質(zhì)的序列或結(jié)構(gòu)差異關(guān)系可構(gòu)建分子進化樹(evolutionary tree)或種系發(fā)生樹(phylogenetic tree)。進化樹給出分支層次或拓撲圖形,它是產(chǎn)生新的基因復(fù)制或享有共同祖先的生物體的歧異點的一種反映,樹枝的長度反映當(dāng)這些事件發(fā)生時就存在的蛋白質(zhì)與現(xiàn)在的蛋白質(zhì)之間的進化距離。根據(jù)進化樹不僅可以研究從單細胞有機體到多細胞有機體的生物進化過程,而且可以粗略估計現(xiàn)存的各類種屬生物的分歧時間。通過蛋白質(zhì)的分子進化樹分析,為從分子水平研究物種進化提供了新的手段,可以比較精確的確定某物種的進化地位。對于物種分類問題,蛋白質(zhì)的分子進化樹亦可作為一個重要的依據(jù)。
  構(gòu)建進化樹的方法包括兩種:一類是序列類似性比較,主要是基于氨基酸相對突變率矩陣(常用PAM250)計算不同序列差異性積分作為它們的差異性量度(序列進化樹);另一類在難以通過序列比較構(gòu)建序列進化樹的情況下,通過蛋白質(zhì)結(jié)構(gòu)比較包括剛體結(jié)構(gòu)疊合和多結(jié)構(gòu)特征比較等方法建立結(jié)構(gòu)進化樹。

序列進化樹

構(gòu)建序列進化樹的主要步驟是比對,建立取代模型,建立進化樹以及進化樹評估。

1.建立數(shù)據(jù)模型(比對)

建立一個比對模型的基本步驟包括:選擇合適的比對程序;然后從比對結(jié)果中提取系統(tǒng)發(fā)育的數(shù)據(jù)集,至于如何提取有效數(shù)據(jù),取決于所選擇的建樹程序如何處理容易引起歧義的比對區(qū)域和插入/刪除序列(即所謂的indel狀態(tài)或者空位狀態(tài))。

一個典型的比對過程包括:首先應(yīng)用CLUSTALW程序,然后進行手工比對,最后提交給一個建樹程序。這個過程有如下特征選項:(1)部分依賴于計算機(也就是說,需要手工調(diào)整);(2)需要一個先驗的系統(tǒng)發(fā)育標準(即需要一個前導(dǎo)樹);(3)使用先驗評估方法和動態(tài)評估方法(推薦)對比對參數(shù)進行評估;(4)對基本結(jié)構(gòu)(序列)進行比對(對于親水氨基酸,推薦引入部分二級結(jié)構(gòu)特征);(5)應(yīng)用非統(tǒng)計數(shù)學(xué)優(yōu)化。這些特征選項的取舍依賴于系統(tǒng)發(fā)育分析方法。

2.決定取代模型

取代模型既影響比對,也影響建樹;因此需要采用遞歸方法。對于核酸數(shù)據(jù)而言,可以通過取代模型中的兩個要素進行計算機評估,但是對于氨基酸和密碼子數(shù)據(jù)而言,沒有什么評估方案。其中一個要素是堿基之間相互取代的模型;另外一個要素是序列中不同位點的所有取代的相對速率。還沒有一種簡單的計算機程序可以對較復(fù)雜的變量(比如,位點特異性或者系統(tǒng)特異性取代模型)進行評估,同樣,現(xiàn)有的建樹軟件也不可能理解這些復(fù)雜變量。

3.建樹方法

三種主要的建樹方法分別是距離、最大節(jié)約(maximum parsimony, MP)和最大似然(maximum likelihood,ML)。最大似然方法考察數(shù)據(jù)組中序列的多重比對結(jié)果,優(yōu)化出擁有一定拓撲結(jié)構(gòu)和樹枝長度的進化樹,這個進化樹能夠以最大的概率導(dǎo)致考察的多重比對結(jié)果。距離樹考察數(shù)據(jù)組中所有序列的兩兩比對結(jié)果,通過序列兩兩之間的差異決定進化樹的拓撲結(jié)構(gòu)和樹枝長度。最大節(jié)約方法考察數(shù)據(jù)組中序列的多重比對結(jié)果,優(yōu)化出的進化樹能夠利用最少的離散步驟去解釋多重比對中的堿基差異。

距離方陣方法簡單的計算兩個序列的差異數(shù)量。這個數(shù)量被看作進化距離,而其準確大小依賴于進化模型的選擇。然后運行一個聚類算法,從最相似(也就是說,兩者之間的距離最短)的序列開始,通過距離值方陣計算出實際的進化樹,或者通過將總的樹枝長度最小化而優(yōu)化出進化樹。用最大節(jié)約方法搜索進化樹的原理是要求用最小的改變來解釋所要研究的分類群之間的觀察到的差異。最大似然方法評估所選定的進化模型能夠產(chǎn)生實際觀察到的數(shù)據(jù)的可能性。進化模型可能只是簡單地假定所有核苷酸(或者氨基酸)之間相互轉(zhuǎn)變的概率一樣。程序會把所有可能的核苷酸輪流置于進化樹的內(nèi)部節(jié)點上,并且計算每一個這樣的序列產(chǎn)生實際數(shù)據(jù)的可能性(如果兩個姐妹分類群都有核苷酸“A”,那么,如果假定原先的核苷酸是“C”,得到現(xiàn)在的“A”的可能性比起假定原先就是“A”的可能性要小得多)。所有可能的再現(xiàn)(不僅僅是比較可能的再現(xiàn))的幾率被加總,產(chǎn)生一個特定位點的似然值,然后這個數(shù)據(jù)集的所有比對位點的似然值的加和就是整個進化樹的似然值。

4.進化樹搜索

單一的進化樹的數(shù)量會隨著分類群數(shù)量的增長而呈指數(shù)增長,從而變?yōu)橐粋天文數(shù)字。由于計算能力的限制,現(xiàn)在一般只允許對很小一部分的可能的進化樹進行搜索。具體的數(shù)目主要依賴于分類群的數(shù)量、優(yōu)化標準、參數(shù)設(shè)定、數(shù)據(jù)結(jié)構(gòu)、計算機硬件以及計算機軟件。

有兩種搜索方法保證可以找到最優(yōu)化的進化樹:窮舉法和樹枝 跳躍法(BB)。對于一個很大的數(shù)據(jù)集,這兩種方法都很不實用。對分類群數(shù)量的限制主要取決于數(shù)據(jù)結(jié)構(gòu)和計算機速度,但是對于超過20個分類群的數(shù)據(jù)集,BB方法很少會得到應(yīng)用。窮舉法要根據(jù)優(yōu)化標準,對每一個可能的進化樹進行評估。BB方法提供一個邏輯方法,以確定那些進化樹值得評估,而另一些進化樹可被簡單屏蔽。因此BB方法通常要比窮舉法快得多。

絕大多數(shù)分析方法都使用“啟發(fā)式”的搜索。啟發(fā)式現(xiàn)搜索出相近的次優(yōu)化的進化樹家族(“島嶼”),然后從中得到優(yōu)化解(“山頂”)。不同的算法用不同程度的精確性搜索這些島嶼和山頂。最徹底也是最慢的程序(TBR,tree bisection-reconnection,進化樹對分重接)先把進化樹在每一個內(nèi)部樹枝處劈開,然后以任意方式將劈開的碎片重新組合起來。最快的算法只是檢查一下相鄰終端的不太重要的重新組合,因此傾向于找到最近的島嶼的山頂。

降低搜索代價的最好方法是對數(shù)據(jù)集進行剪除。影響優(yōu)化搜索策略選擇的因素(數(shù)據(jù)量,數(shù)據(jù)結(jié)構(gòu),時間量,硬件,分析目的)太復(fù)雜,無法推薦一個簡單可行的處方。因此進行搜索的用戶必須對數(shù)據(jù)非常熟悉且有明確的目標,了解各種各樣的搜索程序及自己硬件設(shè)備和軟件的能力。

除上述當(dāng)前應(yīng)用最廣的方法外,還有大量的建立和搜索進化樹的其它方法。這些方法包括Wagner距離方法和親近方法(距離轉(zhuǎn)化方法);Lake的不變式方法(一個基于特征符的方法,它選擇的拓撲結(jié)構(gòu)包含一個意義重大的正數(shù)以支持顛換);Hadamard結(jié)合方法(一個精細的代數(shù)方陣方法,對距離數(shù)據(jù)或者觀察到的特征符進行修正);裂解方法(這個方法決定在數(shù)據(jù)中應(yīng)該支持哪一個基于距離的可選的拓撲結(jié)構(gòu));四重奏迷惑(Quartet puzzling)方法可以為ML建樹方法所應(yīng)用,這個算法相對而言是個較快的進化樹搜索算法。

5.確定樹根

上述的建樹方法所產(chǎn)生的都是無根樹(進化樹沒有進化的極性)。為了評估進化假說,通常必須要確定進化樹的樹根。確定系統(tǒng)發(fā)育進化樹的樹根并不簡單問題。一種確定樹根的好方法就是分析時加入一個復(fù)制的基因。如果來自絕大多數(shù)物種或者所有物種的所有的平行基因在分析時都被包含進去,那么從邏輯上我們就可以把進化樹的樹根定位于平行基因進化樹的交匯處,當(dāng)然要假定在所有進化樹中都沒有長樹枝問題。

6.評估進化樹和數(shù)據(jù)

現(xiàn)在已經(jīng)有一些程序可以用來評估數(shù)據(jù)中的系統(tǒng)發(fā)育信號和進化樹的健壯性。對于前者,最流行的方法是用數(shù)據(jù)信號和隨機數(shù)據(jù)作對比實驗(偏斜和排列實驗);對于后者,可以對觀察到的數(shù)據(jù)重新取樣,進行進化樹的支持實驗(非參數(shù)自引導(dǎo)和對折方法)。似然比例實驗可以對取代模型和進化樹都進行評估。

5.3結(jié)構(gòu)進化樹

隨著X-ray、NMR等實驗技術(shù)的的進步,蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)的數(shù)量日益增多,結(jié)構(gòu)精度也越來越高,使得結(jié)構(gòu)比較更為可行。目前已經(jīng)發(fā)現(xiàn)許多蛋白的一級序列差異很大,難以通過序列比對進行分子進化的研究,但它們的空間拓撲結(jié)構(gòu)仍然很相似,可以進行結(jié)構(gòu)疊合比較、分析它們之間的進化關(guān)系,這表明結(jié)構(gòu)比較可以比序列比較獲得更多更精確的結(jié)構(gòu)信息。研究發(fā)現(xiàn)蛋白質(zhì)結(jié)構(gòu)比序列的保守性更強,進化過程中蛋白質(zhì)序列可能發(fā)生變化,但它的折疊模式更為保守,即使是70%的序列發(fā)生變化,它的折疊模式也不會有很大的改變[1]。蛋白質(zhì)分子的結(jié)構(gòu)比較與蛋白質(zhì)一級序列比較法相比,具有更高的優(yōu)越性。

目前有關(guān)蛋白質(zhì)結(jié)構(gòu)比較的研究方法很多,主要有剛體結(jié)構(gòu)疊合比較、多特征的結(jié)構(gòu)比較等方法。前者用比較后確定的拓撲等價位點的個數(shù)或等價位點Cα原子距離的均方根值作為不同結(jié)構(gòu)間差異性的量度(結(jié)構(gòu)進化樹);后者用蛋白質(zhì)結(jié)構(gòu)的多項特征如殘基的物理特性、殘基的空間傾向性、主側(cè)鏈的方向、主鏈的二面角、二級結(jié)構(gòu)類型和主側(cè)鏈的可接近性等綜合指標作為結(jié)構(gòu)的差異性量度,有時稱此類方法構(gòu)建的結(jié)構(gòu)進化樹為“類結(jié)構(gòu)”進化樹。

剛體疊合所構(gòu)建的進化樹適用于同源蛋白質(zhì)結(jié)構(gòu)預(yù)測的骨架結(jié)構(gòu)的選擇,基于序列的進化樹便于描述類似性較大的蛋白質(zhì)的進化關(guān)系,而結(jié)構(gòu)的多特征比較則適用于分析分歧較大的蛋白質(zhì)結(jié)構(gòu)。

1.剛體結(jié)構(gòu)疊合比較

當(dāng)已知2個以上同源蛋白質(zhì)的晶體結(jié)構(gòu)時,可將每兩套結(jié)構(gòu)的原子坐標進行最佳疊合,確定類似結(jié)構(gòu)中完整的一套殘基等價位點,并使等價位點間的距離平方和最小,這樣便得到各結(jié)構(gòu)的拓撲等價區(qū)。通常將結(jié)構(gòu)簡化為一系列Cα位置,等價位點被定義為在重疊結(jié)構(gòu)中位于某個特定距離范圍(不大于3埃)之內(nèi)的Cα原子。通過計算不同結(jié)構(gòu)等價位點的個數(shù)或計算多個結(jié)構(gòu)的等價位點Cα距離的均方根值作為不同結(jié)構(gòu)間差異性的度量。再根據(jù)一般的建樹方法,給出幾個結(jié)構(gòu)的進化關(guān)系。

剛體結(jié)構(gòu)疊合方法需要蛋白質(zhì)的晶體結(jié)構(gòu)數(shù)據(jù)的質(zhì)量要高。事實上,相對于序列而言,已測定的蛋白質(zhì)晶體結(jié)構(gòu)很少,許多同源蛋白質(zhì)的結(jié)構(gòu)并不知道。其次,盡管同源蛋白質(zhì)具有相同的折疊結(jié)構(gòu),它們的二級結(jié)構(gòu)成分則經(jīng)歷形變、相對平移和旋轉(zhuǎn)使側(cè)鏈達到優(yōu)化的包裝以適應(yīng)進化的壓力。對于序列相同率為30%的兩個蛋白質(zhì),由剛體疊合所確定的拓撲等殘基的均方根差大約為1.5埃,而且殘基數(shù)可能只占全部殘基數(shù)的1/3。它可能不足以進行結(jié)構(gòu)比較。因此需要發(fā)展一種更靈活的確定拓撲等價位點的方法,并且要把二級結(jié)構(gòu)成分的相對運動和變形也考慮進去。

2.多特征結(jié)構(gòu)比較

多特征結(jié)構(gòu)比較以及構(gòu)建“類結(jié)構(gòu)”進化樹的原理與基于殘基匹配記分方法(常用PAM250矩陣)進行多序列比較和構(gòu)建序列進化樹的原理相同。包括以下步驟:(1)動態(tài)規(guī)劃配準和結(jié)構(gòu)匹配;(2)多個結(jié)構(gòu)的多特征比較;(3)多特征結(jié)構(gòu)比較的距離量度;(4)繪制進化樹圖。

相關(guān)軟件

Phylip

PHYLIP是一個包含了大約30個程序的軟件包,這些程序基本上囊括了系統(tǒng)發(fā)育的所有方面。PHYLIP是免費軟件,并且可以在很多平臺上運行(Mac, DOS, Unix, VAX/VMS, 及其它)。PHYLIP目前已經(jīng)是最廣泛使用的系統(tǒng)發(fā)育程序。

PAUP

開發(fā)PAUP的目的是為系統(tǒng)發(fā)育分析提供一個簡單的,帶有菜單界面的,與平臺無關(guān)的,擁有多種功能(包括進化樹圖)的程序。PAUP 3.0只建立于MP相關(guān)的進化樹及其分析功能;而PAUP 4.0已經(jīng)可以針對核苷酸數(shù)據(jù)進行與距離方法和ML方法相關(guān)的分析功能,以及其它一些特色。

除了PAUP和PHYLIP以外,還有其它一些系統(tǒng)發(fā)育程序,這些程序包括FastDNAml, MACCLADE, MEGA plus METREE, MOLPHY和PAML。

PHYLOGENETIC RESOURCES

http://www.ucmp.berkeley.edu/subway/phylogen.html

PHYLOGENY PROGRAMS

http://evolution.genetics.washington.edu/phylip/software.html

PHYLOGENETIC ANALYSIS COMPUTER PROGRAMS

http://phylogeny.arizona.edu/tree/programs/programs.html

BIOCATALOG MOLECULAR EVOLUTION http://www.ebi.ac.uk:/biocat/phylogeny.html

PHYLIP http://evolution.genetics.washington.edu/phylip.html
7樓2005-06-07 17:13:34
已閱   回復(fù)此樓   關(guān)注TA 給TA發(fā)消息 送TA紅花 TA的回帖

BlueGuy

榮譽版主 (正式寫手)

懶懶的小蟲蟲


miRNA(金幣+1):謝謝!!
6 基因組序列信息分析

DNA序列自身編碼特征的分析是基因組信息學(xué)研究的基礎(chǔ),特別是隨著大規(guī)模測序的日益增加,它的每一個環(huán)節(jié)都與信息分析緊密相關(guān)。從測序儀的光密度采樣與分析、堿基讀出、載體標識與去除、拼接、填補序列間隙、到重復(fù)序列標識、讀框預(yù)測和基因標注的每一步都是緊密依賴基因組信息學(xué)的軟件和數(shù)據(jù)庫。特別是拼接和填補序列間隙更需要把實驗設(shè)計和信息分析時刻聯(lián)系在一起。

基因組不僅是基因的簡單排列,更重要的是它有其特有的組織結(jié)構(gòu)和信息結(jié)構(gòu),這種結(jié)構(gòu)是在長期的演化過程中產(chǎn)生的,也是基因發(fā)揮其功能所必須的。利用國際EST 數(shù)據(jù)庫 (dbEST) 和各實驗室測定的相應(yīng)數(shù)據(jù),經(jīng)過大規(guī)模并行計算識別并預(yù)測新基因,新SNPs以及各種功能位點,如剪接與可變剪接位點等。

到2005年初在人類的約3萬個基因中有2.1萬多個已被發(fā)現(xiàn)。由于新基因帶來的顯著經(jīng)濟效益和社會效益,它們成為了各國科學(xué)家當(dāng)前爭奪的熱點。EST序列 (Expressed Sequence Tags) 到1999年12月已搜集了約200萬條,它大約覆蓋了人類基因的 90%,因此如何利用這些信息發(fā)現(xiàn)新基因成了近幾年的重要研究課題。同時1998年國際上又開展了以EST為主發(fā)現(xiàn)新SNPs的研究。因此利用EST數(shù)據(jù)庫發(fā)現(xiàn)新基因、新SNPs以及各種功能位點是近幾年的重要研究方向。

雖然對約占人類基因組 95%的非編碼區(qū)的作用人們還不清楚,但從生物進化的觀點看來,這部分序列必定具有重要的生物功能。普遍的認識是,它們與基因在四維時空的表達調(diào)控有關(guān)。尋找這些區(qū)域的編碼特征,信息調(diào)節(jié)與表達規(guī)律是未來相當(dāng)長時間內(nèi)的熱點,是取得重要成果的源泉。

在不同物種、不同進化水平的生物的相關(guān)基因之間進行比較分析,是基因研究的重要手段。目前,模式生物全基因組序列數(shù)據(jù)越來越多,因此,基因的比較研究,也必須從基因的比較,上升到對不同進化水平的生物在全基因組水平上的比較研究。這樣的研究將更有效地揭示基因在生命系統(tǒng)中的地位和作用,解釋整個生命系統(tǒng)的組成和作用方式。

 

6.1 基因組序列分析工具

1. Wisconsin軟件包(GCG)

Genetics Computer Group公司開發(fā)的Wisconsin軟件包,是一組綜合性的序列分析程序,使用公用的核酸和蛋白質(zhì)數(shù)據(jù)庫。SeqLab是其圖形用戶界面(GUI),通過它可以使用所有Wisconsin軟件包中的程序及其支持的數(shù)據(jù)庫。此外,它還提供了一個環(huán)境用于創(chuàng)建、顯示、編輯和注釋序列。SeqLab也可以被擴展使其可以包括其它公用或非公用的程序和數(shù)據(jù)庫。

Wisconsin軟件包由120多個獨立的程序組成,每個程序進行一項單一的分析任務(wù)。包括所有程序的完整目錄以及詳細的描述可以在Wisconsin軟件包的程序使用文檔中找到。GCG支持兩種核酸數(shù)據(jù)庫(GenBank數(shù)據(jù)庫, 簡化版的EMBL核酸序列數(shù)據(jù)庫)和三種蛋白質(zhì)數(shù)據(jù)庫(PIR,SWISS-PROT, SP-TrEMBL)。這些數(shù)據(jù)庫既有GCG格式的(供大多數(shù)Wisconsin軟件包程序使用),也有BLAST格式的(供BLAST數(shù)據(jù)庫搜索程序使用)。同時還提供了用于LookUp程序以及數(shù)據(jù)庫參考搜索的索引。

關(guān)于GCG,Wisconsin軟件包,支持的平臺以及硬件需求的一般性信息可以在GCG的主頁以及Wisconsin軟件包的用戶手冊中找到。GCG主頁提供了更新信息以及Wisconsin軟件包程序的完整列表。

SeqLab中可以使用多個序列分析程序的特性使用戶可以應(yīng)用這些程序順序地回答相關(guān)問題或在對輸入序列進行編輯后重復(fù)某項分析。而可以同時訪問公用數(shù)據(jù)庫和本機序列的優(yōu)點使用戶可以在一個分析中使用其中任意一種而不用先進行轉(zhuǎn)換或格式化的工作。SeqLab可以解決的序列分析問題:

(1)在兩條mRNA中尋找開放閱讀框架,翻譯并對比RNA與蛋白質(zhì)序列

對兩條相關(guān)的mRNA進行測序的用戶可能希望尋找開放閱讀框架(ORF)、翻譯以及進行核酸與氨基酸序列間的兩兩對比。

把序列加入SeqLab Editor中,從Functions菜單中選中Map選項運行Map程序。Map輸出文件包含了限制性酶切圖和6種可能的翻譯框架的ORF的顯示。這些ORF的起始和終止位置可進行標記并選為SeqLab Editor中序列顯示的范圍,然后可用Edit菜單的Translate操作進行翻譯。翻譯結(jié)果自動出現(xiàn)在SeqLab Editor中。

兩條相關(guān)的核酸或蛋白質(zhì)序列可用Gap程序或BestFit程序進行對比。Gap程序?qū)ふ覂蓷l序列間的全局最優(yōu)對比結(jié)果。適用于兩條待比對的序列是進化相關(guān)的情況。BestFit程序?qū)ふ覂蓷l序列的局部最優(yōu)對比結(jié)果,它適用于兩條序列不是進化相關(guān)而是功能相關(guān)的情況。

(2)通過參考搜索尋找數(shù)據(jù)庫中的相關(guān)條目并進行對比

研究一個特征序列家族成員的用戶可能希望尋找這個家族中的其它成員并建立它們的多序列對比。

從Functions菜單中選取LookUp程序。LookUp在數(shù)據(jù)庫條目的參考信息部分搜索描述詞并建立匹配條目的列表。在參考部分的Definiton, Author, Keyword和Organism域中搜索描述詞并在詞之間使用“and”(&)、“or”(|)以及“but not”(!)布爾表達式。例如,在SWISS-PROT條目的Description域搜索“l(fā)actate & dehydrogenase & h & chain”將產(chǎn)生一個輸出文件,其中列出了乳酸脫氫酶 H 鏈(lactate dehydrogenase H chain)條目。這個輸出文件可以從Output Manager窗口中加以顯示,然后與用戶的序列一起添加到SeqLab Editor中。

要創(chuàng)建所有這些序列的多序列對比,只要根據(jù)序列名稱選中這些序列并從Functions菜單中運行PileUp程序。由PileUp產(chǎn)生的多序列文件也列在Output Manager窗口中并可以直接添加到SeqLab Editor中。推薦采用這一步的原因在于數(shù)據(jù)庫條目的特征表格(Features table)信息可與對比結(jié)果一起被包括進來。必要時對比結(jié)果是可以被編輯的,并且如果數(shù)據(jù)庫條目有相似的特征,這些特征可被附加給用戶序列。

(3)用查詢序列搜索數(shù)據(jù)庫,將找到的條目與查詢序列進行對比并產(chǎn)生進化系統(tǒng)樹

克隆并測序一個未知功能基因的用戶可能希望在一個數(shù)據(jù)庫中搜索相似的序列。如果搜索到了,用戶可能進一步希望創(chuàng)建與查詢序列最相似的序列的多序列對比并產(chǎn)生數(shù)據(jù)的種系圖。

往SeqLab Editor中添加一個查詢序列并從Functions菜單中選取FASTA程序。FASTA程序在數(shù)據(jù)庫中搜索與查詢序列相似的序列。輸出文件可從Output Manager窗口中加以顯示并直接添加到SeqLab Editor中。在這個輸出文件中數(shù)據(jù)庫條目與查詢序列局部相似性最好的區(qū)域被加以標記。如果要顯示的話,每個數(shù)據(jù)庫條目只有這種區(qū)域可以顯示在SeqLab Editor中。不要的條目可以從SeqLab Editor中一起被刪除。

從Functions菜單中選中PileUp程序創(chuàng)建這些序列的多序列對比。輸出可從Output Manager窗口中加以顯示并添加到SeqLab Editor中更新已經(jīng)存在的未對比序列。必要時可對這一對比結(jié)果進行編輯,并且數(shù)據(jù)庫條目的有用的特征表格信息也可以添加給查詢序列。

從Functions菜單中選取PaupSearch程序,程序提供了一個PAUP(進化系統(tǒng)簡約性分析(Phylogenetic Analysis Using Parsimony))中樹搜索方式的GCG接口。PaupDisplay程序為PAUP中的樹操作,鑒定以及顯示方式提供了一個GCG接口。

(4)拼接交疊序列片段產(chǎn)生一連續(xù)序列,尋找并翻譯這一序列的編碼區(qū)域并在數(shù)據(jù)庫中搜索相似序列

克隆了一個基因,把它分解克隆為一組有交疊的序列片段并進行了測序的用戶可能希望把這些序列片段重新組裝為一條連續(xù)的序列。一旦contig拼接完成,用戶可能希望在序列中尋找閱讀框架,翻譯并在數(shù)據(jù)庫中搜索相似序列。

Fragment Assmbly System的程序可用于拼接交疊序列片段。GelStart程序創(chuàng)建一個項目。GelEnter程序把序列片段復(fù)制到項目中。GelMerge程序?qū)ふ移沃g的交疊并把它們拼接成contig。GelAssemble程序是一個編輯器,可用于編輯這些連續(xù)的部分并解決片段之間的沖突問題。所有這些程序都可以從Functions菜單中選取。一旦拼接完成,最終構(gòu)成此contig的連續(xù)序列可以被保存為一個序列文件并添加到SeqLab Editor中。

使用Map、Frames、TestCode或Codon Preference程序可預(yù)測序列中的編碼區(qū)(所有這些程序可以從Functions菜單中選中)。使用Edit菜單的Select Range功能選擇這些程序預(yù)測的區(qū)域并使用Edit菜單中的翻譯操作把它們翻譯為蛋白質(zhì)。這些提出的翻譯區(qū)域也可以作為核酸共有序列的特征被加入。

選取蛋白質(zhì)序列然后選擇Functions菜單中BLAST。BLAST程序在數(shù)據(jù)庫中搜索與查詢序列相似的條目,此程序既可以進行遠程搜索也可以進行本機搜索。搜索結(jié)果可以從Output Manager窗口中加以顯示。如果被搜索的是一個本機的數(shù)據(jù)庫,結(jié)果文件可以加入SeqLab Editor或Main List窗口中,并允許對找到的序列進行進一步分析。

(5)對比相關(guān)的蛋白質(zhì)序列,計算對比結(jié)果的共有序列,辨識序列中新的特征序列模式,在數(shù)據(jù)庫中搜索包含此模式的序列或在對比結(jié)果的共有序列中搜索已知的蛋白質(zhì)模式

辨識了一組相關(guān)序列的用戶可能希望對其進行對比并計算對比結(jié)果的共有序列。如果可以在對比結(jié)果中找到保守模式,用戶可能希望在數(shù)據(jù)庫中搜索包含這種模式的其它序列。用戶可能還希望在計算出的共有序列搜索已知的蛋白質(zhì)模式。

選取待對比的序列,從Functions菜單中選取PileUp程序創(chuàng)建多序列對比,PileUp程序的輸出文件可從Output Manager窗口中加以顯示并添加到SeqLab Editor中。用戶可以對對比結(jié)果的某個區(qū)域重新加以對比并以此替換原有的對比結(jié)果。只要選取一個區(qū)域并重新運行PileUp即可。從PileUp Options窗口中選取"realign a portion of an existing alignment(重新對比一個已存在的對比結(jié)果的一部分)",這可能有利于選擇一個替代評分矩陣或不同的創(chuàng)建和擴展處罰。新的輸出文件將包含最初的對比結(jié)果以及替換原始對比結(jié)果的重新對比的區(qū)域。

用Edit菜單中Consensus操作計算對比結(jié)果的共有序列。如果保守模式可被辨識,從Functions菜單中選取FindPatterns選項。從共有序列中剪切下此特征序列模式并把它粘貼到FindPatterns模式選擇器中,并在數(shù)據(jù)庫中搜索包含這一模式的序列。

此外,運行Motif程序可在共有序列中搜索已知的蛋白質(zhì)模式。Motif在蛋白質(zhì)序列中搜索在PROSITE,蛋白質(zhì)位點和模式的PROSITE字典中已知的蛋白質(zhì)模式。如果辨識出一個Motif,則給所有序列增加一個特征,并標出它的位置。圖4.9顯示了一個蛋白質(zhì)序列的匹配、一個共有序列以及Motif搜索的結(jié)果。

(6)使用Profile進行相似性搜索并對比相關(guān)序列

序列分析的一個新的擴展領(lǐng)域是Profile技術(shù)。一個profile是一個位置特定的評分矩陣,它包含了一個序列對比結(jié)果中每個位置的所有殘基信息。這一點與共有序列不同,共有序列中只包含每個位置的保守殘基的信息。Profile做好后可用于搜索數(shù)據(jù)庫、數(shù)據(jù)庫劃分或在一個集合中搜索與原始對比結(jié)果中的序列相似的序列。它也可以用于把一條單獨的序列與一個對比結(jié)果進行對比。

使用ProfileMake程序可創(chuàng)建一個序列對比結(jié)果的profile。使用ProfileSearch程序可用profile對數(shù)據(jù)庫進行搜索,ProfileSegment程序可以顯示搜索結(jié)果。使用ProfileGap程序可將一個序列與profile進行對比。ProfileMake, ProfileSearch, ProfileSegments以及ProfileGap程序都可以從Functions菜單中啟動。

GCG的主頁 http://www.gcg.com

2. ACEDB

ACEDB是一種被廣泛應(yīng)用的管理和提供基因組數(shù)據(jù)的工具組,適用于許多動物和植物的基因組計劃。該軟件是免費的,并且可運行在Unix和Macintosh OS系統(tǒng)下,Windows版本馬上就會推出。數(shù)據(jù)庫以豐富的圖形界面提供信息,包括有具體顯示的基因圖譜,物理圖譜,新陳代謝的途徑和序列等。數(shù)據(jù)用流行的對象的形式進行組織,使用大家熟悉的類別如,相關(guān)的文獻,基因,描述,和克隆的DNA等。可用于專用的數(shù)據(jù)分析以及許多永久性數(shù)據(jù)的采集,而且使用者不需要經(jīng)過專門的計算機和數(shù)據(jù)庫的訓(xùn)練就可以使用ACEDB。對于資源有限的計劃,這往往是決定使用ACEDB的關(guān)鍵因素。

3.其它工具

不同的基因組測序中心都有其特有的一套序列管理分析方案及工具,并且在不斷發(fā)展完善之中,具體細節(jié)可訪問這些測序中心的網(wǎng)站了解。

 

6.2人類和鼠類公共物理圖譜數(shù)據(jù)庫的使用

1.物理圖譜的類型

物理圖譜有許多結(jié)構(gòu)和形式。限制性圖譜(restriction map),用于對小區(qū)域、如kb量級做精細結(jié)構(gòu)制圖,細胞遺傳學(xué)圖(cytogenetic map),用于對以104 kb為長度量級的區(qū)域制圖。最常用的兩種類型是STS含量圖(STS content map)和放射性雜交圖(radiation hybrid map),它們的分辨區(qū)域都大于1Mb,并且有能使用簡易PCR中的定位標記物的優(yōu)點。

在STS含量圖中,STS標記物通過多聚酶鏈反應(yīng)所監(jiān)測,在反應(yīng)中它與一個大的插入克隆基因庫反應(yīng),如酵母人工染色體(TACs),細菌人工染色體(BACs)和粘粒等。如果兩個或多個STS被發(fā)現(xiàn)是存在于同一個克隆之中,那么這些標記位點緊密相鄰的機會就很高(不是100%,因為在制圖過程中存在一些假象,如出現(xiàn)嵌合克隆體)。一段時期以來,根據(jù)STS含量圖已經(jīng)建立起一系列重疊群,如含有STS的重疊簇克隆。這樣一張圖的分辨率和覆蓋度由一些因子決定,如STS的密度、克隆群體的大小、以及克隆文庫的深度。通常STS含量圖以長1Mb的插入YAC庫為基礎(chǔ),分辨率為幾百個bp。如果使用插入部分較小的克隆載體,圖譜就會有一個更高的理論分辨率,但是覆蓋基因組同樣大小面積就需要更多的STS。雖然一般有可能從STS含量圖上得到標記物的相對順序,但是相鄰標記物之間的距離還是無法精確測得。盡管如此,STS含量圖還是有與克隆原相關(guān)的優(yōu)點,并且可將其用于更進一步的研究,如次級克隆或DNA測序。到目前為止,STS含量圖制圖簡單而使用最多的來源是巴黎的CEPH(centre d Etudes du Polymorphisme Humain)中的YAC庫。它是一個10×覆蓋率的文庫,平均插入長度為~1Mb。

放射性雜交圖(對片段DNA的斷點作圖。在此技術(shù)中,一個人體細胞系被致死性的gamma射線照射,染色體DNA分成片段。然后該細胞系與一個倉鼠細胞系融合而被救,并能繁殖幾代。在這期間,人類細胞和倉鼠細胞的雜合體隨機丟失其人類染色體片段。這樣一百個或更多的雜合細胞系克隆體中,每一個都有不同數(shù)量的染色體片段,篩選生長后,就可以形成一套雜合組,供接下來的制圖實驗用了。

如果要在一個放射性雜交組中對一個STS作圖,那就要將每種雜交組細胞系中的DNA進行STS的PCR操作。細胞系中如果含有該STS的染色體片段,那么就能得到一個正的PCR信號。在基因組中相鄰很近的STS有相似的固位模式(retention pattern),因為放射性引起的斷點落在它們中間的幾率很小。相鄰較遠的STS固位模式相似性降低,相鄰很遠的STS的固位模式將會截然不同。與基因圖譜所用方法類似,算法類的軟件也能推出STS在放射性雜交圖上的相對順序,并通過斷點落在其中間的可能性,用某一距離系統(tǒng)計算相鄰標記物之間的距離。放射性雜交圖還能提供一個標記物位于某一個特殊位點的可能值(優(yōu)勢對數(shù)值)。一個放射性雜交圖的分辨率依賴于雜交體片斷的大小,而這又依賴于人體細胞系所受的輻射量。一般對基因組大小作圖的細胞系分辨率為~1M。

除STS含量圖和放射性雜交圖外還有幾個方法可用于制作人類物理圖譜?寺D譜使用與STS含量圖不同的技術(shù)來決定克隆體的接近程度。例如,CEPH YAC圖譜法綜合利用指紋法(fingerprinting)、間-Alu產(chǎn)物雜交法(inter-Alu product hybridization)和STS含量圖法來制作一張重疊的YAC克隆體圖譜。缺失和體細胞雜交圖依賴于大型基因組重組(可以人工引進或由實驗本身引起),從而將標記物放在由染色體斷點所限定的bin?中。FISH圖譜使用一個熒光信號來探測克隆體的間期DNA擴散時的雜交情況,從而以細胞遺傳學(xué)圖中一條帶的位置定出克隆體的位置。

研究者捕捉致病基因時對轉(zhuǎn)錄序列圖譜有特別的興趣。這些序列是由已表達序列,和那些從已轉(zhuǎn)化成STS并置于傳統(tǒng)物理圖譜的已知基因衍生而來的。近來一些制作大量EST的工程已經(jīng)使制圖實驗室能夠得到數(shù)以萬計的單一表達序列。一旦一個致病位點被鑒定出來后,這些轉(zhuǎn)錄序列圖譜就能明顯加快對目標基因的研究速度。

YAC庫可用于STS的排序,但其克隆體中的高嵌合率和高刪除率使它們不能用于DNA測序。去年高分辨率、可用于測序的質(zhì)粒和BAC圖譜則發(fā)展很快。因為它們所需的克隆工藝水平很低。除了幾個特例,如染色體19的Lawrence Livemore實驗室質(zhì)粒圖外,其它圖譜都還只處在初級階段。

2.大型公用數(shù)據(jù)庫中的基因組圖譜

人類基因組物理圖譜信息的主要來源是由NCBI和GDB提供的大型公用數(shù)據(jù)庫。這些數(shù)據(jù)庫提供各種圖譜的來源,使研究者能夠用一個多用戶界面交互系統(tǒng)在圖譜中進行比較。在一定程度下,這些數(shù)據(jù)庫還能進行圖譜的綜合及分析。

(1)NCBI Entrez的染色體圖譜

Entrez的基因組部分是最容易獲得物理圖譜信息的來源之一。此服務(wù)由NCBI所提供。Entrez試圖以一種可理解的方式將幾種遺傳學(xué)圖譜和物理圖譜、DNA和蛋白序列信息、以及一個目錄型引用數(shù)據(jù)庫和三維晶體結(jié)構(gòu)信息融合起來。因為它的內(nèi)部連接多,而且界面簡單,Entrez 可作為搜索圖譜的一個起始點。

除人類基因組,Entrez還提供關(guān)于鼠類、果蠅、C.elegans、酵母以及一些原生動物的圖譜。盡管可比較的(同線性)圖仍不可獲得,但它代表了現(xiàn)在最大和最完整的一套多生物體的圖譜信息。

(2)GDB的瀏覽染色體圖譜

另一種常見的人類物理圖譜數(shù)據(jù)的來源是GDB。盡管GDB是基于當(dāng)時基因圖譜的重要性才構(gòu)建起來的,但是最近幾年來,GDB也已經(jīng)進行了擴建重組,現(xiàn)在同樣可以算是物理圖譜數(shù)據(jù)的倉庫。不象NCBI,GDB只限于人類圖譜數(shù)據(jù)。它不含序列數(shù)據(jù),也沒有其它種類生物的信息。同NCBI一樣,GDB可以由WWW上得到。GDB提供了一種全功能的對其數(shù)據(jù)庫的查詢式界面。

(3)來自個體來源的基因組圖譜

盡管一級數(shù)據(jù)庫,如Entrez和GDB是已發(fā)表的圖譜的重要來源,但是它們還沒有能替代原始數(shù)據(jù)的東西。有能力制作自己的物理圖譜的實驗室一般都有自己的網(wǎng)址,連向它們的圖譜數(shù)據(jù)庫。通過從這一渠道直接獲取資料,我們可以看到制圖實驗室所使用的圖的形式、下載原始數(shù)據(jù)、并且了解實驗室制圖時的協(xié)議。另外,一些圖在出現(xiàn)于Entrez和GDB前經(jīng)常被丟掉。Entrez和GDB數(shù)據(jù)庫選擇的表達方式,對那些希望將新的標記物定位于已知物理圖譜上的研究者來說,只提供了最小的幫助。

基因組的基因圖譜

基因圖譜是制作許多物理圖譜時工作的基本骨架,也是許多制圖項目的起點。有兩種基因組范圍的基因圖譜可供選擇。Genethon圖含5264個多樣性微衛(wèi)星重復(fù)片斷,間隔1.6cM。完整的數(shù)據(jù)庫文件,以及圖譜的PostScript方式圖形表示,在Genethon的FTP站點上均可獲得,這些圖通過GDB也可以獲得。

第二大基因圖譜由人類連鎖合作中心(Cooperative Human Linkage Center)制造,CHLC圖由10775個標記物組成,大多數(shù)為微衛(wèi)星重復(fù)片斷,間隔3.7cM。

人類基因組的轉(zhuǎn)錄物圖

在1996年10月,Horno sapiens的一個全基因組轉(zhuǎn)錄物圖由一個國際合作的研究實驗室發(fā)表于Science上。這個圖由~15000個不同的表達序列組成,由放射性雜交法定位,與Genethon基因圖譜衍生的框架相近。通過對酵母人工染色體作STS含量法又增添了1000個表達序列。在這張圖中,大約1/5的標記物有已知的或是假定的功能,而余下的代表了未知功能的表達序列。制成圖的序列一般由UniGeneset衍生而來,它是一個由NCBI管理的公用重復(fù)ESTs數(shù)據(jù)庫。

轉(zhuǎn)錄物圖是通過將八家不同實驗室的圖譜數(shù)據(jù)綜合而得到的。為協(xié)調(diào)制圖方法的些微不同,表達序列被放在由Genethon基因圖譜衍生的框架上。結(jié)果,該圖的最大分辨率為~2cM。很多情況下,可以從各個實驗室的數(shù)據(jù)庫里得到針對某一部分數(shù)據(jù)更好的制圖信息,特別是the Whitehead Institute和Stanford University的。

瀏覽NCBI轉(zhuǎn)錄物圖

轉(zhuǎn)錄物圖可在兩個網(wǎng)址上得到。數(shù)據(jù)的“親本”站點為NCBI。在那兒可以找到含有全基因組轉(zhuǎn)錄物圖的Science文章的全文,以及彩色的圖象,但一般都只有裝飾性的墻面圖案。另外,也有搜索頁可以讓瀏覽者對特別感興趣的基因進行查詢,或是通過對功能未知,但其讀碼框與某已知功能的蛋白質(zhì)相近的表達序列圖譜進行搜索。

NCBI網(wǎng)址的一個限制就是它不能在低分辨率標記物分布柱形圖上提供轉(zhuǎn)錄物圖的圖形。但是通過Mapview微程序就可以得到其圖形顯示。從GDB的首頁,沿著What s New的鏈接,可找到全基因組轉(zhuǎn)錄物圖(到本書出版時鏈接形式可能已有所不同)。同樣,可以認為轉(zhuǎn)錄物圖也是Entrez網(wǎng)將要制作的一部分。

White head Institute提供的人類物理圖譜

The Whitehead Intitute/MIT Center for Genome Research是兩張基因組范圍物理圖譜的最初來源。其中一張是STS含量圖,內(nèi)含指定為YAC的10000多個標記物,以及一張含12000個左右標記物的放射性雜交圖。Whitehead所用的G4雜交板(Genebridge 4 radiation hybrid panel)分辨率為~1Mbp,而以YAC為基礎(chǔ)作的圖分辨率大約為200kbp。這些圖已經(jīng)和Genethon基因圖相結(jié)合,產(chǎn)生了一張合圖,在平均150kb范圍內(nèi)有20000個STSs。Whitehead圖上大約有一半的標記物是表達序列,它們在人類轉(zhuǎn)錄物圖上也會出現(xiàn)。

WI(Whitehead Institute)圖可通過網(wǎng)絡(luò)從Whitehead Center for Genome Research的主頁上得到。沿著“人類物理圖項目”(Human Physical Mapping Project)的鏈接就可以得到感興趣的圖,這些圖可通過幾種方法瀏覽。選擇一系列pop-up菜單可以產(chǎn)生所選染色體的圖,選擇選項按鈕可以綜合放射性雜交圖、STS含量圖和基因圖。與Entrez一樣,這些圖不是固定不變的。點擊一個STS或是重疊群,會彈出關(guān)于該圖素詳細信息的頁面。圖形式圖譜在網(wǎng)址上可按GIF或Macintosh最初模式(PICT)下載。Whitehead網(wǎng)址上還提供了對圖譜數(shù)據(jù)庫進行查詢的搜索頁。這些搜索數(shù)據(jù)的鏈接可按名稱、GenBank通道號、STS型號、染色體分配進行搜索。另外,Whitehead網(wǎng)頁也可根據(jù)功能關(guān)鍵字搜索制圖轉(zhuǎn)錄序列,并提供與NCBI中的主轉(zhuǎn)錄物圖的鏈接。

Whitehead也為那些希望建立他們自己的STS 的研究者提供服務(wù),并將之放在一個或多個圖上,這些服務(wù)包括:

一個在線的引物選擇程序,引物3

將一個STS放在STS/YAC含量圖上的服務(wù)

將一個STS放在放射性雜交圖上的服務(wù)

Whitehead圖遠未完善,對合圖進行監(jiān)督性測試就能顯示出在基因圖、放射性雜交圖和STS/YAC圖上的STSs位置間存在矛盾。這些矛盾表現(xiàn)在合圖上仍存在交叉線。解釋這些圖的一個關(guān)鍵點在于理解這些圖在可靠性與分辨率水平不一;驁D骨架在數(shù)十兆時能可靠地連接標記物,但在低于約2兆時就無法準確解決兩個STS的順序問題了。放射性雜交圖能夠測知約10Mb的連接,有效分辨率達~1Mb(更小的間隔也能排序,但是不可靠性逐步增加)。STS/YAC圖可以測知兩個相互間隔1Mb的STS的連接,估計分辨力達100~300kb。理解圖譜時頭腦中應(yīng)有這些尺度上的差異。一般在1Mb的范圍以下,STS/YAC圖是說明順序的圖譜中最可靠的一種。

在STS含量圖中,由于STS和YAC的不等分布,可靠性也會有地域差異。在YAC密集的區(qū)域(每一個STS有5個或更多的YAC),在排序信息的重要性上,圖譜結(jié)果是相對更可靠的。在低密度區(qū),圖譜結(jié)果中就會有幾種同時可能替代的STS順序,并會附上數(shù)據(jù)。假定的錯誤的反面情況,如圖12.8中,表示為圖中的空白框。這一點也會嚴重降低圖譜的準確性。最后,因為在所有YAC庫中都存在嵌合現(xiàn)象的問題,雙鍵(例如,一對STS同時與2個或更多YAC連接)比單鍵(STS只由1個YAC連接)更能可靠說明相鄰關(guān)系。盡管只有在基因圖或放射性雜交圖中存在支持性數(shù)據(jù)時,圖上才能構(gòu)建單鍵信息,但單由兩個STS相連形成的連接仍保留懷疑。這些元素在任何制圖區(qū)域被詳細檢查的時候都應(yīng)考慮在內(nèi)。

下面的部分介紹如何在Whitehead圖上,通過Whitehead網(wǎng)址安置新的STS。從STS設(shè)計和針對Whitehead和放射性雜交圖進行制圖開始。

設(shè)計一個STS,置于Whitehead上

設(shè)計一個STS需要一個高質(zhì)量的DNA序列,至少長達所需的PCR產(chǎn)物。為得到最好的結(jié)果,這些序列應(yīng)不含重復(fù)元素和載體序列,并且質(zhì)量相對高些。任何支持一個WWW瀏覽器的計算機系統(tǒng)都可以使用該程序,支持TCP/IP的網(wǎng)絡(luò)連接也是必須的。

首先,將瀏覽器連到Whitehead Genome Center的主頁。尋找并點擊指向WWW Primer Picking的鏈接。接著出現(xiàn)一頁,在其上方有一個很大的輸入框。剪切原始序列并粘貼到該處,只用粘貼原始序列,不需用名稱或其它標記詞。這些堿基可以小寫或大寫,而白色空格可以忽略。

現(xiàn)在,向下滾動窗口,將PCR的條件調(diào)至需要值。那些關(guān)于鹽濃度、溫度和產(chǎn)物大小范圍等的默認值均是WI所設(shè)定的。如果有必要的改變需輸入時,按標有Pick Primers鍵返回一套引物處進行特定設(shè)定。這些引物現(xiàn)在在對感興趣的序列的審查實驗中用得上。通過放大基因組DNA中的一條特定帶,可以對這些引物的能力進行經(jīng)驗性鑒定。引物的失敗主要與引物掃描區(qū)域中的重復(fù)元素有關(guān)。相反,通過進行BLAST或FASTA搜索,再選擇引物對,來對輸入序列中的重復(fù)序列進行篩選則是比較明智的,如果STS成功地放大了一條特定帶,它就可以與Whitehead STS/TAC含量圖或放射性雜交圖相聯(lián)系,被制成圖。

與Whitehead STS/YAC含量圖聯(lián)系對STS制圖

一旦被制出后,一個STS就可以通過對CEPT mega-YAC庫的掃描確定在STS/YAC含量圖上的位置。而對含有超過30000個克隆,其中又有1200個排列、板塊和柱池(row、plate和column pool)的YAC庫進行搜索,實在是一件頭疼的任務(wù)?上驳氖牵瑤讉生物技術(shù)公司已經(jīng)提供了CEPH YAC的復(fù)本和(或)篩選系統(tǒng),包括Research Genetics Corporation。Whitehead圖就是僅從YAC庫的后一部分構(gòu)建起來的。這意味著庫模塊中位于709-972的范圍仍需篩選。STS接著就可以用以下步驟放在圖上了。

使瀏覽器連向Whitehead的主頁,并點擊標有Human Physical Mapping Project的鏈接以跳到該組織的物理制圖頁。從這兒,再找到并選擇“Search for a YAC to its address”,接著出現(xiàn)一頁,內(nèi)有一系列pop-up菜單,能用于輸入單個YAC的地址、或一個輸入單個YAC名稱的主題欄、或一個能粘貼一列YAC地址的大型區(qū)域。后者適用于將多個YAC用于研究的時候。在這個地方輸入YAC列表,再使用“plate_row_column”形式,這里是用“_”號分離板塊、排和列這三維(如709_A_1),也可輸入多個YAC地址,用空格或carriage回車隔開。搜索過程輸入格式并不固定,它也可識別多個YAC模式(包括709_a_1和709a1)。

當(dāng)YAC表完成后,按Search鍵,得到一個表,列有各個YAC,其重疊群位置和染色體分配,以及附近STS的位置。這些STS位于放射性雜交圖和(或)基因圖上。

要理解該搜索結(jié)果,應(yīng)該知道CEPH庫中相當(dāng)數(shù)量(40-50%)的克隆都是嵌合體,這意味著單個YAC可能存在于位于基因組不同部分的重疊群中。由于這個原因,需要找到多個YAC來證明單個STS分配到了某一特定重疊群中,或是從其它方法來證明(比如FISH,體細胞雜交制圖,放射性雜交圖制圖數(shù)據(jù))。

每張圖對應(yīng)輸入的一個YAC地址,每個表包括已知YAC中的STS表,以及STS制圖信息。對于每個STS,染色體分配、基因圖位置和放射性雜交圖位置只要已知就會給出。另外,STS所屬的已命名的重疊群也列成表,這些表中大多數(shù)元素是超文字鏈接,選擇合適的鏈接可以獲得關(guān)于一個STS或一個重疊群更多的信息。由于歷史原因,許多STS有兩個重疊群。雙鏈接重疊群(例如由成對YAC共有的重疊群)短一些,在構(gòu)圖的起始階段中是可創(chuàng)造的更可靠的重疊群,它們可以被放心地忽略。單個重疊群長一些,在不同方式下也應(yīng)承認其合理性。

Whitehead放射性雜交圖

STS也能被置于Whitehead放射性雜交圖中,這比STS/YAC含量圖的問題簡單很多,因為在放射性雜交圖上搜索一個STS只用93次PCR,而不是1000次。Whitehead放射性雜交圖使用Genebridge 4 radiation hybrid panel。與CEPH YAC庫一樣,這些細胞譜系的DNA也可以從一些生物技術(shù)公司那兒得到。而有些公司還提供搜索服務(wù)。為得到最好的結(jié)果,PCR必須在與制作Whitehead圖的相同條件下進行,并應(yīng)在復(fù)制時進行。復(fù)制PCR間出現(xiàn)的不同結(jié)果說明應(yīng)繼續(xù)重復(fù)或以未知物對待。

首先,將雜交模板篩選結(jié)果重定為“rhv”格式,看上去如下:

sts_name1 001001011000001000000011010001101110011100101001211001110101010100101000

sts_name2 000001111000001000000011010000001110011100101001211001110101010100100000

每個數(shù)字代表每個放射性雜交細胞系的PCR結(jié)果:0說明PCR結(jié)果為負(無反應(yīng)產(chǎn)物),1說明為正,2說明為“未知”或“未完成”。載體上數(shù)字的順序是很重要的,必須與G4rhp中的正式順序相對應(yīng)。為找到該順序,可沿(Whitehead物理圖頁上)標有“How the radiation hybrid maps were constructed”(如何構(gòu)建放射性雜交圖)的鏈接,再按下標有“G40”的鏈接。該順序與它們由Research Genetics運輸時包裝的DNA順序相同,所以它一般還不是結(jié)果。要增加可讀性,可在載體內(nèi)加入空格,用一個或多個空格、或Tab鍵就可以將STS名稱與掃描數(shù)據(jù)分離開了。

從Whitehead物理圖頁上,按下標有“Place your own STSs on the genome framework map”(將你自己的STS放入基因組框架圖中)的鏈接,再輸入提示的合適的Email地址,并將PCR值粘貼至位于該頁上的大型主題框。輸入正確的Email地址很重要,否則制圖結(jié)果將有可能被誤解。

默認時,制圖數(shù)據(jù)會以正文形式返回。為產(chǎn)生放在Whitehead圖上的STS的圖形,選擇一個標有Mac PICT(針對Macintosh系統(tǒng))或GIF(針對Windows和Uinx系統(tǒng))的選項按鈕。

當(dāng)設(shè)置完成時,按下“提交”鍵。當(dāng)數(shù)據(jù)已被轉(zhuǎn)交或正在制圖時,你會得到一個證明,在一小時內(nèi)結(jié)果將會通過Email回執(zhí)給你。

對于大量的篩選數(shù)據(jù),如果用剪切和粘貼來向服務(wù)器提交這些文件就不太方便了。這時可以將數(shù)據(jù)以純文本形式存在用戶盤上,然后用RH制圖頁中的瀏覽鍵來定義并提交此文件給服務(wù)器,同樣,Email地址也要手工輸入。

對于~98%的提交的標記物,Whitehead放射性雜交圖制圖服務(wù)器都會找到特定的位置。如果安置成功,軟件將會給一回執(zhí),包括該標記物的染色體分布和在染色體連接群中的位置、對標記物的表格式說明、和在Whitehead放射性雜交圖上兩側(cè)標記物的存在時其數(shù)據(jù)情況。按要求將會得到一張Macintosh圖或GIF格式圖。這些圖由Whitehead框架圖組成,所提交STS的位置以紅色標明。

如果發(fā)現(xiàn)標記物連接的染色體多于一個或是根本就沒有連接,制圖過程也可能失敗。在前一種情況中,可以重新提交并設(shè)置高優(yōu)勢對數(shù)值,這樣服務(wù)器將會認為其連接一個染色體,在后一種情況中,你可以試著利用放射性雜交圖頁上的一個pop-up菜單將限制性降低。如果一個標記物確實連向多個染色體,那么有可能用STS探測出重復(fù)序列。

Stanford University放射性雜交圖

Stanford Human Genome Center已經(jīng)用G3制圖板發(fā)展了一張基因組放射性雜交圖。由于比G4板所用放射量更高,G3板的分辨率更高,但是代價是在探測長距離連接時限制很大。Stanford圖一般在平均375kb的范圍內(nèi)存在~8000個STS,這些標記物中,3700個左右是表達序列,存在于NCBI轉(zhuǎn)錄物圖中。同以往一樣,在基因組很多部分中,Stanford圖中的表達序列比“全包容”NCBI圖中的準確性更高。

Stanford提供一個放射性雜交圖制圖服務(wù)器。如同Whitehead服務(wù),這個服務(wù)器允許對從Research Genetics和其它業(yè)主處得到的G3板進行STS掃描。輸入數(shù)據(jù),服務(wù)器將會嘗試將STS與Stanford圖相連,并用Email返回結(jié)果。因為G3板不能探測長距離連接,在無其它圖譜信息時,Stanford服務(wù)器只能將75%的STS定位在一條染色體上。但是如果要在可選區(qū)域內(nèi)提供標記物的染色體分布。服務(wù)器就能夠在一個低優(yōu)勢對數(shù)連接值時進行分析,并可對90%的情況作出分布圖譜。

當(dāng)使用PCR時,STS應(yīng)對83G3板DNA掃描。為得到最好的結(jié)果,可使用Stanford的RH Protocol主頁給出的PCR協(xié)議,每次分析結(jié)果都應(yīng)該復(fù)制,并且復(fù)制品間有分析差異就應(yīng)該重復(fù)或標為未知。

Stanford服務(wù)器返回的制圖結(jié)果由一系列相應(yīng)的標記物分布組成。對于每一個STS,服務(wù)器都會報告離其最近的基因標記物、染色體、和標記物到STS的距離,以centiray(cR)為單位。盡管對于制圖結(jié)果并不提供圖形顯示,圖譜信息還是可以用來與以上討論的瀏覽圖形結(jié)合來說明所提交STS相對于Stanford圖上其它STS的位置。

要提交這一數(shù)據(jù),連接Stanford的主頁,并按下RH服務(wù)器的鏈接,然后是RH Server Web Submission。輸入Email地址和提交號的區(qū)域已被說明。Email地址對于保證收到制圖結(jié)果是很重要的。提交號是一個可選擇欄,它會同結(jié)果一起回執(zhí)給用戶,并且用于幫助工作人員使結(jié)果組織化。如果STS的染色體分布已知,那么應(yīng)輸入到標有Chromosome Number的區(qū)域。這個信息會增加制圖軟件測出一個正確連接的能力。

現(xiàn)在,將篩選數(shù)據(jù)粘到大型正文欄中,并按提交鍵。制圖結(jié)果一般在幾分鐘內(nèi)通過Email回執(zhí)。Stanford服務(wù)器以一系列相對基因標記物的位置返回制圖結(jié)果。對于每個STS,服務(wù)器會報告離其最近的基因標記物、其所在染色體和STS到標記物的距離(以centirays為單位)。盡管并不提供制圖結(jié)果的圖形顯示,制圖信息仍可用于和以上標出了用戶的STS相對Stanford圖譜上的其它STS的位置的可瀏覽型圖譜相結(jié)合。

CEPH YAC圖

1993年,巴黎的CEPH(Centre d Études du Polymorphisme Humain),與Genethon合作,發(fā)表了人類基因組的第一張物理圖譜。這張圖由幾套重疊YAC組成,形成連接鄰近基因標記物的途徑。YAC重疊可由幾種技術(shù)鑒定,包括YAC指紋印跡法(YAC fingerprinting)、與inter-Alu PCR結(jié)果雜交法、熒光原位雜交(FISH)和STS含量圖。盡管YAC克隆圖大部分已被更方便的以STS為基礎(chǔ)的圖譜替代,對于要包括CEPH YAC庫或以克隆為基礎(chǔ)的反應(yīng)物的制圖項目還是有用的。

由于YAC庫中的高嵌合率,在兩個通過指紋法或inter-Alu PCR雜交法確定相互重疊的YAC之間,每一小步可能都很可能跨過基因組的一個物理距離;谶@一點,短距離比長距離更可靠,這一概念已植入CEPH的詞條“l(fā)evel”中。一個1級(level)途徑,由兩個錨定STS組成,它們應(yīng)至少有一個YAC直接連接。這類途徑,與平面STS含量圖中用于確定相鄰關(guān)系的鍵或單鍵相類同。可以讓研究者從一個STS跳到另一個,而無需跳過任何YAC/YAC連接點。相反,一個2級途徑,由兩個錨定STS組成,不直接由單個YAC連接,而是由inter-Alu PCR或指紋法確定在包含它們的兩個或多個YAC間有一個重疊,所以2級途徑需要跳過一個YAC/YAC連接點。3級途徑需跳過2個。4級需跳過3個,等等。盡管每一種的可靠性尚未經(jīng)驗性證明,通過對一套CEPH數(shù)據(jù)的分析暗示4級或更高時可能不精確。而幸好CEPH途徑中近90%的基于間距為3級的或更低。

 

從CEPH服務(wù)器得到Y(jié)AC重疊

CEPH圖可以在其單位的網(wǎng)址上在線獲得。這里可找到的鏈接有YAC庫信息,也有一系列圖譜的后轉(zhuǎn)錄文件,用于制圖的QuickMap軟件,以及含原始圖譜數(shù)據(jù)的文件。瀏覽CEPH圖最好的作用方法為下載QuickMap文件,安裝并利用它來觀看數(shù)據(jù)文件。然而,由于QuickMap只在Sun工作站工作,這種方法已經(jīng)不可行。CEPH也提供針對QuickMap的一種在線界面,在通過標有Infoclone的鏈接處可以獲得。這時會彈出一頁,可以提交一個STS、或一個基因標記物或一個YAC的名稱。提交名稱后會回執(zhí)所有關(guān)于它的原始圖譜數(shù)據(jù)。該文本是超鏈接,可以從一個YAC的單一inter-Alu PCR雜交跳至另一個。

要得到數(shù)據(jù),將瀏覽器連到CEPH的網(wǎng)址上。這會彈出ECPH Genethon網(wǎng)頁。現(xiàn)在找到并選擇I鏈接,接下來的一頁會要你在一個小文本欄中輸入一個YAC或一個STS的名稱。YAC應(yīng)遵循簡便的plate_row_column(板塊_排_列)格式,如923_f_6。對于STS,可以用GDB分配的D-片斷名(如果可得的話)或是實驗室分配的研究名稱。該文件只針對特定事例,所以輸入AFM20ZE3不會得到正確的名為AFM220ZE3的STS。也應(yīng)注意YAC地址中排的名稱應(yīng)小寫。

按下Query(查詢)鍵,如果該名稱存在于CEPH數(shù)據(jù)庫中,那么含相似信息的頁面將會出現(xiàn)。第一部分包括一些關(guān)于STS的總體信息,如引物序列和基因圖譜信息。第二部分給出STS的YAC搜索數(shù)據(jù)。該部分列表中的所有YAC通過直接PAC掃描均發(fā)現(xiàn)含有該STS,注釋Alu-PCR probe(探針)說明這個YAC在inter-Alu PCR雜交實驗中被選用為探針。第三部分包含與STS相鄰的YAC的信息,它們與STS相隔一個inter-Alu PCR的距離。

為得到一個YAC上的制圖信息,可在文本欄輸入其名稱并按下Query鍵,出現(xiàn)的界面將會給出YAC、FISH和STS含量圖數(shù)據(jù)的尺寸信息,以及inter-Alu PCR和指紋印跡實驗中衍生出的重疊信息。

每個YAC詞條有幾個編碼與之相關(guān)。例如,在直接PCR掃描表中,c說明CEPH進行實驗的無分歧結(jié)果,而E說明為單個已證明的YAC,來源于外在(非CEPH)實驗室。在YAC/YAC重疊表中,a說明為一個A-PCR關(guān)系,而f說明為一個指紋印跡關(guān)系。完整的編碼表從位于該頁上的不同幫助鏈接中而得到。

CEPH YAC庫的一個子集已由脈沖區(qū)凝膠電泳法限定了大小。如果可以得到它,就能得到Y(jié)AC的大小。在某些情況下,可以找到多帶,這是污染的結(jié)果,或是因為在YAC插入?yún)^(qū)和克隆生長時DNA的隨機刪除所造成的。這種情況下,多YAC的大小也會演示出來。

特定人類染色體圖譜

除基因組圖譜外,許多個體染色體物理圖譜也由研究實驗室和基因組中心構(gòu)建起來了。在很多情況下,這些圖譜能比相應(yīng)基因組范圍圖譜提供更詳盡的信息。在GDB的來源頁面上可得到一個最新的表。另一張表由NHGRI的網(wǎng)址保存。

3.鼠類圖譜來源

現(xiàn)在對鼠類作物理圖活動最多的地點是Whitehead Institute/MIT Center for Genome Research,而且一張murine STS/YAC含量圖已經(jīng)被構(gòu)建起來了。這張圖,最終將在24000個YAC上含有10000個STS。

MIT的物理圖譜可以在Whitehead的主頁上在線瀏覽。先按下Mouse Genetic and Physical Mapping Project(鼠類基因圖和物理圖制圖項目)的鏈接,然后向下滾動到標有鼠類STS物理圖譜的部分。這一部分與Whitehead人類物理圖譜有相同的搜索項和用戶界面,但是放射性雜交圖數(shù)據(jù)還不可得。

在Whitehead網(wǎng)址上還可以得到基于6331個簡單相鄰長度多態(tài)性的鼠類物理圖譜,以及這張圖與Copeland/Jenkins限制性片斷長度多態(tài)性圖的整合。這些RFLP圖,分辨率為1.1cM。分辨率更高的鼠類基因圖正由European Collaborative Interspecific Mouse BackCros項目得到。該圖最大的理論分辨率將會達0.3cM,并且可以在ECJMBC的主頁上在線得到。到1997年5月已完成5條染色體。

The Mouse Genome Database(MGD)是由Bar Harbor的Jackson Laboratory維持的一個大型鼠類基因信息的公用數(shù)據(jù)庫。盡管它基本上還是一個基因圖庫,MGD還是保留了很多物理圖譜信息,包括細胞遺傳圖譜和synteny圖,將來一旦得到數(shù)據(jù)就會加進去。MGD可在Jackson Laboratory的主頁上得到。按下標有Mouse Genome Informatics的鏈接,然后是標有Mouse Genome Database的鏈接,可得到用于不同研究的一個起始網(wǎng)頁。在所列選項中包括目錄檢索、基因和標記物符號檢索、以及多態(tài)性檢索。

CEPH YAC圖
http://www.cephb.fr/ceph-genethon-map.html

CHLC圖
http://www.chlc.org

ECIMBC主頁
http://www.hgmp.mrc.ac.uk/MBx/MbxHomepage.html

Entrez主頁
http://www.ncbi.nlm.nih.gov/Entrez/

Entrez全覽頁
http://www.ncbi.nlm.nih.gov/Entrez/nentrez.overview.html

GDB主頁
http://gdbwww.gdb.org/

GDB來源頁
http://gdbwww.gdb.org/gdb/hgp_resources.html

Genethon FTP站點
ftp://ftp.genethon.fr/pub/Gmap/Nature-1995

I.M.A.G.E. Consortium
http://www.bio.llnl.gov/bbrp/image/iresources.html

Jackson實驗室
http://www.jax.org/

NHGRI來源頁
http://www.nhgri.nih.gov/Data/

Science轉(zhuǎn)錄物圖譜
http://www.ncbi.nlm.nih.gov/Science96/

Stanford主頁
http://shgc.stanford.edu/

Stanford RH協(xié)議
http://shgc.stanford.edu/Mapping/rh/procedure/

Whitehead主頁
http://www.genome.wi.mit.edu/

Whitehead FTP站點
ftp://www.genome.wi.mit.edu/pub/human_STS_releases

C.elegans
ACEDB
http://probe.nalusda.gov:8300/other/

E.coli
University of Wisonsin
http://www.genetics.wisc.edu/

D.melanogaster
FlyBase
http://flybase.indiana.edu:82/

S.cerevisiae
SGD,Stanford
http://genome-www.stanford.edu/Saccharomyces


--------------------------------------------------------------------------------

 

11.6.3 全基因組比較

在不同物種、不同進化水平的生物的相關(guān)基因之間進行比較分析,是基因研究的重要手段。目前,我們有了越來越多的模式生物全基因組序列數(shù)據(jù),因此,基因的比較研究,也必須從基因的比較,上升到對不同進化水平的生物在全基因組水平上的比較研究。這樣的研究將更有效地揭示基因在生命系統(tǒng)中的地位和作用,解釋整個生命系統(tǒng)的組成和作用方式。

對伴隨人類基因組而完成的大量微生物完整基因組的信息分析,不僅將直接幫助破譯人類遺傳密碼,其本身也可能解決重大的科學(xué)問題。因此,由完整基因組研究所導(dǎo)致的比較基因組學(xué)必將為后基因組研究開辟新的領(lǐng)域。

11.6.4 SNP的發(fā)現(xiàn)

人類基因組計劃持續(xù)產(chǎn)生大量序列數(shù)據(jù),清楚表明不同個體在整個基因組有許多點存在DNA序列的基本變異。最常見的變異發(fā)生在分散的單個核苷酸位置,即單核苷酸多態(tài)性(SNPs),估計發(fā)生頻率大約每1000個核苷酸有1個。那么,沒每1000個核苷酸,具有一個群體的基本頻率的任何一個雙拷貝染色體之間的在任一個位置平均核苷酸的一致性是不同的。SNPs是雙等位基因多態(tài)性,即多原則上態(tài)性位點的核苷酸一致性通常在人類中傾向于二分之一的機率,而不是四核苷酸機率。

SNPs在人類遺傳學(xué)研究中有重要意義。首先,一組SNPs發(fā)生在蛋白質(zhì)編碼區(qū)。特定的SNPs等位基因可被認為是人類遺傳疾病的致病因子。在個體中篩選這類等位基因可以檢查其對疾病的遺傳易感性。其次,SNPs可作為遺傳作圖研究中的遺傳標記,幫助定位和鑒定功能基因。推算3000個雙等位SNP標記將足夠進行人類全基因組作圖;100,000或更多的SNPs能夠在更大的群體中進行有效的遺傳作圖研究。因此,需要發(fā)展進行大量SNP分析的廉價高效技術(shù),包括DNA芯片技術(shù),MALDI-TOF質(zhì)譜等。

SNPs是人類遺傳多樣性最豐富的形式,可用做復(fù)雜遺傳性狀作圖。通過高通量的測序項目的得到的大量數(shù)據(jù)是豐富的大部分沒接上的SNP來源。這里介紹一種認一DNA來源的遺傳序列數(shù)據(jù)變異發(fā)現(xiàn)的整體途徑。計劃用迅速出現(xiàn)的基因組序列作為模板放置沒有作圖片段化的序列數(shù)據(jù),并用堿基質(zhì)量數(shù)值區(qū)別真正的等位基因變異與測序錯誤。

[ Last edited by BlueGuy on 2005-6-7 at 17:21 ]
8樓2005-06-07 17:14:23
已閱   回復(fù)此樓   關(guān)注TA 給TA發(fā)消息 送TA紅花 TA的回帖

BlueGuy

榮譽版主 (正式寫手)

懶懶的小蟲蟲

★ ★
miRNA(金幣+2):謝謝!
7 功能基因組相關(guān)信息分析

功能基因組學(xué)是后基因組研究的核心內(nèi)容,它強調(diào)發(fā)展和應(yīng)用整體的(基因組水平或系統(tǒng)水平)實驗方法分析基因組序列信息闡明基因功能,特點是采用高通量的實驗方法結(jié)合的大規(guī)模數(shù)據(jù)統(tǒng)計計算方法進行研究,基本策略是從研究單一基因或蛋白上升到從系統(tǒng)角度一次研究所有基因或蛋白。隨著功能基因組實驗研究的深入,大量的數(shù)據(jù)不斷涌現(xiàn),生物信息學(xué)將在功能基因組學(xué)研究中的扮演關(guān)鍵角色。

7.1 大規(guī);虮磉_譜分析

隨著人類基因組測序逐漸接近完成,科學(xué)家發(fā)現(xiàn)即使獲得了完整基因圖譜,對了解生命活動還有很大距離。我們從基因圖譜不知道基因表達的產(chǎn)物是否出現(xiàn)與何時出現(xiàn);基因表達產(chǎn)物的濃度是多少;是否存在翻譯后的修飾過程,若存在是如何修飾的,等一系列問題。這些問題的實質(zhì)是不了解按照特定的時間、空間進行的基因表達譜。獲得基因表達的信息是比DNA序列測定艱巨得多的任務(wù),因為基因表達是依賴于許多因素的動態(tài)過程。

國際上在核酸和蛋白質(zhì)兩個層次上發(fā)展了分析基因表達譜的新技術(shù),即核酸層次上的 cDNA 芯片(cDNA微陣列)技術(shù)和蛋白質(zhì)層次上的二維凝膠電泳和測序質(zhì)譜技術(shù),即蛋白質(zhì)組(proteome)技術(shù)。DNA芯片技術(shù)能夠在基因組水平分析基因表達,檢測許多基因的轉(zhuǎn)錄水平。

對大規(guī);虮磉_譜的分析存在新的方法學(xué)問題,它們從數(shù)學(xué)角度看不是簡單的NP問題、動力系統(tǒng)問題或不確定性問題,而是基因表達網(wǎng)絡(luò),因此需要發(fā)展新的方法和工具。同時,在芯片等的設(shè)計上,也需要從理論到軟件的支持

下面主要圍繞cDNA芯片相關(guān)的數(shù)據(jù)管理和分析問題進行討論。

1.實驗室信息管理系統(tǒng)

cDNA芯片實驗的目的是要在一次實驗中同時得到成千上萬個基因的表達行為,這樣的實驗需要有管理實驗前后大量數(shù)據(jù)的能力。設(shè)計構(gòu)建檢測基因表達的微陣列需要獲得生物體基因的所有序列、注釋和克隆。在雜交反應(yīng)和掃描后,收集到的數(shù)據(jù)必須以某種方式保存,以便很容易進行圖象處理和統(tǒng)計及生物學(xué)分析。因此需要建立與大規(guī)模高通量實驗方法相匹配的實驗材料和信息管理系統(tǒng)。

該系統(tǒng)除用來定位和跟蹤材料來源(例如,克隆,微陣列,探針)外,還必須管理實驗前后大量的數(shù)據(jù)。此外,還包括實驗室設(shè)備軟件系統(tǒng),如斯坦福大學(xué)Brown實驗室免費的控制自制機器點樣設(shè)備軟件(http://cmgm.standford.edu/pbrown

芯片圖象處理已有各種軟件工具,基本的功能是將不同信號強度點的圖像轉(zhuǎn)換為每個點的強度數(shù)值。這方面沒有一致的方法,許多研究小組仍在開發(fā)這類軟件。圖象分析軟件的質(zhì)量對精確解釋玻片和膜上的信號非常關(guān)鍵。NHGRI的Yidong Chen開發(fā)了一種復(fù)雜的圖象分析程序,deArray,可免費獲取。

美國國立衛(wèi)生研究院人類基因組研究所(NHGRI)開發(fā)的免費的cDNA芯片數(shù)據(jù)管理分析系統(tǒng)ArrayDB,涉及微陣列的設(shè)計、實驗室信息管理、實驗結(jié)果的處理和解釋。下面加以簡單介紹。

ArrayDB

ArrayDB是用來儲存、查詢和分析cDNA芯片實驗信息的實驗室管理系統(tǒng)。ArrayDB整合了cDNA芯片實驗中的多個方面,包括數(shù)據(jù)管理、用戶介面、機器自動點樣、掃描和圖象處理。ArrayDB中保存的數(shù)據(jù)包括實驗來源、實驗參數(shù)和條件以及原始的和經(jīng)處理的雜交結(jié)果。ArrayDB依托的關(guān)系數(shù)據(jù)庫儲存了芯片上每個克隆的相關(guān)信息,包括基因的簡單描述、GenBank號、IMAGE克隆識別號、代謝途徑號和實驗室內(nèi)部克隆號。ArrayDB還儲存了與cDNA芯片制造和實驗條件的信息。包括點樣相關(guān)數(shù)據(jù)(點樣機器的參數(shù))、環(huán)境條件(溫度、濕度、點樣針沖洗條件)等數(shù)據(jù)。此外,還保存了雜交探針和實驗條件,包括研究者的姓名,研究目的和實驗條件、組織細胞類型的文本描述。有關(guān)雜交的結(jié)果的信息包括掃描圖象(“原始”結(jié)果)、信號強度數(shù)據(jù)、信號強度比值和本底值。

ArrayDB的設(shè)計允許靈活地提取數(shù)據(jù)信息。設(shè)計策略允許不同來源的數(shù)據(jù)輸入,大多數(shù)克隆信息來自Unigene數(shù)據(jù)庫(包括序列的命名和獲取號)。也允許新分離的還沒有獲取號及名稱的克隆的輸入。許多數(shù)據(jù)輸入和處理過程是自動的。軟件會自動掃描目錄查找新輸入數(shù)據(jù)庫中的信號強度數(shù)據(jù)無須人工輔助,其它自動處理包括很方便地整合信號強度數(shù)據(jù)和克隆數(shù)據(jù)。

ArrayDB的Web界面能很方便地進行不同類型信息的查詢,從克隆信息到信號強度值到分析結(jié)果。ArrayDB支持各種字段的數(shù)據(jù)查詢,例如克隆ID、標題、實驗編號、序列獲取號、微量滴定板編號以及相關(guān)克隆的結(jié)果。每個克隆的更多信息通過超文本鏈接至其他數(shù)據(jù)庫如dbEST、GenBank或Unigene,代謝途徑信息也可通過鏈接至KEGG得到。

通過序列相似性搜索可以有效地尋找目的基因。ArrayDB支持對10K/15K數(shù)據(jù)(軟件自帶數(shù)據(jù))進行BLASTN搜索以便確定目的基因是否已包含在芯片中。

ArrayDB能分析單個和多個實驗產(chǎn)生的信號強度比值的類型和關(guān)系。ArrayViewer工具支持查詢和分析單個實驗;MultiExperiment viewer工具支持多個實驗數(shù)據(jù)。在下述網(wǎng)站可得到更詳細信息和相關(guān)軟件。

DeArray和ArrayDB網(wǎng)址: http://www.nhgri.nih.gov/DIR/LCG/15K/HTML

 

2.基因表達公共數(shù)據(jù)庫

數(shù)據(jù)庫用途

(1)基礎(chǔ)研究 將來自各種生物的表達數(shù)據(jù)與其它各種分子生物學(xué)數(shù)據(jù)資源,如經(jīng)注釋的基因組序列、啟動子、代謝途徑數(shù)據(jù)庫等結(jié)合,有助于理解基因調(diào)控網(wǎng)絡(luò)、代謝途徑、細胞分化和組織發(fā)育。例如,比較未知基因與已知基因表達譜的相似性能幫助推測未知基因的功能。

(2)醫(yī)學(xué)及藥學(xué)研究 例如,如果特定的一些基因的高表達與某種腫瘤密切相關(guān),可以研究這些或其它有相似表達譜的基因的表達的影響條件,或研究能降低表達水平的化合物(潛在藥物)。

(3)診斷研究 通過對數(shù)據(jù)庫數(shù)據(jù)進行基因表達譜的相似性比較對疾病早期診斷具有臨床價值。

(4)毒理學(xué)研究 例如,了解大鼠某種基因?qū)μ囟ǘ緞┑姆磻?yīng)可幫助預(yù)測人的同源性基因的反應(yīng)情況。

(5)實驗質(zhì)量控制和研究參考 實驗室樣本與數(shù)據(jù)庫中標準對照樣本比較能找出方法和設(shè)備問題。此外,還能提供其他研究者的研究現(xiàn)狀,避免重復(fù)實驗,節(jié)約經(jīng)費。

數(shù)據(jù)庫的特點和難點

目前急需建立標準注釋的公共數(shù)據(jù)庫,但這是生物信息學(xué)迄今面臨的最復(fù)雜且富有挑戰(zhàn)性的工作之一。主要困難來自對實驗條件細節(jié)的描述,不精確的表達水平相對定量方法以及不斷增長的龐大數(shù)據(jù)量。

目前所有的基因表達水平定量都是相對的:哪些基因差異表達僅僅是與另外一個實驗比較而言,或者與相同實驗的另一個基因的相比而言。這種方法不能確定mRNA的拷貝數(shù),轉(zhuǎn)錄水平是總的細胞群的平均水平。結(jié)果導(dǎo)致采用不同技術(shù)進行基因表達的檢測,甚至不同實驗室采用相同技術(shù),都有可能不能進行比較。對不同來源數(shù)據(jù)的進行比較有必要采取兩個步驟:首先,原始數(shù)據(jù)應(yīng)避免任何改動,比如采取數(shù)據(jù)標準化(data-normalization)的方法。其次,在實驗中設(shè)計使用標準化的對照探針和樣本以便給出參考點至少使來自同一實驗平臺的數(shù)據(jù)標準化。

另一難點是對實驗條件的描述,解決方法是對實驗方法用采用規(guī)范化詞匯的文件描述:如基因名稱,物種,發(fā)育階段,組織或細胞系。還要考慮偶然的不受控制實驗因素也可能影響表達:例如空氣濕度,甚至實驗室的噪音水平。目前建立一種結(jié)構(gòu)能對將來實驗設(shè)計的所有細節(jié)進行描述顯然是不可能的。比較現(xiàn)實的解決辦法是大部分采用自由文本描述實驗,同時盡可能加上有實用價值的結(jié)構(gòu)。DNA芯片實驗的標準注釋必須采用一致的術(shù)語,這有待時間去發(fā)展。但目前,就應(yīng)采用盡可能合理的標準用于DNA芯片數(shù)據(jù)及其注釋。

標準化的基因表達公共數(shù)據(jù)庫要有五類必要的信息:

(1)聯(lián)系信息:提交數(shù)據(jù)的實驗室或研究人員的信息。

(2)雜交靶探針信息:對陣列上的每個“點”,應(yīng)有相應(yīng)的DNA序列在公共數(shù)據(jù)庫中的編號。對cDNA陣列,克隆識別號(如IMAGE clone_id)應(yīng)給出。

(3)雜交樣本:細胞類型和組織來源用標準語言描述。常規(guī)診斷病理中使用的組織和組織病理詞匯可被采用,還可采用胚胎發(fā)育和器官發(fā)生中的標準詞匯。樣本來源種屬的分類學(xué)名稱(如Saccharomyces cerevisiae,Homo sapiens),應(yīng)當(dāng)提供。對有些生物體如嚙齒類動物和微生物,品系資料需要提供。關(guān)于實驗中生物體狀況的資料,如用藥或未用藥非常關(guān)鍵,也需提供!澳[瘤與正!被虿煌l(fā)育階段也該注明。細胞或生物體的遺傳背景或基因型在特定例子中也應(yīng)是重要的,如酵母基因缺失和轉(zhuǎn)基因鼠。最后,由于組織處理的會引起差別,故應(yīng)包括相關(guān)的詳細處理方法。

(4)mRNA轉(zhuǎn)錄定量:這方面非常關(guān)鍵,很難通過一組“持家基因”做內(nèi)參照進行標準化,有關(guān)的具體定量方法應(yīng)提供。

(5)統(tǒng)計學(xué)意義:理想地,應(yīng)經(jīng)濟合理地有足夠的次數(shù)重復(fù)一個實驗以便給出基因表達測定的變異情況,最好能提供合理的可信度值。

上述表達數(shù)據(jù)記錄的前兩個要求是簡單的,第三個要求較困難需有標準術(shù)語協(xié)議,但這并不只是表達數(shù)據(jù)的要求,類似的要求已在公共序列數(shù)據(jù)庫或?qū)I(yè)化的數(shù)據(jù)庫中得到成功解決。目前基因表達數(shù)據(jù)最富有挑戰(zhàn)性的方面是最后兩個方面。

現(xiàn)狀和計劃

幾個大的芯片實驗室如斯坦福大學(xué)和麻省理工學(xué)院Whitehead研究所等,在發(fā)展實驗室內(nèi)部數(shù)據(jù)庫;大的商業(yè)化芯片公司如Affymetrix, Incyte,GeneLogic,正在開發(fā)基于Affymetrix芯片技術(shù)平臺的商業(yè)化基因表達數(shù)據(jù)庫。哈佛大學(xué)已經(jīng)建立了一個的數(shù)據(jù)庫,數(shù)據(jù)來自幾個公共來源并統(tǒng)一格式。賓夕法尼亞大學(xué)計算生物學(xué)和信息學(xué)實驗室正在整合描述樣本的術(shù)語。

目前至少有3個大的公共基因表達數(shù)據(jù)庫項目:美國基因組資源國家中心的GeneX;美國國家生物技術(shù)信息中心(NCBI)的Gene Expression Omnibus;歐洲生物信息學(xué)研究所(EBI)的ArrayExpress.

歐美專家合作提出有關(guān)數(shù)據(jù)庫的初步標準:實驗描述和數(shù)據(jù)表示的標準;芯片數(shù)據(jù)XML 交換格式;樣本描述的術(shù)語;標準化、質(zhì)量控制和跨平臺比較;數(shù)據(jù)查詢語言和數(shù)據(jù)挖掘途徑。(http://www.ebi.ac.uk/microarray/)。EBI與德國癌癥研究中心正在開發(fā)ArrayExpress , 一種與目前推薦標準兼容的基因表達數(shù)據(jù)庫。該數(shù)據(jù)庫將利用來自合作方的的數(shù)據(jù),可操作的數(shù)據(jù)庫將于近期建立(http://www.ebi.ac.uk/arrayexpress)。

3.大規(guī);虮磉_譜數(shù)據(jù)分析方法

芯片分析能夠檢測不同條件下的基因轉(zhuǎn)錄變化,能夠顯示反映特征組織類型、發(fā)育階段、環(huán)境條件應(yīng)答、遺傳改變的基因譜。當(dāng)芯片數(shù)據(jù)大量出現(xiàn),產(chǎn)生了新的問題:如果將所有獲得的數(shù)據(jù)集中起來,我們能否將未知功能的新基因歸類到已知功能分類中?能否將基因表達與基因功能聯(lián)系起來?能否發(fā)現(xiàn)新類型的共調(diào)控基因?能否從芯片表達數(shù)據(jù)中得出完整的基因調(diào)控網(wǎng)絡(luò)?這些唯有通過計算的方法。基因制圖及測序所面臨的問題與大規(guī);虮磉_分析的數(shù)學(xué)問題相比要小的多。這種新類型的表達數(shù)據(jù)使我們直接面對生物系統(tǒng)和基因組水平功能的復(fù)雜性,從生物系統(tǒng)單個成分的定性發(fā)展到完整生物系統(tǒng)行為的描述上來,這方面困難很多,目前只有很少的分析工具。

聚類分析(clustering analysis)是大規(guī);虮磉_譜目前最廣泛使用的統(tǒng)計技術(shù),最近又發(fā)展了一種機器學(xué)習(xí)方法-支持向量機(support vector machines,SVMs)。這些分析方法均處在研究的初級階段,隨著大量數(shù)據(jù)及標準化數(shù)據(jù)庫的出現(xiàn),其它數(shù)據(jù)挖掘技術(shù)包括神經(jīng)網(wǎng)絡(luò)和遺傳算法將在基因表達數(shù)據(jù)分析中得到應(yīng)用。

聚類分析

聚類通過把目標數(shù)據(jù)放入少數(shù)相對同源的組或“類”(cluster)里。分析表達數(shù)據(jù),(1)通過一系列的檢測將待測的一組基因的變異標準化,然后成對比較線性協(xié)方差。(2)通過把用最緊密關(guān)聯(lián)的譜來放基因進行樣本聚類,例如用簡單的層級聚類(hierarchical clustering)方法。這種聚類亦可擴展到每個實驗樣本,利用一組基因總的線性相關(guān)進行聚類。(3)多維等級分析(multidimensional scaling analysis,MDS)是一種在二維Euclidean “距離”中顯示實驗樣本相關(guān)的大約程度。(4)K-means方法聚類,通過重復(fù)再分配類成員來使“類”內(nèi)分散度最小化的方法。

聚類方法有兩個顯著的局限:首先,要聚類結(jié)果要明確就需分離度很好(well-separated)的數(shù)據(jù)。幾乎所有現(xiàn)存的算法都是從互相區(qū)別的不重疊的類數(shù)據(jù)中產(chǎn)生同樣的聚類。但是,如果類是擴散且互相滲透,那么每種算法的的結(jié)果將有點不同。結(jié)果,每種算法界定的邊界不清,每種聚類算法得到各自的最適結(jié)果,每個數(shù)據(jù)部分將產(chǎn)生單一的信息。為解釋因不同算法使同樣數(shù)據(jù)產(chǎn)生不同結(jié)果,必須注意判斷不同的方式。對遺傳學(xué)家來說,正確解釋來自任一算法的聚類內(nèi)容的實際結(jié)果是困難的(特別是邊界)。最終,將需要經(jīng)驗可信度通過序列比較來指導(dǎo)聚類解釋。

第二個局限由線性相關(guān)產(chǎn)生。上述的所有聚類方法分析的僅是簡單的一對一的關(guān)系。因為只是成對的線性比較,大大減少發(fā)現(xiàn)表達類型關(guān)系的計算量,但忽視了生物系統(tǒng)多因素和非線性的特點。

斯坦福大學(xué)的Michael Eisen開發(fā)的Windows平臺免費芯片數(shù)據(jù)分析軟件CLUSTER和TREEVIEW,采用配對平均連鎖(pairwise average-linkage)聚類分析。這種方法中,每個不同的基因與其它的基因比較,鑒定最相關(guān)的基因?qū)。這種基因?qū)Φ臄?shù)據(jù)用平均數(shù)替代,再重新計算關(guān)系矩陣,不斷重復(fù)這個過程。TREEVIEW對CLUSTER計算結(jié)果進行圖形輸出,將芯片中的每個基因的表達比值用彩色方塊表示。

盡管CLUSTER軟件易于使用且直觀,但其算法仍有缺陷之處:實際數(shù)據(jù)由每次重復(fù)的平均數(shù)據(jù)替代;相似性測定的選擇(相關(guān)性/Eluclidean距離);將等級模型用于非等級過程;成對比較矩陣的計算負擔(dān)。因此,出現(xiàn)了其它方法,包括自組織圖(self organizing maps,SOMs),二進制決定-退火算法(binary deterministic-annealing algorithm),k-means聚類等。Tamayo等提供Windows平臺的SOMs軟件包。

CLUSTER和TREEVIE下載網(wǎng)址:http://www.genome.standford.edu

基于知識挖掘的機器學(xué)習(xí)方法

最近發(fā)展了一種的有監(jiān)督的機器學(xué)習(xí)方法-支持向量機(support vector machines,SVMs)來分析表達數(shù)據(jù),它通過訓(xùn)練一種“分類器”來辨識與已知的共調(diào)控基因表達類型相似的的新基因。與經(jīng)典的無監(jiān)督聚類方法(unsupervised clustering)和自組織圖(self-organizing maps)不同,該方法建立在已有的知識上并有改進現(xiàn)有知識的潛力。

無監(jiān)督的聚類方法,例如層級(hierarchical)和K-means聚類,假設(shè)每個基因僅屬于一“類”(cluster)。這在生物學(xué)意義上當(dāng)然不是真實的。而且,事實上同一類基因不是必然意味著有相似的表達類型。比如,k-means聚類方法事先指定產(chǎn)生的“類”的數(shù)量及并將每個基因放在其最優(yōu)“類”,并不總是有意義。需要對類(cluster)進行質(zhì)量評價,“類”的“嚴謹性”和外圍基因的存在(如果存在,它們與下一類的接近度)以及一組核心特征基因應(yīng)在質(zhì)量上保證。最重要的是應(yīng)考慮“類”是否有生物學(xué)意義。

與無監(jiān)督的方法產(chǎn)生基因的“類”相比,有監(jiān)督的學(xué)習(xí)方法是向已知的“類”學(xué)習(xí)。訓(xùn)練者必須提供SVMs以每個“類”正反兩方面的例子。SVMs提供一種層級的方法來分析芯片數(shù)據(jù)。首先,對每個基因,應(yīng)詢問最近的鄰居是否它與它們的關(guān)系是有生物學(xué)意義的。其次,對已知共調(diào)控基因,應(yīng)該詢問它們的表達類型是否相似,如果是這樣,還有哪些其它的基因有相同類型。這些在監(jiān)督階段可通過SVMs或優(yōu)化的SOMs來判斷。第三,應(yīng)該通過無監(jiān)督的學(xué)習(xí)方法進行基因分類并詢問是否聚類有生物學(xué)意義并且包括外圍基因。最后,“類”可通過每個無監(jiān)督的“類”的核心基因訓(xùn)練SVMs的方法來檢測和優(yōu)化。

 

可視化

大規(guī);虮磉_數(shù)據(jù)挖掘另一重要方面是發(fā)展有力的數(shù)據(jù)可視化方法和工具。已經(jīng)發(fā)展了用簡單圖形顯示提供聚類結(jié)果的途徑,如上述的TREEVIEW軟件。對大規(guī);虮磉_原始數(shù)據(jù)的進行不失真的可視化并鏈接的標注過的序列數(shù)據(jù)庫,可為基因表達分析提供非常有價值的工具,有助于從新的視角看待基因組水平的轉(zhuǎn)錄調(diào)控并建立模型。

 

7.2 基因組水平蛋白質(zhì)功能綜合預(yù)測

蛋白質(zhì)之間的功能聯(lián)系

基因組測序計劃在產(chǎn)生完全的組成多個亞單位裝配和信號通路的蛋白質(zhì)列表方面取得里程碑式的業(yè)績。這些裝配和通路現(xiàn)在必然被制圖,Marcotte等和Enright等在此方面走了顯著一步。這兩個研究小組發(fā)展了不是通過氨基酸序列相似性比較的其他特性聯(lián)系起蛋白質(zhì)的計算方法。通過比較系統(tǒng)發(fā)育(進化)譜和表達類型,以及通過分析結(jié)構(gòu)域融合(domain fusions)新方法識別在代謝通路、信號通路或結(jié)構(gòu)復(fù)合體上功能相關(guān)的蛋白質(zhì)。酵母未定性蛋白大約一半 總蛋白數(shù)約四分之一可用此方法進行功能注釋。因為不依賴于直接的序列相似性,這種方法可預(yù)測與已知功能蛋白質(zhì)缺乏同源性的蛋白質(zhì)功能。將會發(fā)現(xiàn)它們在基因組學(xué)中的許多應(yīng)用,與大規(guī)模蛋白質(zhì)功能實驗互為補充。

構(gòu)建通路和專配有用模型的信息來自實驗,最重要的通過蛋白質(zhì)組學(xué)和結(jié)構(gòu)基因組學(xué)。蛋白質(zhì)組學(xué)的目標是對所有的蛋白質(zhì)和蛋白相互作用進行鑒定和定性。它包括采用大規(guī)模實驗方法如雙雜交系統(tǒng)(two-hybrid system)、質(zhì)譜法(mass spectrometry,MS)、二維凝膠電泳(2D PAGE)和DNA芯片雜交(DNA microarray hybridization)。任務(wù)大小和復(fù)雜性可由下面的假定理解:每個蛋白質(zhì)有5-50個功能連鎖,結(jié)果在一個酵母細胞中就有30,000-300,000個連鎖。雖然實驗已確定了約30%的酵母的功能,但是它們有時不是迅速廉價的,且不完全。因此需要用計算的方法來預(yù)測功能。

計算方法傳統(tǒng)上預(yù)測功能是通過與性質(zhì)明確蛋白質(zhì)的序列相似性比較。這樣標注的可行性是因為進化產(chǎn)生享有共同祖先的的同源性蛋白家族,因此有相似的序列、結(jié)構(gòu),經(jīng)常還有功能。蛋白質(zhì)比較允許對酵母另30%的蛋白質(zhì)功能進行研究。但是,通過同源性進行功能預(yù)測受兩方面的因素制約。首先,它只能用于與已知功能蛋白質(zhì)有同源性的未知蛋白質(zhì)的功能預(yù)測。其次,不是總清楚匹配的蛋白質(zhì)何種功能特性為其共享,尤其對那些距離較遠的匹配。

Marcotte等和Enright等并未受此限制,因為他們不依賴與未知蛋白質(zhì)與已知功能蛋白質(zhì)的序列相似性。而代替的是,將同樣通路和裝配的蛋白質(zhì)分組,定義為“功能連鎖”(functionally linked).Marcotte等針對出芽酵畝基因組蛋白質(zhì)采用了三種不同的方法:系統(tǒng)發(fā)育譜(phylogenetic profiles),結(jié)構(gòu)域融合(domain-fusion analysis)和相關(guān)mRNA表達類型(correlated messenger RNA expression patterns)。Enright等獨立發(fā)展了結(jié)構(gòu)域融合分析,采用新的聚類算法用于三個原核基因組分析。

系統(tǒng)發(fā)育譜依賴于蛋白質(zhì)相關(guān)進化。兩個蛋白質(zhì)是進化相關(guān)的當(dāng)它們共有一個系統(tǒng)發(fā)育譜,定義為蛋白質(zhì)在一組基因組中的發(fā)生率類型。僅當(dāng)幾個完整的基因組比較時系統(tǒng)發(fā)育表達譜才能精確計算。兩個蛋白質(zhì)享有相似的系統(tǒng)發(fā)育譜被認為是功能連鎖(functionally linked)。因此,根據(jù)系統(tǒng)發(fā)育譜進行的蛋白質(zhì)聚類,當(dāng)未知蛋白質(zhì)與一個或更多的功能已知的蛋白質(zhì)歸為一組時能夠提供未知蛋白質(zhì)的功能信息。

結(jié)構(gòu)域融合的方法鑒定含有兩個分別在其它基因組的非同源性成分蛋白(component proteins)組成的融合蛋白(fusion proteins)。這樣的成分蛋白被認為彼此物理上有相互作用。在兩個相互作用成分蛋白之間的界面(interface)更有可能進化當(dāng)兩個蛋白融合為一條單一鏈。著名的例子是,從細菌到真菌的色氨酸合成酶的α和β亞單位。在一些方面,結(jié)構(gòu)域融合分析與從基因鄰近效應(yīng)(gene proximity)推測功能連鎖相似。

Marcotte等也通過關(guān)聯(lián)它們的mRNA表達類型來對酵母蛋白質(zhì)進行分類。這些類型來自97組公共DNA芯片數(shù)據(jù),顯示了大多數(shù)酵母蛋白質(zhì)在正常生長、葡萄糖缺乏孢子形成和突變基因表達的條件下的表達變化。分析建立在認為在一系列相同條件下表達水平相互關(guān)聯(lián)的蛋白質(zhì)是功能連鎖的。

新的功能注釋經(jīng)常是廣義的,限制蛋白質(zhì)的功能為,“代謝”或“轉(zhuǎn)錄”。即使隨機的一對蛋白質(zhì)也有50%的相似機率在這樣廣義的水平上。但是因為注釋一般來自許多連鎖,比隨機連鎖信息量大3-8倍,在一些例子中與蛋白-蛋白相互作用的實驗決定相比。 例如,Marcotte等建立了新的MSH6的連鎖,在某些結(jié)腸癌中的DNA錯配修復(fù)蛋白,屬于PMS1錯配修復(fù)家族,其中的突變也與人結(jié)腸癌、嘌呤生物合成途徑、RNA修飾酶和一個未知的蛋白質(zhì)家族相關(guān),這樣它們可以通過核酸修復(fù)或修飾來研究。

這樣的注釋精確度如何?能覆蓋多少比例的蛋白質(zhì)?這些問題只能部分提出,因為參考的功能連鎖蛋白質(zhì)不是很容易得到。Marcotte和同事給酵母2,557個未知蛋白的一半預(yù)測了一般功能。他們估計成對預(yù)測來確定功能的近30%是錯誤的,雖然兩到三種方法聯(lián)合應(yīng)用使錯誤率降到15%。

Enright等通過結(jié)構(gòu)域融合在三個原核基因組中僅功能連鎖215個蛋白,但是非常少的估計假陽性。較少的功能連鎖率可能由于沒有系統(tǒng)發(fā)育譜和mRNA表達方法丟失了連鎖(作者沒有做這兩種方法),融合事件更嚴格的定義以及用較少的蛋白檢測融合。盡管假陽性和顯得粗糙的功能注釋,計算方法使得實驗者將注意力集中在有希望的相互作用上。當(dāng)?shù)玫礁嗟幕蚪M數(shù)據(jù),結(jié)構(gòu)域融合和系統(tǒng)發(fā)育譜的方法的預(yù)測數(shù)和精度將增加。

下一步將是提高方法預(yù)測蛋白質(zhì)功能的范圍、準確度和精確性。這可能在理論上,通過考慮三維結(jié)構(gòu)來做,因為蛋白質(zhì)的功能更多直接由它的結(jié)構(gòu)和動力學(xué)而不是它的序列來決定。那么為什么在基因組學(xué)上結(jié)構(gòu)沒有序列用的廣泛呢?至少有兩個原因。首先,只有一部分蛋白質(zhì)有三維結(jié)構(gòu)數(shù)據(jù)。這種限制在幾年內(nèi)隨著結(jié)構(gòu)基因組學(xué)(structural genomics)的進展而減少。結(jié)構(gòu)基因組學(xué)的目標是確定大約10,000經(jīng)仔細挑選的蛋白質(zhì)結(jié)構(gòu)域的結(jié)構(gòu),以便所有其它的蛋白質(zhì)序列能夠有很好的精確性建模。其次,能夠從結(jié)構(gòu)而不是從序列提取的功能細節(jié)依賴于細胞環(huán)境下的那種結(jié)構(gòu)的細節(jié),同樣也依賴于它的動力學(xué)和能量,所有這些在現(xiàn)有的實驗和理論技術(shù)下難以獲得。
9樓2005-06-07 17:15:06
已閱   回復(fù)此樓   關(guān)注TA 給TA發(fā)消息 送TA紅花 TA的回帖

miRNA

至尊木蟲 (職業(yè)作家)

水王之王(愚愚學(xué)園管理員)

支持生物版!!

★ ★ ★
xbbxll(金幣+3):ok,謝謝!
支持生物版。。

[ Last edited by miRNA on 2005-6-11 at 18:09 ]
〖愚愚學(xué)園〗http://www.scifans.net免費代理|免費期刊|ezproxy|文獻檢索|學(xué)術(shù)資源|免費資源
10樓2005-06-07 21:52:19
已閱   回復(fù)此樓   關(guān)注TA 給TA發(fā)消息 送TA紅花 TA的回帖
相關(guān)版塊跳轉(zhuǎn) 我要訂閱樓主 BlueGuy 的主題更新
最具人氣熱帖推薦 [查看全部] 作者 回/看 最后發(fā)表
[考研] 211本,11408一志愿中科院277分,曾在中科院自動化所實習(xí) +6 Losir 2026-03-12 7/350 2026-03-17 12:09 by danranxie
[考研] 293求調(diào)劑 +5 世界首富 2026-03-11 5/250 2026-03-17 10:16 by Sammy2
[考研] 286求調(diào)劑 +3 lemonzzn 2026-03-16 5/250 2026-03-16 20:43 by lemonzzn
[考研] 考研化學(xué)學(xué)碩調(diào)劑,一志愿985 +3 張vvvv 2026-03-15 5/250 2026-03-16 20:25 by 張vvvv
[考研] 0854控制工程 359求調(diào)劑 可跨專業(yè) +3 626776879 2026-03-14 9/450 2026-03-16 17:42 by 626776879
[考研] 一志愿985,本科211,0817化學(xué)工程與技術(shù)319求調(diào)劑 +5 Liwangman 2026-03-15 5/250 2026-03-16 17:10 by 我的船我的海
[基金申請] 今年的國基金是打分制嗎? 50+3 zhanghaozhu 2026-03-14 3/150 2026-03-16 17:07 by 北京萊茵潤色
[考研] 318求調(diào)劑 +3 Yanyali 2026-03-15 3/150 2026-03-16 16:41 by houyaoxu
[考研] 機械專碩調(diào)劑 +3 笨笨兔子 2026-03-12 3/150 2026-03-15 20:02 by 栗子粥?
[考研] 070305求調(diào)劑 +3 mlpqaz03 2026-03-14 4/200 2026-03-15 11:04 by peike
[考研] 294求調(diào)劑 +3 Zys010410@ 2026-03-13 4/200 2026-03-15 10:59 by zhq0425
[考研] 本科南京大學(xué)一志愿川大藥學(xué)327 +3 麥田耕者 2026-03-14 3/150 2026-03-14 20:04 by 外星文明
[考研] 328求調(diào)劑 +3 5201314Lsy! 2026-03-13 6/300 2026-03-14 15:31 by hyswxzs
[考研] 【0703化學(xué)調(diào)劑】-一志愿華中師范大學(xué)-六級475 +5 Becho359 2026-03-11 5/250 2026-03-14 11:35 by 哦哦123
[考研] 279求調(diào)劑 +3 Dizzy123@ 2026-03-10 3/150 2026-03-13 23:02 by JourneyLucky
[考研] 材料工程調(diào)劑 +4 咪咪空空 2026-03-11 4/200 2026-03-13 19:57 by JourneyLucky
[考研] 307求調(diào)劑 +5 超級伊昂大王 2026-03-12 5/250 2026-03-13 15:56 by 棒棒球手
[考研] 26考研求調(diào)劑 +5 丶宏Sir 2026-03-13 5/250 2026-03-13 13:05 by JourneyLucky
[考研] 321求調(diào)劑(食品/專碩) +3 xc321 2026-03-12 6/300 2026-03-13 08:45 by xc321
[考研] 420求調(diào)劑 +4 莫向外求11 2026-03-10 6/300 2026-03-12 14:41 by ruiyingmiao
信息提示
請?zhí)钐幚硪庖?/div>
韩国毛片w妈妈的朋友7| 国产自拍偷拍在线精品| 不用付费特黄特色亚洲特级黄色片| 成人免费视频现网站99在线观看 | 妈妈的朋友中字在线免费观看| 男女69视频在线观看免费| 色就色综合偷拍区欧美在线| 裸露视频免费在线观看| 日本高清有码在线视频| 亚洲男人的天堂最新网址| 欧美第一激情综合网欧美激情| 在线 激情 亚洲 视频| 大香蕉在线欧美在线视频| 日本韩国欧美在线视频| 老熟女 露脸 嗷嗷叫| 免费在线观看亚洲福利| 国产精品久久久久久成人久| 宅男噜噜噜66国产在线观看| 天天插天天干天天狠| 熟妇高潮久久久久久久| 亚洲经典av中文字幕| 9999久久久久老熟妇二区| 久久av色噜噜ai换脸| 2018中文字字幕人妻| 欧美日韩国产在线中文字幕| 色欲AV蜜桃一区二区三| 亚洲熟妇在线视频观看| 亚洲第一页欧美第一页| 久久视频 在线播放| 欧美最新一区二区三区| 韩国毛片w妈妈的朋友7| 亚洲第一成年偷拍视频| 亚洲熟妇丰满多毛xxxx网站| av网页免费在线观看| 亚洲一区二区偷拍女厕所| 韩国毛片w妈妈的朋友7| 大成色亚洲一二三区| 自拍偷拍视频亚洲一区| julia人妻av一区二区三区| 手机看片福利一区二区三区四区| 亚洲午夜精品视频节目| 亚洲欧洲无码一区2区无码| 精品精品精品精品精品污污污污| 国际日韩日韩日韩日韩日韩| 91超精品碰国产在线观看| 亚洲欧美另类丝袜另类自拍| 亚洲国产中文字幕在线看 | 日本一道中文字幕99| 91九色pony蝌蚪| 黄色av网址在线播放| www,日韩av,com| 在线观看中文字幕视频成人| 午夜夫妻性生活视频| 免费啪啪啪网站在线观看| 日韩国产欧美久久一区| 亚洲精品一区二区gif| 最近日韩免费在线观看| 1级黄色片在线观看| 亚洲成人激情在线综合| 成年人免费福利在线| 公侵犯人妻中文字幕巨| 一区二区三区内射美女| 中文字幕一区二区三区久久久| 午夜精品秘一区二区三区| 天天操天天舔天天射天天日天天干| 最新国产精品久久精品app| 加勒比东京热绿帽人妻多人操| 搞乱在线在线观看视频| 亚洲AV无码久久精品国产一区老| 情趣视频在线观看91| 中文字幕日韩人妻在线三区| 黄色网络中文字幕日本| 日本少妇精品免费视频| 色欲AV亚洲AV无码精品| 啊不行啊操逼好爽大鸡吧视频| 东京热日韩av影片| 亚洲国产日韩a在线欧美| 伊人网国产在线播放| 欧美亚洲另类精品第一页| 免费观看在线中文字幕视频| jiee日本美女视频网站| 欧美日韩精品aaa| 国产亚洲精品啪啪视频| www,日韩av,com| 亚洲综合色一区二区三区| 亚洲欧美日韩电影一区| 亚洲日本欧美韩国另类综合| 大香焦一道本一区二区三区| 人妻视频网站快射视频网站| 国产熟妇色xxⅹ交白浆视频| 4438全国成人免费视频| av男人站在线观看| 男人资源站中文字幕| 日韩欧美一区二区三区免费看| 97精品视频,全部免费| 熟妇人妻av无码中文字幕| 松本菜奈实最新av在线| 中文字幕av人妻一区二区三区 | 琪琪日本福利伦理视频| 亚洲中文字幕无线乱码人妻精品| 日韩黄色在线观看网站上| 岛国av成人午夜高清| 免费在线小视频你懂的| 黄色片免费网站在线| 青青操天堂在线观看视频| 蜜桃臀少妇白色紧身裤细高跟| 亚洲成人av在线一区二区| 欧美一级特黄大片在线| 婷婷综合缴情亚洲五月伊人| 91色乱一区二区三区| 日韩最近中文在线观看| 三区美女视频在线观看| 日韩精品视频一区二区三区在线 | 18在线观看免费观看| av中文字幕国产精品| 91精品国产综合99| 9999久久久久老熟妇二区| 大鸡扒操大逼大片免费关看| 久草视频在线视频在线视频| 国产视频1区2区3区| 亚洲一区二区在线激情| 亚洲成人自拍av在线| ysl蜜桃色7425| 国产漂亮白嫩美女在线图片| 国产资源在线观看二区| 日本高清激情乱一区二区三区| 熟女人妻aⅴ一区二区三| 区一区二区三免费观看视频| 国产精品美女免费视频观看| 日本免费人爱做视频在线观看不卡| 久久精品国产亚洲av热软件| 久久久久久久精品乱码| 91精品夜夜夜一区二区蜜桃| 99久久久久久亚洲精品免费| 上床啪啪啪免费视频| 国产精品久久久99| 内地精品毛片在线观看| 天海翼亚洲一区在线观看| 豆豆专区操逼性视频在线| 午夜久久久久欠久久久久| 天天干天天操天天要| 人妻中文字幕亚洲在线| 天天搞天天操天天干| 伊人网在线欧美日韩在线| 18在线观看免费观看| 亚洲综合首页综合在线观看| 天天插天天干天天狠| 亚洲一区二区偷拍女厕所| 黄版视频在线免费观看| 深夜福利免费观看在线看| 日韩久久不卡免费视频| 人妻女侠被擒受辱记| 久久精品国产亚洲av清纯| 亚洲欧美国产一本综合首页| alisontyler和黑人| 97精品视频,全部免费| a级片特黄免费看| 久久免费视频ww一区| 亚洲av毛片一区二区三区网| 两个奶被揉得又硬又翘怎么回事| 中文字幕日韩人妻在线三区| 欧美精品激情在线不卡| 人妻少妇的va视频| 日本五六十路熟女视频| 丰满少妇人妻一区二区三区蜜桃| 99re这里是国产精品首页 | 成人午夜高清福利视频| 男女真人做带声音视频图片| 久久人妻诱惑我视频| 天堂av国产av伦理av| 鸡巴插进美女的嫩小穴视频| 插鸡视频免费网站在线播放| 中文字幕熟女乱一区二区| 国产精品午夜无码AV体验区| 天天操天天干加勒比久久| 天天插天天透天天爽| 久久久精品人妻无码专区不卡| 亚洲综合色一区二区三区| 欧美久久一区二区伊人| 午夜久久久久欠久久久久| 日韩人妻中文字幕二区| 美女福利视频一区二区三区四区| 黄色片免费国产精品| 天天色天天射天天日天天干| 色就色综合偷拍区欧美在线| 日韩av电影中文在线免费观看| 亚洲av激情综合网| 亚洲另类激情视频在线看| 欧美啪啪一区二区三区| 中文字幕综合网91| 国产夫妻视频在线观看免费| av网页免费在线观看| 美国十次了亚洲天堂网国产| 亚洲国产精品一区51动漫| 91色哟哟视频在线观看| 新香蕉视频香蕉视频2| 核xp工厂精品久久亚洲| 日韩av电影中文在线免费观看| 国产精品亚洲精品亚洲| 91精品91久久久久| 婷婷六月天在线视频| 日本电影一级人妻在线播放四区| 亚洲精品9999蜜桃| 波多野结衣在线一区别| 国产男女无套?免费网站下载| 日本韩国福利在线播放| 国产午夜在线播放视频| 在线有码人妻自拍视频| 天堂网成人av电影| 天天弄天天草天天日天天| 亚洲午夜精品视频节目| 国语对白性爱三级片免费看| 国产高清在线观看av| 中文字幕亚洲乱码精品无限| 伊人网在线观看 视频一区| 国产成人情侣av在线| 91精品资源在线观看| 男人用大鸡巴狂操女人肉穴| 国产91黑丝小视频在线观看| 天天天天天天天天干夜夜| av无限看熟女人妻另类av| 中文字幕在线观看亚洲情色| 亚洲成人动漫av在线| 欧美成人一二三在线网| 福利小视频免费在线| a级片特黄免费看| 偷拍欧美日韩另类图片| 污视频在线观看地址| 最新中文字幕久久久久| 91精产国品一二三产区区别网站| 亚洲激情视频在线观看免费| 911美女片黄在线观看| 日本香港韩国三级黄色| 久久内射天天玩天天懂色| 亚av一二三在线观看| 国内自拍第一区二区三区| 青青操91美女国产| 另类欧美激情校园春色| 天天操,天天射,天天爽| 激情九月天在线视频| 少妇熟女天堂网av| 国产漂亮白嫩美女在线图片 | 国产精品igao为爱寻找激情| 午夜精品小视频在线播放| 亚洲欧美另类校园春色| 亚洲欧美小说中文字幕| 国产成人在线观看视频播放| 五十岁熟妇高潮喷水| 熟妇人妻丰满久久久久久久| 天天插天天干天天狠| 69av精品国产探花| 91色老久久精品偷偷蜜臀| 顶级欧美色妇4khd| 日韩女同与成人用品电影免费看| 久久视频 在线播放| 国产主播诱惑毛片av| 猫咪亚洲中文在线中文字幕| 国产高清视频www夜色资源| 国产福利小视频在线观看网站| 美利坚合众国av天堂| 全彩漫画口工18禁| 亚洲成人av在线一区二区| 亚洲少妇色小说综合| 色屁屁一区二区三区在线观看| 在线免费观看欧美小视频| 中文字幕观看中文字幕免费| 欧美性感美女热舞视频| 最近最新欧美日韩精品| 女生裸体视频免费网站| 一区二区三区观看在线| 人人妻人人爽人人摸| 99久久国语露脸国产精品| 欧美区日本区国产区| 中文字幕 中文字幕 亚洲| 国产精品乱码高清在线观看h| 亚洲人精品午夜射精日韩| 中文字幕人妻一区二区视频系列 | 无码精品黑人一区二区老人| 国产中年夫妇激情高潮| 久久久久高潮白浆久久| 熟女一区二区三区综合| 夫妻黄色一级性生活片| 骚穴被阴茎插免费视频| 激情久久在线免费观看视频| 女女抠逼白虎白丝袜| 天天操天天日天天插天天舔| 伦理在线观看未删减中文字幕| 青青青青青爽视频在线| 美女福利网站在线播放| xxnxx国产美女| 午夜情色一区二区三区| 91精品资源在线观看| 青青青国产精品视频| 九十九步都是爱最后一步是尊严 | 午夜8050免费小说| 乱子伦国产一区二区三区| 中文字幕 首页 人妻| 精品国产污污污污免费观看| 五月婷婷激情视频网| 一级做性色a爱片久久片| 妈妈的朋友2中文字幕在线| 日本高清 中文字幕| 一级做性色a爱片久久片| av天堂a亚洲va天堂va里番| 人妻少妇视频系列视频在线| 大秀成年人国产精品视频| 欧美性受黑人猛交裸体视频| 天天在线播放日韩av| 自拍偷拍亚洲综合第一页| 麻豆出品视频在线观看| 神马午夜久久电影网| 欧美性受黑人猛交裸体视频| 得得爱在线视频观看| 熟妇精品午夜久久久久| 大乳人妻一区二区三区| 荣立三等功退休有什么待遇| jizzjizz国产精品传媒| 亚洲中文字幕在线视频观看二区| 欧美 日韩 精品 中文| 操操操操操操操操操网| 亚洲成人三级黄色片| 国产熟妇色xxⅹ交白浆视频| 最新国产午夜激情视频| 成年人免费黄色av| 日本美女爱爱视频网站| 亚洲中文字幕最新地址| 有码一区二区三区四区五区| 亚洲资源在线免费观看| 亚洲成人自拍图片网站| 插鸡视频免费网站在线播放 | 成人精品动漫一区二区| 日韩人妻精品久久久久| 亚洲永远av在线播放| 东京热日韩av影片| 91偷拍被偷拍在线播放| 久久久久久久精品乱码| 夜夜人人干人人爱人人操| 夜色17s精品人妻熟女av| 女女抠逼白虎白丝袜| 精品人妻 色中文熟女 oo| 久久人人爽人人爽人人av东京热 | 欧美一级特黄大片做受99| 国产成人综合久久婷婷| 午夜一区二区三区视频在线观看| 凹凸视频一区二区在线观看| 裸日本资源在线午夜| 欧美性受黑人猛交裸体视频| 日韩欧美中文字幕老司机三分钟 | 日韩国产欧美一区二区三区粉嫩| 熟女一区二区视频在线| 欧美日韩一区二区三区成人影院| 国际日韩日韩日韩日韩日韩| 汤姆提醒30秒中转进站口| 国产激情一区二区视频| av丝袜免费在线观看| 狠狠操av一区二区三区| 五月婷婷激情视频网| 青青青在线观看国产| 亚洲一区二区在线视频观看免费| 亚洲免费在线不卡视频| 天天操天天干天天谢| 91国产精品乱码久久久久久| 偷拍欧美日韩另类图片| 国产精品亚洲精品亚洲| 丰满少妇人妻一区二区三区蜜桃| 韩国一级片最火爆中文字幕| 中文字幕人妻一区色偷偷久久| 夫亡人妻被强干中文字幕| 欧美一级日韩一级亚洲一级va| 欧美成人少妇人妻精品| 自拍偷拍亚洲综合第一页| 污网址在线观看视频| 亚洲制服丝袜资源网| 欧美精品乱码99久久蜜桃免费| 999国产精品视频免费看| 欧美日韩黄片免费在线观看| 99在线视频精品观看高| 在线国产精品欧美| 天天操天天干加勒比久久| av大尺度一区二区三区| 成人资源中文在线观看| 色欲AV亚洲AV无码精品| 在线观看中文字幕精品av| 2021国产剧情麻豆| 久久久久久免费观看av| 伊人久久综合国产精品| 91精品国产欧美在线| 欧美亚洲国产一区二区| 黑吊操欧美极品美女| 欧美一区二区三区爽爽| 日韩av熟妇在线观看| 两个奶被揉得又硬又翘怎么回事| 2026天天操天天干| 性感美女人妻久久久| 午夜宅男电影av网站| 国产熟女五十路一区二区三区| 亚洲av毛片在在线播放| 国产人妻777人伦精品hd超碰| 欧美一级日韩一级亚洲一级va| 68福利精品在线视频| 亚洲精品1卡2卡3卡| 日本美女爱爱视频网站| 亚洲自拍偷拍av在线| 涩涩黄片在线免费观看| 核xp工厂精品久久亚洲| 51精品视频在线免费观看| 精品av天堂毛片久久久| 在线看的免费网站黄| 黄色片免费网站在线| tushy一区二区三区视频| 手机看片福利一区二区三区四区| 天天天天天天天天干夜夜| 久久久久久高清一区| 日本人妻少妇xxxxxxx| 91精品国产欧美在线| 亚洲人妻系列在线视频| 久草久热这里只有精品| 中文字幕丰满子伦无码专区| 伊人综合在线视频免费观看| 亚洲在线免费观看18| 欧美vr专区日韩vr专区| 国产成人在线观看视频播放| 九九热视频1这里只有精品| 99精品久久一区二区| 中文字字幕在线精品乱码| 夫亡人妻被强干中文字幕| 日本一区二区高清av中文| 青青青在线视频观看97| 国产精品网站亚洲发布| 99精品视频在线在线观看| 亚洲资源在线免费观看| 成人18禁高潮片免费日本| 在线看日韩av不卡| 亚洲AV无码一二三四区在线播放| 中国精品人妻一区二区| 99免费观看在线视频| 亚洲午夜精品视频节目| 亚洲精品久久久人妻| 激情九月天在线视频| 伊人网国产在线播放| 区一区二区三免费观看视频| 9420高清视频在线观看国语版| 内地精品毛片在线观看| 亚洲字幕一区二区夜色av| 首页欧美日韩中文字幕| 55夜色66夜色亚洲精品| 在线视频自拍第三页| 日韩av电影中文在线免费观看| 日韩欧美一区二区三区免费看| 99精品久久一区二区| 国产 亚洲 欧美 自拍| 亚洲熟女一区二区六区| 成人av在线视频免费| 大香蕉伊人97在线| 天天操天天干天天舔天天| 91精品综合久久久久久五月天| 亚成区一区二区人妻熟女| 在线观看黄页网站视频网站| 亚洲成a人片777777张柏芝| 免费在线观看黄色小网站| 亚洲乱熟女一区二区三区山| 午夜福利片无码10000| 日韩人妻中文字幕区| 欧美啪啪一区二区三区| 亚洲码av一区二区三区| 最近最新欧美日韩精品| 无码人妻丰满熟妇区五路| 亚洲av毛片一区二区三区网| 日韩人妻一区二区三区在线观看| 欧美日本亚欧在线观看| 懂色av之国产精品| 欧美第一激情综合网欧美激情| 18禁男女啪啪啪无遮挡| 亚洲国产日韩精品在线| 欧美猛少妇色ⅹⅹⅹⅹⅹ猛叫| 啊~插得好快别揉我胸了视频| 天天日天天玩天天摸| 自拍偷拍 亚洲性图 欧美另类| 日本不卡视频一二三区| 岛国av成人午夜高清| 开心五月综合激情婷婷| 最新久久这里只有精品| 亚洲一区二区中文字幕久久| 91偷拍被偷拍在线播放| 国产一区二区手机在线观看| 日本电影一级人妻在线播放四区| 蜜乳av一区二区三区免费观看| aa福利影视在线观看| 日本少妇人妻中文在线| 激情久久在线免费观看视频| 91精品一区一区三区| 特级aaaaa黄色片| 欧美精品乱码99久久蜜桃免费 | 91porny九色视频偷拍| 日本少妇精品免费视频| 正在播放麻豆精品一区二区| 91九色91在线视频| 伊人情人成综合视频| 午夜亚洲国产精品中字| 精品不卡一区二区三区| 91佛爷视频在线观看| v天堂国产精品久久| 亚洲一区二区中文字幕久久| 亚洲综合熟女乱中文| 插鸡视频免费网站在线播放| 日韩无码国产一区二区| 制服丝袜 中文字幕 日韩| 欧美精品999不卡| 两个奶被揉得又硬又翘怎么回事| 久久av色噜噜ai换脸| 538欧美在线观看一区二区三区| 亚洲人人爽人人澡起碰av| 9420高清视频在线观看国语版| 黄色av网址在线播放| 国产做A爱免费视频在线观看| 午夜8050免费小说| 大尺度av毛片在线网址| 91精品综合久久久久久五月天| 大屁股熟女一区二区视频| 国产欧美福利在线观看| 呻吟求饶的人妻中文字幕| 老牛影视在线一区二区三区| 欧美亚洲另类精品第一页| 日本高清激情乱一区二区三区| 成人十欧美亚洲综合在线| 韩国毛片w妈妈的朋友7| 99热这里只有精品免费播放| 亚洲天堂av最新在线| 亚洲美女色www色| 另类欧美激情校园春色| 欧美猛少妇色ⅹⅹⅹⅹⅹ猛叫| 中文字幕丰满子伦无码专区 | 天堂网成人av电影| 亚洲av综合av一去二区三区| 西野翔人妻中文字幕中字在| 国内销魂老女人老泬| 一区二区三区四区影片| 天堂在线中文字幕av| 一区二区三区不卡免费视频网站 | 99999久久久精品| 国产精品黄色片大全| 亚洲一区二区精品三区视频| 一区二区三区内射美女| 亚洲色视频在线播放网站| 黑人巨大精品一区二区在线| 亚洲欧美另类校园春色| 成人午夜高清福利视频| 狠狠操av一区二区三区| 二十四小时日本高清在线观看| 亚洲一区在线视频观看地址| 不卡在线一区二区三区| 中文字幕精品人妻久久久久| 顶级欧美色妇4khd| 55夜色66夜色亚洲精品| 国产精品久久久久久成人久| 女人的天堂 av在线| 黄色av网址在线播放| 欧美色区国产日韩亚洲区| 午夜一区二区三区视频在线观看| 无人区一码二码三码区别在哪| 亚洲制服丝袜在线看| 91色哟哟视频在线观看| 日韩加勒比精品在线看| 欧美日本国产一区二区| 中文字幕丰满子伦无码专区| 国产午夜羞羞一区二区三区| 国语精品视频自产自拍| 国产在线小视频一区二区| 汤姆提醒30秒中转进站口| 乌克兰美女操逼高清内射视频| 亚洲精品9999蜜桃| 亚洲成人自拍av在线| 久久久久久久岛国免费观看 | 日韩一级视频一区二区三区| 精品欧美乱码久久久| 日韩在线 中文字幕| 亚洲午夜熟女在线观看| 国产美女高潮精品视频| 日本高清有码在线视频| 91中文字幕视频网站| 亚洲精品乱码久久久久app | 青青草成人免费自拍视频| 亚洲经典av中文字幕| 天天操天天日天天碰| 女人高潮潮呻吟喷水网站| 亚洲精品国品乱码久久久久| 五十岁熟女高潮喷水| 亚洲乱熟女一区二区三区山| 日本韩国福利在线播放| 激情久久在线免费观看视频| 性感人妻 中文字幕| 天天操天天舔天天做| 亚洲熟女在线免费观看| 日韩国产欧美一区二区三区粉嫩| 自拍偷拍色图亚洲天堂| 亚洲乱码国产乱码精品精视频| 国产,亚洲,欧美综合| 亚洲激情噜噜噜久久久| yellow在线亚洲精品一区| 中文字幕福利视频在线一区| 日本欧美高清在线观看视频| 中出小骚货在线观看| 亚洲欧美精品海量播放| 黑鸡巴肏少妇逼视频| 一区二区三区国产在线成人av | 亚洲一区二区三区四区入口| 人人妻人人爽人人摸| 91色老久久精品偷偷蜜臀| av天堂a亚洲va天堂va里番| 偷拍熟女大胆免费视频| 日日夜夜免费视频精品| 日韩久久不卡免费视频| 国产在线小视频一区二区| 亚洲一区二区在线视频观看免费 | 国产主播诱惑毛片av| 最新国产精品拍在线观看| 国模伊人久久精品一区二区三区| 国产高清视频www夜色资源| 国产精品黄色片大全| 国产精品久久久久久成人久| 日本少妇精品免费视频| 97精品久久久久久无码人妻| 青青青青午夜手机国产视频| 久久99精品久久久久久三级| 亚洲理论在线a中文字幕97| 亚洲午夜高清在线观看| 亚欧洲乱码视频一二三区| 好看的日本中文字幕在线观看二区| 欧美精品熟妇免费在线| 99精品久久99久久久久一| 97香蕉久久国产超碰| 开心激情五月天作爱片| 91人妻人人做人人爽高清| 大香蕉在线欧美在线视频| 伦理在线观看未删减中文字幕| 色欲AV蜜桃一区二区三| 国产极品气质外围av| 91中文字幕视频网站| 久久99精品久久久久久三级| 青青青在线观看国产| 天天干夜夜操夜夜骑| 亚洲一区二区精品三区视频| 97超碰人人爽人人做| aaaa级少妇高潮在线观看 | 亚洲精品久久久人妻| 午夜宅男电影av网站| 亚洲人人爽人人澡起碰av| 国产在线观看一区二区三区四区| 亚洲成人 国产精品| 久久精品四虎夜夜拍拍拍| 国产精品国产三级在线高清观看| 五月在线视频免费播放91| 一区二区三区四区影片| 欧美日韩亚洲国产视频二区| 亚洲欧美综合另类最新| 韩国资源视频一区二区三区 | 午夜久久久久欠久久久久| 新亚洲天堂男子av| 欧美一级特黄大片在线| 亚洲精品乱码久久久久app | 天天夜夜久久精品综合| 综合久久伊人久久88| 可以直接看av网站| 一二三四区国产在线观看| 午夜福利在线不卡视频| 中文字幕 人妻 熟女| 免费看日韩黄视频在线观看| 精品人妻人人做人人爽| 蜜臀一区二区日韩美女少妇视频| 欧美黄色一区二区三区视频| 911美女片黄在线观看| 日韩A级毛片免费视频| 天天看片天天摸天天操| 精品人妻在线激情视频| 韩国资源视频一区二区三区| 18在线观看免费观看| 青青青国产精品视频| 国产精品久久久久精品三级18| 激情久久在线免费观看视频| 亚洲人精品午夜射精日韩| 极品内射老女人操逼视频| 亚洲熟妇在线视频观看| 大尺度av毛片在线网址| 亚洲欧美综合另类最新| 波多野结衣在线一区别| 最新国产精品久久精品app| 97超碰人人爽人人做| 亚洲成人三级黄色片| 黄色大片一级老太太操逼| avtt中文字幕手机版| 国产美女视频带a∨黄色片| 大奶熟妇激情操逼逼| jandara在线观看| 超碰在线观看97资源| 大片a免费观看在线视频观看| 福利小视频免费在线| 免费看日韩黄视频在线观看| 欧美一区二区三区视频看| 公侵犯人妻中文字幕巨| 国产探花自拍亚洲av| 男人av一区二区三区| 91进入蜜桃臀在线播放| 精品精品精品精品精品污污污污| 夜夜骚av一二三区| 亚洲第一区av中文字幕| 91色乱一区二区三区| 一区二区三区四区久久久久韩日| caopeng97在线观看视频| 韩国在线播放一区二区三区| 午夜精品一区二区三区不卡顿| 松本菜奈实最新av在线| 91九色国产在线视频| 国产成人91色精品免费看片| 亚洲欧美另类丝袜另类自拍| 日韩一区二区在线播放观看| 九热精品视频在线观看| 黑人和日本人av一区二区| 天天天天天天天天日日日| 女人的天堂av在线网| 亚洲一区二区三区国产精品电影| 美女网站视频久久精品| 高潮喷水在线视频观看| 亚洲第一区av中文字幕| 日本清纯中文字幕版| av在线观看视频免费| 2020精品视频在线| 亚洲 综合 欧美 一区| 9662av在线视频| 午夜在线成人免费电影| 青娱乐免费最新视频| 中文字幕中文字幕在线中…一区| 久久中文字幕av一区二区| 午夜精品一区二区三区不卡顿 | 国产不卡免费在线观看| xxnxx国产美女| 国产免费久久精品99re丫丫 | 乱子伦国产一区二区三区| 久久sm人妻中出精品一区二区| 最新福利二区三区视频| ass亚洲熟女ass| 成年人黄色日本视频| 久久久国产精品免费视频网| 午夜一区二区三区视频在线观看| 插鸡视频免费网站在线播放 | jiee日本美女视频网站| 人妻少妇的va视频| 精久久久久久久久久久久| 另类欧美激情校园春色| 欧美一级特黄大片做受99| 中文字幕在线观看亚洲情色| 亚洲一区二区在线视频观看免费| 高清av在线婷一区二区色日韩| 国产三级自拍视频在线观看网站| 午夜久久人妻一级内射av网址| 全球高清中文字幕av| 欧美一级特黄大片做受99| 成熟了的熟妇毛茸茸| 亚洲精品久久久人妻| 久久久久久久岛国免费观看| 黑人大巨屌操美女逼| 一二三四区国产在线观看| 欧美精品一区二区三区观看 | 欧美大胆a级视频秒播| 自拍偷拍视频亚洲一区| 大乳丰满人妻中文字幕韩国hd| 国产精美视频精品视频精品 | 黑人和日本人av一区二区| 自拍丝袜国产欧美日韩| 欧美区一区二区三视频| 大尺度av毛片在线网址| 中文字幕精品人妻久久久久| 国产自拍偷拍在线精品| 日韩国产欧美一区二区三区粉嫩| 女生抠逼自慰啊啊啊啊啊啊啊下载| 91精品国产综合99| 手机看片福利一区二区三区四区| 久久一级片三上悠亚| 亚洲国产美女主播在线观看| 中文字幕免费啪啪啪| 国产漂亮白嫩美女在线图片| 色欲AV亚洲AV无码精品| 亚洲中文字幕最新地址| 欧美男女一区二区三区| 91亚洲精品久久蜜桃| 黄色片免费国产精品| 在线观看黄页网站视频网站| 伊人网国产在线播放| 黑人巨大精品一区二区在线| 中文字幕人妻一区色偷偷久久| 伊人久久综合国产精品| 中文字幕综合网91| 国产经典精品欧美日韩| 成年人免费福利在线| 久久久久久久岛国免费观看| 一区二区三区不卡免费视频网站| 免费成人av麻豆| 天天色天天射天天日天天干| 亚洲高清一区二区三区久久| 熟女国内精品一区二区三区 | 人人妻人人爽人人摸| 天天天天天天天天日日日| 亚洲成人偷拍自拍在线| 免费24小时人妻视频| 午夜一区二区三区视频在线观看| 欧美黑人1区2区3区| 国产精品蝌蚪自拍视频| 国产福利小视频在线观看网站| 麻豆国产91制片厂| 91精品国产91久久久久久密臀| 精品国产污污污污免费观看| 亚洲精品9999蜜桃| jandara在线观看| 日本有码精品一区二区三区| 自拍偷自拍亚洲精品10p| 美女欧美视频在线观看免费| 日本不卡 中文字幕| 夫妻黄色一级性生活片| 91精品一区一区三区| 人妻系列中文字幕大乳丰满人妻| 亚洲国产精品自拍偷拍视频在线| 人妻人妻在线视频网站| 大片a免费观看在线视频观看| 亚洲色视频在线播放网站| 午夜精品一区二区三区不卡顿| 5d蜜桃臀女无痕裸感| 国产农村乱子伦精精品视频| 亚洲欧美国产一本综合首页| 加勒比不卡在线视频| 91色老久久精品偷偷蜜臀| 最新免费在线观看污视频| 亚洲美女露隐私av一区二区精品| 久久精品国产亚洲av热软件| 不卡视频在线 欧美日韩| 大成色亚洲一二三区| 9999久久久久老熟妇二区| 亚洲熟女人妻自拍在线视频| 男人电影天堂在线观看| 午夜精品秘一区二区三区| 久久久久久久久久久久久国产| 99在线视频精品观看高| 免费在线观看视频啪啪| 全彩漫画口工18禁| 一区二区三区观看在线| 人妻少妇的va视频| 国产igao激情在线视频入口| 无人区一码二码三码区别在哪| 港台美女明星av天堂| 午夜精品视频免费观看| 青青草一个释放的网站| 9420高清视频在线观看国语版| 成人精品动漫一区二区| 国产农村乱子伦精精品视频| 顶级欧美色妇4khd| 日日夜夜免费视频精品| caopeng97在线观看视频| 中文字幕日韩人妻在线三区| 色狠狠色综合久久久绯色| 97精品视频,全部免费| 熟女俱乐部jukujoclub| 青娱乐免费最新视频| 在线免费观看a视频免费| 久久国产半精品99精品国产| 国产精品美女免费视频观看| 18岁禁一二三区免费体验| 女生抠逼自慰啊啊啊啊啊啊啊下载| 欧美在线观看一区二区不卡| 真人一进一出抽搐大尺度视频| iga肾三级算严重吗| 日本国产亚洲欧美色综合| 玖玖资源站在线观看亚洲| 老熟妇一区二区三区v∧88| 夜夜操夜夜爱夜夜摸| 天天干天天操天天日天天日| 99国产精品国产精品毛片19| 亚洲欧美激情久久久| 熟女人妻aⅴ一区二区三| 9999久久久久老熟妇二区| 又粗又长又硬又黄又爽| 久久99热精品免费观看视| 欧美精品一区二区三区观看| 91偷拍被偷拍在线播放| 性感美女极品18禁网站在线| 97精品人妻免费视频| 成人做爰av在线观看网站| 日韩人妻精品久久久久| 亚洲三级综合在线观看| 中文字幕人妻精品精品| 天天操天天舔天天做| 日韩成人在线电影首页| 可以直接看av网站| 国产精品剧情av在线播放| 9662av在线视频| 日韩欧美一区二区三区免费看| 老司国产精品视频免费观看| 全彩漫画口工18禁| 日韩人妻精品久久久久| 色丁香久久激情综合网| 欧美第一激情综合网欧美激情 | 亚洲国产精品一区51动漫| 亚洲第一区av中文字幕| 亚洲乱码av一区二区蜜桃av| 青青国产95免看视频| 97精品视频,全部免费| 在线观看中文字幕精品av| 夜夜人人干人人爱人人操| 午夜情色一区二区三区| 人妻少妇精品二三区| 天天想要天天操天天干| 2020年亚洲男人天堂网| 久久午夜免费鲁丝片| 青青免费观看视频| 女人扒开逼让男人操 | 亚洲 综合 欧美 一区| 上床啪啪啪免费视频| 五月天天堂视频在线| 91在线九色porny| 日产国产欧美精品另类| av 资源在线播放| 国产精品网站的黄色| 久草久热这里只有精品| 亚洲熟妇丰满多毛xxxx网站| 美国伦理片午夜理论片| 日本在线免费观看国产精品| 干逼又爽又黄又免费的视频| 国产精品 亚洲欧美 自拍偷拍| 91超精品碰国产在线观看| 在线播放 日韩 av| 偷拍欧美日韩另类图片| 一区二区三区四区影片| 亚洲欧美日韩电影一区| 69国产精品成人aaaaa片| 男女真人做带声音视频图片| 午夜免费福利老司机| 2020国产成人精品视频| 亚av一二三在线观看| 国产大桥未久一区二区| 98热视频精品在线观看| 人妻熟女 亚洲 一页二页| 又爽又粗又猛又色又黄视频| 日韩av熟妇在线观看| av天堂a亚洲va天堂va里番| 国产最新av在线免费观看| 18禁男女啪啪啪无遮挡| 久久人人爽人人爽人人av东京热| 人妻系列中文字幕大乳丰满人妻| 欧美视频免费观看777| 国产一级一国产一级毛片 | 亚洲码av一区二区三区| 国产自拍偷拍视频在线免费观看| 制服丝袜中文字幕熟女人妻| 97精品视频,全部免费| 日韩成人在线电影首页| 美国十次了亚洲天堂网国产| 91色乱一区二区三区| 男人av一区二区三区| 亚洲精品激情视频在线观看| 午夜一区二区三区视频在线观看| 久久视频 在线播放| 日韩美精品成人一区二区三区四区| 亚洲av手机免费在线| 国产肥胖熟女又色又爽免费视频 | 国产av精品一区二区三区久久| 黄版视频在线免费观看| 久久亚洲国产成人精品麻豆| 韩国资源视频一区二区三区| 69av精品国产探花| 中文字幕人妻一区二区视频系列 | 天天干天天操天天要| av在线中文字幕在线| 正在播放麻豆精品一区二区| 97人妻在线视频自拍| 亚洲欧美另类校园春色| 亚洲天堂av最新在线| 国产不卡免费在线观看| 西野翔人妻中文字幕中字在| 在线中文字幕人妻av| 91 精品视频在线看| 在线能看视频你懂的| 99精品久久精品一区二区| 69视频在线精品国自产拍| av人摸人人人澡人人超碰小说| 成人午夜av电影网| 亚洲综合另类欧美久久| 伊人网在线观看 视频一区| 2018中文字字幕人妻| 一区二区三区五区六区| 熟女人妻少妇一区二区| 亚洲激情噜噜噜久久久| 成人精品影视一区二区| 亚洲天堂色综合久久| 青青青在线视频免费播放| 久久久亚洲综合国产精品| 国产激情一区二区视频| 亚洲成人欧洲成人在线| 久久久视频在线播放| 涩涩黄片在线免费观看| 一区二区三区四区 在线播放| 婷婷一区二区三区五月丁| 日本成年视频在线免费观看| 91久久久精品成人国产| 69久久夜色精品国产69乱电影| 国产精品网站的黄色| 最新久久这里只有精品| 亚洲人成小说网站色| 二十四小时日本高清在线观看| 伊人网在线观看 视频一区| 超碰在线pro中文字幕| 中文字幕熟女人妻一区| 日本亚洲午夜福利一区二区三区| 亚洲欧美国产一本综合首页| 操烂你的骚逼天天欧美| 999久久久人妻精品一区| 日日夜夜免费视频精品| 欧美精品熟妇免费在线| av在线男人的天堂亚洲| 性色蜜桃臀x88av天美传媒| 日韩一区二区在线播放观看| 老司机免费视频福利0| 欧美成人短视频在线播放| 第一福利视频在线观看| 在线视频自拍第三页| 青青草原在线播放日韩| 亚洲自拍偷拍av在线| xxoo福利视频导航| av大尺度一区二区三区| 天堂网成人av电影| 午夜福利国产精品久久久久 | 亚洲色视频在线播放网站| 人人妻人人爽人人摸| 亚洲图片另类综合小说| 中文字幕日本一二三区| 一区二区三区国产在线成人av| 色噜噜噜噜色噜噜色合久一| 99久久人人爽亚洲精品美女| 日韩久久不卡免费视频| 国产精品乱码高清在线观看h| 亚洲综合成人精品成人精品| 中文字幕久久久国产| 五十岁熟妇高潮喷水| 欧美日韩不卡视频合集| 白白色在线免费视频发布视频| 国产美女主播av在线| 中文字幕 一区二区在线观看| 青青操91美女国产| 日韩国产欧美一区二区三区粉嫩| 小妹妹爱大棒棒免费观看视频| 久久人人爽人人爽人人av东京热| 亚洲精品中文字幕手机在线免费看| 欧美 日韩 精品 中文| 国产天堂av不卡网| 麻豆出品视频在线观看| 日本高清久久人人爽| 视频免费在线观看网站| 日韩在线 中文字幕| 亚洲a区在线免费观看| 91精品国产成人久久久久久| 狠狠干狠狠操免费视频| 欧美区日本区国产区| 欧美性感美女热舞视频| 熟女阿高潮合集一区二区| 亚洲美女黄色福利视频网站大全| 91超精品碰国产在线观看| 久久精品久久久久观看99水蜜桃| 精品国产污污污污免费观看| 黑人大巨屌操美女逼| 欧美亚洲另类精品第一页| 欧美aaaa性bbbbaaaa| 国产青青青青草免费在线视频| 国产精品免费看一区二区三区| 特级aaaaa黄色片| 国产夫妻视频在线观看免费| 2020国产激情视频在线观看| 可以免费观看日韩av| 国产美女主播av在线| 91色哟哟视频在线观看| 98热视频精品在线观看| 天天干夜夜爽狠狠操| 亚洲第一页欧美第一页| 男女爱爱好爽视频免费看| 亚洲制服丝袜网站中文字幕| 免费在线观看亚洲福利| 日本国产亚洲欧美色综合| 青青青在线视频观看97| 欧美极品少妇高潮喷水| 91青青青国产免费高清| 可以直接看av网站| 猫咪亚洲中文在线中文字幕| 午夜国产免费视频亚洲| 午夜精品秘一区二区三区| 68视频在线免费观看| 中文字幕亚洲无线乱码| 精产国品一二三77777| 亚洲欧美韩国日本一区二区| 欧美黑人1区2区3区| 日本美女爱爱视频网站| 二十四小时日本高清在线观看| 亚洲第一成年偷拍视频| 国产成人91色精品免费看片| 4日日夜夜精品视频免费| 日韩成人精品久久久免费看| 欧美操大黑鸡巴视频在线观看| 日本福利视频网站导航| 日本成年视频在线免费观看| 北野中文字幕一区二区| 黑吊操欧美极品美女| 国产av在线免费视频| 99久久免费播放在线观看视频| 老熟妇一区二区三区v∧88| 伊人精品成人综合网| 亚洲午夜精品一级毛片app| 超碰在线观看97资源| 中文字幕人妻一区二区视频系列 | 福利一二三在线视频观看| 国产黄色主播网址大全在线播放 | 四虎国产精品国产精品国产精品| 国产人妻777人伦精品hd超碰| 亚洲av网站一区二区三区| 夜夜躁婷婷av蜜桃妖| 手机看片1024精品国产| 国产精品久久人人添| 亚洲av 综合av| 亚洲最大先锋资源采集站| 国产美女主播av在线| 一区二区三区四区影片| 一二区二区不卡视频| 99精品视频在线在线观看| av日韩视频在线观看| 欧美操大黑鸡巴视频在线观看| 丰满放荡熟妇在线播放| 午夜精品久久久久久久久久蜜桃| 4日日夜夜精品视频免费| lutu玩弄人妻短视频| 久久久人妻免费视频| 青青在线视频看看| 欧美第一激情综合网欧美激情| 色哟哟亚洲乱码国产乱码精品精 | 成人人妻h在线观看| 全国熟妇精品一区二区免费视频 | 老熟女xxxⅹhd老熟女性| 日本高清激情乱一区二区三区| 亚洲国产精品一区二区第二页| 琪琪日本福利伦理视频| 熟妇精品午夜久久久久| 福利一二三在线视频观看| 操人妻人妻天天爽天天偷| 欧美三区四区在线视频| 中文字幕在线免费观看人妻| 日韩三级黄色大片在线观看| 老牛影视在线一区二区三区| 呻吟求饶的人妻中文字幕| 黄色网络中文字幕日本| 在线视频自拍第三页| 久久99嫩草99久久精品| 69久久夜色精品国产69乱电影| 国产清纯一区二区在线观看| 91色乱一区二区三区| 国语精品视频自产自拍| 亚洲成年人精品国产| 亚洲制服丝袜网站中文字幕| 中文字幕观看中文字幕免费 | 加勒比东京热绿帽人妻多人操| 免费成人av麻豆| 亚洲成人自拍av在线| 红桃视频国产av在线| 网站在线观看蜜臀91| 国内自拍第一区二区三区| 欧美日韩高清片在线观看| 外国美女舔男人坤坤| 国产福利一区二区三区在线观看| 另类欧美激情校园春色| 欧美老熟妇xxoo老妇| 日本不卡视频一二三区| 极品内射老女人操逼视频| 欧美亚洲精品色图网站| 亚洲第一区av中文字幕| 老司机伊人99久久精品| 操人妻人妻天天爽天天偷| 玖辛奈18禁同人污本子| 四季av人妻一区二区三区| avtt中文字幕手机版| 白白色在线免费视频发布视频| 国产大桥未久一区二区| 精产国品一二三77777| 一区二区在线观看视频观看| 熟女俱乐部jukujoclub| 福利在线国产小视频| 日本在线免费观看国产精品| 亚洲成人中文无码在线| 亚洲午夜精品视频节目| 亚洲熟妇丰满多毛xxxx网站| 天天看片天天摸天天操| 日本人妻熟妇丰满成熟HD系列| 高清国产美女a一级毛片| 日韩激情亚洲国产欧美另类激情| 亚洲无码专区中文字幕专区| 小妹妹爱大棒棒免费观看视频| 国产av高清二区三区| 国产91黑丝小视频在线观看| 男女插鸡巴视频软件| 亚洲av 综合av| 中文字幕福利视频第四页| 人妻中文字幕亚洲在线| 日本欧美视频在线免费| 亚洲AV无码久久精品国产一区老| 免费看日韩黄视频在线观看| 日韩免费黄色片在线观看| 日本一本午夜在线播放| 加勒比不卡在线视频| 成年人免费福利在线| 精产国品一二三77777| 欧美性感美女热舞视频| 免费啪啪啪网站在线观看| 污网址在线观看视频| 亚洲熟妇丰满多毛xxxx网站| 国产自拍偷拍视频在线免费观看| 欧美巨大另类极品video| 午夜福利国产精品久久久久| 婷婷色综合五月天视频| 91人妻人人做人人爽高清| 色老头一区二区三区四区五区| 荣立三等功退休有什么待遇| 中文字幕精品人妻久久久久| 欧美黄色一区二区三区视频| 911精产国品一二三产区区| 黑人侵犯人妻森泽佳奈| 国产精美视频精品视频精品| 最近最新最好看的中文字幕| 国产自拍偷拍视频在线免费观看| 亚洲日本欧美韩国另类综合| 男人用大鸡巴狂操女人肉穴| 国际精品熟女一区二区| 免费看日韩黄视频在线观看| 国产精品亚洲精品亚洲| 天天干天天色综合久久| 国产igao激情在线视频入口 | 快色视频在线观看免费| 中出小骚货在线观看| 国产一级一国产一级毛片| 精品国产污污污污免费观看| 一区二区三区四区 在线播放| 国产激情视频在线观看的 | 亚洲一区二区三区四区入口| 欧美日韩一区二区三区成人影院| 国产伦理二区三区在干嘛呢| 欧美亚洲精品色图网站| 九九热在线精品播放| 中文字幕福利视频在线一区| 亚洲成年人精品国产| 黄色片免费网站在线| 伊人情人成综合视频| 久久久久久a女人处女| 亚洲一区二区三区国产精品电影| 天天做天天日天天搞| 91性高湖久久久久久久久久| 欧美精品一区二区三区观看| 天天夜夜久久精品综合| 日本福利片在线播放| 熟女国内精品一区二区三区| 亚洲免费午夜污福利| av大尺度一区二区三区| 红桃视频国产av在线| 欧美色视频网址大全| 老熟妇一区二区三区v∧88| 国产经典精品欧美日韩| 人妻免费视频黄片在线视频| 狠狠操狠狠操狠狠插| 老牛影视在线一区二区三区| lutu玩弄人妻短视频| 亚洲激情视频在线观看免费| 日本东京热视频欧美视频| 综合激情网,激情五月| 亚洲乱码av一区二区蜜桃av| 亚洲无码专区中文字幕专区| 亚洲午夜熟女在线观看| 日韩美精品成人一区二区三区四区| 国产精品蝌蚪自拍视频| 亚洲欧美一级特黄大片| 日本电影一级人妻在线播放四区| 99久久精品视频16| 亚洲精品国产99999| 97cao在线视频| 黑人侵犯人妻森泽佳奈| 99久9在线视频播放| 九九热在线精品播放| 欧美亚洲另类精品第一页| 色老头一区二区三区四区五区| 中出小骚货在线观看| 97人妻在线视频自拍| 瑟瑟干视频在线观看| 韩国毛片w妈妈的朋友7| 亚洲美女色www色| 亚洲自拍偷拍av在线| 高潮喷水在线视频观看| 国产高清在线观看av| 美国男的操女孩的小嫩逼| 性色蜜桃臀x88av天美传媒| 天天操天天射天天操天天日| 男女啪啪啪网站在线观看免费| 国产精品网站的黄色| 亚洲av网站一区二区三区| 汤姆提醒30秒中转进站口| 色噜噜噜噜色噜噜色合久一| 两个人在一起靠逼啊啊啊| 人妻超清中文字幕在线乱码 | 欧美国产精品久久久免费| 国产熟女五十路一区二区三区| 婷婷六月天在线视频| 国产主播诱惑毛片av| 一区二区三区 国产日韩欧美| 最新国产精品久久精品app| 一区二区三区不卡免费视频网站| 中文字幕av人妻一区二区三区 | 午夜久久人妻一级内射av网址| 日韩久久九九精品视频| 欧美激情视频第一页| 精品一区二区三区喷水内射高潮| 亚洲av激情综合网| 99热99这里免费的精品| 日韩人妻中文字幕区| 亚洲综合一区二区三区四区| 青青青青青爽视频在线| 妈妈的朋友中字在线免费观看| 欧美丝袜亚洲国产日韩| 九色porny91国产| 亚洲永远av在线播放| 欧美啪啪一区二区三区| 中字幕人妻熟女人妻a62v网| 黄在线看片免费人成视频| 亚洲 综合 欧美 一区| 亚洲少妇视频在线观看| 天天操,天天射,天天爽| 国际日韩日韩日韩日韩日韩| 2020精品视频在线| 九一精品人妻一区二区三区| 久久午夜免费鲁丝片| 日本美女爱爱视频网站| 大成色亚洲一二三区| 国内自拍第一区二区三区| 亚洲国产精品青青草| 九九热视频1这里只有精品| 国产av啊啊啊啊啊啊啊| 亚洲综合首页综合在线观看| 福利一二三在线视频观看| 91亚洲精品久久蜜桃| 九九视频在线观看全部| 天天干天天色综合久久| 老熟女 露脸 嗷嗷叫| 天天弄天天草天天日天天| 亚洲 偷拍 自拍 欧美| 97成人老师在线视频| 欧美日韩黄片免费在线观看| 国产高清视频www夜色资源| 国产原创一区二区三区在线播放| 99亚偷拍自图区亚洲| 日韩三级黄色大片在线观看| 青青草成人免费自拍视频| 亚洲国产精品一区51动漫| 国际精品熟女一区二区| 性感人妻 中文字幕| 人妻系列中文字幕大乳丰满人妻| 国产 少妇 一区二区| www国产亚洲精品久久久| 9420高清视频在线观看国语版| 青青青在线视频观看97| 亚洲AV无码一二三四区在线播放| 77亚洲视频在线观看| 国产精品乱码高清在线观看h| 偷拍欧美日韩另类图片| 九九热在线精品播放| 亚洲 自拍 激情 另类| 亚洲午夜熟女在线观看| 成人午夜麻豆大胆视频| 一区二区三区免费版在线| 69国产精品成人aaaaa片| 182tv精品免费在线观看| 色视频免费观看网址| 2020国产激情视频在线观看| 911精产国品一二三产区区| 亚洲a区在线免费观看| 人人妻人人澡人人爽97| 久久久久久久岛国免费观看| 色就色综合偷拍区欧美在线| 抽插小穴啊啊啊视频| 日本不卡视频一二三区| 日韩成人在线电影首页| 国产精品久久久久久成人久| 日本黄色一级电影网址| 夏目彩春av在线看| 五月激情婷婷四射基地| alisontyler和黑人| 免费高清av一区二区| 免费的啪啪视频软件| 日本熟妇乱妇熟色视频| 人妻系列中文字幕大乳丰满人妻| 亚洲av中文无码网站| 国产精品免费看一区二区三区| 丝袜美女诱惑佐佐三上| xxnxx国产美女| 亚洲激情噜噜噜久久久| 亚洲无码专区中文字幕专区| 大尺度久久久久久久| 精品视频在线观看免费99| 国产精品福利久久久久| 自拍偷自拍亚洲精品10p| 国产精品久久人人添| 天天操天天干加勒比久久| 视频免费在线观看网站| 国产乱码有码一区二区三区| 亚洲蜜桃久久久久久| 麻豆午夜激情在线观看| 天天摸天天舔天天操天天日| 快使劲弄我视频在线播放 | 欧洲成熟女人色惰片| 天天色 天天操 天天好逼| 涩涩黄片在线免费观看| 亚洲成人自拍av在线| 国产资源网站在线播放| 日韩免费黄色片在线观看| 美女露阴道让男人捅| 国产精美视频精品视频精品| 黑人大巨屌操美女逼| 成人精品影视一区二区| 人人妻人人爽人人摸| 中文字幕 中文字幕 亚洲| 裸露视频免费在线观看| 午夜宅男电影av网站| 日本欧美亚洲国产啊啊啊| 夜夜操夜夜爱夜夜摸| 日本久久久久久黄色| www一区二区91| 18禁男女啪啪啪无遮挡| 九十九步都是爱最后一步是尊严| 中文字幕日韩人妻在线三区| 成年男女免费视频网站无毒| av在线播放观看h| 国产精品无码无卡免费观| 女人扒开逼让男人操 | 久久久久久久岛国免费观看| 亚洲美女a级黄色在线播放| 在线观看免费啪啪啪| 天天综合久久无人区| www国产亚洲精品久久久| 国产在线小视频一区二区| 日韩欧美黄色免费网站| 中文字幕人妻精品精品| 性高潮视频在线观看日韩| 青青操久久综合激情| 男生用大肌巴操美女骚穴| 国产福利小视频在线观看网站| 午夜久久久久久av五月| 天天操天天射天天操天天日 | 欧美强奸视频在线观看| 欧美精品激情在线不卡| 玖玖资源站在线观看亚洲| 最新国产精品拍在线观看| 熟女一区二区视频在线| 亚洲制服丝袜资源网| 绿巨人浩克在线视频观看| 琪琪日本福利伦理视频| 一区二区在线观看视频观看| 亚洲综合天堂av网站在线观看| 性感人妻 中文字幕| 夜夜骚av一二三区| 凹凸视频一区二区在线观看| 色屁屁一区二区三区在线观看| 极品少妇高潮喷水日出白浆| 天天弄天天草天天日天天| 天天干夜夜撸天天操| 欧美老熟妇xxoo老妇| 欧美情色av在线观看| 911美女片黄在线观看| 国内自拍第一区二区三区| 夜夜操天天干夜夜操| 在线观看免费啪啪啪| 77亚洲视频在线观看| 美利坚合众国av天堂| 亚洲综合首页综合在线观看| 制服丝袜中文字幕熟女人妻| 天天色 天天操 天天好逼| 最新日韩中文字幕啪啪啪| 天天操天天舔天天爽|