| 5 | 1/1 | 返回列表 |
| 查看: 5688 | 回復(fù): 12 | ||||
| 當(dāng)前只顯示滿足指定條件的回帖,點(diǎn)擊這里查看本話題的所有回帖 | ||||
zhangjunpeng至尊木蟲 (知名作家)
|
[交流]
TCGA數(shù)據(jù)庫(kù)的使用交流 已有10人參與
|
|||
|
在生信領(lǐng)域,數(shù)據(jù)源是非常重要的,畢竟誰(shuí)也不想感受“巧婦無(wú)米之炊”的感覺(jué)。隨著大數(shù)據(jù)時(shí)代的到來(lái),各種大型生物公共數(shù)據(jù)庫(kù)也不斷完善,其中就包括The Cancer Genome Atlas (TCGA,https://tcga-data.nci.nih.gov/tcga/tcgaHome2.jsp)數(shù)據(jù)庫(kù)。TCGA數(shù)據(jù)源大部分都是公開(kāi)的,如何有效的進(jìn)行收集和預(yù)處理是一個(gè)頭疼的問(wèn)題。 目前來(lái)能夠從TCGA數(shù)據(jù)庫(kù)中提取數(shù)據(jù)的處理工具有cBioPortal(http://www.cbioportal.org/public-portal/cgds_r.jsp),ICGC(http://dcc.icgc.org/download/current)和GenePattern(http://www.broadinstitute.org/ca ... tern/download/index)。這些工具使用起來(lái)還是有其局限性,都不能夠輕易獲取每個(gè)癌癥類型的二維數(shù)據(jù)矩陣(例如基因?yàn)閞ows,樣本為columns)。 因此開(kāi)此貼,歡迎各位同行蟲友交流一下獲取TCGA數(shù)據(jù)庫(kù)的經(jīng)驗(yàn),以及間接獲取TCGA數(shù)據(jù)的工具使用技巧和方法。 |
分子生化實(shí)驗(yàn)經(jīng)驗(yàn)積累 |

新蟲 (初入文壇)
|
下面是某學(xué)長(zhǎng)發(fā)給我的TCGA部分?jǐn)?shù)據(jù),請(qǐng)問(wèn)每組數(shù)據(jù)代表什么意思? # Mutation matrix made from SNV data (/data/compbio/datasets/MutationMatrices/BREAST/2012-10-31/brca_mutation_fromPanCancer.snv) and CNA data (brca_cna_gistic_wide.cna). TCGA-A1-A0SD ANK3 C12ORF51 C19ORF51 CASK CDHR3 CNTFR COL14A1 CPAMD8 CPEB2 CXORF58 FAM182B FNDC1 GDF5 GRIN2C IGSF3 KIRREL KLK15 L1CAM LOC653125 LRBA LRP2 NCOA3 PAK1(A) PCDHA6 PGC PNLIPRP2 PTEN(D) RP1 SFRS17A SIDT2 SLC44A3 SLFN14 SNX5 TLR5 WDR72 ZFP91 ZFR2 ZNF544 ZNF740 TCGA-A1-A0SE ARRDC4 B3GNT1 C10ORF71 C3ORF38 CCND1(A) CDH1 ENSG00000234924 ENSG00000245041 ENSG00000245055 ENSG00000245922 ENSG00000246925 ENSG00000247772 LOC646096 MAP2K4(D) MED23 MGA MRPS18B PAK1(A) RBM26 SDR16C5 SYDE2 TBC1D12 UNC13C WDR91 ZFHX4 TCGA-A1-A0SH 12p13.33(A) ACSL4 AHCTF1 ALPK3 ANK3 ANKRD7 APOB48R ARHGAP28 ASL ATPIF1 BCL7B BDP1 BLOC1S1 BRCA1 C14ORF37 CAP2 CCT8 CD97 CDCA2 CHCHD1 CNTN4 COL14A1 CUBN DAPK2 DHRS13 DMD DNAH8 DRGX ENSG00000210082 ENSG00000245997 ENSG00000246667 ENSG00000247966 ESCO1 EXPH5 FAM111A FAM149B1 FAM150B FAM83B FBXO4 GDF9 GPR32 H2BFWT HCFC2 HOMER3 HYDIN IRS4 ITIH5 KCNT2 KCNU1 KDELR3 KLHL25 KRT28 LOC100130982 LOC100288406 LOC201651 LOC440292 LOC645954 LPP LRRC8A MAGEA12 MARCH7 MED13L METT5D1 MICAL1 MTM1 NOS3 PALLD PCTK3 PHF17 PLCE1 PNCK PPARA PREX1 PTPRD(D) PZP RHCG SCAPER SLC17A4 SPTBN1 TAS2R46 TIFAB TTC39A UPRT WDR7 WDR87 WWOX(D) ZFHX4 ZNF606 TCGA-A1-A0SJ 20p12.1(D) ADK-MYST4(A) ADORA3 ALG1 AMZ2 ASCL3 C14ORF104 CCND1(A) CHML CILP CNR1 COL20A1 ENSG00000240720 ENSG00000245434 ENSG00000245549 ENSG00000245900 ENSG00000246515 ENSG00000247089 FAF2 FLJ40292 GJB2 GNPTAB HAGHL HNRPDL HOOK2 IKZF1 LATS2 LOC100287308 LOC100290640 LOC729866 MAP2K4(D) MCTS1 MDM2(A) NOTUM NUP62 OFD1 PAK1(A) PSMD11 RANBP6 RASSF7 SCN4A SNAI1 SPEN TH1L TNRC6A ZBTB11 ZNF217(A) ZNF543 TCGA-A1-A0SK 8p11(A) 8p11.23(A) ACBD5 AHNAK ANKRD42 ARL11 ASB10 ATG2A C19ORF29OS CAMTA2 CCL23 CHRNB4 COPE CYP21A2 DMBT1 DTX1 ENSG00000005206 ENSG00000223274 FAT3 FLJ32810 GDPD5 GMEB1 GTF3C1 HNRNPA1 IDS LAMA3 LARGE LOC645954 LRP2 LSR NPAS2 NSMAF OBFC2B OR5AU1 PJA1 POU4F1 RB1(D) RXFP4 SCD5 SERTAD3 SHPK SLITRK4 SSR4 TECTA TEX11 TG TP53 TRAF3IP1 UGT2B15 UNC5D USH2A VIT YIPF7 |

金蟲 (初入文壇)
| 我最近也在使用TCGA的一些數(shù)據(jù),TCGA只公開(kāi)部分的腫瘤數(shù)據(jù),有一些是可以下載,但不能發(fā)布使用,對(duì)于既能下又能用的部分(我用到的是22種腫瘤),又分為基因組的variation和RNA seq的一些原始結(jié)果(目前我所知道的)。最好是批量下載,即在它的ftp上把整個(gè)文件夾獲取。另外也推薦一個(gè)腫瘤數(shù)據(jù)庫(kù):COSMIC 里面的mutation文件竟包含了TCGA的一些結(jié)果,但我沒(méi)細(xì)看是否完全包含了,lz如果深入做這部分,可以向你請(qǐng)教一下! |
至尊木蟲 (知名作家)

木蟲 (小有名氣)
| 最具人氣熱帖推薦 [查看全部] | 作者 | 回/看 | 最后發(fā)表 | |
|---|---|---|---|---|
|
[考研] 0703化學(xué)調(diào)劑 +11 | 妮妮ninicgb 2026-03-15 | 15/750 |
|
|---|---|---|---|---|
|
[考研] 326求調(diào)劑 +4 | mlpqaz03 2026-03-15 | 4/200 |
|
|
[基金申請(qǐng)] 山東省面上項(xiàng)目限額評(píng)審 +3 | 石瑞0426 2026-03-19 | 3/150 |
|
|
[考研] 一志愿深大,0703化學(xué),總分302,求調(diào)劑 +4 | 七月-七七 2026-03-21 | 4/200 |
|
|
[考研] 083200學(xué)碩321分一志愿暨南大學(xué)求調(diào)劑 +3 | innocenceF 2026-03-17 | 3/150 |
|
|
[考研] 二本跨考鄭大材料306英一數(shù)二 +3 | z1z2z3879 2026-03-17 | 3/150 |
|
|
[考研] 一志愿中國(guó)石油大學(xué)(華東) 本科齊魯工業(yè)大學(xué) +3 | 石能偉 2026-03-17 | 3/150 |
|
|
[考研]
|
.6lL 2026-03-18 | 8/400 |
|
|
[考研] 304求調(diào)劑 +6 | 曼殊2266 2026-03-18 | 6/300 |
|
|
[考研] 一志愿西南交大,求調(diào)劑 +5 | 材化逐夢(mèng)人 2026-03-18 | 5/250 |
|
|
[考研] 288求調(diào)劑 +16 | 于海海海海 2026-03-19 | 16/800 |
|
|
[考研] 317求調(diào)劑 +5 | 申子申申 2026-03-19 | 9/450 |
|
|
[考研] 290求調(diào)劑 +7 | ^O^乜 2026-03-19 | 7/350 |
|
|
[考研]
|
簡(jiǎn)木ChuFront 2026-03-19 | 8/400 |
|
|
[考研] 260求調(diào)劑 +3 | 朱芷琳 2026-03-20 | 3/150 |
|
|
[考研] 一志愿南理工085701環(huán)境302求調(diào)劑院校 +3 | 葵梓衛(wèi)隊(duì) 2026-03-20 | 3/150 |
|
|
[考研] 生物學(xué)調(diào)劑招人。! +3 | 山海天嵐 2026-03-17 | 4/200 |
|
|
[碩博家園] 湖北工業(yè)大學(xué) 生命科學(xué)與健康學(xué)院-課題組招收2026級(jí)食品/生物方向碩士 +3 | 1喜春8 2026-03-17 | 5/250 |
|
|
[考研] 283求調(diào)劑 +3 | 聽(tīng)風(fēng)就是雨; 2026-03-16 | 3/150 |
|
|
[考研] 一志愿211 0703方向310分求調(diào)劑 +3 | 努力奮斗112 2026-03-15 | 3/150 |
|