| 2 | 1/1 | 返回列表 |
| 查看: 1001 | 回復(fù): 1 | ||
| 本帖產(chǎn)生 1 個(gè) BioEPI ,點(diǎn)擊這里進(jìn)行查看 | ||
xiezhancnu木蟲(chóng) (小有名氣)
|
[求助]
vcf格式疑問(wèn),想請(qǐng)教大神! 已有1人參與
|
|
|
各位好: 請(qǐng)問(wèn)一下 vcf格式中 QUAL這一列 我查了一下是這樣的: QUAL:Phred格式(Phred_scaled)的質(zhì)量值,表示在該位點(diǎn)存在variant的可能性;該值越高,則variant的可能性越大;計(jì)算方法:Phred值 = -10 * log (1-p) p為variant存在的概率; 通過(guò)計(jì)算公式可以看出值為10的表示錯(cuò)誤概率為0.1,該位點(diǎn)為variant的概率為90%。 我想問(wèn)一下 這里p是怎么算出來(lái)的? 我一直對(duì)這個(gè)vcf文件中QUAL是怎么來(lái)的不太明白 想請(qǐng)教 金幣不是問(wèn)題,解釋清楚了,要多少給多少,呵呵~~ |
至尊木蟲(chóng) (著名寫(xiě)手)
|
先看文獻(xiàn)http://www.ncbi.nlm.nih.gov/pubmed/9521921 然后我的理解和你稍微不同,phred不是測(cè)variant,是測(cè)測(cè)序序列的準(zhǔn)確性的。 像你說(shuō)的phred=10,就是在那個(gè)位點(diǎn)得到的堿基有90%的可能性是準(zhǔn)確的 這個(gè)P的計(jì)算有點(diǎn)像machine learning,phred程序中保存了大量的數(shù)據(jù)。這些數(shù)據(jù)來(lái)源于測(cè)已知序列,記錄了測(cè)序波形和精度與正確堿基判斷之間的關(guān)系。然后通過(guò)對(duì)當(dāng)前波形和精度的判斷,在已知數(shù)據(jù)中找匹配值,而得到P。 |
| 2 | 1/1 | 返回列表 |
| 最具人氣熱帖推薦 [查看全部] | 作者 | 回/看 | 最后發(fā)表 | |
|---|---|---|---|---|