新AI模型成功預測有害基因突變
有助確定遺傳疾病病因
科技日報北京9月20日電 (記者劉霞)英國“深度思維”(DeepMind)公司的人工智能工具“阿爾法錯義”(AlphaMissense)已對2萬種人類蛋白質(zhì)中的7100萬種可能的錯義突變進行了檢測,通過找出哪些小突變可能具有破壞性,來幫助醫(yī)生確定導致遺傳疾病的“罪魁禍首”。相關論文刊發(fā)于最新一期《科學》雜志。
幾乎每個人出生時都攜帶有50—100個父母沒有的突變,這導致了個體之間巨大的基因差異。對醫(yī)生來說,對某個病人的基因組進行測序以找出病因極具挑戰(zhàn)性,因為可能有成千上萬個突變與這種疾病有關!鞍柗ㄥe義”應運而生,旨在預測這些基因突變是否有害。
由于堿基置換,與某一氨基酸相對應的密碼子變成其他氨基酸的密碼子,其結(jié)果使合成的蛋白質(zhì)的活性發(fā)生變化或失去活性,這樣的突變稱為錯義突變。每人體內(nèi)平均攜帶約9000個錯義突變,但在所有可能發(fā)生的7100萬個錯義突變中,科學家只確定了其中0.1%的錯義突變的影響。
“阿爾法錯義”并非要厘清錯義突變?nèi)绾胃淖兊鞍踪|(zhì)的結(jié)構(gòu)或穩(wěn)定性,以及與其他蛋白質(zhì)之間的相互作用。相反,它會將每種可能的突變蛋白質(zhì)的序列與“阿爾法折疊”(AlphaFold)訓練過的蛋白質(zhì)的序列進行比較,查看它看起來是否“自然”,看起來“不自然”的蛋白質(zhì)會被評為潛在有害。
在對已知突變開展測試時,“阿爾法錯義”的表現(xiàn)優(yōu)于其他方法。研究人員評論道,“阿爾法錯義”在幾項不同的性能測試中“表現(xiàn)優(yōu)異”,將有助于科學家確定哪些致病突變應優(yōu)先研究。不過,錯義突變只是眾多不同突變中的一種。DNA片段也可以被添加、刪除、復制、翻轉(zhuǎn)等。此外,許多致病突變不會改變蛋白質(zhì),而是出現(xiàn)在參與調(diào)節(jié)基因活性的序列附近,在確定病因時也需要考慮這些因素。