3月23日,由前沿科技媒體機器之心主辦的“AI科技年會”上,美國芝加哥豐田計算技術(shù)研究所教授許錦波在演講中宣布歸國加入國家級實驗室,并分享了AI預(yù)測蛋白質(zhì)結(jié)構(gòu)和功能這一新興領(lǐng)域的發(fā)展沿革與最新進展。
許錦波被業(yè)界譽為“AI預(yù)測蛋白質(zhì)結(jié)構(gòu)全球第一人”,早在2016年,他開發(fā)的RaptorX-Contact方法,首次證明了深度學(xué)習(xí)方法預(yù)測蛋白質(zhì)結(jié)構(gòu)的可行性,拉開了AI蛋白質(zhì)結(jié)構(gòu)預(yù)測時代的序幕。谷歌DeepMind開發(fā)的AlphaFold軟件也是基于許錦波團隊前期研究成果。
許錦波表示,準(zhǔn)確描述蛋白質(zhì)的結(jié)構(gòu)和功能,是理解生命過程的基礎(chǔ)。蛋白質(zhì)的結(jié)構(gòu)和功能聯(lián)系緊密,預(yù)測蛋白質(zhì)的結(jié)構(gòu)有助于人們在原子層面了解蛋白質(zhì)的功能。近年來,隨著人工智能的又一次興起,蛋白質(zhì)的結(jié)構(gòu)預(yù)測從傳統(tǒng)的物理和統(tǒng)計方法,快速走向最新的機器學(xué)習(xí)乃至深度學(xué)習(xí)算法。深度學(xué)習(xí)技術(shù)顛覆了蛋白質(zhì)結(jié)構(gòu)預(yù)測,可以正確預(yù)測90%的蛋白質(zhì)形狀,其中50-60%的蛋白質(zhì)可以做到高分辨率預(yù)測,在此基礎(chǔ)上,推動分子生物學(xué)界的研究范式從基于序列的研究到基于結(jié)構(gòu)的研究,進而促進了基于結(jié)構(gòu)的藥物發(fā)現(xiàn)和設(shè)計,提高了蛋白質(zhì)從頭設(shè)計的效率。
眾所周知,細胞是構(gòu)成生命體的基本單位,而蛋白質(zhì)則是構(gòu)成細胞的重要生命物質(zhì),是生命活動的體現(xiàn)者和承擔(dān)者。這其中,蛋白質(zhì)分子的組成及其折疊結(jié)構(gòu),在很大程度上決定了蛋白質(zhì)所具備并正在發(fā)揮的生物學(xué)功能。然而,如何清晰“理解”蛋白質(zhì)的折疊結(jié)構(gòu),是困擾生物學(xué)界的一個“世紀(jì)難題”。一旦解開,人類對于生命的理解將邁出飛躍性的一步。
以當(dāng)下火熱的生物醫(yī)療產(chǎn)業(yè)為例,利用細胞、組織、體液等制造的一系列生物醫(yī)療制品,如單克隆抗體、重組蛋白、疫苗及基因和細胞治療藥物等大分子藥物,因功效普遍較化學(xué)藥更高且毒副作用小,近年來得到醫(yī)療產(chǎn)業(yè)界越來越多的關(guān)注,市場規(guī)模增長率遠高于化學(xué)藥。通過AI對蛋白質(zhì)結(jié)構(gòu)和功能進行預(yù)測,可以幫助人們深入了解包括癌癥、遺傳病等諸多頑疾的發(fā)病機理,進而找到治療更精準(zhǔn)的路徑;同時,借助AI進行蛋白質(zhì)結(jié)構(gòu)優(yōu)化,還可以極大地提升大分子藥物的研發(fā)效率、降低成本。
而除了醫(yī)療產(chǎn)業(yè)以外,由于蛋白質(zhì)可用作為諸如酶和激素之類的生物催化劑,在食品、化工、能源、環(huán)境工程等諸多領(lǐng)域有有著廣泛的應(yīng)用,可想而知,用AI破解蛋白質(zhì)結(jié)構(gòu)之謎、并在此基礎(chǔ)上進行結(jié)構(gòu)設(shè)計和優(yōu)化,可以給未來社會發(fā)展帶來怎樣天翻地覆的變化。
過去的近六年時間里,許錦波在AI蛋白質(zhì)結(jié)構(gòu)預(yù)測領(lǐng)域做出了開創(chuàng)性的貢獻。
2016年,許錦波開發(fā)出基于殘差網(wǎng)絡(luò)(ResNet)的RaptorX-Contact方法,其采用全局式的結(jié)構(gòu)預(yù)測方式,將圖像處理中的圖像分割技術(shù)遷移到蛋白質(zhì)結(jié)構(gòu)預(yù)測領(lǐng)域,采用深度學(xué)習(xí)卷積網(wǎng)絡(luò)對蛋白質(zhì)結(jié)構(gòu)進行整體測算,并通過距離矩陣重構(gòu)蛋白質(zhì)分子三維結(jié)構(gòu),從而大幅度提高了蛋白質(zhì)結(jié)構(gòu)預(yù)測。同年,在被稱為“蛋白質(zhì)結(jié)構(gòu)預(yù)測領(lǐng)域的奧林匹克競賽”——第十二屆國際蛋白質(zhì)結(jié)構(gòu)預(yù)測競賽(CASP,Critical Assessment of protein Structure Prediction)中,RaptorX-Contact在蛋白質(zhì)接觸矩陣的預(yù)測上得分居首位。這一蛋白質(zhì)結(jié)構(gòu)預(yù)測的核心思想得到了谷歌DeepMind團隊的重視,并應(yīng)用在AlphaFold的開發(fā)中。
除了開辟AI蛋白質(zhì)預(yù)測的新思路之外,許錦波團隊還研發(fā)了多個著名的生物信息學(xué)軟件,包括蛋白質(zhì)相互作用網(wǎng)絡(luò)分析軟件IsoRank。去年以來,許錦波團隊繼續(xù)通過使用殘差網(wǎng)絡(luò)(ResNet),在不使用協(xié)同進化(co-evolution)信息的條件下,實現(xiàn)了較高的蛋白質(zhì)結(jié)構(gòu)預(yù)測水平,并在預(yù)測人工設(shè)計的蛋白質(zhì)結(jié)構(gòu)時表現(xiàn)得更為出色。這一研發(fā)成果對蛋白質(zhì)工程和蛋白質(zhì)設(shè)計都具有重要意義。
許錦波教授將加入聚焦生命科學(xué)領(lǐng)域、代表國家戰(zhàn)略科技力量的北京昌平實驗室,并將在此繼續(xù)圍繞蛋白質(zhì)預(yù)測與設(shè)計開展科研攻關(guān)。
請輸入驗證碼