【ZiDongHua方案應(yīng)用場(chǎng)收錄關(guān)鍵詞:晶泰科技 生命科學(xué)領(lǐng)域 IDEA研究院 藥物研發(fā) 智能自動(dòng)化 AI 人工智能

AI助力抗體結(jié)構(gòu)預(yù)測(cè),晶泰科技與IDEA研究院合作取得重要進(jìn)展

近日,晶泰科技與粵港澳大灣區(qū)數(shù)字經(jīng)濟(jì)研究院(簡(jiǎn)稱 IDEA 研究院)共同宣布:雙方合作項(xiàng)目取得階段性重要進(jìn)展。晶泰科技與 IDEA 研究院聯(lián)合開(kāi)發(fā)了一款基于AI的高通量高精度抗體結(jié)構(gòu)預(yù)測(cè)模型idealFold(IDEa-xtALpi-Fold)。

該模型依托晶泰科技自主搭建的 XupremAb™ 下一代抗體發(fā)現(xiàn)平臺(tái)和 IDEA 研究院的人工智能技術(shù),將先進(jìn)的 AI 算法與大分子藥物研發(fā)專家經(jīng)驗(yàn)有機(jī)結(jié)合,并運(yùn)用于抗體結(jié)構(gòu)預(yù)測(cè)中。

經(jīng)下游任務(wù)的濕實(shí)驗(yàn)驗(yàn)證,idealFold 的預(yù)測(cè)速度和預(yù)測(cè)精度均取得行業(yè)領(lǐng)先水平。高通量且高精度的抗體結(jié)構(gòu)預(yù)測(cè)將對(duì)抗體理性設(shè)計(jì)、可開(kāi)發(fā)性預(yù)測(cè)、超大抗體庫(kù)構(gòu)建等產(chǎn)生積極作用,大大提高抗體藥物的研發(fā)效率。

AlphaFold2 于 2021 年在蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)方面取得突破性進(jìn)展,展示了 AI 在生命科學(xué)領(lǐng)域的應(yīng)用潛力。雖然 AlphaFold2 可以利用不同蛋白間的多重序列比對(duì)( MSA ),實(shí)現(xiàn)對(duì)未知蛋白質(zhì)結(jié)構(gòu)的預(yù)測(cè)[1]。但從進(jìn)化的角度看,抗體并不存在 MSA 信息,較難通過(guò) MSA 實(shí)現(xiàn)抗體結(jié)構(gòu)的預(yù)測(cè),因而 AlphaFold2 在抗體結(jié)構(gòu)預(yù)測(cè)方面的準(zhǔn)確率不夠高,難以得到很好的應(yīng)用落地。

AlphaFold2 的運(yùn)行速度也極大地制約了其在工業(yè)界級(jí)別的藥物發(fā)現(xiàn)中的落地。另外,AI 領(lǐng)域的干實(shí)驗(yàn)指標(biāo)與藥物研發(fā)領(lǐng)域的濕實(shí)驗(yàn)指標(biāo)之間存在鴻溝,僅僅從 AI 角度進(jìn)行算法改進(jìn)常常是難以落地的。舉例來(lái)說(shuō),抗體結(jié)構(gòu)預(yù)測(cè)的 RMSD 等干實(shí)驗(yàn)指標(biāo)的提升并不一定能讓真實(shí)的藥物研發(fā)獲益。

晶泰科技自 2021 年起即與 IDEA 研究院開(kāi)啟戰(zhàn)略合作,設(shè)立 IDEA 晶泰人工智能實(shí)驗(yàn)室。為了解決抗體結(jié)構(gòu)預(yù)測(cè) AI 在大分子藥物研發(fā)領(lǐng)域的落地難題,IDEA 晶泰人工智能實(shí)驗(yàn)室研發(fā)推出了第一代基于 AI 的抗體結(jié)構(gòu)預(yù)測(cè)模型 idealFold。

首先,基于專家經(jīng)驗(yàn)篩選的海量自然抗體數(shù)據(jù)庫(kù)搭建了大型抗體預(yù)訓(xùn)練模型。然后,該模型利用大規(guī)模預(yù)訓(xùn)練模型從無(wú)標(biāo)注蛋白質(zhì)序列數(shù)據(jù)中學(xué)習(xí)到的表征為輸入,搭配基于層次化聚類得到的蛋白質(zhì)殘基生化性質(zhì),建模蛋白質(zhì)序列與空間結(jié)構(gòu)的關(guān)系,避免了使用 MSA 作為輸入,節(jié)省了多序列比對(duì)過(guò)程,極大地提升了模型推理的速度。

抗體結(jié)構(gòu) H3 區(qū)域的長(zhǎng)度高度可變性、結(jié)構(gòu)高度可變一直是抗體結(jié)構(gòu)預(yù)測(cè)的難題, idealFold 通過(guò)引入多重位置編碼信息,包括針對(duì) CDR 區(qū)域的相對(duì)位置編碼和絕對(duì)位置編碼,增強(qiáng)了模型對(duì)抗體不同可變區(qū)的感知能力。idealFold 的單抗版本還集成了增強(qiáng)配對(duì)的特征表示,把抗體的輕重鏈位置信息也放入了配對(duì)特征表示中,提升了模型對(duì)輕鏈和重鏈的區(qū)分能力,從而提升了模型的性能。

經(jīng)過(guò)與同類模型分別在單抗和 VHH 抗體結(jié)構(gòu)預(yù)測(cè)效果的比較,該模型的運(yùn)行速度比當(dāng)前行業(yè)廣泛使用的 IgFold 快93倍,大大提升了 AI 算法預(yù)測(cè)抗體結(jié)構(gòu)的效率。

此外,為了加速該模型的應(yīng)用落地,晶泰科技基于自主搭建的下一代抗體發(fā)現(xiàn)平臺(tái) XupremAb™,將 idealFold 與晶泰科技自研的疏水性預(yù)測(cè)方法結(jié)合,應(yīng)用于 VHH 抗體的疏水性預(yù)測(cè)并進(jìn)行了濕實(shí)驗(yàn)驗(yàn)證。結(jié)果表明,idealFold 的 Spearman 相關(guān)系數(shù)達(dá) 0.82,超過(guò)其他兩個(gè)行業(yè)內(nèi)的主流模型,在真實(shí)的大分子藥物研發(fā)任務(wù)中嶄露頭角。

IDEA 晶泰人工智能實(shí)驗(yàn)室充分利用晶泰科技在醫(yī)藥研發(fā)行業(yè)積累多年的 AI 算法落地經(jīng)驗(yàn),以及 IDEA 研究院在 AI 算法研究方面的優(yōu)勢(shì),旨在通過(guò)智能化、自動(dòng)化驅(qū)動(dòng) AI 算法快速產(chǎn)業(yè)落地,賦能靶點(diǎn)發(fā)現(xiàn)、大分子藥物的高通量篩選以及大分子藥物的從頭設(shè)計(jì)等多個(gè)藥物研發(fā)的重要環(huán)節(jié)。與此同時(shí),在晶泰科技智能計(jì)算、專家經(jīng)驗(yàn)和自動(dòng)化實(shí)驗(yàn)形成的“三位一體”藥物研發(fā)新模式的基礎(chǔ)之上,實(shí)驗(yàn)室通過(guò)“干濕融合”的方式將AI技術(shù)與藥物研發(fā)環(huán)節(jié)緊密結(jié)合,從而形成閉環(huán)式迭代優(yōu)化,為 AI 模型的落地提供多元化應(yīng)用場(chǎng)景,進(jìn)一步加速創(chuàng)新藥物發(fā)現(xiàn)。

李一

晶泰科技戰(zhàn)略發(fā)展副總裁、

抗體業(yè)務(wù)線負(fù)責(zé)人

“我們很榮幸與 IDEA 建立戰(zhàn)略合作關(guān)系。AI 驅(qū)動(dòng)大分子藥物發(fā)現(xiàn)是晶泰科技近兩年來(lái)積極部署的研究方向,致力于將人工智能技術(shù)和自動(dòng)化前沿技術(shù)進(jìn)一步拓展到大分子藥物發(fā)現(xiàn)領(lǐng)域,提高大分子藥物發(fā)現(xiàn)的新穎性和成功率。通過(guò)此次合作,我們希望進(jìn)一步鞏固晶泰科技在人工智能計(jì)算方面的領(lǐng)先優(yōu)勢(shì),依靠晶泰科技在AI制藥行業(yè)累積多年的算法落地經(jīng)驗(yàn),讓 AI 在大分子藥物研發(fā)領(lǐng)域的應(yīng)用進(jìn)一步落地,滿足該領(lǐng)域仍未被滿足的臨床需求,讓患者早日受益。”

幺寶剛

IDEA研究院聯(lián)合實(shí)驗(yàn)室負(fù)責(zé)人

“我們正處于人工智能技術(shù)爆發(fā)的時(shí)代,AI 賦予了我們新的發(fā)展機(jī)遇。IDEA 研究院不僅專注于人工智能技術(shù)研究,而且更希望通過(guò)人工智能技術(shù)驅(qū)動(dòng)各行各業(yè)的發(fā)展,讓更多的人從數(shù)字經(jīng)濟(jì)發(fā)展中獲益。其中,生物醫(yī)藥領(lǐng)域是近些年 AI 落地最直接的應(yīng)用場(chǎng)景之一。我們很榮幸能與全球藥物研發(fā)智能化、自動(dòng)化的行業(yè)開(kāi)拓者晶泰科技合作,期待利用我們?cè)?AI 技術(shù)方面的優(yōu)勢(shì),共同探索更廣闊的大分子序列和結(jié)構(gòu)空間,拓展產(chǎn)業(yè)邊界,讓 AI 賦能大分子藥物發(fā)現(xiàn)。”