AI浪潮席卷而至,藥物研發(fā)如何破解成本與效率的“雙重滯礙”?
投入巨量資源,但新藥研發(fā)的成功率、回報(bào)率卻非常低——藥物研發(fā)早已走入“倒摩爾定律”的“怪圈”。AI如何助力產(chǎn)業(yè)破局?
藥物研發(fā)走入“倒摩爾怪圈”,
AI成為產(chǎn)業(yè)破局關(guān)鍵
一款全新靶點(diǎn)、全新機(jī)制的新藥,其研發(fā)需要經(jīng)過靶點(diǎn)發(fā)現(xiàn)、靶點(diǎn)驗(yàn)證、先導(dǎo)物發(fā)現(xiàn),以及先導(dǎo)物優(yōu)化等階段,這個過程可能需要驗(yàn)證、篩選數(shù)十萬個化合物。此前在藥物研發(fā)行業(yè)一直有一個著名的“雙十定律”,即至少需要10年時間與10億美元,才可能研發(fā)出一款新藥。而按照Nature的統(tǒng)計(jì),“雙十定律”其實(shí)已經(jīng)是一種理想業(yè)態(tài),據(jù)國外某行業(yè)報(bào)告提供的數(shù)據(jù)顯示,一款新藥的平均研發(fā)周期達(dá)10年以上,投入資金則在20億美元左右;即使候選藥物通過I期臨床試驗(yàn),其進(jìn)入市場的可能性也僅約5%左右。投入巨量資源,但新藥研發(fā)的成功率、回報(bào)率卻非常低——藥物研發(fā)早已走入“倒摩爾定律”的“怪圈”(即自1950年起,批準(zhǔn)投資10億美元研發(fā)的新藥數(shù)量每9年就會減半)。
面對制藥發(fā)展過程中面臨的諸多痛點(diǎn),產(chǎn)業(yè)正在積極尋找破題方法。從初期計(jì)算機(jī)輔助藥物設(shè)計(jì)(CADD),發(fā)展到如今的AI輔助藥物研發(fā)(AIDD),在不斷嘗試和探索后,通過AI技術(shù)來破解藥物發(fā)展難題,已經(jīng)逐漸成為行業(yè)共識。來自TechEmergence的報(bào)告顯示,AI可以將新藥研發(fā)的成功率提高到16.7%,AI輔助藥物研發(fā)每年能節(jié)約540億美元的研發(fā)費(fèi)用,并在研發(fā)的主要環(huán)節(jié)節(jié)約40%至60%的時間成本。
AI在這個領(lǐng)域的成功要旨,要?dú)w功于它強(qiáng)大的數(shù)據(jù)分析和深度學(xué)習(xí)能力,使它能夠快速處理和解析大量的生物化學(xué)信息,幫助科學(xué)家篩選出合適的化合物,設(shè)計(jì)、優(yōu)化藥物分子結(jié)構(gòu),從而大幅縮短藥物研發(fā)時間、降低研發(fā)成本并提高成功率。也就是說,AI已經(jīng)按下新藥研發(fā)的“加速鍵”,并為推動產(chǎn)業(yè)發(fā)展乃至人類社會進(jìn)步描摹著更加廣闊的前景。
英特爾:助力AlphaFold2性能提升,
加速開啟藥物研發(fā)新里程
由DeepMind在2021年發(fā)布的AlphaFold2,當(dāng)屬目前AI制藥領(lǐng)域的最重要的算法。它自身在蛋白質(zhì)結(jié)構(gòu)預(yù)測上具有極高的可信度,能夠?qū)τ袡C(jī)體構(gòu)成、運(yùn)行和變化的規(guī)律開展更深層次的詮釋和探究,進(jìn)而可為生物學(xué)、醫(yī)學(xué)、藥學(xué)等領(lǐng)域的未來研究與發(fā)展提供高質(zhì)量的生物學(xué)假設(shè)。2021年,AlphaFold2成功預(yù)測出了超過100萬個物種的2.14億個蛋白質(zhì)結(jié)構(gòu),幾乎涵蓋了地球上所有已知的蛋白質(zhì)。這項(xiàng)成果的誕生,讓科學(xué)已知蛋白質(zhì)3D形狀的查詢工作,從原來的不可能,變得像使用搜索引擎一樣簡單。毫不夸張地說,AlphaFold2憑借自身在蛋白質(zhì)結(jié)構(gòu)預(yù)測上的高可信度,以及遠(yuǎn)優(yōu)于傳統(tǒng)實(shí)驗(yàn)方法的高效率、低成本,樹起了一座“AI for Science”的全新里程碑。它不僅在生命科學(xué)領(lǐng)域掀起了顛覆式的革新,也成為了AI在生物學(xué)、醫(yī)學(xué)和藥學(xué)等領(lǐng)域落地的核心發(fā)力點(diǎn)。
違反常識!CPU速刷AlphaFold2竟能更順暢
隨著越來越多的科研機(jī)構(gòu)、實(shí)驗(yàn)室和企業(yè)開始借助或計(jì)劃采用AlphaFold2進(jìn)行蛋白質(zhì)結(jié)構(gòu)預(yù)測,它亟須更廣泛IT基礎(chǔ)設(shè)施的支持,來推進(jìn)實(shí)實(shí)在在的部署和落地。于是,英特爾開始在有海量用戶安裝和使用的基礎(chǔ)服務(wù)器用至強(qiáng)CPU平臺上對AlphaFold2進(jìn)行端到端的高通量優(yōu)化嘗試,這一試,一切都隨之改變。2022年,英特爾先是報(bào)出第一波優(yōu)化成績——它以第三代至強(qiáng)? 可擴(kuò)展平臺為硬件基座,通過優(yōu)化讓AlphaFold2通量提升達(dá)到了優(yōu)化前的23.11倍。2023年,針對不斷攀升的算力需求,英特爾又出動了第四代至強(qiáng)? 可擴(kuò)展處理器,其新增了全新的內(nèi)置AI加速技術(shù)——英特爾? AMX,可為對于深度學(xué)習(xí)工作負(fù)載來說至關(guān)重要的矩陣乘法提供更優(yōu)的算力支持。這項(xiàng)技術(shù)可助每個核心存儲更大的數(shù)據(jù)塊,并在單個指令操作中完成更多的矩陣運(yùn)算。而且除了算力上的倍增,矩陣運(yùn)算的完全硬件化,還減少對系統(tǒng)緩存和內(nèi)部寄存器等資源占用,保證CPU AI加速流水線運(yùn)行得更加流暢。結(jié)果不負(fù)眾望,第四代至強(qiáng)? 可擴(kuò)展處理器的引入,使得AlphaFold2的通量在第三代至強(qiáng)? 平臺優(yōu)化的基礎(chǔ)上再獲高達(dá)3.02倍的提升。在英特爾開展相關(guān)探索的同時,國內(nèi)已有云服務(wù)廠商也通過與英特爾的合作,在參考英特爾優(yōu)化經(jīng)驗(yàn)的基礎(chǔ)上提出了創(chuàng)新的、基于公有云應(yīng)用和交付方式的方案,并通過一系列測試,得出了基于第四代英特爾? 至強(qiáng)? 可擴(kuò)展處理器的加速方案相比于某主流GPU,在通量上更優(yōu)、在性價比上更為出色的結(jié)果,該團(tuán)隊(duì)還發(fā)現(xiàn),當(dāng)運(yùn)行的任務(wù)序列長度超過300或400個氨基酸的情況時,幾乎只有CPU能夠成功算完,而GPU的失敗率會很高。要知道,AlphaFold2在AI for Science領(lǐng)域一直被認(rèn)為是最吃AI專用加速芯片、如GPU紅利的前沿技術(shù)。上面這些成果的釋出,就意味著CPU也能在AI for Science領(lǐng)域占有一席之地,并發(fā)揮巨大、而且是出乎大家意料的威力。
五大步驟、四大“強(qiáng)芯針”,至強(qiáng)? 可擴(kuò)展平臺助力AlphaFold2推理性能顯著提升
說完成績,我們再來瞧瞧至強(qiáng)CPU是如何實(shí)現(xiàn)這一奇跡的,開篇一句話,即AlphaFold2結(jié)構(gòu)預(yù)測各環(huán)節(jié)面臨著龐大的計(jì)算量,使用者需要更加充分地挖掘硬件的計(jì)算潛力來提升執(zhí)行效率。
因此,針對AlphaFold2的設(shè)計(jì)特點(diǎn),英特爾提供的AlphaFold2端到端全面優(yōu)化方案聚焦在預(yù)處理和模型推理兩個層面,在第三代和第四代英特爾? 至強(qiáng)? 可擴(kuò)展處理器上具體分為:
第一步,預(yù)處理階段:借助第三代或第四代英特爾? 至強(qiáng)? 可擴(kuò)展處理器的多核優(yōu)勢及其內(nèi)置的英特爾? AVX-512技術(shù)的高通量優(yōu)化。
第二步到第五步,模型推理階段:要將深度學(xué)習(xí)模型遷移至面向英特爾? 架構(gòu)優(yōu)化的PyTorch;然后對遷移后的代碼進(jìn)行一系列的API改造,在不改變網(wǎng)絡(luò)拓?fù)涞那疤嵯拢隤yTorch Just-In-Time(JIT)圖編譯技術(shù),將網(wǎng)絡(luò)最終轉(zhuǎn)化為靜態(tài)圖;再切分 Attention 模塊和算子融合;最后借助英特爾? 至強(qiáng)? 可擴(kuò)展平臺提供的高效且更為均衡的計(jì)算和存儲優(yōu)勢破解多實(shí)例運(yùn)算過程中的計(jì)算和內(nèi)存瓶頸。
在基于第四代英特爾? 至強(qiáng)? 可擴(kuò)展處理器的優(yōu)化工作中,英特爾基于:(1)借助TPP技術(shù),降低推理過程中的內(nèi)存消耗、(2)支持DDR5內(nèi)存與大容量緩存帶來張量吞吐提升、(3)英特爾? AMX_BF16在保證精度的前提下加速推理過程、(4)高帶寬內(nèi)存HBM2e增加訪存通量這四劑“強(qiáng)芯針”,讓AlphaFold2的推理性能獲得了更進(jìn)一步的提升。
強(qiáng)強(qiáng)聯(lián)合,英特爾持續(xù)為蛋白質(zhì)結(jié)構(gòu)預(yù)測降本增效
事實(shí)上,除了有內(nèi)置了AI加速技術(shù)的CPU產(chǎn)品用來加速推理,英特爾同樣也有自己的異構(gòu)平臺布局,其專用的AI加速芯片,一樣可以對整個蛋白質(zhì)結(jié)構(gòu)預(yù)測平臺上的各種任務(wù)提供有力的支持,而且性能更好,而這些加速芯片與CPU的組合,就讓英特爾架構(gòu)能夠更好地適合差異化的應(yīng)用場景,顧全推理和訓(xùn)練的需求并更靈活的兼顧在成本和性能上的目標(biāo)。Github上知名的AI+科學(xué)計(jì)算的開源項(xiàng)目——Colossal-AI的團(tuán)隊(duì)就與英特爾Habana技術(shù)團(tuán)隊(duì)合作,充分利用Colossal-AI大模型優(yōu)化能力,推出了使用至強(qiáng)? 可擴(kuò)展處理器進(jìn)行數(shù)據(jù)預(yù)處理,并采用Habana? Gaudi? AI加速器優(yōu)化AlphaFold2模型推理的方案。據(jù)該團(tuán)隊(duì)透露,相比他們此前使用的方案,AlphaFold2端到端推理速度最高提升3.86倍,相較GPU方案,應(yīng)用成本最多降低39%!Colossal-AI團(tuán)隊(duì)上述嘗試中使用的還是Gaudi?芯片,Gaudi?2芯片也已于7月11日正式與用戶們見面。在6月27日剛剛發(fā)布的MLPerf新一期測試報(bào)告中,它已經(jīng)有了先聲奪人的表現(xiàn)——不論是大家已經(jīng)非常熟悉的BERT、ResNet、Unet模型,還是最近半年異軍突起的大語言模型GPT-3、Gaudi?2都有非常靚眼的表現(xiàn)。除了Gaudi?2 這樣的AI專用加速芯片,英特爾更偏向通用加速場景的數(shù)據(jù)中心GPU Max系列,也于近期完成了在美國阿貢實(shí)驗(yàn)室Aurora系統(tǒng)中的安裝工作,它未來可能更適用于AI+科學(xué)計(jì)算的融合式應(yīng)用場景。
不難看出,英特爾未來在AI或整個企業(yè)計(jì)算領(lǐng)域的異構(gòu)多芯布局,已經(jīng)在腳踏實(shí)地地走向現(xiàn)實(shí),就更別提它還會為這些硬件產(chǎn)品搭配可以進(jìn)行統(tǒng)一編程、輕松遷移并能跨異構(gòu)調(diào)度算力資源的oneAPI軟件工具包。業(yè)界有理由期待,它將為我們提供更多也更好的新產(chǎn)品、新技術(shù),對蛋白質(zhì)結(jié)構(gòu)預(yù)測的推理和訓(xùn)練等各種任務(wù),乃至生命科學(xué)和制藥領(lǐng)域的更多科研方向,輸出更有力的支持。有一個方向值得一提,即隨著大模型時代的到來,一直致力于將先進(jìn)AI技術(shù)與前沿生物技術(shù)相結(jié)合的百圖生科,也開始深耕生命科學(xué)大模型驅(qū)動的AIGP(AI Generated Protein)平臺,旨在利用AI從預(yù)測蛋白質(zhì)結(jié)構(gòu)到直接生成和設(shè)計(jì)蛋白質(zhì)。未來,是否還會有更多AI輔助的生命科學(xué)研究和制藥領(lǐng)域的創(chuàng)新?是否還有更多算法可以在生命科學(xué)和醫(yī)藥創(chuàng)新領(lǐng)域里找到機(jī)遇和探索的空間?讓我們拭目以待。(企業(yè)供稿)
如果您對本文涉及的基于Habana? Gaudi? 與英特爾? 至強(qiáng)? 可擴(kuò)展處理器對AlphaFold2進(jìn)行端到端優(yōu)化的技術(shù)細(xì)節(jié)感興趣,如果您也想了解百圖生科在AIGP領(lǐng)域的最新進(jìn)展,英特爾《至強(qiáng)實(shí)戰(zhàn)課》之《AI驅(qū)動的生命科學(xué)與醫(yī)藥創(chuàng)新》將為您帶來更加全面且詳細(xì)的真人講解,歡迎大家注冊收看~
了解更多第四代至強(qiáng)? 可擴(kuò)展平臺對AlphaFold2的優(yōu)化方案,請點(diǎn)擊「此處」