4月7日,斯坦福以人為本人工智能研究所(HAI)發(fā)布《2025年AI指數(shù)報(bào)告》,這份長(zhǎng)達(dá)456頁的報(bào)告,全景展示了過去一年AI領(lǐng)域的關(guān)鍵進(jìn)展。
以人為本人工智能研究所是斯坦福大學(xué)于2019 年成立的跨學(xué)科研究機(jī)構(gòu),由“AI教母”李飛飛聯(lián)合領(lǐng)導(dǎo),其每年發(fā)布的“AI指數(shù)報(bào)告”成為全球人士了解人工智能前沿發(fā)展的核心文件。
具體來看,今年的報(bào)告共列了研究與開發(fā)、技術(shù)性能、負(fù)責(zé)任的AI、經(jīng)濟(jì)、科學(xué)與醫(yī)學(xué)、政策與治理、教育等8個(gè)章節(jié),其中科學(xué)與醫(yī)學(xué)占據(jù)43頁內(nèi)容。
在科學(xué)與醫(yī)學(xué)中,報(bào)告重點(diǎn)介紹了2024年醫(yī)學(xué)和生物學(xué)領(lǐng)域的AI里程碑,展示了AI在醫(yī)學(xué)影像、臨床試驗(yàn)、輔助診斷等領(lǐng)域的進(jìn)展,彰顯出AI在醫(yī)療保健的關(guān)鍵影響。
其中包括以下要點(diǎn):
-
更大更好的蛋白質(zhì)測(cè)序模型出現(xiàn):2024年,包括ESM3和AlphaFold 3在內(nèi)的幾個(gè)大規(guī)模、高性能蛋白質(zhì)測(cè)序模型被推出。
-
AI繼續(xù)推動(dòng)科學(xué)發(fā)現(xiàn)的快速進(jìn)步:2022年和2023年標(biāo)志著AI驅(qū)動(dòng)科學(xué)的早期階段,2024年帶來了更大的進(jìn)展。
-
領(lǐng)先AI模型的臨床知識(shí)持續(xù)提升:OpenAI最近發(fā)布的o1在MedQA基準(zhǔn)測(cè)試中達(dá)到新的最先進(jìn)水平96.0%——比2023年的最佳成績(jī)提高了5.8個(gè)百分點(diǎn)。
-
AI在關(guān)鍵臨床任務(wù)上超越了醫(yī)生:一項(xiàng)新研究發(fā)現(xiàn),僅GPT-4就能在診斷復(fù)雜臨床病例方面勝過醫(yī)生。其他研究顯示,AI在癌癥檢測(cè)和識(shí)別高死亡風(fēng)險(xiǎn)患者方面也超過了醫(yī)生。
-
FDA批準(zhǔn)的AI醫(yī)療設(shè)備數(shù)量激增:FDA于1995年首次批準(zhǔn)了人工智能驅(qū)動(dòng)的醫(yī)療設(shè)備。到2015年,只有6種這樣的設(shè)備獲得批準(zhǔn),但到2023年,這一數(shù)字飆升至223種。
-
合成數(shù)據(jù)在醫(yī)學(xué)領(lǐng)域顯示出巨大的潛力:2024年發(fā)布的研究表明,人工智能生成的合成數(shù)據(jù)可以幫助模型更好地識(shí)別健康的社會(huì)決定因素,增強(qiáng)隱私保護(hù)的臨床風(fēng)險(xiǎn)預(yù)測(cè),并促進(jìn)新藥化合物的發(fā)現(xiàn)
-
醫(yī)學(xué)出現(xiàn)基礎(chǔ)模型:一批醫(yī)學(xué)大模型于2024年發(fā)布,從通用多模態(tài)模型Med-Gemini到垂類專業(yè)模型EchoCLIP(心電圖學(xué))和ChexAgent(放射學(xué))。
-
公開的蛋白質(zhì)數(shù)據(jù)庫規(guī)模不斷擴(kuò)大:自2021年以來,主要公共蛋白質(zhì)科學(xué)數(shù)據(jù)庫的條目數(shù)量顯著增加,這對(duì)科學(xué)發(fā)現(xiàn)具有重要意義。
今年1月,李飛飛在接受采訪時(shí)稱,她對(duì)AI在醫(yī)療健康領(lǐng)域的應(yīng)用充滿熱情,“這是一個(gè)龐大的行業(yè),從基礎(chǔ)生物學(xué)研究,到臨床診斷、醫(yī)療服務(wù)和公共衛(wèi)生……令人振奮的是,在這個(gè)系統(tǒng)的每個(gè)環(huán)節(jié),AI都能發(fā)揮重要作用?!?
對(duì)AI醫(yī)療的看好,已經(jīng)成為精英們的共識(shí),此前木頭姐表示醫(yī)療保健將成為AI最為深遠(yuǎn)的應(yīng)用領(lǐng)域,甲骨文CEO拉里·埃里森、OpenAI首席執(zhí)行官Sam Altman也以實(shí)際行動(dòng)支持AI醫(yī)療發(fā)展。
得益于AI技術(shù)的發(fā)展,醫(yī)療健康領(lǐng)域正在經(jīng)歷一場(chǎng)深刻革命。
2024,AI醫(yī)療有哪些里程碑?
在“科學(xué)與醫(yī)學(xué)”章節(jié)的開頭,報(bào)告細(xì)數(shù)了過去一年AI在醫(yī)療和生物學(xué)領(lǐng)域的里程碑成果。
蛋白質(zhì)序列優(yōu)化:大語言模型來助力
盡管并非有意為之,但語言模型最近獲得了一項(xiàng)新的生物能力:優(yōu)化蛋白質(zhì)序列。
傳統(tǒng)上,蛋白質(zhì)工程需要大量的實(shí)驗(yàn)室研究來改進(jìn)序列以提高功能。然而,最近的一項(xiàng)研究發(fā)現(xiàn),未經(jīng)微調(diào)的語言模型在這一任務(wù)上變得異常有效。
研究人員采用定向進(jìn)化的方法證明,語言模型能夠生成在合成和實(shí)驗(yàn)適應(yīng)度景觀中均優(yōu)于傳統(tǒng)算法的蛋白質(zhì)序列。
Aviary:為生物學(xué)任務(wù)訓(xùn)練Agent
FutureHouse是一家旨在實(shí)現(xiàn)科學(xué)發(fā)現(xiàn)過程自動(dòng)化的公司,去年公司發(fā)布了Aviary,這是一個(gè)能夠執(zhí)行生物學(xué)研究中多步驟任務(wù)的代理,有望實(shí)現(xiàn)智力任務(wù)的自動(dòng)化。
在Aviary框架下,AI Agent已經(jīng)可以執(zhí)行“操縱DNA 結(jié)構(gòu)進(jìn)行分子克隆、通過查閱科學(xué)文獻(xiàn)來回答研究問題、構(gòu)建蛋白質(zhì)穩(wěn)定性”等具有挑戰(zhàn)性的科學(xué)任務(wù)。
結(jié)果顯示,Aviary的支持下,基于開源大語言模型構(gòu)建的智能體已經(jīng)可以在多個(gè)任務(wù)上比肩甚至超越人類專家,為科學(xué)探索的自動(dòng)化進(jìn)一步鋪平道路。
AlphaProteo:AI用于新型高親和力蛋白結(jié)合劑
AlphaProteo是谷歌DeepMind開發(fā)的模型,專注于創(chuàng)建能夠與特定目標(biāo)分子結(jié)合的新型高親和力蛋白結(jié)合劑。
AlphaProteo設(shè)計(jì)了多個(gè)目標(biāo)蛋白的首個(gè)結(jié)合劑,包括與癌癥和糖尿病相關(guān)的VEGF-A蛋白,在測(cè)試的七個(gè)目標(biāo)蛋白上比現(xiàn)有任何方法的有效性高出300倍。
AlphaProteo的結(jié)合劑也比使用現(xiàn)有最先進(jìn)設(shè)計(jì)方法創(chuàng)建的結(jié)合劑牢固約10倍,這是一項(xiàng)真正的生物工程突破,該模型正被用于藥物開發(fā)、診斷和生物技術(shù)應(yīng)用。
人腦圖譜:重建人類大腦的一小部分
谷歌的一個(gè)團(tuán)隊(duì)在突觸水平上重建了人類大腦的一小部分——《連線》雜志稱贊這是“迄今為止最詳細(xì)的腦連接圖”。
該樣本取自一名癲癇患者手術(shù)中左側(cè)前顳葉,使用多束掃描電子顯微鏡成像。超過5000個(gè)薄約30納米的切片捕捉到了約57000個(gè)細(xì)胞——包括神經(jīng)元、膠質(zhì)細(xì)胞和血管——以及1.5億個(gè)突觸。
該項(xiàng)目標(biāo)志著在理解神經(jīng)回路方面邁出了重要一步,并可能為未來的神經(jīng)治療提供參考。
虛擬AI實(shí)驗(yàn)室:加強(qiáng)生物醫(yī)學(xué)研究
最近斯坦福大學(xué)引入了一個(gè)虛擬的人工智能實(shí)驗(yàn)室,在這個(gè)實(shí)驗(yàn)室中,多位“AI科學(xué)家”專注于不同的學(xué)科,并作為自主代理進(jìn)行協(xié)作。
在實(shí)驗(yàn)中,人類研究員委托這個(gè)AI實(shí)驗(yàn)室設(shè)計(jì)能夠與導(dǎo)致病毒結(jié)合的納米抗體片段,該實(shí)驗(yàn)室生成了92個(gè)納米抗體,其中超過90%在驗(yàn)證研究中成功與病毒結(jié)合。
這項(xiàng)研究的真正意義不在于其具體發(fā)現(xiàn),而在于證明了一個(gè)完全自主的、由語言模型驅(qū)動(dòng)的實(shí)驗(yàn)室可以產(chǎn)生有意義的科學(xué)發(fā)現(xiàn)。
GluFormer:使用AI進(jìn)行持續(xù)血糖監(jiān)測(cè)
GluFormer是由英偉達(dá)、魏茨曼研究所等機(jī)構(gòu)開發(fā)的基礎(chǔ)模型,基于近11000名個(gè)體的超過1000萬次血糖測(cè)量數(shù)據(jù)訓(xùn)練而成,通過分析連續(xù)血糖監(jiān)測(cè)(CGM)數(shù)據(jù)來預(yù)測(cè)長(zhǎng)期健康結(jié)果。
GluFormer可以在癥狀出現(xiàn)之前識(shí)別出有糖尿病風(fēng)險(xiǎn)或血糖控制惡化的個(gè)體。在一項(xiàng)為期12年、涉及580名成年人的研究中,它準(zhǔn)確地標(biāo)記了66%的新發(fā)糖尿病病例和69%的心血管相關(guān)死亡病例。
像GluFormer這樣的模型將使糖尿病護(hù)理從被動(dòng)治療轉(zhuǎn)向主動(dòng)預(yù)防,從而實(shí)現(xiàn)更早的臨床干預(yù)。
ESM3:模擬進(jìn)化過程以生成新的蛋白質(zhì)
EvolutionaryScale的ESM3是一種開創(chuàng)性的模型,基于27.8億個(gè)蛋白質(zhì)序列進(jìn)行了訓(xùn)練,擁有980億個(gè)參數(shù),旨在通過模擬進(jìn)化過程生成新型蛋白質(zhì)。
ESM3最顯著的成就之一是設(shè)計(jì)了esmGFP,這是一種新的人工綠色熒光蛋白,公司估計(jì)自然界需要5億年才能發(fā)展出這種蛋白。這是通過人類引導(dǎo)的思維鏈提示實(shí)現(xiàn)的。
ESM3還是開源的,促進(jìn)了合成生物學(xué)和蛋白質(zhì)工程項(xiàng)目的合作,應(yīng)用于藥物發(fā)現(xiàn)、材料科學(xué)和環(huán)境工程。
AlphaFold3:預(yù)測(cè)所有生命分子的結(jié)構(gòu)和相互作用
谷歌DeepMind和Isomorphic Lab的最新成果——AlphaFold 3,不僅預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu),還更精確地模擬其與關(guān)鍵生物分子(DNA、RNA、配體、抗體)的相互作用。
AlphaFold 3通過建模小分子與蛋白質(zhì)的相互作用,加速了藥物開發(fā),這對(duì)于疾病研究至關(guān)重要。此外,AlphaFold 3的開源賦予了全球科學(xué)家力量。
AI席卷醫(yī)療:從研發(fā)到臨床
蛋白質(zhì),是AI賦能生命科學(xué)的核心領(lǐng)域,過去一年,應(yīng)用于蛋白質(zhì)序列的AI模型取得了顯著進(jìn)展。
一個(gè)明顯的趨勢(shì)是模型的訓(xùn)練規(guī)模越來越大,這些由AI驅(qū)動(dòng)的方法通過減少對(duì)昂貴且耗時(shí)的實(shí)驗(yàn)方法的依賴,加速了蛋白質(zhì)功能和設(shè)計(jì)的探索。
這一過程中,各種公共蛋白質(zhì)科學(xué)數(shù)據(jù)庫中的條目數(shù)量也隨著時(shí)間的推移穩(wěn)步增長(zhǎng)。這些數(shù)據(jù)庫成為研究者不可或缺的工具,然而保持?jǐn)?shù)據(jù)質(zhì)量和防止模型偏差仍然是持續(xù)的挑戰(zhàn)。
目前,AI驅(qū)動(dòng)的蛋白質(zhì)研究數(shù)量顯著增長(zhǎng),這些研究集中在功能預(yù)測(cè)(8.4%)、蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)(7.6%)和蛋白質(zhì)-藥物相互作用(3.0%)等幾個(gè)關(guān)鍵領(lǐng)域。
此外,圖像和多模態(tài)的人工智能也被用于科學(xué)發(fā)現(xiàn),冷凍電鏡、高通量熒光顯微鏡和全切片成像技術(shù)的進(jìn)步,使科學(xué)家能夠以高精度檢查和分析原子、亞細(xì)胞環(huán)境及組織水平的結(jié)構(gòu),揭示復(fù)雜生物過程的新見解。
在藥物研發(fā)流程中,臨床試驗(yàn)是最為耗時(shí)且花費(fèi)最大的階段,近年來運(yùn)用AI的臨床試驗(yàn)數(shù)量正在穩(wěn)步上升。
去年,中國(guó)AI臨床試驗(yàn)的數(shù)量達(dá)到105項(xiàng),超過美國(guó)(97項(xiàng))排名世界第一,緊隨其后的是意大利(42項(xiàng))、土耳其(30項(xiàng))、英國(guó)(24項(xiàng))等。
臨床方面,AI在醫(yī)學(xué)影像領(lǐng)域的應(yīng)用正在迅速發(fā)展,擴(kuò)展到新的數(shù)據(jù)模式,并解決日益復(fù)雜的臨床問題。
統(tǒng)計(jì)顯示,超過80%的FDA批準(zhǔn)的機(jī)器學(xué)習(xí)軟件都針對(duì)醫(yī)學(xué)圖像的分析。近年來,醫(yī)學(xué)影像領(lǐng)域的大模型急劇增加,尤其是病理領(lǐng)域,基礎(chǔ)模型數(shù)量顯著增加。
然而,盡管該領(lǐng)域取得了一些成績(jī),許多醫(yī)學(xué)影像中的AI仍然依賴于高度有限的訓(xùn)練數(shù)據(jù)集,特別是在三維成像領(lǐng)域。
為了訓(xùn)練更為穩(wěn)健的醫(yī)學(xué)影像AI模型,需要更大、更全面且多隊(duì)列的數(shù)據(jù)集,通過提升高質(zhì)量、標(biāo)記好的訓(xùn)練數(shù)據(jù)的可用性,預(yù)計(jì)模型性能會(huì)得到增強(qiáng)。
此外,在臨床實(shí)踐中,大語言模型的崛起為醫(yī)學(xué)決策、輔助診斷、患者護(hù)理、病歷管理等方面帶來變革。
一個(gè)具有代表性的情況便是AI在MedQA基準(zhǔn)測(cè)試(其中包含超過60000個(gè)臨床問題)的表現(xiàn)已顯著提升。
微軟和OpenAI的研究團(tuán)隊(duì)最近測(cè)試了o1,取得了新的最高分96.0%——比2023年創(chuàng)下的記錄提高了5.8個(gè)百分點(diǎn)。自2022年底以來,基準(zhǔn)測(cè)試的表現(xiàn)提高了28.4個(gè)百分點(diǎn)。
行業(yè)對(duì)語言模型在醫(yī)療保健任務(wù)上的興趣激增,在PubMed中“大型語言模型”一詞的檢索結(jié)果為1566篇,僅2024年就發(fā)表了1210篇。
目前大語言模型已經(jīng)在臨床決策上展現(xiàn)出強(qiáng)大實(shí)力,一項(xiàng)涉及92名醫(yī)生的隨機(jī)對(duì)照試驗(yàn)顯示,GPT-4獨(dú)立運(yùn)行的決策水平與使用GPT-4進(jìn)行輔助決策的人類醫(yī)生表現(xiàn)相當(dāng)。
臨床文檔長(zhǎng)期以來一直是醫(yī)生沉重負(fù)擔(dān)的來源,如今AI正在解決這一難題。
斯坦福大學(xué)的研究人員進(jìn)行了一項(xiàng)完全集成的自動(dòng)化AI速記系統(tǒng)測(cè)試,結(jié)果顯示醫(yī)生的采用率高達(dá)55%,AI速記使得每條記錄節(jié)省了約30秒的時(shí)間,醫(yī)生的負(fù)擔(dān)和倦怠分別平均減少了35%和26%。
這些發(fā)現(xiàn)表明,由AI驅(qū)動(dòng)的速記技術(shù)可以顯著改善醫(yī)生的工作流程和福祉,既節(jié)省時(shí)間又減輕行政負(fù)擔(dān)。
報(bào)告進(jìn)一步表示,AI融入電子健康記錄系統(tǒng)可以簡(jiǎn)化臨床工作流程,提升醫(yī)護(hù)人員和患者的體驗(yàn)并減輕醫(yī)療負(fù)擔(dān)。主要供應(yīng)商——Epic、Oracle Health、Meditech和TruBridge已廣泛采用AI。
近年來AI在醫(yī)療保健中的顯著影響,從FDA授權(quán)數(shù)量也能得到體現(xiàn)。
統(tǒng)計(jì)顯示,自2015年起,FDA每年批準(zhǔn)的AI醫(yī)療器械數(shù)量呈現(xiàn)指數(shù)級(jí)增長(zhǎng),到2023年已達(dá)到223款。