強(qiáng)化學(xué)習(xí)+AI應(yīng)用醫(yī)療大模型準(zhǔn)確性和安全性雙升級

2025-03-12 21:27:01 來源: 科技日報點擊數(shù)：

科技日報記者李禾

近日，國內(nèi)醫(yī)療大模型評測平臺MedBench在官網(wǎng)更新了榜單。多個醫(yī)療AI產(chǎn)品及研究團(tuán)隊入榜，其中螞蟻AI健康管家團(tuán)隊研發(fā)的螞蟻醫(yī)療大模型以評測榜單97.5、自測榜單98.2的分?jǐn)?shù)再度奪得“雙料”冠軍。

MedBench測評結(jié)果顯示，螞蟻醫(yī)療大模型在醫(yī)學(xué)知識問答、醫(yī)學(xué)語言生成、復(fù)雜醫(yī)學(xué)推理三類單項中位居第一，在醫(yī)學(xué)語言理解、醫(yī)療安全和倫理等方面也有突出表現(xiàn)。

據(jù)了解，醫(yī)療行業(yè)是復(fù)雜度較高的領(lǐng)域，醫(yī)療大模型實時評估體系對大模型的應(yīng)用落地尤為關(guān)鍵。螞蟻醫(yī)療健康團(tuán)隊近期完成了基于強(qiáng)化學(xué)習(xí)的新一代醫(yī)療推理模型研發(fā)。AI引擎升級后，該垂直行業(yè)大模型不僅具備“醫(yī)學(xué)思維”推理能力，還能完成“圖、文、音視頻等”多模態(tài)交互。基于此，螞蟻醫(yī)療大模型添加了百億級中英文圖文、千億級醫(yī)療文本語料以及千萬級高質(zhì)量醫(yī)療知識圖譜進(jìn)行專業(yè)知識訓(xùn)練，經(jīng)過醫(yī)患診療、藥廠等真實場景問答的多任務(wù)微調(diào)，以及數(shù)百個專業(yè)醫(yī)學(xué)團(tuán)隊、醫(yī)生標(biāo)注數(shù)據(jù)的強(qiáng)化學(xué)習(xí)。

以醫(yī)學(xué)報告、藥品、毛發(fā)等圖像識別為例，目前該模型準(zhǔn)確率超過90%。在安全性上，該大模型遵循安全隱私標(biāo)準(zhǔn)，從去年7月推出以來，面向行業(yè)開放了配套的“可信一體機(jī)+可信云”解決方案，保障數(shù)據(jù)隱私和算力效率，為醫(yī)院、醫(yī)療機(jī)構(gòu)提供可靠的本地部署與數(shù)據(jù)保護(hù)支持。

責(zé)任編輯：陳可軒

熱點