科技日報記者 李禾
近日,國內(nèi)醫(yī)療大模型評測平臺MedBench在官網(wǎng)更新了榜單。多個醫(yī)療AI產(chǎn)品及研究團(tuán)隊入榜,其中螞蟻AI健康管家團(tuán)隊研發(fā)的螞蟻醫(yī)療大模型以評測榜單97.5、自測榜單98.2的分?jǐn)?shù)再度奪得“雙料”冠軍。
MedBench測評結(jié)果顯示,螞蟻醫(yī)療大模型在醫(yī)學(xué)知識問答、醫(yī)學(xué)語言生成、復(fù)雜醫(yī)學(xué)推理三類單項中位居第一,在醫(yī)學(xué)語言理解、醫(yī)療安全和倫理等方面也有突出表現(xiàn)。
據(jù)了解,醫(yī)療行業(yè)是復(fù)雜度較高的領(lǐng)域,醫(yī)療大模型實時評估體系對大模型的應(yīng)用落地尤為關(guān)鍵。螞蟻醫(yī)療健康團(tuán)隊近期完成了基于強(qiáng)化學(xué)習(xí)的新一代醫(yī)療推理模型研發(fā)。AI引擎升級后,該垂直行業(yè)大模型不僅具備“醫(yī)學(xué)思維”推理能力,還能完成“圖、文、音視頻等”多模態(tài)交互。基于此,螞蟻醫(yī)療大模型添加了百億級中英文圖文、千億級醫(yī)療文本語料以及千萬級高質(zhì)量醫(yī)療知識圖譜進(jìn)行專業(yè)知識訓(xùn)練,經(jīng)過醫(yī)患診療、藥廠等真實場景問答的多任務(wù)微調(diào),以及數(shù)百個專業(yè)醫(yī)學(xué)團(tuán)隊、醫(yī)生標(biāo)注數(shù)據(jù)的強(qiáng)化學(xué)習(xí)。
以醫(yī)學(xué)報告、藥品、毛發(fā)等圖像識別為例,目前該模型準(zhǔn)確率超過90%。在安全性上,該大模型遵循安全隱私標(biāo)準(zhǔn),從去年7月推出以來,面向行業(yè)開放了配套的“可信一體機(jī)+可信云”解決方案,保障數(shù)據(jù)隱私和算力效率,為醫(yī)院、醫(yī)療機(jī)構(gòu)提供可靠的本地部署與數(shù)據(jù)保護(hù)支持。