再次拔高上限!夸克健康大模型通過12門主任醫師考試觀點

7月23日消息,夸克健康大模型成功通過中國 12 門核心學科的主任醫師筆試評測,成為國內首個完成這一挑戰的大模型。目前,“主任級 AI 醫生”能力已全面集成至夸克的AI搜索中,用戶在查詢健康問題時,選擇深度搜索即可調用。
7月23日消息,夸克健康大模型成功通過中國 12 門核心學科的主任醫師筆試評測,成為國內首個完成這一挑戰的大模型。目前,“主任級 AI 醫生”能力已全面集成至夸克的AI搜索中,用戶在查詢健康問題時,選擇深度搜索即可調用。
這是繼 5 月通過副主任醫師職稱考試后,夸克健康大模型能力的又一次躍升。在垂類模型與通用模型對比中,夸克健康大模型呈現出難度越高、領先優勢越明顯的性能曲線,展現出在復雜醫學推理任務中的突破。
這揭示了在醫學領域研發垂類模型的巨大潛力。夸克健康大模型以通義千問為基礎,走出了一條面向垂直場景的深度工程化路線。“我們不是在訓練AI回答醫學問題,而是在訓練它學會醫學思維”,夸克健康算法負責人徐健說。
夸克健康大模型的核心突破之一,是構建出“慢思考能力”。該能力融合了鏈式推理與多階段臨床演繹路徑建模,驅動模型在面對復雜醫療問題時,能夠分階段、層層深入地推導出最終回答。
構建慢思考能力的前提,是擁有高質量推理訓練數據。為此,夸克構建了“雙數據產線 + 雙獎勵機制”的工程體系。一方面,將醫學數據劃分為“可驗證”和“不可驗證”兩類,分別對應診斷類任務和健康建議類任務;另一方面,在訓練方法上引入“過程獎勵模型”和“結果獎勵模型”,分別評估模型推理鏈的合理性與最終結論的準確性,顯著提升模型的臨床可解釋性和推理一致性。
該體系還設計了多階段強化學習流程,包括冷啟動數據的嚴格人工校驗、多輪樣本篩選與難度遞進訓練策略,以及用于防止“高分投機”的作弊識別機制。通過真實醫生標注、“問—思—答”整組數據驅動強化學習,夸克健康大模型不僅學會了醫學知識,更掌握了醫學思維的路徑選擇、證據整合與多解平衡能力。底層的權威醫學知識庫確保了模型輸出內容專業、及時。
安貞醫院心臟外科主任醫師謝進生認為,夸克在一些問題上回答專業度比專業醫生還要強。這一成果背后是專業醫師團隊的深度參與。目前,夸克健康大模型擁有千人規模的專業醫師標注團隊,其中超過400名均為副主任醫師及以上的高資歷醫療專家。
憑借在醫學領域的專業性,夸克AI搜索吸引了一大批醫學生和醫生群體。夸克健康運營負責人趙存忠介紹,目前平臺在全國醫學生中月活用戶已突破 200 萬,覆蓋率過半,他們廣泛使用夸克用于基礎知識搜索、考試備考和臨床輔助診療。
1.TMT觀察網遵循行業規范,任何轉載的稿件都會明確標注作者和來源;
2.TMT觀察網的原創文章,請轉載時務必注明文章作者和"來源:TMT觀察網",不尊重原創的行為TMT觀察網或將追究責任;
3.作者投稿可能會經TMT觀察網編輯修改或補充。