國內首例!由釘釘AI平臺訓練的豆蔻大模型通過婦產科主任醫師考試觀點

7月28日,壹生檢康(杭州)生命科技有限公司研發的 “豆蔻婦科大模型” 成功通過國家婦產科衛生高級職稱(正高)筆試考試,成為國內首個由創業公司在釘釘企業專屬AI平臺上訓練達到該專業標準的垂直醫療模型。
7月28日,壹生檢康(杭州)生命科技有限公司研發的 “豆蔻婦科大模型” 成功通過國家婦產科衛生高級職稱(正高)筆試考試,成為國內首個由創業公司在釘釘企業專屬AI平臺上訓練達到該專業標準的垂直醫療模型。這一突破性成果不僅標志著醫療垂直領域大模型研發實現關鍵跨越,更以鮮明的示范效應為行業提供了可復制的創新路徑。
短時間從無到優,為行業打造專屬大模型提供樣本
從技術攻堅到成果落地,豆蔻婦科大模型短時間內便完成從無到優的研發訓練,并達到專業資質標準。這一高效突破打破了 “垂直領域大模型研發依賴高投入、長周期” 的固有認知,證明中小型團隊完全能夠在專業訓練平臺支持下,通過科學的訓練方法、高質量的領域數據與聚焦式技術攻堅,快速打造出達到頂尖專業水平的專屬大模型。
作為技術突破的核心支撐,豆蔻婦科大模型以先進的基礎模型為起點,依托釘釘企業專屬 AI 平臺和專業服務,通過高質量婦產科數據構建與多階段優化訓練方法實現性能躍升。
釘釘CTO朱鴻表示,豆蔻婦科大模型是釘釘AI平臺上誕生的第一個專業垂類大模型,雙方團隊只經過短短一個多月的協作,就將模型準確率提升到了90.2%,并成功通過專業考試。這驗證了釘釘幫助千行萬業企業打造專屬大模型的能力。“釘釘正不斷完善行業/企業大模型建設支持體系,打造AI大模型按效果付費的模式,幫助更多像壹生檢康一樣的行業企業真正落地AI應用。”朱鴻說。
豆蔻婦科大模型的研發過程中,壹生檢康和釘釘采用了“精準標注的高質量醫療數據+定制化訓練工具+高效訓練流程及方法”的技術路徑,使得豆蔻婦科大模型能夠快速迭代,也顯著提升了模型的準確性和穩定性,使其在復雜臨床場景中表現出色。豆蔻婦科大模型從數據準備、預處理到性能不斷優化過程中的實踐,為醫療乃至更多行業打造專業專屬大模型提供了可復制的參考案例。
專業性超通用模型,豆蔻婦科大模型推動AI醫療普惠
國家婦產科衛生高級職稱(正高)考試是衡量婦產科醫生專業水準的金標準。該考試不僅涵蓋女性生殖系統解剖學、臨床婦產科學、生殖內分泌等 12 大核心學科知識,更著重考察復雜病例診斷、高難度手術方案設計等實戰能力,要求應試者具備數十年臨床積累的“臨床直覺”。
本次筆試測評嚴格采用國家衛健委指定的人衛版《婦產科高級職稱考試全真模擬卷》,考試范圍覆蓋臨床婦產科學、婦科腫瘤、圍產期醫學、生殖內分泌、計劃生育等 12 個核心學科,題型包含多選題(占比 40%)和案例分析題(占比 60%)兩大題型。其中,案例分析題要求模型根據患者主訴、檢查報告等多源信息,解決臨床診斷、鑒別診斷、治療方案等問題,全面考察臨床決策能力,需要全部正確才能得分,評判標準高于人類實際考試標準。多選題正確率: 75.56%,案例分析題(不定項)正確率: 59.01% ,最終正確率: 64.94%,無論是多選題還是案例分析題正確率都要優于多個模型。為確保結果可靠性,團隊采用三套獨立試卷取平均分的驗證方法進行驗證。
(對比基于同份的考卷)
“通過正高考試,意味著該模型已具備主任級醫師的專業判斷力。”壹生檢康創始人王強宇強調,“我的實踐證明,中小企業也能出訓練高精度的大模型。”不過,王強宇也表示,大模型不會取代婦產科醫生。其核心價值體現在:為女性用戶提供居家自診斷支持,實現“術前分流”與“院外健康管理”;針對無需就診的情況提供科普指導與生活建議;為醫療、醫美等行業機構提供專業支撐,提升婦科服務質量,同時可通過機構的數據訓練專科模型,讓患者預問診享受頂尖專家水平服務,提升醫療效率。
業內專家表示:“這一突破為 AI 在婦產科臨床決策輔助、循證醫學研究、患者健康教育、醫學生學習考試等場景的深度應用開辟了新路徑。”浙江大學醫學院附屬婦產科醫院婦科周博士也對該模型給予了高度評價:“這一突破將為我們的工作帶來極大便利,有助于提高診斷效率和準確性” 。
隨著技術的不斷完善和推廣,豆蔻婦科大模型不僅有望在更多醫療場景中發揮重要作用,還將進一步優化醫療資源配置,緩解優質婦科醫療資源分布不均的問題。未來,該模型還將與更多醫療機構合作,推動醫療行業的智能化、高效化發展,為更多女性患者帶來福音。
1.TMT觀察網遵循行業規范,任何轉載的稿件都會明確標注作者和來源;
2.TMT觀察網的原創文章,請轉載時務必注明文章作者和"來源:TMT觀察網",不尊重原創的行為TMT觀察網或將追究責任;
3.作者投稿可能會經TMT觀察網編輯修改或補充。