瀾舟科技開源孟子3-13B大模型,0門檻可商用快訊
導讀
Mengzi3-13B在數據集質量上有了顯著的提升,在MMLU、Chinese-MMLU、GSM8K、HUMAN-EVAL等多項公開數據集進行的模型效果評估中,相較于今年1月發布的孟子大模型GPT V2系列(包括孟子大模型-標準、孟子大模型-輕量、孟子大模型-金融、孟子大模型-編碼)。
【TechWeb】4月1日消息,瀾舟科技正式宣布Mengzi3-13B開源!對學術研究完全開放,同時支持免費商用。
相較于今年1月發布的孟子大模型GPT V2系列(包括孟子大模型-標準、孟子大模型-輕量、孟子大模型-金融、孟子大模型-編碼),Mengzi3-13B在數據集質量上有了顯著的提升。其采用的Mengzi-3數據集規模高達3T tokens,涵蓋了網頁、代碼、書籍、論文等多元化、高質量的數據來源。
在MMLU、Chinese-MMLU、GSM8K、HUMAN-EVAL等多項公開數據集進行的模型效果評估中,Mengzi3-13B均展現出了卓越的性能表現。在參數量20B以內的輕量化大模型領域,Mengzi3-13B在中英文語言能力方面的成績尤為突出,具備了出色的實用性和高性價比,能更好的滿足企業的商業化需求。
1.TMT觀察網遵循行業規范,任何轉載的稿件都會明確標注作者和來源;
2.TMT觀察網的原創文章,請轉載時務必注明文章作者和"來源:TMT觀察網",不尊重原創的行為TMT觀察網或將追究責任;
3.作者投稿可能會經TMT觀察網編輯修改或補充。