XAI大模型Grok-1已正式開(kāi)源 但并不是在馬斯克說(shuō)的上周快訊
xAI官網(wǎng)宣布開(kāi)始發(fā)布的時(shí)間是周日,Grok-1的開(kāi)源時(shí)間仍是在馬斯克所說(shuō)的那一周內(nèi),馬斯克領(lǐng)導(dǎo)的人工智能公司xAI當(dāng)?shù)貢r(shí)間周一在官網(wǎng)宣布。
【TechWeb】3月18日消息,據(jù)外媒報(bào)道,馬斯克領(lǐng)導(dǎo)的人工智能公司xAI當(dāng)?shù)貢r(shí)間周一在官網(wǎng)宣布,他們的大語(yǔ)言模型Grok-1已正式開(kāi)源,發(fā)布了基本模型的權(quán)重和網(wǎng)絡(luò)架構(gòu),有興趣的用戶可通過(guò)github.com/xai-org/grok上的指引使用。

從xAI在官網(wǎng)公布的消息來(lái)看,Grok-1是擁有3140億參數(shù)的混合專家模型。在目前已開(kāi)源的大語(yǔ)言模型中,Grok-1的參數(shù)最多的。
XAI官網(wǎng)的信息還顯示,Grok-1是由他們從頭開(kāi)始訓(xùn)練的模型,此次發(fā)布的是預(yù)訓(xùn)練階段結(jié)束時(shí)的原始基礎(chǔ)模型檢查點(diǎn),預(yù)訓(xùn)練階段在去年10月份完成。這也就意味著他們開(kāi)源的模型,沒(méi)有進(jìn)行針對(duì)對(duì)話等任何具體應(yīng)用的微調(diào)。
在官網(wǎng)上,xAI披露Grok-1是在大量文本數(shù)據(jù)上訓(xùn)練的基礎(chǔ)模型,是xAI團(tuán)隊(duì)使用JAX和Rust編程語(yǔ)言自定義訓(xùn)練棧從零開(kāi)始訓(xùn)練的成果,權(quán)重和架構(gòu)均依照Apache 2.0開(kāi)源許可協(xié)議發(fā)布。
雖然Grok-1已正式開(kāi)源,但在開(kāi)源時(shí)間上,還是要晚于馬斯克此前所宣布的時(shí)間。
馬斯克是上周一,在他所收購(gòu)的社交媒體上宣布Grok大模型將開(kāi)源的,當(dāng)時(shí)他公布的開(kāi)源時(shí)間是上周,xAI官網(wǎng)宣布開(kāi)始發(fā)布的時(shí)間是周日。而包括美國(guó)在內(nèi)的諸多國(guó)家,仍習(xí)慣將周日作為一周的開(kāi)始,止于周六,3月17日是新一周的第一天,這也就意味著Grok-1并未如馬斯克此前在社交媒體上所公布的那樣,在上周開(kāi)源。
不過(guò),按照國(guó)際標(biāo)準(zhǔn)化組織在ISO 8601國(guó)際標(biāo)準(zhǔn)中給出的日歷星期表示方法,每個(gè)日歷星期是始于周一,止于周日。如果按照這一標(biāo)準(zhǔn),Grok-1的開(kāi)源時(shí)間仍是在馬斯克所說(shuō)的那一周內(nèi)。
1.TMT觀察網(wǎng)遵循行業(yè)規(guī)范,任何轉(zhuǎn)載的稿件都會(huì)明確標(biāo)注作者和來(lái)源;
2.TMT觀察網(wǎng)的原創(chuàng)文章,請(qǐng)轉(zhuǎn)載時(shí)務(wù)必注明文章作者和"來(lái)源:TMT觀察網(wǎng)",不尊重原創(chuàng)的行為TMT觀察網(wǎng)或?qū)⒆肪控?zé)任;
3.作者投稿可能會(huì)經(jīng)TMT觀察網(wǎng)編輯修改或補(bǔ)充。