馬斯克旗下xAI今日中午發(fā)布Grok 3 消息稱具備自我糾正機(jī)制和強(qiáng)化學(xué)習(xí)能力快訊
xAI在訓(xùn)練Grok 3的合成數(shù)據(jù)集,xAI在訓(xùn)練Grok 3的過程中,減少了訓(xùn)練時間。
【TechWeb】2月18日消息,據(jù)外媒報道,xAI的領(lǐng)導(dǎo)者馬斯克當(dāng)?shù)貢r間周日已在社交媒體上表示,新一代的大語言模型Grok 3,將在太平洋時間周一晚8點(diǎn)發(fā)布,將是地球上最聰明的人工智能。

太平洋時間周一晚8點(diǎn),對應(yīng)的北京時間是周二中午12點(diǎn),這也就意味著xAI Grok 3的發(fā)布會,在今日中午就將正式開始。
隨著發(fā)布時間的臨近,外媒也在報道中給出了大量有關(guān)這一款大語言模型的更多信息,包括訓(xùn)練中提供的算力、訓(xùn)練的數(shù)據(jù)來源、具備的功能等。
在算力方面,有外媒在報道中xAI僅花費(fèi)8個月就建成的Colossus超級計算機(jī),加快了Grok 3的開發(fā)速度,這一超級計算機(jī)由10萬塊英偉達(dá)H100驅(qū)動,提供了2億GPU小時的訓(xùn)練時間,是Grok 2的10倍,算力的顯著提升幫助Grok 3更有效的處理大型數(shù)據(jù)集,減少了訓(xùn)練時間,并提高了準(zhǔn)確性。
除了大幅增加的算力,xAI在訓(xùn)練Grok 3的過程中,還調(diào)整了訓(xùn)練方法,以提高能力,也采用了合成數(shù)據(jù)集、自我糾正機(jī)制和強(qiáng)化學(xué)習(xí)來提高性能。
xAI在訓(xùn)練Grok 3的合成數(shù)據(jù)集,是由人工生成的數(shù)據(jù)集,不是從真實(shí)世界收集的數(shù)據(jù),他們通過模擬各種場景來訓(xùn)練人工智能模型,確保數(shù)據(jù)集的多樣性和受控,這有助于提高學(xué)習(xí)效率,并解決了數(shù)據(jù)隱私方面的擔(dān)憂。
自我糾正機(jī)制則是允許識別和糾正模型自身錯誤的人工智能技術(shù),通過評估輸出并同已知的正確響應(yīng)進(jìn)行比較,模型可以隨著時間的推移改進(jìn)回應(yīng),減少錯誤并提高準(zhǔn)確性。
強(qiáng)化學(xué)習(xí)使AI模型通過獎勵或懲罰來學(xué)習(xí),可以通過試錯來最大限度的提高決策能力。此外,外媒在報道中還提到,xAI引入了人工反饋循環(huán)和情境訓(xùn)練,以確保更自然和更準(zhǔn)確的反饋。(海藍(lán))
1.TMT觀察網(wǎng)遵循行業(yè)規(guī)范,任何轉(zhuǎn)載的稿件都會明確標(biāo)注作者和來源;
2.TMT觀察網(wǎng)的原創(chuàng)文章,請轉(zhuǎn)載時務(wù)必注明文章作者和"來源:TMT觀察網(wǎng)",不尊重原創(chuàng)的行為TMT觀察網(wǎng)或?qū)⒆肪控?zé)任;
3.作者投稿可能會經(jīng)TMT觀察網(wǎng)編輯修改或補(bǔ)充。