智譜開源清影模型CogVideoX-2B,單張4090顯卡即可進(jìn)行推理快訊
期待開發(fā)者們在提示詞優(yōu)化、視頻長度、幀率、分辨率、場景微調(diào)以及圍繞視頻的各類功能開發(fā)上貢獻(xiàn)開源力量,智譜宣布將與「清影」同源的視頻生成模型——CogVideoX開源,「清影」發(fā)布6天生成視頻數(shù)已經(jīng)突破百萬量級。
【TechWeb】8月6日消息,智譜于7月26日發(fā)布 AI 生視頻「清影」并上線智譜清言APP,可30秒將任意文圖生成視頻。
智譜宣布將與「清影」同源的視頻生成模型——CogVideoX開源,以期讓每一位開發(fā)者、每一家企業(yè)都能自由開發(fā)屬于自己的視頻生成模型。[圖片][圖片]CogVideoX開源模型包含多個(gè)不同尺寸大小的模型,目前智譜將開源CogVideoX-2B,它在FP-16精度下的推理僅需18GB顯存,微調(diào)則只需要40GB顯存,這意味著單張4090顯卡即可進(jìn)行推理,而單張A6000顯卡即可完成微調(diào)。


CogVideoX-2B的提示詞上限為226個(gè)token,視頻長度為6秒,幀率為8幀/秒,視頻分辨率為720*480。
智譜表示,為視頻質(zhì)量的提升預(yù)留了廣闊的空間,期待開發(fā)者們在提示詞優(yōu)化、視頻長度、幀率、分辨率、場景微調(diào)以及圍繞視頻的各類功能開發(fā)上貢獻(xiàn)開源力量。
同時(shí),智譜預(yù)告,性能更強(qiáng)參數(shù)量更大的模型正在路上,敬請關(guān)注與期待。
另外,據(jù)智譜發(fā)布的數(shù)據(jù)顯示,「清影」發(fā)布6天生成視頻數(shù)已經(jīng)突破百萬量級。(果青)
1.TMT觀察網(wǎng)遵循行業(yè)規(guī)范,任何轉(zhuǎn)載的稿件都會明確標(biāo)注作者和來源;
2.TMT觀察網(wǎng)的原創(chuàng)文章,請轉(zhuǎn)載時(shí)務(wù)必注明文章作者和"來源:TMT觀察網(wǎng)",不尊重原創(chuàng)的行為TMT觀察網(wǎng)或?qū)⒆肪控?zé)任;
3.作者投稿可能會經(jīng)TMT觀察網(wǎng)編輯修改或補(bǔ)充。