英偉達(dá)發(fā)布三款消費(fèi)級(jí)顯卡,599美元起,主打"本地化"AI快訊
能運(yùn)行視頻游戲的個(gè)人電腦顯卡一直是英偉達(dá)的主要業(yè)務(wù),芯片制造商英偉達(dá)發(fā)布了三款新顯卡,云端的英偉達(dá)GPU芯片可以運(yùn)行非常大的語言模型。
1月9日消息,周一,芯片制造商英偉達(dá)發(fā)布了三款新顯卡:RTX 4060 Super、RTX 4070 Ti Super和RTX 4080 Super,價(jià)格在599美元到999美元之間。這些消費(fèi)級(jí)顯卡可以在個(gè)人電腦或筆記本電腦上運(yùn)行“本地化”人工智能,比如在Adobe Photoshop的Firefly生成器上制作圖像,或在視頻通話中刪除背景,甚至可以用于游戲開發(fā)。
去年,英偉達(dá)旗下的H100等服務(wù)器級(jí)GPU芯片成為訓(xùn)練和部署生成式人工智能的關(guān)鍵設(shè)備,使得英偉達(dá)發(fā)現(xiàn)自己處在人工智能熱潮的中心位置。如今,英偉達(dá)正致力于打造“本地化”人工智能的消費(fèi)級(jí)顯卡,以進(jìn)一步增強(qiáng)公司實(shí)力。
這三款新顯卡都配備了額外的“張量內(nèi)核”處理單元,可用于運(yùn)行生成式人工智能應(yīng)用程序。英偉達(dá)將為宏碁、戴爾和聯(lián)想等公司的筆記本電腦提供這些顯卡。
人工智能行業(yè)對(duì)英偉達(dá)企業(yè)級(jí)顯卡的需求導(dǎo)致公司整體銷售額激增,市值超過1萬億美元。英偉達(dá)的企業(yè)級(jí)顯卡售價(jià)高達(dá)上萬美元,通常用在有8塊顯卡協(xié)同工作的大型服務(wù)器系統(tǒng)中。
長期以來,能運(yùn)行視頻游戲的個(gè)人電腦顯卡一直是英偉達(dá)的主要業(yè)務(wù)。但該公司表示,今年新發(fā)布的顯卡有一番改進(jìn),專注于運(yùn)行人工智能模型,而且無需將信息傳回云端。
英偉達(dá)表示,新的消費(fèi)級(jí)顯卡主要用于運(yùn)行游戲,但同樣適用于人工智能應(yīng)用程序。例如,RTX 4080 Super生成人工智能視頻的速度比上一代顯卡快150%。英偉達(dá)表示,公司最近在軟件方面的其他改進(jìn)將使大語言模型的運(yùn)行速度提高五倍。
英偉達(dá)產(chǎn)品管理高級(jí)總監(jiān)賈斯汀·沃克(Justin Walker)表示:“隨著RTX系列顯卡的出貨量達(dá)到1億塊,我們能為運(yùn)行人工智能應(yīng)用的強(qiáng)大電腦提供大量安裝基數(shù)。”
英偉達(dá)預(yù)計(jì),明年將出現(xiàn)能有效利用增強(qiáng)處理能力的新人工智能應(yīng)用程序。微軟預(yù)計(jì)將在今年晚些時(shí)候發(fā)布新版本的Windows 12操作系統(tǒng),可以進(jìn)一步有效利用人工智能芯片。
沃克說,這種新款芯片可以用在Adobe Photoshop的Firefly生成器上制作圖像,或者在視頻通話中刪除背景。英偉達(dá)還在開發(fā)工具,允許游戲開發(fā)者將生成式人工智能集成到他們的游戲中,自動(dòng)生成非玩家角色的對(duì)話。
邊緣設(shè)備與服務(wù)器
英偉達(dá)本周發(fā)布的新芯片表明,雖然其業(yè)務(wù)亮點(diǎn)一直與大型服務(wù)器所用的顯卡牢固相連,但也將與開發(fā)“本地化”人工智能設(shè)備的英特爾、AMD以及高通展開競爭。這三家公司都發(fā)布了新款芯片,具備運(yùn)行機(jī)器學(xué)習(xí)的專用單元,能為所謂的“人工智能個(gè)人電腦”提供動(dòng)力。
英偉達(dá)發(fā)布新款芯片之際,科技行業(yè)正在尋找部署生成式人工智能的最佳方式。目前,部署生成式人工智能需要巨大算力,而且在云端運(yùn)行的成本可能高得驚人。
微軟和英偉達(dá)的競爭對(duì)手正在推廣的技術(shù)解決方案是所謂的AI PC,有時(shí)也被稱為“邊緣計(jì)算”。這種情況下,設(shè)備不再通過互聯(lián)網(wǎng)使用強(qiáng)大的超級(jí)計(jì)算機(jī),而是內(nèi)置更強(qiáng)大的人工智能芯片,可以運(yùn)行所謂的大語言模型或圖像生成器,當(dāng)然也存在一些折衷和缺點(diǎn)。
英偉達(dá)提出的方案是使用云端模型來解決棘手問題,并使用本地化人工智能模型來完成需要快速處理的任務(wù)。
沃克說:“云端的英偉達(dá)GPU芯片可以運(yùn)行非常大的語言模型,也能調(diào)用所有的處理能力來支持非常大的人工智能模型。與此同時(shí),個(gè)人電腦中的RTX張量內(nèi)核將運(yùn)行對(duì)延遲更敏感的人工智能應(yīng)用程序。”
1.TMT觀察網(wǎng)遵循行業(yè)規(guī)范,任何轉(zhuǎn)載的稿件都會(huì)明確標(biāo)注作者和來源;
2.TMT觀察網(wǎng)的原創(chuàng)文章,請(qǐng)轉(zhuǎn)載時(shí)務(wù)必注明文章作者和"來源:TMT觀察網(wǎng)",不尊重原創(chuàng)的行為TMT觀察網(wǎng)或?qū)⒆肪控?zé)任;
3.作者投稿可能會(huì)經(jīng)TMT觀察網(wǎng)編輯修改或補(bǔ)充。