馬斯克的新AI我試了,開(kāi)局就被它“罵”了一頓。。。互聯(lián)網(wǎng)+
導(dǎo)讀
按照老馬的說(shuō)法,英語(yǔ)用戶(hù)大概在一周內(nèi)都能用上,日語(yǔ)用戶(hù)排在第二波,到明年年初,所有用戶(hù)都能安排上。
按照老馬的說(shuō)法,英語(yǔ)用戶(hù)大概在一周內(nèi)都能用上,日語(yǔ)用戶(hù)排在第二波,到明年年初,所有用戶(hù)都能安排上。
前兩天,馬斯克悄摸發(fā)了條推特,宣布他們的新 AI —— Grok ,逐漸要向大伙們( 開(kāi)了大會(huì)員的 )開(kāi)放了。
按照老馬的說(shuō)法,英語(yǔ)用戶(hù)大概在一周內(nèi)都能用上,日語(yǔ)用戶(hù)排在第二波,到明年年初,所有用戶(hù)都能安排上。
而這個(gè) Grok 呢,雖說(shuō)還是個(gè)初出茅廬的毛頭小子,但討論度一點(diǎn)不比別家少。
一個(gè)方面是老馬瘋狂發(fā)推,給自家 AI 帶量。。。
另一邊,不少事先嘗鮮的科技大佬,也紛紛曬出了和 Grok 的聊天截圖。
像是英偉達(dá)的科學(xué)家拋出個(gè) “ 我老婆說(shuō) 4+5=12 ” 的經(jīng)典難題, Grok 都能輕松給出解決辦法:老婆永遠(yuǎn)是對(duì)的。。。
要知道之前這個(gè)問(wèn)題可是難道了不少大模型,連 ChatGPT 也都死磕正確答案,轉(zhuǎn)不過(guò)彎來(lái)。
甚至,有個(gè)和 Grok 同名的虛擬幣,前段時(shí)間也都暴漲了上萬(wàn)倍。。。
馬斯克直接現(xiàn)身說(shuō)法,告訴大家啥是科技圈兒頂流好吧。
而好巧不巧,這兩天,世超正好就拿到了 Grok 這個(gè)網(wǎng)紅 AI 的測(cè)試資格。
咱也不整啥廢話(huà)了,直接就帶大伙們體驗(yàn)一波。
先是點(diǎn)開(kāi) Grok 的界面,就能感覺(jué)到濃濃的馬斯克風(fēng)撲面而來(lái)。
它搞了兩個(gè)模式,正經(jīng)模式和娛樂(lè)模式,默認(rèn)的就是 “ 墨鏡一帶誰(shuí)都不愛(ài) ” 的娛樂(lè)模式。
主頁(yè)推薦的第一個(gè)提示詞也都是 “ Roast me Grok ( 挖苦我, Grok )” ,讓它根據(jù)自己 X 賬號(hào)的內(nèi)容開(kāi)涮。
世超決定就從這個(gè)問(wèn)題開(kāi)始,試試 Grok 檢索 X 上信息的能力,順便還能檢驗(yàn)下它是真幽默還是假幽默。
沒(méi)想到這個(gè) Grok 嘴下是一點(diǎn)不留情,先是吐槽一大堆,第二段直接陰陽(yáng)怪氣起來(lái): “ 你癡迷科技和 AI 是在嘗試彌補(bǔ)什么嘛 ” 。。。
而且有一說(shuō)一,這結(jié)果算是非常準(zhǔn)確,我主頁(yè)確實(shí)點(diǎn)贊轉(zhuǎn)發(fā)了不少科技或者 AI 相關(guān)的帖子。
不過(guò)幽默不光是毒舌,能不能 get 到人類(lèi)的一些梗,也是很重要的一個(gè)衡量標(biāo)準(zhǔn)。
好在 Grok 在這塊穩(wěn)定發(fā)揮,像是 “ 沒(méi)有眼睛的鹿叫什么 ” , “ No eye deer ( No idea ) ” 這種經(jīng)典英文笑話(huà),它完全能理解。
包括 “ 普通的貓有 9 條命,而精通計(jì)算機(jī)的貓有 1001 條命 ” ,這種二進(jìn)制梗, Grok 也輕松拿捏。
而除了幽默外, Grok 的另一大特點(diǎn)便是數(shù)據(jù)更新得快,是第一時(shí)間在網(wǎng)上沖浪的弄潮兒。
世超也直接開(kāi)門(mén)見(jiàn)山,問(wèn)了它一般什么時(shí)候更新數(shù)據(jù)庫(kù)。
Grok 那邊直接來(lái)了個(gè)比喻,說(shuō)它的數(shù)據(jù)和雛菊一樣新鮮。。。
好吧,既然這樣,那就來(lái)點(diǎn)開(kāi)碟小菜,問(wèn)問(wèn)它知道前兩天谷歌剛發(fā)的 Gemini 嗎?
這倒沒(méi)難到 Grok ,它準(zhǔn)確給出了答案,后面還附帶了那天一些 Gemini 相關(guān)的推文鏈接,大概就是想告訴我們它的信息就是從這邊總結(jié)到的。
接下來(lái)再上點(diǎn)難度,讓它總結(jié)一下今天科技領(lǐng)域都發(fā)生了哪些大事。
這次的結(jié)果,著實(shí)有點(diǎn)難評(píng)。消息確實(shí)都是最近發(fā)生的,但好多都不是今天的,屬于有點(diǎn)時(shí)效但不多。。。
先是 Gemini 已經(jīng)是好幾天前的消息了,剩下的像蘋(píng)果系統(tǒng)更新、歐盟 AI 新協(xié)議等等,也都講得十分含糊。
反正看了它總結(jié)的這些東西,世超是一點(diǎn)信息增量都沒(méi)得到,而且有的消息沒(méi)源頭都不敢信,還得自己再查一波。。。。
從上面這幾輪體驗(yàn)下來(lái), Grok 給世超的感覺(jué)還算過(guò)得去,娛樂(lè)能力是有的,一些梗也能迅速 get 到,回答的時(shí)候也挺幽默的。
實(shí)時(shí)數(shù)據(jù)庫(kù)這塊,確實(shí)是能看出來(lái) Grok 有在不斷更新,不過(guò)總結(jié)能力,頂多就是中規(guī)中矩的水平,想把它當(dāng)作生產(chǎn)力工具遠(yuǎn)遠(yuǎn)夠不上,還沒(méi)搜索引擎來(lái)得方便。
當(dāng)然,這也不只是 Grok 一個(gè)的毛病了,其他有實(shí)時(shí)檢索能力的大模型,總結(jié)能力或多或少都有點(diǎn)菜。
比較獨(dú)特的功能體驗(yàn)完了,按照慣例,大模型的一些基礎(chǔ)問(wèn)題咱也得在 Grok 上測(cè)測(cè)。
這次,為了確保能測(cè)出 Grok 的真正實(shí)力,世超專(zhuān)門(mén)找來(lái)了上次谷歌測(cè)試 Gemini 的MMLU ( 大規(guī)模多任務(wù)語(yǔ)言理解 )能力的論文,從里面扒了一些問(wèn)題出來(lái)問(wèn)問(wèn)它。
先是一些生活中的道德常識(shí):
在賽道上和在郊區(qū)飆車(chē),哪種情況違反道德?
大家動(dòng)動(dòng)腳趾頭估計(jì)都能給出答案,這也難不倒 Grok ,它很快給出了判斷,情景 2 。
再來(lái)一點(diǎn)網(wǎng)上就能檢索出來(lái)數(shù)據(jù)問(wèn)題,問(wèn)問(wèn) 2017 年之前,世界上有多少 1 歲兒童接種過(guò)疫苗?正確答案應(yīng)該是八成多。
Grok 唰唰一通搜索,不僅給出了 85% 的大概比例,而且還給出了 1.162 億的準(zhǔn)確數(shù)字。
常識(shí)問(wèn)題對(duì) Grok 來(lái)說(shuō)算是灑灑水,接下來(lái)就整點(diǎn)復(fù)雜的,來(lái)點(diǎn)情境看看它的理解推理能力。
世超先拋出個(gè)社會(huì)犯罪學(xué)里面的名詞 “ 差別接觸理論 ” ,讓 Grok 判斷哪個(gè)例子符合這個(gè)名詞。
Grok 不僅正確選出了答案 A ,還講了為啥要選這個(gè)選項(xiàng),順帶解釋了下這個(gè)名詞。
還有下面這種帶點(diǎn)職場(chǎng)人情世故的狀況,發(fā)現(xiàn)上司準(zhǔn)備的演講稿中有事實(shí)性錯(cuò)誤該怎么辦?
大家都是老打工人了,估計(jì)都能選出 D 才是最妥善的解決辦法。
而 Grok 也沒(méi)半點(diǎn)糾結(jié),儼然一副飽經(jīng)職場(chǎng)風(fēng)霜的樣子,給出最合理的解決方案,還說(shuō)了一大堆這么做的好處。
這么體驗(yàn)下來(lái), “ 人味兒 ” 測(cè)試對(duì) Grok 來(lái)說(shuō)并不難。
最后就該使出殺手锏了,來(lái)點(diǎn)大模型們都聞風(fēng)喪膽的數(shù)學(xué)題。
從最基礎(chǔ)的小學(xué)數(shù)學(xué)題開(kāi)始,這個(gè)涉及到最小公倍數(shù)的問(wèn)題, 15 這個(gè)答案,相信大伙們都能口算。
然而 Grok 在第一道上就栽了跟頭,用最小公倍數(shù)算它倒是清楚的很,最后本來(lái)要加上開(kāi)頭的那次亮燈,結(jié)果它給減掉了,純純就是讀題不認(rèn)真了。。。
再來(lái)點(diǎn)難度,搞個(gè)導(dǎo)數(shù)的題目,看看 Grok 能不能做對(duì),正確答案應(yīng)該是下面圖片這樣的。
結(jié)果 Grok 這邊從一開(kāi)始就胡說(shuō)八道了,車(chē)轱轆話(huà)說(shuō)了一遍又一遍,最后正確答案也沒(méi)算出來(lái)。。。
總的來(lái)講,馬斯克的 Grok 在一些基礎(chǔ)能力上,要說(shuō)比肩 GPT-4 ,肯定還有點(diǎn)癡人說(shuō)夢(mèng)。
而且在試用的過(guò)程中,除了開(kāi)頭那個(gè)根據(jù)自己的帖子吐槽的功能外,世超沒(méi)有找到啥特別驚喜的點(diǎn),包括那個(gè)實(shí)時(shí)更新的數(shù)據(jù)庫(kù),用下來(lái)感覺(jué)就挺一般的。
但世超也沒(méi)有要唱衰的 Grok 的意思,畢竟馬斯克的人工智能公司 xAI 在今年 7 月份才成立。
雖然起步很晚,但 xAI 該有的進(jìn)展是一點(diǎn)沒(méi)落下。
整個(gè)團(tuán)隊(duì)不到 20 個(gè)人,爆肝兩個(gè)月,在 OpenAI 開(kāi)發(fā)者大會(huì)之前發(fā)布 Grok ,趕上了大模型這趟末班車(chē)。
在最基礎(chǔ)的能力上,它剛上線(xiàn)就能有實(shí)時(shí)更新的數(shù)據(jù)庫(kù),下一步, Grok 還計(jì)劃上多模態(tài)和長(zhǎng)文本處理的功能。
而且公開(kāi)資料顯示,前些天, xAI 還向美國(guó)證券監(jiān)管機(jī)構(gòu)提交了相關(guān)文件,準(zhǔn)備通過(guò)股權(quán)籌集10 億美元。
現(xiàn)在已經(jīng)籌集到了 1.35 億美元,另外還有 8.6 億美元的代收股權(quán)已經(jīng)簽了協(xié)議。
這么來(lái)看, xAI 的發(fā)展算是相當(dāng)順風(fēng)順?biāo)恕?其實(shí)馬斯克搞出上面這些名堂,倒也不讓人感到意外,畢竟當(dāng)時(shí)從 OpenAI 退出之后,他就一直瞅著時(shí)機(jī)準(zhǔn)備入局 AI ,屬于底子一直都在的那類(lèi)。
真正拉滿(mǎn)世超對(duì) Grok 期待值的,還得是它背靠的一整個(gè)“ 大家族 ” ,它們又會(huì)擦出怎樣的火花?
大家也都知道馬斯克手里還有特斯拉、 SpaceX 、 Neuralink 等等一大堆公司,在 “ 所有東西都要用 AI 再做一遍 ” 的現(xiàn)在,把 Grok 融到這些公司肯定是遲早的事。。。
xAI 官網(wǎng)也透露,后續(xù)除了繼續(xù)和 X 合作之外,還會(huì)和特斯拉還有其他公司搞搞聯(lián)動(dòng)。
反正世超現(xiàn)在已經(jīng)在暢想把 Grok 集成在特斯拉上的景象了。。。
撰文:松鼠 編輯:江江 & 面線(xiàn) 封面:煥妍
圖片、資料來(lái)源:
X、Grok



























1.TMT觀(guān)察網(wǎng)遵循行業(yè)規(guī)范,任何轉(zhuǎn)載的稿件都會(huì)明確標(biāo)注作者和來(lái)源;
2.TMT觀(guān)察網(wǎng)的原創(chuàng)文章,請(qǐng)轉(zhuǎn)載時(shí)務(wù)必注明文章作者和"來(lái)源:TMT觀(guān)察網(wǎng)",不尊重原創(chuàng)的行為T(mén)MT觀(guān)察網(wǎng)或?qū)⒆肪控?zé)任;
3.作者投稿可能會(huì)經(jīng)TMT觀(guān)察網(wǎng)編輯修改或補(bǔ)充。