谷歌I/O大會(huì)周二拉開帷幕 推出Gemini 1.5 flash大模型、VideoFX等快訊
升級(jí)Gemini 1.5 Pro 推出Gemini 1.5 flash 谷歌在去年12月份推出了原生多模態(tài)大模型Gemini 1.0,谷歌宣布推出Gemini家族的新模型Gemini 1.5 flash,他們也已經(jīng)將Gemini大模型應(yīng)用到了搜索中。
【TechWeb】5月15日消息,據(jù)外媒報(bào)道,雖然OpenAI搶先推出了新一代AI大模型GPT-4o,搶走了谷歌I/O大會(huì)的不少風(fēng)頭,但從大會(huì)的進(jìn)展來看,谷歌過去一段時(shí)間在人工智能上仍在不懈探索,他們在當(dāng)?shù)貢r(shí)間周二上午開始的大會(huì)上推出了眾多的人工智能產(chǎn)品,包括大語言模型、視頻生成模型,搜索等諸多應(yīng)用在人工智能的加持下也有了更強(qiáng)的能力。

大模型方面:升級(jí)Gemini 1.5 Pro 推出Gemini 1.5 flash
谷歌在去年12月份推出了原生多模態(tài)大模型Gemini 1.0,有Ultra、Pro 和Nano三種不同尺寸的版本,并在幾個(gè)月之后推出了100萬token文本容量的Gemini 1.5 Pro。
在當(dāng)?shù)貢r(shí)間周二的I/O大會(huì)上,谷歌宣布推出Gemini家族的新模型Gemini 1.5 flash,也是100萬token文本容量,較Gemini 1.5 Pro相比是輕量化的模型,專門為更快和更有效的大規(guī)模應(yīng)用設(shè)計(jì)。

而對(duì)于幾個(gè)月前推出的Gemini 1.5 Pro,谷歌也宣布將文本容量由此前的100萬token,升級(jí)到200萬token。
Gemini Nano大模型也進(jìn)行了升級(jí),由此前的純文本輸入,擴(kuò)大到圖像。
除了Gemini系列大模型的升級(jí),谷歌在大會(huì)上公布了他們開源大模型Gemma的新進(jìn)展,宣布了用于AI創(chuàng)新的新一代開源大模型Gemma 2,有新的架構(gòu)。從谷歌方面公布的消息來看,Gemma系列開源大模型,采用了研發(fā)Gemini大模型相同的技術(shù)。
同OpenAI一樣,谷歌旗下谷歌DeepMind的使命也是打造有益于人類的人工智能,他們也一直致力于研發(fā)有助于日常生活的通用人工智能,在I/O大會(huì)上,他們也分享了為未來打造的人工智能助手Project Astra項(xiàng)目的進(jìn)展。Project Astra是一款目前仍在研發(fā)中的產(chǎn)品,是具有視頻理解能力的研究原型。
AI應(yīng)用及工具方面:升級(jí)搜索、ImageFX、MusicFX等
對(duì)原有大模型進(jìn)行升級(jí),并推出了新的大模型的谷歌,也將大模型引入他們的應(yīng)用中,包括搜索、VideoFX、ImageFX、MusicFX等。
谷歌發(fā)源于搜索,搜索也是他們重要的業(yè)務(wù),他們也已經(jīng)將Gemini大模型應(yīng)用到了搜索中。而作為搜索生成體驗(yàn)的一部分,谷歌在過去的一年響應(yīng)了數(shù)十億次搜索請求,用戶也在用全新的方式搜索,進(jìn)行更長和更復(fù)雜的搜索,甚至用圖片搜索。
而在Gemini的加持下,谷歌也對(duì)搜索進(jìn)行針對(duì)性的升級(jí),他們也能為用戶帶來更強(qiáng)的搜索體驗(yàn),他們在大會(huì)上也宣布推出“AI Overviews”這一全新的體驗(yàn),本周開始向美國用戶推出,隨后將推向更多的國家。
在引入Gemini后,谷歌照片應(yīng)用也將進(jìn)化。谷歌方面表示,9年前他們推出的這一應(yīng)用,在用戶中廣泛使用,現(xiàn)在每天上傳超過60億張照片和視頻。

谷歌照片應(yīng)用在今年夏天將推出「詢問照片(Ask Photos)」功能,基于Gemini模型,可以讓用戶以自然語言搜索照片和視頻中的人物、寵物、地點(diǎn)等,它能理解照片的上下文和主題,找到特定的回憶信息,無需滑動(dòng)屏幕。
在今年的I/O上,谷歌也宣布對(duì)創(chuàng)作工具ImageFX、MusicFX進(jìn)行升級(jí),并推出人工智能視頻生成工具VideoFX。ImageFX自2月份推出以來,已被廣泛用于視覺藝術(shù)項(xiàng)目的圖片生成,他們宣布這一應(yīng)用將增加編輯控制功能和Imagen 3,后者是谷歌DeepMind目前最新和能力最強(qiáng)的圖片生成模型。
AI視頻生成工具VideoFX,由谷歌DeepMind最新的視頻生成模型Veo驅(qū)動(dòng),是他們最新的實(shí)驗(yàn)工具,通過文本提示,可以讓用戶把想法變成視頻,也將率先面向美國用戶推出。
谷歌方面披露,人工智能圖像生產(chǎn)工具ImageFX、人工智能音樂創(chuàng)作工具M(jìn)usicFX,目前已推廣到了全球110多個(gè)國家。(海藍(lán))
1.TMT觀察網(wǎng)遵循行業(yè)規(guī)范,任何轉(zhuǎn)載的稿件都會(huì)明確標(biāo)注作者和來源;
2.TMT觀察網(wǎng)的原創(chuàng)文章,請轉(zhuǎn)載時(shí)務(wù)必注明文章作者和"來源:TMT觀察網(wǎng)",不尊重原創(chuàng)的行為TMT觀察網(wǎng)或?qū)⒆肪控?zé)任;
3.作者投稿可能會(huì)經(jīng)TMT觀察網(wǎng)編輯修改或補(bǔ)充。