AR正在面臨的三大關(guān)鍵挑戰(zhàn)!智能
不論是AR還是VR都還需要一段時(shí)間才能變得更加成熟,開發(fā)者不斷得在學(xué)習(xí)的道路上繼續(xù)前進(jìn)著。我們也同樣期待著。
自從蘋果開啟了全世界都能參與的AR大招之后,可能我們覺得AR時(shí)代即將到來!但事實(shí)是,AR要成為主流還需要很多年的努力及設(shè)計(jì),因?yàn)樗鼈儸F(xiàn)在面臨著一些不得不解決的挑戰(zhàn)。
1、沉浸式
在看完酷炫的ARKit演示視頻后,我們很容易想象完全占據(jù)視場的全屏幕視圖將有多么神奇。但現(xiàn)實(shí)情況是,即便是當(dāng)前最優(yōu)秀的便攜式AR頭顯開發(fā)套件,其視場仍十分有限(遠(yuǎn)比不上今天的VR頭顯,而且部分人認(rèn)為當(dāng)前VR頭顯的視場也并不足夠)。
從許多方面來說,HoloLens是當(dāng)前開發(fā)者能夠購買的最佳AR頭顯,但其視場也只不過是34度左右,遠(yuǎn)比不上谷歌Cardboard(大約為60度)。文章中的視頻把全視場與約34度的視場進(jìn)行了對比,結(jié)果顯示你在任何時(shí)刻內(nèi)都只能看到增強(qiáng)現(xiàn)實(shí)世界的一小部分。
這非常重要,因?yàn)橐獙?shí)現(xiàn)合理的沉浸感,增強(qiáng)世界需要與現(xiàn)實(shí)世界無縫融合。如果無法立即看到大部分的增強(qiáng)現(xiàn)實(shí)世界,你將發(fā)現(xiàn)自己需要不自然地“掃描”環(huán)境,以找出AR對象的實(shí)際位置(就像在使用望遠(yuǎn)鏡一樣),而不是說你的大腦能夠直觀地映射AR世界,并將其看作是現(xiàn)實(shí)世界的一部分。
并不是說34度視場的AR頭顯毫無用處,它只是不夠身臨其境而已,因此無法深入地沉浸你的自然感知,同時(shí)意味著它不太適合這種直觀的人機(jī)交互,不是消費(fèi)者和娛樂用途的理想選擇。
有人或許會(huì)說,“那擁有90度視場的Meta2 AR頭顯呢?”這個(gè)問題問得好。
沒錯(cuò),Meta 2是目前擁有最大視場的已知AR頭顯,接近于今天的VR頭顯。但這款設(shè)備的體積十分龐大,也沒有在不犧牲大部分視場的情況下小型化其光學(xué)系統(tǒng)的明顯解決方案。
Meta 2的光學(xué)鏡頭其實(shí)很簡單。頭顯那大大的“帽檐”部分包含跟智能手機(jī)類似的顯示器。大型塑料遮光罩有一部分進(jìn)行了鍍銀處理,并將顯示屏上的內(nèi)容反射到用戶的眼睛里。縮小頭顯意味著縮小顯示屏和遮光罩,這顯然會(huì)減少視場。Meta 2對開發(fā)者來說可能是非常好的設(shè)備,他們愿意為開發(fā)未來的設(shè)備而忍受笨重的頭顯,但對消費(fèi)者而言,Meta必須采用不同的光學(xué)解決方案來達(dá)到如此視場。
在這方面,ODG正在研發(fā)一種類似但體積更小的光學(xué)系統(tǒng),并且能夠?qū)崿F(xiàn)最高為50度的視場,亦即1800美元的R-9 AR眼鏡。然而,它們也只能勉強(qiáng)接近于消費(fèi)者可以接受的尺寸。在另一邊,Lumus采用了不同的光學(xué)解決方案(波導(dǎo)),成功在2mm厚的光學(xué)元件中實(shí)現(xiàn)了55度的視場。
約50度的視場還不錯(cuò),但遠(yuǎn)遠(yuǎn)比不上當(dāng)前高端VR頭顯的約110度視場,而且消費(fèi)者仍在要求更寬的視場。對于真正身臨其境的視場而言,我們很難判斷一個(gè)具體的數(shù)字,而Oculus過去曾認(rèn)為我們需要至少90度視場才能體驗(yàn)真正的臨場感(至少在這方面,VR行業(yè)中的大部分人都予以認(rèn)同)。
2. 實(shí)時(shí)對象分類
蘋果的ARKit技術(shù)和谷歌的ARCore技術(shù)能讓你在智能手機(jī)上實(shí)現(xiàn)一些非常炫麗和新穎的類AR體驗(yàn),但在大多數(shù)情況下,這些系統(tǒng)僅局限于“理解”地板和墻壁等平面。這就是為什么現(xiàn)在iOS上99%的AR應(yīng)用和演示作品都只能發(fā)生在地板或桌子上。
為什么是地板和墻壁呢?因?yàn)樗鼈兒苋菀追诸悺5匕寤驂Ρ诘钠矫媾c另一地板和另一墻壁的平面相同,所以系統(tǒng)有信心假定這一平面能夠向所有方面延展,直到與另一平面相交。
注意,我在這里是使用“理解”一詞,而不是“感知”或“檢測”。這是因?yàn)楸M管所述系統(tǒng)或許能夠“看到”除地板和墻壁以外的對象的形狀,但目前無法理解它們。
我們不妨把杯子作為例子。當(dāng)你看著一個(gè)杯子時(shí),你看到的不僅只是一種形狀,你對杯子已經(jīng)十分了解。了解有多少?下面讓我們一起看看:
你知道杯子與它所在的平面截然不同。你知道杯子里面包含一定的空間,可用來容納液體和其他物體。你知道我們可以用杯子來喝水。你知道杯子十分輕便,很容易打翻,從而導(dǎo)致杯內(nèi)液體或物體溢出。……
我可以繼續(xù)往下說…我想說的是,計(jì)算機(jī)并不知道任何這一切。它只能“看到”一個(gè)形狀,而不是一個(gè)杯子。計(jì)算機(jī)無法得到杯子內(nèi)部的完整視圖,無法映射出完整的形狀,計(jì)算機(jī)甚至不能假定杯子內(nèi)部存在一定的空間。計(jì)算機(jī)也不知道杯子是獨(dú)立于其所在平面的一個(gè)對象。但你知道這一切,因?yàn)樗且粋€(gè)杯子。
然而,令計(jì)算機(jī)視覺能夠理解“杯子”,而不僅僅只是看到一個(gè)形狀,這是一個(gè)非常重要的問題。所以這么多年來,我們在AR演示作品中看到人們把基準(zhǔn)標(biāo)記附加到對象身上,以實(shí)現(xiàn)更細(xì)致的追蹤和交互。
為什么如此困難呢?第一個(gè)挑戰(zhàn)在于分類。杯子有數(shù)千種形狀,大小,顏色和紋理。部分杯子擁有特殊的屬性和特殊的用途(如燒杯),這意味著不同的杯子被用于不同的場景和背景。
你可以想象編程這么一個(gè)可以幫助計(jì)算機(jī)了解所有上述概念的算法的挑戰(zhàn);你也可以想象編寫一個(gè)向計(jì)算機(jī)解釋杯子和碗之間區(qū)別的代碼的挑戰(zhàn)。
僅僅只是一個(gè)簡單的杯子就存在如此巨大的挑戰(zhàn),更不用說世界上那數(shù)千或數(shù)十萬件常見物品。
當(dāng)前基于智能手機(jī)的AR發(fā)生在你的環(huán)境之中,但你很難與之進(jìn)行交互。這就是為什么你今天在智能手機(jī)上看到的所有AR體驗(yàn)都被固定在地板和墻壁上。這種系統(tǒng)不可能與我們周圍的世界進(jìn)行令人信服的交互,因?yàn)殡m然系統(tǒng)能夠“看到”地板和墻壁,但不能“理解”它們。
對于我們所向往的科幻式AR(亦即AR眼鏡能夠向我展示杯子里的咖啡的溫度;或者說把微波爐的剩余時(shí)間顯示在其上方),我們需要系統(tǒng)“理解”更多關(guān)于我們周圍的世界。
那我們該如何實(shí)現(xiàn)呢?答案似乎是所謂的“深度學(xué)習(xí)”。用于每種對象類型的手寫分類算法,甚至是普通的分類算法,這都是一項(xiàng)非常復(fù)雜的任務(wù)。但我們可以訓(xùn)練計(jì)算機(jī)的神經(jīng)網(wǎng)絡(luò),把這種神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)為能夠隨時(shí)間發(fā)展而自動(dòng)調(diào)整其編程,并可靠地檢測周圍的常見物品。映維網(wǎng)曾報(bào)道研究人員已經(jīng)在開展部分項(xiàng)目,而且看起來十分有希望。在下面這個(gè)視頻中,系統(tǒng)能夠稍微可靠地檢測任意人類,雨傘,交通燈和汽車之間的差異。
下一步是大幅擴(kuò)展可能的分類庫,然后把基于圖像的檢測與從AR追蹤系統(tǒng)采集的實(shí)時(shí)環(huán)境映射數(shù)據(jù)結(jié)合起來。一旦我們可以讓AR系統(tǒng)開始“理解”我們周圍的世界,我們就可以著手解決AR體驗(yàn)的自適應(yīng)設(shè)計(jì)挑戰(zhàn)。
3. 自適應(yīng)AR設(shè)計(jì)
打個(gè)比方,網(wǎng)頁開發(fā)者投入了多年時(shí)間來開發(fā)可靠,實(shí)用的設(shè)計(jì)規(guī)則,使得網(wǎng)站能夠適合不同形狀的屏幕。但與自適應(yīng)AR設(shè)計(jì)相比,前者似乎是一個(gè)簡單的任務(wù),因?yàn)楹笳咝枰С趾w所有三維的任意環(huán)境。
這不是一個(gè)簡單的問題。即便是已投入多年實(shí)踐開發(fā)時(shí)間的VR游戲設(shè)計(jì),開發(fā)者也仍然在努力解決這一難題的更基礎(chǔ)版本:針對不同的游玩空間大小進(jìn)行設(shè)計(jì)。一般來說,VR游玩區(qū)域的形狀是正方形或矩形,而且除了玩家之外沒有任何東西。與伴隨著一系列并發(fā)對象的AR體驗(yàn)而言,這似乎是簡單不過的問題。
想象一下:即使是生活在相同公寓單位的人來說,家具和物品的擺放也完全不同。要理解如何創(chuàng)建令人信服的娛樂體驗(yàn),AR游戲設(shè)計(jì)將需要很多年時(shí)間的發(fā)展。從平面到天花板,再到家具,再到數(shù)以百萬計(jì)的家庭,這種娛樂體驗(yàn)需要適應(yīng)一個(gè)看似無限的環(huán)境變量(更不用說更加廣泛的戶外空間)。
你可能會(huì)認(rèn)為開發(fā)一款簡單的AR射擊游戲并不難,比如說在一房一廳的設(shè)計(jì)中,敵人就從那特定的房間中冒出來。但不要忘記,如果不預(yù)先映射環(huán)境,AR系統(tǒng)甚至不知道這棟房子存在另一個(gè)房間。
讓我們假設(shè)開發(fā)者已經(jīng)解決了對象分類問題,這樣的系統(tǒng)可以在人類層面上理解你周圍的對象,那開發(fā)者應(yīng)該如何創(chuàng)建一款利用這些對象的游戲呢?
比如說一款簡單的種田游戲,其中玩家需要在家中種植和澆灌AR作物,而這涉及使用真正的杯子來澆灌AR水。但如果你周圍沒有杯子呢?這樣的游戲是否將變得毫無用處?答案是否定的,開發(fā)者都是聰明人,比如說玩家可以把閉合的拳頭作為杯子的替代品,當(dāng)傾斜拳頭時(shí),AR水就會(huì)倒出來。
所以我們現(xiàn)在可以栽種作物。美國開發(fā)者認(rèn)為,每個(gè)人都應(yīng)該有足夠的空間來種植10排玉米;但在中國,我們居住的小型公寓不適合種植10排玉米,因?yàn)榇蟛糠秩藳]有多余的臥室來進(jìn)行播種。
我可以繼續(xù)說下去。我想說的是:如果我們不再局限于在空白地板和墻壁上體驗(yàn)沉浸式AR,我們需要設(shè)計(jì)自適應(yīng)的AR游戲和應(yīng)用,而這涉及利用我們周圍的實(shí)際空間和對象。因此,我們需要通過一些非常聰明的設(shè)計(jì)來管理數(shù)十億種變量。
盡管這可能是所述三大挑戰(zhàn)中最遙遠(yuǎn)的一個(gè),但在真正能夠?qū)崿F(xiàn)這些體驗(yàn)的未來設(shè)備到來之前,我們現(xiàn)在就可以從理論上進(jìn)行設(shè)計(jì)。
在過去一年中,很多人都認(rèn)為AR和VR在技術(shù)成熟度方面已經(jīng)不相上下,但事實(shí)上AR仍然遠(yuǎn)遠(yuǎn)落后于當(dāng)前的VR。AR令人十分興奮,但從硬件到感知,再到設(shè)計(jì),我們?nèi)杂性S多東西需要學(xué)習(xí)。對AR來說,現(xiàn)在是一個(gè)激動(dòng)人心的時(shí)刻。這個(gè)領(lǐng)域仍然是相當(dāng)開放,而且市場已經(jīng)出現(xiàn)了一個(gè)牢固的立足點(diǎn),進(jìn)軍AR市場的時(shí)機(jī)已經(jīng)成熟。
99VR視界君說:不論是AR還是VR都還需要一段時(shí)間才能變得更加成熟,開發(fā)者不斷得在學(xué)習(xí)的道路上繼續(xù)前進(jìn)著。我們也同樣期待著。
來源:99VR視界
1.TMT觀察網(wǎng)遵循行業(yè)規(guī)范,任何轉(zhuǎn)載的稿件都會(huì)明確標(biāo)注作者和來源;
2.TMT觀察網(wǎng)的原創(chuàng)文章,請轉(zhuǎn)載時(shí)務(wù)必注明文章作者和"來源:TMT觀察網(wǎng)",不尊重原創(chuàng)的行為TMT觀察網(wǎng)或?qū)⒆肪控?zé)任;
3.作者投稿可能會(huì)經(jīng)TMT觀察網(wǎng)編輯修改或補(bǔ)充。