真·3D創(chuàng)作來了,必須用手比劃!這回AI總不能搶我飯碗了吧
?本文經(jīng)AI新媒體量子位(公眾號ID:QbitAI)授權轉載,轉載請聯(lián)系出處。
AR苦內(nèi)容久矣。
過去一段時間來,AR廠商們都爭相推出消費級AR眼鏡,在重量、續(xù)航、功能上卷出新花樣,但也逃不脫被人們詬病:
除了看片還能干啥?
當下的消費級AR到底是不是真·AR?
對于用戶來說,AR眼鏡的作用,如果只是將一臺投影儀縮小到鏡片大小架在眼前,很難長期滿足消費者不斷涌現(xiàn)的新需求。
一直和手機借內(nèi)容生態(tài)?
似乎也不可取,畢竟AR最大的想象力就在于如何成為一個新型獨立終端。更何況手機內(nèi)容都局限在2D,和增強現(xiàn)實基本定義里反復提及的3D也有本質(zhì)性區(qū)別。
所以應該怎么辦?
賣空自家6萬臺AR眼鏡庫存的行業(yè)頭部玩家,最近頂著元宇宙退潮交出了自家答卷:
通過一個AR應用,他們讓普通人在10分鐘內(nèi)建造屬于自己的AR數(shù)字空間。
而且還是必須要用手在物理空間里創(chuàng)作的那種,AI這回沒話說了吧?
當然這是開玩笑,其背后真正的目的在于,能夠讓更多開發(fā)者、創(chuàng)作者,能夠來AR空間內(nèi)發(fā)揮自己的想象力,壯大AR內(nèi)容生態(tài),并進一步達到推動AR向大眾層面鋪開。
所以這款應用到底是什么?僅憑它就能實現(xiàn)如此宏大的目標嗎?背后又揭示了AR行業(yè)的哪些暗涌?
靈境是什么?
Rokid創(chuàng)始人兼CEO 祝銘明表示,靈境是AR行業(yè)一個劃時代的產(chǎn)品,可以讓每一個人都參與到AR數(shù)字內(nèi)容的創(chuàng)作中。
官方定義,靈境是一款AR空間創(chuàng)作工具,能做的事就是在3D空間內(nèi)創(chuàng)作AR內(nèi)容,而且門檻很低,人人可用。
具體操作步驟分為5步:
- 手機掃描空間
- 云端空間重建
- 在線場景布局
- 多端一鍵發(fā)布
- AR終端體驗
也就是說,通過普通手機攝像頭,靈境就能獲取到空間信息,然后在云端進行重建。之后就可以按照自己的想法完成創(chuàng)作了。
創(chuàng)作好的AR內(nèi)容可以直接發(fā)布在平臺上,一個空間內(nèi)可以有多個人發(fā)布自己的創(chuàng)作。最后只需戴上AR眼鏡就能體驗。
整個過程下來,一個10平米左右的空間,只需10分鐘就能搞定。
據(jù)介紹,靈境的內(nèi)容渲染也是基于Rokid自己的3D渲染引擎,這樣可以極大降低整個內(nèi)容創(chuàng)作、落地的時間和人力成本。
要知道,目前AR內(nèi)容創(chuàng)作的落地過程,基本上都還是一個長鏈條流程。
需要有一定的產(chǎn)品資源、開發(fā)資源和內(nèi)容創(chuàng)作資源,然后再由專業(yè)團隊打包資源到現(xiàn)場測試,最后進行驗收。常被使用的創(chuàng)作工具如Unity、UnrealEngine,在使用上也有門檻,要求用戶具備一定的開發(fā)基礎能力。
而且靈境還強調(diào)一大特點:協(xié)同合作。
不僅實現(xiàn)了多端一致,即在手機、PC、AR眼鏡上都能看到創(chuàng)作內(nèi)容空間;也實現(xiàn)了讓多人參與到同一空間內(nèi)的AR創(chuàng)作。
這個定位明顯更偏向于大眾化,行業(yè)內(nèi)用戶和普通消費者都能上手體驗,與此同時也會提出一些新的要求,如高并發(fā)需求、終端算力、內(nèi)容創(chuàng)作效果等。
那么問題來了——
靈境是如何實現(xiàn)的?
這背后其實是一整套技術棧的全方位升級,包括硬件、系統(tǒng)、云服務、算法等。
首先來看硬件方面,這一次配合靈境的發(fā)布,Rokid將AR眼鏡從傳統(tǒng)“雙魚眼+RGB三攝方案”升級為“單攝RGB輕量化SLAM”。
單目方案的好處很直接:結構簡單、硬件設計復雜度降低、主板面積小、成本功耗比大幅降低,用戶側能直接感受到佩戴舒適度和續(xù)航能力上的提升。
在落地應用上,據(jù)悉靈境搭載的硬件也是只有一個攝像頭的。
因為把相機數(shù)量壓縮到最后一個,單目方案可以帶來更低功耗、更簡結構,更低成本等諸多優(yōu)勢,舒適的佩戴和更普惠的價格,符合靈境的“讓AR更普惠”的需求。
但單目方案也確實有短板,比如它無法得到絕對的尺度信息,所以需要通過初始化恢復尺度信息,而初始化的好壞直接影響算法最終的精度。單目計算絕對尺度準確性不夠高,尺度收斂也有不確定性,這些對單目SLAM算法開發(fā)帶來很大的挑戰(zhàn),會直接影響到AR體驗。
不過Rokid表示,目前行業(yè)內(nèi)已經(jīng)出現(xiàn)了相應的解決方案。
算法上,在IMU的輔助下,單目的靜態(tài)初始化和動態(tài)初始化已經(jīng)有了很多方案,初始化完畢以后基本上獲得比較精確的絕對尺度先驗。再結合比如基于濾波的算法,可以在后期使用過程中對各種SLAM參數(shù)持續(xù)優(yōu)化,進一步提升算法的定位精度,同時基于深度學習的技術在SLAM算法上也有很多技術探索。
由此,也能感受到Rokid的理念是:AR產(chǎn)品不僅僅只是堆疊傳感器,而是軟件、硬件、算法和場景作為整體,給用戶提供更舒適的AR綜合體驗。
軟件方面的提升,主要體現(xiàn)在3D點云和SLAM方面。
并利用端云協(xié)同的方式平衡了算力、功耗和高并發(fā)幾個方面的要求。
Rokid應用平臺中心部門負責人Watson介紹說:
基于3D點云的視覺定位技術和設備端的SLAM技術(Simultaneous localization and mapping,同步定位和地圖構建),可以類比自動駕駛中的道路高精地圖和車輛空間感知。
在AR場景下,也有一些開發(fā)者拿點云作全局的粗定位,拿SLAM做局部精定位,兩個松耦合在一起。
Rokid這次將這個松耦合,做了更深度的融合。實現(xiàn)了端上只做定位和跟蹤,云上空間建圖。
這種端云協(xié)同協(xié)作計算的方式,可以提升一些場景下的定位精度,如弱紋理、環(huán)境有變化的場景,同時也能降低移動端的計算功率。原理上主要利用了RTC(Real time communication,實時通信)在弱網(wǎng)對抗/低時延傳輸和視頻圖像壓縮上具備的優(yōu)勢。
緊耦合的實現(xiàn),依靠了Rokid全新升級的底層操作系統(tǒng)YodaOS-Master。
具體變化體現(xiàn)在XR系統(tǒng)、XR云服務和XR硬件三個層面。
系統(tǒng)全方位升級后,Rokid可以搭建一個更加完整閉環(huán)的OS生態(tài),以此更好連接開發(fā)者和消費者。
深扒完靈境的技術棧后不難發(fā)現(xiàn),Rokid此次發(fā)布是有備而來。
最核心的目的十分明確:降低AR內(nèi)容創(chuàng)作門檻,壯大AR內(nèi)容創(chuàng)作隊伍。
僅需一部手機即可體驗,耗時縮短到10分鐘,這確實是每個人幾乎都能滿足的條件,還有機會感受到所謂“真正的AR”到底是什么形態(tài)。想一想,確實能吸引一波好奇者了。
由此也讓人開始好奇,為什么要在此刻正式推出靈境?又為什么要主打降門檻?
答案還是要從市場需求、AR行業(yè)發(fā)展及行業(yè)玩家經(jīng)驗驗證幾個維度看起。
為什么要做靈境?
最直接的影響因素還是來自于市場需求。
Rokid副總裁、數(shù)字文化事業(yè)部負責人陳希表示,目前在文博文旅領域,對AR內(nèi)容的需求非常突出,她給出了一個很驚人的數(shù)據(jù)來說明:
今年春節(jié)期間在文博場景體驗過Rokid AR的人數(shù)達到了4萬人。
全國范圍內(nèi),如廣東省博物館、西安博物院、陜西自然博物館、蘇州博物館、良渚古城遺址公園等都陸續(xù)推出了AR導覽。
AR會在文博領域快速進入的原因也很好理解,它能極大程度上豐富3D空間內(nèi)的內(nèi)容豐富度,并將文化知識以更加直觀、豐富、多樣的方式呈現(xiàn)到參觀者面前。
而全國登記在冊的博物館數(shù)量就超過了6000家,隨著越來越多博物館提出需求,過去長鏈條的內(nèi)容生產(chǎn)模式,難以快速響應。更何況這種以方案落地的模式,對人力物力成本的要求也很高。
因此,市場上亟需一個能高效易上手的生產(chǎn)力工具,能夠加速AR內(nèi)容的創(chuàng)作,并降低成本。
另一邊,在工業(yè)方面類似的情況。
Rokid副總裁、產(chǎn)品技術中心負責人江濤介紹說,和文博場景有些相似,在工業(yè)生產(chǎn)一線上,也希望能夠在3D空間里盡可能展示更多信息。
這樣一線人員進行操作時,不用再專門走到一些儀表前查看數(shù)據(jù)、核對情況,而是直接在工作現(xiàn)場就能看到所需信息。
用江濤的話來說,從工業(yè)元宇宙的大概念出發(fā),完成數(shù)字化轉型是做完了工業(yè)元宇宙的基建,將整合分析好的數(shù)據(jù)再重新反饋到現(xiàn)場,才真正走完了一整個閉環(huán)。
由于工業(yè)場景天然對降本增效提出更高要求,因此工業(yè)場景內(nèi)AR的需求和市場可能會更大。
在很多工廠中,許多條真實的AR生產(chǎn)線已經(jīng)被搭起來了:
此外,在教育領域,用上AR輔助教學也逐漸普及開來。
比如基于AR的安防教育,就不再只是書面、視頻形式的灌輸了。小朋友們可以在模擬的火災場景里學習如何逃生,記憶點會更加深刻,教育的效果自然也會更好。
而在這一場景內(nèi),學校老師往往是需要基于課程要求,持續(xù)更新AR內(nèi)容的,一個基于手機就能用的低門檻內(nèi)容生產(chǎn)工具,也確實符合真實需求。
如上是市場方面帶來的直接需求。
更深層的影響因素,是AR現(xiàn)階段進化的要求。
一直以來,AR原生內(nèi)容生態(tài)匱乏都常常被人吐槽,成為很多人不愿意體驗AR設備的一大原因。
和手機借生態(tài)?雖然內(nèi)容豐富度短期上來了,但是展現(xiàn)的內(nèi)容更多局限在2D層面,真正的AR內(nèi)容沒有被展現(xiàn)出來,還會讓人覺得AR眼鏡的終途就是手機配件?
由此,對于AR行業(yè)而言,幾乎所有人都意識到豐富內(nèi)容生態(tài)是當下發(fā)展的重中之重。如蘋果在最早期探索AR時,也是率先發(fā)布了AR Kit開發(fā)平臺,把APP Store的打法繼續(xù)用在AR領域。
畢竟只有內(nèi)容豐富了,用戶才會被吸引過來,AR才有機會向前更進一步。那么眼下的問題就變成了如何豐富AR原生內(nèi)容。
僅憑AR廠商一己之力顯然效率不夠高,過去多年來探索出的AR交互場景還是非常有限。
號召更多開發(fā)者和創(chuàng)作者加入,正在逐漸成為行業(yè)內(nèi)的共識,并且要把使用門檻和成本都打下來。
由此也就不難理解,作為行業(yè)內(nèi)的資深玩家,Rokid選擇推出靈境這樣一個AR空間引擎。
但,為什么是現(xiàn)在?
Rokid給出的回答是:自身在文博領域的經(jīng)驗積累,驗證了市場對于AR的真實需求。
陳希回憶起最初和良渚古城遺址公園的合作時,各種場景還歷歷在目。
她記得當Rokid和園方提出,可以利用AR來對文物遺址進行修復時,園方立刻表示很感興趣。整個項目從最初提出到落地,前后經(jīng)歷了3個月左右,最終在2020年國慶期間和大眾見面。
最開始,Rokid一天提供了200副AR眼鏡的租賃,結果一個小時左右設備就全被租出了。并且對AR好奇的人群,很多都是老人和小孩,這也出乎了Rokid的預料。
而有了真實場景的應用,其實能從第一線積累到非常寶貴的開發(fā)經(jīng)驗。比如在設想里人們都會按照導覽順序參觀,但實際不是如此,Rokid就要保證亂序參觀也不會影響AR效果的展現(xiàn)。以及針對博物館室內(nèi)燈光條件不好的情況,技術團隊也專門做了優(yōu)化……最終這些優(yōu)化和迭代,一并體現(xiàn)在了靈境的設計里。
陳希也感慨說,不可否認當下還不是所有人都愿意花上千元去購買一個專門的設備來體驗AR,但是如果只花50塊錢通過租借,是很多人都愿意嘗試的。
那么等到未來,應用場景足夠多時,價值就會慢慢體現(xiàn),那個時候可能就到了AR真正走向C端的時刻。
由此也就不難理解,為什么靈境會在此刻推出。
因為它能通過一個小杠桿,撬動龐大的開發(fā)者和創(chuàng)作者群體,發(fā)動數(shù)以百計、數(shù)以千計的人,共同探索廣闊的AR內(nèi)容和應用場景。
并以此助推AR更快速走向大眾群體,成長為真正意義上的下一代移動計算終端設備。
靈境會帶來什么?
作為一款AR原生內(nèi)容生產(chǎn)力工具,靈境的出現(xiàn)向行業(yè)內(nèi)外傳遞了一個信號:
是時候發(fā)展AR的內(nèi)容生態(tài)了。
并且不再是和手機或其他終端借生態(tài),而是從AR自身出發(fā),能夠展示“什么叫真正的AR”。
一方面,參考目前移動計算終端的絕對霸主智能手機,它正是在出現(xiàn)了爆款內(nèi)容應用后,才快速吸引了大量用戶。
另一方面,AR原生內(nèi)容和手機等終端內(nèi)容有本質(zhì)性區(qū)別,它需要是3D的。
如果一直和手機借生態(tài),那最終大眾對于AR的理解,可能只是手機的虛擬大屏,這會限制整個技術和產(chǎn)業(yè)發(fā)展的想象力,也會影響AR的獨立發(fā)展。
由此,開發(fā)AR原生內(nèi)容是當下必須做的事。
盡管目前在算力、硬件等條件的制約下,AR內(nèi)容還無法一下達到大家的最終期待。但誠如Windows最初,不也是只有掃雷、蜘蛛紙牌這樣的簡單應用嗎?
我們需要給予技術足夠的耐心,等待變化發(fā)生。
更何況,端云一體的思路,確實為解決當下算力問題提供了新解法。
如果再從AR行業(yè)外的角度來看,靈境的出現(xiàn)也為廣大開發(fā)者和創(chuàng)作者提供了一個新的機遇。畢竟每一代移動計算終端的崛起,都會伴隨一大批非常優(yōu)秀的內(nèi)容應用和軟件涌現(xiàn)。
總之,在AR向前推進的這條路上。還會不斷有新的行業(yè)角色、技術力量加入進來,共同推動AR駛向我們的終極想象:真正意義上面向大眾的增強現(xiàn)實。
你覺得呢?