鄧紫棋「跨越紅海」幕后,竟是英偉達AIGC黑科技!
這幾天,由ChatGPT引發的搜索引擎大戰,谷歌和微軟是打得火星四濺。
我們即使隔岸觀火,也能深切感受到:這股AIGC的熱潮,恐怕會永遠改變人類社會的運作方式。
昨天,以「生成式AI大爆發」為主題的新智者Talk第二期正式上線。
新智者Talk由新智元創始人楊靜女士主持,本期嘉賓是英偉達中國區Omniverse負責人何展。
生成式AI大爆發
在主持人和嘉賓相繼陽康之后,新智者Talk新一期節目終于開錄了。這一期的主題是「生成式AI大爆發」。
其實,就在節目籌備期間,生成式AI已經經歷了幾代的迭代和進化,可以說,它進化的速度比節目籌備的速度還要快。
2022年,就在我們人類卷來卷去的時候,AI也在悄悄進化,因此,2022年成為了生成式AI的大爆發年。
有兩件事,可以充分證明生成式AI的火爆。
比如國內知名搖滾樂隊——萬能青年旅社的作品《殺死那個石家莊人》,忽然在B站火出了圈。原因竟然是,它的每一句歌詞都被AI配上了畫面。
另一件事,應該是很多人耳熟能詳的了。美國的一個游戲設計師,他用AI畫了一幅畫,然后用這幅畫去參加了藝術類比賽,竟然得到第一名。這也是有史以來,AI首次在藝術方面打敗人類。
同樣,英偉達Omniverse的強勢迭代也體現了這一點。現在,用戶可以很方便的用數字化來實現數字孿生和虛擬數字人的制作,這為元宇宙的構建夯實了基礎。
鄧紫棋「跨越紅海」,英偉達虛擬舞臺加持
楊靜女士提出一個十分有趣的說法:過去這半年時間里,人類在卷來卷去,而AI其實也被卷到了舞臺上。
比如2023年江蘇衛視的跨年演唱會,在鄧紫棋演唱《啟示錄》中的《Gloria》時,身邊突然出現萬丈波濤的海浪,就是由AIGC的技術和AR技術來生成的。
這個視覺呈現,是讓我們中國的億萬觀眾都能親眼看到的,來自元宇宙的震撼。
而這個舞臺背后,就有英偉達的一些黑科技作為支撐。何展就做了現場解密。
比如,這個海水特效,就是內容生成重要的應用方向。這個舞臺利用了XR技術,還結合了最新的AIGC生成的技術,為我們呈現出一場華麗的視覺盛宴。這些技術背后,還包括圖形學的進步。
第二個黑科技,就是英偉達在AI深度學習加速算法上的一些優化。舞臺上看,就是大規模訓練模型來去迭代成型的效果。
比如說海水,就需要大量的模擬,需要更多的模型訓練數據集。最終在舞臺上呈現出來后,就能讓觀眾在欣賞到美妙歌聲的同時,還能身臨其境。
AIGC的三個節點
基于以上這些背景,楊靜女士向何展提問道:在這樣快速、強勢的迭代背后,在這一輪生成式AI的浪潮當中,人工智能生成內容(AIGC)背后是什么算法支撐的?它對算法和算力有什么要求,讓年輕人能借此沖浪耍酷呢?
何展從好幾個角度,對此做了精彩的解答。
首先,AIGC和生成式AI的概念,離我們并不遙遠。有幾個歷史節點,可以讓我們更好地把握AIGC發展的脈絡。
早在1957年,就有了第一首由人工智能創作的弦樂四重奏——《伊利亞克組曲》,這就是最早的人工智能音樂。
當時間推到2007年,紐約大學出版了一本由人工智能創作的小說。雖然里面有各種邏輯錯誤和各種模糊的情節劇情,但是它是第一個完全由AI完成的小說。
下一個時間點是2014年,在這一年,GAN(生成式對抗網絡)出現了。
這三個時間點,恰好正是生成式AI或者AIGC不同的迭代階段。
這其中有一個非常有意思的事,不知讀者發現沒有——
在AI發展的第一個階段,也就是第一首AI生成樂曲《伊利亞克組曲》的誕生,到第一本AI創作的小說,經歷了50年時間;但是從第一本AI生成的小說到出現GAN網絡,只過去了7年時間。
而在近幾年,尤其是這半年時間,生成式AI更是如雨后春筍般涌現。有文本成圖片的DALL-E2、Midjourney、Stable Diffusion等等。這些模型都是一兩周的時間在迭代,速度非常快。
深度學習技術的快速迭代,包括剛才提到2014年GAN的生成,大幅加速了生成式AIGC技術的發展。
年輕人該如何利用AIGC的技術呢?在何展看來,未來令人遐想無限。我們都可以看到,現在已經有越來越多的工作,都涵蓋了創意性的內容。
包括剛才說到的AI寫文章,作音樂,后期制作等,這些方方面面的應用,都可能給年輕人提供非常大的空間去開拓和發掘。
如果年輕人擁抱這些變化,持續地迭代自己的能力,在未來將會擁有潛力無限。
數萬億美金藍海
2022年是元宇宙爆發的一年,但還沒等元宇宙捂熱呢,AIGC這個新概念又以迅雷不及之勢走紅網絡。
紅杉資本的合伙人甚至還跟GPT-3合寫了一篇文章,預測AIGC將會形成一個數萬億美金的新賽道。
楊靜女士提問道:為什么2022年AIGC會乘上東風爆發?背后的技術邏輯和產業邏輯是什么?而元宇宙和AIGC又到底有什么異同呢?
何展對此解釋道,提起GPT-3,就必須提到它背后的參數——1750億個。
GPT-3剛發布時,很多研究人員和開發者都驚呆了。而就在一周前,有一篇關于GPT-4預熱的報道,提到GPT-4的參數能達到100萬億。
對于邁入百萬億參數級別的模型,未來由它創作出的內容會是什么樣子?這值得所有人期待。
而GPT-3、GPT-4之于元宇宙,承擔的就是一個內容生產的角色。
想讓元宇宙應用快速地迭代發展,就必須讓盡可能多的人參與進來。
舉個例子,如果想讓每個人都參與Omniverse平臺,就必須把技術門檻降低,讓人人都能用它創作出更多的作品。
這時,就需要能快速生成的工具,要又快又好,還要成本低廉。
那么生產力是從何而來呢?就是從生成式AIGC的工具。
現在,包括英偉達在內,很多公司都在做會議系統。視頻會議中有Maxine算法,如果你開著會想去喝水,算法就可以在你去喝水時,把你的人臉矯正成一張你的新臉,讓別人以為你一直在緊盯著屏幕。
嗯?等等,這不是摸魚嗎?
沒錯,其實,這就是摸魚。
在幾周前,英偉達還曾做過一個有趣的用戶交流。
有用戶說,自己想要這樣一個直播間,它是一個書房,書中要有一些相框或者藝術品,相框中有藍天、白云等等。
其實,這類要求并不像演播舞臺那樣苛刻,如今是完全可以實現的。
比如書房的壁紙,想要什么樣的風格和色調,都可以用工具輸入,就會產生實時的效果。
如今這些技術的進步,算是完全把個人的創造欲給激發出來了。
想象一下,以前你需要畫一幅油畫,現在直接可以讓AI去快速生成,這真的太夢幻了。
2023:AIGC元年
楊靜女士表示,這種設想真的讓人非常興奮,因為現在微博和微信上的視頻號背后,都有著上千萬甚至上億的用戶。如果能用AI來生成特效或視頻,無疑會激發很多人的創作欲。
那么,這個愿望能在2023年實現嗎?
何展引用了一個知名調研機構的報告,根據這個報告,目前生成式AI在整個人工智能生成的比例連1%都不到。因此,如果能在2025年達到10%,已經是很驚艷的成績了。
而在生物科學醫療領域,到2050年,藥物和材料由AI生成的占比可能會達到30%。
那么,在林林總總的生成式AI技術當中,哪些能夠成為殺手锏呢?AIGC什么時候能真正走向大眾,成為超級APP,又有哪些企業會贏得黃金的機會呢?
何展認為,最關鍵的地方在于,辨別這些應用到底需要哪些殺手級應用。
舉個例子,你需要設計一個電熱水壺,但又想偷懶摸魚,怎么辦?
現在,其實有不少大廠的3D模型生成工具,都可以實現這種設計的定制。
比如谷歌的DreamFusion和英偉達的Magic 3D,只需輸入一段文字就可以生成你想要的效果。
概括來說就是,只要能夠滿足設計師或工程師的需求,AIGC隨時都能爆發。
爽劇一鍵生成
顯然,生成式AI跟內容的融合更加緊密,在電商、傳媒、影視等行業,都可以用AI去助力視頻的劇本創作、游戲場景的生成、數字人輔助帶貨、XR商品展示等。
現在,幾句話就能生成一個劇本,甚至一個短視頻、小電影。而如果未來AIGC大規模落地,會給產業鏈的哪一環節帶來最大的影響呢?
何展回答說,最近視頻號上非常流行的爽劇,就是用爽文拍成的。但這個過程中的生產力,其實是缺乏的。
要知道,爽劇背后的制作人員,在中國大概有10萬人,這10萬人在整個制作鏈條的最末端,他們的作品倒了很多手,才真正成為舞臺上或熒幕上的作品。
這些制作人員非常辛苦,卻沒有得到太多收益。但是,如果爽劇能夠通過AIGC快速生產,就會帶動一批人進來。技術門檻降下來,生產力就起來了,自然會有一個閉環。
并且,不止的編劇,在藥物研發、教育等領域,都會有這樣一個制作、投放、產生經濟效益的閉環。
不過,楊靜女士提出一個非常關鍵的問題:既然爽文和爽劇能夠一鍵生成,會不會讓年輕人太過依賴這樣的工具,從而喪失想象力呢?
何展表示,可以肯定,AI工具并不會讓人喪失想象力。
比如,英偉達去年在杭州做了一個設計周的活動,現場就展示了一個叫「神筆馬良」的工藝——Nvidia Canvas。在左側勾勒出曲線,右側就可以通過你的輸入,讓AI腦補一個畫面。
簡單畫幾筆,右邊就會生成真實照片一樣的作品。
讓何展非常感動的是,在場的許多小朋友比大人要認真得多,非常的聚精會神。而很多大人是開玩笑或是羞澀的態度。
因而他們畫出的畫,比成人參展的畫作都要有想象力。
同樣一個AI工具,產生的作品卻截然不同。這就告訴我們:輸入的想象力不同,作品達到的效果是完全不一樣的。因此即使是科技迭代出來的工具,依然離不開人類的想象力和專注。
因此,生成式AI可以激發年輕人的想象力,讓思維不再被束縛,讓想象力插上翅膀。不論未來出現的工具多令人驚艷,最終的input還是取決于我們自己。
國內玩家群雄逐鹿
講到這里,就不得不提到,谷歌、微軟、Meta等大廠最近的群雄逐鹿。而OpenAI這樣的新晉獨角獸,也在最近憑ChatGPT掙足眼球,獲得微軟的100多億美元投資。
同時,國內的BAT等大廠,也都在AIGC領域搶跑。
哪些玩家會成為領跑者呢?2023年技術發展的最大看點又在哪里呢?
何展認為,國內的互聯網大廠,一定會有類似于ChatGPT的模型出來。
比如阿里的在線購物,騰訊的社交等等,可遐想的應用就非常多,而大廠也一定會重金投入的。
行星級算力,能生成動態「生命冊」
在節目尾聲,楊靜女士講起自己最近做的一個神奇的夢。在夢里,同學送給她一本相冊,把她一生中記憶最深刻的畫面用數字和圖像活靈活現地呈現出來,仿佛一本活生生的生命冊。
由此,楊靜有了一個奇妙的想法:能不能利用AIGC技術,把一個人一年、一生的影像自動生成一個虛擬相冊?如果我們想回顧自己的微博或朋友圈,一天一天地找這些記憶是很難的,而如果用AI回溯這些畫面,自動生成一個生命冊,就會容易得多。
何展表示,問題不大,就像手機有時會推送給我們一個moment,也是同樣的邏輯。
我們可以把自己過去這些年的資料作為input,然后輸入生成。而你可以要求溫情一點,或者歡快一點,生成的相集也會有相應的情緒表達。
楊靜女士談起自己曾經養過一只叫小豆豆的小狗,它在2020年去世了。她曾看過一個廣告,把狗的照片input給那個產品,它就會生成一個寵物狗一生的相冊。但特意找狗的相片會很麻煩,所以如果AI能從圖庫里自動尋找,肯定會滿足不少人的需求。
何展聽完很感動,他也認為,隨著工具進展得越來越快,會越來越多地進入普通人的生活,肯定會有新的行當出現,比如有些人會利用這些工具做成新的APP。
楊靜表示,我們的伙伴、寵物、親人,都是我們生命中的軟肋,也是最溫情的部分,這是人性最大的資產。
而未來的元宇宙除了有爽文和爽劇,還會出現規模龐大的虛擬城市,還有很多個性相異的虛擬明星,甚至并不是人類。
這些虛擬和真實明星的數字分身又可以生成新的數字相冊和虛擬電影,也就有了無數的生命冊,未來AIGC有能力生成一個新的數字行星、數字地球,甚至是包羅萬象的數字元宇宙嗎?
何展認為,一切皆有可能,暢想一下,所有這些技術,最終推動的還是生產力,而現在,大家的需求已經存在了,比如生成一個相冊,讓人回顧那些溫情的時刻。而用戶需要的是又快又好又便宜,比如十幾塊錢就能生成一個相冊。
在節目最后,楊靜女士總結道:黃仁勛掛在嘴邊的口頭禪就是「saving money」,所以又快又好又強的一個生成式AI,必定能夠顛覆人類的未來。
所以,在2023年,感謝生成式AI帶我們跨越了紅海,也帶我們去回顧我們人生當中溫馨的記憶,所以我們更加憧憬2023年生成式AI大爆發會帶來一個斑斕多彩的世界,以及一個充滿無限可能的、有行星級算力的元宇宙、新宇宙。