2022,人工智能開啟未來新密碼
購買大型電器、汽車,你是否會詢問有沒有智能語音功能?是的,潛移默化中人們已經(jīng)不再將人工智能當(dāng)作魔術(shù),而是習(xí)以為常的東西。從AlphaGo以四比一戰(zhàn)勝棋王李世石,讓人們第一次意識到人工智能真的可以超越人類,也讓人們對AI的未來前景充滿期待。
近年來,以深度學(xué)習(xí)為代表的人工智能技術(shù)高速蓬勃發(fā)展,新算法層出不窮,圖像識別、自然語言、聲音克隆等智能水平逼近甚至超過人類。同時人工智能技術(shù)的發(fā)展,也促進(jìn)著人類對數(shù)據(jù)以及算力的不斷突破。AI技術(shù)各類應(yīng)用落地,滲透到我們生活的方方面面,已然成為我們不可缺少的一部分。
1.2021回顧
回顧跌宕起伏的 2021年,新冠疫情仍然肆虐著世界,看不到疫情結(jié)束的信號。疫情帶來國際形勢的突然變化,深刻地影響著全球半導(dǎo)體產(chǎn)業(yè)鏈及生態(tài),同樣對人工智能行業(yè)帶來沖擊。國際間的算力競爭異常激烈,如果算力不在一個維度上,競爭力自然就不在一個維度上。2021年我國因為芯片不足導(dǎo)致供應(yīng)鏈斷裂的事件此起彼伏,因此數(shù)字化、智能化轉(zhuǎn)型被列為國家重點發(fā)展規(guī)劃中,已成為大勢所趨。
疫情雖然還沒有結(jié)束,但絲毫不影響2021年人工智能領(lǐng)域洶涌澎湃的發(fā)展,振奮人心的消息頻頻傳來。
商湯科技,成為國內(nèi)「AI四小龍」中第一家IPO成功的上市公司;AphaFold2 成功預(yù)測 98% 蛋白質(zhì)結(jié)構(gòu);無人駕駛領(lǐng)域,技術(shù)和算法層面的不斷突破讓 L4場景落地日益成熟,掌握自動倒車、搶道行駛等眾多接近人類駕駛的行為。
2021年10月,中國科學(xué)技術(shù)大學(xué)潘建偉、陸朝陽、劉乃樂等組成的研究團(tuán)隊與中國科學(xué)院上海微系統(tǒng)與信息技術(shù)研究所、國家并行計算機工程技術(shù)研究中心合作,構(gòu)建了113個光子144模式的量子計算原型機“九章二號”,完成對用于演示“量子計算優(yōu)越性”的高斯玻色取樣任務(wù)的快速求解,求解速度比目前全球最快的超級計算機快10的24次方倍(億億億倍)。我們正處在人類技術(shù)爆炸時期,人工智能賽道相信也必將獨占鰲頭。
多模態(tài)
多模態(tài)學(xué)習(xí)旨在使計算機擁有處理不同來源信息的能力,近年來成為了人工智能領(lǐng)域的研究熱點。將不同模態(tài)信息進(jìn)行融合,學(xué)習(xí)不同模態(tài)信息之間的關(guān)聯(lián)。2021年是OpenAI實現(xiàn)圖像和文本匹配的CLIP和根據(jù)輸入文本生成對應(yīng)圖像的Dall·E開啟了多模式學(xué)習(xí)的重要一年。同時DeepMind的Perceiver IO對文本、圖像、視頻和點云實現(xiàn)分類以及斯坦福大學(xué)的ConVIRT在醫(yī)療X光影像中添加了文本標(biāo)簽,都預(yù)示著多模態(tài)學(xué)習(xí)正在崛起并且滲入到其他領(lǐng)域。
Facebook也表示在其仇恨言論檢測器中也使用了多模態(tài)學(xué)習(xí),用以刪除了社交網(wǎng)絡(luò)中97%的辱罵以及有害內(nèi)容。該系統(tǒng)能根據(jù)文本、圖像和視頻在內(nèi)的10種數(shù)據(jù)類型,將模因和其他圖像文本配對歸類為良性或有害。同時谷歌也表示在搜索引擎中添加了多模態(tài)(及多語言)功能,實現(xiàn)了多任務(wù)統(tǒng)一模型能返回文本、音頻、圖像和視頻鏈接,以響應(yīng)75種語言中任意一種的查詢等。
巨大模型
讓機器去理解人類語言一直以來都是人工智能的核心夙愿,只有將人腦獨有的自然語言賦予機器,才能真正讓機器“活”過來。隨著OpenAI去年提出GPT-3模型,在各大平臺引起熱議,讓我們似乎觸摸到了上帝的領(lǐng)域。GPT-3模型比全球最大深度學(xué)習(xí)模型 Turing NLP 大上十倍,而且不僅可以更好地答題、翻譯、寫文章,還帶有一些數(shù)學(xué)計算的能力。根據(jù)論文所述,GPT-3是一種具有1750億個參數(shù)的自然語言深度學(xué)習(xí)模型。
就在大家還沉浸在GPT-3模型龐大參數(shù)量的時候,谷歌Switch Transformer開啟了2021年首個超過1萬億參數(shù)的模型,參數(shù)規(guī)模高達(dá)1.6萬億。隨后北京智源人工智能研究院推出更大的、擁有1.75萬億參數(shù)規(guī)模的大模型悟道2.0。資金雄厚的人工智能公司正以狂熱的速度堆積參數(shù),既為提高性能,也為秀肌肉,特別是在語言模型中,互聯(lián)網(wǎng)為無監(jiān)督和半監(jiān)督的預(yù)訓(xùn)練提供了大量無標(biāo)簽的數(shù)據(jù)。然而模型從“大”走向“巨大”的確可以使得效果越來越好,但同時帶來更多的問題與挑戰(zhàn)。
(1) 數(shù)據(jù)挑戰(zhàn):巨大的模型需要海量的數(shù)據(jù),但網(wǎng)絡(luò)和數(shù)字圖書館來源缺乏高質(zhì)量的數(shù)據(jù)。例如,研究人員常用的BookCorpus是一本由11000本電子書組成的數(shù)據(jù)集,用于訓(xùn)練30多種大型語言模型,它可能會傳播對某些宗教的偏見。人工智能社區(qū)越來越意識到數(shù)據(jù)質(zhì)量至關(guān)重要,但在收集大規(guī)模高質(zhì)量數(shù)據(jù)集的有效方法上尚未達(dá)成共識。對于巨大模型而言,海量高質(zhì)量數(shù)據(jù)采集成為了避不開的屏障。
(2) 速度與效率:當(dāng)前人類的硬件水平雖然在不斷突破,但是仍然跟不上巨大模型的需要。Switch Transformer背后的谷歌團(tuán)隊為了降低延遲開發(fā)了一種方法,讓每個token處理模型層的選定子集。他們的最佳模型比參數(shù)量只有1/30的模型快了約66%。同時,微軟開發(fā)了DeepSpeed庫,這個庫并行處理數(shù)據(jù)、各層和層組,并通過在CPU和GPU之間劃分任務(wù)來減少冗余處理。然而最好的解決方案仍然是提升硬件的效率,人類必須要對算力進(jìn)行不斷突破。
(3) 巨大耗能:訓(xùn)練如此巨大的模型會消耗大量電能。2019年的一項研究發(fā)現(xiàn),在8個英偉達(dá)P100 GPU上訓(xùn)練2億參數(shù)的Transformer模型所造成的碳排放,幾乎和一輛普通汽車五年駕駛總排放量一樣多。如何降低訓(xùn)練巨大模型消耗電能的問題已經(jīng)擺在所有人面前。目前有望加速人工智能的新一代芯片,如Cerebras的WSE-2和谷歌的最新TPU,可能有助于減少排放。同時,算力已然成為國家的基礎(chǔ)建設(shè)一部分,算力導(dǎo)致的能耗問題也敦促著需要更多的去使用風(fēng)能、太陽能等更清潔的能源。
計算機視覺
計算機視覺目前作為人工智能進(jìn)步最多、發(fā)展最快的領(lǐng)域,一直沖在賽道最前面。根據(jù)Grand View Research的數(shù)據(jù)顯示,2020年全球計算機視覺市場規(guī)模為113.2億美元,預(yù)計2021年至2028年將以7.3%的復(fù)合年增長率擴大。目前競爭比較激烈的計算機視覺子領(lǐng)域有:場景重建、目標(biāo)檢測、事件檢測、視頻跟蹤、目標(biāo)識別、3d姿態(tài)估計、運動估計、視覺伺服、3d場景建模、圖像修復(fù)。
作為上市公司的商湯科技提供的OpenMMLab是迄今為止最完備的計算機視覺算法體系和框架——“人工智能算法開放體系”,涉及超過10種研究方向,開放超過100種算法、600種預(yù)訓(xùn)練模型。現(xiàn)如今OpenMMLab逐漸從單點單個方向的開源和單篇論文的開源走向日趨蓬勃的開源體系,成為底層訓(xùn)練框架、計算平臺與科研、教學(xué)和算法生產(chǎn)的重要橋梁和紐帶,極大加速AI科研和產(chǎn)業(yè)化的進(jìn)程。
強化學(xué)習(xí)
強化學(xué)習(xí)可以說是最貼近人類學(xué)習(xí)過程的AI了,換位思考一下,我們從小到大不斷地學(xué)習(xí),就是一個不斷試錯的過程。強化學(xué)習(xí)就像一個真實的孩子,自我生長,不需要大量的歷史數(shù)據(jù)做引導(dǎo),只有不需要監(jiān)督的學(xué)習(xí)才是人工智能最好的形態(tài)。
強化學(xué)習(xí)理論收到人類行為主義心理學(xué)啟發(fā),側(cè)重在線學(xué)習(xí)并試圖在探索-利用(exploration-exploitation)間保持平衡。不同于監(jiān)督學(xué)習(xí)和非監(jiān)督學(xué)習(xí),強化學(xué)習(xí)不要求預(yù)先給定任何數(shù)據(jù),而是通過接收環(huán)境對動作的獎勵(反饋)獲得學(xué)習(xí)信息并更新模型參數(shù)。過去幾年中,無論是Facebook、Google、Deepmind、Amazon還是Microsoft,他們都投入了大量時間、金錢、人力來推動強化學(xué)習(xí)的不斷創(chuàng)新。
2.國內(nèi)的各大AI云平臺涌現(xiàn)
隨著人工智能的日益火爆,國內(nèi)大廠們紛紛在AI領(lǐng)域布局。AI開放平臺已經(jīng)和當(dāng)初的云計算平臺一樣,如雨后春筍般涌現(xiàn)。AI開放平臺已經(jīng)成為了企業(yè)重要的基礎(chǔ)建設(shè)。列舉目前國內(nèi)比較有代表性的AI開放平臺:
- 百度飛漿
- 阿里云人工智能平臺
- 騰訊AI開放平臺
- 科大訊飛開放平臺
- 華為云ModelArts
- 曠視Face++
- 360人工智能研究院
- 網(wǎng)易人工智能
AI云平臺的本質(zhì)仍然延續(xù)了大數(shù)據(jù)時代經(jīng)典的租賃模式,似乎讓我們回到了幾年前大數(shù)據(jù)風(fēng)起云涌的年代。而AI云平臺的優(yōu)勢在于讓越來越多開發(fā)者對AI有更簡單直觀的認(rèn)識,他提供了許多頂會模型供大家學(xué)習(xí)的同時,也提供了開發(fā)者將自己作品上傳展示的平臺。
讓AI不再離我們遙遠(yuǎn),成為人人都可以使用的東西。只有成熟的社區(qū)文化,才能孕育出新的創(chuàng)作者,也讓市場上出現(xiàn)越來越多的人工智能產(chǎn)品,AI云平臺核心意義就在這里。
3.2022趨勢
創(chuàng)立17年的Facebook在美國時間2021年10月28日正式宣布改名為“Meta”,如一個重磅炸彈,在業(yè)內(nèi)引起了驚濤駭浪。扎克伯格用實際行動向大家宣布,元宇宙已經(jīng)來了。隨之而來的2022年,將迎來人工智能新一輪趨勢風(fēng)暴。
元宇宙真正意義上的拐點
如果說2021年人們認(rèn)為元宇宙還只是妄想家的一廂情愿,那么2022年將真正開始顛覆人類對“世界”兩個字的理解。所以筆者認(rèn)為2022年可以成為元宇宙真正意義上的拐點。在技術(shù)角度看,元宇宙主要技術(shù)群有:網(wǎng)絡(luò)以及算力技術(shù)、人工智能、游戲技術(shù)、顯示技術(shù)(VR、AR、MR甚至是XR,體驗不斷深化)、區(qū)塊鏈技術(shù)。而筆者認(rèn)為,人工智能將會是整個元宇宙的核心,甚至是元宇宙的母體或者說是大腦。為了演化真正的社會形態(tài),需要母體不斷自我學(xué)習(xí),而不是設(shè)定各種各樣的規(guī)則不斷修補社會形態(tài)。就像《失控玩家》電影一樣,由母體創(chuàng)造的NPC也會隨著社會形態(tài)的演變而進(jìn)化。
根據(jù)Bloomberg Intelligence預(yù)測,元宇宙的投資與價值只會在未來幾年不斷增長,到2024年價值將高達(dá)8000億美元。在如此大的宏利明前,只會讓市場不斷敦促人工智能產(chǎn)能不斷突破。
算力革命
隨著全球自動駕駛需求不斷擴大,圍繞大算力芯片的競爭2022年將異常熱鬧。因為今年,英偉達(dá)自動駕駛芯片Orin將量產(chǎn),高通Snapdragon Ride也將量產(chǎn),而中國創(chuàng)業(yè)企業(yè)的大算力芯片也將量產(chǎn)。楊宇欣給出了一組數(shù)據(jù):2014—2016年特斯拉ModelS的算力為0.256TOPS,2017年蔚來ES8的算力是2.5TOPS,2019年特斯拉Model3算力為144TOPS,2021年智己L71070TOPS,2022年蔚來ET7是1016 TOPS。這組數(shù)據(jù)進(jìn)一步印證了這樣一個事實:智能駕駛每前進(jìn)一小步,后面都需要算力前進(jìn)一大步。算力的作用不單單體現(xiàn)在汽車行業(yè),2021年11月8月,阿里巴巴達(dá)摩院公布了多模態(tài)大模型“M6”的最新進(jìn)展,其參數(shù)已從萬億躍遷至10萬億,成為全球最大的AI預(yù)訓(xùn)練模型。在10月,M6再次突破業(yè)界極限,使用512顆GPU,在10天內(nèi)就訓(xùn)練出了具有可用水平的10萬億模型,相比2020年發(fā)布的大模型GPT-3,M6實現(xiàn)了同等參數(shù)規(guī)模,能耗卻只有1%。
越來越強大的算力是更智能人工智能模型可用的基礎(chǔ),隨著人工智能行業(yè)不斷發(fā)展,不只是技術(shù)的革命,更加是算力的革命。兵馬未動糧草先行,算力作為人工智能模型的主要消耗品,決定著人工智能邁進(jìn)的速度。就在2021 年 11 月,摩爾線程宣布已完成 20 億元人民幣 A 輪融資。該輪融資由上海國盛資本、五源資本、中銀國際旗下渤海中盛基金聯(lián)合領(lǐng)投,建銀國際、前海母基金、等九家機構(gòu)聯(lián)合參投。在宣布該輪融資的同時,摩爾線程同時宣布其首顆全功能 GPU 芯片如期研制成功,且已經(jīng)開始適配國產(chǎn)主流 CPU 和操作系統(tǒng)。所籌資金將重點用于首顆 GPU 芯片的批量生產(chǎn)與制造、GPU SOC 相關(guān)聯(lián)的 IP 研發(fā)、以及國產(chǎn) GPU 生態(tài)系統(tǒng)的拓展等。隨著算力革命的打響,各國都將投入大量的資本和人力,這場沒有硝煙的戰(zhàn)爭會將人工智能推上全新的高度。
AI門檻降低帶來工業(yè)生產(chǎn)全面應(yīng)用
隨著AI的不斷發(fā)展,人類算力的不斷提升,AI的使用門檻也越來越低。如智能語音系統(tǒng)、智能客服等商業(yè)落地,比比皆是。另一方面如短中長視頻業(yè)務(wù),在全球仍保持著較高的增長速度,視頻內(nèi)容創(chuàng)作者和內(nèi)容消費者活躍度非常高。其中作為全球最火的手機應(yīng)用“抖音”,大量的視頻智能處理技術(shù)可以幫助創(chuàng)作者更好地創(chuàng)作作品。另外,北京冬奧會中AI虛擬氣象主播、AI手語主播、場館智能向?qū)А⒅悄苷Z言翻譯、鷹眼裁判、AI運動員訓(xùn)練系統(tǒng)等等都是人工智能全面應(yīng)用的體現(xiàn)。
預(yù)訓(xùn)練大模型降低了 AI 應(yīng)用的門檻,解決了 AI 應(yīng)用的兩個難題:數(shù)據(jù)和行業(yè)知識。它既不需要大量的標(biāo)注數(shù)據(jù),又保障了基礎(chǔ)底座。所以擺在企業(yè)家面前的最大問題不再是技術(shù)如何突破,而是商業(yè)模式如何建立,商業(yè)閉環(huán)如何落地,以及技術(shù)轉(zhuǎn)化為產(chǎn)品的效率。
科學(xué)界AI技術(shù)將作為新生產(chǎn)工具
根據(jù)阿里巴巴達(dá)摩院對2022年十大科技預(yù)測,其中趨勢一就是:AI for Science。
引用:實驗科學(xué)和理論科學(xué)是數(shù)百年來科學(xué)界的兩大基礎(chǔ)范式,而人工智能正在催生新的科研范式。機器學(xué)習(xí)能夠處理多維、多模態(tài)的海量數(shù)據(jù),解決復(fù)雜場景下的科學(xué)難題,帶領(lǐng)科學(xué)探索抵達(dá)過去無法觸及的新領(lǐng)域。人工智能不僅將加速科研流程,還將幫助發(fā)現(xiàn)新的科學(xué)規(guī)律。預(yù)計未來三年,人工智能將在應(yīng)用科學(xué)中得到普遍應(yīng)用,在部分基礎(chǔ)科學(xué)中開始成為科學(xué)家的生產(chǎn)工具。
沒錯,除了DeepMind在2021年初開源了AlphaFold2,并且能夠預(yù)測出98.5%的蛋白質(zhì)結(jié)構(gòu)。2021年12月,DeepMind首次利用人工智能幫助數(shù)學(xué)家們提出了兩個全新的數(shù)學(xué)猜想,登上Nature封面。作者猜測低維拓?fù)渲写嬖谖粗姆蔷€性關(guān)系,產(chǎn)生了很多數(shù)據(jù)并用神經(jīng)網(wǎng)絡(luò)擬合了近似函數(shù),發(fā)現(xiàn)其中三個量在擬合過程中起到了很重要的作用。通過反正做擬合實驗,產(chǎn)生新的數(shù)據(jù),得到新的觀察模型,最終數(shù)學(xué)家利用智慧猜出了一個不等式結(jié)構(gòu),并進(jìn)一步給了嚴(yán)格的證明。
由此可見人工智能成為了科學(xué)家新生產(chǎn)工具之后,不但可以加速科學(xué)發(fā)展的進(jìn)度,更加可以讓人工智能創(chuàng)造新的設(shè)想,甚至讓某些科學(xué)產(chǎn)生新的方向。
4.小結(jié)
2022年必然會成為人工智能技術(shù)爆發(fā)的一年,我們有可能會見證以前從未有過的成果。人工智能深入我們的生活,給我們帶來更多便捷的同時,也帶來更多的挑戰(zhàn)和機遇。