如何縮小中美通用大模型差距? 我在兩會看到了答案
“通用大模型關乎國運之爭”……
“人工智能+”首次出現在政府工作報告中,并直接上升為一種行動 。
雷軍劉慶峰等代表委員都將人工智能納入到自己的建議之中;
又是一年兩會進行時,AI大模型受到前所未有的關注。
彼時在大洋彼岸的另一邊,GPT-4正被最新大模型全面超越,Sora新視頻持續驚艷網友。
一時間,關于國產通用大模型未來發展、中美之間差距還有多少的話題再次引人注目。
既如此且先來看看,兩會都聊了啥?或許能從中找到答案。
人工智能火爆兩會
與開展“人工智能+”行動相呼應的是,20多位全國人大代表或政協委員都談到了大模型相關,覆蓋到從底層數據算力、模型層以及應用層的方方面面,為當前正面臨的挑戰建言獻策。
通用大模型又成為這其中的關鍵詞。這樣的盛況,以往并不多見。
在具體建議中,可以看到大概有三個方面:技術瓶頸、未來發展以及應用落地。
- 技術瓶頸:數據、算力和產業生態
當前國產大模型技術瓶頸還有哪些?包括科大訊飛董事長劉慶峰、知乎創始人周源、京東集團技術委員會主席曹鵬、中科院計算機所研究員張云泉等在內都發表了自己的看法。
知乎創始人周源談到了數據方面的挑戰,他認為對大模型數據采集進行監督和審查。
京東集團技術委員會主席曹鵬、中科院計算機所研究員張云泉等在內都談到了突破算力瓶頸,曹鵬鼓勵國產算力軟硬協同,張云泉提出了集中AI芯片研制、設立智能算力發展專項組等幾個方向的建議。
而科大訊飛董事長劉慶峰則從算力、底座平臺、源頭技術研發等維度介紹了我國發展大模型存在的短板,并建議制定國家《通用人工智能發展規劃》,來縮小中美通用人工智能產業的差距,打造我國的比較優勢。
- 未來發展:教育人才和政策法規也成關注焦點
技術之外,教育、人才建設、政策法規等方面也成為了代表們的關注焦點。
小米創始人雷軍提出了三項人才相關的建議:從義務教育階段普及人工智能素養教育;大力推進高校人工智能相關專業的建設;支持大型科技企業和教培機構培育人工智能應用型人才。
還有一些法律界人士,比如金杜律師事務所高級合伙人張毅,提出推進《人工智能法》的出臺。
- 應用落地:如何賦能千行百業?
值得一提的是,此次還有來自影視、體育、農村、養老、制造、文旅等各行業代表也都參與到對于人工智能發展的討論之中。
比如Sora對影視行業的影響,演員靳東在接受采訪時談到一些服務型的崗位可能會被替代,但短時間內,人工智能很難替代影視等創作行業。
還有像美的副總裁鐘錚、拈花灣文旅董事長吳國平、天能控股集團董事長張天任提到了人工智能在制造業、文旅、養老等行業的應用。
……
可以看到的是,大模型毫無疑問地成為此次兩會的焦點。在二十多位人大代表或政協委員的提案中,其實也能總結出當前國產大模型的發展縮影:技術挑戰仍在,人才政策得跟上,應用發展要加速。
中美差距還有多大?
ChatGPT的出現,國內掀起千模大戰,部分玩家的大模型在一年時間實現了對標GPT-3.5的實力,部分能力超過了GPT-4。
而Sora橫空出世,僅需通過文本即可自動生成1分鐘視頻,給視頻生成領域帶來了顛覆,其展現的性能對同類產品實現了碾壓……
于是乎,關于中美之間的差距是否進一步加大再次引發熱議。數據、算力、人才培養和投入成為這當中討論的焦點。
但中美差距具體還有多大?始終沒有什么定論。
此次兩會上,科大訊飛董事長劉慶峰首次給出了定量描述——
1-2年,追平。
為什么會是這個數字?劉慶峰做了進一步解答。
他認為中美博弈的“主戰場”就是在通用底座能力上持續進行對標。而Sora正是基于GPT-4/4V的通用大模型底座能力所延伸出來的特定領域的成功實踐。
同樣延伸的還有像DALL-E3、Whisper。
他還以訊飛星火大模型為例,預計6個月內可達到GPT4/4V當前最好水平。但隨著GPT-5的發布,“這個差距可能會被拉到一年以上”。
因此他也強調稱,這也會是一個你追我趕的動態過程。
在劉慶峰這一推論中,在人工智能領域,將通用大模型推至到一個高點,成為中美之間差距的核心競爭點。
也有代表此次在兩會上表達了類似的觀點:通用大模型的發展,已不是單純的科技之爭,更是國運之爭,影響深遠。
過去一年可以看到,通用大模型已然成為業內玩家的發展共識。
在模型層,關于長文本處理、多模態、邏輯推理、數學編碼等技術突破,以全方位提升通用大模型的理解能力。基礎設施層,自主可控算力生態也構建開來,國產算力軟硬協同來支撐大模型創新和應用。
當然最明顯感知的發展變化,還是應用層的全面開花。
來自醫療、教育、廣告營銷、制造等各個行業領域的傳統玩家,基于通用大模型底座平臺以及行業數據,得以讓大模型在自身領域加速應用。
千模大戰之中,絕大多數也都是行業和垂直領域大模型。而如果沒有通用底座大模型的支撐,行業大模型的成效將無法持續進步。
因此,中國必須要有自主可控、對標國際一流水準的通用底座大模型。
這當中最具代表的踐行者就是科大訊飛。
過去一年,他們有兩個進展值得關注——
一個是中國首個支持萬億浮點參數的國產化算力平臺“飛星一號”,聯合華為實現國產算力的自主可控。
另一個基于該平臺發布訊飛星火V3.5,整體效果逼近GPT-4 Turbo,并初步形成大模型產業生態。
基于算力和持續升級迭代的通用大模型,他們在醫療、教育、工業等場景中有了深度應用,已率先構建出行業領先的大模型產業生態——
截至今年1月,訊飛星火純用戶2400萬,基于訊飛聽見、訊飛星火APP、訊飛輸入法等應用,星火已累計賦能億萬用戶。大模型開發者生態積累37萬開發者數量,其中企業開發者數量為24萬……并從中以此形數據閉環,自驅動大模型的迭代和落地。
過去的發展成績表明:以科大訊飛為代表的通用人工智能國家隊在推動大模型的落地,我們有基礎,也有自身的場景和數據優勢。但同樣也要客觀看到差距、正視差距,縮小中美底座大模型的差距。
全球競爭更加激烈,通用底座呼之欲出
2024年剛開年,以天為單位的AI新進展再次讓全球無眠。
顛覆視頻生成的Sora、全面超越GPT-4的Claude 3、還有Stable Diffusion 3的發布,而在產業鏈上,英偉達正式突破2萬億美元震驚股市……
顯然,全球競速沒有放緩,反而更緊迫了。
但同去年ChatGPT剛出現時百模大戰千模大戰的各家探索不同,今年國內卻顯得冷靜許多。因為有關技術趨勢的共識已經再明顯不過:
- 多模態融合,包括語音、圖像、視頻等多個模態融合已成為國內外科技大廠大模型升級和迭代重點;
- Scaling Law反復被驗證,大模型的不同流派走向統一;
- 軟硬件一體,產業鏈上下游共建的通用底座,更加呼之欲出。也只有通用底座,才是綜合實力、長治久安、基業長青、支撐千行百業“AI+”的基石。
有意思的是,這樣的洞察,也在兩會上也被提及出來了。
劉慶峰給出了全面系統的建議。
他建議在2017年《新一代人工智能發展規劃》的基礎上,系統性制定國家《通用人工智能發展規劃》,以頂層設計來推動通用人工智能的發展。
與此同時,相關工作也要同步展開,為此劉慶峰給出了九點建議。
首先第一點,聚焦通用大模型“主戰場”,整合各方資源,持續加大投入。
比如包括以專項的形式在未來5年持續支持研發攻關、支持算力基礎設施建設、推動工業和民生等領域的大模型應用等。
隨后,就是加強源頭技術布局,圍繞通用人工智能相關領域,布局戰略性、前瞻性基礎研究,堅持以源頭核心技術突破來推動顛覆式創新的探索。
除了大模型技術外,還要加快腦科學與類腦智能、量子計算以及推動AI for Science的發展。
更為具體的建議還有:
建議加快形成以國產大模型為核心的自主可控產業生態。
建議推動國家級高質量訓練數據開放和共享,支持國家戰略科技力量以揭榜掛帥形式優先、低成本使用。
建議出臺更加客觀、公正、可信的評測方法,推動大模型在行業領域應用的健康發展。
除此之外,他還強調了人才培養、法律法規以及倫理人文研究方面的重要性。
尤其是人才培養,他不僅強調了頂尖的創新人才、應用型人才的培養,而且建議加快推廣人工智能通識教育,賦能基礎教育、職業教育和高等教育全學段,并且建議設立國家人工智能學院。
對于未來可能會被人工智能大量替代的行業和崗位,他認為應該研究新型人才能力素質模型和培養方案。
這樣的洞察和建議,之所以系統和全面,一方面是訊飛本身是人工智能國家隊,懂行。另一方面,常年的人工智能產業深耕,也讓它對產業需求有更深的洞察。
透過此次兩會上各位行業代表們的觀點,可以看到社會的共識是:
通用大模型是必經之路。
從全球發展來看,實現算力、產業生態的自主可控,才能保證大模型的持續迭代和應用,在全球競爭態勢下才能占據一席之地,擁有話語權。
民生社會層面,以大模型為代表的新質生產力,正成為支撐社會發展的新型基礎設施。從技術研發到商業落地,這條發展路線上一以貫之的最終目標,都是為各行各業提質提效。
所以即便現在差距仍不可忽視,但包括國產大模型的核心玩家,已經初步探索出了一條自主可控之路,賦能到各行業,這也是大模型的真正價值所在。
從“互聯網+”到“人工智能+”,新質生產力機遇,未來可期,中國可期。