AI 芯片是個偽命題嗎?
本文轉載自微信公眾號「AI前線」,作者劉燕 。轉載本文請聯系AI前線公眾號。
AI 芯片進入了市場檢驗期。
技術研發關卡“無芯片不 AI”。最近幾年,業界縈繞著對摩爾定律失效的擔憂。后摩爾定律時代,AI 芯片的崛起被寄予厚望。
AI 芯片一度站上了風口,熱度空前,與此同時,挑戰尤存。現階段的 AI 芯片處在發展早期,尚有諸多技術痛點待攻克。
在設計、研發上,一個最大的技術挑戰在于 如何跟得上 AI 算法的演進。 芯片研發速度往往落后于 AI 語言的迭代速度,很多芯片做出來時,AI 算法已發生了較大的改變,甚至已過時了。因此在芯片設計時,預測未來的前沿算法趨勢十分重要。
架構創新能力也是核心競爭力之一。擺在設計和研發前的第一個大難題就是解決架構問題,要具備適應所有應用的架構。正確的架構取決于對 AI 的理解,一些專家芯片設計能力很強,但對 AI 的計算或應用特點理解不深入,一些 AI 算法科學家在底層知識上有所欠缺。AI 芯片的核心要點在于對整個 AI 算法、硬件能力有宏觀認知,及對未來發展趨勢有精準預判,具備這一綜合能力難度不小。去年初,圖靈獎得主 John L .Hennessy 和 DavidA. Patterson 曾在二人的合著論文中預判,未來十年,計算機架構將迎來新的黃金時代。
投入成本高企、進入門檻高、周期長、回報率低是整個 AI 芯片產業“頭頂”的幾座大山,也是目前行業發展的現實情況。一款 AI 芯片的研發周期一般在 18 個月左右,一款 AI 芯片產品問世后,可能要歷經 N 次迭代后才能獲得較大市場份額,這是一個更考驗耐心和韌性的行業。目前國內約有十幾家公司實現了實現 AI 芯片量產,包括華為、寒武紀、依圖、鯤云等公司。
億歐智庫調研數據顯示,以終端常用的 28nm 制程的芯片為例,國內 AI 系統芯片的開發費用約為 2500 萬美元。新鼎資本創始人張馳曾在接受 InfoQ 采訪時表示,寒武紀等 AI 芯片公司的研發支出主要花在流片上,高精尖工藝造成了流片成本高。一般一款芯片流片費用在千萬起步,如果要做到 7 納米,至少要花費五千萬,這還不包括流片失敗的費用。像寒武紀這種體量的公司,一般一款芯片流片的體量可能在三千萬 - 五千萬左右,甚至有可能單次上億。
英國 AI 芯片創企 Graphcore 高級副總裁兼中國區總經理盧濤對 InfoQ 表示,一款 AI 芯片的研發成本主要包括 5 個方面:
開發工具的成本。
IP 購買成本。如果內部 IP 積累較少,需要購買 IP,成本約在千萬美金級別。
后端設計成本。如果沒有后端設計工藝,就需要依靠 Broadcom、IBM、TI 這樣的公司提供幫助。一些較新的工藝或涉及更高昂的成本。
人力成本。一般做一個 AI 處理器的團隊要在 100 人左右,且只能做一款產品。如果要保持像目前頭部廠商這樣的迭代速度,可能要并行做好幾個產品,這是一塊很大的成本投入。
失敗成本。經驗比較豐富的團隊可能一版能成功,如果不成功,又需要做好幾版,這都意味著高成本投入。
“更高性能,更低功耗,更小面積,更低成本”是芯片設計永恒的追求目標。 這些指標除與設計相關外,更關鍵的影響因素是芯片采用的工藝,在同等芯片面積下,更先進的工藝明顯有助于提升峰值性能和能效比,但這也會讓芯片成本顯著提升。
鯤云科技 COO 王少軍認為,架構創新不僅考驗的是芯片公司的硬件設計能力,作為專用芯片來說,還考驗對專用領域的應用理解和轉化能力,在 AI 領域,這主要體現在對算法的深入理解和準確的發展趨勢判斷。而摩爾定律終結的質疑聲在一定程度上說明了業界對芯片工藝水平持續提升的能力、速度和成本的擔憂。他認為,單純依靠工藝提升來解決性能問題的技術路線在不久的將來將面臨巨大挑戰。
基于這個判斷,鯤云科技更重視芯片利用率和實測性能,希望通過架構創新為客戶提供更高的算力性價比。一周前,鯤云科技發布了全球首款數據流架構的 AI 芯片 CAISA,據悉,搭載 CAISA 芯片的加速卡僅擁有英偉達同類產品 1/3 的峰值算力,但其通過 95.4% 的芯片利用率可實現最高 3.91 倍的實測性能提升。數據流架構或是未來提升 AI 芯片性價比的一條可行性技術路線。
落地下半場AI 芯片實現極致性價比也與應用強相關。 盧濤覺得,如果在一些應用中,能夠做到 5 倍、10 倍、20 倍的性能時,性價比的問題也就變得簡單了。
找到合適的場景,實現利潤率合理的、規模化的出貨量,并逐步搭建起自己的生態圈,是衡量一家 AI 芯片公司商業化路徑成功的關鍵標準。
智慧安防、智能終端、自動駕駛、云計算等場景是目前 AI 芯片主要的應用場景,尤其在安防領域,幾乎所有的 AI 芯片公司都在該領域有所布局,安防硬件巨頭們也都在緊鑼密鼓進行 AI 芯片研發。
自動駕駛是其中落地較快,能夠相對獨立地為用戶提供價值,頗具應用潛力的場景。現在自動駕駛技術在實際落地上還不成熟,有些“雷聲大、雨點小”,這也在很大程度上限制了 AI 芯片的落地。
長期關注 AI 芯片行業的媒體人劉宇(化名)對自動駕駛的未來持懷疑態度。他認為,自動駕駛本身就不靠譜。在他看來,“靠譜”的 AI 芯片應該具備類似指紋識別這種應用特征 — 計算量不大、有效性好、成本足夠低。另外,不要與深度學習過度“綁定”,因為深度學習的紅利基本上已經被“吃盡”了。
劉宇對一些 AI 芯片公司的商業模式感到有些失望。“它們基本上都是 TO VC 路線,為了更好地投資人講好故事,它們存在的前提就是不斷有人來融資。有些公司真正的商業模式是‘以芯片為名’拿地,營收主要來自房地產、政府補助等”。
今年 4 月,寒武紀 披露的 IPO 文件顯示,其 AI 芯片研發投入巨大,但盈利和落地狀況堪憂。在與前第一大客戶華為“分手”之后,寒武紀的前五大客戶中,第一大、第二大客戶均為政府,存在客戶集中度過高且高度 TO G 的問題。寒武紀是國內 AI 芯片的第一梯隊,其財務表現也是整個行業盈利能力的縮影,現階段,能夠實現盈利的 AI 芯片公司還寥寥無幾。
也是在這個月,有外媒消息稱,美國 AI 芯片公司 Wave Computing 接近倒閉,已申請破產保護。今年年初,比特大陸的 AI 芯片業務被曝大幅裁員。上述現象不禁令人對國內外 AI 芯片公司的生存狀況感到擔憂。
AI 芯片是資金投入最大的 AI 垂直領域之一。當資本市場有較大波動時,影響必然會傳導到 AI 芯片創業公司。 受自 2018 年下半年開始的資本寒冬,以及外部不確定性的大環境等因素影響,有些投資人也從“不能不看 AI 芯片項目了”變成了“不再看 AI 芯片項目了”。資本市場逐漸趨于理性為 AI 芯片創業公司的落地帶來了很大壓力,在還沒賺到錢之前,它們不得不開始“勒緊”自己的錢袋子了。
王少軍認為“錢荒”問題并沒有那么嚴重。他所認識的大部分 AI 芯片企業都發展不錯,有一些存在問題的多是經營與戰略問題。他認為,市場上優質的 AI 芯片公司在商業化落地上逐步找到了定位,有了持續造血的能力。“大多數 AI 芯片公司還是認真做產品、認真推落地的,在目前行業逐步重視落地、回歸商業本質的趨勢下,AI 行業的發展會逐步進入良性增長的趨勢”。
AI 芯片從產品到實現商業化落地,這中間存在著巨大的鴻溝。 首先是技術層面上的,當一款 AI 芯片出來后,是否有良好的工具鏈、支持大規模商用部署的豐富軟件庫,能否與主流機器學習框架實現無縫銜接。對于用戶來說,是否具備良好的可移植性、可開發性及可部署性能。
更為重要的,是怎樣在行業扎下根去。
聲智科技合伙人 &CSO 李智勇認為,AI 芯片實現落地的核心點不是技術問題,而是如何實現市場化并完成商業閉環(從技術 - 產品 - 用戶反饋)的問題。 芯片周期長、投入大,形成商業閉環的挑戰更大。消化技術紅利的過程滿足產品化和用戶正向反饋兩個條件時,落地規模才能持續放大,進而出現并擴寬盈利空間。
而且,就 AI 落地而言,目前主要有兩種思路,其一是采用含算法的 ASIC 芯片,其二是采用通用芯片 + 算法在云端的通用系統。在不同場景中兩種途徑各有優勢,在語音交互場景下聲智科技選擇了第二種,推出多模態人工智能交互系統 SoundAI Azero,可屏蔽不同底層操作系統的差異,提供簡單易用的技能開發工具和 Turnkey 軟硬件解決方案,滿足萬物互聯時代不同行業應用的需求。
“深”探行業還需要拿捏一定的度。很多現實場景中的需求是無邊界的,AI 的能力有限,必須清楚地界定問題的邊界,并且用經濟的技術手段解決這些問題后才能實現落地。 例如,人臉識別必須加上具體的應用場景限定(包括成像角度、人臉數量等技術約束),才是一個可落地的問題。這個邊界如何界定清楚是落地進程中的一道難關。
“AI 公司實際上不應該存在,因為 AI 技術是一套基礎性支撐技術,是軟件方法,而軟件方法本身不能夠成為商業模式,它必須跟某一個特定的問題相結合才能夠成為商業公司,換句話說,未來所有的公司都是 AI 公司”,AI 行業資深從業者周凌然(化名)的觀點有些非主流,“一家公司如果僅擁有算法,是無法站住腳的,本質上在于如何與領域深度結合,如何真正為用戶帶來終極價值”。
從這個角度來考量 AI 芯片未來的發展。一家 AI 芯片公司未來不能僅僅只有 AI 芯片,而與行業深入結合,變成一家領域解決方案公司或許才是成功之道。AI 芯片應用于各個場景之中為用戶所帶來的實際效果應當是商業化成果的最終檢驗標準。
兩大應用趨勢:云端向邊緣端擴展,追求軟硬件協同按照部署位置,AI 芯片可以分為云端部署和終端部署兩種。經過幾年發展,AI 芯片已不僅僅限于云端,邊緣 AI 芯片成為各個廠商競相布局的垂直賽道,越來越多的 AI 應用部署到了端設備上。
目前云端市場發展已漸趨向成熟,巨頭盤踞,格局難撼。對于創業公司來說,應用場景更廣闊的終端設備市場還蘊含著不少機會。例如智能手機是目前應用最廣泛的邊緣計算設備,自動駕駛也是邊緣 AI 計算的重要應用場景。邊緣計算被視為下一個 AI 戰場。
而另一方面,邊緣側市場空間更大,更容易給投資人“講故事”,吸引資本的關注。據中金公司研究數據,2017 年,邊緣計算 AI 芯片市場規模為 39.1 億美元,到 2022 年,這一數字將增長至 352.2 億美元,5 年或增長 10 倍。
近幾年,邊緣計算呈現出了巨大的增長需求,** 尤其在有大量數據并要求低延時響應的應用場景中。** 在邊緣上做計算,具有數據處理更快速、實時業務處理、成本更低、網絡帶寬成本低、保護數據隱私安全等優勢。
做邊緣芯片,最難在于應用場景。 除自動駕駛場景較集中外,其他很多場景十分“碎片化”。AI 邊緣芯片現階段的主要挑戰來源于邊緣端算力需求的不一致,以及邊緣算力平臺的差異,導致邊緣 AI 芯片的性能和功能需求難以統一界定。
王少軍觀察到,目前市場上出現了很多場景定義的專用芯片,“市場正朝著專業化、細分化方向發展,也說明,各領域出現了普遍性的行業落地需求,足以支撐專用 AI 芯片的發展,這對掌握了核心技術,能禁得住市場考驗的 AI 芯片企業來說是一個好現象”。
另一趨勢是,不少 AI 芯片公司越來越追求打造軟硬件協同能力。不少原來做芯片的公司開始由硬件切入軟件,有些算法公司開始深入硬件做布局。軟硬件協同意味著更高的有效算力。
明確重要的落地場景是軟硬件協同的前提;此外,一體化過程涉及軟件和硬件兩種不同技術團隊間的協同,在磨合期團隊要充分磨合,相關工具支持也得跟上。
軟硬協同理念是從軟件(算法)和硬件兩個角度同時優化,從而實現性能的全局最優。在設計過程中,面臨約束條件多且存在不確定性,設計空間大等挑戰,導致最終結果很難得到最優解。要實現所有網絡的最優,在技術上實現難度較大,為此,芯片設計應以有效加速大多數的算法為目標。
AI 芯片從未成功過?回溯 AI 芯片在國內的發展歷程,2015-2016 年是業內公認的小高潮。卷積神經網絡、深度學習的突破掀起了 AI 芯片的研究與創投熱潮,深度學習方法在很大程度上約減了算法計算需求的多樣性,為 AI 芯片提供了明確的技術可行性;算法精度的有效提升為 AI 行業落地提供了可能。
一時間,大批創業公司爭相涌入,巨頭公司加大投入力度,資本亦瘋狂助推 ,尤其在 2018 年,AI 芯片大熱,多家創企相繼宣布獲得融資。
2017-2019 年,在王少軍看來是 AI 芯片技術和產品研發“百花齊放”的三年 — 市場端還是英偉達一家獨大,涌現出了很多的新技術、新架構和新模式,AI 場景需求的定義更加清晰,云邊端基本成為共識,但不同技術路線對不同場景的適應程度還沒有被充分驗證。
2019 年是芯片行業的轉折點。資本寒冬、華為遭斷供、多家科技企業被列入實體清單等事件凸顯“卡脖子”危機,在國際形勢不明朗的環境下,AI 芯片產業鏈添了不可測的發展變數,對于有技術實力、能完成替代的國內芯片公司來說,未嘗不是一個發展的契機。
相較幾年前,AI 芯片行業的熱度已經下降了不少。當熱度漸漸冷卻下來,業界也開始反思 AI 芯片行業是否存在一些“概念炒作”、搞噱頭、泡沫化的問題。艾瑞咨詢在《2019 年 AI 芯片行業研究報告》中分析指出,當前 AI 芯片行業接近 Gartner 技術曲線泡沫頂端。
“最近這三四年 AI 芯片的發展狀況,我覺得是‘泡沫’,站不住腳。泡沫主要體現在,AI 芯片是個偽命題,不是真實的需求。過去 20 多年來,有關人工智能硬件化的嘗試,絕大多數都失敗了,這里面可能存在一些共性的原因。到目前為止,我還沒有感受到 AI 芯片在根本上的不一樣。因此,我懷疑,在這次以深度學習為發端的 AI 浪潮背景下的 AI 芯片硬件化也會失敗”。一位 AI 技術專家馮輝(化名)向 InfoQ 表達了他的判斷,他認為,AI 芯片發展這么多年,從未成功過。
如何來定義 AI 芯片的“成功”?InfoQ 詢問了多位受訪專家的看法。多位專家對“從未成功”這一說法不甚認同。
在產品層面,歷史上涌現了很多成功的 AI 芯片產品,例如 Google 的 TPU、HTPU,英偉達的 P100 GPU、高通的驍龍 AI 芯片等產品。
“如果單按這個(產品)標準,歷史上那些 AI 芯片也算'成功'了”,馮輝補充道,“我認為,AI 芯片的成功與否,不在于是不是做出來,而在于是不是可用。這里的“可用”是指,相對于通用芯片,是否具有明顯的成本優勢”。
值得注意的是,在技術層面,由于 AI 芯片是技術上的新生事物,如何定義一款 AI 芯片在技術上取得了成功,目前業界并未形成統一的技術共識。“成功的定義或有不同,任何一個按照自己的技術理念成功流片的 AI 芯片公司,都可以認為在技術上是達到了一定程度的成功。除此之外,如何將自己產品的技術特性與市場需求場景充分適配,為目標市場提供不可替代性和更高性價比,進而有效落地,這個是基于商用化上的考量。”王少軍說。
至于商業化上的成功,未來仍需要時間來驗證。這在一定程度上取決于 AI 芯片落地速度,目前的環境給了有產品優勢的芯片公司突破的機會。
經歷了過去 5 年的快速發展后,2020 年,AI 芯片進入了研究與大規模化落地的關鍵一年。盧濤認為上半年的疫情對于 AI 芯片的落地利弊參半,利好是,疫情加速全球版數字化進程,加快數據中心等算力基礎設施建設進程;挑戰是,那些紛紛嚷嚷著自己要做 AI 處理器的公司能不能真的做出來,真的到場景中落下地去。如果沒有真東西 “亮出來” ,后期持續的投入可能將面臨巨大挑戰。
‘講故事’,拼技術理念、拼背景光環的時代已經過去了。
進入下半場的 AI 芯片到了市場驗證期,到了拼產品效果、拼用戶體驗的時候。這將伴隨著一場大的洗牌過程而展開,那些找不到落地場景,盈利能力不足,在技術和商業模式上不能提供核心價值的玩家可能最終將面臨被淘汰出局的命運。“市場將會按照不同的行業保留 2-3 家頭部公司,以及若干家有特色的中小公司”,王少軍向 InfoQ 預測這場淘汰賽可能的終局。
不能忽視地是,AI 芯片尚處在稚嫩的“嬰兒期”,快速成長難免伴隨著“陣痛”,未來雖未知但可期。“我覺得現在應該是做芯片最好的時期,AI 芯片需要走的路特別長”,李智勇覺得,握住當下的機遇是最重要的。