Questel:2024深度學習與大模型全球專利全景報告
“歐米伽未來研究所”關注科技未來發展趨勢,研究人類向歐米伽點演化過程中面臨的重大機遇與挑戰。將不定期推薦和發布世界范圍重要科技研究進展和未來趨勢研究。
Questel是一家世界著名端到端知識產權解決方案提供商,為超過20,000家客戶和150萬用戶提供服務,覆蓋30個國家。主要提供軟件套件,用于發明和知識產權資產的搜索、分析和管理。
簡述
深度學習和大型語言模型(LLMs)專利的關鍵趨勢圖示
深度學習領域知識產權保護的激烈競爭,全球DL領域的專利活動顯著增長,自2017-2018年以來,LLMs逐漸嶄露頭角。2022年OpenAI推出ChatGPT標志著一個重要的轉折點,加速了公眾認知以及專利申請的步伐。這場全球范圍內的知識產權競爭凸顯了其戰略重要性,其中中國和美國領先:
- 中國:以百度等企業為核心,由頂尖高校支持的集中式創新生態系統。
- 美國:多元化、分散式的創新格局,由IBM、谷歌和微軟等科技巨頭推動。
LLM領域的整合與機會,LLM領域由少數幾個主要玩家主導——包括谷歌、百度、騰訊、微軟、亞馬遜和阿里巴巴,其專利組合展現了其全球影響力。幾項顯著的趨勢如下:
- 谷歌、百度、微軟和騰訊正積極保護并推進其產品,凸顯了這一仍被視為新興技術的市場成熟度。這些公司在所有列出的應用領域中均為專利申請的領導者,展示了其全面的戰略和對LLM應用全譜系的承諾。
- 醫療健康作為增長領域:LLMs在診斷、藥物研發和個性化醫療方面推動了突破性進展,使醫療健康成為一個具有變革性的領域。
- 擴大行業影響力:隨著計算效率和數據質量的改進,LLMs迅速與市場需求對接,正在重塑金融、教育和網絡安全等行業。
報告綜述
深度學習:基于實例學習而非規則學習,人工智能正在以驚人的速度變革,推動了一場前所未有的創新浪潮,這將在本報告中詳細闡述。在AI的表面之下,是由機器學習、神經網絡和深度學習(DL)等技術交織而成的復雜體系。這些層次相互結合,推動了突破性的進步,為該領域的快速演變作出了貢獻。
圖1 - 人工智能的結構
2021年,我們在關于深度學習的研究中引用了Gartner 2020年技術成熟度曲線(Hype Cycle),以展示AI各個部分的成熟度和發展情況。將當時的快照與2024年的技術成熟度曲線對比,可以發現顯著的演變(每個階段的描述見附錄)。例如,“深度學習”在不到四年的時間內,從“幻滅期”轉變為“生產力高原期”(主流采用階段)。然而,最引人注目的變化是生成式AI(Generative AI)的迅猛崛起,以大型語言模型(LLMs)為驅動。2020年還只是處于“創新觸發”階段的生成式AI,到2024年已經快速邁入“期望膨脹頂峰”的后期階段。在專利領域,這一階段尤為關鍵,應該被視為獲得專利并加強專利組合的機會,以提高未來市場的競爭優勢。
圖1 - Gartner人工智能技術成熟度曲線2020年與2024年對比
LLM的崛起:革新信息處理和生成方式,LLMs是生成式AI熱潮的核心。這些模型由深度學習驅動,旨在處理、理解并生成類人文本。但其能力遠不止于此——它們可以分析數據、解讀復雜模式并以一種類似人類的方式提供見解。這些模型基于包含數十億甚至數萬億參數的海量數據集進行訓練,正在重新定義數據處理的可能性。
- 規模:LLMs基于龐大而多樣的數據集構建,具備無與倫比的學習能力和適應性。
- 語境掌握:它們擅長理解語言的細微差別,從語義細節到整個段落的流暢性。
- 文本生成:無論是撰寫文章、回答問題還是生成對話,LLMs都能生成連貫、相關且吸引人的內容。
- 多功能性:其應用涵蓋內容生成、翻譯、情感分析、聊天機器人等多個領域。
我們探討的關鍵問題包括:
- 哪些國家處于LLM創新的前沿?
- 哪些公司和研究機構正在推動進展,誰在全球范圍內處于領先地位?
- LLM的主要應用領域是什么,相關知識產權歸誰所有?
通過回答這些問題,我們旨在提供對LLM專利格局的全面理解,挖掘新的機會和視角,以指導利益相關者在這一前所未有的創新時代做出明智的戰略決策。
方法論
1. 數據來源與檢索策略
本研究使用的主要數據來源是 FamPat 全球專利數據庫,通過 Orbit Intelligence 檢索工具進行檢索。FamPat 是一個全球專利申請和授權專利的集合,基于簡單專利族進行組織,涵蓋全球 100 多個專利機構,并包括來自 22 個專利局的可檢索全文,由 Questel 提供。由于每條 FamPat 記錄可能包含許多具有不同日期的單獨發布事件,本報告采用每個專利族的 最早已知首次提交專利局的日期 作為參考。這一日期被視為專利族的代表性成員日期,用于標識專利族。
首次提交專利局(Office of First Filing, OFF) 指的是某項發明的第一份申請,當這份申請在某專利局提交時,它會成為“優先權申請”,而事件發生的日期則定義為 優先權日期。優先權國家是指首次提交的國家。
報告中的表格和圖表均使用優先權日期(除非另有說明),因為它可以最準確地反映發明活動。專利來源的定義(即專利族的發源地)基于首次提交專利局(OFF)。需要注意的是,這一定義并非百分之百準確,但仍然提供了一種有用且公平的方法來識別實體的通常優先權國家,這通常與其本土專利局一致。
每個專利族與一個或多個實體相關聯,這些實體統稱為專利權人。如果同一專利族中的專利由多個所有者持有,則將該專利族歸屬于所有相關實體。為了提升可讀性并提供清晰的概覽,本報告對提及的申請人進行了系統性整理,并將其歸屬于各自的母公司。子公司和關聯實體被歸入其母公司,以反映統一的所有權結構。這一歸類過程結合了自動化(通過 Orbit Intelligence 數據庫)和人工方法完成,并基于報告創建時公開的最佳信息進行操作。
2. 分類體系
本專利分析以深度學習(DL)為中心,特別關注 大型語言模型(LLMs)。檢索方法結合了多種策略,包括深度學習相關的關鍵詞和技術,以及相關的專利分類,例如 G06N3/02(使用神經網絡模型的計算機系統)。
為了確保結果在全面性和準確性之間達到平衡,檢索中采用了布爾邏輯操作符以及迭代優化過程。這種系統化的方法確保了分析數據集的穩健性和可靠性。
雖然專利未必總是明確提及具體的應用,但對這些專利中描述的應用進行探索可以提供有價值的見解。與企業通信或營銷材料相比,這種方法為當前熱門應用提供了一個獨特而互補的視角。
為了提供更深入的理解,我們參考了領域特定的文獻,匯編了一個全面的 LLMs 應用清單。該清單突出了LLMs在各個領域的潛力,提供了新鮮的視角和可操作的見解,以幫助解讀這一快速發展的技術。應用清單及其描述見報告末尾的附錄。
深度學習全球專利格局
1. 專利申請趨勢
爆炸性增長:深度學習的熱潮仍在繼續!我們對2011-2023年這12年的專利活動進行了分析,幾乎完整地呈現了深度學習專利活動的顯著演化?,F代意義上的深度學習概念約在2011年形成,自那時以來,該領域已出現了 311,000個專利族。
在我們之前的研究中(圖中淺藍色曲線所示),深度學習專利活動的快速增長已經令人印象深刻,尤其是在技術浪潮初期,年增長率接近 50%。
最新趨勢: 截至2023年,盡管增長速度略有放緩,但仍然保持了顯著的增長態勢:2019-2023年的年均復合增長率(CAGR)為16%。在快速變化的IT領域,這種超過十年的持續創新動能極為罕見。這表明,深度學習不僅僅是一項獨立的技術,而是推動一系列創新和應用的基礎性技術。
其中,大型語言模型(LLM) 是這一技術革命的突出成果。得益于深度學習的進步,LLMs迅速嶄露頭角。從圖中橙色曲線可以看出,與LLMs相關的專利族申請始于2020-2021年,并迅速增長。
2. 發明的起源
中國在深度學習競爭中的領先地位優先權國家數據為專利戰略提供了重要洞見,也是判斷研發活動主要發生地的可靠指標。大多數申請人傾向于首先在本國申請優先權專利。不過,為了更細致地分析,還需考慮國際專利族(IPFs) 的數量(定義見附錄)。
國際專利族(IPFs): 是指專利權人選擇向國外擴展的專利族,代表了專利的商業價值和國際關注度。這個指標有助于減小因國內政策支持本地申請而產生的偏差,是評估專利戰略和商業潛力的寶貴工具。
- 中國的優勢地位:2023年,中國占全球深度學習專利申請總量的80%,并占國際專利族的40%。
- 美國的戰略重點:盡管僅占全球總申請量的5%,但美國貢獻了35%的國際專利族,穩居第二。
中國在人工智能領域的領導地位得益于以下幾個關鍵因素:
- 龐大的國內市場:為技術創新提供豐富的應用場景。
- 政策刺激與戰略引導:政府的支持和產業布局推動了技術發展。
- 良好的市場生態:自給自足的供應鏈支撐了創新生態系統。
與此同時,韓國 的專利申請量和國際專利族數量均顯著增長,顯示出強勁的上升勢頭。歐洲 和 日本 也保持了重要的影響力,但在這一競爭激烈的領域略遜于中美韓。
3. 主要玩家
自2021年我們的上一份報告發布以來,深度學習領域專利申請的排名相對穩定,這表明主要玩家的地位正在鞏固。領先的實體通過顯著擴展其專利組合繼續鞏固其優勢:
- 百度:專利族從2,500增長至6,751,增長了45%,在總量和國際專利族數量上均排名第一。
- 三星:增長了27%,在國際專利族數量上排名第二,是領域內的重要玩家。
- 平安科技:在專利族數量上排名第四,在國際專利族數量上排名第三。
- 谷歌:專利族數量排名第九,國際專利族數量排名第四。
- 微軟:專利族數量排名第十,國際專利族數量排名第五。
- IBM:專利組合增長了28%,專利族數量排名第六,國際專利族數量排名第九。
- 騰訊:專利族增長了38%,但在國際專利族排名中位列第十。
- 中國國家電網(SGCC):專利族總量龐大,但主要集中在中國,沒有國際專利族。
中國高校的作用:中國的高校在創新生態系統中繼續扮演重要角色,在深度學習領域擁有可觀的專利組合,但主要集中于國內,國際專利族比例較低。
- 中國科學院:自2021年以來擴展了17%。
- 浙江大學:增長了15%。
- 北京工業大學:增長了43%。
- 哈爾濱工業大學:以64%的增長率居首。
缺席的科技巨頭:盡管一些科技巨頭(如亞馬遜、Meta(Facebook)和蘋果)在技術行業中占據主導地位,但它們在深度學習領域的專利申請量相對較低。這并不意味著這些公司缺乏對深度學習的投入,而是它們更傾向于通過收購人工智能初創公司來擴展其技術能力。
4. 結論
深度學習領域的知識產權保護競爭激烈全球深度學習專利競爭的激烈程度突顯了知識產權保護在這一變革性領域中的戰略重要性。各國和國家聯盟必須培養關鍵玩家,并建立創新友好的生態系統以保持競爭力。
- 中國的優勢:以市場規模、政府支持和自給自足的供應鏈為核心的組合,推動了中國在深度學習領域的領導地位。百度憑借強大的專利組合位居首位,其背后是一個強大的高校和研究機構生態系統。
- 其他重要貢獻者:美國(IBM、谷歌、微軟、英偉達和英特爾)、韓國(三星)、歐洲(博世)和日本(索尼)的持續努力將確保深度學習及其應用的未來充滿活力和競爭力。
本文轉載自 ??歐米伽未來研究所??,作者: 歐米伽未來研究所
