伴隨著“中國制造”,“中國創造”走向世界,漢之光華將以卓越的
服務能力協助我們的客戶完成全球知識產權布局。
【前言】?
2024年7月,世界知識產權組織WIPO發布了《生成式人工智能專利態勢報告》(以下簡稱:WIPO報告),報告分析了從2014年至2023年底的十年間,全球生成式人工智能(GenAI)相關專利情況,并給出了權威的結論。WIPO報告顯示,在這10年間,全球GenAI相關專利申請有5.4萬件,其中中國的專利申請量以3.8萬件占據首位,遠遠超過美國、韓國、日本和印度等國。由于 GenAI 技術呈現井噴式發展,相應的專利申請量也呈現指數式上升,僅2023年公布的 GenAI 相關專利就超過了全部總數的1/4。相應地,GenAI技術淘汰速度也非常快,可以想見過去10年的專利技術,越是新的技術越是具有參考借鑒價值。
本文將沿襲WIPO報告的專利分析思路,聚焦ChatGPT發布后,即2023年1月以后公開的GenAI幾個重要中國參與企業和研究機構,進行相關專利數據進行分析,為感興趣的客戶提供參考。
《WIPO報告》顯示,在中國的企業中,中國騰訊、平安保險集團和百度在過去 10 年中申請了最多的 GenAI 專利家族。以下將按照《WIPO報告》里面GenAI專利申請量排名,簡單介紹這些中國研發實體。
在專利增長方面,GANs專利在過去十年中增長最為強勁。然而,最近這一速度有所放緩。相比之下,擴散模型(DMs)和 LLMs 在過去三年中顯示出更高的增長率,擴散模型的專利家族數量從2020年的18個增加到2023年的441個,LLMs的專利家族從2020年53個增加到了2023年881個。顯然ChatGPT 等現代聊天機器人引發的 GenAI 熱潮顯然增加了人們對 DMs和LLMs大模型的研發投入。
騰訊的專利申請量排名第一。騰訊基于其 LLM 大模型“混元”(Tencent Hunyuan)推出了自己的 AI 聊天機器人,該機器人支持圖像創建、文案和文本識別等應用。該公司使用“混元”為其旗艦產品。例如在微信里添加了 AI 功能,以改善用戶體驗。
平安保險的專利申請量排名第二。平安保險的 AI 計劃專注于用于承保和風險評估的 GenAI 模型。
百度的專利申請量排名第三。百度是 GenAI 領域最早的參與者之一,最近發布了其最新的基于其文心大模型的 AI 聊天機器人 ERNIE4.0。百度還為 IT、交通或能源等行業開發了多個LLM大模型。
進入前 20 名的其他中國公司還包括阿里巴巴集團(第6)、字節跳動(第9)、步步高電子(第11)、網易(第12)、華為(第14)、中國移動(第17)和國家電網(第18)。
在排名前20名的研發團隊中,還有非公司的中國科學院(第4)、清華大學(第15)和浙江大學(第16)等幾家科研機構。
具體的GenAI相關專利公開量排名,見下圖。
圖:《WIPO報告》中 GenAI 相關專利申請人全球排行榜前20
?
中國企業對GenAI大模型的貢獻:
本次文章中,我們研究了《WIPO報告》里面排名靠前的中國公司:騰訊、平安保險、百度、阿里巴巴、字節跳動、華為、中國電網。這幾家公司都是行業龍頭,并且具有很高知名度和社會影響力。
通過研究這幾個排名靠前的國內知名公司在ChatGPT發布前后(即2023年前后)的相關專利公開量,并且根據GenAI各主要大模型加以梳理,形成以下柱狀圖,直觀地展示了騰訊、平安保險、百度、阿里巴巴、字節跳動、華為、中國電網 等公司,于2023年前后在GAN,VAE,LLM,AE,DM 大模型上相關專利公開量。
注
1.2023年前是指:2014年1月1日-2022年12月31日;2023年后是指:2023年1月1日-2024年6月30日。我們將2024年6月30日作為專利統計的截斷日,主要是因為有很多2024年下半年申請的專利尚未公開
2.各大模型具體的含義:
·?生成對抗網絡 Generative adversarial networks (GAN)
·?變分自編碼器 Variational autoencoders (VAE)
·?基于解碼器的大型語言模型 decoder-based large language models (decoder-based LLM)
·?自回歸模型 Autoregressive models(AM)
·?擴散模型 Diffusion models(DM)
各大模型的技術特點詳見:
《生成式人工智能(GenAI+)最新專利技術發展態勢系列之一——-GenAI+大模型》
?
從各大公司的 GAN、VAE、AM 大模型相關專利的申請情況來看:2023年后僅有中國電網在VAE大模型相關專利申請量上有顯著增長,其他2023年后的專利申請量沒有明顯的爆發性上升;AM 大模型相關專利一直只有零星的申請量,比前文分析的國際知名公司還要少;至于GAN 相關專利,中國這幾家公司的公開量仍然很高,但是就公開量而言放緩明顯,可見中國各大公司在技術轉向上緊跟技術發展前沿和國際同步。
以上情況和 GAN、VAE、AM 三個大模型在總體上受到 ChatGPT 發布的影響較小的結論是一致的。以下讓我們來看一下受到 ChatGPT 發布的影響較大的 LLM 和 DM 的中國這幾家大公司的專利申請情況。
?
相較于 GAN、VAE、AM 大模型,各大中國公司的 LLM 和 DM 大模型的則在2023年前后受到ChatGPT 的影響非常大。尤其是 LLM 大模型,騰訊、百度和阿里巴巴這幾家國內互聯網龍頭企業在2023年后相關專利申請量成倍數增加;平安保險、華為和中國電網由于其主營業務并非是互聯網相關業務,而是其他實體產業,這些大公司從事大模型的研發主要是配合其主營實體產業展開的,因此其LLM 和 DM 大模型相關專利申請量相對較低,是可以理解的;但是由于“字節跳動”作為有社會影響力的互聯網多媒體企業,旗下擁有“抖音”、“TikTok”、“今日頭條”等諸多知名產品,其相應大模型申請量如此少,是值得研究的一個現象。
中國大學/研究機構對GenAI大模型的貢獻:
WIPO報告指出:在所研究的 GenAI 專利里面,除了以上一些行業內知名企業外,大學/研究機構也是智慧貢獻的主要力量。《WIPO報告》中 GenAI 相關專利申請人全球排行榜前20里面,有17家是企業;僅有的3所大學,都是中國大學,他們是中國科學院(第4)、清華大學(第15)和浙江大學(第16)。
《WIPO報告》中還專門為全球大學的相關專利申請量做了排名,在所有這些大學/研究機構里面,中國的專利權人處于主導地位,排名前4的都是中國的大學/研究機構,具體排名見下圖。
圖:《WIPO報告》中 GenAI 相關專利申請人全球大學排行榜前20
?
中國科學院,600余件專利,位列第一;清華大學和浙江大學都有300余件專利分列2、3位;浙江工業大學 (Zhejiang University of Technology)貢獻了近200件專利,位列第4;這幾個中國的大學,他們處于第一梯隊;美國、韓國、日本和瑞士的一些大學/研究機構,雖然也出現在大學排行榜前20里,但是排名靠后,且其相關專利申請量遠低于前4名。因此本文僅研究這4所中國大學相關專利情況。
我們可以通過研究這幾個大學的專利,得知其研發方向,以及未來企業可能涉及的應用領域。同時,我們研究大學的專利申請情況,還能為GenAI從業企業未來人才招聘,大學科研項目合作提供參考。各大學的具體專利申請量數據,見下圖。
?
從以上數據統計圖中得知:
中國科學院緊跟前沿技術,在五大模型上均有研發投入,且相關專利申請量居于中國大學之冠。究其原因,主要源于以下兩個方面:
1.?其研究機構在中國各地布局,有多個研發團隊基于當地不同實體產業的需要,進行有針對性的研究;
2.?相對于各大學主要是教學任務不同,中國科學院主要任務是課題研究,其業績考核也是基于其研發成果進行的。
清華大學作為中國理工科的最高學府,現在在全國也有研究院的布局,和當地政府企業有深度合作。
浙江大學和浙江工業大學,特別值得一提。這兩所大學都在杭州。眾所周知,由于阿里巴巴在杭州長達20多年的成長,帶動了浙江杭州地區互聯網相關產業的蓬勃發展。從這兩所大學申請的專利主題看,其專利實際應用性強,專利技術更容易商業化。
【結語】?
以上的專利統計,是基于專利標題、摘要以及權利要求等信息,進行的專利類型歸類。但是,所有GenAI專利家族中有很大一部分不適合任何特定的大模型。許多GenAI專利的標題、摘要以及權利要求不包含特定的大模型關鍵字,而是專注于描述專利的應用,并且在專利說明書里面只對使用的GenAI過程進行了一般性描述。這使得我們很難將一些專利映射到五個核心GenAI模型,同時這5種不同的大模型在技術解決方案上也有一些重疊。因此以上的統計不免有些失真的情況,但是從總體上而言還是有說服力的。
至此,我們針對各大模型的統計分析到此結束了。今后我們將切換分析維度,對大語言模型訓練/處理的數據類型,以及大語言模型的應用領域進行深度分析。敬請期待!