![]() |
2025年9月24日,经济与合作发展组织(OECD)发布《利用专利数据识别新兴人工智能(AI)技术》(IDENTIFYING EMERGING AI TECHNOLOGIES USING PATENT DATA)报告。该报告系统梳理了现有的AI专利识别技术体系,创新性修订了AI专利识别方法,尤其关注PCT(专利合作条约)申请动态。
该报告指出自2015年以来,AI技术领域的专利发明数量激增,截至2020年,年均增长率为30%。到2023年,AI专利约占所有PCT申请的6%,是2015年水平的三倍。2020—2023年,AI专利发展领先的国家是中国(占比31%)、美国(27%)和日本(10.5%)。但是,近期趋势表明AI专利申请速度有所放缓。
1. 现有AI技术分类体系综述
(1)世界知识产权组织(WIPO)
2019年,WIPO提出的检索策略主要采用分类代码,以克服AI等技术领域中单纯依赖关键词检索的局限性。该检索框架包含三个模块:①筛选与AI相关的联合专利分类(CPC)代码;②提取AI专属关键词;③将CPC/国际专利分类(IPC)/日本特许厅的FI(File Index classification)/文件形成术语(F-term)分类与AI相关关键词配对使用。最终检索式通过逻辑组合集成上述模块。
(2)OECD
2020年,OECD将IPC/CPC分类与关键词相结合,开发出一套识别AI专利的检索策略,包含以下三个步骤:①筛选出包含核心AI的IPC/CPC分类的专利;②筛选出包含AI相关的IPC/CPC分类,并且在其摘要、标题和/或权利要求书(仅针对美国专利商标局的专利)中至少包含一个AI相关关键词的专利;③筛选出至少包含三个AI相关关键词的专利。但是,该检索策略依赖于特定时间点,无法涵盖AI领域的最新发展,如生成式AI。
(3)乔治城大学安全与新兴技术中心(CSET)发布的国别活动追踪库(CAT)[1]
采用CPC与IPC分类结合的方法识别AI相关专利,选取了约90个CPC分类和12个关键术语。此外,CAT利用多种专利数据源,为机器学习等7个AI子领域提供数据与指标。
(4)USPTO
USPTO采用机器学习技术进行AI专利识别,其方法包括:①定义七大AI子领域:包括“机器学习”“进化计算”“自然语言处理”“视觉技术”“语音技术”“知识处理”“规划与控制”以及“AI硬件”。②构建专利样本集:针对每一个子领域,分别确定“种子集”(属于该领域的专利)、“反种子集”(不属于该领域的专利),以及“扩展集”(候选专利)。③文本向量化处理:基于Transformer模型对专利文本进行向量化处理。④分类器训练:利用上述数据集,分别对七个AI类别进行模型分类训练。⑤预测结果的人工验证:在测试集上对分类器的预测结果进行人工校验。基于上述流程,USPTO构建了AI专利数据集并向研究人员公开。
(5)WIPO关于生成式AI的专利识别方法
生成式AI目前缺乏成熟的专利分类体系。与之最相关的CPC类别—G06N3/045(自动编码器网络),于2023年才引入。
为全面捕捉生成式AI专利,WIPO开发了一套定制化的两阶段方法:①结合传统检索和AI提示获取初始高召回率数据集。②采用基于Transformer的双向编码器表征模型分类器对数据集进行优化,通过区分生成式AI专利与其他AI技术专利,有效提升识别精准度。
所有数据集最终均通过BERT分类器进行微调,划分为生成式AI专利与非生成式AI专利。目前,由此方法捕捉的生成式AI专利集合已可公开下载。
(6)其他现有分类体系
近年来,各知识产权局积极开展专利分析工作。2019年,英国知识产权局基于WIPO和OECD的前期研究,并吸纳加拿大知识产权局的深度见解,发布了AI专利专题报告。2020年,欧洲专利局界定的第四次工业革命技术领域包含的AI模块,同样采用技术分类与关键词相结合的检索方法进行划定。
近期,澳大利亚知识产权局发布了聚焦AI专利的交互式专利可视化分析平台,采用IPC分类与关键词混合检索策略。其专利态势分析深入至机器学习、专家系统、硬件等技术领域,以及化学、机械工程、电气工程、仪器仪表等应用领域。
2024年,日本特许厅发布的报告则通过文件索引系统(尤其是G06N分类)和关键词组合,区分核心AI技术与AI应用专利的发展趋势。
2. OECD识别AI领域新兴技术专利的新方法
OECD的AI专利识别方法基于2020年框架,由预设CPC代码体系和动态更新的AI关键词库构成。该方法通过持续纳入新兴技术术语,系统追踪AI领域发展,有效识别新兴技术。为保持方法的时效性,关键词库定期从近期科学论文中提取新术语,支持高频更新。
修订后的方法在总体层面上将CPC体系(受分类变更影响较小)与AI相关关键词相结合,基于PCT专利申请数据,提供具备国际可比性的及时指标。
修订后的AI专利识别方法包括:
(1)5个核心CPC组别,涵盖生物模型、知识模型、数学模型、机器学习及模式识别;
(2)95个AI相关CPC组别,要求专利标题或摘要中至少包含一个AI关键词;
(3)274个持续更新的AI关键词。
与2020年版本相比,新方法使2000年以来识别出的AI专利数量平均增加50%以上,增长主要源于生成式AI与图像处理等相关关键词的补充。
3. AI专利近期趋势
OECD基于上述新方法提取的专利数据,对AI技术发展的近期趋势进行了综述(以下分析均基于PCT专利申请数据)。
(1)AI专利发展态势
过去十年间,AI技术专利发明数量快速增长,2015—2020年的平均年增长率达30%。2023年,通过PCT途径申请的AI发明接近1.7万项,规模达到2011年的11倍。作为对比,自2015年以来信息通信技术相关专利年均增长率仅为3%。此外,2023年PCT专利申请中超过6%包含AI技术成分,这一比例是2015年的三倍以上。
图1 AI专利发展趋势(2010—2023年)
自2020年以来AI专利增长显著放缓,2020—2023年间的年均增长率仅为2%。同期全球专利申请总量也呈现小幅下降,年均增长率为-0.4%。尽管AI专利数量在2015年后呈现爆发式增长并于2020年达到峰值,但近期趋于稳定的态势仍反映出该领域持续的创新活力。
图2 专利标题或摘要中出现频率前十的关键词(2010—2020年)
(2)AI专利领先国家
AI发明的来源地高度集中于少数国家:2020—2023年间,中国、美国和日本的发明人贡献了全球69%的AI专利。自2010年初以来,中国在AI专利总量中的份额迅速上升,以30.6%的占比成为全球领导者。
历史上长期位居首位的是美国,其AI专利贡献度从2010—2013年的33%降至2020—2023年的27%。日本的份额从2010年的29%下滑至近期的10.5%。欧盟27国的平均份额较2010—2013年下降4个百分点,但自2014年以来保持稳定。韩国、德国、加拿大、印度和瑞典是自2010年代中期以来少数实现份额增长的国家。
图3 AI领域专利申请量前十五位的国家/地区(2010—2023年)
4. 结论与局限性
OECD最新提出的修订版AI专利识别方法,通过纳入最新术语扩展了对AI发明的覆盖范围,采用CPC分类与关键词相结合的策略,可适配不同专利数据集。该体系设计支持高频更新(约每年两次),且通过采用聚合层级的CPC分类,能有效规避细分层级分类变动带来的干扰。
OECD指出,该方法仍存在以下局限性:①专利信息时效延迟:因专利公开的行政流程滞后,近期数据采用“即时预测“方法进行估算;②非专利创新盲区:由于缺乏可用数据,未能覆盖未申请专利的AI创新成果。
OECD表示,此方法也适用于其他新兴技术领域的专利监测。同时,未来OECD可结合科学论文、开源软件等多元指标,更全面呈现AI技术发展图景。修订后的AI专利识别体系将为后续研究提供基础,尤其有助于探究AI技术的知识溢出效应、技术相对价值、创新生态系统及跨技术领域融合等关键问题。
[1] CAT:是涵盖52个专利管辖区的AI相关专利数据库与指标体系,包含专利申请书与授权专利数据。
周朝梅 编译
来源:https://www.oecd.org/content/dam/oecd/en/publications/reports/2025/09/identifying-emerging-ai-technologies-using-patent-data_5c8da861/d17e9a1a-en.pdf
原文标题:IDENTIFYING EMERGING AI TECHNOLOGIES USING PATENT DATA
检索日期:2025年9月25日
| 主办单位 | :河南省知识产权事务中心 |    2006-2021 版权所有 |
|
| 地址 | :河南省郑州市花园路21号 | 河南省市场监督管理局南区主楼8层 | |
| 联系电话 | :0371-65922162 |   备案号: 豫ICP备2023034794号-4 |