基于深度语义学习的专利挖掘方法及应用
发布时间:2025-05-11 00:21
当下社会进入了前所未有的高速发展期,科技创新活动呈井喷趋势增长,成为推动国家经济增长和提升国家竞争力的第一动力。专利文献由于囊括了全球每年90%~95%的最新科技成果,是蕴含技术创新方案的重要知识载体,因此基于专利数据从海量的信息中挖掘出与技术相关的情报信息,可以为企业和国家制定创新发展战略提供帮助。传统的专利分析研究多使用计量统计的方法,忽略了文本中隐藏的重要信息,而近些年兴起的专利文本挖掘研究中,则存在专利文本特征提取不完整、未充分考虑文本中语义关联等问题,不能对专利文献进行深度的分析。基于以上原因,本文以专利文本为挖掘对象,考虑了专利的语义和文本特征,分别从特征提取和专利文本向量表示两个方面,提出了适用于专利领域的文本挖掘方法。其中,在特征提取上,本文选择SAO-C(Subject,Action,Object,Complement)结构作为专利的技术特征,并针对专利文本特有的语言特点,以及现有方法在提取专利领域SAO-C结构上的不足,提出了基于深度学习的SAO-C结构提取模型:Ro BERTa+BiLSTM+MLP,并充分利用大型公开数据集和部分标注的专利数据作为训练集,提高了模型...
【文章页数】:133 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第一章 绪论
1.1 研究背景及意义
1.1.1 研究背景
1.1.2 研究意义
1.2 国内外研究综述
1.2.1 专利挖掘方法
1.2.2 SAO结构提取方法
1.2.3 深度学习及在专利领域的应用
1.2.4 研究现状的总结与评述
1.3 研究内容及框架
1.3.1 研究内容
1.3.2 研究方法
1.3.3 主要创新点
1.3.4 论文框架
第二章 基于深度学习的SAO-C结构提取方法构建
2.1 专利数据及其获取
2.1.1 专利数据描述
2.1.2 专利数据获取
2.2 使用深度学习提取SAO-C的方法构建
2.2.1 模型整体框架
2.2.2 词嵌入模型
2.2.3 Bi-LSTM
2.2.4 序列标注
2.3 实验分析
2.3.1 实验数据
2.3.2 对比模型
2.3.3 超参数设置
2.3.4 评估标准
2.3.5 实验结果分析
2.4 本章小结
第三章 基于Doc-SAO模型的专利挖掘方法构建
3.1 专利挖掘方法构建流程
3.2 基于Doc2Vec和 SAO-C的专利相似度度量
3.2.1 整体流程
3.2.2 专利文本向量的生成与相似度计算
3.3 实验分析
3.3.1 实验说明
3.3.2 权重因子值的设置
3.3.3 实验结果对比
3.3.4 小样本专利直观分析
3.4 基于专利相似度的知识图谱构建
3.4.1 专利网络
3.4.2 专利地图构建
3.5 本章小结
第四章 实证研究:人工智能领域的专利情报挖掘
4.1 人工智能领域概述
4.2 专利数据的获取
4.3 人工智能技术发展的计量分析
4.3.1 技术发展阶段分析
4.3.2 专利生效国与技术市场分析
4.3.3 专利权人分析
4.3.4 技术领域分布初步分析
4.4 基于本专利挖掘方法的人工智能实证研究
4.4.1 实验环境配置
4.4.2 各阶段专利相似度计算
4.4.3 专利知识图谱分析
4.4.4 对策与建议
4.5 本章小结
结论
总结与启示
不足与展望
参考文献
附录
附录1 核心专利及其相关信息表
附录2 SAO-C结构提取部分代码
附录3 专利相似度度量部分代码
攻读博士/硕士学位期间取得的研究成果
致谢
附件
本文编号:4044555
【文章页数】:133 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第一章 绪论
1.1 研究背景及意义
1.1.1 研究背景
1.1.2 研究意义
1.2 国内外研究综述
1.2.1 专利挖掘方法
1.2.2 SAO结构提取方法
1.2.3 深度学习及在专利领域的应用
1.2.4 研究现状的总结与评述
1.3 研究内容及框架
1.3.1 研究内容
1.3.2 研究方法
1.3.3 主要创新点
1.3.4 论文框架
第二章 基于深度学习的SAO-C结构提取方法构建
2.1 专利数据及其获取
2.1.1 专利数据描述
2.1.2 专利数据获取
2.2 使用深度学习提取SAO-C的方法构建
2.2.1 模型整体框架
2.2.2 词嵌入模型
2.2.3 Bi-LSTM
2.2.4 序列标注
2.3 实验分析
2.3.1 实验数据
2.3.2 对比模型
2.3.3 超参数设置
2.3.4 评估标准
2.3.5 实验结果分析
2.4 本章小结
第三章 基于Doc-SAO模型的专利挖掘方法构建
3.1 专利挖掘方法构建流程
3.2 基于Doc2Vec和 SAO-C的专利相似度度量
3.2.1 整体流程
3.2.2 专利文本向量的生成与相似度计算
3.3 实验分析
3.3.1 实验说明
3.3.2 权重因子值的设置
3.3.3 实验结果对比
3.3.4 小样本专利直观分析
3.4 基于专利相似度的知识图谱构建
3.4.1 专利网络
3.4.2 专利地图构建
3.5 本章小结
第四章 实证研究:人工智能领域的专利情报挖掘
4.1 人工智能领域概述
4.2 专利数据的获取
4.3 人工智能技术发展的计量分析
4.3.1 技术发展阶段分析
4.3.2 专利生效国与技术市场分析
4.3.3 专利权人分析
4.3.4 技术领域分布初步分析
4.4 基于本专利挖掘方法的人工智能实证研究
4.4.1 实验环境配置
4.4.2 各阶段专利相似度计算
4.4.3 专利知识图谱分析
4.4.4 对策与建议
4.5 本章小结
结论
总结与启示
不足与展望
参考文献
附录
附录1 核心专利及其相关信息表
附录2 SAO-C结构提取部分代码
附录3 专利相似度度量部分代码
攻读博士/硕士学位期间取得的研究成果
致谢
附件
本文编号:4044555
本文链接:https://www.wllwen.com/tushudanganlunwen/4044555.html