当前位置:主页 > 管理论文 > 科研管理论文 >

专利大数据分析系统关键技术与应用

发布时间:2020-06-12 11:28
【摘要】:随着信息时代的来临,技术的发展与创新速度达到了一个前所未有的巅峰,而这样的进步也为相关的知识管理带来前所未有的挑战。当代技术领域的进步极大地提高了对分散在各种信息来源中的组织知识进行管理的需求。然而,传统的专利分析方法存在人工占比高、数据质量和挖掘价值低、分析结果单调以及对用户智能利用程度低下的缺陷,因此需要利用新一代信息技术帮助改进专利分析方法,以适应大数据的应用场景,并充分借助群体智能实现更精准、更高效的专利内容挖掘提取。本文在专利分析相关领域研究的基础之上,提出了专利大数据分析的方法流程,针对该分析方法中的专利文献基本信息分析、专利复杂网络分析以及用户-专利交互分析等关键技术做了重点研究,并在此基础上开发了专利大数据分析系统。本文的主要内容包括:第1章研究了目前的专利活动现状,对专利文献的分析流程以及专利文献的挖掘方法进行了梳理,同时对复杂网络分析以及群体智能的国内外研究进行了整理。在对现有的专利分析流程进行分析的基础上,发现了传统专利分析方法所面临的困境,提出了专利大数据分析流程。第2章提出了专利文献基本信息分析与挖掘的技术方案,通过界定专利文献基本信息的数据形式与内容边界,解构了专利文献的数据结构,针对结构化的专利元数据提出多角度的定量统计分析方法集合,针对非结构化的专利文本数据则提出了从文本数据建模、特征表示、特征过滤以及基于SAO的关键词分析的专利文本挖掘流程。第3章提出了利用专利数据中的潜在关联关系的专利复杂网络建模与分析技术,通过提取专利的IPC共现关系、引用/被引关系以及基于SAO的关键词关联关系,构建了专利IPC共现网络、引文网络以及关键词网络,在完成网络指标统计的基础上,利用主路径分析以及异质信息网络分析的方法,对专利复杂网络中的信息加以挖掘。第4章提出了基于群体智能的用户-专利交互分析技术,在将用户与专利之间的交互行为抽象提取的基础上,进行了用户-专利交互二分网络的建模,并完成用户关联网络的建模。基于这两个网络,完成专利协同分析用户的社区检测与专利协同过滤,并完成专利的推荐流程。针对用户对专利的标注与评价行为,基于链接分析算法,提出了基于用户-专利评价二分网络的双向价值评定方法。第5章基于本文的理论研究结果以及专利分析关键技术方案,开发了专利大数据分析系统,实现了专利分析用户对专利的检索、查看、评价与批量分析,并从系统的角度实现了对专利分析用户的专利定向推荐,专利数据的全局定期计算与更新、专利用户与专利的相关数据的持续提取与分析。本文的创新点包括:①在结合专利文献挖掘、复杂网络分析和群体智能的理论的基础上,提出了专利大数据分析方法与流程;②提出了基于群体智能的专利分析技术——用户-专利交互分析技术,借助群体智能完成对专利数据的优化与智能扩展;③基于Node.js+Spring+Hadoop的技术架构,开发了专利大数据分析系统,实现全局专利大数据的实时更新、专利复杂网络的建模与计算以及对专利协同分析用户的支持。
【图文】:

专利授权,专利局,全球,专利


1.2研究背景逡逑根据国际知识产权组织提供的数据[4],我们可以看到近10年的专利活动的演变,逡逑其数据趋势如图1-1所示。逡逑2017全球等效专利授权t0P20专利局所在W家或地区逡逑I逡逑Italy邋*逡逑a逡逑Brazil邋?逡逑s逡逑Singapore邋蜃逡逑a逡逑China,邋Hong邋Kong邋SAR邋a逡逑m逡逑France邋■逡逑灥逡逑Germany邋■逡逑Canada逡逑EPO逡逑:.wisuKmsim^逡逑Japan逡逑China逦K邋aw;■、漏逦灥MwmmMMmsgai逡逑0逦100,000200,00(B00,000400,000500,000600,000700,00(^00,000900,,000逡逑本地授权■非本地授杈■授权总数逡逑图1-1逦2017全球等效专利授权top20专利局所在国家或地区逡逑在过去的10年间,专利的申请数量和申请数量的增速都在以迅猛的势头增长,逡逑而从国家间的2017年度统计数据来看,中国正以绝对的数量优势压过其他的专利申逡逑请来源国以及专利授权国。2017年,中国国家知识产权局(SIPO)受理的专利申请数量逡逑排在第一位,创纪录地达到了邋138万件。不过由于2017年,中国更改了统计专利和逡逑工业品外观设计等知识产权申请数据的方法,仅计算已支付费用的专利。排在中国之逡逑后的是美利坚合众国(美国;606

专利分析,技术分类,文本挖掘,使用分析


利用自动化专利分析工具不仅可以减轻专利分析专家手动分析专利的繁重任务,逡逑还可以加快分析过程。专利分析涉及一系列步骤,包括从专利数据库中提取专利,从逡逑专利中提取信息,以及分析提取的信息以推断出逻辑结论。图1-2显示了专利分析的逡逑通用工作流程。这些专利包含各种类型的内容,例如结构化和非结构化数据。非结构逡逑化专利数据包括叙述性文本,包括专利名称,摘要,权利要求和描述。结构化专利数逡逑据包含信息,例如专利的发明人、专利的受让人和引用信息[20],[21]。逡逑5逡逑
【学位授予单位】:浙江大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:G306;TP311.13

【参考文献】

相关期刊论文 前1条

1 黄英铭;;Web结构挖掘及HITS算法分析[J];计算机与现代化;2007年07期



本文编号:2709465

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/keyanlw/2709465.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户c0022***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com