当前位置:主页 > 法律论文 > 民法论文 >

基于多维鲁棒数据质量分析模型的中文专利法律状态信息清洗研究

发布时间:2018-04-25 20:28

  本文选题:专利法律状态 + 数据清洗 ; 参考:《南京理工大学》2017年硕士论文


【摘要】:专利法律状态信息具有时序特征,能够体现专利的生命周期和特定时间内权利归属等特征,在专利分析中具有独特价值。其清洗工作要求保证法律状态个体的正确性和状态之间时序关系的合理性。但是,现有数据清洗研究集中于对单个数据的清洗,很少涉及到时序关系数据的清洗。因此,构建并实现能够对时序关系进行清洗的专利法律状态信息清洗框架势在必行。多维鲁棒数据质量分析模型能够方便有效的完成对时序关系数据的清洗。该方法首先进行时序数据库建模,即抽象出时序数据中的状态集及状态转移关系,并形式化表示,然后通过模型检测的方式将时序数据清洗任务转换为模型检测任务,从而识别出时序数据中所隐藏的时序逻辑问题。该方法实现了数据问题的自动化发现,提高了时序数据清洗的效率,降低了清洗成本。为了完成法律状态个体以及状态之间时序关系的清洗工作,本文利用多维鲁棒数据质量分析模型对法律状态信息数据库建模,并对其进行模型检测,实现法律状态信息时序关系的清洗,并以此为核心构建并实现法律状态信息清洗框架。通过对实际数据的清洗验证了框架的科学性和有效性,发现了专利法律状态信息在时序关系方面的常见错误模式,并对这些错误进行了分析。本文将多维鲁棒数据质量分析模型应用到专利法律状态信息时序关系的清洗中,为时序数据清洗提供了新思路,同时本文构建的数据清洗框架,为同类型数据清洗工作提供了实证参考。
[Abstract]:Patent legal status information has the characteristics of time series, which can reflect the characteristics of the life cycle of the patent and the rights belonging to a certain time. It has the unique value in the patent analysis. The cleaning work requires the rationality of the timing relationship between the correctness and the state of the individual in the legal state. However, the current research of data cleaning is concentrated on the individual. The cleaning of data is rarely involved in the cleaning of temporal relational data. Therefore, it is imperative to build and implement a patent legal status information cleaning framework that can clean the temporal relationship. The multidimensional robust data quality analysis model can easily and efficiently complete the cleaning of temporal relational data. The model, namely, abstracts the state set and state transfer relation in the time series data, and formally expresses it, and then transforms the time series data cleaning task into the model detection task through the model detection method, thus identifying the temporal logic problems hidden in the time series data. This method has realized the automatic discovery of the data problem and improved the time sequence. The efficiency of data cleaning reduces the cost of cleaning. In order to complete the cleaning of the time sequence relationship between the legal state individual and the state, this paper uses the multidimensional robust data quality analysis model to model the legal state information database, and carries out the model detection to realize the cleaning of the temporal relation of the legal state information, and takes this as the core. Construction and implementation of the legal state information cleaning framework. Through the cleaning of actual data to verify the scientific and effective framework of the framework, the common error patterns in the temporal relationship of patent legal status information are found, and these errors are analyzed. This paper applies the multidimensional robust data quality analysis model to the patent legal state. In the cleaning of the temporal relation of information, a new idea is provided for the cleaning of time series data. At the same time, the data cleaning framework constructed in this paper provides an empirical reference for the cleaning of the same type of data.

【学位授予单位】:南京理工大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:D923.42;G306

【相似文献】

相关会议论文 前10条

1 俞荣华;郭志懋;田增平;周傲英;;一个可扩展的数据清洗系统[A];第十八届全国数据库学术会议论文集(技术报告篇)[C];2001年

2 崔运钏;刘连忠;;一种可扩展的数据清洗系统的设计与实现[A];2006中国控制与决策学术年会论文集[C];2006年

3 汪爱民;;宝钢全流程合同数据清洗与组织方案的设计和应用[A];全国冶金自动化信息网2014年会论文集[C];2014年

4 蒋勇青;杨奕虹;杨贺;;论数据清洗对信息检索质量的影响及清洗方法[A];2011年中国索引学会年会暨成立二十周年庆典论文集[C];2011年

5 李智;宋杰;冷芳玲;王大玲;鲍玉斌;于戈;;一种基于构件扩展的数据清洗框架[A];第二十五届中国数据库学术会议论文集(一)[C];2008年

6 高淑娟;鲍玉斌;江志纲;王大玲;于戈;;一种基于最小风险贝叶斯决策的数据清洗策略[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年

7 王妍;石鑫;宋宝燕;;基于伪事件的RFID数据清洗方法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年

8 李晓静;谷峪;吕雁飞;王艳秋;于戈;;基于动态事件概率模型的高效RFID数据清洗算法[A];第二十五届中国数据库学术会议论文集(二)[C];2008年

9 肖英治;陈红;;带数据清洗功能的数据预处理系统PW-ETL的设计与实现[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年

10 赵之慧;;专利数据加工[A];2014年中华全国专利代理人协会年会第五届知识产权论坛论文(第二部分)[C];2014年

相关重要报纸文章 前1条

1 中国人民财产保险股份有限公司信息技术部副总经理 鹿慧 编译;在SOA中创建独立的数据清洗服务[N];计算机世界;2009年

相关博士学位论文 前1条

1 樊华;面向物联网的RFID不确定数据清洗与存储技术研究[D];国防科学技术大学;2013年

相关硕士学位论文 前10条

1 高宝;不确定性RFID数据清洗算法研究[D];南京信息工程大学;2015年

2 叶晨;基于众包的数据清洗关键技术的研究[D];哈尔滨工业大学;2015年

3 张晓东;基于业务模型的数据清洗与整合平台的设计与实现[D];电子科技大学;2015年

4 艾超;针对在线产品支撑数据的过滤和分析系统的研究与设计[D];电子科技大学;2015年

5 王江;数据清洗技术研究及清洗框架的设计与实现[D];内蒙古大学;2016年

6 陈飞;基于MapReduce的数据清洗算法研究[D];昆明理工大学;2016年

7 李宁宁;大数据清洗系统中优化技术的研究与实现[D];哈尔滨工业大学;2016年

8 盛丹丹;面向农业领域知识库构建的数据清洗方法优化研究[D];中国农业科学院;2016年

9 郑纪玲;数据清洗在构建POI数据仓库中的研究与应用[D];中国矿业大学;2016年

10 李苗;船舶监控系统中实时数据清洗技术研究[D];南京航空航天大学;2016年



本文编号:1802835

资料下载
论文发表

本文链接:https://www.wllwen.com/falvlunwen/minfalunwen/1802835.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户624a7***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com