政府网站信息资源多维语义知识融合研究
发布时间:2017-12-25 15:36
本文关键词:政府网站信息资源多维语义知识融合研究 出处:《吉林大学》2017年博士论文 论文类型:学位论文
更多相关文章: 政府公开信息 政府网站 网络资源 语义 知识融合
【摘要】:近年来,我国政府信息公开工作进展迅速,越来越多的政务信息资源通过政府门户网站发布,这些信息涉及到各个领域,关系到国计民生和群众的切身利益,群众对其有着广泛的需求。然而由于政府机构的层次性,且行政机关的隶属不同、分工不同,造成政府网站发布的公开信息具有层次性、地域性、分散性等特点,这些海量的、孤立的、分散状态存在的碎片信息往往使人们束手无策,给公众获取有效信息造成障碍,影响政府公开信息的有效利用。政府网站信息资源数量的急剧增长在为人们获取所需的信息和知识带来更多机遇的同时也带来了更大的挑战。因此面对“信息海洋”与“知识匮乏”的对峙局面,迫切需要采取一定的方式和手段对多来源、多类型的政府网站信息资源进行类聚、重组和融合,构建一个有序高效的政府信息知识体系,为用户提供知识的有效获取与利用。知识融合能够针对多源分布信息的碎片化、冗余性、不完整性等问题,从众多数据源中抽取相关知识,经过知识转换、集成与合并等处理,产生新的集成化知识对象,从而为领域决策问题求解构造有效的知识资源。它为解决政府网站信息资源领域的知识服务问题提供了新思路、新方法和新途径。本文以实现政府网站信息资源的深层次开发和利用为立足点,以满足公众的高效率知识服务为目标,综合运用信息管理学、计算机科学、知识科学、系统科学等多学科的理论方法,拟从知识组织的角度架构政府网站信息资源知识融合框架模型,试图改变知识获取的固有流程,形成新的知识获取过程模型,提出对多源的、分散重复、被淹没的政府网站信息资源进行知识融合的理论框架与解决方案。在此基础上,以语义网、知识本体、知识发现等语义信息组织技术为支撑,尝试在语义环境下分别从内容维度、结构维度、应用维度三个不同维度探索政府网站信息资源知识融合的实现方法。具体研究内容包括:(1)通过对政府网站信息资源和知识融合等相关概念的阐述,进一步明晰了本文研究对象与研究内容的范畴。同时对本研究具有重要指导意义和参考价值的知识空间理论、知识组织理论、本体理论、知识发现理论进行了理论溯源。其中,知识空间多维度的知识分类与知识管理为本文政府网站信息资源多维度知识融合框架的构建提供了重要的理论支撑。知识组织理论对确定不同维度层级政府网站信息资源知识融合所需要实现的知识表示、知识重组、知识关联、知识聚类等过程具有重要的理论指导作用。本体是实现政府网站信息资源知识融合的有力工具,而知识发现理论则提供了解决政府网站信息资源知识融合问题的技术方案。(2)确定了政府网站信息资源知识融合的目标和原则,从用户信息需求和知识融合功能需求两个方面分析了知识融合需求,明确了知识融合的流程与体系结构等框架构建依据。然后对语义环境下政府网站信息资源知识融合过程中涉及的构成要素、功能要素及要素之间的关系进行了分析,并依此提出了基于语义的政府网站信息资源知识融合逻辑框架,从概念与逻辑层面回答了政府网站信息资源知识融合“做什么”的问题。在提出的基于语义的政府网站信息资源知识融合逻辑框架的基础上,以知识空间理论多维度的知识分类与知识管理,知识融合研究领域对知识类型的划分,以及信息融合研究领域中多源信息融合系统的结构与功能框架为依据,提炼出了由数据级融合、概念级融合、决策级融合构成的知识融合功能结构,并依此分别从内容维度、结构维度、应用维度三个维度构建了政府网站信息资源多维度知识融合框架,从结构与功能层面回答了政府网站信息资源知识融合“怎么做”的问题。(3)内容维度上数据级融合要解决的关键问题是如何对描述统一的政府网站信息资源内容进行有效的数据关联,通过数据关联,形成知识网络。为此,本文通过对特定主题政府网站信息资源进行细粒度信息抽取、预处理,采用本体驱动的元数据模型对其进行统一的语义描述,构建了政府网站信息资源领域知识本体,并以语义网络表示法为参考,实现了政府网站信息资源的知识表示。在此基础上,引入知识元、知识元—本体映射的概念,利用基于知识元语义链接的数据关联方法实现知识元的统一对象化表示、知识元对象的抽取、知识元对象的属性获取、知识元语义关联度计算等,并依此构造生成对特定主题资源内容进行宏观描述的知识网络。(4)结构维度上概念级融合要解决的关键问题是如何从数据级融合生成的政府网站信息资源知识网络中获取领域概念,并识别领域本体概念关系,通过本体合并,形成能够便于发现彼此间关联规则和模式的分类知识组织体系。针对该问题,本文提出了采用RDF链接定性推理与Voronoi图定量推理相结合的本体形式化表示方法来获取政府网站信息资源领域概念。通过识别领域本体概念关系,构建领域本体概念关系的层次结构,依此获得领域本体概念分类体系。在此基础上,设计基于概念分类的领域本体映射模型,并采用本体概念间语义相似度的计算方法,实现基于概念分类的政府网站信息资源领域知识本体合并,消除政府网络信息资源知识网络中的冗余知识,达到对其进行有效分类组织的目的。(5)应用维度上决策级融合要解决的关键问题是如何对政府网站信息资源知识网络和分类知识组织体系结构中具有关联关系和相似关系的领域知识进行关联聚类,经过知识关联聚类,生成面向决策应用的完整领域知识。基于此问题,本文通过对已有领域知识关联聚类方法进行比较分析,提出基于关联挖掘和语义聚类的领域知识融合方法,该方法涵盖时序关联融合、因果关联融合、凝聚层次聚类融合3种核心领域知识融合算法,进而通过因果关联、时序关联、知识聚类等方法生成能够辅助用户决策的完整领域知识。(6)前文按照政府网站信息资源多维度知识融合框架的结构与功能划分,提出了不同维度层级知识融合实现所需要的方法,这些方法的效果如何,还需要通过实验进行验证。为此,本文搭建了实验所需的软硬件环境,介绍了实验需要应用到的相关工具。对实验数据来源及其主题分布情况进行了描述,明确了不同维度层级知识融合的实验内容。在具体的实验验证上,以政府网站发布的“雾霾防治”主题相关的领域信息资源为例,构建了政府网站“雾霾防治”领域知识本体实例。并以构建的“雾霾防治”领域知识本体为依据,分别对数据级融合提出的基于知识元语义链接的知识网络实现方法、概念级融合提出的基于概念分类的领域知识本体合并方法以及决策级融合提出的基于关联挖掘和语义聚类的领域知识融合方法进行了实验验证,并通过设计定性与定量相结合的评价指标对案例实验结果进行了分析与评价。
【学位授予单位】:吉林大学
【学位级别】:博士
【学位授予年份】:2017
【分类号】:D63;G203
,
本文编号:1333438
本文链接:https://www.wllwen.com/shoufeilunwen/sklbs/1333438.html