当前位置:主页 > 社科论文 > 图书档案论文 >

基于知识分词算法的病案全文检索系统

发布时间:2025-07-02 00:49
  随着科技的发展和经济的腾飞,图书馆、新闻出版、企业等单位电子数据激增,可供人们选择的信息迅速膨胀。这些文档常常并非存在于结构化的数据库中,以TXT, DOC, HTML,XML, XLS, PPT, PDF等多种文档格式存储。当人们需要某方面信息的时候,就要从这大量的文档中提取有用的信息。然而目前的全文检索系统或因特网搜索对中文信息在查全率和查准率很难让用户满意,这很大程度上与中文的语言特性相关。 本课题的研究重点是中文分词。汉语自动分词是中文信息处理技术的“瓶颈”问题。各类分词算法不下几十种。围绕提高分词效率和精度,减少歧义,本文提出了知识分词的思路,以各类知识体系为基础建立分词系统。 数据库全文检索技术也获得了蓬勃的发展。各大数据库厂商大都为自己的数据库配置了全文检索引擎。由于这种引擎是完全集成在数据库中的,因此具有很高的效率,并且管理方便,易于使用,容易与数据库应用系统相关联。本课题利用ORACLE大型数据库提供的全文检索引擎Oracle Text 建立一个病案全文检索系统,并将分词系统与Oracle Text建立关联,提高全文检索的查全率与查准率。...

【文章页数】:59 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
第一章 概述
    1.1 课题意义
    1.2 自然语言处理技术的理论基础
    1.3 课题的研究策略和论文组织
第二章 全文检索技术
    2.1 信息检索的发展过程
    2.2 全文检索技术的发展
    2.3 全文检索的特点
    2.4 全文检索所面临的问题
    2.5 全文检索的方法
第三章 中文分词算法
    3.1 分词的由来
    3.2 自动分词方法与技术
    3.3 目前存在的问题
    3.4 自动分词的作用与发展
    3.5 本章小结
第四章 知识分词系统的研究
    4.1 知识分词的相关理论
    4.2 知识分词系统研究及实现
    4.3 歧义校正
第五章 病案全文检索系统的实现
    5.1 系统需求说明
    5.2 ORACIE CONTEXT全文检索的实现
    5.3 运行过程与结果分析
第六章 结束语
参考文献
硕士期间发表的论文
致谢
文献综述



本文编号:4054959

资料下载
论文发表

本文链接:https://www.wllwen.com/tushudanganlunwen/4054959.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户c4a6c***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com