当前位置:主页 > 科技论文 > 软件论文 >

基于自身特征扩展的短文本分类方法

发布时间:2018-06-13 21:33

  本文选题:短文本 + 稀疏 ; 参考:《计算机应用研究》2017年04期


【摘要】:短文本具有特征稀疏、描述概念信号弱等特点,传统方法对短文本进行分类很难取得较好结果。针对上述问题,提出了一种基于自身特征扩展的短文本分类方法 SC-FE。该方法首先基于类内离散度从每个类中选取高类别指示性的特征组成特征空间;其次对样本的特征,在已选的特征空间中选取其相关度最大的特征加入短文本中进行扩充。在实际数据集上的实验结果表明,该方法可有效提高短文本的分类效果。
[Abstract]:Short text is characterized by sparse features and weak description of conceptual signals. It is difficult to obtain good results by traditional methods for classifying short text. In order to solve the above problems, a novel short text classification method, SC-FE, is proposed, which is based on the expansion of its own features. The method firstly selects high class indicative features from each class to form a feature space based on the intra-class dispersion; secondly, the feature of the sample is selected and the feature with the highest correlation is selected in the selected feature space to be added to the short text to expand the feature space. The experimental results on actual data sets show that the proposed method can effectively improve the classification effect of short text.
【作者单位】: 合肥工业大学计算机与信息学院;
【基金】:国家自然科学基金资助项目(61503112,61305063,61673152)
【分类号】:TP391.1

【相似文献】

相关期刊论文 前10条

1 陈林;杨丹;;独立于语种的文本分类方法[J];计算机工程与科学;2008年06期

2 张燕平;徐庆鹏;苏守宝;邢猛;;一种基于贪婪覆盖的文本分类方法[J];计算机技术与发展;2009年01期

3 焦庆争;蔚承建;;一种基于特征投票的文本分类方法[J];计算机工程;2010年09期

4 孟海东;张炼;吕海林;;基于图模型的文本分类方法的研究[J];计算机与现代化;2010年09期

5 仲兆满;李存华;;基于重要事件的文本分类方法研究[J];微电子学与计算机;2012年03期

6 赫芳;王洋;;网络的简监督文本分类方法[J];计算机与网络;2012年17期

7 朱志宁;万小容;黄青松;;一种改进的基于信噪比的文本分类方法[J];宁波广播电视大学学报;2005年04期

8 朱斐;刁红军;吕强;;一种富文本分类方法的设计和实现[J];计算机应用与软件;2007年12期

9 台德艺;谢飞;胡学钢;;新的基于簇划分文本分类方法[J];计算机工程与设计;2009年06期

10 杨林波;王士同;;基于类别分布特征的快速文本分类方法[J];计算机工程与设计;2009年05期

相关会议论文 前9条

1 陈克利;宗成庆;王霞;;基于大规模真实文本的平衡语料分析与文本分类方法[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年

2 姚天f ;彭思崴;;汉语主客观文本分类方法的研究[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年

3 李月伦;李湘;常宝宝;袁毓林;;一种基于认知情景框架的文本分类方法[A];第五届全国青年计算语言学研讨会论文集[C];2010年

4 张永;陈思睿;杨志勇;;一种改进的文本分类方法的研究[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年

5 陈毅恒;秦兵;刘挺;林建国;李生;;基于错误预测的文本分类方法[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年

6 宋鑫颖;周志逵;;一种基于SVM的主动学习文本分类方法[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年

7 卢娇丽;郑家恒;;基于粗糙集的文本分类方法研究[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年

8 牛强;王志晓;陈岱;夏士雄;;基于支持向量机的Web文本分类方法[A];2006年全国开放式分布与并行计算学术会议论文集(一)[C];2006年

9 张政;周水庚;周傲英;;一种新的基于kNN和Rocchio的文本分类方法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年

相关硕士学位论文 前10条

1 江大鹏;基于词向量的短文本分类方法研究[D];浙江大学;2015年

2 陈远超;基于MapReduce的大数据文本分类方法研究[D];浙江师范大学;2015年

3 年素磊;自由文本分类技术研究[D];南京大学;2014年

4 谭建平;基于半监督的SVM迁移学习文本分类方法[D];广东工业大学;2016年

5 黄旭;基于机器学习的汉语短文本分类方法研究与实现[D];黑龙江大学;2016年

6 王丹丹;基于特征选择的文本分类方法研究及其应用[D];江南大学;2017年

7 朱斐;一种富文本分类方法的研究与实现[D];苏州大学;2006年

8 李萍;基于改进词语权重的文本分类方法研究[D];东北师范大学;2010年

9 王燕霞;基于相关主题模型的文本分类方法研究[D];苏州大学;2010年

10 张建兴;一种提取类核的快速文本分类方法[D];兰州理工大学;2010年



本文编号:2015493

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2015493.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户259ae***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com