当前位置:主页 > 管理论文 > 科研管理论文 >

基于词同现网络与支持向量机的科学论文甄别方法研究

发布时间:2020-05-28 21:08
【摘要】: 科学论文都有标准的格式要求,但形式是具有欺骗性的,严谨的语法与中规中矩的格式并不能保证所传达的信息有意义和价值。本研究本着节省期刊与会议评审人的时间、提高论文评审的效率和质量的目的,提出了对科学论文进行甄别的方法,同时分析主要由自然语言表达的人类知识体系的结构特征。 在语言中,词与词在句子中的交互不是随机的,而是基于一定的规则。这种规则可以通过语言网络进行研究。词同现网络是人类语言网络的一种表现形式,句子中独立的词汇构成了网络的结点,词汇在句子中的相邻关系确定了网络的连接。通过构建论文的词同现网络,从网络分析的角度发现真伪论文词同现网络结构的区别,利用这些区别在一定程度上先将垃圾文章剔除,再在有意义的资源中进行筛选,这将提高整个社会的效率,纯洁人类知识体系。 通过类比复杂网络生长机制与真论文创作的特点,随机网络生长机制与文本发生器生成的伪论文及低质量的论文在生成(或书写)时的特点,发现它们存在明显的相似性,因而提出假设:真论文与伪论文在词同现网络结构上存在质的区别。为验证这一假设,本研究创新地使用语言复杂网络的一些特征参数来表征论文,计算这些特征参数并输出一个向量,然后运用支持向量机工具包训练样本建模,对论文的真伪进行甄别。针对提出的假设和甄别方法,本研究收集样本、设计实验、使用该方法来验证假设。 实验结果表明,伪论文由于受语法和相关规则的约束,其词同现网络表现出一定的小世界特性;文本发生器产生的伪论文与高质量论文在网络结构上存在着明显的区别,但是水平差别不大的论文其网络结构差别不显著;同时,不同领域的论文其网络结构也能被明显地区分出来。本研究中提出的科学论文甄别方法可以在一定程度上将伪论文剔除,但还是有一定的不足和待改善的地方,这将是本研究后续研究的方向。
【图文】:

网络节点,聚集系数,朋友,边数


图 2-1 某个网络节点度的分布(线性的)(3) 聚集系数:聚集系数C用来描述网络中节点的聚集情况,即网络的紧密程社会网络中,你朋友的朋友可能也是你的朋友或者你的两个朋友可朋友。聚集系数的计算方法为:假设节点i通过 ik条边与其他 ik接,如果这 个节点都相互全都有连接,,则它们之间应该存在2( iikk而这 个节点之间实际存在的边数只有 im的话,则它与全连接2( 1)iikk之比就是节点 的聚集系数。网络的聚集系数就是整个网点的聚集系数的平均。聚集系数 反映了网络中节点的平均聚集程度。对于节点 ,数 iC定义如公式(2-2)所示:( 1) iiiiikkGGGC中的连接边数中最多可能的连接边数中的连接边数

路径长度,几何量,全局,直径


2-2 5 个节点的网络的直径和平均路径长度:D=d4,5=3,L径长度相关的一个重要的全局几何量。节点的中心指经过节点 ,且是其他节点对之间最短距离的路径要用于度量节点 对其他节点对之间信息流通的影最短距离的情况下),它反映了节点 的影响力。络的介数分布也拥有共同的统计特征。e的边介数是指经过边e,且是其他节点对之间最节点之间存在多条最短路径,则假定每条路径的权体,且由几条不同的边将这些团体连接起来,那么径都必须经过这几条跨团体的边。如果将这些连接体将被相互隔离,进而网络中的社团结构就显示现[32],边的介数可用于分析节点的聚类,其基本思中所有路径长度经过次数最多的边,也就是介数最团的边。
【学位授予单位】:哈尔滨工业大学
【学位级别】:硕士
【学位授予年份】:2010
【分类号】:TP391.1;G322

【相似文献】

相关期刊论文 前10条

1 张士庚;曾英佩;陈力军;陈道蓄;谢立;;移动传感器网络中定位算法的性能评测[J];软件学报;2011年07期

2 郑军;周海平;;基于复杂网络理论的大型电路分析与优化[J];计算机工程;2011年15期

3 杜方;宣琦;吴铁军;;基于相似度传播的复杂网络间节点匹配算法[J];信息与控制;2011年03期

4 黄颖;王勉;;学术论文引文网络的无标度特征及成因分析[J];中国科技期刊研究;2010年06期

5 胡长爱;朱礼军;;汉语科技词系统网络特性分析[J];情报学报;2011年08期

6 郭海鸥;李静;;基于复杂网络理论的互联网病毒传播的控制技术分析[J];河南教育学院学报(自然科学版);2011年02期

7 杨常清;高尧;;谱划分算法中特征向量选取方法的研究[J];信息与电脑(理论版);2011年08期

8 马吉祥;王强;;基于软计算思想解决含干扰输入多值异或问题的研究[J];工业控制计算机;2011年07期

9 ;[J];;年期

10 ;[J];;年期

相关会议论文 前10条

1 张国强;;数据通信网络设计——回归随机网络的可能性[A];第六届全国网络科学论坛暨第二届全国混沌应用研讨会论文集[C];2010年

2 吴俊;邓宏钟;谭跃进;;基于自然连通度的随机网络抗毁性研究[A];第五届全国复杂网络学术会议论文(摘要)汇集[C];2009年

3 杜端甫;修娟;;医院管理中的随机网络仿真模型[A];科学决策与系统工程——中国系统工程学会第六次年会论文集[C];1990年

4 周红;杜晓明;于永利;金伟;;Q-GERT随机网络的面向对象分析、设计及原型系统的实现[A];2001系统仿真技术及其应用学术会议论文集[C];2001年

5 冯允成;邱菀华;杨光;;计算机辅助造船厂年度生产计划及其优化——Q-GERT随机网络的应用[A];发展战略与系统工程——第五届系统工程学会年会论文集[C];1986年

6 张新培;;结构分析的随机网络法[A];工程结构可靠性——中国土木工程学会桥梁及结构工程学会结构可靠度委员会全国第二届学术交流会议论文集[C];1989年

7 杨士准;谢政;陈挚;熊李军;;随机网络仿真模型的研究[A];2009年研究生学术交流会通信与信息技术论文集[C];2009年

8 池丽平;蔡勖;;遭袭随机网络与无标度网络的修复策略比较[A];2006全国复杂网络学术会议论文集[C];2006年

9 陈狮星;徐培德;张干宗;;导弹研制风险分析的VERT仿真方法[A];系统工程与可持续发展战略——中国系统工程学会第十届年会论文集[C];1998年

10 郑方圆;王杰;;基于随机结构的多机电力系统鲁棒控制器设计[A];第十一届全国电工数学学术年会论文集[C];2007年

相关重要报纸文章 前10条

1 陕西省洛南县药检所 冀华山 陈雪琴;几种西药的甄别方法[N];中国医药报;2000年

2 鲍亚飞;六法破解新瓷“做旧”[N];威海日报;2008年

3 ;如何甄别自住房?仅靠银行查够吗?[N];新华每日电讯;2006年

4 高万泉;货样买卖合同与定作合同的司法甄别[N];人民法院报;2006年

5 张勋;墙体裂缝的生成原因及其形态特征[N];伊犁日报(汉);2007年

6 本报记者  赵江山;各银行陆续出台房贷操作细则[N];经济参考报;2006年

7 记者  李俊奇 靳国庆 通讯员  东顺 华山;河北省启动外来入侵生物除治行动[N];农民日报;2006年

8 赵江山;各大银行草拟房贷操作细则[N];中国建设报;2006年

9 白静邋蒋嵘;“火眼金睛”辨真伪[N];人民公安报·交通安全周刊;2007年

10 林海;医院、医疗、医药网站实施“可信网站”验证[N];中国高新技术产业导报;2010年

相关博士学位论文 前10条

1 杨保华;基于随机网络的非常规突发事件情景推演模型及其应用研究[D];南京航空航天大学;2011年

2 郝军军;复杂网络模块之间的相互作用[D];上海大学;2012年

3 李焕忠;基于随机网络演算的性能分析技术研究[D];国防科学技术大学;2011年

4 王津涛;环境甲状腺素干扰物体外作用机制及发育毒性研究[D];四川大学;2004年

5 张玄;随机活动网络的理论与应用研究[D];中南大学;2012年

6 刘睿;国际大型土木工程承包项目投标风险定量评估[D];天津大学;2003年

7 邬晓光;桥梁施工随机网络仿真及资源优化研究[D];西安建筑科技大学;2005年

8 潘红梅;应用FRTL-5细胞建立环境化学物的甲状腺激素干扰活性甄别方法及其干扰机制研究[D];四川大学;2007年

9 王文惠;统计建模分析高通量生物数据及其应用[D];山东大学;2009年

10 周东北;物流单元网络基础理论及应用研究[D];中南大学;2007年

相关硕士学位论文 前10条

1 杜娟;基于词同现网络与支持向量机的科学论文甄别方法研究[D];哈尔滨工业大学;2010年

2 崔晓婷;随机网络中国邮路问题算法研究[D];大连理工大学;2006年

3 王善福;随机网络中的簇系数的研究[D];河北工业大学;2007年

4 张玄;随机网络最短路径的概率分布[D];中南大学;2008年

5 李旭东;随机网络的等差增长模型研究[D];河北工业大学;2007年

6 张英俊;管理决策中多元随机网络的数据采集及多元统计信息的研究[D];北方工业大学;2009年

7 陈尚星;基于分形理论的土体裂隙网络研究[D];河海大学;2006年

8 刘巧霞;随机网络的等比增长模型研究[D];河北工业大学;2007年

9 雷芬;随机网络中的动态最短路研究[D];中央民族大学;2009年

10 陈敏;管理决策中随机网络的多元统计信息表示[D];北方工业大学;2011年



本文编号:2685838

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/keyanlw/2685838.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户681b6***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com