当前位置:主页 > 经济论文 > 国际贸易论文 >

基于多方向特征集的传销预判研究

发布时间:2022-01-08 23:54
  网络信息已经成为当今社会环境及网络环境的重要影响因素。随着网络数据流量的大面积覆盖、网络技术的陈新换代,非法网络数据也在不断入侵网络环境。近年来,传销作为一种非法诈骗行为,网络传销将作为未来主要的传播途径,通过社交平台或招聘网站等开放网络环境传播思想,以非法牟利等,对网民乃至网络环境已经造成一种严重的网络安全威胁。因此,对网络传销数据的研究及控制具有十分重要的意义。本文在现有理论技术的基础上采用自动提取数据及数据特征分析方法对传销数据做预判工作,具体如下:第一,提出一种数字邻近特征集提取算法,既可扩充现有的特征集库,也作为了传销预判算法的预判依据因素之一。实验表明:数字邻近特征集算法与现有的特征集有同样的表征效果,且对于某些背景领域中的数据,表征效果更好。第二,提出一种基于多方向特征集的传销预判算法。该算法以多方向特征集作为预判依据集,基于词语相似度的改进算法,将每个文本数据特征集通过向量抽象化,与剩余文本数据特征集进行相似度计算,将结果作为预判指标,待测特征集与多方向特征集的特征交集率作为预判传销嫌疑的实验,将两种指标结合起来分析,对传销数据进行预判。其中待测特征集是由待测数据作为实... 

【文章来源】:北京工业大学北京市 211工程院校

【文章页数】:72 页

【学位级别】:硕士

【部分图文】:

基于多方向特征集的传销预判研究


SeleniumRC实现原理图

实现原理,编码方式


图 2-2 WebDriver 实现原理图Figure 2-2 WebDriver implementation schematic2.1.2 基于 html 标签限定原理(1)Beautiful Soup 实现原理Beautiful Soup 是 Python 的一个库,最主要的功能是从网络平台中实现数据的抓取。BeautifulSoup 提供一些简单的、Python 式的函数用来处理导航、搜索、修改分析树等功能。它是一个工具箱,通过解析文档为用户提供需要抓取的数据,因为简单,所以不需要多少代码就可以写出一个完整的应用程序。BeautifulSoup自动会将输入文档转换为Unicode编码,输出文档转换为UTF-8 编码。使用者不需要考虑编码方式,除非文档没有指定一个具体的编码方式,这时,BeautifulSoup 就不能自动识别编码方式了。然后,使用者仅仅需要说明一下原始编码方式就可完成编码。Beautiful Soup 已成为和 Lxml、Html6lib 一样有效的 Python 解释器,为用户灵活地提供不同的解析策略或较快的处理速度。

对应图,标签,符号化,解析算法


图 2-3 DOM 和标签对应图Figure 2-3 DOM and label mapping签结构转换为 DOM 树,如图 2-4 所示:图 2-4 DOM 结构树Figure 2-4 DOM treeLParser 解析算法包括两个阶段:符号化和构建树。符号化是词法

【参考文献】:
期刊论文
[1]大数据思维下网络传销犯罪的侦查[J]. 胡玉明,宋利红.  广西警察学院学报. 2017(05)
[2]自动关键词抽取研究综述[J]. 赵京胜,朱巧明,周国栋,张丽.  软件学报. 2017(09)
[3]基于改进TextRank的关键词抽取算法[J]. 张莉婧,李业丽,曾庆涛,雷嘉丽,杨鹏.  北京印刷学院学报. 2016(04)
[4]基于HMM的动作识别结果可信度计算方法[J]. 王昌海,张建忠,徐敬东,许昱玮.  通信学报. 2016(05)
[5]基于语义的文档特征提取研究方法[J]. 姜芳,李国和,岳翔.  计算机科学. 2016(02)
[6]基于特征学习的文本大数据内容理解及其发展趋势[J]. 袁书寒,向阳,鄂世嘉.  大数据. 2015(03)
[7]网络大数据的文本内容分析[J]. 程学旗,兰艳艳.  大数据. 2015(03)
[8]词语相似度算法研究综述[J]. 李慧.  现代情报. 2015(04)
[9]基于LDA模型的文本聚类研究[J]. 王鹏,高铖,陈晓美.  情报科学. 2015(01)
[10]结合内容和标签的Web文本聚类研究[J]. 顾晓雪,章成志.  现代图书情报技术. 2014(11)



本文编号:3577521

资料下载
论文发表

本文链接:https://www.wllwen.com/jingjilunwen/guojimaoyilunwen/3577521.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户7eca1***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com