基本信息
文件名称:2025【基于词向量的恶意URL检测算法及实验探析13000字】.docx
文件大小:896.94 KB
总页数:26 页
更新时间:2025-03-19
总字数:约1.68万字
文档摘要

PAGEV

PAGE2

基于词向量的恶意URL检测算法及实验分析

摘要

由于网络上的恶意攻击者常常借助恶意URL来实现攻击目的,因此对于恶意URL进行检测对于保障用户和整个互联网的信息安全具有重大的意义。当前的恶意URL检测技术主要基于规则匹配、黑名单过滤和机器学习分类等方法。但是规则匹配和黑名单过滤方法对于千变万化的URL缺乏灵活性,而机器学习方法的效率则依赖于对于URL特征的提取方案。本文从文本数据的向量化表示入手,提出基于混合词向量的恶意URL检测方法。本文的主要内容如下:

1)提出一种面向恶意URL的混合词向量架构。为了充分利用URL中的隐含特征,提出包含单字符级和