加密移动应用程序流量分类技术研究
摘要
当网络中两个通信节点间进行数据传输时,为降低网络时延和提高通信效率,由
服务器到用户和由用户到服务器可能会使用两条不同的路径。这就导致当系统位于用
户与服务器路径上某一中间节点时,系统只能获取单向流量,而传统的加密移动应用
程序流量分类方法都使用了双向流量的特征。这使得使用传统方法对移动应用程序流
量进行分类变得困难。同时移动设备的功能越来越丰富,智能手机的使用者和使用频
率大幅增长,来自移动应用程序的流量呈指数级增加。传统方法都假设训练集和测试
集来自相同的类别,而现实世界的未知流量会导致识别准确率下降。为保障系统识别
加密应用程序流量的准确性,本文针对加密移动应用程序的单向流量和开放世界问
题,提出相应的解决方案。
首先,传统方法都是基于双向流量的特征对流量进行分类,但在实际场景中,不
对称路由会导致远程攻击者只能获得单向流量,使得传统方法识别准确率下降。因此
本文设计一种只使用单向流量特征的加密移动应用程序流量分类方法。由于移动应用
程序流量具有时间和空间的相关性,提出使用双向长短期记忆网络捕获数据流的时序
相关性、使用卷积神经网络学习特征的空间相关性,同时引入注意力层关注重要特征
来进一步提高识别准确率。该方法相较于之前的方法,它的适用范围更广,能够适用
于单向流量和双向流量场景,使用更少的特征获取更高的准确率。
其次,传统神经网络的闭集性质使得模型进行预测时只能从训练集的类别中选
择,而现实世界是开集的,导致其无法识别现实世界中的未知类别流量。针对这一问
题,本文设计一种适合于开放世界的加密移动应用程序流量识别方法。该方法首先构
建一个基于Softmax的移动应用程序流量分类的模型,然后使用训练集进行训练得到
识别准确率较高的模型,在此模型基础上使用已知类模型构建算法,利用极值理论和
韦伯分布得到已知类的拟合分布模型,然后使用未知类概率估计算法对模型激活向量
进行修正,预测测试用例的类别,该方法获得比传统方法更高的真阳性率和更低的假
阳性率。
通过以上研究,提高了加密移动应用程序流量分类的准确性,从而保障网络服务
质量和保护用户隐私,该研究具有实际应用价值和广泛的社会需要。
关键词:加密流量;移动应用程序;流量分类;非对称路由;开放世界
加密移动应用程序流量分类技术研究
Abstract
Whendataistransmittedbetweentwocommunicationnodesonanetwork,twodifferent
pathsmaybeusedtotransferdatafromtheservertotheuserandfromtheusertotheserverto
reducenetworkdelayandimprovecommunicationefficiency.Asaresult,whenthesystemis
locatedatanintermediatenodeonthepathbetweentheuserandtheserver,thesystemcanonly
obtainunidirectionaltraffic,whilethetraditionalencryptedmobileapplicationtraffic
classificationmethodsusethecharacteristicsofbidirectionaltraffic.Thismakesitdifficultto
categorizemobileapplicationtrafficusingtraditionalmethods.Atthesametime,thefunctions
ofmobiledevicesarebecomingmoreandmoreabundant.Theusersandfrequencyofsmart
phoneshaveincreaseddramatically,andthetraf