A Deep Learning Approach to Network Intrusion Detection

SuperEgg included in category 科研学习

2019-08-26 2022-08-22 879 words 2 minutes

Contents

Shone N , Ngoc T N , Phai V D , et al. A Deep Learning Approach to Network Intrusion Detection[J]. IEEE Transactions on Emerging Topics in Computational Intelligence, 2018, 2(1):41-50.

本文提出用stacked Non-Symmetric deep Auto-encoders 方法进行特征抽取，并将提取的特征传给随机森林进行分类的一种入侵检测方法。

基本知识介绍

当前网络安全的主要挑战

网络流量的激增
更深入和更细粒度监控的需求
协议的多种多样和数据的多元化

本文提出一种深度和浅度学习结合的方法：NDAE+RF，使用的测试数据集为KDD Cup'99和NSL-KDD。

Auto-Encoder算法

原算法

该算法有两个过程：Encoder和Decoder，Encoder过程为了让高维数据在低维中表示出来，Decoder过程将低维数据重新在高维中表示出来。即它尝试去学习： $$h_{W,b} \approx x \tag{1}$$ h是非线性假设，W和b是权重和偏置。它的学习过程就是最小化损失函数： $$L(x,d(f(x))) \tag{2}$$ 其中，L是损失函数，d是解码函数，f是编码函数

本文的Non-Symmetric Deep Auto-Envoder

多个隐藏层，且只有编码，没有解码

假设输入向量$x\in R^d$,它将一步一步匹配隐藏层$h_i \in R^{d_i}$，使用确定性函数表示如下： $$h_i=\sigma(W_ih_{i-1}+b_i);i=1,\dots,n \tag{3}$$ 这里$h_0=x,\sigma$是挤压函数，n是隐藏层数目。 NDAE没有decoder,它的输出向量类似于如下函数， $$y=\sigma(W_{n+1}h_n+b_n+1) \tag{4}$$ 模型可通过最小重构误差获得： $$E(\theta)=\sum_{i=1}^{m}(x^{(i)}-y^{(i)})^2 \tag{5}$$

这里有个东西它没讲请楚隐藏层的结点数与输入层不一样就没法算误差，如果一样就失去降维意义了

本文件所使用的stack-NDAE,结构如下，它是将两个NDAE接起来，并将结果传给RF进行分类。