前置特征提取网络由3个卷积块组成,前置特征提取网络及卷积块的构成如图3b所示。前置特征提取网络在网络进行更进一步的特征提取和特征融合之前,提取出一些有效的特征,减少有可能存在的噪声,减少一些无效信息对于模型性能的影响。前置特征提取网络**个卷积块卷积核大小为3×3×1,第二、三卷积块大小均为3×3×3,卷积块输出通道数逐渐增多,分别为16,32,64。为了在进行特征融合之前,保留更多的有效特征信息,所以在**个卷积操作时,并不对时间序列上的运动信息进行采集,更多的利用当前帧的信息,且采用的Max-pooling在前置特征提取网络的步长为(2,2,1),这会让网络更多的保留当前所提取的特征图信息,而不是和后序时序特征融合,让网络保留更多的当前帧图像的特征。卷积层后增加了Batch Normalization层、Relu激活层,以及Max-pooling层。