当前位置: X-MOL 学术J. Real-Time Image Proc. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
V3O2: hybrid deep learning model for hyperspectral image classification using vanilla-3D and octave-2D convolution
Journal of Real-Time Image Processing ( IF 2.9 ) Pub Date : 2020-04-25 , DOI: 10.1007/s11554-020-00966-z
Alkha Mohan , Venkatesan Meenakshi Sundaram

Remote sensing image analysis is an emerging area of research and is used for various applications such as climate analysis, crop monitoring and change detection. Hyperspectral image (HSI) is one of the dominant remote sensing imaging modalities that captures information beyond the visible spectrum. The evolution of deep learning has made a significant impact on HSI analysis, mainly for its classification. The spatial–spectral feature-based classification model improves the classification accuracy of hyperspectral images (HSIs). However, these models are computationally expensive, and redundancy exists in the spatial dimension of features. This research work proposes a hybrid convolutional neural network (CNN) for HSI classification. The proposed model uses principal component analysis (PCA) as a preprocessing technique for optimal band extraction from HSIs. The hybrid CNN classification technique extracts the spectral and spatial features using three-dimensional CNN (3D CNN). These features are fed into a two-dimensional CNN (2D CNN) for further feature extraction and classification. The redundancy in spatial features of the hybrid CNN model is reduced by octave convolution (OctConv) instead of standard vanilla convolution. OctConv factorizes the spatial features into lower and higher spatial frequencies, and different convolutions are performed on them based on their frequencies. The hybrid model is compared against various state-of-the-art CNN-based techniques and found that the accuracy is boosted with a lesser computational cost.



中文翻译:

V3O2:使用Vanilla-3D和octave-2D卷积的高光谱图像分类的混合深度学习模型

遥感图像分析是一个新兴的研究领域,可用于各种应用,例如气候分析,作物监测和变化检测。高光谱图像(HSI)是一种主要的遥感成像方式,可以捕获可见光谱以外的信息。深度学习的发展对HSI分析产生了重大影响,主要是因为其分类。基于空间光谱特征的分类模型提高了高光谱图像(HSI)的分类准确性。但是,这些模型的计算量很大,并且要素的空间尺寸存在冗余。这项研究工作提出了一种用于HSI分类的混合卷积神经网络(CNN)。所提出的模型使用主成分分析(PCA)作为从HSI最佳频带提取的预处理技术。混合CNN分类技术使用三维CNN(3D CNN)提取光谱和空间特征。这些特征被输入到二维CNN(2D CNN)中,以进行进一步的特征提取和分类。通过倍频程卷积(OctConv)而不是标准的普通卷积,可以减少混合CNN模型空间特征的冗余。OctConv将空间特征分解为较低和较高的空间频率,并根据它们的频率对它们执行不同的卷积。将混合模型与各种基于CNN的最新技术进行了比较,发现以较低的计算成本提高了准确性。混合CNN分类技术使用三维CNN(3D CNN)提取光谱和空间特征。这些特征被输入到二维CNN(2D CNN)中,以进行进一步的特征提取和分类。通过倍频程卷积(OctConv)而不是标准的普通卷积,可以减少混合CNN模型空间特征的冗余。OctConv将空间特征分解为较低和较高的空间频率,并根据它们的频率对它们执行不同的卷积。将混合模型与各种基于CNN的最新技术进行了比较,发现以较低的计算成本提高了准确性。混合CNN分类技术使用三维CNN(3D CNN)提取光谱和空间特征。这些特征被输入到二维CNN(2D CNN)中,以进行进一步的特征提取和分类。通过倍频程卷积(OctConv)而不是标准的普通卷积,可以减少混合CNN模型空间特征的冗余。OctConv将空间特征分解为较低和较高的空间频率,并根据它们的频率对它们执行不同的卷积。将混合模型与各种基于CNN的最新技术进行了比较,发现以较低的计算成本提高了准确性。这些特征被输入到二维CNN(2D CNN)中,以进行进一步的特征提取和分类。通过倍频程卷积(OctConv)而不是标准的普通卷积,可以减少混合CNN模型空间特征的冗余。OctConv将空间特征分解为较低和较高的空间频率,并根据它们的频率对它们执行不同的卷积。将混合模型与各种基于CNN的最新技术进行了比较,发现以较低的计算成本提高了准确性。这些特征被输入到二维CNN(2D CNN)中,以进行进一步的特征提取和分类。通过倍频程卷积(OctConv)而不是标准的普通卷积来减少混合CNN模型空间特征的冗余。OctConv将空间特征分解为较低和较高的空间频率,并根据它们的频率对它们执行不同的卷积。将混合模型与各种基于CNN的最新技术进行了比较,发现以较低的计算成本提高了准确性。然后根据它们的频率对它们执行不同的卷积。将混合模型与各种基于CNN的最新技术进行了比较,发现以较低的计算成本提高了准确性。然后根据它们的频率对它们执行不同的卷积。将混合模型与各种基于CNN的最新技术进行了比较,发现以较低的计算成本提高了准确性。

更新日期:2020-04-25
down
wechat
bug