当前位置: X-MOL 学术arXiv.cs.MM › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
SUR-FeatNet: Predicting the Satisfied User Ratio Curvefor Image Compression with Deep Feature Learning
arXiv - CS - Multimedia Pub Date : 2020-01-07 , DOI: arxiv-2001.02002
Hanhe Lin, Vlad Hosu, Chunling Fan, Yun Zhang, Yuchen Mu, Raouf Hamzaoui, Dietmar Saupe

The satisfied user ratio (SUR) curve for a lossy image compression scheme, e.g., JPEG, characterizes the complementary cumulative distribution function of the just noticeable difference (JND), the smallest distortion level that can be perceived by a subject when a reference image is compared to a distorted one. A sequence of JNDs can be defined with a suitable successive choice of reference images. We propose the first deep learning approach to predict SUR curves. We show how to apply maximum likelihood estimation and the Anderson-Darling test to select a suitable parametric model for the distribution function. We then use deep feature learning to predict samples of the SUR curve and apply the method of least squares to fit the parametric model to the predicted samples. Our deep learning approach relies on a siamese convolutional neural network, transfer learning, and deep feature learning, using pairs consisting of a reference image and a compressed image for training. Experiments on the MCL-JCI dataset showed state-of-the-art performance. For example, the mean Bhattacharyya distances between the predicted and ground truth first, second, and third JND distributions were 0.0810, 0.0702, and 0.0522, respectively, and the corresponding average absolute differences of the peak signal-to-noise ratio at a median of the first JND distribution were 0.58, 0.69, and 0.58 dB. Further experiments on the JND-Pano dataset showed that the method transfers well to high resolution panoramic images viewed on head-mounted displays.

中文翻译:

SUR-FeatNet:使用深度特征学习预测图像压缩的满意用户比率曲线

有损图像压缩方案(例如 JPEG)的满意用户比率 (SUR) 曲线表征了刚好可察觉差 (JND) 的互补累积分布函数,JND 是当参考图像在与扭曲的相比。可以使用合适的连续选择的参考图像来定义一系列 JND。我们提出了第一种预测 SUR 曲线的深度学习方法。我们展示了如何应用最大似然估计和 Anderson-Darling 检验来为分布函数选择合适的参数模型。然后我们使用深度特征学习来预测 SUR 曲线的样本,并应用最小二乘法将参数模型拟合到预测样本。我们的深度学习方法依赖于孪生卷积神经网络,迁移学习和深度特征学习,使用由参考图像和压缩图像组成的对进行训练。MCL-JCI 数据集上的实验显示了最先进的性能。例如,预测的和真实的第一、第二和第三 JND 分布之间的平均 Bhattacharyya 距离分别为 0.0810、0.0702 和 0.0522,并且对应的中位数为第一个 JND 分布是 0.58、0.69 和 0.58 dB。在 JND-Pano 数据集上的进一步实验表明,该方法可以很好地转移到在头戴式显示器上查看的高分辨率全景图像。MCL-JCI 数据集上的实验显示了最先进的性能。例如,预测的和真实的第一、第二和第三 JND 分布之间的平均 Bhattacharyya 距离分别为 0.0810、0.0702 和 0.0522,并且对应的中位数为第一个 JND 分布是 0.58、0.69 和 0.58 dB。在 JND-Pano 数据集上的进一步实验表明,该方法可以很好地转移到在头戴式显示器上查看的高分辨率全景图像。MCL-JCI 数据集上的实验显示了最先进的性能。例如,预测的和真实的第一、第二和第三 JND 分布之间的平均 Bhattacharyya 距离分别为 0.0810、0.0702 和 0.0522,并且对应的中位数为第一个 JND 分布是 0.58、0.69 和 0.58 dB。在 JND-Pano 数据集上的进一步实验表明,该方法可以很好地转移到在头戴式显示器上查看的高分辨率全景图像。对应的第一 JND 分布中值处峰值信噪比的平均绝对差值分别为 0.58、0.69 和 0.58 dB。在 JND-Pano 数据集上的进一步实验表明,该方法可以很好地转移到在头戴式显示器上查看的高分辨率全景图像。对应的第一 JND 分布中值处峰值信噪比的平均绝对差值分别为 0.58、0.69 和 0.58 dB。在 JND-Pano 数据集上的进一步实验表明,该方法可以很好地转移到在头戴式显示器上查看的高分辨率全景图像。
更新日期:2020-05-06
down
wechat
bug