当前位置: X-MOL 学术Int. J. Doc. Anal. Recognit. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Plug-and-play approach to class-adapted blind image deblurring
International Journal on Document Analysis and Recognition ( IF 1.8 ) Pub Date : 2019-03-02 , DOI: 10.1007/s10032-019-00318-z
Marina Ljubenović , Mário A. T. Figueiredo

Most of the existing single-image blind deblurring methods are tailored for natural images. However, in many important applications (e.g., document analysis, forensics), the image being recovered belongs to a specific class (e.g., text, faces, fingerprints) or contains two or more classes. To deal with these images, we propose a class-adapted blind deblurring framework, based on the plug-and-play scheme, which allows forward models of imaging systems to be combined with state-of-the-art denoisers. We consider three patch-based denoisers, two suitable for images that belong to a specific class and a general purpose one. Additionally, for images with two or more classes, we propose two approaches: a direct one, and one that uses a patch classification step before denoising. The proposed deblurring framework includes two priors on the blurring filter: a sparsity-inducing prior, suitable for motion blur and a weak prior, for a variety of filters. The results show the state-of-the-art performance of the proposed framework when applied to images that belong to a specific class (text, face, fingerprints), or contain two classes (text and face). For images with two classes, we show that the deblurring performance is improved by using the classification step. For these images, we choose to test one instance of the proposed framework suitable for text and faces, which is a natural test ground for the proposed framework. With the proper (dictionary and/or classifier) learning procedure, the framework can be adapted to other problems. For text images, we show that, in most cases, the proposed deblurring framework improves OCR accuracy.

中文翻译:

即插即用的方法来适应类盲图像去模糊

大多数现有的单图像盲去模糊方法都是为自然图像量身定制的。然而,在许多重要应用中(例如,文档分析,取证),要恢复的图像属于特定类别(例如,文本,面部,指纹)或包含两个或多个类别。为了处理这些图像,我们基于即插即用方案提出了一种适用于类的盲去模糊框架,该框架允许将成像系统的正向模型与最新的去噪器相结合。我们考虑三种基于补丁的降噪器,其中两种适合于属于特定类别的图像,而另一种适合于通用图像。此外,对于具有两个或多个类别的图像,我们提出了两种方法:一种是直接方法,另一种是在去噪之前使用色标分类步骤。拟议的去模糊框架在模糊滤波器上包括两个先验:适用于运动模糊的稀疏诱导先验,适用于各种滤波器的先验弱先验。结果表明,当应用于属于特定类别(文本,面部,指纹)或包含两个类别(文本和面部)的图像时,所提出框架的最新性能。对于具有两个类别的图像,我们表明通过使用分类步骤可以提高去模糊性能。对于这些图像,我们选择测试适用于文本和面部的提议框架的一个实例,这是提议框架的自然测试基础。通过适当的(词典和/或分类器)学习程序,该框架可以适应其他问题。对于文本图像,我们表明,在大多数情况下,所提出的去模糊框架可提高OCR准确性。适用于运动模糊和弱先验,适用于各种滤镜。结果表明,当应用于属于特定类别(文本,面部,指纹)或包含两个类别(文本和面部)的图像时,所提出框架的最新性能。对于具有两个类别的图像,我们表明通过使用分类步骤可以提高去模糊性能。对于这些图像,我们选择测试适用于文本和面部的提议框架的一个实例,这是提议框架的自然测试基础。通过适当的(词典和/或分类器)学习程序,该框架可以适应其他问题。对于文本图像,我们表明,在大多数情况下,所提出的去模糊框架可提高OCR准确性。适用于运动模糊和弱先验,适用于各种滤镜。结果表明,当应用于属于特定类别(文本,面部,指纹)或包含两个类别(文本和面部)的图像时,所提出框架的最新性能。对于具有两个类别的图像,我们表明通过使用分类步骤可以提高去模糊性能。对于这些图像,我们选择测试适用于文本和面部的提议框架的一个实例,这是提议框架的自然测试基础。通过适当的(词典和/或分类器)学习程序,该框架可以适应其他问题。对于文本图像,我们表明,在大多数情况下,所提出的去模糊框架可提高OCR准确性。结果表明,当应用于属于特定类别(文本,面部,指纹)或包含两个类别(文本和面部)的图像时,所提出框架的最新性能。对于具有两个类别的图像,我们表明通过使用分类步骤可以提高去模糊性能。对于这些图像,我们选择测试适用于文本和面部的提议框架的一个实例,这是提议框架的自然测试基础。通过适当的(词典和/或分类器)学习程序,该框架可以适应其他问题。对于文本图像,我们表明,在大多数情况下,所提出的去模糊框架可提高OCR准确性。结果表明,当应用于属于特定类别(文本,面部,指纹)或包含两个类别(文本和面部)的图像时,所提出框架的最新性能。对于具有两个类别的图像,我们表明通过使用分类步骤可以提高去模糊性能。对于这些图像,我们选择测试适用于文本和面部的提议框架的一个实例,这是提议框架的自然测试基础。通过适当的(词典和/或分类器)学习程序,该框架可以适应其他问题。对于文本图像,我们表明,在大多数情况下,所提出的去模糊框架可提高OCR准确性。我们表明,使用分类步骤可以提高去模糊性能。对于这些图像,我们选择测试适用于文本和面部的提议框架的一个实例,这是提议框架的自然测试基础。通过适当的(词典和/或分类器)学习程序,该框架可以适应其他问题。对于文本图像,我们表明,在大多数情况下,所提出的去模糊框架可提高OCR准确性。我们表明,使用分类步骤可以提高去模糊性能。对于这些图像,我们选择测试适用于文本和面部的提议框架的一个实例,这是提议框架的自然测试基础。通过适当的(词典和/或分类器)学习程序,该框架可以适应其他问题。对于文本图像,我们表明,在大多数情况下,所提出的去模糊框架可提高OCR准确性。
更新日期:2019-03-02
down
wechat
bug