基于 MCMC方法的图像还原模型

ads

基于 MCMC方法的图像还原模型

刘 冬 李雅婷 赵家浩 欧锦凤 贺超超

1.天津商业大学统计系 300134

摘要:随着信息化社会的发展,监控设施的存在让犯罪份子无处遁形,但由于一些不可控因素,经常导致监控照片模糊不清,图像还原技术即是处理这类问题的关键。本文建立了基于MCMC[1], [2]方法的图像还原模型,首先给定合理的先验分布,采用马尔科夫随机域上的MCMC抽样方法,得到来自后验分布的像素样本,后验像素样本能够有效的估计真实图像,从而实现图像还原的目的。

关键词:马尔科夫随机域;MCMC;图像还原

[项目编号]JDS958 [项目名称]伴你学数统——大数据和统计学结合的创新应用实践

1引言

本文建立了基于马尔科夫随机域上的MCMC抽样模型,可以对模糊图像进行还原。模型首先假定合理的先验分布,得到了吉布斯抽样需要的满条件概率,进而得到了来自后验分布的像素样本,通过对样本平均值的计算,实现了模糊图像的还原。在实证应用中,模型对模糊图像的还原效果很好。

图像推断方法综述

在本模型中,我们为参考空间的随机变量指定一个特定的概率分布。对于特定的图像来说,就是对每一个像素的取值指定一个概率分布。马尔科夫随机域可以应用于很多格子型的结构,如正规的长方形,六角形和不正规的网格结构。Besag关于空间统计和图像分析中的马尔科夫随机域发表了大量重要的经典文章[4] ,[5]。参考文献[5]也给出了马尔科夫随机域的全面介绍。近10年来,空间统计和图像推断方法的发展主要集中在算法的效率问题上,其中Swendsen-Wang算法[6],以及完美抽样算法是其中的重要成果。

在图像还原的过程中,我们主要考虑马尔科夫随机域在正规矩形格子中的应用。例如:一张照片的基本单位是像素,把每个像素看做一个小格子,于是一张相片可以看做是由5fcdc7365c745_html_15612b3e28d4a8bd.gif 个格子拼成的矩形,第5fcdc7365c745_html_1736468181fe6b37.gif 个像素(即格子)的值记为5fcdc7365c745_html_a61213a7e8dadc6.gif ,5fcdc7365c745_html_a7742131d72f779.gif ,其中5fcdc7365c745_html_15612b3e28d4a8bd.gif 为像素的总数。我们关注二元随机域,即5fcdc7365c745_html_a61213a7e8dadc6.gif 只能取0或1。当然,5fcdc7365c745_html_a61213a7e8dadc6.gif 的取值可以推广到取两个以上的离散值或是连续的情况。

定义5fcdc7365c745_html_24a0bc994489488f.gif 为第5fcdc7365c745_html_1736468181fe6b37.gif 个像素的所有邻域,记5fcdc7365c745_html_d111d42cae8d6b4e.gif 为像素5fcdc7365c745_html_1736468181fe6b37.gif 的邻域像素的值的集合。注意第5fcdc7365c745_html_1736468181fe6b37.gif 个像素不在5fcdc7365c745_html_24a0bc994489488f.gif 中。在长方形格子中,第5fcdc7365c745_html_1736468181fe6b37.gif 个像素的一阶邻域为其垂直方向和水平方向的像素集合,二阶邻域还包含对角线方向上的像素。本模型考虑的是一阶邻域。

假定第5fcdc7365c745_html_1736468181fe6b37.gif 个像素的值5fcdc7365c745_html_a61213a7e8dadc6.gif 是随机变量5fcdc7365c745_html_b11ddce8969a02f4.gif 的实现,则我们可以定义一个局部依赖的马尔科夫随机域:规定在给定其他像素5fcdc7365c745_html_e77d3b13e62f0888.gif 的条件下的5fcdc7365c745_html_b11ddce8969a02f4.gif 的分布仅依赖于相邻像素。因此,当5fcdc7365c745_html_4e0fcd4d11a84c26.gif 时,即第5fcdc7365c745_html_1736468181fe6b37.gif 个像素周围的像素值都确定的情况下,我们有

5fcdc7365c745_html_69e7685c0d8205de.gif ,

对于5fcdc7365c745_html_a7742131d72f779.gif (1)

假定每个像素在等于0或1时有非零概率,则后面定义的条件分布(即公式(2))有定义。

Hammersley-Clifford定理[4]证明上面的条件分布可以使得X的联合分布成为一个规范化的常数。在我们考虑的离散二元状态空间中,这个规范化常数为5fcdc7365c745_html_4da0f8a522d99ea9.gif 取遍状态空间的像素的和。举个例子,考虑40×40的小图像,在规范化常数的计算中仍需要计算5fcdc7365c745_html_35efd0c6b0814d97.gif 个项。这是一个天文数字,但应用基于贝叶斯推断的MCMC方法,我们可以得到分布5fcdc7365c745_html_d45ea2a038e9bf3.gif 的抽样,进而研究分布5fcdc7365c745_html_d45ea2a038e9bf3.gif ,做出图像的推断。

建立模型

沿用前面的说明,定义5fcdc7365c745_html_a61213a7e8dadc6.gif 为第5fcdc7365c745_html_1736468181fe6b37.gif 个像素的值,这里5fcdc7365c745_html_b11ddce8969a02f4.gif 为第5fcdc7365c745_html_1736468181fe6b37.gif 个像素的真实值,将5fcdc7365c745_html_b11ddce8969a02f4.gif 看做一个随机变量,令5fcdc7365c745_html_4ef980402df006a1.gif 为第5fcdc7365c745_html_1736468181fe6b37.gif 个像素的观测值。这样,照片上的所有像素就构成了一个随机向量5fcdc7365c745_html_814a9de1a7ffe691.gif ,5fcdc7365c745_html_2d84af3a31ca81d9.gif 是观测数据。在图像分析领域中,5fcdc7365c745_html_2d84af3a31ca81d9.gif 为退化的图像,而5fcdc7365c745_html_814a9de1a7ffe691.gif 为未知的真实图像。对于二元随机域:5fcdc7365c745_html_6413153703c6b33e.gif 表明第5fcdc7365c745_html_1736468181fe6b37.gif 个像素是空白的,5fcdc7365c745_html_4c994359d0cc1a44.gif 表明第5fcdc7365c745_html_1736468181fe6b37.gif 个像素存在一个值。

有几个基本假设是模型的基础。首先,假设在给定真实像素值的条件下观测是相互独立的,即当5fcdc7365c745_html_2a9d94958f959d2e.gif 时,5fcdc7365c745_html_2d84af3a31ca81d9.gif 的联合条件密度为

5fcdc7365c745_html_8a0232a8967caac6.gif (2)

其中5fcdc7365c745_html_af3ff05c5538c9a7.gif 为给定真实值的条件下,像素5fcdc7365c745_html_1736468181fe6b37.gif 的观测数据的密度。

本模型中的参数为5fcdc7365c745_html_8a9339efc4ce7fbc.gif ,我们的目的就是要估计这些真实值,已知条件为5fcdc7365c745_html_7fac61ae7c35df51.gif 。假设参数的先验分布为5fcdc7365c745_html_1b7522b0b2afb41e.gif ,吉布斯抽样的目标是从5fcdc7365c745_html_814a9de1a7ffe691.gif 的后验密度中获得抽样:

5fcdc7365c745_html_93bb9b7a24f7856d.gif (3)

X的先验分布为

5fcdc7365c745_html_f93bb5adaca0e81b.gif (4)

其中,5fcdc7365c745_html_8a3454d35769e849.gif 表示像素5fcdc7365c745_html_1736468181fe6b37.gif 的邻域中的所有的像素5fcdc7365c745_html_4e60b72579d683ed.gif ,5fcdc7365c745_html_21ced3b5a078e85c.gif 为关于0对称的函数。考虑一个简单的先验密度和似然函数

5fcdc7365c745_html_fc2476ac1e3ce504.gif (5)

5fcdc7365c745_html_70c9f43d58a73734.gif (6)

上式中的5fcdc7365c745_html_b9531223879ddfc7.gif ,对于特定的问题,可以对5fcdc7365c745_html_95ca484f12910655.gif 的值做敏感度分析,以确定它们的最佳数值。另外,对于先验密度和似然函数的选取,通常选择指数族分布[1],因为指数族分布会使得先验分布和后验分布属于同一种分布(即共轭分布),而且指数族分布在大样本数据中的应用也是相当广泛的,已经经受住了相当的考验,实际操作非常稳定[4]

有了上面的假定,立即可以证明一元条件分布:

5fcdc7365c745_html_8e4f6b11c6d066e0.gif 服从的是贝努利分布,于是吉布斯抽样的第t+1次循环中,第5fcdc7365c745_html_1736468181fe6b37.gif 个像素等于1的概率为

5fcdc7365c745_html_4450da0827fead7c.gif5fcdc7365c745_html_db445c81a75bbd7b.gif (7)

4实证分析

在实证环节阶段,我们将还原一个模糊的车牌图像。该图像由153×409个像素格子组成,图像存储格式为bmp格式即可。像素值为1时,显示红色,像素值为0时,显示黄色。真实的车辆牌照号码为:津JVC520。

我们随机改变真实图像中50%的像素的值,即随机把50%像素的值从0变为1或者从1变为0,这样会得到非常模糊不清的“观测图像”,

应用基于马尔科夫随机域上的吉布斯抽样方法,得到以下算法:

  1. 做100次循环,每次循环更新图像上所有 像素点的取值;

  2. t+1次循环中,第5fcdc7365c745_html_1736468181fe6b37.gif 个像素等于1的概率为:

5fcdc7365c745_html_4450da0827fead7c.gif5fcdc7365c745_html_db445c81a75bbd7b.gif

3.100次循环后,计算每个像素在100次循环中的平均值,作为该像素的估计值。

用像素估计值如下图所示,估计值的准确率达到了82%。可见,除了“津”字不太清晰,JVC520的轮廓清晰可见。

5fcdc7365c745_html_3b6c518d37fddfe9.gif

1:模型估计的图像

5 模型的不足与待研究问题

实证的例子处理的是153×409个像素的图片,模型在R语言环境下实现,算法运行比较慢(程序处理需要两分钟左右),其效率有待提高。Swendsen-Wang算法是目前已知的收敛最快的算法之一,我们会在后续文章中给出Swendsen-Wang算法与本文算法的比较研究。

参考文献

[1] Gentle, James E. Computational Statistics[M]. Springer, 2009.

[2] Ross.Simulation[M].Elsevier Pte Ltd, 2013.

[3] 茆诗松,程依明. 概率论与数理统计[M]. 高等教育出版社, 2011.

[4] J.Besag. On the statistical analysis of dirty picture. Journal of the Royal Statistical Society, Series B, 48:259-302, 1986.

[5] J.Besag. Spatial interaction and the statistical analysis of lattice systems. Journal of the Royal Statistical Society, Series B,36:192-236,1974.

本站部分资源来自网络,如有侵权请联系删除!点击联系

发表评论

登录后才能评论