数字图像处理复习笔记
数字图像质量表示
灰度图像与黑白图像不同,在计算机图像领域中黑白图像只有黑色与白色两种颜色;但是,灰度图像在黑色与白色之间还有许多级的颜色深度。
灰度:表示图像像素明暗程度的数值
灰度级:灰度级表明图像中不同灰度的最大数量。灰度级越大,图像的亮度范围越大。
对比度:指一幅图中灰度反差的大小,$对比度 = 最大灰度值/最小灰度值$
对图像质量的评价分为主观评价和客观评价
主观评价:通过人眼主观视觉效果进行判断
将待评价的图像序列播放给评论者观看,并记录他们的打分,然后对所有评论者的打分进行统计,得出平均分作为评价结果
![image-20240104202714573](/posts/0aa1101fa093/image-20240104202714573.png)
绝对评价:由观察者根据事先规定的评价尺度或自己的经验对图像作出判断和评价
相对评价:由观察者对一组图像按质量高低进行分类,并给出质量分数
客观评价:通过客观的测量给出量化指标
通过计算恢复图像偏离原始图像的误差来衡量恢复图像的质量,最常用的有均方误差(MSE)和峰值信噪比(PSNR)
![image-20240104202921584](/posts/0aa1101fa093/image-20240104202921584.png)
![image-20240104203234452](/posts/0aa1101fa093/image-20240104203234452.png)
新的方法有基于视觉特性的影像质量评价方法
![image-20240104203610421](/posts/0aa1101fa093/image-20240104203610421.png)
图像的关系
![image-20240105083727085](/posts/0aa1101fa093/image-20240105083727085.png)
两个像素(i,j)和(h,k)之间的距离有下面这几种定义:
![image-20240104203934176](/posts/0aa1101fa093/image-20240104203934176.png)
![image-20240104204012631](/posts/0aa1101fa093/image-20240104204012631.png)
![image-20240104204034405](/posts/0aa1101fa093/image-20240104204034405.png)
图像间运算
像素级运算
点运算
![image-20231105104611178](/posts/0aa1101fa093/image-20231105104611178.png)
![image-20231105104635407](/posts/0aa1101fa093/image-20231105104635407.png)
点运算针对图像中的每一个像素灰度,独立地进行灰度值的改变
输出图像中每个像素点的灰度值,仅取决于相应输入像素点的值
代数运算
![image-20231105104856290](/posts/0aa1101fa093/image-20231105104856290.png)
![image-20231105104943809](/posts/0aa1101fa093/image-20231105104943809.png)
![image-20231105105011256](/posts/0aa1101fa093/image-20231105105011256.png)
逻辑运算
![image-20231105105054296](/posts/0aa1101fa093/image-20231105105054296.png)
图像的颜色空间
如果我们需要表示彩色图片,就需要引入RGB和HSV(HSI)两种表示方法了
RGB和HSV分别是两种常见的彩色图像表示方法
RGB颜色空间以R(Red:红)、G(Green:绿)、B(Blue:蓝)三种基本色为基础,进行不同程度的叠加,产生丰富而广泛的颜色,所以俗称三基色模式。
与灰度图不同之处在于,RBG图的每个像素点都有3个值表示颜色,也叫3通道。如RGB(10,47,200)
相比于类似调色板的RGB颜色空间,HSV更接近于颜色的直观特性和人的视觉特性
HSV颜色模型是指H、S、V三维颜色空间中的一个可见光子集,它包含某个颜色域的所有颜色。每一种颜色都是由色相(Hue,简H),饱和度(Saturation,简S)和色明度(Value,简V)所表示的。这个模型中颜色的参数分别是:色调(H),饱和度(S),亮度(V)。
色调色彩信息,即所处的光谱颜色的位置。该参数用一角度量来表示,取值范围为0°~360°。若从红色开始按逆时针方向计算,红色为0°,绿色为120°,蓝色为240°。它们的补色是:黄色为60°,青色为180°,紫色为300°
饱和度是指色彩的鲜艳程度,也称色彩的纯度。饱和度取决于该色中含色成分和消色成分(灰色)的比例。含色成分越大,饱和度越大;消色成分越大,饱和度越小。取值范围为0.0~1.0
亮度(色明度)的概念与RGB中三原色的值类似,代表色彩的明亮程度。
HSV模型对应于圆柱坐标系中的一个圆锥形子集,圆锥的顶面对应于V=1。它包含RGB模型中的R=1,G=1,B=1 三个面,所代表的颜色较亮。色彩H由绕V轴的旋转角给定。饱和度]S取值从0到1,所以圆锥顶面的半径为1。
该圆锥形为倒立,顶点处V值为0,而底面上的V值为1
![image-20240104211951359](/posts/0aa1101fa093/image-20240104211951359.png)
离散信号和连续信号
![image-20240104212039128](/posts/0aa1101fa093/image-20240104212039128.png)
系统性质
![image-20240104213004873](/posts/0aa1101fa093/image-20240104213004873.png)
时不变系统:
![image-20240104213018388](/posts/0aa1101fa093/image-20240104213018388.png)
线性时不变
![image-20240104213035168](/posts/0aa1101fa093/image-20240104213035168.png)
离散信号响应
![image-20240104213339217](/posts/0aa1101fa093/image-20240104213339217.png)
![image-20240104213904618](/posts/0aa1101fa093/image-20240104213904618.png)
二维图像的卷积计算
卷积运算:模板先沿纵轴翻转,再沿横轴翻转后再加权平均。
需要注意图像的边缘处要补零
![image-20240104235512499](/posts/0aa1101fa093/image-20240104235512499.png)
图像的直方图
灰度直方图展示了图像中每种灰度级的像素个数
横坐标为灰度级,纵坐标表示该灰度级出现的频率
绘制图像的灰度直方图可以按照如下算法:
假设有一个灰度级为L的灰度图像f(x,y),大小为M*N
- 初始化$hist[k]=0;k=0,…,L-1$
- 统计$hist[f(x,y)]$++$;x=0,…,M-1,y=0,…,N-1$
- 归一化$hist[f(x,y)]/(M*N)$
灰度直方图可以应用于图像快速检测、分割前景背景、目标面积计算
彩色图像可以分别计算其R、G、B通道上的直方图
直方图均衡
直方图呈均匀分布时,对比度会有明显增强
通过灰度变换函数,将原图像直方图的分布均衡化,这一过程称为直方图均衡化
![image-20231105142229662](/posts/0aa1101fa093/image-20231105142229662.png)
想要使直方图均衡化,那么此时$D_B$就是均匀分布的
![image-20231105143057840](/posts/0aa1101fa093/image-20231105143057840.png)
可以推导出均衡化公式如下
![image-20231105143256782](/posts/0aa1101fa093/image-20231105143256782.png)
![image-20240104224617031](/posts/0aa1101fa093/image-20240104224617031.png)
噪声
一个信号通常是由低频和高频部分组成
低频组成部分:平滑或逐段平滑的区域,邻近像素亮度值相似。
高频组成部分:震荡性强的区域,邻近像素亮度值不同,通常在边缘或噪声点处。
下面是一个明显的例子
![image-20231112142919890](/posts/0aa1101fa093/image-20231112142919890.png)
那么我们已经知道高频信号经常是图片中的噪声,也就顺理成章地能想到一种去噪方法
那就是将图像中噪声集中的频率过滤掉
![image-20231112145659608](/posts/0aa1101fa093/image-20231112145659608.png)
深入研究去噪方法前,我们先来了解有哪些常见的噪声
- 盐和胡椒噪声(Salt-and-Pepper Noise):
- 特点:这种噪声呈现为图像中随机分布的黑白像素点。
- 产生原因:通常由图像传感器、传输错误或由于数据损坏等原因引起。
- 表现:图像中出现的黑点(”胡椒”)和白点(”盐”)。
- 脉冲噪声(Impulse Noise):
- 特点:类似于盐和胡椒噪声,但通常只包括单一色彩的像素点(通常是白色)。
- 产生原因:可能由图像传感器的故障、传输过程中的错误或其他技术问题导致。
- 表现:图像中随机分布的明亮像素点。
- 高斯噪声(Gaussian Noise):
- 特点:这种噪声的幅度遵循高斯分布(正态分布),即噪声值的分布呈钟形曲线。
- 产生原因:可以由多种原因产生,包括传感器噪声、电子电路噪声、热噪声等。
- 表现:在整个图像中平均分布,通常看起来像是图像的粒状或轻微模糊。
![image-20240104235640397](/posts/0aa1101fa093/image-20240104235640397.png)
在均值滤波中,每个样本(即四周的像素点)都有相同的权重
那么事实上,我们可以把卷积看作一个移动加权均值滤波
均值滤波适合高斯噪声
![image-20240104235804588](/posts/0aa1101fa093/image-20240104235804588.png)
中值滤波
中值滤波会选取滑动窗口中的中间值作为函数结果
相比于高斯低通滤波,中值滤波有对异常值的稳健性,同时也具有边缘保护功能
![image-20231113110755683](/posts/0aa1101fa093/image-20231113110755683.png)
![image-20240104235834260](/posts/0aa1101fa093/image-20240104235834260.png)
![image-20240105084446459](/posts/0aa1101fa093/image-20240105084446459.png)
傅里叶变换
![image-20240104235904586](/posts/0aa1101fa093/image-20240104235904586.png)
![image-20240104230415226](/posts/0aa1101fa093/image-20240104230415226.png)
![image-20240104232107647](/posts/0aa1101fa093/image-20240104232107647.png)
![image-20240104230319812](/posts/0aa1101fa093/image-20240104230319812.png)
![image-20240104233326489](/posts/0aa1101fa093/image-20240104233326489.png)
离散傅里叶变换
![image-20240105000327981](/posts/0aa1101fa093/image-20240105000327981.png)
![image-20240105000344904](/posts/0aa1101fa093/image-20240105000344904.png)
![image-20240105000351311](/posts/0aa1101fa093/image-20240105000351311.png)
离散傅里叶变换的显示,中心化和对数化
![image-20240105001626079](/posts/0aa1101fa093/image-20240105001626079.png)
![image-20240105001648468](/posts/0aa1101fa093/image-20240105001648468.png)
![image-20240105001920913](/posts/0aa1101fa093/image-20240105001920913.png)
对数化:
![image-20240105001536982](/posts/0aa1101fa093/image-20240105001536982.png)
频域滤波
![image-20240105002107791](/posts/0aa1101fa093/image-20240105002107791.png)
![image-20240105002201788](/posts/0aa1101fa093/image-20240105002201788.png)
![image-20240105002204831](/posts/0aa1101fa093/image-20240105002204831.png)
低通滤波和⾼通滤波的意义
![image-20240105002613166](/posts/0aa1101fa093/image-20240105002613166.png)
![image-20240105002620497](/posts/0aa1101fa093/image-20240105002620497.png)
![image-20240105002637453](/posts/0aa1101fa093/image-20240105002637453.png)
卷积定理
![image-20240105002701777](/posts/0aa1101fa093/image-20240105002701777.png)
形态学处理
概念
形态学处理是指将数学形态学作为⼯具从图像中提取对于表达和描述区域形状有⽤的图像分量。
形态学处理表现为⼀种邻域运算形式;⼀种特殊定义的邻域称之为“结构单元”(Structure Element),在每个像素位置上它与⼆值图像对应的区域进⾏特定的逻辑运算,逻辑运算的结果为输出图像的相应像素。
形态学运算的效果取决于结构单元的⼤⼩、内容以及逻辑运算的性质
基本处理定义
二值形态学处理
二值图像中,黑色表示1,白色表示0
![image-20231216150630889](/posts/0aa1101fa093/image-20231216150630889.png)
![image-20231216150643744](/posts/0aa1101fa093/image-20231216150643744.png)
平移
![image-20231216150731370](/posts/0aa1101fa093/image-20231216150731370.png)
此处的结构单元x在平移运算中通常为1个点
扩张
扩张使得图像扩大
![image-20231216152448033](/posts/0aa1101fa093/image-20231216152448033.png)
如果有重叠则将结构中心处设为1
腐蚀
腐蚀会使得图像缩小
![image-20231216152638746](/posts/0aa1101fa093/image-20231216152638746.png)
![image-20231216153002542](/posts/0aa1101fa093/image-20231216153002542.png)
如果有完美匹配则将结构中心处设为1
性质
扩张和腐蚀具有以下性质
![image-20231216153409216](/posts/0aa1101fa093/image-20231216153409216.png)
方形结构单元越大,膨胀和腐蚀的效果越强
![image-20231216153646850](/posts/0aa1101fa093/image-20231216153646850.png)
![image-20231216153700024](/posts/0aa1101fa093/image-20231216153700024.png)
形态学变换
结构开(open)变换
结构开变换等同于先腐蚀然后再扩张
公式:$A \circ B = (A \ominus B) \oplus B$
目的:使轮廓平滑,抑制A物体边界的⼩离散点或尖峰,在研究物体的形态分布时常⽤。⽤来消除⼩物体、在纤细点处分离物体、平滑较⼤物体的边界的同时并不明显改变其⾯积。
下图能够非常直观的说明平滑作用
![image-20231216154547071](/posts/0aa1101fa093/image-20231216154547071.png)
![image-20231216154657067](/posts/0aa1101fa093/image-20231216154657067.png)
结构闭(close)变换
结构闭变换等同于先扩张然后再腐蚀
公式:$A \bullet B = (A \ominus B) \oplus B$
目的:也是⽤于图像光滑。但与开变换相反,闭变换⽤来填充物体内细⼩空洞、连接邻近物体、平滑其边界的同时并不明显改变其⾯积。
下图能够非常直观的说明填补空洞的作用
![image-20231216160301592](/posts/0aa1101fa093/image-20231216160301592.png)