《数字图像处理 第三版》札记
第一章
何为强度或灰度?
一幅图像可定义为一个二维函数 \(f(x, y)\),其中 \(x\) 和 \(y\) 是空间(平面)坐标,而在任何一对空间坐标 \((x, y)\) 处的幅值(amplitude,振幅)\(f\) 称为图像在该点处的强度或灰度。
关于灰度的更通俗的解释如下:
The grey level or grey value indicates the brightness of a pixel. The minimum grey level is 0. The maximum grey level depends on the digitisation depth of the image. For an 8-bit-deep image it is 255. In a binary image a pixel can only take on either the value 0 or the value 255. In contrast, in a greyscale or colour image a pixel can take on any value between 0 and 255.
引用自:https://www.stemmer-imaging.com/en-ie/knowledge-base/grey-level-grey-value/
何为数字图像?
接上一条,当 \(x, y\) 和灰度值 \(f\) 是有限的离散数值时,我们称该图像为数字图像。
第二章
如何理解人眼的结构?
眼睛的形状近似为一个球体,其平均直径约为 20 mm。有三层薄膜包围着眼睛:角膜与巩膜外壳、脉络膜和视网膜。
- 角膜是一种硬而透明的组织,覆盖着眼睛的前表面。与角膜相连的巩膜是一层包围着眼球其余部分的不透明的膜。
- 脉络膜位于巩膜的正下方。脉络膜包含有血管网,它是眼睛的重要滋养源。即使是对脉络膜表面并不严重的损害,也有可能严重地损害眼睛,引起限制血液流动的炎症。脉络膜外壳着色很重,因此有助于减少进入眼内的外来光和眼球内反向散射光的数量。
- 脉络膜的最前面分为睫状肌和虹膜。虹膜的收缩和扩张控制着进入眼睛的光量。虹膜中间的开口(瞳孔)的直径是可变的,范围大约在
2-8 mm。虹膜的前面包含有眼睛的可见色素,而后面则包含有黑色色素。
按:这里要从三维视角来看。
- 晶状体由同心的纤维细胞层组成,并由附在睫状肌上的纤维悬挂着。晶状体包含 60%~70% 的水、6% 的脂肪和比眼睛中任何其他组织都多的蛋白质。晶状体由稍黄的色素着色,其颜色随着人的年龄的增大而加深。晶状体吸收大约 8% 的可见光谱,对短波长的光有较高的吸收率。在晶状体结构中,蛋白质吸收红外光和紫外光,吸收过量时会伤害眼睛。
- 眼睛最里面的膜是视网膜,它布满了整个后部和内壁。当眼睛适当地聚焦时,来自眼睛外部物体的光在视网膜上成像。由视网膜表面分布的不连续的光,感受器提供了图案视觉。有两类光感受器:锥状体和杆状体。
- 每只眼睛中的锥状体数量在 600~700 万之间。他们主要位于视网膜的中间部分,称之为中央凹,且对颜色高度敏感。用这些锥状体,人可以充分地分辨图像细节,因为每个锥状体都连接到自身地神经末梢。肌肉控制眼球转动,直到感兴趣的物体落到中央凹上。锥状体视觉称为白昼视觉或亮视觉。
- 杆状体的数量更多:约有 7500~15 000 万个杆状体分布在视网膜表面。由于分布面积较大而且几个杆状体连接到一个神经末梢,因此减少了这些感受器感知细节的数量。杆状体用来给出视野内的一般的总体图像。它们没有彩色感觉,而对低照明度敏感。例如,在白天呈现鲜明色彩的物体,在月光下都没有颜色,因为此时只有杆状体收到刺激。这种现象称为暗视觉或微光视觉。
下图显示了右眼中通过眼睛视神经出现区的剖面的杆状体和锥状体密度。The absence of receptors in this area results in the so-called blind spot.
疑问:这里是怎么剖开的???
- Ciliary body: 睫状体
- Sclera: 巩膜
- Choroid: 脉络膜
- Nerve & sheath: 神经和鞘
- Ciliary muscle: 睫状肌
- Iris: 虹膜
- Cornea: 角膜
- Anterior chamber: 前房
- Lens: 晶状体
- Ciliary fibers: 睫状小带
- Visual axis: 视轴
- Vitreous humor: 玻璃体
- Fovea: 中央凹
- Blind spot: 盲点
- Retina: 视网膜
何为马赫带效应?
视觉系统对亮度的感知不是简单的强度函数。然后,这个马赫带效应就是,每一条带上的亮度是均匀的,但是在不同带的交界处,我们会看到,亮的那一侧会出现更亮的一条线,暗的那一侧会出现更暗的一条线。简单来讲,这就是马赫带效应。
何为同时对比现象?
和马赫带效应类似,我们人眼观察到好像第一个图中间的小方块最亮,第三个中间的小方块最暗。实际上,它们的灰度(亮度)是一样的。
何为灰度级?
灰度级的典型取值是 2 的整数次幂。通常假设离散灰度级是等间隔的并且是区间 \([0, L - 1]\) 内的整数。(L 即 2 的整数次幂)
何为 k 比特图像?
当一幅图像有 \(2^k\) 灰度级时,通常称该图像是 k 比特图像。
何为动态范围?
有时灰度级的取值范围称为图像的动态范围。把占有灰度级全部有效段的图像叫做高动态范围图像。当相当可观数目的像素呈现这样的特征时,图像就有较高的对比度。相反,低动态范围的图像看上去似乎是冲淡了的灰暗格调。
何为图像采样分辨率?
单位长度上所包含的采样数。
何为空间分辨率?
直观上讲,空间分辨率是图像中可辨别的最小细节的度量。在数量上,空间分辨率可以有很多方法来说明,其中每单位距离线对数和每单位距离点数(像素数)是最通用的度量。
举例来说,每英寸点数(dpi)就是描述空间分辨率的一个例子。
何为灰度分辨率?
灰度分辨率是指在灰度级中可分辨的最小变化。
灰度分辨率指的是用于量化灰度的比特数。
例如,通常说一幅被量化为 256 级的图像有 8 比特的灰度分辨率。
关于直方图变换的推导?
书上的证明很精确,而且易于理解。
直方图均衡的离散形式为?
\[ s_k = T(r_k) = (L - 1) \sum_{j = 0}^{k} p_r(r_j) = \frac{L -1}{MN} \sum_{j = 0}^{k} n_j, \quad k = 0, 1, 2,..., L -1 \]
详情见教材。这一块,似乎不用非常熟练地理解,大概只要思路跟着教材或者老师走一遍就行。真的需要具体用的时候再回来看。不过,这玩意儿还挺绕的。
如果考试需要考的话,那么,就得把西电的网课上的那一道例题给看一下了。