人的眼睛有600万到700万个锥体细胞,其中包含三种被称为视蛋白的对颜色敏感的蛋白质之一。当光子击中这些视蛋白时,它们会改变形状,引发级联反应,产生电信号,进而将信息传递给大脑进行解读。
整个过程是一个非常复杂的现象,并且使机器在人类层面上解释这一点一直是一个挑战。现代机器视觉系统背后的的核心动机在于模拟人类视觉,用于识别图案,面部以及将将2D图像转化为3D模型等。
在概念层面,图像处理和计算机视觉之间存在很多重叠,并且经常被误解的术语可以互换使用。在这里,我们简要概述了这些技术,并解释了它们在基础层面上的不同之处。
图像处理
数字图像处理技术于20世纪60年代末在美国国家航空航天局喷气推进实验室(Jet Propulsion Laboratory)首创,通过计算机增强,将Ranger航天器的模拟信号转换为数字图像。现在,数字成像有着广泛的应用,尤其是在医学上。众所周知的应用包括计算机辅助断层扫描(CAT)和超声波。
图像处理主要与数学函数和图像变换的使用和应用有关,而不考虑对图像本身进行任何智能推理。它仅仅意味着算法对图像进行一些转换,如平滑、锐化、对比度、拉伸。
对于计算机来说,图像是一个二维信号,由像素的行和列组成。一种形式的输入有时可以转换成另一种形式。例如,磁共振成像(MRI),记录下离子的激发并将其转换成视觉图像。
这里有一个用Python平滑图像的例子:
对于一维信号,图像还可以使用各种低通滤波器(LPF)、高通滤波器(HPF)等进行滤波。HPF滤波器有助于在图像中找到边缘。
这种使用矩阵的变换在卷积神经网络等机器学习算法中非常普遍。在图像(像素值的另一个矩阵)上卷积滤波器,用于检测边缘或颜色强度。
在数字图像处理中使用的一些技术包括:
隐马尔可夫模型
图像编辑与恢复
线性滤波和双边滤波
神经网络
计算机视觉
计算机视觉来自使用机器学习技术建模图像处理。计算机视觉应用机器学习来识别用于解释图像的模式。就像人类视觉的视觉推理过程一样;我们可以区分对象,对它们进行分类,根据它们的大小对它们进行排序等等。计算机视觉,如图像处理,将图像作为输入,并以大小,颜色强度等信息的形式提供输出。
特斯拉的无人驾驶系统通过Source检测有雾情景中的物体
以下是标准机器视觉系统的组件:
相机
照明设备
镜头
抓帧器
图像处理软件
用于模式识别的机器学习算法
显示屏或机械臂执行从图像解释中获得的指令。
例如,安装在无人驾驶汽车上的摄像机必须检测到前面的人,并将他们与车辆和其他特征区分开来。或者,我们可以测量网球运动员在比赛中所走的距离。
球员运动的热图
因此,时间信息在计算机视觉中起着重要作用,就像我们自己理解世界的方式一样。
这里的最终目标是使用计算机来模拟人类视觉,包括学习和能够根据视觉输入进行推理和采取行动。
结论
图像处理是计算机视觉的一个子集。计算机视觉系统利用图像处理算法对人体视觉进行仿真。例如,如果目标是增强图像以便以后使用,那么这可以称为图像处理。如果目标是识别物体、汽车自动驾驶,那么它可以被称为计算机视觉。