我们人类从第一次睁开眼睛开始就学会了识别模式。那是一只鸟!那是一架飞机!那些是字母A, B和C!如果我们不能从周围环境中挑选出特定的物体并加以分类,我们的视觉就没有什么用处了。

机器视觉系统还需要能够发现和识别模式。任何机器视觉任务的第一步都是模式匹配,即根据形状属性(如边缘)的预期排列,在视场中定位目标。这个过程是如何工作的?

事实证明,有许多方法可以执行模式匹配,因为这是一项涉及大量数据处理的任务,优化流程至关重要。在最基本的层次上,它涉及到使用图像中单个像素的强度来确定形状的轮廓(或边缘)在哪里。如果这些轮廓的排列与基于统计分析的模板模式的排列合理地相似,则视觉系统将输出一个匹配。

对比是王

由于边缘的检测是基于单个像素的不同强度,因此良好的对比度是非常重要的。这一要求导致了照明安排的各种创新,如轴上照明,照亮垂直于表面的光和穹顶照明,从各个方向提供一致的照明。这也是必要的,以尽量减少环境光和眩光来自反射表面。良好的光照可以最大限度地检测相关边缘,并最小化对不存在的边缘的感知。

还有一些图像处理算法,当光靠良好的光照是不够的时候,可以显示出图像的某些特征。阈值化是这种图像处理算法的一个例子,它通过计算不同强度下像素数量的直方图来确定强度阈值。该算法逐像素查看图像,将阈值以下的所有像素设置为黑色,阈值以上的所有像素设置为白色。

寻找一种模式

在机器视觉系统在产品线上,它需要知道自己在寻找什么。系统的操作人员通过提供模板映像告诉它要查找什么。然后系统会记住形状,包括边缘的位置以及相对于模板模式的整体大小它们之间的距离。重要的是视觉系统能够找到相同的模式在不同的大小和方向。

一旦系统知道它想要找到什么,它就开始分析捕获图像的像素数据。像素的强度范围从0到255,这些值可用于计算。为了找到物体的边缘,该软件通过执行像素减法来寻找对比度的大变化。如果减法的结果接近于零,那么这两个像素就不构成一条边。强度上的巨大差异——无论是正的还是负的——表明可能存在一个边缘。

像素减法的结果存储在数据结构中,软件水平和垂直扫描修改后的图像表示,以找到轮廓。它记录轮廓的相对距离,然后查找参考图像和任何发现的形状之间的统计相似性。可以改变系统的统计容忍度,以使匹配的可能性更大或更小。高容差将使误报更常见,而将容差设置在较低级别的系统更有可能错过真正的比赛。

机器视觉的未来:深度学习

在传统的机器视觉中,您需要准确地告诉系统您希望它寻找什么。这可能需要大量的编程工作。如果系统能够自己找出要查找的内容,那不是很好吗?这就是将深度学习算法融入工业机器视觉系统背后的推动力。

深度学习利用卷积神经网络(CNNs)等先进算法,让计算机根据一组训练数据来学习它们需要做什么。不需要指定一个对象的精确轮廓,一系列的图像被呈现给系统,指定它们要么包含感兴趣的对象,要么不包含。在这个训练期间,这些算法自己发现图像的哪些属性表明目标可能存在。这导致了更强的识别率,因为视觉系统处理大量数据的能力使它在识别物体的定义特征方面比人类做得更好。机器视觉正在迅速发展,专门研究它的工程师们也在不断地展望未来。未来几年可能会在照明、相机设备和机器视觉算法方面带来大量创新,使工业自动化比以往任何时候都更加精简和灵活。