跳转至

4. 三维与特殊成像(第23—31问)

网络署名:LanQS · 作者及著作权人:兰青松 · 版权说明

本节介绍双目、结构光、激光三角测量、TOF、红外、紫外和智能相机,并把这些技术放回项目需求、环境条件和维护成本中比较。

23. 3D视觉常用哪些技术方案?(如双目立体视觉、结构光、激光三角测量、TOF)

23.1 什么是 3D 视觉,为什么它需要不同的技术方案?

二维视觉主要处理位置、形状、灰度和颜色,很多时候足以完成定位、计数和表面外观判断;但当任务依赖高度、深度、体积、平面度、段差、间隙、轮廓或空间姿态时,仅凭二维灰度就不够了,这时就需要 3D 视觉。它的目标是从成像数据中恢复与几何相关的深度信息,而非仅仅把画面呈现为立体效果。

之所以存在多种 3D 方案,是因为不同场景对精度、测距范围、速度、表面材质、环境光和成本的要求差别很大。近距离高精度检测、户外远距离感知、在线轮廓扫描和高速动态测距,分别更适合不同原理。没有一种 3D 技术能在所有工况下同时做到最便宜、最快、最稳又最精。

23.2 双目立体视觉的基本原理是什么,它有什么优缺点?

双目立体视觉通过两台相机从不同视角拍摄同一目标,利用对应点在左右图中的位置差计算视差,再由视差恢复深度。其简化关系可写为

\[ Z = \frac{fB}{d} \tag{23-1} \]

其中,\(Z\) 为目标深度,\(f\) 为焦距,\(B\) 为双目基线,\(d\) 为视差。由式(23-1)继续推导,可得到深度误差与视差测量误差的关系:

\[ \sigma_Z = \frac{fB}{d^2}\sigma_d = \frac{Z^2}{fB}\sigma_d \tag{23-2} \]

式(23-2)说明一个非常实际的工程事实:距离越远,双目深度精度下降越快。这并不意味着双目不能用于远距离,而是意味着若要维持精度,往往需要更长基线、更高分辨率或更强匹配约束,而这些措施又会带来安装空间、公共视场和标定难度的代价。

它的优点在于系统相对简单、成本可控、无需主动投光,且能同时保留纹理信息;局限则在于它高度依赖表面纹理与匹配质量。对于纯色面、重复纹理、透明件、镜面件或严重遮挡区域,双目并不天然占优。工业选型时不能把"反光件适合双目"作为普遍结论,是否可行仍取决于表面是否提供了足够、稳定且可匹配的纹理线索。

在工程实现上,OpenCV 提供了完整的双目视觉工具链:先用 cv::stereoCalibrate() 标定双目的内外参,再用 cv::stereoRectify() 将左右图校正到行对齐,然后以 cv::StereoSGBM::create()cv::StereoBM::create() 计算视差图,最后通过 cv::reprojectImageTo3D() 将视差转为三维点云。其中 SGBM(Semi-Global Block Matching)是较常用的半全局匹配算法,关键参数包括:numDisparities(视差搜索范围,须为 16 的倍数)、blockSize(匹配块大小,通常 3~11 的奇数)、P1P2(平滑惩罚系数,P2>P1 时视差图更平滑)、uniquenessRatio(唯一性比率,通常 5~15)以及 disp12MaxDiff(左右一致性检查阈值)。这些参数需要在具体场景下调试,没有一组默认值能通用于所有工业工况。

引用出处:双目立体视觉的标定与匹配流程参见 OpenCV 4.x 官方文档——cv::stereoCalibrate()cv::stereoRectify()cv::StereoSGBM 参数说明(docs.opencv.org/4.x/d9/d0c/group__calib3d.htmldocs.opencv.org/4.x/d2/d85/classcv_1_1StereoSGBM.html)。

23.3 结构光技术如何工作,它在哪些场景中表现优异?

结构光属于主动 3D 方法,它通过投射已知图案到目标表面,再由相机观察图案的变形,从而恢复深度。这里的“图案”可以是条纹、散斑、格雷码、正弦相移等,其共同点是:投射器给出了一个已知空间参考,相机看到的是这个参考被目标几何改写后的结果。只要能正确解码每个像素对应的投射信息,再结合标定好的几何关系,就能反推出三维坐标。

它特别适合近距离高精度、稠密重建和纯色表面场景,因为系统不依赖工件天然纹理,而是自己提供纹理。消费电子装配、精密轮廓测量、面形分析和近距机器人抓取中,结构光往往很有优势。它的边界也很明确:强环境光、明显运动、透明材质和高反光内腔都会增加解码难度,尤其多帧相移方案对振动和位移更敏感。

常见3D视觉技术方案对比

图23-1 常见 3D 视觉方案的原理与适用边界对比

图23-1把双目、结构光、激光三角测量和 TOF 放在同一评价框架中比较。每一列上半部分概括测量机制,中间部分列出更常见的适用工况与受限场景,底部则给出工程上最容易忽略的边界,例如双目依赖纹理、结构光怕强环境光、激光三角更擅长轮廓扫描而非一次性全场、TOF 需要处理多径和飞点。图中彩色卡片分别代表不同技术路线,帮助读者先按物理机制分类,再按工况筛选。它适合作为选型入口,但真正落地时还要把精度、测距范围、节拍和表面光学性质纳入同一张表里比较。

23.4 激光三角测量技术的核心机制是什么,它为何在工业检测中广泛应用?

激光三角测量通常由线激光 + 成像相机 + 相对运动构成。线激光在工件表面形成一条光带,相机从侧向观察这条光带的位置变化;当表面高度改变时,光带在相机图像中的位置也会偏移,通过三角关系即可恢复高度。若工件沿传送方向移动,或传感器自身做扫描运动,单条轮廓可以逐步展开为完整的 3D 表面。

它在工业检测中应用广泛,原因在于方案成熟、对轮廓类任务极其实用,且在线测量能力强。焊缝轮廓、钢板厚度、轨迹跟踪、型材截面、台阶高度和胶路截面等任务,本质上都更关心沿某一截面的高度变化,这正是激光三角测量最擅长的工作方式。需要说明的是,它常常不是一次得到整个面,而是依靠线扫或运动把面展开。

23.5 TOF(飞行时间)技术的物理原理是什么,它如何实现实时深度测量?

TOF 的基本思想是测量光从发射到返回所经历的时间,或者等价地测量调制光的相位变化。其理想化关系可写为

\[ d = \frac{ct}{2} \tag{23-3} \]

其中,\(d\) 为目标距离,\(c\) 为光速,\(t\) 为往返飞行时间。实际系统中既有直接 TOF,也有以相位测量为主的间接 TOF;无论具体实现如何,它们共同的优势都是每个像素直接输出深度估计,因此帧率较高,适合动态场景和实时避障。

TOF 的难点在于精度通常不如近距高精度结构光,也更容易受到多径反射、强环境光、表面反射率差异和飞点(flying pixels,在深度边缘或多径干扰处产生的错误深度点)影响。它擅长的是中近距快速感知,而不是在所有表面上做精密计量。

23.6 除了上述四种,还有哪些重要的 3D 视觉技术?

常见补充路线还包括多目视觉、单目深度估计、光场方法、轮廓投影测量等。多目系统可以利用更多视角减少遮挡并提高匹配约束;单目深度估计在成本和集成上有吸引力,但其深度通常更偏“感知意义”而不是精密计量;某些工业场景还会把结构光与双目结合,形成主动双目方案,以兼顾纹理补充和几何测量。

对初学者而言,理解这些方法最有效的方式,不是记名称,而是先问自己:深度信息来自哪里,是自然纹理、主动投光、时间测距,还是物体与传感器之间的已知运动? 这条线索有助于快速把各种 3D 系统归类。

23.7 这些技术方案在实际应用中如何选择?

选型时建议先按五个问题筛选。第一,看精度和距离:近距离高精度面形测量,结构光和激光三角更常见;中近距实时感知,TOF 更有优势;大场景、成本敏感且有足够纹理时,双目值得优先考虑。第二,看表面性质:透明、镜面、黑亮和深腔表面往往会把主动投光和被动匹配同时变难,需要样件验证。第三,看速度:明显运动的目标不适合直接套用多帧相移结构光。第四,看数据形式:需要整面稠密高度图,和只需要轮廓线高度,方案并不相同。第五,看工程成本:标定、维护、遮光、安装空间和上位机算力都应计入总成本。

真正成熟的选型很少只靠一项参数决定。例如“精度最高就选结构光”“动态场景就一定选 TOF”都过于粗糙。工程判断通常建立在样件验证上,尤其要覆盖最难样件、最差表面状态和最不利姿态。

23.8 当前 3D 视觉技术的发展趋势是什么?

总体趋势有三条。其一是传感器和投射器硬件持续提升,让系统在更大视场和更高帧率下保持更可用的深度质量;其二是算法融合增强,用学习方法修补匹配、相位展开、点云去噪和多径抑制中的薄弱环节;其三是多模态融合,将二维纹理、偏振、热成像或力觉等信息与深度联合使用,以弥补单一 3D 传感路线的边界。

结构光中条纹位移与单帧歧义

图23-2 结构光中条纹位移与单帧歧义的直观关系

图23-2先画出投射器给出的基准条纹,再在中间引入台阶高度,显示条纹如何随表面起伏发生侧移,最后在右侧指出单帧图像只能观察“当前位置”,却未必知道该条纹跨了几个周期。图中的竖条表示投射节律,灰色台阶表示高度变化,箭头表示相位或投射坐标发生了偏移。这里的左右方向只是示意,真实系统中条纹向左还是向右移动,取决于相机与投射器的相对几何位置。它帮助读者把结构光和普通亮暗成像区分开来:系统真正利用的是已知图案与被测表面之间的几何关系。该图适合建立直觉,但实际重建还需要编码设计、相位展开和高精度标定,不能把“看到位移”直接等同于“已经得到高度”。


24. 结构光 3D 相机的工作原理是什么?适用于检测物体的哪些特性?

24.1 什么是结构光技术的基本概念?

结构光是主动式三维测量方法。系统主动向目标投射一个已知空间结构,例如条纹、点阵、格雷码或散斑,然后由相机观察这些结构在目标表面上的变形。若把投射器看成“给场景写入一把标尺”,结构光做的就是根据这把标尺被表面起伏改写后的样子,反推空间坐标。

它与单纯的二维打光不同,后者更关注亮暗对比;结构光关注的是图案位置、相位和编码关系。因此,同样是看一条条纹,二维视觉可能只关心它亮不亮,结构光系统关心的是它出现在何处、为何出现在那里,以及它与投射端原始编号之间如何对应。

24.2 结构光 3D 相机的基本硬件组成有哪些?

典型结构光系统由投射器、相机、标定几何和处理单元构成。投射器负责输出具有已知结构的光图案,相机负责采集图案经目标表面调制后的图像,处理单元负责完成解码、相位计算、展开和三角重建。很多工业系统还会附带窄带滤光、同步控制、机械支架和温度管理模块,因为它们直接关系到长期稳定性。

若从几何意义理解,投射器和相机并不只是两个“会发光、会拍照的部件”,而是共同构成了一个已知基线与夹角的测量系统。标定的质量决定了后续从图像坐标恢复三维坐标的精度上限。

24.3 结构光 3D 相机工作的核心原理是什么?

核心过程可以概括为三步:投射已知编码,采集变形结果,结合标定几何求三维坐标。在相移条纹系统中,算法往往先根据多幅条纹图求出每个像素的相位,再通过相位或投射器坐标与相机像素之间的对应关系进行三角计算;在格雷码系统中,算法则更偏向先解码离散编号,再换算成投射坐标。

因此,结构光并不是简单“分析每个点挪了多少”那么粗略,更准确的表述应当是:系统先恢复每个像素对应的投射信息,再利用相机—投射器几何关系把该信息转换为空间坐标。这一区别很重要,因为它决定了编码设计、相位展开和标定在系统中的地位。

结构光3D相机的典型重建流程

图24-1 结构光 3D 相机的典型重建流程

图24-1把结构光重建拆成五步:投射编码图案、相机采集变形条纹、解码投射坐标或相位、在标定几何下做三角换算,最后输出点云或高度图。每个面板对应一段真实处理链路,而不是简单的概念罗列。图中的条纹、柱状值、几何点位和点云点阵,分别代表原始编码、解码后的相位信息、相机与投射器的几何关系以及最终的三维结果。读者应由此理解结构光系统中“编码”和“标定”同样重要,不能只盯着投射器亮不亮。它适合用于理解整体流程,但不同厂商在编码形式和后处理细节上会有差别。

24.4 结构光图案编码和解码过程是怎样的?

如果只投一幅周期条纹,相机往往只能知道条纹在当前位置亮暗如何变化,却不一定知道它属于哪一个周期,这就是结构光里常说的单帧歧义。需要说明的是,\(\arctan\) 求出的相位只在一个周期内(被卷绕),恢复它跨了几个周期的过程就叫相位展开(phase unwrapping)。为解决这个问题,工业系统会使用时间编码、空间编码或二者结合的策略。格雷码侧重给每个区域分配唯一编号,相移法侧重用多幅相位不同的正弦条纹恢复连续相位,一些系统还会把两者叠加,先粗定位周期,再精定位相位。

解码的目标并不是“把图案看清楚”,而是把每个相机像素映射到投射器坐标或相位值。只有建立这层对应关系,三维求解才有基础。对多帧方案而言,工件静止性和同步精度直接决定解码质量;对单帧方案而言,动态能力更强,但编码容量、抗噪和精度常常需要重新权衡。

24.5 结构光 3D 相机的主要技术类型有哪些?

从图案和采集方式看,常见路线包括格雷码结构光、相移结构光、散斑结构光、单帧编码结构光等。若把“线结构光”也纳入广义范围,它与面结构光共享三角测量基础,但在工业应用中通常更独立地归为激光三角测量或轮廓传感,因为其数据组织方式、应用重心和节拍特点都不同。

对初学者来说,一个有效的区分方式是:一次覆盖整个视场、得到稠密面信息的,更接近面结构光;沿一条线逐步展开 3D 的,更接近轮廓扫描型方案。两者都重要,但不应在概念上混成一个模糊大类。

引用出处:OpenCV 4.x 提供了 cv::structured_light 模块(含格雷码和正弦条纹等编码方法)作为教学与原型参考,但工业级结构光系统通常以厂商专有 SDK 与标定流程为主(docs.opencv.org/4.x/d1/d90/group__structured__light.html)。

24.6 结构光 3D 相机适用于检测物体的哪些几何特性?

它最适合处理那些必须依赖高度信息才能准确判断的几何量,例如高度、段差、间隙、平面度、翘曲、轮廓起伏、体积、表面形貌和自由曲面偏差。如果任务只关心平面上的轮廓位置,二维视觉通常更经济;若任务关心“高出多少、陷下多少、面是否鼓起、边缘是否齐平”,结构光的价值才真正体现出来。

在很多制造场景中,读者会看到“外观没问题,但装配后仍失效”的案例,根源往往是二维相机看不到的段差、翘曲或装配高度漂移。结构光提供的是这类信息的直接观测通道。

24.7 结构光 3D 相机在表面缺陷检测中有何优势?

它的优势在于把几何起伏本身作为检测对象。二维视觉常常依赖亮暗、反射和颜色差异来间接推断缺陷,而结构光可以更直接地输出某处是否凹下去、鼓起来、边界是否连续、局部高度是否异常。这对划伤、凹坑、焊道高度、毛刺、压伤、胶路截面和密封面起伏等问题尤其有价值。

当然,这并不意味着 3D 一定优于 2D。若缺陷主要体现为颜色污染、轻微印刷问题或没有可分辨高度差的表面异色,结构光未必更合适。工程上常见的可靠做法,是让二维和三维各自承担最擅长的判定部分,而不是试图用一种传感方式包打天下。

24.8 结构光 3D 相机在哪些具体应用场景中表现突出?

典型场景包括电子装配中的器件高度、焊点轮廓、PCB 翘曲,汽车与机械制造中的段差、间隙、焊缝面形、冲压件轮廓,以及包装、消费电子和医疗器械中的平面度、灌装高度、自由曲面偏差和外形重建。凡是需要在较大视场内一次拿到较稠密高度图,又不希望完全依赖工件天然纹理的场景,结构光都值得优先评估。

选择时仍要警惕表面反射特性。许多高反光金属件、透明件和深槽内壁,在“看上去很适合做 3D”的直觉下,恰恰是结构光最难稳定处理的对象。

24.9 结构光 3D 相机相比其他 3D 技术有何优缺点?面临的最大痛点是什么?

它的主要优势是近距离精度高、点云稠密、对天然纹理要求低。对于纯色塑料件、复杂曲面和要求整面高度分布的检测任务,它通常比被动双目更稳定,也比单线轮廓扫描更容易直接得到全场信息。

真正的痛点则集中在环境光、运动和多径反射。环境光会降低投射图案对比,多帧采集会放大振动影响,而深槽、镜面、高反光内腔和复杂金属件中常出现的多径干扰,会让相机接收到混合了多次反射的条纹信号,造成相位扭曲、飞点、破洞或局部深度错误。这个问题往往不是简单“调亮一点”就能解决,而需要在投射频率、偏振、光路角度、表面处理和算法抑制之间综合平衡。

24.10 结构光 3D 相机的精度受哪些因素影响?

精度上限来自多个环节共同作用。几何基线与焦距决定了测量灵敏度,投射分辨率与相机分辨率决定了可恢复的空间细节,相位解算或编码解码精度决定了像素级对应关系是否稳定,标定质量决定了图像坐标到空间坐标的换算误差,表面反射特性、环境光、振动和温漂则决定了这些理论能力能否在现场真正兑现。

工程上应避免把精度理解为一个脱离条件的固定数字。某台设备在漫反射标定板上能达到的精度,未必能直接移植到高反光金属件、斜面玻璃或高速运动工件上。读者看到厂商给出的指标时,最好同步确认其对应的工作距离、视场、采样方式、表面类型和误差定义。

相移法将条纹位置转换为可计算相位

图24-2 相移法中多帧条纹与相位求解的关系

图24-2把四步相移法中常见的四幅条纹并排展开,并在下方给出典型的相位计算形式。上排四个小框表示同一空间位置在四个投射相位下的灰度响应,下方公式说明算法并不是凭一张条纹“猜高度”,而是利用一组已知相位关系把灰度变化转换成连续相位。读者应从这张图读出两个判断:一是多帧相移能提高精度,但前提是目标在采集期间足够稳定;二是求得相位并不等于深度已经完成,后续仍需相位展开和几何标定。它适合用于理解相移法原理,但实际系统在抗饱和、去阴影和展开策略上还会有进一步细节。


25. 红外相机和紫外相机分别用于检测什么类型的缺陷?

25.1 红外相机和紫外相机分别基于什么物理原理工作?

红外相机主要利用红外波段中的辐射、透射或反射信息成像。在热像应用中,它观察的是目标表面的温度场及其随时间的变化;在短波红外应用中,它也可能利用材料在该波段的透射或反射差异,而不只是“看热”。因此,说红外相机时最好先区分是热成像还是近红外/短波红外成像,二者虽同属红外,但工作机理和应用重点并不完全相同。

紫外相机则不是简单因为“波长更短所以一定更清晰”。它真正有价值的地方在于,许多材料在紫外波段下的反射、吸收和荧光响应与可见光不同,从而能把普通照明下不明显的表面污染、涂层异常、渗透探伤指示或微弱图案差异凸显出来。在某些高 NA 光学系统中,短波长也确实有利于提高理论分辨能力,但这只是紫外检测价值的一部分,不应把它概括成唯一原理。

25.2 红外相机主要检测哪些类型的缺陷?

红外相机更适合检测会引起温度场异常或热传导路径异常的缺陷。例如电子元件过热、接触电阻异常、短路热点、封装空洞、复合材料分层、建筑空鼓、保温缺陷、光伏隐裂和某些流体泄漏,往往都会在热像上表现为局部温差、扩散速度异常或热响应不连续。对于这类问题,缺陷未必能在可见光图像中直接看到,但会通过热过程暴露出来。

需要强调的是,热像上的亮暗并不自动等同于“好坏”。很多场景必须结合激励方式、时间窗、发射率和背景反射来解释。例如同一位置变亮,可能代表发热异常,也可能只是表面发射率更高或反射了外界热源。

25.3 紫外相机主要检测哪些类型的缺陷?

紫外相机更常见的价值有两类。第一类是表面光学响应差异,即某些污染、薄膜、氧化、残胶、印刷涂层或图案在紫外下会表现出与可见光不同的反射或吸收特性;第二类是紫外激发荧光,这在荧光渗透探伤、胶水检测、涂覆均匀性检查和生物荧光观察中尤为常见。

因此,若读者把紫外相机理解成“专门看极小缺陷的高分辨相机”,就会失之过窄。它确实可用于微细图案观察,但更常见的工程价值在于把原本缺乏可见光反差的表面问题转换成可见的紫外反差或荧光指示。是否有效,取决于材料和缺陷在紫外波段下是否真的产生了有用差异。

25.4 为什么红外相机适合检测热相关缺陷,而紫外相机适合检测微观表面缺陷?

两者擅长的并不是同一个物理层面。红外更擅长看热过程和热属性差异,也就是温升、散热、热阻、热扩散和内部缺陷对温度场的影响;紫外更擅长看表面光学响应差异,或者借助紫外激发把某些材料、渗透剂和污染残留转成更鲜明的可见信号。前者偏向功能和能量过程,后者偏向表面状态与波段特异性。

如果缺陷并不造成可分辨温差,红外未必帮得上忙;如果缺陷在紫外下既不改变反射,也不产生荧光,紫外同样没有优势。

25.5 在半导体制造中,两种相机分别扮演什么角色?

在半导体制造中,红外和紫外往往服务于不同层级的问题。红外或短波红外更适合热分布、热热点、内部结构透视、键合异常和局部热失配分析,尤其在芯片工作状态评估、封装热管理和某些透视检测中很有价值。紫外则更常用于表面污染、图案对比、某些微细结构观察、光刻相关检测或特定荧光标记观察。

但这里同样不能写成绝对规则。半导体工艺极多,最终是否选红外或紫外,还要看待测层、工艺步骤、材料透明性、镜头波段能力和允许的照明方式。出版表达更稳妥的说法是:红外更偏向热与内部,紫外更偏向表面与波段选择性。

25.6 两种相机在检测能力上有哪些互补性?

它们的互补性主要体现在检测机理、观察深度和异常类型三个方面。红外可以帮助发现热异常、内部空洞、扩散异常和功能失配,适合先做快速筛查;紫外则更适合确认表面污染、渗透探伤指示、局部涂层问题或某些微细图案异常。前者偏“看功能状态”,后者偏“看表面响应”。

在复杂项目中,两者并不冲突,反而常适合作为两道不同的观察窗口。一个缺陷若既表现为局部发热,又伴随表面残留和涂层变化,用单一相机往往难以给出完整解释,多波段联合反而更可靠。

25.7 现代工业检测中,两种相机技术有哪些发展趋势?

红外方向的一条明显趋势,是探测器灵敏度、非制冷能力、分辨率和时序分析能力持续提高,使得热响应检测不仅能看静态温差,还能看动态热过程。紫外方向则更多体现在传感器量子效率提升、弱信号噪声控制、光学材料适配和与荧光探伤工艺的联动优化上。两者共同的趋势,是与自动化分析、缺陷分类和多模态融合结合得更紧。

未来更值得期待的,未必是哪一种相机“替代”另一种,而是系统能否根据缺陷机理选择合适波段,并把热像、紫外、可见光甚至 3D 数据放到同一判定框架里使用。对工程应用来说,这比单纯追求更高像素更有价值。

红外与紫外相机检测机理对比

图25-1 红外相机与紫外相机的检测机理与适用缺陷对比

图25-1把红外和紫外放在同一框架下比较。左侧从温度场、热扩散和热点出发,说明红外适合处理热异常、分层、空洞和功耗相关问题;右侧从表面光学响应和紫外激发荧光出发,说明紫外更适合残留、污染、荧光渗透裂纹和某些图案异常。图中的热点、表面响应区域和荧光亮斑分别代表两类系统真正观测的物理量,而不是简单的“颜色不同”。读者应把这张图当作缺陷机理与波段选择的对应表,而不是把红外理解成看内部、紫外理解成看微小的固定模板。它有助于做初步筛选,但样件验证仍然必不可少。

26. 什么是智能相机?它与相机+工控机方案相比,优劣势是什么?

26.1 智能相机的基本定义是什么?

智能相机是一台把相机、处理器、运行环境和基础视觉功能封装在同一外壳中的嵌入式视觉设备。它通常包含图像传感器、图像预处理模块、CPU 或 FPGA、存储资源、通信接口以及本地执行的视觉工具链,能够在设备本体内完成采图、运算和结果输出,而不是把原始图像全部送到外部工控机后再处理。

这个定义里更值得把握的是系统边界发生了变化。在智能相机架构中,单台设备往往就对应一个完整检测节点;在相机加工控机架构中,相机更接近数据源,真正的算力、软件环境和业务逻辑集中在上位机。理解这一点,后面的实时性、成本和维护差异才不会被误解成代际高低之分。

26.2 智能相机的技术架构包含哪些关键组件?

一台典型智能相机通常包括图像传感器、图像信号处理(ISP)或基础预处理链路、嵌入式 CPU / FPGA / NPU、运行时系统、内存和非易失存储、以太网或串口等通信接口,以及数字 IO。很多设备还会提供图形化配置环境、脚本接口或内置视觉工具库,使用户能够在相机端直接完成读码、定位、OCR、模板匹配或简单测量。

需要补充的是,不同厂商的智能相机能力跨度很大。有些产品更接近带工具包的嵌入式读码器,适合固定任务;有些则已经具备一定的脚本化与 AI 推理能力,但即便如此,它们与可自由扩展 CPU、GPU、内存和磁盘的工控机平台仍不属于同一量级的计算环境。

智能相机与相机加工控机架构对比

图26-1 智能相机与相机+工控机系统边界对比

图26-1左侧把智能相机拆成传感器、预处理、嵌入式运算、算法和通信输出等几个内部层级,强调它在单机内闭合完成采图和判定。右侧则把相机加工控机拆成采集端、上位机运算端和外部控制系统,突出图像传输和集中处理链路。读者应从图中看出,两种方案差别不在于是否都能做视觉,而在于计算资源、软件环境和系统边界分别落在哪里。这张图适合做架构入门,但不能直接代替选型结论,因为真正的优劣还要继续看任务复杂度、工位数量和维护方式。

26.3 相机+工控机方案是如何工作的?

在这种传统机器视觉架构中,相机负责采集图像,再通过 GigE、USB3、Camera Link 或 CoaXPress 等接口把数据传到工控机。真正的图像处理、算法执行、结果存档、数据库交互和界面显示,主要都发生在工控机端。工控机可以安装标准视觉库、定制业务软件、GPU 推理环境和多线程调度系统,因此更适合承载复杂任务、多个工位协同和较重的数据处理流程。

它的代价也很明确。系统体积更大,布线更多,软硬件依赖关系更复杂,集成时还要处理操作系统、驱动、采集卡、许可和网络配置。它并非所谓的低级方案,而是开放度更高、系统负担也更重的方案。

26.4 智能相机在系统集成方面有哪些优势?

它的集成优势主要体现在三点。第一,系统短,安装时通常只需要电源、通信和 IO,不需要额外配置独立 IPC、采集卡和完整视觉主机。第二,物理体积小,适合安装空间紧张、布线困难或设备分散的工位。第三,任务边界清晰,一台设备往往对应一个检测点,问题定位和替换也相对直接。

这类优势在单点或双点、任务固定、节拍明确的场景里特别明显。例如简单有无检测、读码、固定模板比对、单一工位字符检查,智能相机常常能以较少的集成工作量快速落地。它减少的并不只是硬件数量,更是系统联调和维护接口的复杂度。

26.5 智能相机在实时性方面相比传统方案有何特点?

对简单、固定、局部闭环的任务,智能相机常有不错的端到端响应,因为图像不必先完整传到外部主机再参与调度和处理。本地处理减少了传输、缓存和操作系统调度带来的额外路径,对读码、有无判断和局部定位这类任务尤其有效。

智能相机的实时性优势有其适用范围。若任务包含大分辨率图像、复杂多步流程、深度学习推理、点云处理或多相机协同,嵌入式算力本身可能成为更大的延迟来源。此时工控机端虽然多了一段传输,但总时延反而可能更低。因此,实时性必须放在算法复杂度是否与嵌入式算力匹配的前提下讨论。

26.6 智能相机在部署和维护方面有哪些便利性?

它更接近标准化工业设备,而不是一台缩小版 PC。部署时,用户常常通过图形化界面完成参数配置、训练模板、设置 IO 和结果输出;维护时,也更偏向固件升级、作业备份和参数迁移,而不是完整的软件环境重装。对没有专职视觉软件工程师的现场团队来说,这种维护方式更友好。

不过便利性有其边界。若项目需要频繁改流程、增加复杂逻辑、做数据库联动或和多套上位系统耦合,智能相机的维护优势就会逐渐减弱,因为系统变化开始超出它擅长的封闭任务边界。

26.7 智能相机在成本方面有哪些考虑?

成本判断最容易出错,因为很多人只看单台采购价,而忽略总拥有成本。对单点工位,智能相机往往能省掉 IPC、采集卡、系统安装、软件许可和电控箱空间,看起来单价高一些,整体项目却可能更便宜;但当工位数量增加后,情况常会反转。一台工控机可以集中带多台普通工业相机,算力、软件许可和运维成本被多工位分摊,PC 架构的总成本曲线通常会更平。

因此,智能相机的成本优势常出现在工位少、任务相对简单、工程投入希望尽量收敛的项目里;工控机架构的成本优势则更常出现在多相机协同、多工位集中处理、复杂任务或需要统一管理的系统中。讨论成本时,至少要同时看硬件采购、软件许可、开发投入、维护方式和扩展代价。

智能相机与工控机方案成本随工位数量变化

图26-2 两种架构的成本优势随工位数量变化而反转

图26-2把工位数量作为横轴,把总成本作为纵轴,分别画出智能相机集群与工控机集中处理两条典型趋势线。蓝线表示随着工位增加,需要重复购买内置算力和算法能力的智能相机,总成本上升更快;绿线表示工控机端的算力、许可和集成代价可以被多个工位分摊,因此曲线更平。两条曲线在中后段出现交叉,表达的正是单工位与多工位场景下成本优势可能发生反转。图中的拐点不是固定数字,而是提醒读者:成本优势不是静态的,它会随着工位数、算法复杂度和许可模式变化。这张图适合作为 TCO 讨论入口,但不能替代具体报价和算力核算。

26.8 智能相机在灵活性方面存在哪些局限性?

局限主要来自可扩展性。它的处理器、内存和软件环境通常是固定的,能做的任务范围取决于厂商开放程度和本体算力。一旦项目从简单读码发展为复杂缺陷检测、深度学习分级、跨工位协同或数据库驱动流程,用户会明显感到它不像 PC 那样容易扩展。

还有一个容易被忽略的限制是开发自由度。许多智能相机非常适合用现成工具快速完成标准任务,但若项目需要更深的自定义逻辑、特殊预处理、复杂结果管理或第三方库整合,封闭平台就会成为约束。

26.9 相机+工控机方案在处理复杂任务时有哪些优势?

优势集中在算力、软件自由度和系统整合能力。高性能 CPU、GPU、大内存和成熟操作系统使它更适合多线程处理、深度学习推理、3D 数据处理、大图像缓存、复杂界面以及与 MES、ERP、PLC、数据库的深度集成。很多真正难做的项目,难点不在采图,而在后续的业务联动和异常处理流程,这正是工控机平台更有空间的地方。

它的开放性也意味着更高的工程责任。系统设计者必须自己处理驱动、资源调度、版本兼容、异常恢复和长期维护,这些都是智能相机方案里被平台封装掉的一部分工作。

26.10 两种方案在系统可靠性和稳定性方面有何差异?

智能相机的可靠性优势,通常来自结构短、连接少、软件环境封闭,因而外部变量较少;工控机方案的可靠性,则更多取决于系统设计是否成熟,包括电源、散热、网络、操作系统维护、磁盘策略和异常恢复机制。前者天然更适合标准化节点,后者则更依赖工程能力。

真正的结论不应落成简单的二选一口号。更准确的说法是:单节点、固定任务、追求快速落地时,智能相机常更省心;多工位、复杂逻辑、需要持续扩展时,工控机架构通常更有长期优势。



27. 如何阅读一份相机或镜头的官方数据手册?你会最关注哪些参数?

27.1 为什么机器视觉工程师必须精通阅读数据手册?

阅读数据手册的唯一目的,是确认硬件的物理边界是否满足任务要求。机器视觉项目能否落地,很多情况下不是败在算法,而是败在前端物理条件选错——快门类型不对、靶面不匹配、接口带宽不够、镜头像场不足、温度范围被忽略,这些问题在现场几乎无法靠软件弥补。

因此,读数据手册应依次回答三个层面的问题:这台相机能否在给定节拍下稳定出图;这支镜头能否把目标视场与细节真实投射到传感器上;这套接口和环境指标能否支撑产线长期运行。

27.2 阅读工业相机数据手册时,最核心的基础硬件参数有哪些?

最先看的是快门类型、分辨率、帧率、像元尺寸、靶面尺寸和接口类型。快门类型决定能否拍运动目标;分辨率与像元尺寸共同影响空间采样能力;帧率决定产线节拍和缓存压力;靶面尺寸决定镜头像场匹配;接口类型决定带宽、线缆长度和主机侧配置需求。

如果要继续判断这台相机在弱光、测量一致性和极限灰度表现上的真实能力,就不能只停留在这一级,还要把 EMVA 1288 体系里的基础光电参数一起读懂。其中最值得优先关注的是量子效率 \(\eta\)(Quantum Efficiency,QE)。它表示入射光子最终转化为有效电子的比例,数值越高,在相同照度和曝光时间下能得到的电子数越多,低照度下更容易获得较高的信噪比。满阱容量 \(\mu_{e.\mathrm{sat}}\)(Full Well Capacity)表示单个像素在饱和前最多能容纳多少电子,它直接关系到高亮区域会不会过早饱和,也决定动态范围上限。读出噪声 \(\sigma_d\) 通常以电子数 e- 表示,反映读出链路本身引入的随机波动;在短曝光、弱光和高速采集场景中,这个数值往往比标称位深更能说明图像底噪水平。

暗电流通常用 e-/pixel/s 表示,说明像素在无光时每秒仍会因为热激发积累多少电子。长曝光、高温环境或需要看暗部细节时,暗电流及其波动不能忽略。DSNU(Dark Signal Non-Uniformity)表示暗场下不同像素的基线输出不一致,PRNU(Photo Response Non-Uniformity)表示均匀照明下不同像素对光的响应不一致,后者常以百分比给出。这两项参数看起来不如分辨率直观,却直接关系到平场均匀性、阈值稳定性和高精度测量重复性,尤其在面阵拼接、低对比缺陷检测和定量成像任务中影响很大。

这一层参数的价值,在于先排除明显不可能的方案,再进一步判断它的物理边界是否真的适合当前任务。低照度检测更关心高 QE 和低读出噪声,大光比场景更关心满阱容量与动态范围,长曝光应用要警惕暗电流,做均匀性要求很高的定量分析则必须把 DSNU 和 PRNU 单独拿出来审查。这样读数据手册,看到的就不再只是“参数表”,而是相机在实际场景中的可用范围。

来源:EMVA 1288 Standard 3.0,Section 10、Appendix B,https://www.emva.org/wp-content/uploads/EMVA1288-3.0.pdf

27.3 评估相机极限成像质量时,需要看懂哪些光电性能图表?

真正影响成像上限的,不能只靠几个摘要参数来判断,还要看数据手册后面的光电性能图表。按照 EMVA 1288 的组织方式,最值得优先看的是四类图。第一类是光子转换曲线,常被称为 PTC(Photon Transfer Curve)。这类曲线把信号与噪声的关系放到同一个框架里,能帮助我们判断相机在不同曝光区间到底受什么噪声限制。读 PTC 时,低信号端的截距或起始平台常对应读出噪声水平,曲线接近弯折或饱和的位置则对应满阱容量或有效饱和上限,因此它是判断“底噪有多低、亮部还能容纳多少电子”的关键图。

第二类是 SNR 曲线。它通常会用对数坐标展示不同信号水平下的信噪比变化,比单独给一个“最大 SNR”数值更有判断力。通过这张图,可以看出相机在弱光区、中灰区和接近饱和区各自处于什么状态,也能判断某个应用真正工作的灰度区间是否落在相机较有优势的位置。第三类是线性度曲线,用来检查输出灰度是否随入射光子数保持近似线性变化。做测量、灰度定量分析、反射率比较或多相机标定时,线性度不好会直接影响后续模型与阈值的可迁移性。

第四类是暗电流随温度变化的图表,或与其等价的暗信号温漂图。EMVA 1288 明确指出暗电流对温度非常敏感,硅传感器中常见的经验规律是温度每升高约 6 到 8 摄氏度,暗电流会接近翻倍。对长曝光、弱光成像和封闭机箱内运行的系统来说,这类图能帮助我们判断相机在实验室条件下和在产线机柜中是否会表现出明显差异。

对初学者来说,最值得建立的习惯,是不要把“像素多”“图像亮”“动态范围大”看成孤立优点,而要学会把 PTC、SNR、线性度和温漂相关图表连起来看。这样读图时,看到的就不只是宣传参数,而是一台相机在现场条件下真正能做到什么、哪些地方会开始失真、饱和或失去重复性。

来源:EMVA 1288 Standard 3.0,Section 10、Section 2.5、Appendix B,https://www.emva.org/wp-content/uploads/EMVA1288-3.0.pdf

27.4 工业镜头数据手册中,绝对不能选错的物理匹配参数是什么?

最不能出错的是兼容靶面、接口类型、法兰距和焦距。兼容靶面不足会直接带来严重暗角,属于物理层面的失配;接口和法兰距不对,会导致无法正确安装或无法合焦;焦距则与工作距离、视场范围和分辨率余量直接相关。

镜头选型里最常见的误区,是只根据能否机械安装来判断是否可用。机器视觉镜头首先必须满足物理匹配,其次才谈成像质量。连像场都覆盖不了的镜头,不存在靠算法补足的空间。

27.5 如何通过光学图表(如 MTF)评估工业镜头的真实解像力?

MTF 的意义在于告诉你,镜头是否还能在某个空间频率下保住足够的对比。相机像元越小,采样上限越高,但如果镜头在对应空间频率附近的 MTF 已经掉得很低,传感器虽然采得更密,真正有用的细节却未必增加。

在工程上,常先根据像元尺寸估算奈奎斯特频率:

\[ f_N = \frac{1000}{2p} \tag{27-1} \]

其中,\(f_N\) 为奈奎斯特频率,单位为 lp/mm\(p\) 为像元尺寸,单位为 μm。式(27-1)给出的不是镜头应当达到的唯一标准,而是传感器的理论采样边界。实际评估镜头时,常把 0.7f_N 左右作为重点核查频率点,观察镜头在这一带是否仍有足够 MTF 余量。

相机与镜头数据手册阅读框架

图27-1 相机与镜头数据手册的阅读顺序框架

图27-1把数据手册阅读拆成三组:相机基础参数、镜头物理与光学参数,以及系统接口和环境边界。这样安排不是为了形式整齐,重点是避免一上来就陷在局部图表里。真正有效的阅读顺序通常是先确认快门、靶面、接口等硬性条件,再进入 MTF、QE、动态范围等性能上限,最后回到触发、温度和振动等长期运行条件。它能帮助读者建立排查路径,但不意味着每个项目都要平均关注三组参数,测量项目与读码项目的重点会明显不同。

27.6 在电气控制与环境适应性方面,还需要关注哪些隐藏参数?

很多项目不是死在成像指标,而是死在 IO 与环境条件上。应重点看触发输入形式、输入输出延迟、抖动、供电规格、功耗、工作温度范围、机身散热要求、抗振和防护等级。这些参数决定相机能否与传感器、频闪光源、PLC 和现场环境稳定配合。

尤其在高速飞拍、强振动或高温场景中,触发抖动、线缆长度限制和机身热设计都不属于次要问题。对现场系统来说,数据手册后半段那些“看起来不像画质参数”的条目,往往恰恰决定方案能否长期稳定运行。

奈奎斯特频率与MTF关系

图27-2 像元采样上限与镜头 MTF 余量的关系

图27-2左侧给出由像元尺寸估算奈奎斯特频率的关系,右侧则用简化 MTF 曲线说明镜头在高空间频率下的对比保持能力。图中的竖线不是固定行业标准,而是一个工程上常用的重点核查位置,用来观察镜头在接近传感器采样上限之前是否已经明显掉队。读者应从这张图得到一个很实用的判断:高像素相机的有效分辨率受限于镜头的高频 MTF 表现,若镜头端解像力不足,像素再多也无法提升系统真实分辨能力。它适合帮助初学者理解“相机分辨率”和“镜头解像力”必须配套,但具体阈值仍需结合彩色/黑白、噪声和边缘对比要求判断。


28. 相机需要散热吗?在高温车间如何保证相机稳定运行?

28.1 相机为什么需要散热?高温对相机有哪些具体危害?

工业相机当然需要散热。传感器、FPGA、ISP、电源模块和通信芯片在工作时都会持续发热,温度升高后,不仅元件寿命会缩短,图像质量本身也会受到影响。最直接的表现是噪声升高、暗电流增加、稳定性变差,严重时还会触发降频、掉帧或保护停机。

对视觉系统来说,高温的风险不只是“机器会不会坏”,还包括图像还能不能稳定复现。相机温漂、光源热漂、机械结构热膨胀和接口稳定性都会受温度影响,因此高温问题和成像质量、测量重复性其实是连在一起的。

28.2 相机内部热量是如何产生的?主要热源有哪些?

热量主要来自传感器读出、图像处理芯片、接口链路和电源转换。分辨率越高、帧率越高、位深越高、片上处理越重,发热通常越明显。智能相机或带 FPGA、NPU 的设备,内部热负荷往往比普通采集相机更集中,因为计算资源也被封装进了同一个机身。

理解热源分布的意义,在于判断热该往哪里走。不是所有热都来自同一芯片,也不是所有散热措施都对每个热源同样有效。工程上要做的是给主要热源建立一条稳定、可重复的导热路径。

28.3 相机散热的基本原理是什么?有哪些主要散热方式?

工业相机最常见的散热方式不是内部风扇,而是机身传导 + 外部结构散热。热量从内部芯片经导热垫、金属壳体传到安装支架,再通过支架、铝型材或机架扩散到更大的金属体积中,最后再与环境进行对流换热。之所以普遍不用机内风扇,是因为很多工业现场粉尘、油污、振动和空间条件并不适合把风扇作为主要散热手段。

热设计里常用的一个简化量是热阻:

\[ R_{th} = \frac{\Delta T}{P} \tag{28-1} \]

其中,\(R_{th}\) 为热阻,\(\Delta T\) 为温升,\(P\) 为需要散掉的热功率。式(28-1)虽然简单,却足够说明一个直觉:在发热功率一定时,导热路径越差、热阻越大,温升就越高。

工业相机热传导路径

图28-1 工业相机散热依赖连续的热传导路径

图28-1把热量路径拆成内部热源、导热介面、机身壳体、安装支架和外部环境几级。读者应注意这张图强调的是路径连续,而不是单一零件的导热系数。只要中间某一段导热被切断,例如机身悬空、安装在绝热件上,前面芯片和壳体即使设计得再好,热也会堵在机内。它回答的是为什么很多工业相机必须紧贴大面积金属支架安装,但它并不意味着所有场景都只靠自然散热,高温炉旁和压铸车间仍需额外冷却外设。

28.4 工业相机在高温车间面临哪些特殊挑战?

高温车间的问题不只是环境温度高,而是环境温度高、粉尘油污多、热辐射强、长期运行时间长这些因素叠加。普通实验室里能稳定工作的设备,到了玻璃、钢铁、压铸、热处理或烘烤设备周边,可能很快就会出现温升过快、外壳过热、接口老化和图像噪声上升的问题。

此外,高温往往和密闭防护、强振动、局部热源靠近同时出现。相机不是孤立发热体,而是处在一个本就不利于散热的系统中,这也是为什么高温项目不能只看相机标称工作温度。

28.5 高温车间中保证相机稳定运行的技术方案有哪些?

常见方案包括选择更宽温度规格的工业相机、强化机身与金属支架之间的导热、使用隔热防护罩、把相机远离强辐射区、在防护箱内引入冷却空气流,以及在极端场景中使用专用冷却罩或水冷防护结构。真正可靠的方案往往不是单一措施,而是隔热、导热和冷却三件事同时做。

现场设计时要特别警惕一个误区:把相机封进密闭盒里并不自动等于保护。若防护罩没有把热带出去,密闭空间可能反而成为蓄热腔。保护和散热必须一起设计。

28.6 热电制冷器(TEC)在相机散热中如何工作?有什么优势?

TEC 基于帕尔帖效应工作,通电后其一侧吸热、另一侧放热,因此常被用来稳定传感器温度。它的优势是温控精确、无机械运动部件,适合需要极低噪声、长曝光和稳定暗电流的科学成像场景,如荧光显微、天文或光谱相机。

但对大多数产线视觉项目而言,TEC 不是主流解。原因并不神秘:它成本高、需要额外散热、冷面结露风险大,而且制冷量和系统复杂度之间存在现实约束。对微秒到毫秒级曝光的工业检测任务来说,暗电流往往不是第一矛盾,过度强调 TEC 反而会把系统引向不必要的复杂化。

28.7 相机散热设计中有哪些关键参数和性能指标?

应重点关注相机功耗、工作温度范围、机身允许温度、热阻、温升、长期稳定性和环境防护等级。若能拿到内部芯片或壳体温度监控信息,还应关注不同负载下的温升曲线,而不是只看静态标称值。对高温项目来说,设备在峰值帧率和最大处理负载下能否连续运行,比实验室低负载条件下的数据更有参考价值。

设计时还要看安装方式。很多相机的数据手册默认设备通过金属机架正常散热,若现场采用了悬空、绝热或封闭安装方式,实际热表现可能与标称条件差异很大。

28.8 未来相机散热技术有哪些发展趋势?

趋势大致有三类。第一类是更好的热界面与结构设计,让热量更快、更均匀地传到机身和支架;第二类是更主动的热管理,例如负载感知、温度监控和动态降频保护;第三类是系统级协同设计,把光源、相机、防护罩和机架的热问题一起考虑,而不是等设备装好后再补救。

从工程角度看,未来最有价值的不是某一种“新材料”名称,而是散热设计越来越前置,越来越与安装结构和长期可靠性绑定。



29. 振动环境对相机安装有什么要求?

29.1 为什么振动环境对相机安装特别重要?

因为视觉系统不仅需要拍到,还需要在多个时刻、多个工件和多个班次里重复获得同样的几何关系。一旦振动导致相机、镜头或接口发生微小相对位移,图像模糊、边缘漂移、标定失准和焦点偏移都会跟着出现。对读码系统来说,这可能表现为偶发失败;对测量或引导系统来说,问题会更严重,因为像素与物理坐标之间的映射本身可能被破坏。

振动问题并不只出现在肉眼可见的大幅晃动上。高频小振幅振动、周期性共振和线缆应力反复拉扯,往往更隐蔽,也更容易在长期运行中积累成故障。

29.2 振动对相机成像质量会产生哪些具体影响?

最直接的是曝光期间的相对位移导致图像模糊,其次是连续帧之间位置不稳、重影和边缘提取重复性下降。若振动足够强,还可能让镜头锁紧结构、接口和支架逐渐松动,最终从画质波动演变为系统几何关系改变。这也是为什么振动问题不能只靠后端算法补偿。

对高速和高精度系统来说,振动带来的损失往往不体现在平均值,而体现在重复性和极限误差上。系统平时似乎还能工作,但一到边界工况就开始失控。

29.3 相机安装需要满足哪些基本的防震要求?

工业视觉更强调刚性锁死,而非简单在相机底下放软垫。支架应尽量短、厚、靠近主承重结构,减少悬臂和细长连接;镜头对焦环、光圈环和各类可调部件应在调试后锁紧;关键紧固件应使用适当等级的防松措施;线缆则要在接口附近做应力释放,不让振动直接作用在插头与焊点上。

这里的核心判断不是“减震件越多越安全”,而是系统能否在振动环境中保持几何关系长期稳定。对精密测量场景来说,软性隔振若引入低频摆动,往往比高频振动本身更麻烦。

振动环境中的相机安装方式对比

图29-1 产线视觉更推荐刚性短力臂安装,而非细长悬臂配软垫

图29-1左侧示意刚性短力臂安装,属于推荐做法;右侧示意细长悬臂加软垫的常见错误做法。图中的底座、立柱和安装板分别代表机架、支撑件与相机安装面,绿色和红色标记只用于区分推荐与不推荐布置。读者应从这张图看出,产线视觉要避免的并不是所有振动,而是让支架本身成为会摆动、会共振的弹性结构。它适合用来做安装原则判断,但若振动源极强、来自整机主结构,本质解法通常是把视觉系统与振源物理解耦,而不是只在相机下方加垫片。

29.4 什么是防震支架,它在振动环境中起什么作用?

防震支架这个词在不同场景里意思并不完全相同。在精密光学实验室,它可能指带阻尼或隔振能力的平台;在工业现场,它更常指更稳的安装结构、更好的防松设计和更合理的力路径。如果不先区分场景,很容易把实验室里的隔振思路照搬到产线测量里,结果反而引入低频摆动。

因此,讨论防震支架时,首先要问清楚任务目标。如果目标是让相机在测量与标定意义上尽量保持刚体式稳定,那么结构刚性和力路径通常比软隔振更重要。

29.5 工业相机在振动环境中的安装有哪些特殊考虑?

除了支架刚性,真正高频出问题的往往是镜头锁紧、接口防松和线缆寿命。带锁扣的工业接口、合适的线缆固定点、运动轴场景下的高柔拖链线,以及靠近接口处预留的应力释放环,常常比单独谈“减震材料”更有实际价值。很多现场故障并不是相机坏了,而是线缆内部断裂、插头接触不稳或镜头在长期振动下慢慢退焦。

所以,振动设计必须把“相机本体、镜头、支架、接口和线缆”当成一个整体,而不是只盯着相机壳体本身。

29.6 如何评估和测试相机安装的防震效果?

可从两条线做验证。第一条是机械侧,测振动频率、振幅、共振点和长期紧固状态;第二条是成像侧,实拍标准边缘、棋盘格或目标工件,观察清晰度、位置重复性、边缘抖动和跨时间漂移。若系统用于测量或引导,还应把重复定位误差纳入评估,而不是只看“看上去清不清楚”。

真正有效的测试,应覆盖设备启停、满速运行、不同工件负载和长时间运行后的状态。很多振动问题只有在热、振和线缆疲劳叠加后才会暴露。

29.7 在极端振动环境下(如航空航天、车辆等),相机安装有哪些特殊要求?

这类场景下,要同时考虑抗冲击、重量约束、接口可靠性、温漂和密封性。设计思路往往不只是“更厚的支架”,还涉及抗冲击标准、结构模态分析、线束寿命、锁固策略和环境试验要求。对于真正依赖标定稳定性的系统,是否允许引入弹性减振件,也必须按任务精度单独评估。

换句话说,极端振动场景不是普通产线支架简单加厚就能解决,而是一个系统级机械与环境适配问题。

29.8 相机安装中常见的防震材料和结构有哪些?

常见结构包括厚壁铝型材、钢板底座、短悬臂安装板、螺纹锁固胶、镜头锁紧结构、防松接插件和线缆应力释放夹具。若任务允许、且主要目标是保护设备免受冲击而非追求微米级几何稳定,也可能使用橡胶减振件、阻尼层或更复杂的隔振结构,但这类方案并不能被默认套用到精密机器视觉测量上。

工程上更稳妥的习惯,是先从“刚性足够、锁紧足够、接口与线缆可靠”做起,再看是否真的需要额外隔振。

线缆应力释放与接口保护

图29-2 振动环境下线缆应力释放比“把线接上”更重要

图29-2左侧示意线缆从接口处被直接拉紧,右侧示意在支架附近预留 U 型应力释放环并固定。这里真正要表达的不是走线美观,而是振动应力该由谁承受。若线缆把拉力和摆动直接传到相机接口,长期运行后更容易出现接触不良、插头松动和内部导线疲劳。读者应把这张图当作接口可靠性检查项,而不是单纯的布线习惯提示。它适合指导现场安装,但如果相机安装在持续大行程运动轴上,还需要进一步核查拖链弯曲半径、线缆寿命等级和夹持位置。


30. 什么是光学防抖?工业相机需要这个功能吗?

30.1 什么是光学防抖(OIS)的基本物理原理?

光学防抖通过检测抖动,再移动镜片组或传感器来抵消部分画面位移,使图像投影尽量稳定在传感器上。与之相近的电子防抖,则多通过裁剪、重采样和时序补偿来实现更平稳的视频观感。无论采用哪一种,本质上都是为了改善观看体验或宏观识别效果,而不是为了维持严格固定的相机内参模型。

这项技术在消费摄影、安防视频、巡检视频和手持拍摄里非常有价值,因为这些场景首先追求的是画面可看、目标不晃、视频稳定。

30.2 核心问题:工业机器视觉相机需要光学防抖功能吗?

对精密机器视觉,答案通常是否定的。工业视觉很多任务依赖相机标定关系保持稳定,尤其是尺寸测量、定位引导、视觉对位和亚像素边缘提取。只要内部光学中心、焦距等效值或裁剪窗口在工作中不断变化,这种稳定映射就会被破坏。

工业视觉和消费摄影面对的优化目标并不相同:前者需维持标定几何严格稳定,后者追求画面观感平稳。将"防抖让画面更稳"直接等同于"工业视觉更需要防抖",混淆了两类系统的核心诉求。

30.3 为什么工业视觉排斥光学防抖与电子防抖?

原因在于它们可能改变成像几何。OIS 通过物理位移补偿抖动,EIS 通过裁剪和重投影稳定画面,这些操作对人眼观看往往是好事,但对依赖标定和几何一致性的视觉系统来说,会让主点、等效焦距、畸变中心或成像区域不再稳定。这样一来,即使画面看起来更顺,尺寸换算和定位精度却可能变差。

还要注意,工业视觉常常需要亚像素级的边缘与位置稳定性。只要内部补偿让成像几何不断变化,后续算法面对的就不再是一台参数稳定的相机。

30.4 如果不用防抖,工业视觉如何解决车间振动与运动模糊?

工业视觉的标准解法不在于补偿抖动,而在于冻结运动。常见组合包括全局快门、极短曝光和高亮频闪。全局快门避免卷帘畸变,极短曝光减少运动在曝光期间造成的位移,高亮频闪则补足短曝光下的光子数量。对高速场景来说,这套组合比防抖更符合几何稳定性的要求。

如果把运动模糊简化成线位移问题,可用

\[ \Delta x = v t_e \tag{30-1} \]

近似理解,其中,\(\Delta x\) 为曝光期间的运动位移,\(v\) 为目标相对速度,\(t_e\) 为曝光时间。式(30-1)说明得很直接:要压低模糊,最有效的物理手段之一就是缩短曝光时间。

30.5 工业视觉在机械安装上如何进行硬防抖?

所谓硬防抖,本质是把系统做成稳定刚体。相机和光源应固定在足够刚的支架上,镜头环与可调机构要锁紧,紧固件要防松,线缆要做应力释放,必要时还要把视觉系统与主要振源物理解耦。这不是消费电子里的一个功能开关,而是一整套机械、电气和成像配合策略。

从系统角度看,这一套方法和 29 题讨论的安装原则是连在一起的:冻结运动、稳定几何、避免内部补偿改变成像模型。

30.6 仍有少数工业场景适合使用防抖技术

仍有少数工业场景使用防抖技术,但必须区分任务类型:常规传输带尺寸测量、定位和抓取任务中的防抖多是机械层面的硬化解,而非电子或光学防抖。若任务属于宏观巡检、远距离观察、安防视频、无人机巡查或移动机器人环境感知,系统更关注画面稳定和目标可见性,而不依赖微米级几何标定,这时 OIS、EIS 或云台稳像都可能是合理选择。它们仍然属于工业应用的一部分,只是目标函数已经从精密测量换成了宏观可见和识别可用。

所以,判断标准应聚焦于当前任务是否要求标定几何严格稳定:若要求严格稳定,就应非常谨慎;若主要做宏观观察,则可以根据需要采用。

消费级防抖与工业视觉瞬态冻结对比

图30-1 消费级防抖补偿与工业视觉瞬态冻结的目标差异

图30-1左侧用“检测抖动—移动镜片或传感器—视频更稳”的链路概括 OIS/EIS 的典型目标,右侧则用“全局快门—极短曝光—高亮频闪”的链路概括工业视觉的常见做法。两边的差别不在于谁更先进,而在于优化目标不同:一边追求观感稳定,另一边追求标定几何和瞬时成像稳定。读者应从这张图中明确,工业视觉抗模糊更偏向物理冻结而非内部补偿。它适合用来澄清概念边界,但在不依赖精密几何的巡检或安防场景中,防抖技术依然可能是合理方案。

31. 拿到一个新的检测项目,你的硬件选型(相机、镜头、光源)的具体步骤是什么?

31.1 在开始硬件选型之前,我需要了解哪些核心的项目需求?

硬件选型应从检测任务的成像约束出发,而不是从器件目录出发。至少要弄清六件事:第一,被测对象的尺寸范围、材质、表面反射特性和姿态变化;第二,需要看见什么,是划痕、毛刺、字符、孔位、边缘、焊点,还是装配关系;第三,最小特征尺寸和允许误差,二者不能混为一谈,因为检出 0.05 mm 缺陷与把尺寸测到 ±0.01 mm 对系统的要求并不相同;第四,产线节拍、运动状态和触发方式,静止拍照与飞拍对快门和照明的约束完全不同;第五,安装空间、工作距离、环境光、振动、粉尘、油污和温度波动;第六,与PLC、机器人、上位机和现场维护方式的集成要求。

如果这些前提没有定清楚,后面的选型很容易出现方向性错误。例如,有人把最小缺陷尺寸直接当作测量精度去算像素,结果相机分辨率选得很高,镜头和光照却支撑不住。也有人只关心视野和分辨率,没有提前确认现场是连续运动抓拍,最后不得不在已定的卷帘快门相机上反复补救。真正有效的做法,是先把任务需求整理成表格,再进入相机、镜头与光源的联合选型。

31.2 如何根据检测精度要求确定相机分辨率?

相机分辨率通常从视野与最小可分辨特征的关系推导。若沿某一方向的视野大小为 \(FOV\),希望该方向上最小特征尺寸为 \(d_{\min}\),并且要求这个特征至少占据 \(n\) 个像素,则理论像素数可写为

\[ N=\frac{FOV}{d_{\min}}\cdot n \tag{31-1} \]

式中,\(n\) 不是固定常数,它取决于任务性质。若只是做存在性检测,2 到 3 个像素覆盖最小特征有时已经可以工作;若要稳定地区分缺陷形状、方向或边缘位置,通常会希望最小特征至少占 3 到 5 个像素;尺寸测量则不能只靠特征占几个像素来判断,还要结合镜头成像质量、边缘对比度、重复性和算法模型综合评估。把所有任务都简单乘一个 2 到 3 的安全系数,虽然常见,却并不严谨。

更稳妥的流程是先按式(31-1)算出理论下限,再检查是否存在以下放大因素:视野是否还要预留边界、目标姿态是否会变化、是否需要后续裁切、是否存在多工位共用一台相机、以及缺陷是否位于视野边缘。理论像素数只是起点,最后选定的相机分辨率还应与镜头分辨能力、帧率需求和接口带宽一起核算,否则高像素并不会自动换来高可检性。

在当前工业视觉项目中,CMOS 已是主流选择。它在帧率、功耗、成本、功能集成度和产品可获得性方面都更有优势,绝大多数新项目优先考虑 CMOS。CCD 并非完全消失,但更多出现在历史系统延续、特定科研应用或少数对成像风格有既有依赖的场景中。若不是在做旧系统替换或有明确的特殊理由,把高质量图像优先选 CCD 当作通用原则,已经不太符合现在的工业相机现实。

接口选择则要从三件事判断:带宽、布线距离和系统架构。GigE 适合布线距离较长、现场网络化程度较高的场合,维护方便,扩展性也较好,但要留意实际可达带宽、网卡性能和多相机并发占用;USB3 接口配置简单、成本低,适合工控机近距离接入,不过线缆长度和抗干扰能力通常不如工业以太网方案;Camera Link 或 CoaXPress 更适合高速、高分辨率、低延迟的严苛场合,但系统成本、采集卡和调试复杂度也更高。接口从来不是孤立选项,它要与分辨率、帧率、位深、相机数量和主机处理能力一起算账。

快门类型同样必须在这一环节定清楚。只要项目涉及连续运动拍照、振动、旋转件或高速传送,通常就应优先选择全局快门相机。卷帘快门在静止物体、固定治具和慢速场景下可以工作,一旦进入飞拍,图像倾斜、拉伸和局部时序畸变会直接影响测量和缺陷判断,后续很难靠算法完全修正。

31.4 镜头选型的核心计算方法和参数有哪些?

镜头选型首先要解决焦距与工作距离的匹配问题。若传感器在对应方向上的有效尺寸为 \(w\),工作距离为 \(WD\),该方向的视野尺寸为 \(FOV\),则薄透镜近似下常用的焦距估算式为

\[ f \approx \frac{w \cdot WD}{FOV} \tag{31-2} \]

这只是初步估算。实际选型时还要同时检查镜头支持的最大靶面是否覆盖相机传感器,否则会出现物理渐晕或边缘成像恶化;再看镜头在当前像元尺寸下的分辨能力是否足够,避免出现相机像素很高但镜头像不清的情况。对高精度测量项目,还要重点关注畸变、远心性、景深和工作距离稳定性。普通工业镜头在检测、识别、定位场景中已经能覆盖大量任务,但一旦目标是降低放大率变化、抑制透视误差或保证边缘尺寸一致性,远心镜头往往更合适。

光圈也不能只按越大越亮来理解。较小的 F 值能提高进光量,却会缩小景深,并放大机械装配与对焦偏差的影响;较大的 F 值有利于景深,却会推高曝光时间或光源功率需求。镜头计算的结果,最终要回到现场:这台镜头在给定工作距离、目标高度起伏和照明条件下,能否在整个检测区域内稳定形成足够锐利的图像。

31.5 不同检测场景下如何选择合适的光源类型和照明方式?

光源选型的目标,是让被关注的特征与背景在图像上拉开稳定差异。看外轮廓、外径、孔径或透明件边界,背光通常最直接;看平整表面的刻印、焊盘、标签或一般性缺陷,环形光常作为起点;看划痕、凹坑、压痕和微小起伏,低角度条形光或暗场照明更容易把表面微结构显出来;面对强反光的金属或玻璃表面,同轴光、穹顶光或积分式照明往往比简单正打光更可控。

光谱选择也应服务于目标特征。黑白相机配单色 LED 是最常见的组合,红光稳定、寿命长、成本合适,因此使用广泛;蓝光波长更短,对某些微小表面缺陷和细节边缘更敏感,但对杂散反射和表面状态也更挑剔;若目标与背景是颜色差异而非灰度差异,就应把彩色成像或分光方案一并纳入考虑。需要强调的是,光源颜色不是凭经验固定下来的,很多项目要靠样件实拍比较红、蓝、白、近红外等不同波段的实际效果。若现场环境光复杂,在镜头前增加与照明波段匹配的窄带滤光片,往往能显著提高稳定性。

31.6 硬件组件之间如何匹配和集成?

相机、镜头和光源构成的是一套相互牵制的成像链。相机像元越小,对镜头分辨能力和照明质量的要求通常越高;镜头焦距越长、光圈收得越小,光源亮度和安装空间压力往往越大;光源角度一改,镜头看到的反射路径和对比度分布也会跟着变。真正的硬件选型,必须把它们放在一起看。

集成阶段至少应核对以下内容:相机接口与主机或采集卡是否匹配,镜头接口和法兰距是否正确,镜头像场是否覆盖传感器,光源照明区域是否完全覆盖视野,触发信号、电源容量和布线是否满足现场要求,机械安装是否足够刚性,是否预留了调焦、调角度和换型维护空间。对于有粉尘、油污、振动或强环境光干扰的现场,还要同时考虑防护罩、散热、减振和遮光结构,因为许多所谓“相机问题”最后其实是安装和环境问题。

31.7 在实际选型中,有哪些常见的错误和注意事项需要避免?

最常见的错误,是过早把注意力集中到单一参数上。有人一上来只看像素,结果忽略了镜头和光照是否真的能支撑这些像素;有人只盯着镜头焦距算视野,没有检查景深和畸变;也有人拿实验室里拍得不错的方案直接上产线,却没有把环境光、振动和节拍变化考虑进去。这样做出来的系统,往往在样机演示时没问题,一到真实生产就开始不稳定。

另一个高频错误,是把能拍到图当作可以交付。图像中确实看到了缺陷,不代表对比度足够稳定;当前样件能对上焦,不代表产品高度波动后仍能工作;在单件测试中能跑通,不代表在连续节拍和温升条件下仍能维持一致性。选型时应主动评估:最可能成为现场短板的参数、系统对该参数留出的余量是否充足、且余量务必来自真实验证而非主观判断。

31.8 如何通过实际测试验证硬件选型的合理性?

验证阶段要做的是用样件把整套假设逐项证实。至少应准备覆盖正常件、边界件、缺陷件和姿态波动件的测试样本,在目标工作距离、目标速度、目标光照和目标安装姿态下连续实拍。验证内容包括图像清晰度、视野覆盖、照明均匀性、缺陷对比度、边缘稳定性、重复拍摄一致性、帧率与丢帧情况,以及长时间运行后的温升和漂移。

如果条件允许,最好在真实产线或与其等效的模拟工位上验证,而不是只在桌面环境里拍静态样件。因为许多问题只会在真实工况下出现,例如传送带振动带来的轻微虚焦、现场杂光引起的反射漂移、多班次温度变化导致的焦点漂移,以及连续运行时的通信和缓存压力。测试结果应形成记录,包括当时的工作距离、相机参数、光源参数、样件编号和效果评价。没有记录的测试,后续几乎无法复现,也难以作为定型依据。

新的视觉项目硬件选型流程

图 31-1 新的视觉项目硬件选型流程

图31-1 从项目需求分析出发,先拆出视野与精度,再进入相机、镜头和光源三个主选型环节,随后补做接口、快门、景深、照明波长等交叉校核,最后通过样件实拍和节拍稳定性验证完成定型。图中上下两层的结构有明确含义:上层回答“各硬件大类怎么选”,下层回答“这些单项选择能否在一套系统里同时成立”。读者应从这张图得到一个工程判断,硬件选型是一个多轮回路,前面的单项选择会不断受到后续验证结果的修正。该图适合作为新项目立项后的工作框架,但具体阈值、留量和验证重点仍需结合任务类型、预算和现场环境确定。

模块二:算法基础(9问)