【導讀】機器視覺(MV)是一種使機器人和自動駕駛汽車等其他機器能夠看到和識別周圍環(huán)境中物體的技術。在過去幾年里,機器視覺的進步使得許多機器人和自動駕駛汽車擁有了幾乎與人類相似的感知水平。這個過程主要是通過將光學傳感器與人工智能和可以分析和處理圖像數(shù)據(jù)的機器學習工具進行配對,此時搭載了機器視覺系統(tǒng)的機器人和自動駕駛汽車就能夠執(zhí)行非常復雜的任務了。
眼睛和大腦:
機器視覺和計算機視覺的主要區(qū)別
很多時候,機器視覺會與計算機視覺一詞混為一談。然而,事實上二者還是有區(qū)別的。對機器視覺而言,它通常與具備計算機視覺能力的工業(yè)應用聯(lián)系在一起,需要攝像頭來捕捉和提供圖像數(shù)據(jù)。計算機視覺的任務則是將已有的圖像數(shù)字化,處理其中包含的數(shù)據(jù)并采取某種行動。
一般來講,機器視覺系統(tǒng)的處理能力相對較小,主要用于精益制造環(huán)境,通過高速執(zhí)行實際任務以獲取完成指定作業(yè)所需的數(shù)據(jù)。計算機視覺系統(tǒng)是處理視覺數(shù)據(jù)的人工智能(AI)和機器學習(ML)算法的所在,它需要收集盡可能多的關于物體或場景的數(shù)據(jù)并充分理解它們。因此,計算機視覺既要能夠分析來自運動檢測器、紅外傳感器等來源的圖像,又可以在沒有相機的情況下執(zhí)行任務,掃描數(shù)字網(wǎng)絡照片或視頻,處理來自任何來源(包括互聯(lián)網(wǎng))的圖像。從本質(zhì)上講,機器視覺就是系統(tǒng)的眼睛,而計算機視覺則相當于系統(tǒng)的大腦。
相機:
機器視覺系統(tǒng)中的重要組件
機器視覺是一項看似簡單但實際上相當復雜的技術。首先,它需要使用專門的光學器件來捕捉周圍環(huán)境中的視覺信息。然后,再借助硬件和軟件的組合對圖像的某些特征進行處理、分析和測量。例如,作為制造系統(tǒng)的一部分的機器視覺應用程序可以用于分析在裝配線上制造的零件的特定特性,確定零件是否符合質(zhì)量標準。
在實際應用中,機器視覺常常被看作是計算機的一種視覺能力,其系統(tǒng)由一個或多個光學傳感器(如高分辨率相機)、模數(shù)轉(zhuǎn)換(ADC)和數(shù)字信號處理(DSP)等器件組成。相機和傳感器用于收集感光形式的圖像,并將其轉(zhuǎn)化為電信號,所產(chǎn)生的電信號經(jīng)數(shù)字化處理后被傳輸?shù)接嬎銠C進行分析并提供所需的輸出。在技術復雜性上,機器視覺與語音識別相似。
目前,用于制造業(yè)的機器視覺主要采用兩種類型的相機,即:面陣掃描相機和線陣掃描相機。
面陣掃描相機使用矩形傳感器在單個幀中拍攝照片,傳感器中的像素數(shù)量對應于圖像的寬度和高度。線陣掃描相機是逐個像素地構建圖像,它們適用于拍攝運動中或尺寸不規(guī)則的物品的圖像。在拍攝照片時,傳感器在物體上以線性運動通過,因此,線陣掃描相機不像面陣掃描相機那樣局限于特定的分辨率。
相機的靈敏度和分辨率是機器視覺系統(tǒng)的兩個重要參數(shù),其中,分辨率負責區(qū)分物體,而靈敏度是機器在光線昏暗或波長不可見的情況下檢測物體或微弱脈沖的能力。一般來說,分辨率越大,視野就越有限。靈敏度和分辨率是相互依存的,如果其他因素不變,增加靈敏度就會降低分辨率,而增加分辨率則會降低靈敏度。面陣相機的分辨率和掃描頻率一般均低于線陣相機。
許多機器視覺相機的分辨率超過4,500萬像素,這些相機能以極高的速度拍攝物體而不會失真。推動機器視覺功能的另一個進步是基于事件的視覺傳感器。這些傳感器處理圖像的方式與人眼的視神經(jīng)處理信息的方式類似。更具體地說,這些基于事件的視覺傳感器檢測每個像素的亮度變化。這種能力使機器視覺能夠在比傳統(tǒng)的基于幀的視覺傳感器暗得多的環(huán)境中使用。
Sony Spresense的ISX012是一款有效像素達到511萬像素的圖像傳感器,相機板在Spreseense的主板上使用了這款結(jié)構緊湊、高分辨率的傳感器來擴展主板的功能。板載編碼器可以采集JPEG、RAW、Y/C或RGB格式的圖片。相機板通過專用的并行接口直接連接到主板,當與主板上CXD5602微控制器的AI功能相結(jié)合時,可為物聯(lián)網(wǎng)設備提供先進的視覺功能。
圖1:可提供先進的視覺功能的
Sony Spresense相機板(圖源:Mouser)
當然,出于應用成本的考慮,機器視覺系統(tǒng)不是越復雜越好,而應選擇適合的。一維(1D)視覺、二維(2D)視覺以及三維(3D)視覺這三種類型是常用的、面向不同任務的機器視覺系統(tǒng)。
01 1D視覺
1D視覺不會一次性完成整個物體圖像的分析,而是一次讀取一行,通常采用線陣掃描相機,這種類型的機器視覺常常用在制造過程中的產(chǎn)品檢測,比如用來發(fā)現(xiàn)傳送帶上產(chǎn)品中的缺陷;
02 2D視覺
2D視覺主要使用數(shù)碼相機收集圖像數(shù)據(jù),通過比較一幅圖像與下一幅圖像的變化來確定下一步應采取的處理措施,這種類型的機器視覺通常用于物體跟蹤以及產(chǎn)品的類型驗證等;
03 3D視覺
3D視覺通常在不同位置使用多個數(shù)碼相機和其他傳感器來捕捉物體的數(shù)字模型或圖像,從而對其位置、大小和特征進行準確的評估,因此,3D機器視覺非常適合幫助機器人導航周圍環(huán)境并執(zhí)行與訂單相關的任務。
隨著不同垂直行業(yè)對質(zhì)量檢測和自動化的需求不斷增加,3D機器視覺市場將以高于行業(yè)平均水平的速度實現(xiàn)快速增長。Grand View Research的分析數(shù)據(jù)表明,2022年,全球3D機器視覺市場規(guī)模為58.1億美元,預計2023年至2030年的復合年增長率(CAGR)將達到13.5%。
ams OSRAM公司的Mira220全局快門圖像傳感器是一款體積小巧、專為工業(yè)機器視覺應用而設計的2D和3D解決方案,有效分辨率為1,600(H)x 1,400(V),幀速率可高達90fps,深度為12位。Mira220采用的先進背面照明(BSI)技術將傳感器層堆疊在數(shù)字/讀出層的頂部,這種設計產(chǎn)生了占位面積僅為5.3毫米×5.3毫米的芯片級封裝,特別適合空間受限產(chǎn)品的設計。
Mira220的功耗非常低,在睡眠模式下僅需4mW,在空閑模式下功耗40mW,而在90fps的全分辨率下也僅僅需要350mW。此外,Mira220傳感器還可以利用MIPI CSI-2接口方便地與處理器和FPGA進行交互。
圖2:專為工業(yè)機器視覺應用而設計的ams OSRAM的Mira220全局快門圖像傳感器(圖源:ams OSRAM)
工業(yè):
機器視覺應用的主戰(zhàn)場
機器人之所以能與人類做同樣的工作,主要歸功于機器視覺。機器人手臂用它來檢查從裝配線上下來的零件和產(chǎn)品,確定哪些符合質(zhì)量標準。此外,機器視覺還使機器人和人類之間的協(xié)作更加高效和安全。現(xiàn)在,機器視覺已經(jīng)成為工業(yè)4.0過程自動化的關鍵技術,其中汽車、制藥、包裝、食品和飲料等垂直行業(yè)是使用機器人系統(tǒng)比較突出的領域。
據(jù)Grand View Research的分析,2022年,全球機器視覺市場規(guī)模為168.9億美元,預計2023年至2030年將以12.3%的復合年增長率(CAGR)增長,到2030年,市場規(guī)模將達到416億美元。按照產(chǎn)品劃分,機器視覺產(chǎn)品可細分為基于PC的和基于智能攝像頭的系統(tǒng)。2022年,基于PC的細分市場在全球的市場份額超過54.92%,接下來的幾年里預計這一趨勢仍將得到延續(xù)。
與機構或教育應用中使用的機器視覺系統(tǒng)相比,工業(yè)機器視覺系統(tǒng)通常更耐用,并要求較高的可靠性、穩(wěn)定性和準確性,而它們的成本則比在軍事、航空航天、國防和政府應用中使用的系統(tǒng)要低很多。這也是近些年機器視覺在工業(yè)領域日益普及的重要原因。
在工業(yè)應用中,機器視覺常常被用于執(zhí)行各種任務,下面我們就列舉一些:
01 電子元件的識別和分析。對元器件的準確識別及跟蹤是整個制造或物流過程控制的重要環(huán)節(jié)。例如,將機器視覺用于電路板的焊接過程監(jiān)控,除了完成焊接質(zhì)量檢查,還能同步檢查元器件的放置是否正確。
02 印刷缺陷識別。印刷缺陷識別的目的是定位印刷異常,如不正確的色調(diào)或印刷品的缺失或有缺陷的部分,機器視覺的應用大幅降低了人為因素可能出現(xiàn)的錯誤。
03 材料檢查。材料檢測系統(tǒng)中的機器視覺功能確保了產(chǎn)品的質(zhì)量控制,它能準確識別產(chǎn)品中的缺陷甚至污染物。例如,可將機器視覺系統(tǒng)用于藥丸和片劑的過程監(jiān)控。
04 物體定位。在機器人制導等應用中,機器視覺通常被用來尋找東西,其目的是確定目標物體的坐標和位置。這也是機器視覺普遍的應用之一。
05 模式識別。機器視覺在當今的醫(yī)學診斷方面發(fā)揮了重要作用。醫(yī)學成像分析使用基于機器視覺的模式識別、磁共振成像、血液掃描和大腦掃描等技術可對疾病進行準確的診斷。
06 物體識別。在汽車行業(yè),自動駕駛汽車使用機器視覺系統(tǒng)中的攝像頭拍攝的圖像進行物體識別,得以準確地分析出道路上的障礙物類型。隨著自動駕駛技術的不斷演進,這一領域?qū)⒊蔀闄C器視覺極具發(fā)展前景的應用之一。
人工智能:
工業(yè)機器視覺技術發(fā)展的加速器
現(xiàn)代機器視覺系統(tǒng)開始越來越多地使用人工智能(AI)方法與技術,如機器學習或深度學習,以及人工神經(jīng)網(wǎng)絡。AI能夠處理大量以前難以收集的圖像和數(shù)據(jù)信息,加快了決策過程。例如,簽名和字符識別,有了人工智能的加持,機器視覺系統(tǒng)可以快速甄別其中的細微差別。
在制造業(yè)中,AI有助于物體識別和材料檢查,使機器視覺系統(tǒng)能夠理解物體或材料形狀和紋理的變化。在質(zhì)量保證方面,AI系統(tǒng)可以分析出現(xiàn)的異?,F(xiàn)象,而不是單純地檢出和拒絕不符合規(guī)范的產(chǎn)品。機器視覺與AI和深度學習相結(jié)合,擴大了機器人在執(zhí)行生產(chǎn)線任務中的作用,如挑選、分揀、放置和執(zhí)行生產(chǎn)線掃描。這種技術組合還使機器人能夠在其他環(huán)境中運行,如超市、醫(yī)院和餐館等。基于AI的機器視覺還可以在更廣泛的背景和照明設置中識別缺陷,并靈活應對產(chǎn)品外觀和缺陷類型的變化,例如凹痕或變色。
深度學習是人工智能中一個更復雜、更強大的子集,在機器視覺應用中也越來越多地被采用。在人工智能的支持下,機器視覺系統(tǒng)常常被用來執(zhí)行復雜的任務,比如質(zhì)量控制、裝配控制、過程控制和機器人操控等。在過去幾年里,將人工智能融入機器視覺應用是工業(yè)機器視覺技術發(fā)展的主要加速器。在“未來的工廠”中,機器視覺和AI技術將是過程自動化和提高效率的關鍵組成部分。
機器視覺與AI的技術進步離不開芯片組的支持。新一代嵌入式芯片的功能更強大,成本合理,適用于處理圖像和運行基于AI的機器視覺算法,可將深度學習訓練時間從數(shù)周減少到數(shù)小時。
NXP的i.MX 95系列應用處理器將eIQ Neutron神經(jīng)處理單元(NPU)、Arm Mali沉浸式3D圖形處理、異構安全分區(qū)和網(wǎng)絡功能組合在一起,可實現(xiàn)機器學習和先進的邊緣應用。此外,i.MX95還集成了NXP的圖像信號處理器(ISP),支持多種不同的圖像傳感器,從而實現(xiàn)工業(yè)、機器人、醫(yī)療和汽車等領域廣泛的視覺應用。為此,NXP專門針對機器視覺應用對這個ISP進行了優(yōu)化,能支持兩個目標區(qū)域、兩個曝光的HDR合成、先進降噪和邊緣增強,支持彩色、單色和RGB-IR攝像頭傳感器。
在i.MX95 SoC中,主要通過集成的eIQ Neutron NPU實現(xiàn)機器視覺,在這里,NPU作為視覺處理通路的一部分,連通多個攝像頭傳感器和網(wǎng)絡連接的智能攝像頭。
圖3:NXP i.MX95系統(tǒng)框圖
(圖源:NXP)
本文小結(jié)
工業(yè)機器視覺是使用相機、鏡頭和照明設備對制成品進行自動視覺檢查。這是一種實時檢測部件的方法,既快速又準確,它可以對高速生產(chǎn)線上的每一件產(chǎn)品進行拍攝和分析,通過復雜的算法來檢查和評估在工業(yè)環(huán)境中獲取的圖像,確保100%的質(zhì)量控制。它還可以自動化許多工業(yè)檢查,包括缺陷和問題的目視檢查、產(chǎn)品存在與否檢查、產(chǎn)品類型驗證、測量和產(chǎn)品代碼讀取等。今天,工業(yè)自動化正在以驚人的速度發(fā)展,機器視覺技術在其發(fā)展和擴張中發(fā)揮著至關重要的作用。
在剛剛過去幾年里,融入了人工智能的機器視覺技術幫助許多機器人和自動駕駛汽車實現(xiàn)了幾乎與人類相似的感知水平。通過使用大量先進的光學傳感器,如高分辨率相機,這些機器人和汽車最終能夠以自己的方式擁有“看”的能力。多種技術的融合和飛速發(fā)展使得新應用的潛力顯著增加,這意味著未來的機器視覺技術將與更多的行業(yè)相關,所創(chuàng)建的解決方案也將更加通用和智能。
免責聲明:本文為轉(zhuǎn)載文章,轉(zhuǎn)載此文目的在于傳遞更多信息,版權歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權問題,請聯(lián)系小編進行處理。
推薦閱讀: