AI 機器視覺是什麼?
原理與應用?
看完這篇一次了解

AI 機器視覺是什麼?

AI 機器視覺是人工智慧的一個分支,使機器和人一樣「看懂」圖像與物件後進行判斷與決策,常用在工業自動化與機器人領域如: 視覺瑕疵檢測3D 視覺定位分類計數,甚至影像監控/辨識等應用,也是新興的 AR + AI 視覺系統技術核心。

技術原理與組成

AOI 這種 Rule-based 到深度學習技術(為機器學習的分支,透過模擬人腦的類神經網路,形成數學函數集並將資料代入做訓練與運算,能處理非結構化資料,使機器和人一樣進行判斷),通常包含以下5個環節。

影像輸入

包含工業相機、IP Cam 拍攝或現成圖像資料等來源。除了像素規格,光源也至關重要,需考量亮度/光通量、色溫、色彩再現性等,確保影像符合實際需求與品質。

影像處理與特徵提取

影像處理或轉換如二值化、濾波、增強、降噪和縮放等操作,提高影像品質和可用性後,提取有用的特徵如: 邊緣、紋理、色彩,或文章裡的詞組,選擇最具代表性的特徵,以降低計算成本並提高識別性能。

AI 建模與訓練

常由人工或 AI 技術進行標記與訓練,並建立 AI 模型,透過特徵來識別和分類模式。常用的模型包括支持向量機(SVM)、卷積神經網絡(CNN)和循環神經網絡(RNN)等。

物件識別與評估

訓練後的模型依照需求識別圖像中的物體、人物、文字或模式等。然而,該如何評估模型性能?
評估指標通常包含精確度(模型正確預測的樣本數除以總樣本數,但對於不平衡的數據集,精確度可能不是一個很好的指標)、混淆矩陣(一個矩陣表格,包括真正例、假正例、真反例和假反例的結果)和置信度(信心值)等。

決策和輸出

根據識別的資訊進行決策如: 辨識物件與方位後,控制機器手臂取放OCR 字元讀取、組裝/設備操作步驟 SOP 確認等應用。

機器視覺的應用與難題

從自動駕駛到廠區智慧巡檢,可用人眼做判斷與檢測/檢查的部分,就有機器視覺的應用機會,但仍面臨原始資料品質差與樣本數不足的挑戰,且無法直接將模型從某領域轉移到另一個領域使用,AI 建模成本(訓練時間、能耗、人力與樣本數等)也至關重要,即便是簡單的機械式指針讀取與辨識,一般傳統 AI 可能需上百甚至上千張樣本進行訓練。
AI 並不是要取代人類,而是幫助人類更高效、準確地運用資源甚至解放雙手等,以 AR 擴增實境 + AI 的視覺系統來說,由於可搭載於穿戴式裝置,作業員組裝設備時,AI 可對現實世界物件做辨識與判斷,並透過 AR 眼鏡,即時提供操作員組裝指引,或自動檢查線路是否正確連接等。
AR 和 AI 的結合能夠以合宜成本,提高資源運用效率、良率和確保工安等優點與全新應用,這種技術的應用有望在未來持續擴大,提供更多創新的解決方案。