Allion Labs / Kali Chen

 

什麼是智慧影像偵測? 

智慧相機在近年經由學術單位大量研究與擴展讓影像偵測技術更上一層樓,因其功能卓越及使用便利,也逐漸成為許多家庭必買的智慧用品之一。簡單來說,智慧影像分析系統會透過電腦視覺、機器學習與深度學習等技術,從中學習人的視覺辨識能力,並自動判讀影像中的關鍵資訊,目前被大量使用在人臉識別、人體動作捕捉、光學文字識別技術等。此外,智慧相機也導入了雲端系統,使資料可以循環儲存在雲端上,搭配網路平台上導入的識別技術,不需額外再架設主機或儲存設備,從而減少設備的開銷。

 

市場常見的四大影像辨識軟體與平台

百佳泰從市面上常見的影像辨識軟體,分別介紹其功能及原理:

  • 人臉偵測
  • 人體動作偵測
  • 車輛辨識
  • 光學文字辨識功能

 

人臉辨識

人臉辨識是智慧相機中最重要的一部分,其原理為當相機取得人臉影像後,會取得人臉五官相對位置的座標。我們以知名影星為例(圖1.1),從照片中擷取眉毛、眼睛、嘴部等多點位置後,描繪出多點所形成的輪廓;如拍攝到數張同一人臉在不同角度的影像時,軟體會利用神經網路處理圖片,從中提取特徵點,並將其數張影像代入機器學習算法,可訓練分類器分類以及訓練出人臉身份對應的模型。


圖1.1:將不同角度的同一人臉導入偵測系統進行訓練

 

 


圖1.2:於已建立的模型中辨識成功

 

此外,這一系列的技術也可運用在即時視訊中,影像偵測透過模型可迅速辨識人員身份(如圖1.3)。


圖1.3

 

人體動作偵測 

在居家環境中,嬰幼兒及老人的居家照顧較為費心;如稍不注意,可能會導致嬰兒跌落床下或是老人跌倒等情形發生。智慧攝影機另一項著重的功能在於可偵測人員防跌以及防摔,鏡頭會偵測人員的肢體由直立快速改變為平躺或捲曲狀的動作。另外像是運動訓練單位所使用的智慧攝影機,也搭配了肢體捕捉功能,可精準進行動作肢體的校正。目前肢體捕捉最主流的為Open Pose,識別的原理先由相機捕捉到2D圖像並傳到網路平台資料庫,圖像資料再導入Open Pose運算平台,之後Open Pose中的關鍵點檢測器會識別並標記出身體特點的部位,身體跟蹤算法會計算出不同角度下每個姿勢的表現,並以3D彩色火柴人的形式呈現出來。 (圖2)


圖2

 

車輛辨識 

在交通管理工作領域中,車輛辨識是相當實用的功能,舉凡停車場停車、路邊違停、超速等交通安全事件,往往都需要拍攝車牌號碼取得證據。不同地區的國家有不同車牌格式,當攝影機拍下車牌影像後會立即上傳到平台資料庫。就目前來說,網路平台上Open ALPR可針對不同地區的車牌格式進行訓練並儲存模型,當使用者上傳資料到平台時便能快速辨識該車牌,並提供車輛型號、年分、廠牌、車牌號碼等資訊。


圖3

 

 

光學文字辨識功能 

利用圖像識別的方式擷取文字資訊,可以大量應用在各種場合,舉凡各種有文字資訊的圖像、光學文件掃描器、文字翻譯機等。目前較為廣泛使用的是Tesseract的OCR技術,在網路平台先建置並設定好使用的文字語系模型,再輸入含有文字的影像和模型比對,即完成文字辨識輸出(圖4)。

 


圖4

 

 

 

百佳泰四大影像軟體驗證服務

百佳泰與時俱進,導入四大影像辨識驗證測試,確保您的產品可針對不同目標進行精準辨識與校正,除可保有良好的產品品質外,也能在市場中佔據一席之地。

以下為智慧攝影機驗證項目其具體方法(表1)

驗證項目  驗證方法 
人臉辨識驗證 臉部影像捕捉傳送至網路平台,導入 Face API 偵測功能,回傳偵測結果並實際比對該廠牌智慧相機APP端的人臉辨識功能。
人體動作偵測驗證 人體影像捕捉傳送至網路平台,導入 OpenPose偵測功能,回傳偵測結果並實際比對該廠牌智慧攝影機APP端的人體動作偵測功能。
車輛辨識驗證 車輛影像捕捉傳送至網路平台,導入Open ALPR偵測功能,回傳偵測結果並實際比對該智慧攝影機APP端的車輛辨識功能。
光學文字辨識功能驗證 文字影像捕捉傳送至網路平台,導入 Optical character recognition (OCR) API 偵測功能,回傳偵測結果並實際比對該廠牌智慧攝影機APP端的光學文字辨識功能。

表1

 

此外,我們參考市面上三大熱門網路平台供應商(表2),透過平台搭配能為您的產品架構出最佳智慧影像識別測試方案。

微軟 亞馬遜 Google
網路平台 Azure Computer Vision AWS Rekognition Cloud Vision

表2

 

若您對相關的測試服務想要進一步了解,歡迎聯絡百佳泰