台俄合作最速物件偵測 影像辨識解決交通車流

中研院今天表示,台灣與俄羅斯共同研究開發的物件偵測演算法(YOLOv4),是目前最快的影像辨識技術,已運用於桃園、新竹交通車流解決方案,為台灣智慧城市往前邁出一大步。

中央研究院公布由資訊科學研究所特聘研究員廖弘源、博士後研究員王建堯,與俄羅斯開發者博科夫斯基(Alexey Bochkovskiy)共同研發出目前世界上最快最準的物件偵測演算法(YOLOv4),平均正確率達43.5%,比前一代提高10%,更超越其他種影像辨識技術。

中研院表示,已與義隆電子合作,將YOLOv4運用於「智慧城市交通車流解決方案」,目前已布設於桃園、新竹,在路口就能進行交通影像辨識及車流分析,為台灣智慧城市發展往前邁出一大步。

王建堯說明,物件偵測技術追求速度和精準,二者缺一不可,卻難以兼備。他從去年開始改良YOLOv3,一改過去多採「降速求控球」,轉而從YOLO所運行的人工智慧模型著手,改善網路識別物件的回傳機制,優化傳輸路徑,以減少演算法的計算量,因此能增加運算內容的多樣性及運算速度。

王建堯的研究成果引起YOLO網路架構維護者博科夫斯基的興趣,並主動向他聯繫,雙方自去年11月攜手合作。經過5個多月日以繼夜地開發,今年4月宣布完成新一代的YOLOv4演算法。

中研院說明,YOLOv4是一種利用人工智慧執行即時物件偵測(Object Detection)的技術,能偵測物件、追蹤及判斷,可應用於交通車流計算、自駕車研發、工廠瑕疵檢測、醫療影像分析、五官定位等。自4月以開放原始碼免費釋出後,全世界已有數萬人測試應用。

YOLO是You only look once的簡稱,顧名思義,只需訓練一個網路模型,電腦只要看一眼,就能判斷照片或影像裡的物件類別與位置,大大提升辨識速度。自104年推出第一代版本後,深受開發者喜愛,為電腦視覺(Computer vision)技術立下重要的里程碑。

中研院強調,過去訓練電腦識別一張照片裡的物件,須執行幾千次的識別指令,改良後的YOLOv4性能更強大,經微軟開源影像資料庫(MSCOCO)測試,辨識物件的速度及精確度皆大幅提升,堪稱是目前世界上辨識速度最快、最精準的物件偵測演算法。
  • 新聞關鍵字: 人工智慧微軟

最新生活新聞
人氣生活新聞
行動版 電腦版