立體視覺或比雷達更適合自動駕駛
發布時間:2018-05-25 來源:Junko Yoshida 責任編輯:wenwei
【導讀】一家成立由20名員工組成的日本新創公司ITD Lab正在開發一種“智能立體攝像頭”(Intelligent Stereo Camera,ISC)技術,鎖定包括先進駕駛輔助係統(ADAS)、自動駕駛車輛、無人機、建築用工具機、工業用機器人等應用。
ITD Lab的秘密武器是首席技術官実吉敬二(Keiji Saneyoshi),他是日本車廠斯巴魯(Subaru)智能駕駛輔助係統EyeSight之父,是該車廠原創立體視覺係統“Stereo Range Imager”幕後的首席工程師;実吉任職於Subaru時率領的團隊,開發了第一套隻利用立體攝像頭(stereo cameras)來偵測物體,例如車輛、行人、自行車或機車騎士的駕駛輔助係統。

Keiji Saneyoshi
実吉在1998年離開Subaru進入學界,在東京工業大學(Tokyo Institute of Technology,TIT)擔任教授直到2017年初;他在TIT任教期間指導的團隊進一步提升了原始立體視覺算法,並在2016年5月成立ITD Lab
顯然先進的立體視覺(stereo-vision technology)技術就是実吉與ITD Lab的專長所在,該技術可提供“距離估算”(distance estimation),這是單眼攝像頭無法做到的。然而,傳感器融合在現今汽車產業領域蔚為風潮,ITD Lab推動立體視覺在ADAS的應用似乎是違背直覺。
盡管立體視覺曾經被視為ADAS來說至關重要的差異化技術,聚焦於高度自動化駕駛車輛的一線汽車零組件供應商(Tier One)與車廠傾向於認為立體視覺不那麼相關;產業界形成的共識是,單視覺(Monovision)的局限可以透過單眼攝像頭與雷達的結合來解決。
実吉坦承,雷達-單視覺方案確有進展,不過他仍然對ITD Lab的立體視覺技術有信心,因為該技術不需要融合雷達數據,能提供在3D距離量測、自我位置識別、防碰撞、物體追蹤、車道識別、道路邊界識別等方麵表現卓越性能,速度可達每秒60訊框(frames)、最高甚至可達每秒160個訊框。
曾受教於実吉的ITD Lab首席執行官小倉明宏(Akihiro Ogura)接受EE Times采訪時表示,該公司技術的其他優勢包括支持“自動校準”(automatic calibration),能吸收製造失誤與安裝時的連接失誤;而小倉強調,ITD Lab的技術目標是以較低的成本提供最高安全性,該公司應用於ADAS的解決方案之成本會低於Intel/Mobileye的方案。
ITD Lab是在一個黑盒子裏提供其先進立體視覺算法,以儲存在ROM中的程序代碼形式,用以啟動Intel-Altera的Cyclone FPGA。

ITD Lab展示其智能立體攝像頭(左上) (來源:EE Times)
與EyeSight係出同源
雖然ITD Lab是一家新創公司,卻因為技術與Subaru的EyeSight有血緣關係而很少遇到信譽相關的問題。如技術顧問公司VSI Labs創辦人暨首席顧問Phil Magney所言:“EyeSight是很可靠的解決方案,而且已經存在市場好一段時間;Subaru在推出前向(forward-facing) ADAS解決方案後不久就贏得不少讚賞,這成為Subaru車用安全解決方案陣容的基礎。”
以実吉在Subaru開發的Stereo Range Imager為基礎,ITD Lab聲稱其解決方案有進一步的改善,特別是在自動校準、視差影像精確度(parallax image accuracy)、計算性能(平行處理優化)等方麵。不過也有部分產業觀察家指出,立體視覺不再是ADAS的唯一解答。
針對Subaru的EyeSight,市場研究機構The Linley Group資深分析師Mike Demler的觀察是:“Subaru顯然利用了雙攝像頭進行距離估算,以支持其適應性巡航控製與自動剎車/油門等功能,這是罕見的選擇;”他指出:“雷達現在是該類功能更熱門的技術選項,也更精確可靠,因為不必顧慮光線情況與雨雪等情境。”
而Demler指出,使用立體攝像頭的唯一理由是3D建模以及距離估算,他猜測実吉選擇立體視覺方法而非攝像頭-雷達係統,隻是因為他對前者比較熟悉。不過実吉堅稱,立體視覺方案──藉由在整個流程中保持光流(optical flow)──能讓ADAS更簡單而且容易,因為不需要傳感器融合。
VSI Labs的Magney部分同意実吉的意見;他指出:“采用立體視覺做為主要傳感器,就不必擔心雷達,”而且能讓你“把所有的處理程序包進立體視覺模塊中,所以在布署之前一切都設定妥當;”然而他也指出:“更常見的方法是將單眼攝像頭搭配雷達,可以更合理地量測物體的深度以及運動。”
確實,雷達技術一直在變得更好;如Magney所言,它抵抗天氣的能力比攝像頭更好。在另一方麵,雷達的最大問題仍然是“誤報”。隨著傳感器融合的勢力不斷擴大,ITD的立體視覺技術有可能已經過時,但該公司首席執行官小倉在充分意識到所麵臨的艱困市場競爭之同時,也表示:“給我們機會證明我們的技術,你一定不會失望。”
支持立體視覺技術,你不是一個人在戰鬥
日本新創公司ITD Lab並非唯一看好立體視覺技術的業者,還有包括汽車安全係統製造商Autoliv、Subaru/Eyesight以及Ambarella (VisLab),也提供立體視覺解決方案。
市場研究機構The Linley Group資深分析師Mike Demler表示,來自歐洲的自動駕駛技術開發商AIMotive曾示範過利用立體攝像頭支持高階自動駕駛;技術顧問公司VSI Labs創辦人暨首席顧問Phil Magney則指出,除了前麵提到的那些公司:“有少數一線(Tier Ones)汽車電子廠商也仍支持立體視覺技術,就算目前沒有將該技術列在產品列表中,也會提供立體視覺方案的詢價(RFQ)。”
相較於其他立體視覺解決方案,ITD Lab首席技術官実吉敬二(Keiji Saneyoshi)強調,該公司的優勢在於兩個方麵:“我們提供更清晰的物體邊緣(object-edge)偵測,而且我們的處理速度快很多──大概是Subaru EyeSight速度的十倍。”

CMOS影像傳感器拍攝的影像 (來源:ITD Lab)

ITD Lab競爭對手之立體視覺技術拍攝的影像 (來源:ITD Lab)
上麵的第一張圖是以CMOS影像傳感器拍攝的影像,第二張圖則是ITD Lab競爭對手的立體視覺技術所擷取的影像;実吉指出,物體之間的邊緣粗糙而且模糊,可能導致某些物體消失在背景中。下方的影像則是由ITD Lab自家立體視覺技術拍攝的,每個物體的邊緣更銳利,強化了可藉由轉向避免碰撞的能力。

以ITD Lab立體視覺技術拍攝的影像 (來源:ITD Lab)
功能齊全的SoC
而ITD Lab與其他計算機視覺處理器業者的最大差異化所在,是実吉堅持利用FPGA做為視覺加速器,他相信FPGA不隻對該公司的立體視覺算法很理想,也能在未來用以執行CNN或DNN等人工智能神經網絡:“FPGA的平行處理流水線是為深度學習量身打造。”
雖然目前ITD Lab的智能立體攝像頭(Intelligent Stereo Camera)還未提供深度學習功能,但該公司首席執行官小倉明宏(Akihiro Ogura)表示,他們計劃利用“一款低成本FPGA”添加AI功能。根據ITD Lab代理商Macnica/Fuji Electronics總經理荒井文彥(Sachihiko Asakura)的說法,該公司正準備導入來自第三方業者的深度學習解決方案。
對此VSI Labs的Magney表示:“對ADAS來說,沒有AI功能不會是一個缺陷,因為該類係統主要是決定性應用;不過對更多先進應用(例如自動駕駛)來說,你會需要對AI技術有所著墨,以保持與市場的關聯性。”
ITD Lab的実吉堅信,立體視覺處理是在未進行訓練的情況下偵測一般物體的理想方案;相較之下單眼視覺可能會在遇到未經過訓練的狀況時錯失物體偵測;“舉例來說,Volvo的自動駕駛技術據說在識別馬路上的袋鼠時遭遇困難,”他表示,袋鼠的跳躍動作會混淆單眼相機的視覺處理。
但The Linley Group的Demler並不讚同,他提出的疑問是:“單眼視覺物體偵測與識別算法都已妥善經過證實,ImageNet競賽都是以單眼拍攝影像為識別內容,這不是很有趣嗎?”他進一步表示:“神經網絡推理引擎是分類氣,它們會計算一個物體有經過預先訓練的概率,如我們所知道的,Uber的係統其實有偵測到牽著自行車穿越馬路的女性路人,但軟件當機了。”
對於Uber自駕車在美國發生的撞人致死事故,実吉的疑問是Mobileye視覺處理器有沒有在足夠快的時間內偵測到行人。為了證明今日的ADAS技術性能,Mobileye在來自警方提供之Uber交通事故視頻饋入上執行其軟件;英特爾資深副總裁Amnon Shashua在去年3月的一篇部落格文章中表示:“盡管條件不理想,大多數出現在實際場景中的高動態範圍數據可能丟失,但在發生撞擊大約1秒之前能達成清楚的偵測。”
実吉也有做過一樣的工作,在Uber事故的視頻饋入上執行其軟件;根據他的說法,ITD的智能立體攝像頭能在撞擊發生前2.23秒偵測到穿越馬路的女性行人。如下圖所示,第一欄是單眼視覺處理器擷取的影像在撞擊前1.29秒偵測到物體,第二欄是ITD的立體視覺擷取到的影像,第三欄則是警方提供的事故發生當時監視錄像。

以不同技術模擬偵測Uber美國的撞人致死事故 (來源:ITD Lab)
ITD Lab準備推出其智能立體攝像頭芯片──儲存一組用以處理視差影像數據之FPGA程序代碼的ROM芯片──以及包括光學組件在內的參考設計開發板;該公司表示,至少將有一家Tier One廠商正在評估其技術,而実吉表示該方案的功耗是3瓦。
本文轉載自電子技術設計。
推薦閱讀:
特別推薦
- 噪聲中提取真值!瑞盟科技推出MSA2240電流檢測芯片賦能多元高端測量場景
- 10MHz高頻運行!氮矽科技發布集成驅動GaN芯片,助力電源能效再攀新高
- 失真度僅0.002%!力芯微推出超低內阻、超低失真4PST模擬開關
- 一“芯”雙電!聖邦微電子發布雙輸出電源芯片,簡化AFE與音頻設計
- 一機適配萬端:金升陽推出1200W可編程電源,賦能高端裝備製造
技術文章更多>>
- 築基AI4S:摩爾線程全功能GPU加速中國生命科學自主生態
- 一秒檢測,成本降至萬分之一,光引科技把幾十萬的台式光譜儀“搬”到了手腕上
- AI服務器電源機櫃Power Rack HVDC MW級測試方案
- 突破工藝邊界,奎芯科技LPDDR5X IP矽驗證通過,速率達9600Mbps
- 通過直接、準確、自動測量超低範圍的氯殘留來推動反滲透膜保護
技術白皮書下載更多>>
- 車規與基於V2X的車輛協同主動避撞技術展望
- 數字隔離助力新能源汽車安全隔離的新挑戰
- 汽車模塊拋負載的解決方案
- 車用連接器的安全創新應用
- Melexis Actuators Business Unit
- Position / Current Sensors - Triaxis Hall
熱門搜索





