聽技術牛人講解:手勢識別技術是什麼?
發布時間:2015-03-02 責任編輯:sherryyu
【導讀】說到手勢識別大家並不陌生,想得到的是二維手型識別、二維手勢識別、三維手勢識別這幾個名詞,但是到底手勢識別技術是什麼?怎麼定義的?又是如何工作的呢?請看下文詳解!
談起手勢識別技術,由簡單粗略的到複雜精細的,大致可以分為三個等級:二維手型識別、二維手勢識別、三維手勢識別。在具體討論手勢識別之前,我們有必要先知道二維和三維的差別。二維隻是一個平麵空間,我們可以用(X坐標,Y坐標)組成的坐標信息來表示一個物體在二維空間中的坐標位置,就像是一幅畫出現在一麵牆上的位置。三維則在此基礎上增加了“深度”(Z坐標)的信息,這是二維所不包含的。這裏的“深度”並不是咱們現實生活中所說的那個深度,這個“深度”表達的是“縱深”,理解為相對於眼睛的“遠度”也許更加貼切。就像是魚缸中的金魚,它可以在你麵前上下左右的遊動,也可能離你更遠或者更近。

前qian兩liang種zhong手shou勢shi識shi別bie技ji術shu,完wan全quan是shi基ji於yu二er維wei層ceng麵mian的de,它ta們men隻zhi需xu要yao不bu含han深shen度du信xin息xi的de二er維wei信xin息xi作zuo為wei輸shu入ru即ji可ke。就jiu像xiang平ping時shi拍pai照zhao所suo得de的de相xiang片pian就jiu包bao含han了le二er維wei信xin息xi一yi樣yang,我wo們men隻zhi需xu要yao使shi用yong單dan個ge攝she像xiang頭tou捕bu捉zhuo到dao的de二er維wei圖tu像xiang作zuo為wei輸shu入ru,然ran後hou通tong過guo計ji算suan機ji視shi覺jiao技ji術shu對dui輸shu入ru的de二er維wei圖tu像xiang進jin行xing分fen析xi,獲huo取qu信xin息xi,從cong而er實shi現xian手shou勢shi識shi別bie。
而er第di三san種zhong手shou勢shi識shi別bie技ji術shu,是shi基ji於yu三san維wei層ceng麵mian的de。三san維wei手shou勢shi識shi別bie與yu二er維wei手shou勢shi識shi別bie的de最zui根gen本ben區qu別bie就jiu在zai於yu,三san維wei手shou勢shi識shi別bie需xu要yao的de輸shu入ru是shi包bao含han有you深shen度du的de信xin息xi,這zhe就jiu使shi得de三san維wei手shou勢shi識shi別bie在zai硬ying件jian和he軟ruan件jian兩liang方fang麵mian都dou比bi二er維wei手shou勢shi識shi別bie要yao複fu雜za得de多duo。對dui於yu一yi般ban的de簡jian單dan操cao作zuo,比bi如ru隻zhi是shi想xiang在zai播bo放fang視shi頻pin的de時shi候hou暫zan停ting或huo者zhe繼ji續xu放fang映ying,二er維wei手shou勢shi也ye就jiu足zu夠gou了le。但dan是shi對dui於yu一yi些xie複fu雜za的de人ren機ji交jiao互hu,比bi如ru玩wan遊you戲xi或huo者zhe應ying用yong在zaiVR(虛擬現實)上,三維手勢實在是居家旅行必備、舍我其誰的不二之選。
手勢識別分類
二維手型識別
二er維wei手shou型xing識shi別bie,也ye可ke稱cheng為wei靜jing態tai二er維wei手shou勢shi識shi別bie,識shi別bie的de是shi手shou勢shi中zhong最zui簡jian單dan的de一yi類lei。這zhe種zhong技ji術shu在zai獲huo取qu二er維wei信xin息xi輸shu入ru之zhi後hou,可ke以yi識shi別bie幾ji個ge靜jing態tai的de手shou勢shi,比bi如ru握wo拳quan或huo者zhe五wu指zhi張zhang開kai。其qi代dai表biao公gong司si是shi一yi年nian前qian被beiGoogle收購的Flutter。在使用了他家的軟件之後,用戶可以用幾個手型來控製播放器。用戶將手掌舉起來放到攝像頭前,視頻就開始播放了;再把手掌放到攝像頭前,視頻又暫停了。
“靜態”是這種二維手勢識別技術的重要特征,這種技術隻能識別手勢的“狀態”,而不能感知手勢的“持續變化”。舉個例子來說,如果將這種技術用在猜拳上的話,它可以識別出石頭、jiandaohebudeshoushizhuangtai。danshiduichucizhiwaideshoushi,tajiuyiwusuozhile。suoyizhezhongjishushuodaodishiyizhongmoshipipeijishu,tongguojisuanjishijiaosuanfafenxituxiang,heyushedetuxiangmoshijinxingbidui,congerlijiezhezhongshoushidehanyi。
這種技術的不足之處顯而易見:zhikeyishibieyushehaodezhuangtai,tuozhanxingcha,kongzhiganhenruo,yonghuzhinengshixianzuijichuderenjijiaohugongneng。danshitashishibiefuzashoushidediyibu,erqiewomendequekeyitongguoshoushihejisuanjihudongle,haishihenkudebushime?xiangxiangyixianimangzhechifan,zhiyaopingkongzuogeshoushi,jisuanjijiukeyiqiehuandaoxiayigeshipin,bishiyongshubiaolaikongzhikeshifangbianduole!
二維手勢識別
二(er)維(wei)手(shou)勢(shi)識(shi)別(bie),比(bi)起(qi)二(er)維(wei)手(shou)型(xing)識(shi)別(bie)來(lai)說(shuo)稍(shao)難(nan)一(yi)些(xie),但(dan)仍(reng)然(ran)基(ji)本(ben)不(bu)含(han)深(shen)度(du)信(xin)息(xi),停(ting)留(liu)在(zai)二(er)維(wei)的(de)層(ceng)麵(mian)上(shang)。這(zhe)種(zhong)技(ji)術(shu)不(bu)僅(jin)可(ke)以(yi)識(shi)別(bie)手(shou)型(xing),還(hai)可(ke)以(yi)識(shi)別(bie)一(yi)些(xie)簡(jian)單(dan)的(de)二(er)維(wei)手(shou)勢(shi)動(dong)作(zuo),比(bi)如(ru)對(dui)著(zhe)攝(she)像(xiang)頭(tou)揮(hui)揮(hui)手(shou)。其(qi)代(dai)表(biao)公(gong)司(si)是(shi)來(lai)自(zi)以(yi)色(se)列(lie)的(de)PointGrab,EyeSight和ExtremeReality。
二er維wei手shou勢shi識shi別bie擁yong有you了le動dong態tai的de特te征zheng,可ke以yi追zhui蹤zong手shou勢shi的de運yun動dong,進jin而er識shi別bie將jiang手shou勢shi和he手shou部bu運yun動dong結jie合he在zai一yi起qi的de複fu雜za動dong作zuo。這zhe樣yang一yi來lai,我wo們men就jiu把ba手shou勢shi識shi別bie的de範fan圍wei真zhen正zheng拓tuo展zhan到dao二er維wei平ping麵mian了le。我wo們men不bu僅jin可ke以yi通tong過guo手shou勢shi來lai控kong製zhi計ji算suan機ji播bo放fang/暫停,我們還可以實現前進/後退/向上翻頁/向下滾動這些需求二維坐標變更信息的複雜操作了。
zhezhongjishusuiranzaiyingjianyaoqiushangheerweishouxingshibiebingwuqubie,danshideyiyugengjiaxianjindejisuanjishijiaosuanfa,keyihuodegengjiafengfuderenjijiaohuneirong。zaishiyongtiyanshangyetigaoleyigedangci,congchuncuidezhuangtaikongzhi,bianchenglebijiaofengfudepingmiankongzhi。zhezhongjishuyijingbeijichengdaoledianshili,danshimuqianhaishiyixuetouweizhu,haibunengchengweidianshidezhuyaochangyongkongzhifangshi。
三維手勢識別
接下來我們要談的就是當今手勢識別領域的重頭戲——三維手勢識別。三維手勢識別需要的輸入是包含有深度的信息,可以識別各種手型、手(shou)勢(shi)和(he)動(dong)作(zuo)。相(xiang)比(bi)於(yu)前(qian)兩(liang)種(zhong)二(er)維(wei)手(shou)勢(shi)識(shi)別(bie)技(ji)術(shu),三(san)維(wei)手(shou)勢(shi)識(shi)別(bie)不(bu)能(neng)再(zai)隻(zhi)使(shi)用(yong)單(dan)個(ge)普(pu)通(tong)攝(she)像(xiang)頭(tou),因(yin)為(wei)單(dan)個(ge)普(pu)通(tong)攝(she)像(xiang)頭(tou)無(wu)法(fa)提(ti)供(gong)深(shen)度(du)信(xin)息(xi)。要(yao)得(de)到(dao)深(shen)度(du)信(xin)息(xi)需(xu)要(yao)特(te)別(bie)的(de)硬(ying)件(jian),目(mu)前(qian)世(shi)界(jie)上(shang)主(zhu)要(yao)有(you)3種zhong硬ying件jian實shi現xian方fang式shi。加jia上shang新xin的de先xian進jin的de計ji算suan機ji視shi覺jiao軟ruan件jian算suan法fa就jiu可ke以yi實shi現xian三san維wei手shou勢shi識shi別bie了le。下xia麵mian就jiu讓rang小xiao編bian為wei大da家jia一yi一yi道dao來lai三san維wei手shou勢shi識shi別bie的de三san維wei成cheng像xiang硬ying件jian原yuan理li。
1結構光(Structure Light)
結構光的代表應用產品就是PrimeSense公司為大名鼎鼎的微軟家XBOX 360所做的Kinect一yi代dai了le。這zhe種zhong技ji術shu的de基ji本ben原yuan理li是shi,加jia載zai一yi個ge激ji光guang投tou射she器qi,在zai激ji光guang投tou射she器qi外wai麵mian放fang一yi個ge刻ke有you特te定ding圖tu樣yang的de光guang柵zha,激ji光guang通tong過guo光guang柵zha進jin行xing投tou射she成cheng像xiang時shi會hui發fa生sheng折zhe射she,從cong而er使shi得de激ji光guang最zui終zhong在zai物wu體ti表biao麵mian上shang的de落luo點dian產chan生sheng位wei移yi。當dang物wu體ti距ju離li激ji光guang投tou射she器qi比bi較jiao近jin的de時shi候hou,折zhe射she而er產chan生sheng的de位wei移yi就jiu較jiao小xiao;dangwutijulijiaoyuanshi,zhesheerchanshengdeweiyiyejiuhuixiangyingdebianda。zheshishiyongyigeshexiangtoulaijiancecaijitoushedaowutibiaomianshangdetuyang,tongguotuyangdeweiyibianhua,jiunengyongsuanfajisuanchuwutideweizhiheshenduxinxi,jinerfuyuanzhenggesanweikongjian。
以Kinectyidaidejiegouguangjishulaishuo,yinweiyilaiyujiguangzheshehouchanshengdeluodianweiyi,suoyizaitaijindejulishang,zheshedaozhideweiyishangbumingxian,shiyonggaijishujiubunengtaijingquedejisuanchushenduxinxi,suoyi1米到4米是其最佳應用範圍。
2光飛時間(Time of Flight)
光飛時間是SoftKinetic公司所采用的技術,該公司為業界巨鱷Intel提供帶手勢識別功能的三維攝像頭。同時,這一硬件技術也是微軟新一代Kinect所使用的。這種技術的基本原理是加載一個發光元件,發光元件發出的光子在碰到物體表麵後會反射回來。使用一個特別的CMOS傳感器來捕捉這些由發光元件發出、youcongwutibiaomianfanshehuilaideguangzi,jiunengdedaoguangzidefeixingshijian。genjuguangzifeixingshijianjinerkeyituisuanchuguangzifeixingdejuli,yejiudedaolewutideshenduxinxi。
就計算上而言,光飛時間是三維手勢識別中最簡單的,不需要任何計算機視覺方麵的計算。
3多角成像(Multi-camera)
多角成像這一技術的代表產品是Leap Motion公司的同名產品和Usens公司的Fingo。
這種技術的基本原理是使用兩個或者兩個以上的攝像頭同時攝取圖像,就好像是人類用雙眼、昆蟲用多目複眼來觀察世界,通過比對這些不同攝像頭在同一時刻獲得的圖像的差別,使用算法來計算深度信息,從而多角三維成像。
在這裏我們以兩個攝像頭成像來簡單解釋一下:

雙shuang攝she像xiang頭tou測ce距ju是shi根gen據ju幾ji何he原yuan理li來lai計ji算suan深shen度du信xin息xi的de。使shi用yong兩liang台tai攝she像xiang機ji對dui當dang前qian環huan境jing進jin行xing拍pai攝she,得de到dao兩liang幅fu針zhen對dui同tong一yi環huan境jing的de不bu同tong視shi角jiao照zhao片pian,實shi際ji上shang就jiu是shi模mo擬ni了le人ren眼yan工gong作zuo的de原yuan理li。因yin為wei兩liang台tai攝she像xiang機ji的de各ge項xiang參can數shu以yi及ji它ta們men之zhi間jian相xiang對dui位wei置zhi的de關guan係xi是shi已yi知zhi的de,隻zhi要yao找zhao出chu相xiang同tong物wu體ti(楓葉)在不同畫麵中的位置,我們就能通過算法計算出這個物體(楓葉)距離攝像頭的深度了。
duojiaochengxiangshisanweishoushishibiejishuzhongyingjianyaoqiuzuidi,dantongshishizuinanshixiande。duojiaochengxiangbuxuyaorenheewaideteshushebei,wanquanyilaiyujisuanjishijiaosuanfalaipipeiliangzhangtupianlidexiangtongmubiao。xiangbiyujiegouguanghuozheguangfeishijianzheliangzhongjishuchengbengao、功耗大的缺點,多角成像能提供“價廉物美”的三維手勢識別效果。
特別推薦
- 噪聲中提取真值!瑞盟科技推出MSA2240電流檢測芯片賦能多元高端測量場景
- 10MHz高頻運行!氮矽科技發布集成驅動GaN芯片,助力電源能效再攀新高
- 失真度僅0.002%!力芯微推出超低內阻、超低失真4PST模擬開關
- 一“芯”雙電!聖邦微電子發布雙輸出電源芯片,簡化AFE與音頻設計
- 一機適配萬端:金升陽推出1200W可編程電源,賦能高端裝備製造
技術文章更多>>
- 菲尼克斯電氣DIP產線獲授“IPC HERMES Demo Line”示範線
- 貿澤電子新品推薦:2026年第一季度引入超過9,000個新物料
- PROFINET牽手RS232:網關為RFID裝上“同聲傳譯”舊設備秒變智能
- 跨域無界 智馭未來——聯合電子北京車展之智能網聯篇
- 為AI尋找存儲新方案
技術白皮書下載更多>>
- 車規與基於V2X的車輛協同主動避撞技術展望
- 數字隔離助力新能源汽車安全隔離的新挑戰
- 汽車模塊拋負載的解決方案
- 車用連接器的安全創新應用
- Melexis Actuators Business Unit
- Position / Current Sensors - Triaxis Hall
熱門搜索
斷路器型號
多層PCB
多諧振蕩器
扼流線圈
耳機
二極管
二極管符號
發光二極管
防靜電產品
防雷
防水連接器
仿真工具
放大器
分立器件
分頻器
風力渦輪機
風能
風扇
風速風向儀
風揚高科
輔助駕駛係統
輔助設備
負荷開關
複用器
伽利略定位
幹電池
幹簧繼電器
感應開關
高頻電感
高通


