卷積神經網絡簡介：什麼是機器學習？——第一部分-傳感技術-電子元件技術網

你的位置：首頁 > 傳感技術 > 正文

卷積神經網絡簡介：什麼是機器學習？——第一部分

發布時間：2023-03-21 來源：ADI 責任編輯：wenwei

【導讀】隨著人工智能(AI)技術的快速發展，AI可以越來越多地支持以前無法實現或者難以實現的應用。本係列文章基於此解釋了卷積神經網絡(CNN)及其對人工智能和機器學習的意義。CNN是一種能夠從複雜數據中提取特征的強大工具，例如識別音頻信號或圖像信號中的複雜模式就是其應用之一。本文討論了CNN相對於經典線性規劃的優勢，後續文章《訓練卷積神經網絡：什麼是機器學習？——第二部分》將討論如何訓練CNN模型，係列文章的第三部分將討論一個特定用例，並使用專門的AI微控製器對模型進行測試。

什麼是卷積神經網絡？

神經網絡是一種由神經元組成的係統或結構，它使AI能夠更好地理解數據，進而解決複雜問題。雖然神經網絡有許多種類型，但本係列文章將隻關注卷積神經網絡(CNN)，其主要應用領域是對輸入數據的模式識別和對象分類。CNN是一種用於深度學習的人工神經網絡。這種網絡由輸入層、若(ruo)幹(gan)卷(juan)積(ji)層(ceng)和(he)輸(shu)出(chu)層(ceng)組(zu)成(cheng)。卷(juan)積(ji)層(ceng)是(shi)最(zui)重(zhong)要(yao)的(de)部(bu)分(fen)，它(ta)們(men)使(shi)用(yong)一(yi)組(zu)獨(du)特(te)的(de)權(quan)重(zhong)和(he)濾(lv)波(bo)器(qi)，使(shi)得(de)網(wang)絡(luo)可(ke)以(yi)從(cong)輸(shu)入(ru)數(shu)據(ju)中(zhong)提(ti)取(qu)特(te)征(zheng)。數(shu)據(ju)可(ke)以(yi)是(shi)許(xu)多(duo)不(bu)同(tong)的(de)形(xing)式(shi)，如(ru)圖(tu)像(xiang)、音頻和文本。這種提取特征的過程使CNN能夠識別數據中的模式從而讓工程師能夠創建更有效和高效的應用。為了更好地理解CNN，我們首先將討論經典的線性規劃。

經典控製技術中的線性規劃

控kong製zhi技ji術shu的de任ren務wu是shi借jie助zhu傳chuan感gan器qi讀du取qu數shu據ju並bing進jin行xing處chu理li，然ran後hou根gen據ju規gui則ze做zuo出chu響xiang應ying，最zui後hou顯xian示shi或huo發fa送song結jie果guo。例li如ru，溫wen度du調tiao節jie器qi每mei秒miao鍾zhong測ce量liang一yi次ci溫wen度du，通tong過guo微wei控kong製zhi器qi單dan元yuan(MCU)讀取溫度傳感器的數據。該數值用於閉環控製係統的輸入，並與設定的溫度進行比較。這就是一個借助MCU執行線性規劃的例子，這種技術通過比較預編程值和實際值來給出明確的結論。相比之下，AI係統通常依據概率論來發揮作用。

複雜模式和信號處理

許(xu)多(duo)應(ying)用(yong)所(suo)使(shi)用(yong)的(de)輸(shu)入(ru)數(shu)據(ju)必(bi)須(xu)首(shou)先(xian)由(you)模(mo)式(shi)識(shi)別(bie)係(xi)統(tong)加(jia)以(yi)判(pan)別(bie)。模(mo)式(shi)識(shi)別(bie)可(ke)以(yi)應(ying)用(yong)於(yu)不(bu)同(tong)的(de)數(shu)據(ju)結(jie)構(gou)。本(ben)文(wen)討(tao)論(lun)的(de)例(li)子(zi)限(xian)定(ding)為(wei)一(yi)維(wei)或(huo)二(er)維(wei)的(de)數(shu)據(ju)結(jie)構(gou)，比(bi)如(ru)音(yin)頻(pin)信(xin)號(hao)、心電圖(ECG)、光電容積脈搏波(PPG)、一維的振動數據或波形、熱圖像、二維的瀑布圖數據。

在上述模式識別中，將應用通過MCU的代碼來實現是極其困難的。一個例子是識別圖像中的具體對象（例如貓）：這種情況下無法區分要分析的圖像是很早攝錄的，還是剛剛由從相機讀取的。分析軟件基於一些特定的規則來判斷圖片中是否有貓：比如說貓必須有典型的尖耳朵、三角形的鼻子和胡須。如果可以在圖像中識別出這些特征，軟件便可以報告在圖像中發現了貓。但是這存在一些問題：ruguotuxiangzhixianshilemaodebeimian，moshishibiexitonghuizenmeban？ruguomaomeiyouhuxuhuozhezaishiguzhongshiquletui，huifashengshenme？jinguanzhexieyichangqingkuangbutaikenengchuxian，danmoshishibiededaimajiangbudebukaolvsuoyoukenengdeyichangqingkuang，congerzengjiadaliangewaideguize。jishizaizhegejiandandelizizhong，ruanjianshezhideguizeyehuibiandefeichangfuza。

機器學習如何取代經典規則

AI背後的核心思想是在小範圍內模仿人類進行學習。它不依賴於製定大量的if-then規則，而是建立一個通用的模式識別的機器模型。這兩種方法的關鍵區別在於，與一套複雜的規則相比，AI不會提供明確的結果。AI不會明確報告"我在圖像中識別出了一隻貓"，而是提供類似這樣的結論："圖像中有一隻貓的概率為97.5%，它也可能是豹子(2.1%)或老虎(0.4%)。"這意味著在模式識別的過程結束時，應用的開發人員必須通過決策閾值做出決定。

另一個區別是AIbingbuyilaigudingdeguize，ershiyaojingguoxunlian。xunlianguochengxuyaojiangdaliangmaodetuxiangzhanshigeishenjingwangluoyigongqixuexi。zuizhong，shenjingwangluojiangnenggoudulishibietuxiangzhongshifouyoumao。guanjiandeyidianshi，weilaiAI可以不局限於已知的訓練圖像開展識別。該神經網絡需要映射到MCU中。

AI的模式識別內部到底是什麼？

AI的神經元網絡類似於人腦的生物神經元網絡。一個神經元有多個輸入，但隻有一個輸出。基本上，這些神經元都是輸入的線性變換——將輸入乘以數字（權重w）並加上一個常數（偏置b），然後通過一個固定的非線性函數產生輸出，該函數也被稱為激活函數1。作為網絡中唯一的非線性部分，激活函數用於定義人工神經元值的激活範圍。神經元的功能在數學上可以描述為

其中，f為激活函數，w為權重，x為輸入數據，b為偏置。數據可以是單獨的標量、向量或矩陣。圖1顯示了一個神經元，它擁有三個輸入和一個激活函數ReLU2。網絡中的神經元總是分層排列的。

圖1.擁有三個輸入和一個輸出的神經元

如上所述，CNN用於輸入數據的模式識別和對象分類。CNN分為不同的部分：一個輸入層、若幹隱藏層和一個輸出層。圖2顯示了一個小型網絡，它包含一個具有三個輸入的輸入層、一個具有五個神經元的隱藏層和一個具有四個輸出的輸出層。所有神經元的輸出都連接到下一層的所有輸入。圖2所示的網絡不具有現實意義，這裏僅用於演示說明。即使對於這個小型網絡，用於描述網絡的方程中也具有32個偏置和32個權重。

CIFAR神經網絡是一種廣泛用於圖像識別的CNN。它主要由兩種類型的層組成：juanjicenghechihuaceng，zheliangzhongcengfenbieshiyongjuanjihechihualiangzhongfangfa，zaishenjingwangluodexunlianzhongfeichangyouxiao。juanjicengshiyongyizhongbeichengweijuanjideshuxueyunsuanlaishibiexiangsuzhishuzudemoshi。juanjifashengzaiyinzangcengzhong，rutu3所示。卷積會重複多次直至達到所需的精度水平。如果要比較的兩個輸入值（本例是輸入圖像和濾波器）相(xiang)似(si)，那(na)麼(me)卷(juan)積(ji)運(yun)算(suan)的(de)輸(shu)出(chu)值(zhi)總(zong)會(hui)特(te)別(bie)高(gao)。濾(lv)波(bo)器(qi)有(you)時(shi)也(ye)被(bei)稱(cheng)為(wei)卷(juan)積(ji)核(he)。然(ran)後(hou)，結(jie)果(guo)被(bei)傳(chuan)遞(di)到(dao)池(chi)化(hua)層(ceng)提(ti)取(qu)特(te)征(zheng)生(sheng)成(cheng)一(yi)個(ge)特(te)征(zheng)圖(tu)，表(biao)征(zheng)輸(shu)入(ru)數(shu)據(ju)的(de)重(zhong)要(yao)特(te)征(zheng)，稱(cheng)為(wei)池(chi)化(hua)。池(chi)化(hua)層(ceng)的(de)運(yun)行(xing)需(xu)要(yao)依(yi)賴(lai)另(ling)一(yi)個(ge)濾(lv)波(bo)器(qi)，稱(cheng)為(wei)池(chi)化(hua)濾(lv)波(bo)器(qi)。訓(xun)練(lian)後(hou)，在(zai)網(wang)絡(luo)運(yun)行(xing)的(de)狀(zhuang)態(tai)下(xia)，特(te)征(zheng)圖(tu)與(yu)輸(shu)入(ru)數(shu)據(ju)進(jin)行(xing)比(bi)較(jiao)。由(you)於(yu)特(te)征(zheng)圖(tu)保(bao)留(liu)了(le)特(te)定(ding)的(de)特(te)征(zheng)，所(suo)以(yi)隻(zhi)有(you)當(dang)內(nei)容(rong)相(xiang)似(si)時(shi)，神(shen)經(jing)元(yuan)的(de)輸(shu)出(chu)才(cai)會(hui)被(bei)觸(chu)發(fa)。通(tong)過(guo)組(zu)合(he)使(shi)用(yong)卷(juan)積(ji)和(he)池(chi)化(hua)，CIFAR網絡可用於高精度地識別和分類圖像中的各種對象。

圖2.一個小型神經網絡

圖3.用CIFAR-10數據集訓練的CIFAR網絡模型

CIFAR-10是一個特定數據集，通常用於訓練CIFAR神經網絡。它由60000幅32×32彩色圖像組成，分為10個類別。這些圖像是從各種來源收集的，例如網頁、新聞和個人圖像集。每個類別包含6000幅圖像，平均分配在訓練集、測試集和驗證集中，使其成為測試計算機視覺和其他機器學習模型的理想圖像集。

juanjishenjingwangluoheqitaleixingwangluodezhuyaoqubiezaiyuchulishujudefangshi。juanjishenjingwangluotongguolvboyicijianzhashurushujudeshuxing。juanjicengdeshuliangyueduo，keyishibiedexijiejiuyuejingxi。zaidiyicijuanjizhihou，gaiguochengcongjiandandeduixiangshuxing（如邊或點）開始進行第二次卷積以識別詳細的結構，如角、圓、矩ju形xing等deng。在zai第di三san次ci卷juan積ji之zhi後hou，特te征zheng就jiu可ke以yi表biao示shi某mou些xie複fu雜za的de模mo式shi，它ta們men與yu圖tu像xiang中zhong對dui象xiang的de某mou些xie部bu分fen相xiang似si，並bing且qie對dui於yu給gei定ding對dui象xiang來lai說shuo通tong常chang是shi唯wei一yi的de。在zai我wo們men最zui初chu的de例li子zi中zhong，這zhe些xie特te征zheng就jiu是shi貓mao的de胡hu須xu或huo耳er朵duo。特te征zheng圖tu的de可ke視shi化hua（如圖4所示）對於應用本身而言並不是必需的，但它有助於幫助理解卷積。

即使是像CIFARzheyangdexiaoxingwangluo，meicengyeyoushubaigeshenjingyuan，bingqieyouxuduochuanxinglianjiedeceng。suizhewangluodefuzaduheguimodezengjia，suoxudequanzhonghepianzhishuliangyexunsuzengchang。tu3所示的CIFAR-10示例已經有20萬wan個ge參can數shu，每mei個ge參can數shu在zai訓xun練lian過guo程cheng中zhong都dou需xu要yao一yi組zu確que定ding的de值zhi。特te征zheng圖tu可ke以yi由you池chi化hua層ceng進jin一yi步bu處chu理li，以yi減jian少shao需xu要yao訓xun練lian的de參can數shu數shu量liang並bing保bao留liu重zhong要yao信xin息xi。

圖4.CNN的特征圖

如上所述，在CNN中的每次卷積之後，通常會發生池化，在一些文獻中也常被稱為子采樣。它有助於減少數據的維度。圖4中zhong的de特te征zheng圖tu裏li麵mian的de很hen多duo區qu域yu包bao含han很hen少shao甚shen至zhi不bu含han有you意yi義yi的de信xin息xi。這zhe是shi因yin為wei對dui象xiang隻zhi是shi圖tu像xiang的de一yi小xiao部bu分fen，並bing不bu構gou成cheng整zheng幅fu圖tu像xiang。圖tu像xiang的de其qi餘yu部bu分fen未wei在zai特te征zheng圖tu中zhong使shi用yong，因yin此ci與yu分fen類lei無wu關guan。在zai池chi化hua層ceng中zhong，池chi化hua類lei型xing（最大值池化或均值池化）hechihuachuangkoujuzhendedaxiaojunbeizhiding。zaichihuaguochengzhong，chuangkoujuzhenzhubuzaishurushujushangyidong。liru，zuidazhichihuahuixuanquchuangkouzhongdezuidashujuzhierdiuqiqitasuoyoudezhi。zheyang，shujuliangbuduanjianshao，zuizhongxingchenggegeduixiangleibiedeweiyishuxing。

juanjihechihuadejieguoshidaliangdeerweijuzhen。weileshixianwomenzhenzhengdemubiaojifenlei，womenxuyaojiangerweishujuzhuanhuanchengyigehenchangdeyiweixiangliang。zhuanhuanshizaisuoweideyapingcengzhongwanchengde，suihoushiyigehuolianggequanlianjieceng。quanlianjiecengdeshenjingyuanleisiyutu2所示的結構。神經網絡最後一層的輸出要與需要區分的類別的數量一致。此外，在最後一層中，數據還被歸一化以產生一個概率分布（97.5%的貓，2.1%的豹，0.4%的虎，等等）。

這zhe就jiu是shi神shen經jing網wang絡luo建jian模mo的de全quan過guo程cheng。然ran而er，卷juan積ji核he與yu濾lv波bo器qi的de權quan重zhong和he內nei容rong仍reng然ran未wei知zhi，必bi須xu通tong過guo網wang絡luo訓xun練lian來lai確que定ding使shi模mo型xing能neng夠gou工gong作zuo。這zhe將jiang在zai後hou續xu文wen章zhang《訓練卷積神經網絡：什麼是機器學習？——第二部分》中說明。第三部分將解釋我們上文討論過的神經網絡（例如識別貓）的硬件實現，我們將使用ADI公司開發的帶硬件CNN加速器的 MAX78000 人工智能微控製器來演示。

1 通常使用sigmoid、tanh或ReLU函數。

2 ReLU：修正線性單元。對於該函數，輸入值為負時，輸出為零；輸入值大於零時，輸出值為輸入值。

免責聲明：本文為轉載文章，轉載此文目的在於傳遞更多信息，版權歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權問題，請聯係小編進行處理。

推薦閱讀：

電能質量監測第2部分：符合標準的電能質量儀表的設計考慮因素

如何為非GEO空間應用選擇天線前端組件

如何為ATE應用創建具有拉電流和灌電流功能的雙輸出電壓軌

精密係統的實用RTI計算

如何利用超級電容設計簡單的不間斷電源

上一篇：電能質量監測第2部分：符合標準的電能質量儀表的設計考慮因素

下一篇：電能質量監測第1部分：符合標準的電能質量測量的重要性

特別推薦

技術文章更多>>

技術白皮書下載更多>>

熱門搜索

友情鏈接(QQ：317243736)

我愛方案網 ICGOO元器件商城創芯在線檢測芯片查詢天天IC網電子產品世界無線通信模塊控製工程網電子開發網電子技術應用與非網世紀電源網 21ic電子技術資料下載電源網電子發燒友網中電網中國工業電器網連接器礦山設備網工博士智慧農業工業路由器天工網乾坤芯電子元器件采購網亞馬遜KOL 聚合物鋰電池工業自動化設備企業查詢工業路由器元器件商城連接器 USB中文網今日招標網塑料機械網農業機械中國IT產經新聞網高低溫試驗箱

關閉

關閉