人工智能芯片的DNA
發布時間:2018-10-16 責任編輯:lina
【導讀】過去十年間,幾項技術的進步使人工智能 (AI)成為最令人振奮的技術之一。2012年,Geoffrey Everest Hinton在Imagenet挑戰賽中展示了他的廣義反向傳播神經網絡算法,該算法使計算機視覺領域發生了革命性變化。然而,機器學習理論早在2012年之前就有人提出,並且Nvidia GTX 580圖形處理器單元等微處理器使這一理論得以實現。
過去十年間,幾項技術的進步使人工智能 (AI)成為最令人振奮的技術之一。2012年,Geoffrey Everest Hinton在Imagenet挑戰賽中展示了他的廣義反向傳播神經網絡算法,該算法使計算機視覺領域發生了革命性變化。然而,機器學習理論早在2012年之前就有人提出,並且Nvidia GTX 580圖形處理器單元等微處理器使這一理論得以實現。這些處理器具有相對較高的內存帶寬能力且擅長矩陣乘法,可將該神經網絡模型的AI訓練時間縮短至大約一周。理論與算法的結合開啟了新一代技術進步,帶來了與AI相關的全新可能性。本文概述了人工智能設計新時代及其多樣化處理、內存和連接需求。
人工智能剖析
我們將神經網絡定義為深度學習,它是機器學習及人工智能的一個子集,如圖1所示。這是一個重要的分類,深度學習該子集改變了芯片係統架構設計。

圖1:人工智能采用深度學習算法模仿人類行為
深度學習不僅改變了芯片架構,而且催生了半導體市場的新一輪投資。深度學習算法模型是研發和商業投資的熱點,例如卷積神經網絡 (CNN)。CNN一直是機器視覺的主要焦點。遞歸神經網絡等模型因其識別時間的能力而在自然語言理解中得以應用。
人工智能的應用
深度學習神經網絡應用於許多不同的場景,為使用它們的人提供了強大的新工具。例如,它們可以支持高級安全威脅分析、預測和防止安全漏洞,並通過預測潛在買家的購物流程來幫助廣告商識別和精簡銷售流程。
但AI設計並未局限於數據中心,諸如用於物件和人臉識別的視覺係統、用於改進人機接口的自然語言理解以及周圍環境感知等許多新功能可基於傳感器輸入的組合而使機器理解正在發生的活動。這些深度學習能力已融入到不同場景所需的芯片設計中,包括智能汽車、數字家庭、數據中心和物聯網 (IoT),如圖2所示。

圖2:AI處理能力已結合到大量應用中
手機利用神經網絡實現上述多種AI功能。手機可運行人臉識別應用、物件識別應用、自然語言理解應用。此外,它在內部使用神經網絡進行5G自組織,因為無線信號在其他介質、不同的光譜上會變得更密集,並且所傳輸的數據有不同的優先級。
人類大腦
最zui近jin,深shen度du學xue習xi通tong過guo數shu學xue和he半ban導dao體ti硬ying件jian的de進jin步bu變bian得de可ke行xing。業ye界jie已yi開kai展zhan多duo項xiang舉ju措cuo,在zai下xia一yi代dai數shu學xue模mo型xing和he半ban導dao體ti架jia構gou中zhong更geng好hao地di複fu製zhi人ren腦nao,這zhe通tong常chang被bei稱cheng為wei神shen經jing形xing態tai計ji算suan。人ren類lei的de大da腦nao可ke以yi達da到dao難nan以yi置zhi信xin的de高gao效xiao率lv,但dan技ji術shu在zai複fu製zhi人ren類lei大da腦nao等deng方fang麵mian才cai剛gang開kai始shi觸chu及ji皮pi毛mao。人ren類lei大da腦nao包bao含han超chao過guo1 PB (Petabyte=1024TB)的存儲空間,相當於大約540萬億個晶體管,且功率小於12瓦。從這點來說,複製大腦是一個長遠的目標。然而,ImageNet挑戰賽已從2012年的第一個反向傳播CNN算法發展到2015年更高級的AI模型ResNet 152,市場正在快速發展,新的算法層出不窮。
AI設計挑戰
融合深度學習能力的芯片架構促使了多項關鍵技術的進步,從而達到高度集成的解決方案和更通用的AI 芯片,包含專用處理需求、創新內存架構和實時數據連接。
專用處理需求
融合神經網絡能力的芯片必須同時適應異構和大規模並行矩陣乘法運算。異構組件需要標量、矢量DSP和神經網絡算法能力。例如,機器視覺需要獨立的步驟,每一步都需要執行不同類型的處理,如圖3所示。

圖3:神經網絡能力需要獨特的處理
預處理需要更簡單的數據級並行性。對所選區域的精確處理需要更複雜的數據級並行性,可以通過具有良好矩陣乘法運算能力的專用CNNjiasuqiyouxiaodichuli。juecejieduantongchangkeyitongguobiaoliangchulidefangshilaichuli。meigeyingyongdoushiduyiwuerde,danhenmingxiandeshi,baokuoshenjingwangluosuanfajiasudeyigouchulijiejuefanganxuyaoyouxiaodichuliAI模型。
創新內存架構
AI模型使用大量內存,這增加了芯片的成本。訓練神經網絡要求達到幾GB甚至10GB的數據,這就需要使用DDR最新技術,以滿足容量要求,例如,作為圖像神經網絡的VGG-16在訓練時需要大約9GB的內存;更精確的模型VGG-512需要89GB的數據才能進行訓練。為了提高AImoxingdezhunquexing,shujukexuejiashiyonglegengdadeshujuji。tongyang,zhehuizengjiaxunlianmoxingsuoxudeshijianhuozengjiajiejuefangandeneicunxuqiu。youyuxuyaodaguimobingxingjuzhenchengfayunsuanyijimoxingdedaxiaohesuoxuxishudeshuliang,zhejiuyaoqiupeibeijuyougaodaikuancunqunenglidewaibucunchuqijixindebandaotijiekouIP,如高帶寬存儲器 (HBM2)和衍生產品 (HBM2e)。先進的FinFET技術支持更大的芯片SRAM陣(zhen)列(lie)和(he)獨(du)特(te)的(de)配(pei)置(zhi),具(ju)有(you)定(ding)製(zhi)的(de)存(cun)儲(chu)器(qi)到(dao)處(chu)理(li)器(qi)和(he)存(cun)儲(chu)器(qi)到(dao)存(cun)儲(chu)器(qi)接(jie)口(kou),這(zhe)些(xie)技(ji)術(shu)正(zheng)在(zai)開(kai)發(fa)中(zhong),為(wei)了(le)更(geng)好(hao)地(di)複(fu)製(zhi)人(ren)腦(nao)並(bing)消(xiao)除(chu)存(cun)儲(chu)器(qi)的(de)約(yue)束(shu)。
AI模型可以壓縮,確保模型在位於手機、汽(qi)車(che)和(he)物(wu)聯(lian)網(wang)應(ying)用(yong)邊(bian)緣(yuan)的(de)芯(xin)片(pian)中(zhong)受(shou)限(xian)的(de)存(cun)儲(chu)器(qi)架(jia)構(gou)上(shang)運(yun)行(xing)所(suo)必(bi)需(xu)的(de)。壓(ya)縮(suo)采(cai)用(yong)剪(jian)枝(zhi)和(he)量(liang)化(hua)技(ji)術(shu)進(jin)行(xing)且(qie)不(bu)能(neng)降(jiang)低(di)結(jie)果(guo)的(de)準(zhun)確(que)性(xing),這(zhe)就(jiu)要(yao)求(qiu)傳(chuan)統(tong)芯(xin)片(pian)架(jia)構(gou)(具有LPDDR或在某些情況下沒有外部存儲器)支(zhi)持(chi)神(shen)經(jing)網(wang)絡(luo)。隨(sui)著(zhe)這(zhe)些(xie)模(mo)型(xing)的(de)壓(ya)縮(suo),不(bu)規(gui)則(ze)的(de)存(cun)儲(chu)器(qi)存(cun)取(qu)和(he)計(ji)算(suan)強(qiang)度(du)增(zeng)加(jia),延(yan)長(chang)了(le)係(xi)統(tong)的(de)執(zhi)行(xing)時(shi)間(jian)。因(yin)此(ci),係(xi)統(tong)設(she)計(ji)人(ren)員(yuan)正(zheng)在(zai)開(kai)發(fa)創(chuang)新(xin)的(de)異(yi)構(gou)存(cun)儲(chu)器(qi)架(jia)構(gou)。
實時數據連接
一旦AI模型經過訓練並可能被壓縮,就可以通過許多不同的接口IP解決方案執行實時數據。例如,視覺應用由CMOS圖像傳感器支持,並通過MIPI攝像頭串行接口 (CSI-2)和MIPI D-PHY IP連接。LiDAR和雷達可通過多種技術支持,包括PCI Express和MIPI。麥克風通過USB、脈衝密度調製 (PDM) 和I2S等連接傳輸語音數據。數字電視支持HDMI和DisplayPort連lian接jie,以yi傳chuan輸shu視shi頻pin內nei容rong,而er這zhe些xie內nei容rong可ke通tong過guo神shen經jing網wang絡luo傳chuan輸shu後hou得de到dao改gai善shan,實shi現xian超chao高gao圖tu像xiang分fen辨bian率lv,從cong而er以yi更geng少shao的de數shu據ju生sheng成cheng更geng高gao質zhi量liang的de圖tu像xiang。目mu前qian,大da多duo數shu電dian視shi製zhi造zao商shang正zheng在zai考kao慮lv部bu署shu這zhe項xiang技ji術shu。
混合AI係統是另一個預計會大量采用的概念。例如,心率算法通過健身帶上的AI係統可以識別異常,通過將信息發送到雲端,對異常進行更準確的深入AI神shen經jing網wang絡luo分fen析xi,並bing加jia以yi提ti示shi。這zhe類lei技ji術shu已yi經jing成cheng功gong地di應ying用yong於yu電dian網wang負fu載zai的de平ping衡heng,特te別bie是shi在zai電dian線xian中zhong斷duan或huo出chu現xian意yi外wai重zhong負fu荷he的de情qing況kuang下xia。為wei了le支zhi持chi快kuai速su、可靠的網絡與雲端連接,上述示例中的聚合器需要以太網連接。
消除瓶頸
jinguanfuzhirenleidanaohaiyouhenchangdeluyaozou,danrenleidanaoyibeiyongzuogoujianrengongzhinengxitongdeyouxiaomoxing,bingjixuyouquanqiulingxiandeyanjiujigoulaijianmo。zuixindeshenjingwangluoshitufuzhixiaolvhejisuannengli,xinpianjiagouyekaishitongguojinmiouhechuliqiheneicunlaifuzhirenleidanao。ARC子係統包括AI及其APEX擴展和普遍存在的RISC架構所需的處理能力。子係統將外設和存儲器緊密耦合到處理器,以消除關鍵的存儲器瓶頸問題。
用於AI的DesignWare IP
AI是最令人振奮的技術之一,特別是深度學習神經網絡,通過結合神經網絡算法的創新以及高帶寬、高性能半導體設計的創新而飛速發展。
新思科技正在與世界各地細分市場中領先的AI 芯片供應商合作,提供采用經過驗證的可靠IP解決方案,幫助他們降低芯片設計風險,加快產品上市速度,並為AI設計人員帶來關鍵的差異化優勢。
專用處理需求、創新內存架構和實時數據連接構成了人工智能芯片的DNA,麵對AI設計挑戰,新思科技提供了許多專業處理解決方案來消除存儲器瓶頸,包括存儲器接口IP、帶有TCAM和多端口存儲器的芯片SRAM編譯器等,同時提供了全麵的實時數據連接選項。這些IP解決方案是下一代AI設計的關鍵組件。
特別推薦
- 噪聲中提取真值!瑞盟科技推出MSA2240電流檢測芯片賦能多元高端測量場景
- 10MHz高頻運行!氮矽科技發布集成驅動GaN芯片,助力電源能效再攀新高
- 失真度僅0.002%!力芯微推出超低內阻、超低失真4PST模擬開關
- 一“芯”雙電!聖邦微電子發布雙輸出電源芯片,簡化AFE與音頻設計
- 一機適配萬端:金升陽推出1200W可編程電源,賦能高端裝備製造
技術文章更多>>
- 一秒檢測,成本降至萬分之一,光引科技把幾十萬的台式光譜儀“搬”到了手腕上
- AI服務器電源機櫃Power Rack HVDC MW級測試方案
- 突破工藝邊界,奎芯科技LPDDR5X IP矽驗證通過,速率達9600Mbps
- 通過直接、準確、自動測量超低範圍的氯殘留來推動反滲透膜保護
- 從技術研發到規模量產:恩智浦第三代成像雷達平台,賦能下一代自動駕駛!
技術白皮書下載更多>>
- 車規與基於V2X的車輛協同主動避撞技術展望
- 數字隔離助力新能源汽車安全隔離的新挑戰
- 汽車模塊拋負載的解決方案
- 車用連接器的安全創新應用
- Melexis Actuators Business Unit
- Position / Current Sensors - Triaxis Hall
熱門搜索




