實例測試解讀，典型音頻係統中FIR和IIR濾波器硬件加速器的使用-RF/微波-電子元件技術網

你的位置：首頁 > RF/微波 > 正文

實例測試解讀，典型音頻係統中FIR和IIR濾波器硬件加速器的使用

發布時間：2022-05-23 來源：ADI 責任編輯：wenwei

【導讀】有限脈衝響應(FIR)和無限脈衝響應(IIR)濾波器都是常用的數字信號處理算法——尤其適用於音頻處理應用。因此，在典型的音頻係統中，處理器內核的很大一部分時間用於FIR和IIR濾波。數字信號處理器上的片內FIR和IIR硬件加速器也分別稱為FIRA和IIRA，我們可以利用這些硬件加速器來分擔FIR和IIR處chu理li任ren務wu，讓rang內nei核he去qu執zhi行xing其qi他ta處chu理li任ren務wu。在zai本ben文wen中zhong，我wo們men將jiang借jie助zhu不bu同tong的de使shi用yong模mo型xing以yi及ji實shi時shi測ce試shi示shi例li來lai探tan討tao如ru何he在zai實shi踐jian中zhong利li用yong這zhe些xie加jia速su器qi。

圖1.FIRA和IIRA係統方框圖。

圖1顯示了FIRA和IIRA的簡化方框圖，以及它們與其餘處理器係統和資源的交互方式。

● FIRA和IIRA模塊均主要包含一個計算引擎（乘累加(MAC)單元）以及一個小的本地數據和係數RAM。

● 為開始進行FIRA/IIRA處理，內核使用通道特定信息初始化處理器存儲器中的DMA傳輸控製塊(TCB)鏈。然後將該TCB鏈的起始地址寫入FIRA/IIRA鏈指針寄存器，隨後配置FIRA/IIRA控製寄存器以啟動加速器處理。一旦所有通道的配置完成，就會向內核發送一個中斷，以便內核將處理後的輸出用於後續操作。

● 從理論上講，最好的方法是將所有FIR和/或IIR任ren務wu從cong內nei核he轉zhuan移yi給gei加jia速su器qi，並bing允yun許xu內nei核he同tong時shi執zhi行xing其qi他ta操cao作zuo。但dan在zai實shi踐jian中zhong，這zhe並bing非fei始shi終zhong可ke行xing，特te別bie是shi當dang內nei核he需xu要yao使shi用yong加jia速su器qi輸shu出chu進jin一yi步bu處chu理li，並bing且qie沒mei有you其qi他ta獨du立li的de任ren務wu需xu要yao同tong時shi完wan成cheng時shi。在zai這zhe種zhong情qing況kuang下xia，我wo們men需xu要yao選xuan擇ze合he適shi的de加jia速su器qi使shi用yong模mo型xing來lai達da到dao最zui佳jia效xiao果guo。

在本文中，我們將討論針對不同應用場景充分利用這些加速器的各種模型。

實時使用FIRA和IIRA

圖2.典型實時音頻數據流。

圖2顯示了典型實時PCM音頻數據流圖。一幀數字化PCM音頻數據通過同步串行端口(SPORT)接收，並通過直接存儲器訪問(DMA)發送至存儲器。在繼續接收幀N+1時，幀N由內核和/或加速器處理，之前處理的幀(N-1)的輸出通過SPORT發送至DAC進行數模轉換。

加速器使用模型

如前所述，根據應用的不同，可能需要以不同的方式使用加速器，以最大限度分擔FIR和/或IIR處理任務，並盡可能節省內核周期以用於其他操作。從高層次角度來看，加速器使用模型可分為三類：直接替代、拆分任務和數據流水線。

直接替代

● 內核FIR和/或IIR處理直接被加速器替代，內核隻需等待加速器完成此任務。

● 此模型僅在加速器的處理速度比內核快時才有效；即，使用FIRA模塊。

拆分任務

● FIR和/或IIR處理任務在內核和加速器之間分配。

● 當多個通道可並行處理時，此模型特別有用。

● 根據粗略的時序估算，在內核和加速器之間分配通道總數，使二者大致能夠同時完成任務。

● 如圖3所示，與直接替代模型相比，此使用模型可節省更多的內核周期。

數據流水線

● 內核和加速器之間的數據流可進行流水線處理，使二者能夠在不同數據幀上並行處理。

● 如圖3所示，內核處理第N個幀，然後啟動加速器對該幀進行處理。內核隨後繼續進一步並行處理加速器在上一迭代中產生的第N-1幀的輸出。該序列允許將FIR和/或IIR處理任務完全轉移給加速器，但輸出會有一些延遲。

● 流水線級以及輸出延遲都可能會增加，具體取決於完整處理鏈中此類FIR和/或IIR處理級的數量。

圖3說明了音頻數據幀如何在不同加速器使用模型的三個階段之間傳輸——DMA IN、內核/加速器處理和DMA OUT。它還顯示了通過采用不同的加速器使用模型將FIR/IIR全部或部分處理轉移到加速器上，與僅使用內核模型相比，內核空閑周期如何增加。

圖3.加速器使用模型比較。

SHARC處理器上的FIRA和IIRA

以下ADI SHARC®處理器係列支持片內FIRA和IIRA（從舊到新）。

● ADSP-214xx (例如， ADSP-21489)

● ADSP-SC58x

● ADSP-SC57x/ADSP-2157x

● ADSP-2156x

這些處理器係列：

● 計算速度不同

● 基本編程模型保持不變，ADSP-2156x處理器上的自動配置模式(ACM)除外。

● FIRA有四個MAC單元，而IIRA隻有一個MAC單元。

ADSP-2156x的FIRA/IIRA改進

ADSP-2156x是SHARC處理器係列中的最新的產品。它是第一款單核1 GHz SHARC處理器，其FIRA和IIRA也可在1 GHz下運行。ADSP-2156x處理器上的FIRA和IIRA與其前代ADSP-SC58x/ADSP-SC57x處理器相比，具有多項改進。

性能改進

● 計算速度提高了8倍（從SCLK-125 MHz至CCLK-1 GHz）。

● 由於內核和加速器借助專用內核結構實現了更緊密的集成，因此減少了內核和加速器之間的數據和MMR訪問延遲。

功能改進

● 添加了ACM支持，以盡量減少進行加速器處理所需的內核幹預。此模式主要具有以下新特性：

● 允許加速器暫停以進行動態任務排隊。

● 無通道數限製。

● 支持觸發生成（主器件）和觸發等待（從器件）。

● 為每個通道生成選擇性中斷。

實驗結果

在本節中，我們將討論在ADSP-2156x評估板上，借助不同的加速器使用模型實施兩個實時多通道FIR/IIR用例的結果

用例1

圖4顯示用例1的方框圖。采樣率為48 kHz，模塊大小為256個采樣點，拆分任務模型中使用的內核與加速器通道比為5:7。

表1顯示測得的內核和FIRA MIPS數量，以及與僅使用內核模型相比獲得的節約內核MIPS結果。表中還顯示了相應使用模型增加的額外輸出延遲。正如我們所看到的，使用加速器配合數據流水線使用模型，可節約高達335內核MIPS，但導致1塊(5.33 ms)的輸出延遲。直接替代和拆分任務使用模型也分別可節約98 MIPS和189 MIPS，而且未導致任何額外的輸出延遲。

圖4.用例1方框圖。

表1.用例1的內核和FIR/IIRA MIPS總結

用例2

圖5顯示用例2的方框圖。采樣率為48 kHz，模塊大小為128個采樣點，拆分任務模型中使用的內核與加速器通道比為1:1。

與表1一樣，表2也顯示了此用例的結果。正如我們所看到的，使用加速器配合數據流水線使用模型，可節約高達490內核MIPS，但導致1模塊(2.67 ms)的輸出延遲。拆分任務使用模型可節約234內核MIPS，而沒有導致任何額外輸出延遲。請注意，與用例1中不同，在用例2中內核使用頻域（快速卷積）處理，而非時域處理。這就是為何處理一個通道所需的內核MIPS比FIRA MIPS少的原因，這可導致直接替代使用模型實現負的內核MIPS節約。

圖5.用例2方框圖。

表2.用例2的內核和FIR/IIRA MIPS總結

結論

在本文中，我們看到如何利用不同的加速器使用模型實現所需的MIPS和處理目標，從而將大量內核MIPS轉移到ADSP-2156x處理器上的FIRA和IIRA加速器。

免責聲明：本文為轉載文章，轉載此文目的在於傳遞更多信息，版權歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權問題，請聯係小編進行處理。

推薦閱讀：

村田專家帶你了解鋰離子電池的工作原理和特點

IGBT門極驅動到底要不要負壓

CTSD精密ADC—利用異步采樣速率轉換(ASRC)簡化數字數據接口

RF通信的數字預失真：從數學運算等式到解決方案的實現

可輕鬆實現無線供電功能的13.56MHz無線充電模塊

上一篇：村田專家帶你了解鋰離子電池的工作原理和特點

下一篇：數字隔離技術：將安全性和數據完整性貫穿始終

特別推薦

技術文章更多>>

技術白皮書下載更多>>

熱門搜索

友情鏈接(QQ：317243736)

我愛方案網 ICGOO元器件商城創芯在線檢測芯片查詢天天IC網電子產品世界無線通信模塊控製工程網電子開發網電子技術應用與非網世紀電源網 21ic電子技術資料下載電源網電子發燒友網中電網中國工業電器網連接器礦山設備網工博士智慧農業工業路由器天工網乾坤芯電子元器件采購網亞馬遜KOL 聚合物鋰電池工業自動化設備企業查詢工業路由器元器件商城連接器 USB中文網今日招標網塑料機械網農業機械中國IT產經新聞網高低溫試驗箱

關閉

關閉