下一代尖端AI係統的電源解決方案
發布時間:2021-09-02 來源:Yat Tam 責任編輯:wenwei
【導讀】人工智能(AI)綜合了多種解決問題的方法,例如數學、計算統計、機器學習和預測分析。AI係統通過基於計算機的“神經”網絡來模仿人腦學習並解決問題。這種神經網絡由並行處理器組成,能夠運行複雜的學習任務並執行軟件算法。如今的AI還在改革計算架構,以複製模仿人腦的神經網絡。盡管在具有傳統中央處理器(CPU)的服務器上也可以訓練或開發通用模型,但大多數神經網絡都需要自定義的內置硬件來進行訓練。
圖形處理單元(GPU)和張量處理單元(TPU)是用於加速神經網絡訓練的常見加速器。它們可以處理重複性和密集型計算,但卻異常耗電。例如,早期的AI市場主導者英偉達的DGX-1 GPU超級計算機內置8個Tesla P100 GPU,每個GPU算力達到21.2 TeraFLOP,總共需要3200W的係統總功率。最新一代的DGX-2超級計算機則內置16個Tesla V100 GPU,每個GPU算力達2 petaFLOP,所需係統總功率達到10kW。因此,AI市場將迅速增長以滿足不斷增長的電源需求也就不足為奇了。
電源設計挑戰
AI電(dian)源(yuan)係(xi)統(tong)設(she)計(ji)人(ren)員(yuan)麵(mian)臨(lin)多(duo)方(fang)麵(mian)的(de)挑(tiao)戰(zhan)。提(ti)供(gong)千(qian)瓦(wa)功(gong)率(lv)是(shi)他(ta)們(men)的(de)第(di)一(yi)個(ge)挑(tiao)戰(zhan),而(er)且(qie)效(xiao)率(lv)絕(jue)對(dui)至(zhi)關(guan)重(zhong)要(yao)。要(yao)知(zhi)道(dao),這(zhe)些(xie)計(ji)算(suan)係(xi)統(tong)是(shi)以(yi)全(quan)功(gong)率(lv)運(yun)行(xing)的(de)複(fu)雜(za)負(fu)載(zai)。活(huo)躍(yue)度(du)下(xia)降(jiang),功(gong)率(lv)需(xu)求(qiu)也(ye)會(hui)隨(sui)之(zhi)下(xia)降(jiang)。係(xi)統(tong)必(bi)須(xu)在(zai)整(zheng)個(ge)電(dian)力(li)需(xu)求(qiu)中(zhong)保(bao)持(chi)盡(jin)可(ke)能(neng)高(gao)的(de)效(xiao)率(lv)。浪(lang)費(fei)的(de)每(mei)一(yi)瓦(wa)能(neng)量(liang)都(dou)會(hui)作(zuo)為(wei)熱(re)量(liang)消(xiao)散(san),並(bing)轉(zhuan)化(hua)為(wei)數(shu)據(ju)中(zhong)心(xin)對(dui)散(san)熱(re)係(xi)統(tong)的(de)更(geng)高(gao)要(yao)求(qiu),這(zhe)會(hui)增(zeng)加(jia)運(yun)營(ying)成(cheng)本(ben)以(yi)及(ji)碳(tan)足(zu)跡(ji)。
空kong間jian成cheng本ben也ye在zai不bu斷duan上shang升sheng。現xian代dai數shu據ju中zhong心xin都dou包bao含han成cheng百bai上shang千qian個ge處chu理li單dan元yuan,因yin此ci設she備bei大da小xiao非fei常chang重zhong要yao。減jian小xiao單dan個ge單dan元yuan的de尺chi寸cun,就jiu可ke以yi在zai與yu大da型xing解jie決jue方fang案an相xiang同tong的de空kong間jian中zhong應ying用yong更geng多duo設she備bei,從cong而er實shi現xian更geng高gao的de處chu理li能neng力li密mi度du。然ran而er,越yue小xiao的de尺chi寸cun越yue要yao求qiu極ji大da地di提ti高gao功gong率lv密mi度du,並bing減jian小xiao散san熱re麵mian積ji。這zhe使shi得de散san熱re管guan理li成cheng為wei下xia一yi代dai尖jian端duanCPU、GPU和TPU電源設計麵臨的重大挑戰之一。
lingwai,xitongfuzaxingdezengjiaheshejizhouqideyasuoshishejiziyuangengjiajinzhang。ziyuandabufenbeifenpeigeixitongguanjianzhishichanquandekaifa,zheyiweizhedianyuanfanganxiangguandedianluchangchangbeihulve,zhidaokaifazhouqidehouqi。shijishang,womenzhixuhenshaodeshijian,bingqiekenengzhixuhenshaodedianyuanshejiziyuanjiukeyijiejueshangshudetiaozhan,dedaolixiangdezhengtidianyuanjiejuefangan,tajiangshijieshengkongjiande、高效的、可擴展的、靈活的,並且隻需要最少的設計工作。
數字控製與模擬控製解決方案
模擬控製解決方案現在已無法應對AI市場中快速增長的電源需求。現在的電源係統更加智能,它被集成到整體解決方案中,與主CPU/GPU/TPU之間的通信也成為一項設計要求。在為AI市場設計高端電源解決方案時,數字控製解決方案將占據主導。
理想的控製解決方案應當兼容多種產品(例如Intel、AMD、PMBus),並且因可擴展且配置靈活而易於使用。包括MPS在內的很多公司都提供了這類理想的高級控製器(參見表1)。它們提供了廣泛而準確的係統控製,同時提供詳細而精確的監測。電壓、電流、頻(pin)率(lv)和(he)故(gu)障(zhang)監(jian)測(ce)均(jun)可(ke)在(zai)寬(kuan)範(fan)圍(wei)內(nei)進(jin)行(xing)配(pei)置(zhi)。工(gong)程(cheng)師(shi)可(ke)以(yi)實(shi)時(shi)訪(fang)問(wen)這(zhe)些(xie)監(jian)測(ce)值(zhi),以(yi)全(quan)麵(mian)了(le)解(jie)解(jie)決(jue)方(fang)案(an)的(de)性(xing)能(neng)。有(you)經(jing)驗(yan)的(de)工(gong)程(cheng)師(shi)還(hai)可(ke)以(yi)通(tong)過(guo)預(yu)測(ce)分(fen)析(xi)來(lai)優(you)化(hua)運(yun)行(xing)時(shi)間(jian),並(bing)在(zai)需(xu)要(yao)維(wei)修(xiu)時(shi)獲(huo)取(qu)更(geng)多(duo)可(ke)用(yong)數(shu)據(ju),從(cong)而(er)最(zui)大(da)程(cheng)度(du)地(di)縮(suo)短(duan)停(ting)機(ji)時(shi)間(jian)。

表1:高級控製器vs.模擬和數字控製解決方案
功率級:集成是關鍵
顯而易見,電源解決方案沒有功率級就無法工作,而功率級通常會采用分立式解決方案。 分立式解決方案由驅動器IC和一對外部MOSFET組成,為三芯片解決方案。還有一種方法是將多芯片驅動器-MOSFET(DrMOS)共同封裝到一個ICjiejuefanganzhong。ruqiansuoshu,buduansuoxiaodexitongbanmianjishisanxinpianjiejuefanganbiandebuzailixiang,yinweitazengjialeyouxianbankongjianzhongdezujianshuliang。gongtongfengzhuangdeduoxinpianjiejuefangantijigengxiao,suoxudezujianyegengshao;不過,其封裝內部的寄生電感仍然很高,這會導致效率的損失,對AI等大功率應用而言也不理想。

圖1:功率級的常用實現方法
與傳統的分立式和多芯片解決方案不同,MPS提供了一種單片功率級解決方案。其功率級具有低靜態電流、同步降壓柵極驅動器以及單個芯片上的一對上管和下管MOSFET。通過將所有關鍵元件集成在一個封裝中,可以輕鬆控製驅動器/MOSFET,並最大程度地減少開關節點處的振鈴。另外,封裝和板級之間的寄生電感也被大大降低。這種設計可以實現最先進的CPU/GPU/TPU設計所需的低輸出電壓下更高的效率。
單片功率級隻需最少數量的外部組件,因此簡化了原理圖以及PCB布局。其基本設計可以分兩步完成:
1. 選擇適當數量的輸入和輸出電容器以滿足電壓和電流紋波要求;
2. 選擇一個電感器以滿足總負載電流需求。

圖2:傳統解決方案與高級解決方案的比較
這種器件的典型功率級可在各種溫度下的全負載範圍內實現出色的電流檢測精度(±2%) ,並以高達3MHz的開關頻率工作(見圖2)。在極其寶貴的空間內還可以同時提供各種可配置的故障保護功能,如過流保護(OCP)、相位故障檢測和IC溫度報告,為設計人員提供了一種小而強大的解決方案,還不會影響效率或瞬態響應。
結論
當今的AI係統都是通過多個高性能計算機係統來實現的,它在很多方麵都對電源設計人員提出了挑戰。傳統的數據中心設計正迅速從通用的僅CPU解決方案演化為CPU、GPU和TPU的組合方案,這對電源設計解決方案提出了新的、更嚴格的要求。數字控製器及其功率級解決方案帶來了靈活性和適應性,以及精確的控製、遙測和保護功能。 它使電源設計人員能夠創建具有高效率和高功率密度的最新電源解決方案,可以滿足快速增長的AI市場當前與未來的高功率需求。
免責聲明:本文為轉載文章,轉載此文目的在於傳遞更多信息,版權歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權問題,請聯係小編進行處理。
推薦閱讀:
特別推薦
- 噪聲中提取真值!瑞盟科技推出MSA2240電流檢測芯片賦能多元高端測量場景
- 10MHz高頻運行!氮矽科技發布集成驅動GaN芯片,助力電源能效再攀新高
- 失真度僅0.002%!力芯微推出超低內阻、超低失真4PST模擬開關
- 一“芯”雙電!聖邦微電子發布雙輸出電源芯片,簡化AFE與音頻設計
- 一機適配萬端:金升陽推出1200W可編程電源,賦能高端裝備製造
技術文章更多>>
- 築基AI4S:摩爾線程全功能GPU加速中國生命科學自主生態
- 一秒檢測,成本降至萬分之一,光引科技把幾十萬的台式光譜儀“搬”到了手腕上
- AI服務器電源機櫃Power Rack HVDC MW級測試方案
- 突破工藝邊界,奎芯科技LPDDR5X IP矽驗證通過,速率達9600Mbps
- 通過直接、準確、自動測量超低範圍的氯殘留來推動反滲透膜保護
技術白皮書下載更多>>
- 車規與基於V2X的車輛協同主動避撞技術展望
- 數字隔離助力新能源汽車安全隔離的新挑戰
- 汽車模塊拋負載的解決方案
- 車用連接器的安全創新應用
- Melexis Actuators Business Unit
- Position / Current Sensors - Triaxis Hall
熱門搜索



