解析峰值電流控製在高端顯卡設計的應用方案
發布時間:2015-07-17 責任編輯:echolady
【導讀】benwenjiexifengzhidianliukongzhizaigaoduanxiankashejideyingyongfangan,shouxianfenxilexitongyichangzhuangkuangdeyuanyin,xiangxijieshaolefengzhidianliukongzhijishu,bingqiezaishejiguochengzhongshixianleGPU工作電流感應的硬件電路。
超大規模高性能並行圖像處理器常常集成了數十億計的晶體管,工作頻率達GHz以上。這樣當處理複雜圖像應用程序時,GPU將在微秒時間內急劇上升到數百瓦功耗,這對電源分布係統(PDS)將產生巨大的衝擊,導致GPU芯片電壓不足,從而出現係統功能異常。
係統異常的原因分析
● GPU中CMOS工藝的要求:
為了降低功耗,GPU芯片工作電壓較低,並允許在寬的範圍工作,如0.7V-1.2V。電壓越高時,內部開關MOS管的Vgs越高,MOS管導通電阻越小,因而傳輸時間常數減少,工作頻率提高;當電壓過低時,MOS管將無法形成正常導電溝道,引起邏輯錯誤。因次,一個電壓相對穩定的電源供應係統(PDS)是係統正常工作的前提。
● GPU動態工作模式的需求:
高性能GPU采用了很多先進功率控製技術,使得最大功耗達到幾百瓦,而待機功耗約幾瓦,動態性能模式切換(DPM)便是其中技術之一。通常DPM時鍾頻率設置在100MHz-1000MHz範圍,電壓在0.7V-1.2V之間。如圖1所示,GPU可在不同DPM狀態切換,當GPU處理負載加重時,將快速轉換到高性能模式,如HCLK1-HCLK4,電壓V3,而如果電壓不足,內部電路將不能維持這個模式,而引起係統故障。

圖1 GPU動態工作模式
● PDS性能限製
開關電源本身性能的限製。開關電源供電能力強,體積小,成本便宜,帶有OCP、OVP保護功能。但是開關電源周期性地打開和關閉MOS管,會產生很大的電源紋波和噪聲。
電源分布網絡參數限製。它是指從電源至負載的所有電氣分布參數的總和,即線路的R、L、C、G的整體效應,來源於PCB材料、層疊、印製線、過孔、屏蔽以及GPU封裝以及內部矽電路設計。所有這些分布參數,會在電路中產生分壓、分流以及反射、衰減損耗等多種影響。
對GPU負載而言,交流高頻信號來源於負載的動態切換引起的電流瞬態變化,加之電源分布網絡中的阻抗不連續,而在LC分布網絡中產生高頻噪聲信號。對大電流(如200A以上)的GPU來說,電壓跌落達數百毫伏,超出DPM設置範圍。
峰值電流控製技術
GPU瞬態電流變化過大,必然造成供電網絡損耗增大,GPU可獲得電壓降低。為了避開電壓跌落造成的衝擊,GPU須及時向下切換動態模式,降低時鍾頻率,降低工作電壓。峰值電流控製技術正是基於這個目的所設計的,它還需要軟件一起協作。圖2所示是峰值電流控製技術軟件流程圖。係統通過及時檢測工作電流變化,可快速調整工作狀態,減少芯片功耗,避免係統死機。

圖2 峰值電流控製技術軟件流程圖
[page] GPU工作電流感應的硬件電路實現
如圖3所示,為了對GPU瞬間大電流變化做出及時反應,電流檢測由硬件電路完成。當GPU動(dong)態(tai)電(dian)流(liu)超(chao)過(guo)預(yu)定(ding)閾(yu)值(zhi)時(shi),硬(ying)件(jian)電(dian)路(lu)會(hui)產(chan)生(sheng)一(yi)個(ge)邏(luo)輯(ji)信(xin)號(hao)通(tong)知(zhi)軟(ruan)件(jian)單(dan)元(yuan)。本(ben)技(ji)術(shu)巧(qiao)妙(miao)地(di)利(li)用(yong)電(dian)源(yuan)網(wang)絡(luo)分(fen)布(bu)電(dian)阻(zu)來(lai)感(gan)應(ying)在(zai)線(xian)路(lu)中(zhong)損(sun)耗(hao)而(er)產(chan)生(sheng)的(de)電(dian)壓(ya)降(jiang)。我(wo)們(men)取(qu)電(dian)源(yuan)輸(shu)出(chu)端(duan)A點和負載端B點作為電流放大器的輸入。當A、B點壓降過大時,GPU消耗的電流過大,電壓比較器輸出一個高電平通知軟件及時調整GPU動態模式,降低頻率和電壓,從而保證GPU及電源均能夠正常工作,避免死機。

圖3 GPU電流感應的硬件實現框圖
測試結果
該方案已經應用到某型號GPU產品上,經過調試及性能測試,取得了滿意的效果。圖4是GPU芯片電流瞬間變化時用示波器所測試得到的波形圖。

圖4 峰值電流控製技術波形圖
圖4所示中,通道1為預設電流閾值(約47.7A);通道2為實際A、B點壓降,除以0.1ohm(線路分布阻抗)後表示最大電流約為55.2A;通道3為遲滯比較器輸出;通道4為GPU管腳電壓波形。當電流超過閾值時,遲滯比較器被觸發,產生高電平中斷信號。軟件開始切換動態工作模式,設置GPU電壓VLOAD降低約100mV。當電流減小並小於閾值時,比較器輸出低電平,係統回歸正常並繼續監測。結語
由上分析及測試結果可知,峰值電流控製技術是一種能夠合理分配GPU負載,避免係統意外死機的很好的控製機製,可顯著提高係統的穩定性和可靠性,可在高性能計算、圖形處理芯片設計等領域投入實際應用。
相關閱讀:
峰值電流控製的非隔離負電壓DC/DC開關電源設計
直擊boost升壓電路負載能力及峰值【原創】
探究:反激變壓器峰值感量方式的三種計算分析
特別推薦
- 噪聲中提取真值!瑞盟科技推出MSA2240電流檢測芯片賦能多元高端測量場景
- 10MHz高頻運行!氮矽科技發布集成驅動GaN芯片,助力電源能效再攀新高
- 失真度僅0.002%!力芯微推出超低內阻、超低失真4PST模擬開關
- 一“芯”雙電!聖邦微電子發布雙輸出電源芯片,簡化AFE與音頻設計
- 一機適配萬端:金升陽推出1200W可編程電源,賦能高端裝備製造
技術文章更多>>
- 貿澤EIT係列新一期,探索AI如何重塑日常科技與用戶體驗
- 算力爆發遇上電源革新,大聯大世平集團攜手晶豐明源線上研討會解鎖應用落地
- 創新不止,創芯不已:第六屆ICDIA創芯展8月南京盛大啟幕!
- AI時代,為什麼存儲基礎設施的可靠性決定數據中心的經濟效益
- 矽典微ONELAB開發係列:為毫米波算法開發者打造的全棧工具鏈
技術白皮書下載更多>>
- 車規與基於V2X的車輛協同主動避撞技術展望
- 數字隔離助力新能源汽車安全隔離的新挑戰
- 汽車模塊拋負載的解決方案
- 車用連接器的安全創新應用
- Melexis Actuators Business Unit
- Position / Current Sensors - Triaxis Hall
熱門搜索
Future
GFIVE
GPS
GPU
Harting
HDMI
HDMI連接器
HD監控
HID燈
I/O處理器
IC
IC插座
IDT
IGBT
in-cell
Intersil
IP監控
iWatt
Keithley
Kemet
Knowles
Lattice
LCD
LCD模組
LCR測試儀
lc振蕩器
Lecroy
LED
LED保護元件
LED背光




