從業20年工程師講述軟錯誤是怎麼損壞存儲器中信息的?
發布時間:2015-06-16 責任編輯:echolady
【導讀】本文由從業20年(nian)工(gong)程(cheng)師(shi)傾(qing)情(qing)講(jiang)述(shu)軟(ruan)錯(cuo)誤(wu)是(shi)如(ru)何(he)發(fa)生(sheng),如(ru)何(he)破(po)壞(huai)半(ban)導(dao)體(ti)存(cun)儲(chu)器(qi)中(zhong)的(de)重(zhong)要(yao)信(xin)息(xi)。有(you)此(ci)問(wen)題(ti)引(yin)出(chu)軟(ruan)錯(cuo)誤(wu)的(de)來(lai)源(yuan)及(ji)其(qi)發(fa)生(sheng)概(gai)率(lv)問(wen)題(ti)。軟(ruan)錯(cuo)誤(wu)影(ying)響(xiang)著(zhe)存(cun)儲(chu)單(dan)元(yuan)中(zhong)的(de)每(mei)個(ge)存(cun)儲(chu)位(wei),改(gai)變(bian)它(ta)們(men)的(de)狀(zhuang)態(tai)。但(dan)是(shi)存(cun)儲(chu)器(qi)中(zhong)的(de)片(pian)上(shang)糾(jiu)錯(cuo)碼(ma)卻(que)可(ke)以(yi)消(xiao)減(jian)軟(ruan)錯(cuo)誤(wu)的(de)影(ying)響(xiang)。
近年來,半導體技術取得了巨大進步,但這種進步也帶來了新的問題。當今的CMOSgongyiyisuozhihenxiaodechicun,yizhiyudiwaifushehexinpianfengzhuangzhengdaozhiyuelaiyueduodeguzhang。youyuzhexieguzhangshikenide,tamenbeichengweiruancuowu。ruancuowushoucichuxianyu1978年,由於受鈾汙染的封裝模塊,英特爾公司無法向AT&T交付其生產的芯片。20世紀70年代,軟錯誤主要與動態RAM(DRAM)有關,這是因為它們的芯片封裝材料含有微量的放射性汙染物。
軟錯誤是指高能粒子與矽元素之間的相互作用而在半導體中造成的隨機、臨時的狀態改變或瞬變。但與硬錯誤不同的是,一個簡單的複位/重寫操作可以恢複受影響器件的正常運行。數字和模擬電路、chuanshuxianluhecicunchuqizhongdoukenengfashengruancuowu,danbandaoticunchuqizuiyichuxianruancuowu,qiyuanyinshitamendedanyuanchicunjiaoda,erqiemeigeweibaochimouzhongzhuangtaideshijianjiaochang(因此增加了風險)。 軟ruan錯cuo誤wu有you可ke能neng翻fan轉zhuan一yi個ge或huo多duo個ge位wei,這zhe取qu決jue於yu誘you發fa粒li子zi到dao達da器qi件jian時shi的de能neng量liang。一yi個ge高gao能neng粒li子zi與yu半ban導dao體ti襯chen底di之zhi間jian的de相xiang互hu作zuo用yong將jiang產chan生sheng多duo個ge電dian子zi空kong穴xue對dui。它ta們men在zai耗hao盡jin區qu中zhong產chan生sheng的de電dian場chang將jiang導dao致zhi一yi次ci電dian荷he漂piao移yi,從cong而er導dao致zhi電dian流liu擾rao動dong。如ru果guo這zhe個ge電dian流liu移yi動dong的de電dian荷he跨kua越yue了le存cun儲chu單dan元yuan(每個單元存儲一個位)的臨界電荷,所存儲的數據就有可能翻轉,從而導致下一次被讀取時出現錯誤。
軟錯誤分為兩級-芯片級和係統級。當芯片中的放射性原子衰變並釋放出阿爾法粒子時,芯片級軟錯誤將發生。它們通常是由高能粒子的輻射導致的(在下文中解釋)。zhexieeerfaliziyumougecunchudanyuanpengzhuang,congerdaozhiqigaibianzhuangtai。dangsuochuanshudeshujuyudaozaoshengshi,xitongjiruanxingcuowujiangfasheng。zhezhongcuowutongchangzaishujuweiyuzongxianerfeicunchuqizhongshifasheng。kongzhiqijiangzaoshengjieduweishuju。zhegecuowushujuzuizhongbeishiweizhengqueshuju,congerdaozhixunzhihuochulicuowu。
用於衡量軟錯誤發生率的軟錯誤率(SER)決jue定ding了le器qi件jian因yin高gao能neng粒li子zi發fa生sheng故gu障zhang的de概gai率lv。由you於yu軟ruan錯cuo誤wu是shi隨sui機ji的de,軟ruan錯cuo誤wu的de發fa生sheng並bing不bu決jue定ding存cun儲chu器qi的de可ke靠kao性xing,而er是shi決jue定ding其qi故gu障zhang率lv。在zai那na些xie采cai用yong了le軟ruan錯cuo誤wu應ying對dui機ji製zhi的de係xi統tong中zhong(主要是高安全性和高可靠性係統),如果一個軟錯誤(被稱為“所檢測到的不可恢複的錯誤”-DUE)被檢測到,係統將重啟,以避免損壞重要數據。如果未重啟,它最終將成為一次無記載數據損壞(SDC)。SDC要比DUE危險得多,因為SDC會導致數據丟失,而DUE隻會導致係統在短時間內不可用。在大量的消費電子設備中,軟錯誤的風險並不很大,它們更可能因軟件錯誤或部件損耗發生故障。
軟錯誤的發生概率取決於眾多因素,如入射粒子、撞擊區域和電路設計等。電容和電壓更高的電路更不容易出現軟錯誤, 但dan這zhe會hui招zhao致zhi更geng慢man的de邏luo輯ji門men和he更geng高gao的de功gong耗hao。因yin此ci,隨sui著zhe芯xin片pian工gong藝yi的de不bu斷duan進jin步bu,軟ruan錯cuo誤wu的de發fa生sheng概gai率lv也ye越yue來lai越yue大da。電dian容rong和he電dian壓ya的de組zu合he被bei稱cheng為wei臨lin界jie電dian荷he(Qcrit)。它被定義為一次粒子撞擊導致電路發生故障所必需擁有的電荷。由於邏輯電路中的每個節點都有其獨特的電容和輸出距離,因此,Qcrit通常以節點為單位測量。此外還必須注意,Qcrit 會隨溫度緩慢變化。
電路軟錯誤 = k X 通量 X 麵積 X e-Qcrit/Qcoil
其中,k = 取決於具體工藝的常數
通量 =中子通量
麵積 = 對軟錯誤敏感的電路麵積
Qcoll = 所采集電荷與所生成電荷的比率
該模型被稱為中子誘發型電路軟錯誤的Hazucha & Svensson模型。
導致軟錯誤的原因
阿爾法粒子
阿爾法粒子由兩個質子和兩個中子組成,類似於一個氦核。它們由放射性原子核在阿爾法衰變過程中釋放。 阿爾法粒子擁有數個MeV的de動dong能neng,低di於yu中zhong子zi。阿e爾er法fa粒li子zi擁yong有you一yi個ge致zhi密mi的de電dian荷he層ceng,在zai穿chuan過guo半ban導dao體ti襯chen底di時shi將jiang產chan生sheng多duo個ge電dian子zi空kong穴xue對dui。如ru果guo這zhe種zhong擾rao動dong足zu夠gou強qiang,它ta就jiu有you可ke能neng翻fan轉zhuan某mou個ge位wei。由you於yu這zhe種zhong情qing況kuang通tong常chang隻zhi會hui持chi續xu幾ji分fen之zhi一yi納na秒miao,因yin此ci很hen難nan被bei檢jian測ce出chu。
芯片被封裝在含有微量放射性汙染物的材料,如錫球或加工材料中。塑封材料、封裝和其它裝配材料中的微量鈾- 238、鈾- 232的放射性衰變會產生低能阿爾法粒子。然而,我們幾乎不可能維持實現大多數電路的可靠性能所需的理想材料純度(小於0.001次/小時/平方厘米)。微量的環氧樹脂可為芯片屏蔽阿爾法輻射,從而降低軟錯誤的發生概率。
[page]
宇宙射線
製zhi造zao商shang已yi設she法fa控kong製zhi了le釋shi放fang阿e爾er法fa粒li子zi的de汙wu染ran物wu,但dan他ta們men卻que無wu法fa抗kang擊ji宇yu宙zhou輻fu射she。事shi實shi上shang,在zai現xian代dai半ban導dao體ti器qi件jian中zhong,宇yu宙zhou射she線xian是shi最zui可ke能neng導dao致zhi軟ruan錯cuo誤wu的de原yuan因yin。宇yu宙zhou射she線xian中zhong的de主zhu要yao粒li子zi通tong常chang不bu能neng抵di達da地di球qiu表biao麵mian,但dan它ta們men會hui產chan生sheng一yi串chuan高gao能neng次ci級ji粒li子zi,其qi中zhong大da多duo數shu是shi高gao能neng中zhong子zi。中zhong子zi不bu帶dai電dian荷he,因yin此ci不bu會hui導dao致zhi軟ruan錯cuo誤wu,但dan卻que能neng被bei芯xin片pian中zhong的de原yuan子zi核he俘fu獲huo,從cong而er生sheng成cheng阿e爾er法fa粒li子zi,繼ji而er導dao致zhi軟ruan錯cuo誤wu。中zhong子zi所suo經jing曆li的de衰shuai減jian很hen小xiao,可ke穿chuan透tou厚hou達da5英寸的混凝土。
由於大氣屏蔽效應隨著海拔的升高而減弱,宇宙輻射將隨之增加。因此,飛機和衛星中的存儲器模塊極(ji)易(yi)出(chu)現(xian)軟(ruan)錯(cuo)誤(wu),軟(ruan)錯(cuo)誤(wu)率(lv)是(shi)地(di)麵(mian)模(mo)塊(kuai)的(de)數(shu)百(bai)倍(bei)甚(shen)至(zhi)數(shu)千(qian)倍(bei)。此(ci)外(wai),由(you)於(yu)上(shang)述(shu)大(da)氣(qi)屏(ping)蔽(bi)效(xiao)應(ying)的(de)減(jian)弱(ruo),位(wei)於(yu)極(ji)地(di)的(de)存(cun)儲(chu)模(mo)塊(kuai)也(ye)極(ji)易(yi)出(chu)現(xian)軟(ruan)錯(cuo)誤(wu)。為(wei)減(jian)少(shao)軟(ruan)錯(cuo)誤(wu),高(gao)風(feng)險(xian)應(ying)用(yong)中(zhong)所(suo)使(shi)用(yong)的(de)模(mo)塊(kuai)需(xu)要(yao)經(jing)過(guo)一(yi)個(ge)名(ming)為(wei)輻(fu)射(she)硬(ying)化(hua)的(de)工(gong)藝(yi)。盡(jin)管(guan)如(ru)此(ci),由(you)於(yu)生(sheng)產(chan)輻(fu)射(she)硬(ying)化(hua)芯(xin)片(pian)需(xu)要(yao)大(da)量(liang)測(ce)試(shi)(和時間),它們一般都屬於舊的工藝節點。
熱中子
由於存在中子俘獲反應,欠缺動能的中子是軟錯誤的一個重要來源。(硼磷矽玻璃介電層中大量存在的)硼同位素(10B)原子核俘獲一個熱中子後將釋放一個阿爾法粒子、liyuanzihehejiamashexian。eerfaliziheliyuanzihedounengdaozhiruancuowu。pengzaishengchanzhongbeiyongyujiangdibolideronghuawendu,yincijubeigenghaodehuiliuhezhengpingtexing。
在重要設計中,貧硼(隻含11B)可用於降低軟錯誤率,通過使用磷矽玻璃(PSG)氧化層替代硼磷矽玻璃(BPSG)來lai實shi現xian。貧pin硼peng對dui於yu腫zhong瘤liu放fang射she治zhi療liao中zhong使shi用yong的de醫yi療liao電dian子zi設she備bei尤you其qi重zhong要yao。中zhong子zi和he治zhi療liao中zhong使shi用yong的de光guang子zi束shu相xiang結jie合he將jiang形xing成cheng一yi個ge熱re中zhong子zi通tong量liang,從cong而er導dao致zhi極ji高gao的de軟ruan錯cuo誤wu率lv。盡jin管guan如ru此ci,熱re中zhong子zi並bing非fei目mu前qian導dao致zhi軟ruan錯cuo誤wu的de主zhu要yao原yuan因yin,製zhi造zao商shang已yi通tong過guo150nm工藝節點消除了含硼酸介電層。
消減軟錯誤的影響
改進工藝和存儲單元布局
womenkeyitongguozengjiacunchudanyuanzhongsuocunchudelinjiedianhetishengcunchuqidekekaoxing。ciwai,womenhaikeyishiyongyizhongkexiaojiankuosancenghoududegongyitigaocunchuqidiyuruancuowudenengli。gaigongyikesuoduandaidianlizizaicunchudanyuanzhongcunzaideshijian。sanjingjiagouyekeyongyujiangdianhequliyouyuanqu。gaigongyixingchengyigeyuNMOS耗盡區相反的電場,迫使電荷進入襯底。它僅適用於NMOS區發生軟錯誤的情況。
係統層麵的消減技術
在係統層麵上,設計人員可以使用外部糾錯碼(ECC)邏luo輯ji消xiao減jian軟ruan錯cuo誤wu的de影ying響xiang。在zai該gai技ji術shu中zhong,用yong戶hu使shi用yong額e外wai的de帶dai奇qi偶ou校xiao驗yan位wei的de存cun儲chu芯xin片pian檢jian測ce和he糾jiu正zheng錯cuo誤wu。正zheng如ru人ren們men所suo料liao,係xi統tong層ceng麵mian的de消xiao減jian技ji術shu較jiao為wei昂ang貴gui,而er且qie增zeng加jia了leFPGA軟件的複雜性。
改變芯片設計和架構
這是抗擊軟錯誤的最佳方法。芯片設計人員可以通過將ECC算法植入到芯片中消減軟錯誤的影響。在寫操作時,ECC編碼器算法為存儲器中存儲的每一個可尋址的數據字寫入奇偶校驗位。在讀操作時,ECC檢測算法使用奇偶校驗位確定數據位是否已經改變。如果出現單位錯誤,ECC糾錯算法將確定相關位的位置,然後通過將該數據位翻轉至其互補值協助糾錯。
盡管如此,ECC不bu能neng獨du立li應ying對dui多duo位wei翻fan轉zhuan錯cuo誤wu。因yin此ci,設she計ji人ren員yuan必bi須xu采cai用yong位wei交jiao織zhi技ji術shu。該gai技ji術shu組zu織zhi位wei線xian的de方fang法fa是shi將jiang物wu理li上shang相xiang鄰lin的de位wei映ying射she到dao不bu同tong的de字zi寄ji存cun器qi上shang。位wei交jiao織zhi距ju離li將jiang映ying射she到dao同tong一yi個ge字zi寄ji存cun器qi上shang的de兩liang個ge連lian續xu位wei分fen開kai。如ru果guo位wei交jiao織zhi距ju離li大da於yu一yi次ci多duo單dan元yuan撞zhuang擊ji的de擴kuo散san範fan圍wei,它ta將jiang在zai多duo個ge字zi中zhong導dao致zhi單dan位wei翻fan轉zhuan,而er不bu是shi在zai一yi個ge字zi中zhong導dao致zhi一yi次ci多duo位wei翻fan轉zhuan。

隨著半導體芯片變得越來越小,發生軟錯誤的風險也在不斷升高。存儲單元的Qcrit會hui隨sui著zhe其qi尺chi寸cun的de縮suo小xiao而er減jian少shao,這zhe使shi得de其qi更geng易yi翻fan轉zhuan。因yin此ci,很hen多duo專zhuan家jia預yu測ce,軟ruan錯cuo誤wu將jiang成cheng為wei這zhe種zhong趨qu勢shi的de製zhi約yue因yin素su,而er且qie最zui終zhong將jiang達da到dao飽bao和he點dian,除chu非fei我wo們men開kai發fa出chu能neng夠gou克ke服fu軟ruan錯cuo誤wu的de新xin技ji術shu。此ci外wai,隨sui著zhe技ji術shu進jin入ru人ren類lei生sheng活huo的de更geng多duo領ling域yu,人ren們men對dui於yu可ke靠kao性xing的de要yao求qiu隻zhi會hui越yue來lai越yue高gao。這zhe種zhong趨qu勢shi催cui生sheng了le對dui存cun儲chu器qi模mo塊kuai的de片pian上shangECC的需求。所有存儲器廠商都已開始推出具備片上ECC功能的芯片,以滿足市場對高可靠性存儲器的需求。SRAM領域的全球領導者賽普拉斯公司擁有一個基於ECC的異步SRAM係列,該係列是當今市場上可靠性最高的異步SRAM。具備ECC功能的16Mbit異步SRAM已開始投產,4Mbi版本也已開始提供樣品。
相關閱讀:
霍尼韋爾半導體封裝新材料,顯著減少軟錯誤故障頻率
三星爆存儲器存隱患,都是穀歌的錯嗎?
專家發言:快閃存儲器儲存陣列強勁成長
特別推薦
- 噪聲中提取真值!瑞盟科技推出MSA2240電流檢測芯片賦能多元高端測量場景
- 10MHz高頻運行!氮矽科技發布集成驅動GaN芯片,助力電源能效再攀新高
- 失真度僅0.002%!力芯微推出超低內阻、超低失真4PST模擬開關
- 一“芯”雙電!聖邦微電子發布雙輸出電源芯片,簡化AFE與音頻設計
- 一機適配萬端:金升陽推出1200W可編程電源,賦能高端裝備製造
技術文章更多>>
- 算力爆發遇上電源革新,大聯大世平集團攜手晶豐明源線上研討會解鎖應用落地
- 築基AI4S:摩爾線程全功能GPU加速中國生命科學自主生態
- 一秒檢測,成本降至萬分之一,光引科技把幾十萬的台式光譜儀“搬”到了手腕上
- AI服務器電源機櫃Power Rack HVDC MW級測試方案
- 突破工藝邊界,奎芯科技LPDDR5X IP矽驗證通過,速率達9600Mbps
技術白皮書下載更多>>
- 車規與基於V2X的車輛協同主動避撞技術展望
- 數字隔離助力新能源汽車安全隔離的新挑戰
- 汽車模塊拋負載的解決方案
- 車用連接器的安全創新應用
- Melexis Actuators Business Unit
- Position / Current Sensors - Triaxis Hall
熱門搜索





