從【特斯拉逆變器故障】和【小鵬召回】,看汽車芯片可靠性
根據(jù)J.D.Power的一份報(bào)告,車載音頻、通信、娛樂和導(dǎo)航(ACEN)類是質(zhì)量投訴中問題最多的領(lǐng)域。作為回應(yīng),近年來汽車主機(jī)廠開始要求電子元件要使用18年零故障。其原因之一是,如果汽車一再出現(xiàn)故障,消費(fèi)者就不太可能購買同一品牌的汽車。隨著汽車中芯片和電子元件數(shù)量的迅速增加,這一問題也變得更為嚴(yán)重。
前不久,小鵬汽車因錫須召回13399輛G3汽車,將免費(fèi)更換逆變器;前后腳,特斯拉新車Model 3因逆變器故障而“死機(jī)”,卻還一度嘴硬。這不禁讓人想起了半導(dǎo)體器件的可靠性及其相關(guān)的一些問題:生命周期、老化失效、零缺陷等。
小鵬和特斯拉可能殊途同歸
小鵬汽車的問題很明白:逆變器直流母線電容上連接銅排螺絲的鍍錫端子錫須可能會(huì)造成高壓直流電正負(fù)極間短路,導(dǎo)致逆變器無高壓電供應(yīng)。當(dāng)這種情況發(fā)生時(shí),如果車輛處于停車狀態(tài),可能無法再次啟動(dòng);如果車輛處于行駛狀態(tài),可能導(dǎo)致車輛失去動(dòng)力,存在安全隱患。

像這樣的地方容易產(chǎn)生錫須
錫須,也叫晶須,是電子產(chǎn)品中一種常見現(xiàn)象。它是一種頭發(fā)狀晶體,可以從焊錫表面自然生長出來,最常見的金屬是錫、鎘、鋅、銻、銦等。錫須是錫表面生長的錫晶體,它會(huì)導(dǎo)致電子短路,并引起焊點(diǎn)的機(jī)械破壞。

元件引腳上的錫須
特斯拉故障現(xiàn)象和小鵬類似,問題或許差不多,應(yīng)給予足夠的重視。專家指出,一些看似不起眼的缺陷卻有可能是一種致命缺陷。一些潛在缺陷可能永遠(yuǎn)不會(huì)導(dǎo)致故障,而其他不太明顯的缺陷可能在某種環(huán)境條件或過度振動(dòng)下會(huì)變成更嚴(yán)重的問題,小鵬汽車的召回介紹為了解決這個(gè)問題。

潛在缺陷與致命缺陷
對于汽車來說,雖然人們正在努力防止和發(fā)現(xiàn)這類缺陷,在出現(xiàn)問題時(shí)及時(shí)加以處理更不失為一種亡羊補(bǔ)牢的做法。因此,除了使器件更可靠外,還必須更容易更換。
汽車零故障何以保證?
ISO 26262的基本要求之一是能夠“優(yōu)雅地”失效。這要么需要一個(gè)冗余系統(tǒng),使電子設(shè)備的成本增加一倍,要么需要能夠利用不是為特定工作設(shè)計(jì)的其他電路。因此,盡管信息娛樂系統(tǒng)的設(shè)計(jì)可能不會(huì)被認(rèn)為對安全至關(guān)重要,但在緊急情況下,其性能可能必須與關(guān)鍵系統(tǒng)一樣好。
然而,這帶來了一個(gè)潛在的問題。根據(jù)J.D.Power的一份報(bào)告,車載音頻、通信、娛樂和導(dǎo)航(ACEN)類是質(zhì)量投訴中問題最多的領(lǐng)域。作為回應(yīng),近年來汽車主機(jī)廠開始要求電子元件要使用18年零故障。其原因之一是,如果汽車一再出現(xiàn)故障,消費(fèi)者就不太可能購買同一品牌的汽車。隨著汽車中芯片和電子元件數(shù)量的迅速增加,這一問題也變得更為嚴(yán)重。奧迪報(bào)告說,其高端車型中有大約有7000個(gè)半導(dǎo)體器件,每天生產(chǎn)大約4000輛汽車。每百萬分之一故障相當(dāng)于每天有24輛有缺陷的汽車。對寶馬來說,這相當(dāng)于54輛有缺陷的汽車,因?yàn)閷汃R使用了大約一半的電子元件,但每天生產(chǎn)10000輛汽車。
這還只是個(gè)開始,因?yàn)槠囍须娮觾?nèi)容的數(shù)量正在上升。電子組件很快就會(huì)占到汽車成本的35%。普華永道認(rèn)為,隨著自動(dòng)駕駛的到來,到2030年將占汽車成本的50%。想一想,汽車今天在這里,明天在那里,惡劣的環(huán)境是一個(gè)問題。
1995年,汽車市場將成熟節(jié)點(diǎn)的半導(dǎo)體用在收音機(jī)或電動(dòng)窗等相對簡單的系統(tǒng)?,F(xiàn)在,汽車需要有絕對最新的技術(shù)來提供ADAS傳感器所需的所有功能。汽車行業(yè)已經(jīng)無法使用已知故障模式和問題的五年前的技術(shù)。他們現(xiàn)在正處于最前沿,沒有人知道這些技術(shù)到底有多穩(wěn)定,也不知道會(huì)出現(xiàn)什么問題。
如何量化和發(fā)現(xiàn)致命缺陷
汽車中有大量的變量,在先進(jìn)節(jié)點(diǎn)設(shè)計(jì)芯片時(shí)也是如此,包括工藝變化到微小缺陷。關(guān)鍵是要理解并量化這些變量,然后利用積累的所有知識,能夠預(yù)測缺陷并發(fā)現(xiàn)致命缺陷。
從芯片的生命周期中收集數(shù)據(jù)并將其插入反饋回路是可靠性和功能安全性的關(guān)鍵。對于功能安全,在測量老化時(shí),可以在某個(gè)時(shí)間點(diǎn)得出結(jié)論,器件已經(jīng)老化到不再安全的程度。然后可以說這輛車需要在故障發(fā)生之前進(jìn)行預(yù)防性維護(hù)。
在過去,可靠性通常被認(rèn)為是制造過程的一部分。芯片要在烤箱中烘烤一段時(shí)間,或經(jīng)過仔細(xì)監(jiān)測的振動(dòng),以確定器件何時(shí)會(huì)出現(xiàn)故障。雖然在制造之前可以模擬不同的場景,但芯片仍然可能會(huì)失效,但缺陷率會(huì)降低,這取決于對各種工藝的控制有多嚴(yán)格,以及可以增加多少裕度來提供某種類型的失效接管。這在今天的ECC(錯(cuò)誤檢查和糾正)內(nèi)存中是很常用的方法。
不過,傳統(tǒng)汽車時(shí)代的一些假設(shè)正在被打破,老化就是其中之一。當(dāng)汽車停駐并關(guān)閉引擎時(shí),汽車電子設(shè)備不會(huì)停止老化。即使是在車庫里,自動(dòng)駕駛汽車也永遠(yuǎn)不會(huì)“熄火”。它可能仍然與手機(jī)通信、更新軟件,在后臺做自我檢查。
芯片能維持的使用壽命因終端市場、器件是否用于安全或任務(wù)關(guān)鍵型應(yīng)用,甚至是否可以輕松更換或遠(yuǎn)程修復(fù)而大相徑庭。

不同行業(yè)芯片的預(yù)期壽命估計(jì)
加速老化測試是模擬產(chǎn)品在現(xiàn)實(shí)使用條件下各種因素對產(chǎn)品產(chǎn)生老化的加強(qiáng)實(shí)驗(yàn)過程。一個(gè)加速因素是溫度,另一個(gè)因素是電壓。如果一個(gè)器件在12V(汽車電池正常電壓)下工作,那么在24年的時(shí)候,這個(gè)器件已難以工作。不同的參數(shù),如濕度、電壓、溫度、機(jī)械沖擊,這些都是加速系數(shù)。老化可以模擬器件壽命。
現(xiàn)在的問題是,如何加速它的壽命?當(dāng)然,需要模擬的是器件在車?yán)锎蠹s20年的壽命。如果希望在一個(gè)月內(nèi)看到一個(gè)故障,那么就要使用許多組件;如果想看到20年內(nèi)的一次故障,可以添加更多的組件,然后就可以得到更多的運(yùn)行時(shí)間。如果想模擬一臺設(shè)備在20年內(nèi)出現(xiàn)故障,可以拿1000臺設(shè)備運(yùn)行一個(gè)小時(shí),即1000工作小時(shí)數(shù)。使用更多組件就可以更快地測試壽命,因?yàn)檎嬲胍氖茄菔具\(yùn)行小時(shí)數(shù)內(nèi)有多少故障。這就是所謂的FIT(失效率),在109小時(shí)內(nèi)出現(xiàn)一次故障即為1 FIT。
值得一提的是,不同汽車級別在時(shí)間質(zhì)量指標(biāo)上有不同的失效率。消費(fèi)類級別的質(zhì)量水平為100 FIT,而安全關(guān)鍵應(yīng)用(如汽車中控制電池充電的電子器件)可能是0.1 FIT。所以必須根據(jù)器件的分類來模擬生存期。為了計(jì)算不同的加速系數(shù)所產(chǎn)生的影響,可以使用阿倫尼烏斯(Arrhenius)方程。
功能安全與可靠性
毋庸諱言,汽車電子的可靠性和功能安全性之間關(guān)系緊密。功能安全的重點(diǎn)是避免傷害,而可靠性是說汽車能否工作,而不需要修理。但是隨著自動(dòng)駕駛的增加,兩者會(huì)有很多重疊。
如果石頭擊中傳感器會(huì)發(fā)生什么?除了自身的可靠性之外,我們還必須考慮自動(dòng)駕駛汽車的功能安全性,其中一些標(biāo)準(zhǔn)是ISO 26262推動(dòng)的。這是在設(shè)計(jì)階段很多工作的核心。只要芯片安全地失效,芯片失效也沒關(guān)系。這是功能安全的重點(diǎn)。在一輛自動(dòng)駕駛汽車?yán)?,無論是芯片故障還是雷擊,不撞車都是至關(guān)重要的。當(dāng)然,可靠性也很重要。最好芯片不出故障,這既是功能安全的需要,也是質(zhì)量的需要。
失效對于汽車行業(yè)至關(guān)重要,而失效的機(jī)會(huì)很多。要想以可控的方式重復(fù)這一過程,并在生產(chǎn)線內(nèi)部、工廠之間或不同供應(yīng)商之間找到問題的根本原因,對可靠性是一個(gè)重大挑戰(zhàn)。無論你在做什么,都必須是可重復(fù)的,而且你必須能夠信任它。這使得這些公司的運(yùn)營方式發(fā)生了重大轉(zhuǎn)變。
汽車電子的可靠性要求是由汽車電子委員會(huì)(AEC)定義和分級的,AEC Q-100/200是汽車IC應(yīng)力測試的標(biāo)準(zhǔn)。熱、濕度和振動(dòng)都是可能破壞芯片的風(fēng)險(xiǎn)因素,但材料、設(shè)計(jì)和制造工藝也會(huì)使芯片或多或少地受到風(fēng)險(xiǎn)因素的影響。這會(huì)變得復(fù)雜,細(xì)節(jié)也很重要。
在整個(gè)開發(fā)和鑒定過程中,需要明智地使用熱機(jī)械建模。例如,聚合物材料在長時(shí)間高溫下會(huì)發(fā)生永久性變化。取決于環(huán)境,這可能包括材料氧化以及導(dǎo)致脆化的機(jī)械性能變化。濕度也會(huì)導(dǎo)致片芯鈍化層和基板焊接掩模界面的附著力喪失。
冗余需要適度
冗余通常是實(shí)現(xiàn)航空可靠性的方法,但這會(huì)增加開支和重量。但對于汽車來說,冗余需要局限于車輛內(nèi)的特定系統(tǒng),因?yàn)槠嚊]有那種奢侈,主機(jī)廠只是想省下每一分錢。
在汽車?yán)?,冗余是需要平衡的。隨著SoC應(yīng)用的擴(kuò)大,冗余有多種形式。這些技術(shù)是在更高層次上復(fù)制一些CPU或一些功能較差的塊,并確保兩者獲得相同的輸出,如果兩者中的任何一個(gè)顯示不一致的內(nèi)容,則標(biāo)記為一個(gè)問題。這允許在操作過程中進(jìn)行某種程度的自我測試。這種方法很昂貴,因?yàn)閺?fù)制了整個(gè)塊或處理器。
其他冗余設(shè)計(jì)更為精確。例如在內(nèi)存寄存器級別,就像邏輯設(shè)計(jì)中的觸發(fā)器,在這里可以找到一些起關(guān)鍵作用的寄存器。要么用一個(gè)更大裕量的器件來替換它,要么加入三重模塊冗余。因此,從降低成本角度看,它是細(xì)粒度、粗粒度和各種其他技術(shù)的一種平衡。
這還取決于這些芯片是如何使用的,它們是否是復(fù)雜系統(tǒng)的重要組成部分,以及持續(xù)監(jiān)控和反饋的成本是否可以分?jǐn)偟秸麄€(gè)系統(tǒng)價(jià)格中。這不是一個(gè)簡單的等式,也沒有簡單的答案,特別是在先進(jìn)節(jié)點(diǎn),額外的電路會(huì)增加功耗并降低性能。
先進(jìn)節(jié)點(diǎn)的尷尬境地
高級駕駛員輔助系統(tǒng)(ADAS)和向完全自動(dòng)駕駛方向發(fā)展正在采用最新節(jié)點(diǎn)的半導(dǎo)體制造工藝,而可靠性成為汽車行業(yè)最關(guān)心的問題。雖然成熟的節(jié)點(diǎn)仍然是主流,但汽車芯片已經(jīng)發(fā)展成為大型復(fù)雜的SoC。其中包括集成到異構(gòu)封裝和配置中的先進(jìn)節(jié)點(diǎn)器件,這些封裝和配置還未經(jīng)嘗試。過去,電子控制單元通常只有一個(gè)處理器或存儲器單元。情況不再如此,從驗(yàn)證到各種類型的測試,包括符合性測試,都變得更加嚴(yán)格。
一些汽車芯片變得越來越復(fù)雜和小巧玲瓏。車輛的中央邏輯尤其如此,它需要管理所有其他系統(tǒng)以避免車輛出現(xiàn)故障。目前的設(shè)計(jì)使用的是7nm和5nm邏輯,這已是芯片制造的前沿,但這些器件必須能夠承受惡劣的環(huán)境,并且比消費(fèi)芯片正常工作至少要長10年。一個(gè)節(jié)點(diǎn)的一種工藝是否存在問題,通常需要五到六年的時(shí)間才能知道。采用5nm到7nm技術(shù),我們不知道會(huì)有什么變化。因此,最近NXP、高通將5nm芯片引入汽車既是在挑戰(zhàn)誘惑,也要面對巨大的挑戰(zhàn)。
回顧一下,前不久智能手機(jī)5nm芯片無一幸免被曝實(shí)際功耗不低,發(fā)熱未減。在封裝和測試方面,許多人都體驗(yàn)到汽車出現(xiàn)故障的地方之一是標(biāo)準(zhǔn)塑料或陶瓷,其選擇主要基于成本。這表明,芯片公司的專業(yè)知識仍然存在差距,一些公司從未涉足汽車領(lǐng)域,而汽車供應(yīng)商和主機(jī)廠對先進(jìn)節(jié)點(diǎn)芯片設(shè)計(jì)和制造中的一些問題沒有經(jīng)驗(yàn)。
盡管主機(jī)廠和Tier 1的要求很嚴(yán)格,但一定程度的失效是不可避免的。電子設(shè)備會(huì)因各種原因而磨損,芯片可能由于一個(gè)設(shè)計(jì)缺陷,也可能由于芯片蝕刻時(shí)困在薄膜中的塵埃顆?;驓饬鲉栴}而出現(xiàn)問題。何況有大量的研究表明,當(dāng)一個(gè)雜散α粒子擊中一個(gè)7nm晶體管時(shí)會(huì)發(fā)生災(zāi)難性的后果。
要控制這樣的問題,需要在系統(tǒng)和電路兩個(gè)層面都有深入的了解,但目前還沒有足夠的數(shù)據(jù)能夠就問題可能在哪里爆發(fā)以及為什么爆發(fā)得出好的結(jié)論。
數(shù)據(jù)與可靠性息息相關(guān)
從汽車上收集有用的數(shù)據(jù),并將其發(fā)送到反饋回路中,將成為汽車行業(yè)未來5到10年內(nèi)一項(xiàng)常規(guī)性的工作。主機(jī)廠、芯片設(shè)計(jì)公司、半導(dǎo)體公司都需要通過正反饋回路來獲得更詳細(xì)的分析,因此,我們可以對所使用的設(shè)計(jì)技術(shù)和庫進(jìn)行適當(dāng)?shù)恼{(diào)整。
實(shí)現(xiàn)這一功能的關(guān)鍵要素之一是從汽車中傳輸最少的數(shù)據(jù)量。這意味著汽車本身必須能夠整理出相關(guān)的數(shù)據(jù)和事件。管理所有這些數(shù)據(jù)至關(guān)重要,要考慮太多的數(shù)據(jù)以及如何以一種干凈的方式將其組合在一起。對于不同類型的工具,或者不同類型的傳感器,盡管其在物理上不同,來自不同的供應(yīng)商,但在邏輯上是相同的。通過識別所有不同數(shù)據(jù)源中語義相似的內(nèi)容,就可以更輕松地將其轉(zhuǎn)換為一種格式,然后提取出一些有用的結(jié)果。
關(guān)鍵在于理解什么對可靠性更重要,而這本身就是一項(xiàng)復(fù)雜的任務(wù)。簡單說,從汽車中收集有價(jià)值的信息非常重要。雖然這很難量化,但不能一直發(fā)送所有的數(shù)據(jù)。找到重要的數(shù)據(jù)意味著汽車或器件要有分析能力,從而最大限度地減少傳輸?shù)皆贫说臄?shù)據(jù)。
在車輛部署到現(xiàn)場之前,我們必須確保已經(jīng)采取了所有的可靠性和安全措施。通過組合從生命周期不同階段提取的UCT(通用芯片遙測)數(shù)據(jù),并用額外的數(shù)據(jù)源對其進(jìn)行擴(kuò)充,價(jià)值鏈上的制造商就可以將質(zhì)量提高10倍,防止質(zhì)量流失或“受傷”。這是通過高度先進(jìn)的異常檢測方法,剔除未檢測到的缺陷,而不影響良率來實(shí)現(xiàn)的。即使在表征和鑒定過程中,也應(yīng)對性能極限進(jìn)行調(diào)整和優(yōu)化,以確保足夠的可靠性裕度。
例如,Synopsys將分析引擎與嵌入芯片中的傳感器和監(jiān)視器相連,利用反饋回路將芯片設(shè)計(jì)和生產(chǎn)各個(gè)階段的豐富數(shù)據(jù)集輸入分析引擎中。

嵌入芯片中的傳感器和監(jiān)視器將豐富數(shù)據(jù)集輸入分析引擎
數(shù)據(jù)的所有權(quán)有助于實(shí)現(xiàn)反饋回路和生命周期管理。從汽車內(nèi)部芯片的深處收集數(shù)據(jù)正在解決這個(gè)問題。如今,數(shù)據(jù)正從汽車中收集起來,并在主機(jī)廠內(nèi)部共享。隨著時(shí)間的推移,根據(jù)地區(qū)、合法性、收集數(shù)據(jù)的程度以及保護(hù)數(shù)據(jù)的能力,數(shù)據(jù)所有權(quán)將成為整個(gè)設(shè)計(jì)生命周期中進(jìn)行更深入分析的一個(gè)加速器。