MOSFET 寿命预测 SPICE 集成 — averaged 电热 + aging + lifetime 闭环

热与可靠性L3别名 MOSFET lifetime estimation · MOSFET aging · Rds_on aging · electro-thermal averaged model · ETAM · Coffin-Manson · Miner rule · half-cycle counting · rainflow counting · mission profile simulation · Rds_on precursor · 寿命预测 · 退化模型 · lifetime SPICE · LTspice aging相关[[topic-multichannel-driver-thermal]][[topic-zth-transient-thermal]][[topic-mosfet-loss-decomposition]][[topic-fit-fmeda-calculation]]

本质与导读

本质 把 electrical/thermal/aging/lifetime 四件事在同一 LTspice 里串成反馈闭环,关键是用 Rds,on 当 health indicator——它同时编码温度依赖与退化漂移,让过去 stress 加速未来退化。含 aging 的寿命预测 9.67 年 vs 不含 13 年,传统方法 over-promise 约 25%。

核心要点

  • 4 子模型集成 LTspice — Electrical / Thermal / Lifetime / Aging,4 个反馈环
  • 是 health precursor — 同时编码温度依赖()和退化进度()
  • End-of-Life 准则(IRFP340 原值 0.423,12% 增加)
  • Averaged model 加速 5600× — 不仿 PWM,跑 10 年只需 46 秒
  • Coffin-Manson:
  • Miner rule:, 时寿命到
  • Half-cycle counting 在线 — 比 rainflow 简单,精度差 ~ 10% 但 SPICE 可实现
  • Aging 自加速 — 过去 stress 让 升,使 升,使 升,使 stress 升

主线坐标:第 5 站 · 逆变器(栅驱 + 功率模块) · ↑ 全景主线

1. 4 子模型集成架构

paper 把 4 个子模型在 LTspice 中通过 + + 三个信号链形成闭环。

集成架构

1.1 子模型 1 — Electrical(averaged)

仿真 PWM 开关,而是 averaged 模型 —— 电压源 / 受控源代替开关网络。损耗按公式估算:

其中 同时包含温度依赖aging 退化:

是温度系数(典型 0.5%/°C), 是 aging 引起的永久 increment。

1.2 子模型 2 — Thermal(R-only)

因为 averaged model 视为稳态,不需要 RC ladder(transient response),只用 R 网络:

  • (junction-to-case)
  • (case-to-ambient)

注意这与 topic-electro-thermal-simulation 的瞬态 Cauer/Foster 模型不同 —— 后者用 5 阶 RC 捕获 μs-ms 瞬态,这里只关心稳态 (用于长期 lifetime 预测)。

1.3 子模型 3 — Lifetime Analytic(Coffin-Manson + Miner)

Coffin-Manson 计算单个 thermal cycle 的失效循环数:

IRFP340 实验拟合参数:

  • (activation energy)

Miner's rule 累积 stress:

表示寿命到达。

1.4 子模型 4 — Aging(自加速反馈)

两种 aging 模型,paper 推荐 stress-related(更通用):

意味着 累积上限是 0.2 × (即 20% increase)—— 但 IRFP340 EoL 准则更严:,在 时已经到 EoL。

关键:这是自加速反馈环 — 过去的 stress 让 升,使 升,使 升,使后续 stress 进一步加速。

2. 作为 Failure Precursor

为什么用 而不是 (thermal resistance)做健康指标?paper §I 给出 3 个理由:

  • 敏感度高: 随 aging 漂移 12-20%, 只漂移 5-10%
  • 测量易:常规电路就能算 , 需要专门热测试
  • 信息密度大: 同时编码瞬时 + 长期 aging 状态

Rds,on 作为 precursor

2.1 4 个 stress case 实验数据

paper 用 IRFP340 在 4 种温度循环 stress 下做实验:

Case测得 (EoL)Coffin-Manson 算
A160 °C160 °C200-750750
B140 °C140 °C14301586
C130 °C145 °C24102410
D80 °C120 °C20-35 k35.2 k

Coffin-Manson 拟合在所有 4 case 误差 ,验证模型可信。

2.2 高 stress vs 低 stress 曲线形状

寿命曲线形状跟 stress 水平强相关——高 stress 后期指数爆破,低 stress 几乎线性,这直接决定在线监测的预警窗口长度:

  • 高 stress(Case A): 早期平,后期指数加速爆破 — 自加速效应明显
  • 低 stress(Case D): 几乎线性增长 — 在 EoL 之前都不会突变

工程含义:用 in-field 监测预警,高 stress 工况预警窗口短(几百 cycle),低 stress 工况预警窗口长(几千 cycle)。

3. Coffin-Manson + Miner 在 LTspice 中实现

传统 Coffin-Manson + Miner 是离线计算 —— 跑完仿真后用 Python / MATLAB 处理。paper 创新用 half-cycle counting + LTspice behavioral source,实现在线计算。

Coffin-Manson + Miner

3.1 Half-cycle counting

传统 rainflow counting 需要完整波形(offline),无法在线。半 cycle counting 用每 5s 采样 ,把上升 / 下降斜率各算作 1 half cycle:

精度比 rainflow 差 ~ 10%,但可以在线 SPICE 直接实现,这是关键工程价值。

3.2 LTspice behavioral source 实现

Smaller-Step rainflow 用 LTspice 的 behavioral source 可以直接在仿真里跑,关键是用 SH() 采样 + idt() 积分凑出 Miner sum——代码不长但每行都贴 LTspice 函数语义:

; 采样 + 归一化(LTspice 限制 SH function 输入 < 10V)
A2 in clk out (sample-and-hold,每 5s 触发)
V_sampling = SH( V(T_j_mos) / 30 )

; Δ T_j 和 T_m 计算
V_ΔTj = abs( V(sampling) - delay(V(sampling), 5s) )
V_Tm  = ( V(sampling) + delay(V(sampling), 5s) ) / 2

; Coffin-Manson N_f
V_Nf = pow( V_ΔTj, delta ) · A_1 · exp( E_a / (k · V_Tm) )

; Miner Q 累积(half-cycle = 0.5 个 cycle)
V_Q = idt( 0.5 / V_Nf )

idt() 是 LTspice 的连续积分函数,直接实现 Miner sum;delay() 实现采样比较;SH() 是 sample-and-hold。

3.3 LTspice 关键函数清单

Aging 模型用到的 LTspice 函数集中在 6 个,理解它们的语义比 copy 代码更重要——下面是 cheat sheet:

函数用途用在哪
ceil(x)取整filter out 小数
min(x,y)取小limit 上限
idt(x)积分Miner Q 累积
random(x)噪声环境温度模拟
delay(x, t)延迟half-cycle 比较
abs(x)绝对值 计算
SH(x, clk)采样保持周期 sampling

paper Table 1 完整列出了 7 个函数 + 模型中各自用途。

4. 10 年 Mission Profile 仿真

paper §III.B 给出长期 mission profile 仿真,验证 aging 效应在 10 年尺度的影响。

10 年 mission profile

4.1 输入设置

仿真 120 ks(= 10 年实时压缩,无 PWM 详细)。环境温度和载阻分别用:

  • = PWL file,每 5 s 一变(模拟 4.8 hr 实际工况变化)

仿真时间 46 秒(Intel i7-7600U)。

4.2 关键波形

10 个 SPICE 节点同时可观察:

变量物理含义10 年值SPICE 节点
V(ta)环境温度7-43 °C环境模型
V(rl)载阻(load)4-12 ΩPWL file
V(tj_mos)瞬时 40-185 °Cthermal R 网络
V(q)stress 累积 Q0 → 1.1idt Miner sum
V(rds)(aging)0.423 → 0.475 Ωaging 模型
V(rds_ins)(瞬时 + 温度)0.4 → 0.55 Ω电气模型实时
V(out)converter 输出17-21.6 V电气模型

4.3 关键发现 — aging 加速 25%

无 aging 模型(传统方法)预测:13 年到 EoL()。

含 aging 模型(本 paper):9.67 年到 EoL —— 提早 25%。

物理原因:aging 让 缓慢升 → 损耗渐升 → 升 → 后续 thermal cycle 更狠 → aging 加速。这是正反馈失稳,被 paper 的 stress-feedback 模型捕获。

工程含义:传统不含 aging 的寿命预测 over-promise 25%,产品保修期会被 underestimate failure rate

5. 仿真速度 — averaged vs switched

paper Table 3 对比了 averaged model 与传统 switched model 的速度:

任务switched(10 kHz)switched(50 kHz)averaged
8 ks thermal cycling14.78 s14.78 s(同)12.27 s
10 ks long-term @ 10 kHz819.5 s0.145 s
10 ks long-term @ 50 kHz3956 s0.148 s

观察:

  • 短时仿真(8 ks),averaged 与 switched 性能相近(都 ~ 15 s)
  • 长时仿真(10 ks),averaged 比 switched 快 5600×( kHz)
  • 频率独立:averaged model 在 10/20/50 kHz 几乎一致 0.15 s(频率不影响仿真时间)
  • switched model 随频率线性增长 — 50 kHz 比 10 kHz 慢 5×

结论:只有 averaged model 让 10 年 lifetime 仿真在普通笔记本上可行

6. 工程边界与限制

paper §IV 给出 4 个明确限制,工程使用时必须遵守。

限制说明应对
不含 parasitic不算 trace inductance / packaging cap仅适合 low-frequency electro-thermal
不含 manufacture spread不同 device 退化曲线不同用 Weibull 拟合
不含 catastrophic failure不算 short-circuit / open / breakdown配合 FMEA
Coffin-Manson 是经验 / / 需测拟合至少 4 个 stress level 实验
Rds,on 不能代替 FMEA 这…

不能代替 FMEA 这个模型只关注 degradation failure(慢性磨损),不识别 catastrophic failure(瞬时击穿 / open / latch-up)。实际产品可靠性评估必须结合 FMEA + FIT + lifetime model,本 paper 是其中一块。详见 topic-fit-fmeda-calculation + topic-fmea

7. 工程 cheat-sheet

下表组织 MOSFET lifetime SPICE 集成的关键决策。

阶段决策推荐做法
模型选switched vs averaged长期(> 1 hr)必须 averaged
模型选RC ladder vs R-onlyaveraged 用 R-only;瞬态用 Cauer
precursor vs 敏感度高,measurement 易
countingrainflow vs half-cycleoffline rainflow;online half-cycle
EoL 准则 = 5% / 12% / 20%datasheet 看,默认 12-20%
aging指数 vs stress-relatedstress-related 更通用
温度依赖 系数实测,典型 0.5%/°C
Coffin-Manson / / 4 个 stress level 拟合
仿真速度10 年 ≈ 46 秒i7-7600U 实测

8. 常见误区

实战中 MOSFET aging 仿真常被 6 个误用模式坑——下面这组反例覆盖了 90% 的项目返工根因:

  • ❌ "用 做 health precursor" — 错, 敏感度高 2-3×
  • ❌ "switched model 准确,不该用 averaged" — 长期仿真精度差异 < 5%,但慢 5600×
  • ❌ "Coffin-Manson 算一次就完" — 必须 4 个 stress level 拟合参数
  • ❌ "Miner Q = 1 就 fail" — 是统计意义,实际器件 spread,提前 / 延后
  • ❌ "不需要 aging 模型" — over-promise 25% 寿命,保修期出问题
  • ❌ "lifetime model 取代 FMEA" — 这只算 degradation,catastrophic failure 还要 FMEA

9. 自检题

前 3 题考架构,4-6 考公式,7-10 考工程应用。

  1. 4 子模型分别是?它们通过什么信号链接?
  2. 为什么用 而非 做 precursor?
  3. averaged model 比 switched 快 5600× 的根本原因?
  4. Coffin-Manson 公式 的关系? 符号正负?
  5. Miner's rule 怎么累积? 表示什么?
  6. half-cycle counting 与 rainflow counting 的精度差异?
  7. 含 aging vs 不含 aging 10 年寿命预测差异多少?为什么?
  8. LTspice 实现 Miner Q 累积需要哪个内置函数?
  9. paper 给出的 4 个工程限制中,哪个最严重?
  10. IRFP340 EoL 准则是 多大?这对应 多少?

Cross-references