热管理（Thermal Management）

功率级L6别名热管理 · 热阻 · Z_th · 结温

本质热管理是功率电子设计里唯一可以用欧姆定律思考的子系统——温度差 = 电压，功率 = 电流，热阻 = 电阻，热容 = 电容。所有热设计问题都归结为一个方程： $T_{j}$ = $T_{a}$ + P × ΣR_th。但"欧姆定律思维"只对稳态有效；实际系统充满脉冲功率和电-热正反馈，需要瞬态热阻 $Z_{t h (t)}$ 和寿命模型作为补充。做好热管理 = 把这几件工具在合适的场合用对。

学习目标

读完本页后，你应该能够：

用热路-电路类比推导稳态结温，并判断一个 MOSFET 在给定散热条件下能否安全工作。
从数据手册的 $Z_{t h (t)}$ 曲线读值，算脉冲 / 重复脉冲工况下的峰值结温。
区分 Foster 和 Cauer 热网络，知道何时用哪个。
解释电-热耦合正反馈，判断什么情况会热失控。
列出 TIM（导热界面材料）的四大类及其典型热阻量级，选择合适的 TIM。
用 Coffin-Manson 模型估算功率循环寿命，量化 ΔT_j 对寿命的指数影响。
诊断一个"设计计算没问题，实测 $T_{j}$ 爆表"的情况（至少五个可能原因）。

1. 核心框架：热管理的四个子问题

热管理不是单一问题,是四个独立子问题的组合——稳态(平均功率)、瞬态(脉冲)、电-热耦合(温度反馈)、寿命(疲劳)。每个子问题用不同分析工具,新人最常的错是只算稳态忽略瞬态,在脉冲工况下温度爆。

子问题	分析工具	关键数据
1 稳态	T = P· $R_{t h}$	$R_{t h}$ ,jc; cs; sa
2 瞬态	$Z_{t h (t)}$ ; Foster/Cauer	手册 $Z_{t h (t)}$
3 电-热耦合	迭代 T vs P	$d R_{D S (o n)}$ /dT
4 寿命	Coffin-Manson	ΔT_j; 循环次数

    ┌──────────────────────────────────────────┐
    │                                          │
    │  1 稳态          2 瞬态                  │
    │   Tj = Ta         Tj(t) 随脉冲           │
    │   + P·ΣRth          功率变化             │
    │                                          │
    │  3 电-热耦合      4 长期寿命             │
    │   Tj ↑ →          功率循环疲劳            │
    │   R_DS(on) ↑ →    ΔTj → 焊线             │
    │   P ↑ → ...        分层                  │
    │                                          │
    └──────────────────────────────────────────┘

热管理看起来是一个问题（" $T_{j}$ 控制在合理范围"），实际上是四个紧密相关的子问题（如上图）。每个子问题用不同的分析工具，如上表所示。

大多数热设计错误出自混用工具：用稳态热阻估瞬态工况（严重低估散热能力），或者忘记电-热耦合（严重低估稳态功耗），或者只看一次 $T_{j}$ 峰值没看 ΔT_j 寿命（模块 3 年后焊线疲劳失效）。

2. 稳态热模型——热路欧姆定律

热管理最简单、最常用的模型：热量在一个简单的串联热阻网络里从结流到环境。

热-电类比

热学问题用电学类比可以借用所有电路工具——温度对电压、功率对电流、热阻对电阻、热容对电容。这条类比让 SPICE 可以仿热,大幅简化复杂热系统分析。

热学量	符号/单位	电学类比
温度差	ΔT (K)	电压 (V)
功率	P (W)	电流 (A)
热阻	$R_{t h}$ (K/W)	电阻 (Ω)
热容	$C_{t h}$ (J/K)	电容 (F)

这个类比不是比喻，是严格的数学同构（如上表）。推论：任何 SPICE 电路仿真工具都可以直接用来做热路仿真——PSIM、LTspice 都有现成的热模块。热阻并联、串联、Y-Δ 变换都和电路完全一样。

稳态热路

稳态热路用串联电阻链建模——结到壳 $R_{t h (j - c)}$ 、壳到散热器 $R_{t h (c - s)}$ 、散热器到环境 $R_{t h (s - a)}$ 。三段串联,任一段大都让结温升。

热阻	决定因素	可改？
$R_{t h}$ ,jc	芯片+封装	不能
$R_{t h}$ ,cs	TIM+涂覆工艺	能
$R_{t h}$ ,sa	散热器	能

典型功率器件 + 散热器的完整热路如上图。稳态方程：

T_j = T_a + P × (R_th,jc + R_th,cs + R_th,sa)
    = T_a + P × R_th,total

每段热阻的决定因素：

$R_{t h}$ ,jc 是不可谈判的上限——选器件时就决定了；后面只能在 $R_{t h}$ ,cs 和 $R_{t h}$ ,sa 上优化。

典型热阻量级

封装 $R_{t h (j - c)}$ 量级跨度三个数量级——从 SOT-23 的 200K/W 到大模块的 0.05K/W。封装选择第一道关就是按功耗反推 $R_{t h (j - c)}$ ,选错封装后面散热再优化也救不回来。

封装	$R_{t h}$ ,jc
SOT-23 (小信号)	200～300 K/W
DPAK/D2PAK	2～5 K/W
TO-220	1～2 K/W
TO-247 (MOSFET)	0.5～1 K/W
TO-247 (IGBT)	0.4～0.8 K/W
IGBT 模块(62mm)	0.1～0.3 K/W
SiC LFPAK56/TOLL	0.8～1.5 K/W
SiC 模块 Easy	0.15～0.4 K/W

环节	$R_{t h}$ 典型值
导热膏(40 cm²)	～0.05 K/W
相变材料	～0.02 K/W
烧结银	～0.001 K/W
自然对流散热器	3～10 K/W
强制风冷(2 m/s)	0.3～2 K/W
液冷(5 L/min)	0.03～0.1 K/W

建立量级感觉是必修课（典型值如上表）。粗略估算法则：风冷的总热阻很难做到 < 0.5 K/W，液冷轻松 < 0.1 K/W。

稳态计算示例

场景：三相逆变器，IGBT 模块 $R_{t h}$ ,jc = 0.15 K/W，每个 IGBT 总损耗 P = 80 W，TIM 是导热膏 $R_{t h}$ ,cs = 0.05 K/W，散热器液冷 $R_{t h}$ ,sa = 0.05 K/W，冷却液温度 $T_{a}$ = 60 °C。

T_j = T_a + P × R_th,total
    = 60 + 80 × (0.15 + 0.05 + 0.05)
    = 60 + 80 × 0.25
    = 60 + 20
    = 80 °C

$T_{j}$ ,max = 150 °C（IGBT5）或 175 °C（IGBT7），降额 25 °C 后允许 $T_{j}$ 达到 125 或 150 °C——80 °C 远低于限，热设计有充足余量。

但注意：

这是单点稳态。实际工况里逆变器电流在变（加速/减速），每个 IGBT 的瞬时功率在波动，要看瞬态峰值。
60 °C 冷却液假设是最坏情况 —— 真实汽车在夏天冷却液可以达到 90 °C。
还没算电-热耦合——高温下 IGBT 的损耗会增大（见下面第四节）。

所以这个 80 °C 只是一个"纸面上的最好情况"，实际设计时必须给更多余量。

3. 瞬态热阻抗 $Z_{t h (t)}$ ——脉冲功率怎么算

稳态热阻只对长期均匀功率有效。脉冲功率的实际峰值温度远低于 P· $R_{t h}$ ，因为热量还没来得及传到散热器，脉冲就已经结束了。这个现象由热容描述，数据手册用 $Z_{t h (t)}$ 曲线表示。

$Z_{t h (t)}$ 是什么

$Z_{t h (t)}$ 是"瞬态热阻"——给定脉冲宽度下,看到的等效热阻。短脉冲 $Z_{t h}$ 远小于稳态 $R_{t h}$ ,因为热容吸收了大部分能量。短路保护设计中必须用 $Z_{t h (t)}$ 而不是 $R_{t h}$ 算 $T_{j}$ 峰值。

$Z_{t h (t)}$ 是"施加单位功率阶跃后 t 时刻的温升"（典型曲线如上，对数坐标）：

$T_{j} (t) = T_{ini t ia l} + P \times Z_{t h} (t)$ 物理含义：

t → 0 时： $Z_{t h}$ (0) ≈ 0（温度还没上升）
t → ∞ 时： $Z_{t h}$ (∞) = $R_{t h}$ （到达稳态）
中间过程：指数上升，由芯片、焊料、DBC、散热器各层的 R/C 时间常数叠加

关键观察： $Z_{t h}$ (1 μs) 可能只有 $R_{t h}$ 的 1%！这就是脉冲功率器件可以承担远超稳态额定值的原因。

Foster 热网络——数据手册的标准形式

Foster 网络用 RC 并联节点构建瞬态热模型——好处是数学简单、参数容易拟合,坏处是节点没有物理对应。Datasheet 给的 $Z_{t h}$ 通常是 4-5 阶 Foster。

Foster 是并联 RC 支路的串联（如上图）。阶跃响应：

$Z_{t h} (t) = Σ R_{i} \times (1 - e x p (- t / τ_{i})), τ_{i} = R_{i} \times C_{i}$ Foster 网络的致命限制：各 RC 节点没有物理对应！中间节点的温度没有物理意义——它不对应芯片-焊料界面温度，也不对应任何其他物理层。不能在中间节点截断热路做替换分析（例如"我换一个散热器，重新算"）。

Foster 是数学拟合，用来精确描述整体的 $Z_{t h (t)}$ 曲线。数据手册给的就是 Foster 参数（或直接给 $Z_{t h (t)}$ 曲线表）。

Cauer 热网络——物理对应

Cauer 网络与物理结构对应——每节 RC 对应一个真实物理层(die、焊接层、DBC、底板、散热器)。所以 Cauer 模型可以反推哪一层是热瓶颈,但参数提取比 Foster 麻烦。

Cauer 是串联 R + 对地并联 C 的组合（如上图）。Cauer 网络的 RC 节点有物理意义：

R1, C1：芯片本体
R2, C2：芯片-DBC 焊料层
R3, C3：DBC 铜层
R4, C4：AlN / Si_3N_4 陶瓷
R5, C5：DBC 底部铜层
R6, C6：散热膏 / TIM
R7, C7：散热器本体

可以在任意节点截断（例如"我只想算芯片内部温升"）。

问题：数据手册不给 Cauer 参数——只给 Foster。需要数学变换才能从 Foster 转到 Cauer。转换方法不是一一对应的，可能有多个 Cauer 表示对应同一个 Foster。

工程实用建议：

做稳态或整体瞬态分析：直接用数据手册的 Foster
做模块物理设计或替换某一层：自己建 Cauer 模型（或厂商直接提供）
做电-热耦合实时仿真：用 PSIM 的热模块，它会自动处理 Foster/Cauer 转换

单次脉冲的峰值温度计算

对单次脉冲（宽度 $t_{p}$ ，功率 $P_{p u l se}$ ），峰值结温：

$T_{j}, p e ak = T_{a} + P_{p u l se} \times Z_{t h} (t_{p}) + P_{ba se l in e} \times R_{t h}, t o t a l$ 其中 $P_{ba se l in e}$ 是脉冲之外的基础损耗（如果有）。

示例：某 MOSFET 正常工作时 $P_{s t e a d y}$ = 10 W（ $R_{t h}$ ,total = 3 K/W， $T_{a}$ = 25 °C，稳态 $T_{j}$ = 55 °C）。偶发短路保护 1 ms 内损耗激增到 500 W， $Z_{t h}$ (1 ms) = 0.05 K/W：

T_j,peak = 55 + (500 − 10) × 0.05
        = 55 + 24.5
        = 79.5 °C

关键洞察：功率暴涨 50 倍，温度只涨 24.5 °C。热容把 500 W 的脉冲"稀释"到几乎看不见。如果按稳态算：

$T_{j}, s t e a d y = 25 + 500 \times 3 = 1525° C \leftarrow 瞬间烧毁$ 这就是 $Z_{t h}$ 的工程价值——允许短时超功率工作，前提是脉冲足够短。

重复脉冲：占空比的作用

对占空比 D、周期 T 的重复脉冲：

T_j,avg = T_a + P_avg × R_th,total,  其中 P_avg = D × P_peak
T_j,peak ≈ T_a + P_avg × R_th,total + P_peak × Z_th(t_p) × (1 − D)

极限情况：

T 远大于热时间常数 → 每个脉冲独立， $T_{j}$ ,peak ≈ $T_{a}$ + $P_{p e ak}$ · $Z_{t h}$ ( $t_{p}$ )
T 远小于热时间常数 → 看起来像稳态， $T_{j}$ ,peak ≈ $T_{a}$ + $P_{a vg}$ · $R_{t h}$

实务：用 PSIM 或 MATLAB 做数值仿真，不要手算。

4. 电-热耦合与热失控

MOSFET 和 IGBT 的损耗依赖结温 —— 温度升高 → 损耗增大 → 温度进一步升高。这是一个正反馈回路，在某些条件下会导致热失控。

耦合机制

电-热耦合形成正反馈环——温度高 → $R_{D S (o n)}$ 升 → 损耗多 → 温度更高。这条环对 IGBT/MOSFET/SiC 都成立,但严重程度不同:Si 适中、IGBT/SiC 因正温系数自调节、GaN 弱(温度系数小)。

MOSFET 的电-热耦合：

IGBT 的电-热耦合：

IGBT 的电-热耦合比 MOSFET 严重得多，主要是因为 $E_{o ff}$ 的 f( $T_{j}$ ) 从 25 °C 到 150 °C 翻倍。

稳定性分析：何时会热失控

热失控的数学条件:温度系数 × 散热不足 > 1。具体来说当 $\frac{d P}{d T} > \frac{1}{R _{t h}}$ ,正反馈环放大, $T_{j}$ 飙升。设计余量必须按这条数学条件留。

稳态工作点 = P( $T_{j}$ ) 和 $P_{d i ss}$ ( $T_{j}$ ) 的交点（如上图）。设损耗 P 是 $T_{j}$ 的函数，散热能力：

$P_{d i ss} = (T_{j} - T_{a}) / R_{t h}, t o t a l$ $P_{d i ss}$ 随 $T_{j}$ 线性上升。稳定性条件：

$d P / d T < d P_{d i ss} / d T = 1/ R_{t h}, t o t a l$ 也就是说，损耗随温度上升的速度不能快于散热能力随温度上升的速度。如果不满足，工作点无稳定性， $T_{j}$ 会持续上升到器件损坏。

实务判断：

Si MOSFET： $R_{D S (o n)}$ 的正温系数在 +0.5 %/°C 量级，只要 $R_{t h}$ ,total 不太差（< 1 K/W），稳定工作点存在
SiC MOSFET：类似 Si， $R_{D S (o n)}$ 正温系数小，稳定性好
IGBT： $E_{o ff}$ 正温系数大 → 高频工作时容易找不到稳定点
任何器件在线性区（饱和区）都不稳定（Spirito 效应，见 MOSFET 页）

并联器件的热失控

并联器件多了一种"热失控传染"机制——一颗温度漂高 → 其他颗共享分担 → 漂高那颗温度回升不下来 → 分担更多。关键防护是选正温度系数器件,温度高电流减少自动均流。

多个器件并联时，电-热耦合变成更复杂的多器件问题：

MOSFET 并联（通常安全）：

$R_{D S (o n)}$ 正温系数 → 热的那个电阻大 → 承担更少电流 → 自动均流
条件：散热和封装对称

IGBT 并联：

NPT / FS 的 $V_{CE (s a t)}$ 正温系数 → 也能自动均流
但如果某个 IGBT 散热差（如 TIM 涂不均），它会先热，承担更多开关应力，可能先失效

最坏情况：散热不均 + 热失控

预防：

严格的热界面工艺（所有器件一致）
每个器件用独立温度传感器监测
降额使用（留 20～30% 热余量）

5. 导热界面材料 (TIM)

TIM 是 $R_{t h}$ ,cs 的决定因素。选错 TIM 或涂覆工艺不当，可使 $R_{t h}$ ,cs 偏差 ±50%，让精心计算的热设计方案当场失效。

TIM 四大类对比

TIM(Thermal Interface Material) 四大类按"热导率 × 寿命 × 工艺"三维分——硅脂便宜但易干涸、相变材料中等、烧结银昂贵但寿命长、铟金属薄片极优但贵。EV 主驱选烧结银是趋势。

类型	λ (W/m·K)	$R_{t h}$ ,cs (40 cm²)
导热膏	3～8	～0.05 K/W
导热垫	3～6	～0.1 K/W
相变材料	3～8	～0.04 K/W
烧结银	150～200	～0.001 K/W
焊接	20～60	～0.005 K/W

工艺与适用：导热膏可重工适合大多数场景；导热垫有绝缘性；相变材料加热自填充适合复杂表面；烧结银高温高压不可重工适合 SiC；焊接不可拆卸用于芯片到 DBC。

烧结银——SiC 时代的革命

烧结银（Sintered Ag）的热导率 150～200 W/m·K，是普通导热膏的 25～50 倍。相同厚度下 $R_{t h}$ ,cs 降低两个数量级。

工艺：

银膏涂覆（类似焊料）
高温 (～250 °C) + 高压 (20 MPa) 烧结
银颗粒在固态下互相扩散融合
形成的银层无孔、无流动、长期稳定

优势：

极低 $R_{t h}$
无液态相，不会"漏"或"流动"
长期热循环下不退化（比导热膏寿命长 10+ 倍）
$T_{j}$ ,max 耐受 250 °C+（适合 SiC 高温应用）

劣势：

不可重工 —— 一旦烧结，要拆下器件就得用专门工艺破坏烧结层
设备贵、工艺复杂
对装配精度要求高

应用：现代高端 SiC 模块（Infineon CoolSiC Easy、Rohm BSM180-series）几乎都用烧结银做芯片到 DBC 的连接。烧结银 + Si_3N_4 AMB 基板是当前 SiC 模块散热的"顶配组合"。

涂覆工艺的影响

散热膏涂覆的三个常见错误：

涂太厚：典型推荐 50～100 μm，但手工涂常常到 200～300 μm。每多 100 μm 会让 $R_{t h}$ ,cs 增加约 0.05 K/W（对 40 cm² 而言），足以让结温涨 10 °C。
涂不均：空气隙会让局部热阻暴涨，热点集中。
重工后没清理干净：残留的老导热膏会和新的不兼容，形成劣质界面。

工程实务：

用自动涂覆设备（丝网印刷、点胶机）
控制用量，让 TIM 均匀分布
按数据手册规定的扭矩和顺序拧螺丝，让 TIM 均匀挤压
定期保养维护（有些 TIM 会随温度循环退化）

一个定量对比

把同样的散热场景用四种 TIM 实测对比——下表给出实际 $R_{t h (c - s)}$ 数值。差异可达 5-10×,对设计影响巨大。

TIM 方案	λ	$R_{t h}$ ,cs
导热膏(理想)	5 W/m·K	0.05 K/W
导热膏(不均)	有效 2	0.125(+150%)
导热膏(太厚)	5 W/m·K	0.15 K/W
烧结银	175	0.0007 K/W

IGBT 模块底板与散热器接触面 40 cm²，在 P = 80 W 时：

正常导热膏：ΔT_cs = 4 K
不均导热膏：ΔT_cs = 10 K（高 6 K）
太厚导热膏：ΔT_cs = 12 K
烧结银：ΔT_cs < 0.1 K（几乎可忽略）

结论：在 SiC 高功率密度模块里，烧结银几乎把 $R_{t h}$ ,cs 从热路里抹掉了，剩下的热阻几乎全部来自散热器本身。

6. 功率循环寿命——Coffin-Manson 模型

焊线疲劳、DBC 分层是 IGBT 和 SiC 模块的典型寿命终结机制。它们由温度摆幅 ΔT_j 驱动的热机械应力累积引起——不是"过温烧毁"，而是"冷热循环老化"。

失效机制

TIM 失效两条主路径——干涸(硅脂中油分挥发)、分层(CTE 失配机械应力)。两者都让 $R_{t h (c - s)}$ 飙升,温度跟着失控。寿命估算用 Arrhenius + 热循环组合。

关键变量：ΔT_j（温度摆幅），不是 $T_{j}$ ,max（峰值温度）。ΔT_j 越大，寿命越短。

Coffin-Manson 幂律

功率循环寿命的经典模型：

$N_{f} = A \times Δ T_{j}^{(} - n) \times e x p (E_{a} / (k \times T_{j}, m e an))$ 其中：

$N_{f}$ ：寿命循环次数
ΔT_j：每次循环的温度摆幅
$T_{j}$ ,mean：平均结温（开尔文）
n：Coffin-Manson 指数，典型 5～6
A、 $E_{a}$ ：材料和工艺常数，由厂商加速寿命测试得到

核心启示：ΔT_j 的指数关系极其敏感。

ΔT_j 减半 → 寿命 ×2^5 = 32 倍
ΔT_j × 1.5 → 寿命 / 7.6
ΔT_j × 2 → 寿命 / 32

每减少 10 K 的 ΔT_j，寿命增加 1.5～2 倍（按 n=5 计算）。

工程启示

降低 ΔT_j 的手段（按优先级）：

降低开关损耗（换 SiC、减小开关频率、优化 $R_{G}$ ）→ 直接减小每个 ΔT_j
增大散热能力（大散热器、液冷）→ 降低 $T_{j}$ ,avg 和 ΔT_j
提高热容（在芯片和散热器之间加相变材料）→ 吸收瞬时峰值
增大热时间常数（厚 DBC、大陶瓷）→ 平滑 ΔT_j
减缓工况变化（软启动、斜率限制）→ 不让 ΔT_j 突然变大

举例：EV 电机控制器的寿命分析

一个 EV 逆变器的工作循环（简化）：

加速： $P_{p e ak}$ = 100 kW，30 秒，ΔT_j = 50 K
巡航：P = 20 kW，30 分钟，ΔT_j = 15 K
刹车： $P_{p e ak}$ = 40 kW（再生制动），20 秒，ΔT_j = 20 K

主要损伤来自加速（ΔT_j = 50 K）。

用 Coffin-Manson 估计：

假设 $N_{f}$ (ΔT_j = 50 K) = 100,000 次
若 ΔT_j 可压到 30 K： $N_{f}$ = 100,000 × (50/30)^5 = 1.3 × $1 0^{6}$ 次（寿命 13 倍）
若 ΔT_j 涨到 70 K： $N_{f}$ = 100,000 × (50/70)^5 = 18,500 次（寿命 1/5）

设计决策：在加速期间限制峰值功率，可以显著延长模块寿命。EV 里的"限功率加速"经常不是为了保护电池，而是为了保护逆变器模块的寿命。

AQG324——汽车模块的寿命测试标准

ECPE AQG 324 是功率半导体模块的汽车级可靠性测试标准。包括：

Power Cycling (PC)：功率循环测试，ΔT_j 大（60～90 K），快速循环（几秒一次）
Thermal Cycling (TC)：环境温度循环，−40 ～ +125 °C，数千次
HTRB / HTGB：高温偏置测试（和 AEC-Q101 共享）
H3TRB：高温高湿
Vibration：振动
Mechanical Shock：机械冲击

通过 AQG 324 的模块可以在汽车应用中使用。Infineon CoolSiC Easy、Rohm BSM 系列、ST ACEPACK 都是 AQG 324 合格产品。

7. LDO 的热管理困境

LDO（低压差线性稳压器）是一个"热管理陷阱"——功率耗散 = ( $V_{in}$ − $V_{o u t}$ ) × $I_{o u t}$ ，在大电流大压差场合热量暴涨。

为什么 LDO 热管理经常失败

典型小封装 LDO（SOT-23、SOT-89）没有散热片，全靠 PCB 铺铜散热：

SOT-23 的 $R_{t h}$ ,ja ≈ 200～300 K/W
SOT-89 的 $R_{t h}$ ,ja ≈ 80～150 K/W

一个反面教材：

从 5 V 转 3.3 V，输出 500 mA：

P = (5 − 3.3) × 0.5 = 0.85 W
T_j = 25 + 0.85 × 250 = 237.5 °C   ← 远超 150 °C 绝对极限

三种解决方案：

换大封装（SOT-89， $R_{t h}$ ,ja ≈ 100 K/W）： $T_{j}$ = 25 + 85 = 110 °C ✓
换 DC-DC 降压变换器（效率 90%+，损耗 ≈ 0.09 W）： $T_{j}$ = 25 + 0.09 × 250 = 47.5 °C ✓✓
降低输出电流（用两个 LDO 分担）

工程启示：LDO 只适合小电流或小压差场合。大电流 + 大压差的应用，优先考虑 DC-DC 而不是 LDO。这是系统架构层面的选择，不是热设计层面的。

8. 热管理失效模式图谱

热管理失效80% 都是"小问题积累成大问题"——TIM 干涸 / 焊层疲劳 / 散热风扇老化等都是缓变过程,Arrhenius 加速试验难复现。所以长期可靠性必须按 Coffin-Manson 数学外推,不能只靠 1000h 试验。

失效模式	根因	缓解措施
稳态 $T_{j}$ 超限	损耗/ $R_{t h}$ 估算偏乐观	温度裕量; 高温迭代
脉冲 $T_{j}$ 超限	用稳态估瞬态	$Z_{t h (t)}$ +瞬态仿真
电-热热失控	正温系数+散热不足	散热冗余; 限功率
并联不均流过热	散热不对称	对称布局; 独立监测
TIM 涂覆不均	工艺控制不良	自动涂覆; 扭矩控制
TIM 长期退化	硅油分离	选相变材料; 定期换
焊线疲劳	大 ΔT_j 累积应力	限功率; Cu 夹合封装
DBC 陶瓷分层	CTE 失配	Si_3N_4 AMB 替代
散热器堵塞	灰尘/风扇失效	定期清洁; 风扇冗余
冷却液流量下降	泵失效/泄漏	流量监测; 冗余泵
LDO 热失控	大电流大压差	换 DC-DC; 大封装
Spirito 热失控	$V_{t h}$ 负温系+大 $V_{D S}$	查 FBSOA; 限流

所有热管理的"坏事"汇总如上表（FMEA 速查）。

9. 热设计的九步流程

把本页所有内容整理成项目实战 9 步流程——从需求收集到 DV 验证。每一步都对应前面某个章节的工具/分析方法。

一个完整功率模块的热设计标准步骤如上图。

核心要点

热管理的欧姆定律： $T_{j}$ = $T_{a}$ + P × ΣR_th； $R_{t h}$ ,jc 由封装决定不能改， $R_{t h}$ ,cs 和 $R_{t h}$ ,sa 是设计空间。
$Z_{t h (t)}$ 描述瞬态响应：短脉冲下系统"看到"的热阻远小于稳态值，允许短时超功率工作。
Foster 网络是数据手册标准，但节点无物理意义；Cauer 网络节点对应实际物理层，可截断分析，但需要从 Foster 转换。
电-热耦合形成正反馈：IGBT 的 $E_{o ff}$ 从 25 °C 到 150 °C 翻倍，必须迭代计算损耗 → $T_{j}$ → 损耗。
热失控稳定性条件：dP/dT < 1/ $R_{t h}$ ；不满足则工作点不稳定， $T_{j}$ 持续上升到炸管。
TIM 四大类：导热膏（大多数）、相变材料（均匀）、烧结银（高性能 SiC，+ 25～50 倍热导率）、焊接（芯片级）。
烧结银是 SiC 模块热管理的关键——把 $R_{t h}$ ,cs 从热路里几乎消除。
Coffin-Manson 寿命 $\propto Δ T_{j}^{- n}$ （n ≈ 5～6）：ΔT_j 减半，寿命 ×32；这是为什么限功率加速能大幅延长模块寿命。
AQG 324 是汽车功率模块的可靠性测试标准，覆盖 PC、TC、HTRB、H3TRB、振动等。
LDO 热陷阱：大电流大压差场合热失控必然发生，优先用 DC-DC 或大封装。
热设计九步流程：工作点 → 损耗估算 → 降额 → $R_{t h}$ 预算 → 散热器 → 电-热迭代 → 瞬态校验 → 寿命校验。

延伸阅读与新动态

由 feed.py 每日自动追加；来源见各条链接。

2026-04-27 DRV8163S-Q1EVM: DRV8163-Q1thermal Impedance — 要点：DRV8163S‑Q1EVM 评估板针对 DRV8163‑Q1 MOSFET 驱动芯片提供了详细的热阻测量方法，揭示了芯片在不同散热条件下的结温上升规律，强调了合理的 PCB 铺铜与散热片布局对降低热阻的关键作用，并给出实际测得的 θJA 与 θJC 数据以指导设计师进行热管理。
关键数据：θJC（芯片至结）≈ 2.5 °C/W ｜ θJA（结…

Cross-references

← 索引
MOSFET 技术 — $R_{D S (o n)}$ 正温系数、Spirito 线性区不稳定
IGBT 技术 — $E_{o ff}$ 的 f( $T_{j}$ )、模块安装工艺对 $R_{t h}$ ,cs 的影响
SiC 器件（Silicon Carbide Devices） — Si_3N_4 AMB + 烧结银的顶配散热组合
栅极驱动（Gate Driver） — OTP 过温保护与 NTC 监测
功率电子学（Power Electronics） — 拓扑选择对损耗分布的影响
功能安全（Functional Safety） — 过温保护作为功能安全链路的一环
汽车电子（Automotive Electronics）
电路仿真工具（Circuit Simulation）
失效模式综合速查表（FMEA Quick Reference）
ISO 16750 环境条件测试
功率 PCB 设计
Si / SiC / GaN 功率器件横向对比
电源设计（Power Supply & LDO/Charge Pump）
半导体器件物理
topic-sic-power-module-datasheet
冷却系统设计 — thermal management 理论的实施层(5 段热阻链 + Pin-fin / 微通道 + TIM 选型)