冷却系统设计 — 液冷 / 油冷 / TIM / 微通道
本质 冷却系统不是"加个水冷板"那么简单——它是把 die 结上几百瓦热量沿着 5 段串联热阻(die→DBC→solder→baseplate→TIM→cooler→coolant)运到外界,任一段是瓶颈整链失败。SiC / 800V 时代功率密度提升让传统单面液冷 R_thJC ~ 0.3 K/W 不够用——必须升级到双面冷却(R ~ 0.15)、Pin-fin 直接水冷(R ~ 0.10)、甚至微通道直接液冷(R ~ 0.05)。最容易踩的坑:工程师过度优化电气参数,忽视了 TIM 的热阻在整链占 30-50%——一颗 0.5 K/W 的 TIM 就让前面 95% 的热设计努力白费。本页拆 5 段热阻链 + 4 类冷却方式 + Pin-fin / 微通道几何设计 + TIM 选型 + 流量 / 压降 + 主驱实例 + 5 反模式。
学习目标
读完本页后,你应该能够:
- 说出 die-to-coolant 5 段串联热阻链 + 各段典型贡献占比
- 区分 4 类冷却方式(单面液冷 / 双面液冷 / 直接 pin-fin / 微通道)的 R_thJC 与适用功率
- 用 Pin-fin 几何设计 4 参数(pin 高度 / 直径 / 间距 / 排列)优化 thermal performance
- 选 TIM(thermal interface material)按 5 维考虑(导热率 / 厚度 / 流变 / 老化 / 装配)
- 计算 冷却液流量 + 压降:200 kW 主驱典型 8-15 L/min,压降 < 30 kPa
- 写出 800V SiC 主驱的典型冷却配置(双面 pin-fin + 50/50 水乙二醇 + 12 L/min)
- 识别 5 个冷却反模式(忽视 TIM / 流量不够 / 气泡 / 漏液 / 装配压力)
1. 5 段串联热阻链
热量从 die 到冷却液要穿过 5 层物理界面——每层都有自己的热阻,整链总热阻 = 5 段相加。理解每段的典型贡献是优化方向选择的前提。
1.1 5 段热阻典型贡献
下面这条贡献占比表是 80% 项目优化精力的指南针——TIM 占 30-50%(最大)说明它是 ROI 最高的优化点,模块层(die-attach + DBC + baseplate)合计 < 30% 是器件厂决定我们改不了。
| 段 | 含义 | R_th 典型(K/W) | 占比 | 优化空间 |
|---|---|---|---|---|
| Die → DBC(die-attach) | solder 或 sintered Ag | 0.05-0.10 | 20-30% | Ag 烧结 vs SAC305 焊料 |
| DBC ceramic( / AlN / ) | 陶瓷基板 | 0.03-0.08 | 10-20% | AlN > > |
| DBC → Baseplate | solder | 0.02-0.05 | 5-15% | 改进焊料 |
| Baseplate(Cu / AlSiC) | 金属底板 | 0.02-0.05 | 5-15% | 厚度 + 材料 |
| TIM(thermal grease / pad) | 热界面材料 | 0.10-0.30 | 30-50% | 选型 + 厚度 + 装配 |
| Cooler interface(plate to fin) | 冷板内部 | 0.05-0.15 | 20-30% | pin-fin / 微通道 |
| Total R_thJA | 全链 | 0.30-0.70 | 100% | - |
1.2 TIM 是最大可优化项
TIM 占整链 30-50% 但易被忽视——前 4 段都是器件 / 模块厂内决定,工程师能控制的只有 TIM 选型 + 装配。TIM 优化是 ROI 最高的热设计动作:
- 换 0.3 W/m·K 普通硅脂 → 8-10 W/m·K 高性能 TIM,整链 R 下降 40%
- 等效器件结温下降 10-15°C,寿命延长 4-8 倍(Arrhenius)
2. 4 类冷却方式
冷却按"接触方式"分 4 类——R_thJC 差 5 倍,适用功率密度差 10 倍。
2.1 4 类对比
4 类冷却R_thJC 差 5 倍,适用功率密度差 10 倍——选型主要靠"目标功率"反推冷却方式,然后倒推预算 / 复杂度。
| 方式 | R_thJC(K/W) | 适用功率 | 复杂度 | 代表 |
|---|---|---|---|---|
| 单面液冷板 | 0.20-0.30 | < 100 kW | 低 | 早期 EV 主驱 / 工业 |
| 双面液冷板 | 0.10-0.15 | 100-200 kW | 中 | 主流 EV 主驱(Bosch / Hitachi nHPD²) |
| 直接 pin-fin baseplate | 0.05-0.10 | 200-300 kW | 中高 | Wolfspeed XM3 / Tesla Plaid |
| 微通道直接液冷 | 0.03-0.05 | > 300 kW | 高 | 仿真 / 样件,少数量产 |
2.2 单面 vs 双面液冷
单面 vs 双面根本差异是热路径数量——单面只用 die 底面,双面同时用底面 + 顶面,有效 die 利用面积从 50% 提升到 90%+。
| 维度 | 单面 | 双面 |
|---|---|---|
| 热路径 | 仅底面 | 底面 + 顶面(铜片或 fluid) |
| R_thJC | 0.3 K/W | 0.12 K/W |
| die area 利用 | 50% | 90%+ |
| 额外硬件 | 无 | 顶部冷却结构 + 顶部 TIM |
| 量产难度 | 低 | 中(顶部接触均匀性) |
双面冷却的隐藏代价:顶部 TIM 接触压力 + 均匀性 + 装配公差比底部难得多——这是 Bosch / Hitachi 量产 nHPD²几年才搞定的工艺挑战。
2.3 Pin-fin 直接水冷
Pin-fin 直接水冷 省掉"baseplate + TIM + cold plate"3 段——baseplate 本身就是 pin-fin,直接浸在冷却液中。
| 优点 | 代价 |
|---|---|
| R_thJC 直接 0.05-0.10 K/W | 模块需特殊设计(Wolfspeed XM3 等) |
| 无 TIM 接触不均问题 | 冷却液必须严格无颗粒(过滤要求高) |
| 体积小(集成度高) | 冷却液与电气模块直接接触,密封要求高 |
3. Pin-fin 几何设计
Pin-fin 的4 参数决定 thermal vs hydraulic 权衡——优化目标是"R 最低 + 压降最低 + 重量最轻"。
3.1 4 参数典型范围
Pin-fin 4 参数互相耦合——单独优化某一参数会让其他参数恶化。下表给出实务上的范围 + 单参数变化的方向影响。
| 参数 | 典型范围 | 影响 |
|---|---|---|
| 高度 H | 5-15 mm | ↑ → R↓ 但压降↑ |
| 直径 D | 1-3 mm | ↓ → 表面积↑ 但 D < 1 mm 时压降爆增 |
| 间距 P | 1.5-3 × D | ↓ → 表面积↑ 但易堵 |
| 排列 | inline / staggered | staggered 比 inline R 低 15-25% 但压降高 |
3.2 设计 trade-off
Pin-fin 设计在"R_th"和"压降 ΔP"之间做 trade-off——常用 Nu / f 比值(Colburn factor / friction factor)做单一指标优化。
| 优化目标 | 取舍 |
|---|---|
| 最小 R | 短宽间距 + staggered + 高度 12 mm |
| 最低压降 | 长稀间距 + inline |
| 平衡设计(实务) | H=8mm,D=2mm,P=4mm,staggered |
3.3 制造 vs 设计
Pin-fin 制造方式 决定了实际可达的几何精度:
| 方式 | 最小 D | 适用 | 成本 |
|---|---|---|---|
| CNC 加工 | 2 mm | 量小研发 | 高 |
| 冷锻 / 挤压 | 1.5 mm | 量产中等 | 中 |
| 铸造 + 机加工 | 2 mm | 大批量 | 低 |
| 3D 打印(粉末床) | 0.5 mm | 仿真 / 高端 | 极高 |
4. TIM 选型 5 维
TIM 不是"硅脂涂厚一点就行"——5 个维度交叉决定最终性能。中国工程师最常忽视流变 / 老化两维。
4.1 5 维细节
TIM 选型5 维不能漏一——前 2 维(k / 厚度)是性能,后 3 维(流变 / 老化 / 装配)是寿命与产线兼容性,中国工程师常忽视后 3 维。
| 维度 | 含义 | 典型范围 |
|---|---|---|
| 导热率 k | W/m·K,越高越好 | 0.3(普通硅脂) ~ 12(高端 SLM gel) |
| 厚度 BLT(Bond Line Thickness) | 实际界面厚度 | 25-200 μm,越薄越好但不能 0 |
| 流变性 rheology | 装配时填隙 vs 长期不流失 | tradeoff |
| 老化 aging | 1000h+ 工作后 k 降幅 | 5-20%(优秀的) |
| 装配 assembly | 涂胶 / 贴膜 / pad 自动化难度 | 影响产线 cycle time |
4.2 TIM 类型对比
TIM 6 大类导热率差几十倍——但贵的不一定好(液态金属 k 极高但腐蚀风险),实务里相变 PCM 和 TIM pad 是车规主流。
| 类型 | k(W/m·K) | 优点 | 缺点 |
|---|---|---|---|
| 传统硅脂(Shin-Etsu G-746) | 1-3 | 便宜 / 流变好 | 老化干裂 / pump-out |
| 金属硅脂(Arctic Silver) | 8-9 | 高 k | 含金属粒子 / 价格 |
| 相变 PCM(Honeywell PTM7000) | 5-8 | 老化好 / 装配 pad | k 略低 |
| 液态金属(镓铟) | 30-80 | 极高 k | 腐蚀 Al / 短路风险 / 难处理 |
| 石墨片(Panasonic PGS) | 700-1500 in-plane | 各向异性高 / 0 厚度 | 几乎只用作平面散热,Z 向差 |
| TIM pad(Henkel Bergquist) | 3-6 | 装配快 / 一致性好 | k 稍低 |
4.3 车规优选
车规 EV 主驱主流 TIM 是相变 PCM 或高性能 TIM pad——综合 k(5-8) + 老化(15 年保持 80%+ k) + 装配(自动化贴膜)。避免传统硅脂(pump-out + 老化干裂 + 维修不便)。
5. 流量 / 压降 / 冷却液
冷却液3 个工程参数决定系统级性能:流量、压降、温度。
5.1 流量计算
流量由 heat removal 反推:
例:200 kW 主驱,效率 97% → 损耗 6 kW,允许冷却液 ΔT = 10°C,水乙二醇 50/50 ( kg/m³, J/kg·K):
5.2 压降约束
车规冷却泵压降通常 < 50 kPa——超出会让泵选型成本激增。
| 压降组成 | 典型贡献 |
|---|---|
| 主驱模块 cold plate | 15-30 kPa @ 10 L/min |
| Hose 管路 | 5-10 kPa |
| Connector / fitting | 2-5 kPa |
| Heat exchanger / radiator | 10-20 kPa |
| Total system | 30-65 kPa |
5.3 冷却液选择
冷却液 4 类按"是否绝缘 / 是否抗冻"分——EV 主驱事实主流是水/乙二醇 50/50(与电池共回路),油冷限于特殊场景。
| 冷却液 | 优点 | 缺点 |
|---|---|---|
| 去离子水 | k=0.6 W/m·K,c_p 高 | 0°C 结冰,腐蚀 |
| 水 / 乙二醇 50/50 | -40°C 不冻 | k 降到 0.4 W/m·K |
| 油(矿物油 / 合成酯) | 绝缘,可直接喷淋 | k 仅 0.13 W/m·K |
| 氢氟醚 HFE(3M Novec) | 沸点低,两相冷却 | 极贵 |
EV 主驱事实标准:水 / 乙二醇 50/50(与电池冷却共用回路时简化设计)。
6. 800V SiC 主驱实例
下面是 200 kW 800V SiC 主驱的典型冷却配置(参考 Wolfspeed XM3 reference design + Bosch 量产案例):
6.1 配置清单
下面 9 行参数是 200 kW 主驱量产项目的事实标准配置——XM3 + 50/50 水/乙二醇 + 12 L/min + Tj 留 25°C 裕量。
| 元件 | 规格 | 备注 |
|---|---|---|
| 冷却方式 | 双面 pin-fin direct cooling | XM3 集成 |
| 冷却液 | 50/50 水/乙二醇 | 与电池共回路 |
| 流量 | 12 L/min(峰值) | 计算损耗 6.5 kW |
| 入口温度 | 65°C(车标准) | radiator 后 |
| 出口温度 | 75°C(ΔT 10°C) | 设计点 |
| 系统压降 | < 40 kPa | 冷却泵 50 W |
| TIM(顶部) | Henkel Bergquist GP3000ULM pad | k=3 W/m·K |
| R_thJC | 0.08 K/W | XM3 datasheet |
| Tj 最大 | 150°C(SiC die)/ 175°C peak | 留 25°C 裕量 |
6.2 关键工程取舍
下面 3 个工程决策对应这条配置背后的真实权衡——没有 silver bullet,每个决策都对应代价。
- 双面 pin-fin 比传统单面 baseplate R 降 60%,但模块 + 冷板设计耦合度高(Wolfspeed 卖打包方案)
- Tj 留 25°C 裕量:实际最坏 case(高温 + 满载)Tj ≈ 150°C,SiC 200°C 限值留足空间
- 冷却液与电池共回路:简化整车 thermal management,但电池温度要求(20-45°C)与主驱(65-90°C)不同,需用阀切换或独立回路
7. 失效模式与防护
冷却系统有 5 类典型失效——任一发生都会快速触发 thermal trip / 主驱停机。
| 失效 | 触发 | 后果 | 防护 |
|---|---|---|---|
| 冷却液漏液 | hose 老化 / 接头松动 | 高压电气与液体接触 | leak detection + interlock + pyro fuse |
| 气泡(cavitation) | 流量过低 / 入口形状差 | 局部过热 | bleed 阀 + 流量传感器 |
| 冷却液堵塞 | 异物 / 结垢 | 局部 R 暴增 | filter + 入口压差监控 |
| 冷却液变质 | pH 漂移 / 添加剂耗尽 | 腐蚀 + 导电 | 5-10 年定期更换 |
| 泵失效 | 寿命到 / 卡死 | 流量归零 → 立即过热 | 泵双冗余(部分高端项目)+ NTC trip |
详见 热安全 — 给出降额曲线(Tj 120/150/175°C 三档)。
8. 5 个冷却系统反模式
冷却系统设计最常踩 5 个反模式——这 5 个让"R_thJC 数据漂亮但实际项目过不了热测试"。
| 反模式 | 表现 | 修法 |
|---|---|---|
| 忽视 TIM | 选了 R=0.05 K/W 模块,涂普通硅脂 0.3 W/m·K → TIM 一颗废全链 | TIM 列入 BOM 重要项,用相变 PCM 或高 k pad |
| 流量算不够 | 只按平均损耗算,忽视瞬态 / 不均匀 | 按峰值损耗 1.5× 留裕量,瞬态用 thermal capacity 缓冲 |
| 气泡 / cavitation | 入口气泡导致局部过热,几次后 die 永久损伤 | bleed 阀 + 入口流速 < 1 m/s + 慢启动 pump profile |
| 漏液隐患不防 | hose 老化没监控,漏液到电气端造成二次事故 | leak detection sensor + drain 槽 + interlock |
| 装配压力不当 | TIM 压力过大挤干 / 过小空气间隙 | 厂商 spec 标定扭矩 + 压力分布测试 |
8.1 忽视 TIM 的隐蔽危险
最致命的反模式:工程师拿了 Wolfspeed XM3 datasheet R=0.08 K/W,觉得"模块够好",涂普通硅脂(k=0.3 W/m·K)装配。实际 TIM 单层 R 增加 0.20 K/W,整链 R 从 0.08 飙到 0.28,等效热阻 3.5×——SiC 模块满载烧穿。修法:TIM 是模块 spec 不可分割的一部分,选型必须配套。
8.2 装配压力不当的隐蔽危险
TIM 装配靠正确扭矩 + 螺钉序列 + 时间——压力过大时 TIM 被挤出导致空气间隙(R 暴增),压力过小时 TIM 残留厚 BLT(R 也增)。修法:厂商通常给"扭矩规范"(例:Nm-按对角顺序-3 次扭矩升级),严格遵守;每月用红外热像随机抽测验证。
核心要点
- 热从 die 到冷却液穿过 5 段串联热阻:die→DBC→baseplate→TIM→cooler,任一段瓶颈整链失败
- TIM 占整链 30-50% 但最易优化 —— 是工程师能直接控制的最大 ROI 优化项
- 4 类冷却方式:单面液冷(< 100 kW)/ 双面液冷(100-200 kW)/ pin-fin 直接(200-300 kW)/ 微通道(> 300 kW)
- Pin-fin 4 参数:H / D / P / 排列;实务平衡 H=8mm,D=2mm,P=4mm,staggered → R=0.07,ΔP=20 kPa
- TIM 选 5 维:k / 厚度 / 流变 / 老化 / 装配——车规主流选相变 PCM 或高 k TIM pad
- 流量计算:,200 kW 主驱典型 9-12 L/min
- 冷却液:水 / 乙二醇 50/50 是 EV 主驱事实标准(与电池共回路)
- 800V SiC 200 kW 典型配置:双面 pin-fin + 12 L/min + Tj 留 25°C 裕量
- 5 反模式戒除:忽视 TIM / 流量不够 / 气泡 / 漏液不防 / 装配压力错
Cross-references
- ← 索引
- 热管理(Thermal Management) — 稳态 / 瞬态热阻、Cauer / Foster 模型基础
- 热安全(Thermal Safety) — 失效模式 + Tj 降额曲线
- 功率模块封装 — 模块层热路径设计
- SiC 功率模块 datasheet 解读 — datasheet 里的 R_thJC 数字含义
- SiC 器件 — Tj max + SCWT 时间裕量
- DC-Link 直流母线电容设计 — 电容自身发热也要冷却
- SiC MOSFET 并联设计 — 并联场景的均流 + 均温
- PCB 设计 — PCB 热传 + 散热铜皮
- 失效模式速查 — 热相关失效机制(Spirito / TR / wire-bond fatigue)
- 汽车电子 — 整车 thermal management 框架