HV 主驱逆变器 ISO 26262 安全概念:从 SG 到 TSC 到 FMEDA
本质与导读
本质 EV HV 主驱逆变器是 ISO 26262 最难的 item 之一:3 个 ASIL D + 1 个 ASIL B Safety Goal(意外加速 / 反向扭矩 / 突然失加速)加上 FTTI 200ms 时间预算,几乎决定了整个系统架构。IC 供应商以 SEooC 交付完整的 Part 3-6 安全 work products,被 Tier 1 / OEM reuse 进自己的 safety case,是把安全开发周期从 18 个月压到 6-9 个月的关键。
1. ISO 26262 V-cycle 与 IC 供应商的角色
1.1 V-cycle 五个 part 的角色
这一节先把“V-cycle 五个 part 的角色”的判断维度收拢到同一视图里,后面的表格用于横向比较各选项的边界。
| Part | 角色 |
|---|---|
| Part 3 | Item Definition + HARA + 功能安全概念(FSC) |
| Part 4 | 系统级开发(技术安全概念 TSC + 系统集成测试) |
| Part 5 | 硬件开发(硬件 FMEDA / 评估) |
| Part 6 | 软件开发(软件架构 / 单元测试) |
| Part 7 | 量产 / 运营 / 退役(Tier 1 主导) |
ISO 26262 还有 Part 8(支持过程)、Part 9(ASIL 相关分析)、Part 10/11(应用指南)。IC 供应商通常做 Part 3-6 的 work products,Part 7 是 Tier 1 量产责任。
1.2 为什么 IC 厂主动做"完整 work products"
传统模式:OEM 提需求 → Tier 1 设计 → 找 IC 厂买芯片。Tier 1 自己做 ISO 26262 全部安全工作,IC 厂只管芯片符合 SEooC 假设。
NXP / TI / Infineon 等头部 IC 厂的新策略:主动做完整的 Part 3-6 reference design(包括 Item Definition / HARA / FSC / TSC / 硬件软件架构),然后把所有 work products 发给 Tier 1 客户。Tier 1 拿来后:
- 如果应用匹配 → 直接 reuse,跳过 6-12 个月开发时间
- 如果应用差异 → 在 NXP 工作产品基础上改,只 review 差异部分
- 如果完全不匹配 → 当 starting point 提速,而不是从零
这是芯片销售模式从"卖硬件"升级到"卖工作产品 + 硬件"的实战路径——头部 IC 厂的护城河越来越深。
2. HV 逆变器 Item Definition
2.1 EV 主驱的边界
ISO 26262 严格要求 Item 边界(scope / boundaries / interfaces)清晰。HV 主驱逆变器典型边界:
- Scope:从 VCU(Vehicle Control Unit)收扭矩命令,驱动 AC 电机产生扭矩
- Boundaries:HV 输入(电池侧)/ AC 输出(电机侧)/ 12V LV 电源 / CAN 通信
- Interfaces:VCU(CAN / FlexRay)、电机(三相 + position resolver + temperature)、电池(HV 接触器 + DC 母线感应)、热管理(冷却液温度)
- Preliminary architecture:DC bus → IGBT/SiC 三相桥 → AC 电机
- Functional assumptions:CAN 通信延迟 < 5ms;电机相电流采样精度 ≥ 1%;HV 输入 200-800V;ambient -40 ~ +85°C
2.2 4 类 Hazard
这一节先把“4 类 Hazard”的判断维度收拢到同一视图里,后面的表格用于横向比较各选项的边界。
| Hazard | ASIL 等级 | 典型场景 |
|---|---|---|
| Unintended Self-Acceleration(车辆静止时自加速) | ASIL D | 等红灯时自冲过路口 |
| Unintended Reverse Acceleration(意外反向扭矩) | ASIL D | D 档却往后退 |
| Unintended Loss of Acceleration(突然失加速) | ASIL B | 高速行驶突然没动力,被追尾 |
| 高压触电(HV shock) | 不属功能安全(本征安全) | 隔离失效 |
注意:前两个 ASIL D 是因为 Severity S3(致命可能)+ Exposure E4(经常)+ Controllability C3(司机难纠正)三高叠加(查 ISO 26262-3 Table 4:S3+E4+C3 = ASIL D)。失加速降到 ASIL B 靠的是 controllability 降两档到 C1(司机可简单让出 / 靠边滑行,>99% 可控):同样 S3+E4,但 C3→C2 只到 ASIL C、C3→C1 才到 ASIL B——单说"C2"不足以从 D 降到 B。具体 S/E/C 以 OEM HARA 为准。
2.3 3 个 Safety Goal
从 Hazard 推出 Safety Goal:
- SG1:Avoid unintended acceleration while stopped — ASIL D
- SG2:Avoid reverse torque — ASIL D
- SG3:Avoid sudden loss of acceleration — ASIL B
每个 SG 都附带 FTTI(Fault Tolerant Time Interval):主驱逆变器 FTTI 通常 200ms——从故障发生到必须进入安全状态的最大时间。这个数字几乎决定了整个监控链路的设计预算(MCU 任务周期 / CAN 报文频率 / safety mechanism 响应时间)。
3. 功能安全概念(FSC,Part 3)
把 Safety Goal 分解成功能要求(FR)+ 功能安全要求(FSR)。NXP 参考设计 5 个 FR + 5 个 FSR:
| 编号 | 功能要求 / 安全要求 | ASIL | FTTI |
|---|---|---|---|
| FR1 | 接收并解释 VCU 扭矩命令 | QM | — |
| FSR1 | 检查命令完整性,故障时报警 | ASIL D | 200 ms |
| FR2 | 测量系统状态(相电流 / 电机位置 / 电池电压温度) | QM | — |
| FSR2 | 传感器反馈合理性检查,故障时报警 | ASIL D | 200 ms |
| FR3 | 控制相电流跟踪扭矩命令 | QM | — |
| FSR3 | 监控扭矩输出,故障时报警 | ASIL D | 200 ms |
| FR4 | 状态报告给 VCU | QM | — |
| FSR4 | 自身故障报告给 VCU | ASIL D | 200 ms |
| FSR5 | Safety Manager 收集故障并触发安全状态(扭矩停止) | ASIL D | 200 ms |
注意 FR 都是 QM(Quality Management,无 ASIL),FSR 都是 ASIL D。FR 是"功能上做什么",FSR 是"安全上保证什么不能错"——FR 出错只是用户体验差,FSR 出错才会违反 SG。
4. 技术安全概念(TSC,Part 4)
4.1 系统架构 + 故障检测点
把 FSC 落到具体系统架构。NXP 参考设计的 TSC 含 6 个主要监控模块:
- Battery Sensing + Battery Measure Fault Detect
- Motor Position Sensing(Resolver)+ MPS Measure Fault Detect
- Current Sensing + Current Measure Fault Detect
- Torque Processing(Estimation)+ Torque Comm. Fault
- Vehicle Communication Processing + Comm. Fault
- Power Failure Detection
每个模块的输出 fault 信号汇集到 Safety Manager,Safety Manager 再驱动 External Safety Logic(0 扭矩信号 + FS_ENB / FS_HS / FS_LS 三个 fail-safe 信号到 Motor Interface)。
4.2 Safe State 定义 — 3 个 ID 不是一个
EV 主驱的 safe state 不是"急停"——突然没扭矩会让车失控。但更细一层:主驱 safe state 有 3 个 ID,选哪个取决于车速(NXP HVINVERTERWPA4):
| ID | 描述 | 后果 | 适用工况 |
|---|---|---|---|
| SS_HSS | 短接 3 个 HS 开关(Active Short Circuit via high-side) | 电机绕组短路 → 短路电流走 HS IGBT 回流,扭矩 ≈ 0 | 高速(< 反电势导致 DC bus 反充) |
| SS_LSS | 短接 3 个 LS 开关(Active Short Circuit via low-side) | 同上,但走 LS IGBT 回流 | 高速,与 HSS 互为冗余 |
| SS_3PO | 6 个 IGBT 全开(3-Phase Open / Free-Wheel) | 电机自由滑行,无电气连接 | 低速(<10 km/h) |
关键规则:高速绝不能用 3PO——电机反电势会通过 IGBT 体二极管反充 DC bus,产生强制动力矩,瞬间峰值可达额定 3-5 倍,司机失去方向控制 + 易翻车。所以高速失效必须 ASC(SS_HSS 或 SS_LSS),低速才能 3PO。
为什么 HSS / LSS 都要做:某些 IGBT 失效模式(开路 / 短路 / 栅极 floating)可能让 HSS / LSS 之一无效;两路冗余 → 总有一路有效。NXP 参考 BOM 用 FS65 SBC 的 FS_ENB / FS_HS / FS_LS 三个独立信号驱动外部 safety logic 实现这两组。
选哪一侧短接是故障驱动的,不只看速度:NXP 白皮书的原始术语是 3PSHS(three-phase high-side short,= 本页 SS_HSS)、3PSLS(three-phase low-side short,= SS_LSS)、three-phase open(= SS_3PO)。它给的选择规则是——high-side short 故障 → 用 3PSHS(三相短到电池);high-side open 故障 → 用 3PSLS(三相短到地),高速下。即顺着已发生故障所在的那一侧去补全短路,而非无脑进某个固定 ASC。这正是高 / 低侧驱动通道必须彼此独立的根因:单点故障不能同时让两侧失效,否则无法在 3PSHS 与 3PSLS 之间选择反应。
速度阈值切换的策略:Safety Manager 持续监测 motor 转速;高于阈值(例如 100 rpm)走 HSS,低于走 3PO。这个阈值本身也是 ASIL D 数据——读错速度等于选错 safe state,所以位置传感器必双路冗余 + plausibility check。
4.3 Safe State 切换路径(物理)
具体实现路径(参照 STO 实现):
- PWM 信号停止(MCU 软件)
- 栅极驱动器供电关断(SBC FS0B 直驱)
- HV 接触器断开(VCU 协调,不在主驱本地做)
前两个在 FTTI 200ms 内完成是必须;第 3 个属于整车协调,可以稍慢但要在驾驶员接管前完成。
4.4 用 FTA / safety FMEA 推 Safety Mechanism
ISO 26262 推荐用 FTA(Fault Tree Analysis,自顶向下从 SG 反推)+ safety FMEA(自底向上从元件失效推影响)双向分析,识别:
- Single Point Fault(单点故障)→ 加 detection + reaction 降到 Latent Fault
- Latent Fault(潜伏故障)→ 加周期诊断检出
- Multi-Point Fault(多点故障)→ 通常假设独立性 + 周期诊断的 dual-mode 失效率可忽略
每个被识别出的故障都在 TSC 里写明:Detection(怎么发现) + Reaction(发现后做什么) + Reaction Time(< FTTI / DTI)。
4.5 三段嵌套 FTTI 预算决定机制分层
safe state 选对了还不够——多快进入同样是 ASIL D 约束。NXP 白皮书把这个时间预算拆成三段数量级递减的嵌套窗口,这比单一的"FTTI 200ms"更能解释架构为什么长这样:
| 层级 | 预算 | 谁来满足 | 为什么是这个数量级 |
|---|---|---|---|
| Safety Goal 级 | 200 ms | MCU safety manager(检测 + 决策) | 扭矩故障到车辆失控的物理窗口,留给软件诊断链 |
| Motor interface 反应 | ~100 µs | GD3100 reaction channel(decision + reaction) | 从决定进 safe state 到三相真正短接的执行预算 |
| 桥臂短路保护 | < 2 µs(IGBT,SiC 更快) | GD3100 硬件内部(独立于 MCU) | 直通短路会在 µs 级烧毁整桥,MCU 根本来不及 |
这三个数量级差(200ms / 100µs / 2µs)直接决定了"哪个机制必须放进硬件、哪个能留给软件":桥臂短路快到必须由 gate driver 在芯片内独立完成(GD3100 quick short-circuit protection,且用 SSD 2LTO 关断整形防 destructive overshoot),软件无论如何来不及;200ms 的 SG 级预算才轮得到 MCU 跑诊断链。把这三段画在一条时间轴上,就能一眼看出 gate driver 为什么必须有自主短路保护、而不能等 safety manager 发指令。GD3100 自身按 ASIL D 流程开发、检出 99% 自身故障,并经 redundant interface / channel 上报与执行反应。
5. 硬件 FMEDA(Part 5)
把 TSC 里的 safety mechanism 算成 FMEDA 数字:
- :元件总失效率(FIT)
- :安全失效率(失效但不影响 SG)
- :Dangerous Detected(被诊断捕获的危险失效)
- :Dangerous Undetected(漏检的危险失效)
ASIL D 要求:
- SPFM(Single Point Fault Metric)≥ 99% =
- LFM(Latent Fault Metric)≥ 90%
- PMHF(Probabilistic Metric for Hardware Failures)≤ 10 FIT
工程上 PMHF 是最难达标的——典型主驱逆变器器件失效率 ~30 FIT,要降到 10 FIT 必须靠诊断把 70% 失效转成 detected。详见 DFA / FMEDA / FTA。
5.1 IC FMEDA → System FMEDA 的 regrouping 陷阱
NXP HVINVERTERWPA4 提了一个常被忽视的细节:IC 级 FMEDA 太细,直接搬到 system FMEDA 会爆表。例如 gate driver IC 内部逻辑可能有数十个失效模式,system 看其实只关心 "internal logic faulty" 这一个。所以要 regroup:把 IC FM 聚合成 system FM,带 + + 三个数。
但有些 IC pin 必须保留细节——比如 PMIC 的 "ignition input" pin,其失效由 system 层 SM 检测(IC 自己不能,因为是输入),如果跟"PMIC 内部逻辑"合并就会被误判为"内部 SM 覆盖" → SPF 漏算。判定规则:任何由 system SM 而非 IC SM 保护的 IC pin / 子块,必须保持独立行,不能跟"IC 内部"合并。
6. NXP Safety Inverter Library — 软件栈
NXP 不只交 IC,还交一份配套软件库,让 Tier-1 跑通 safety stack 而不是从零造。简化架构(NXP HVINVERTERWPA4 Figure 13):
| 层 | 模块 | 职责 |
|---|---|---|
| 顶 | Safety Application | 用户特定的安全应用代码 |
| 中 1 | Checkers Library | 周期性诊断函数集合(motor intense check / torque monitoring / sensor plausibility / ...) |
| 中 2 | Safety Manager | 故障计数 + 阈值判定 + 触发 reaction;init phase 通过 fault injection 自检 checkers |
| 中 3 | Reactions Sequencer | 一旦 Safety Manager 决定进 safe state,负责按顺序执行物理切换 |
| 中 4 | Memory Mgmt | 隔离 QM core 与 ASIL D core 的内存域 |
| 中 5 | ICC(Inter-Core Comm) | 非安全核(QM motor control)与安全核(ASIL D safety check)的通信 |
| 中 6 | Scheduler | 各 task 周期触发 / 抢占 |
| 底 | HAL | 屏蔽 MCU/SBC 细节 |
核心设计点:
- QM core 跑 motor control(高带宽 FOC),ASIL D core 跑 safety(诊断 + Safety Manager + Reactions)——双核分工对应 topic-freedom-from-interference 的 freedom-from-interference
- Memory Mgmt + ICC 是 FFI 实现的关键——没有这两块,QM 核错误能污染 ASIL 核
- Safety Manager init 阶段对 checkers 做 fault injection —— 确认每个 checker 真能 detect,不只是"安装了"
7. SEooC Tier-2 视角的工作
NXP 不是 Tier-1,它做的是 SEooC(Safety Element out of Context,见 topic-seooc)—— OEM 的 SG 拿不到,只能自己假设一组 SG 跑全套 Part 3-6 流程,把"我假设 OEM 这样想"做成 reference design 交给 Tier-1。
NXP 假设的 3 个 SG(基于"一般 EV inverter"的反推):
| SG | 描述 | ASIL |
|---|---|---|
| SG1 | Avoid unintended self acceleration while stopped | ASIL D |
| SG2 | Avoid reverse torque | ASIL D |
| SG3 | Avoid sudden loss of acceleration | ASIL B |
Tier-1 拿到这份 reference design,比对自己拿到的真实 OEM SG:
- 完全匹配 → 直接用 NXP TSC + FMEDA,节省 3-6 月开发
- 部分匹配 → 跑 gap analysis,补足差异
- 显著差异 → 不能复用,但 NXP 的 TSC / FMEDA 仍是宝贵参考起点
这就是 IC supplier 在 V-cycle 里的标准玩法。SEooC 的核心契约是 Safety Manual + Assumptions of Use——NXP 必须明确写 "I assume OEM does X / not Y",Tier-1 看到 AoU 后才知道 reference 适不适配。
核心要点
- HV 主驱逆变器有 3 个 ASIL D + 1 个 ASIL B Safety Goal,FTTI 通常 200ms
- ISO 26262 V-cycle 标准路径:Item Definition → HARA → FSC(Part 3) → TSC(Part 4) → 硬件 FMEDA(Part 5) + 软件架构(Part 6)
- IC 供应商主动做完整 Part 3-6 work products(SEooC)是新趋势,可压缩 Tier 1 安全开发周期 6-12 月
- FR(功能要求)是 QM,FSR(功能安全要求)才是 ASIL D — 区分本质是"用户体验差"vs"违反 SG"
- Safe state 不是"急停",是"0 扭矩 + 自由滑行 + 司机能干预";具体路径靠 PWM 停 / 栅极供电断 / HV 接触器断三件套
- ASIL D 硬件指标:SPFM ≥ 99% / LFM ≥ 90% / PMHF ≤ 10 FIT;PMHF 最难,靠周期诊断把 70%+ 失效转成 detected
Engineering Objects
引用此页的结构化 Engineeri…
引用此页的结构化 Engineering Object(v2.0 Copilot 自动生成,不要手动编辑此段)。
- case ·
case_main_drive_inverter_asil_d— 800V SiC Main-Drive Inverter ASIL D - case ·
case_sg2_reverse_torque_asil_d— SG2 — 避免反向扭矩 (ASIL D) - diagnostic ·
diagnostic_motor_position_sensing— 电机位置 / 速度传感 - diagnostic ·
diagnostic_torque_plausibility_check— 扭矩合理性检查 - failure_mode ·
failure_mode_low_speed_torque_lock— 低速扭矩锁死 - mechanism ·
mechanism_safety_state_manager— Safety State Manager (SSM) - mitigation ·
mitigation_asc_hss— Active Short Circuit via High-Side (SS_HSS) - mitigation ·
mitigation_asc_lss— Active Short Circuit via Low-Side (SS_LSS) - mitigation ·
mitigation_safe_torque_off— STO Safe Torque Off - mitigation ·
mitigation_three_phase_short— 3PO Three-Phase Short Circuit (ASC)
Cross-references
- ← 索引
- 功能安全(Functional Safety):FuSa 总框架
- HARA:Hazard Analysis Risk Assessment 详细方法
- 扭矩安全(Torque Safety ASIL D):本页 SG1/SG2/SG3 的具体技术实现
- ISO 26262 硬件要素三类分类:硬件分类决定 FMEDA 方法
- DFA / FMEDA / FTA:安全分析方法论
- SEooC:IC 供应商交付 work products 的概念基础
- MCU + SBC ASIL D 集成:本 TSC 的 MCU+SBC 实现层
- Safety Case:TSC 与 Safety Case 的关系
- ASIL 分解(ASIL Decomposition):D 分解为 B+B 等组合
- 软件 ASIL D:Part 6 软件架构对应
- IEC 61508 概览:ISO 26262 的母标准
- 工业 vs 汽车功能安全:标准对照