HV 主驱逆变器 ISO 26262 安全概念:从 SG 到 TSC 到 FMEDA

功能安全L5别名 HV inverter safety concept · EV 主驱安全设计 · 功能安全概念 FSC · 技术安全概念 TSC · SG1 SG2 SG3 ASIL D · FTTI 200ms · 整车 SEooC 工作产品

本质与导读

本质 EV HV 主驱逆变器是 ISO 26262 最难的 item 之一:3 个 ASIL D + 1 个 ASIL B Safety Goal(意外加速 / 反向扭矩 / 突然失加速)加上 FTTI 200ms 时间预算,几乎决定了整个系统架构。IC 供应商以 SEooC 交付完整的 Part 3-6 安全 work products,被 Tier 1 / OEM reuse 进自己的 safety case,是把安全开发周期从 18 个月压到 6-9 个月的关键。

主线坐标:第 5 站 · 逆变器(栅驱 + 功率模块) · ↑ 全景主线

1. ISO 26262 V-cycle 与 IC 供应商的角色

1.1 V-cycle 五个 part 的角色

这一节先把“V-cycle 五个 part 的角色”的判断维度收拢到同一视图里,后面的表格用于横向比较各选项的边界。

Part角色
Part 3Item Definition + HARA + 功能安全概念(FSC)
Part 4系统级开发(技术安全概念 TSC + 系统集成测试)
Part 5硬件开发(硬件 FMEDA / 评估)
Part 6软件开发(软件架构 / 单元测试)
Part 7量产 / 运营 / 退役(Tier 1 主导)

ISO 26262 还有 Part 8(支持过程)、Part 9(ASIL 相关分析)、Part 10/11(应用指南)。IC 供应商通常做 Part 3-6 的 work products,Part 7 是 Tier 1 量产责任

1.2 为什么 IC 厂主动做"完整 work products"

传统模式:OEM 提需求 → Tier 1 设计 → 找 IC 厂买芯片。Tier 1 自己做 ISO 26262 全部安全工作,IC 厂只管芯片符合 SEooC 假设。

NXP / TI / Infineon 等头部 IC 厂的新策略:主动做完整的 Part 3-6 reference design(包括 Item Definition / HARA / FSC / TSC / 硬件软件架构),然后把所有 work products 发给 Tier 1 客户。Tier 1 拿来后:

  • 如果应用匹配 → 直接 reuse,跳过 6-12 个月开发时间
  • 如果应用差异 → 在 NXP 工作产品基础上改,只 review 差异部分
  • 如果完全不匹配 → 当 starting point 提速,而不是从零

这是芯片销售模式从"卖硬件"升级到"卖工作产品 + 硬件"的实战路径——头部 IC 厂的护城河越来越深。

2. HV 逆变器 Item Definition

2.1 EV 主驱的边界

ISO 26262 严格要求 Item 边界(scope / boundaries / interfaces)清晰。HV 主驱逆变器典型边界:

主驱逆变器 ISO 26262 概念阶段 — Item Definition → HARA(非预期转矩等危害定 ASIL D)→ 安全目标 → FSC(ASC/lockstep/采样 plausibility/看门狗)

  • Scope:从 VCU(Vehicle Control Unit)收扭矩命令,驱动 AC 电机产生扭矩
  • Boundaries:HV 输入(电池侧)/ AC 输出(电机侧)/ 12V LV 电源 / CAN 通信
  • Interfaces:VCU(CAN / FlexRay)、电机(三相 + position resolver + temperature)、电池(HV 接触器 + DC 母线感应)、热管理(冷却液温度)
  • Preliminary architecture:DC bus → IGBT/SiC 三相桥 → AC 电机
  • Functional assumptions:CAN 通信延迟 < 5ms;电机相电流采样精度 ≥ 1%;HV 输入 200-800V;ambient -40 ~ +85°C

2.2 4 类 Hazard

这一节先把“4 类 Hazard”的判断维度收拢到同一视图里,后面的表格用于横向比较各选项的边界。

HazardASIL 等级典型场景
Unintended Self-Acceleration(车辆静止时自加速)ASIL D等红灯时自冲过路口
Unintended Reverse Acceleration(意外反向扭矩)ASIL DD 档却往后退
Unintended Loss of Acceleration(突然失加速)ASIL B高速行驶突然没动力,被追尾
高压触电(HV shock)不属功能安全(本征安全)隔离失效

注意:前两个 ASIL D 是因为 Severity S3(致命可能)+ Exposure E4(经常)+ Controllability C3(司机难纠正)三高叠加(查 ISO 26262-3 Table 4:S3+E4+C3 = ASIL D)。失加速降到 ASIL B 靠的是 controllability 降两档到 C1(司机可简单让出 / 靠边滑行,>99% 可控):同样 S3+E4,但 C3→C2 只到 ASIL C、C3→C1 才到 ASIL B——单说"C2"不足以从 D 降到 B。具体 S/E/C 以 OEM HARA 为准。

2.3 3 个 Safety Goal

从 Hazard 推出 Safety Goal:

  • SG1:Avoid unintended acceleration while stopped — ASIL D
  • SG2:Avoid reverse torque — ASIL D
  • SG3:Avoid sudden loss of acceleration — ASIL B

每个 SG 都附带 FTTI(Fault Tolerant Time Interval):主驱逆变器 FTTI 通常 200ms——从故障发生到必须进入安全状态的最大时间。这个数字几乎决定了整个监控链路的设计预算(MCU 任务周期 / CAN 报文频率 / safety mechanism 响应时间)。

3. 功能安全概念(FSC,Part 3)

把 Safety Goal 分解成功能要求(FR)+ 功能安全要求(FSR)。NXP 参考设计 5 个 FR + 5 个 FSR:

编号功能要求 / 安全要求ASILFTTI
FR1接收并解释 VCU 扭矩命令QM
FSR1检查命令完整性,故障时报警ASIL D200 ms
FR2测量系统状态(相电流 / 电机位置 / 电池电压温度)QM
FSR2传感器反馈合理性检查,故障时报警ASIL D200 ms
FR3控制相电流跟踪扭矩命令QM
FSR3监控扭矩输出,故障时报警ASIL D200 ms
FR4状态报告给 VCUQM
FSR4自身故障报告给 VCUASIL D200 ms
FSR5Safety Manager 收集故障并触发安全状态(扭矩停止)ASIL D200 ms

注意 FR 都是 QM(Quality Management,无 ASIL),FSR 都是 ASIL D。FR 是"功能上做什么",FSR 是"安全上保证什么不能错"——FR 出错只是用户体验差,FSR 出错才会违反 SG。

4. 技术安全概念(TSC,Part 4)

4.1 系统架构 + 故障检测点

把 FSC 落到具体系统架构。NXP 参考设计的 TSC 含 6 个主要监控模块:

  • Battery Sensing + Battery Measure Fault Detect
  • Motor Position Sensing(Resolver)+ MPS Measure Fault Detect
  • Current Sensing + Current Measure Fault Detect
  • Torque Processing(Estimation)+ Torque Comm. Fault
  • Vehicle Communication Processing + Comm. Fault
  • Power Failure Detection

每个模块的输出 fault 信号汇集到 Safety Manager,Safety Manager 再驱动 External Safety Logic(0 扭矩信号 + FS_ENB / FS_HS / FS_LS 三个 fail-safe 信号到 Motor Interface)。

4.2 Safe State 定义 — 3 个 ID 不是一个

EV 主驱的 safe state 不是"急停"——突然没扭矩会让车失控。但更细一层:主驱 safe state 有 3 个 ID,选哪个取决于车速(NXP HVINVERTERWPA4):

ID描述后果适用工况
SS_HSS短接 3 个 HS 开关(Active Short Circuit via high-side)电机绕组短路 → 短路电流走 HS IGBT 回流,扭矩 ≈ 0高速(< 反电势导致 DC bus 反充)
SS_LSS短接 3 个 LS 开关(Active Short Circuit via low-side)同上,但走 LS IGBT 回流高速,与 HSS 互为冗余
SS_3PO6 个 IGBT 全开(3-Phase Open / Free-Wheel)电机自由滑行,无电气连接低速(<10 km/h)

关键规则:高速绝不能用 3PO——电机反电势会通过 IGBT 体二极管反充 DC bus,产生强制动力矩,瞬间峰值可达额定 3-5 倍,司机失去方向控制 + 易翻车。所以高速失效必须 ASC(SS_HSS 或 SS_LSS),低速才能 3PO。

为什么 HSS / LSS 都要做:某些 IGBT 失效模式(开路 / 短路 / 栅极 floating)可能让 HSS / LSS 之一无效;两路冗余 → 总有一路有效。NXP 参考 BOM 用 FS65 SBC 的 FS_ENB / FS_HS / FS_LS 三个独立信号驱动外部 safety logic 实现这两组。

选哪一侧短接是故障驱动的,不只看速度:NXP 白皮书的原始术语是 3PSHS(three-phase high-side short,= 本页 SS_HSS)、3PSLS(three-phase low-side short,= SS_LSS)、three-phase open(= SS_3PO)。它给的选择规则是——high-side short 故障 → 用 3PSHS(三相短到电池);high-side open 故障 → 用 3PSLS(三相短到地),高速下。即顺着已发生故障所在的那一侧去补全短路,而非无脑进某个固定 ASC。这正是高 / 低侧驱动通道必须彼此独立的根因:单点故障不能同时让两侧失效,否则无法在 3PSHS 与 3PSLS 之间选择反应。

速度阈值切换的策略:Safety Manager 持续监测 motor 转速;高于阈值(例如 100 rpm)走 HSS,低于走 3PO。这个阈值本身也是 ASIL D 数据——读错速度等于选错 safe state,所以位置传感器必双路冗余 + plausibility check。

4.3 Safe State 切换路径(物理)

具体实现路径(参照 STO 实现):

  1. PWM 信号停止(MCU 软件)
  2. 栅极驱动器供电关断(SBC FS0B 直驱)
  3. HV 接触器断开(VCU 协调,不在主驱本地做)

前两个在 FTTI 200ms 内完成是必须;第 3 个属于整车协调,可以稍慢但要在驾驶员接管前完成。

4.4 用 FTA / safety FMEA 推 Safety Mechanism

ISO 26262 推荐用 FTA(Fault Tree Analysis,自顶向下从 SG 反推)+ safety FMEA(自底向上从元件失效推影响)双向分析,识别:

  • Single Point Fault(单点故障)→ 加 detection + reaction 降到 Latent Fault
  • Latent Fault(潜伏故障)→ 加周期诊断检出
  • Multi-Point Fault(多点故障)→ 通常假设独立性 + 周期诊断的 dual-mode 失效率可忽略

每个被识别出的故障都在 TSC 里写明:Detection(怎么发现) + Reaction(发现后做什么) + Reaction Time(< FTTI / DTI)。

4.5 三段嵌套 FTTI 预算决定机制分层

safe state 选对了还不够——多快进入同样是 ASIL D 约束。NXP 白皮书把这个时间预算拆成三段数量级递减的嵌套窗口,这比单一的"FTTI 200ms"更能解释架构为什么长这样:

层级预算谁来满足为什么是这个数量级
Safety Goal 级200 msMCU safety manager(检测 + 决策)扭矩故障到车辆失控的物理窗口,留给软件诊断链
Motor interface 反应~100 µsGD3100 reaction channel(decision + reaction)从决定进 safe state 到三相真正短接的执行预算
桥臂短路保护< 2 µs(IGBT,SiC 更快)GD3100 硬件内部(独立于 MCU)直通短路会在 µs 级烧毁整桥,MCU 根本来不及

这三个数量级差(200ms / 100µs / 2µs)直接决定了"哪个机制必须放进硬件、哪个能留给软件":桥臂短路快到必须由 gate driver 在芯片内独立完成(GD3100 quick short-circuit protection,且用 SSD 2LTO 关断整形防 destructive overshoot),软件无论如何来不及;200ms 的 SG 级预算才轮得到 MCU 跑诊断链。把这三段画在一条时间轴上,就能一眼看出 gate driver 为什么必须有自主短路保护、而不能等 safety manager 发指令。GD3100 自身按 ASIL D 流程开发、检出 99% 自身故障,并经 redundant interface / channel 上报与执行反应。

5. 硬件 FMEDA(Part 5)

把 TSC 里的 safety mechanism 算成 FMEDA 数字:

  • :元件总失效率(FIT)
  • :安全失效率(失效但不影响 SG)
  • :Dangerous Detected(被诊断捕获的危险失效)
  • :Dangerous Undetected(漏检的危险失效)

ASIL D 要求:

  • SPFM(Single Point Fault Metric)≥ 99% =
  • LFM(Latent Fault Metric)≥ 90%
  • PMHF(Probabilistic Metric for Hardware Failures)≤ 10 FIT

工程上 PMHF 是最难达标的——典型主驱逆变器器件失效率 ~30 FIT,要降到 10 FIT 必须靠诊断把 70% 失效转成 detected。详见 DFA / FMEDA / FTA

5.1 IC FMEDA → System FMEDA 的 regrouping 陷阱

NXP HVINVERTERWPA4 提了一个常被忽视的细节:IC 级 FMEDA 太细,直接搬到 system FMEDA 会爆表。例如 gate driver IC 内部逻辑可能有数十个失效模式,system 看其实只关心 "internal logic faulty" 这一个。所以要 regroup:把 IC FM 聚合成 system FM,带 + + 三个数。

但有些 IC pin 必须保留细节——比如 PMIC 的 "ignition input" pin,其失效由 system 层 SM 检测(IC 自己不能,因为是输入),如果跟"PMIC 内部逻辑"合并就会被误判为"内部 SM 覆盖" → SPF 漏算。判定规则:任何由 system SM 而非 IC SM 保护的 IC pin / 子块,必须保持独立行,不能跟"IC 内部"合并。

6. NXP Safety Inverter Library — 软件栈

NXP 不只交 IC,还交一份配套软件库,让 Tier-1 跑通 safety stack 而不是从零造。简化架构(NXP HVINVERTERWPA4 Figure 13):

模块职责
Safety Application用户特定的安全应用代码
中 1Checkers Library周期性诊断函数集合(motor intense check / torque monitoring / sensor plausibility / ...)
中 2Safety Manager故障计数 + 阈值判定 + 触发 reaction;init phase 通过 fault injection 自检 checkers
中 3Reactions Sequencer一旦 Safety Manager 决定进 safe state,负责按顺序执行物理切换
中 4Memory Mgmt隔离 QM core 与 ASIL D core 的内存域
中 5ICC(Inter-Core Comm)非安全核(QM motor control)与安全核(ASIL D safety check)的通信
中 6Scheduler各 task 周期触发 / 抢占
HAL屏蔽 MCU/SBC 细节

核心设计点:

  • QM core 跑 motor control(高带宽 FOC),ASIL D core 跑 safety(诊断 + Safety Manager + Reactions)——双核分工对应 topic-freedom-from-interference 的 freedom-from-interference
  • Memory Mgmt + ICC 是 FFI 实现的关键——没有这两块,QM 核错误能污染 ASIL 核
  • Safety Manager init 阶段对 checkers 做 fault injection —— 确认每个 checker 真能 detect,不只是"安装了"

7. SEooC Tier-2 视角的工作

NXP 不是 Tier-1,它做的是 SEooC(Safety Element out of Context,见 topic-seooc)—— OEM 的 SG 拿不到,只能自己假设一组 SG 跑全套 Part 3-6 流程,把"我假设 OEM 这样想"做成 reference design 交给 Tier-1。

NXP 假设的 3 个 SG(基于"一般 EV inverter"的反推):

SG描述ASIL
SG1Avoid unintended self acceleration while stoppedASIL D
SG2Avoid reverse torqueASIL D
SG3Avoid sudden loss of accelerationASIL B

Tier-1 拿到这份 reference design,比对自己拿到的真实 OEM SG:

  • 完全匹配 → 直接用 NXP TSC + FMEDA,节省 3-6 月开发
  • 部分匹配 → 跑 gap analysis,补足差异
  • 显著差异 → 不能复用,但 NXP 的 TSC / FMEDA 仍是宝贵参考起点

这就是 IC supplier 在 V-cycle 里的标准玩法。SEooC 的核心契约是 Safety Manual + Assumptions of Use——NXP 必须明确写 "I assume OEM does X / not Y",Tier-1 看到 AoU 后才知道 reference 适不适配。

核心要点

  • HV 主驱逆变器有 3 个 ASIL D + 1 个 ASIL B Safety Goal,FTTI 通常 200ms
  • ISO 26262 V-cycle 标准路径:Item Definition → HARA → FSC(Part 3) → TSC(Part 4) → 硬件 FMEDA(Part 5) + 软件架构(Part 6)
  • IC 供应商主动做完整 Part 3-6 work products(SEooC)是新趋势,可压缩 Tier 1 安全开发周期 6-12 月
  • FR(功能要求)是 QM,FSR(功能安全要求)才是 ASIL D — 区分本质是"用户体验差"vs"违反 SG"
  • Safe state 不是"急停",是"0 扭矩 + 自由滑行 + 司机能干预";具体路径靠 PWM 停 / 栅极供电断 / HV 接触器断三件套
  • ASIL D 硬件指标:SPFM ≥ 99% / LFM ≥ 90% / PMHF ≤ 10 FIT;PMHF 最难,靠周期诊断把 70%+ 失效转成 detected

Engineering Objects

引用此页的结构化 Engineeri…

引用此页的结构化 Engineering Object(v2.0 Copilot 自动生成,不要手动编辑此段)。

  • case · case_main_drive_inverter_asil_d — 800V SiC Main-Drive Inverter ASIL D
  • case · case_sg2_reverse_torque_asil_d — SG2 — 避免反向扭矩 (ASIL D)
  • diagnostic · diagnostic_motor_position_sensing — 电机位置 / 速度传感
  • diagnostic · diagnostic_torque_plausibility_check — 扭矩合理性检查
  • failure_mode · failure_mode_low_speed_torque_lock — 低速扭矩锁死
  • mechanism · mechanism_safety_state_manager — Safety State Manager (SSM)
  • mitigation · mitigation_asc_hss — Active Short Circuit via High-Side (SS_HSS)
  • mitigation · mitigation_asc_lss — Active Short Circuit via Low-Side (SS_LSS)
  • mitigation · mitigation_safe_torque_offSTO Safe Torque Off
  • mitigation · mitigation_three_phase_short — 3PO Three-Phase Short Circuit (ASC)

Cross-references