LFDT 深度 — Latent Fault Detection Time + MPF 演化

功能安全L2别名 LFDT · latent fault detection time · 潜伏故障检测时间 · MPF · Multi-Point Fault · latent fault metric

本质与导读

本质 Latent fault 的危险在于第一次坏的是 safety mechanism 本身且静默无害,要等下一次 primary fault 才暴露 SG 违背;LFDT 就是必须在那之前检出 latent 的窗口,所以 power-on BIST(LBIST/MBIST + 周期 ECC/Flash CRC)的 LFDT 上限被一个驾驶周期 key-on→key-off(~1h)、worst-case 受最长连续运行时间约束钉死。ASIL D 强制 LFM ≥ 90%。

主线坐标:横轨 · 功能安全(跨站) · ↑ 全景主线

1. SPF vs MPF + LFDT 窗口

下图把 SPF / MPF / LFDT 一次说清:

LFDT — Latent Fault Detection Time + MPF 演化

3 个核心区分:

  • SPF:单次失效 → 直接 SG 违背(无 SM 缓冲)
  • MPF:多次失效累积 → SG 违背
  • Latent Fault:SM 本身静默失效,等下一次 primary fault 暴露

2. ISO 26262 Part 5 LFM 定义

LFM (Latent Fault Metric) 公式(SPFM/LFM 架构度量公式见 26262-5 Annex C;ASIL D LFM ≥ 90% 目标见 26262-5 Clause 8.4 目标表):

其中:

  • :未被检测的 latent fault FIT
  • :总 FIT
  • :SPF 已计入 SPFM
  • :残余 fault 已计入 SPFM

ASIL D 目标:LFM ≥ 90%。


3. LFDT 物理意义

LFDT 是检测 latent 的时间窗口:

  • latent fault 发生 → 必须在 primary fault 前发现
  • 否则 SM 缺位 → primary fault → SG 违背
  • LFDT ≤ MTBF (primary fault) — 物理约束
  • Power-on BIST 类 SM 的 LFDT 上限 ≈ 一个驾驶周期(key-on→key-off,量级 ~1h);24h 只是车长期不熄火时的最坏连续运行假设,非驾驶周期长度

4. SM 类型 + LFDT 预算

不同 SM 的 LFDT 预算不同:

4.1 实时 SM (μs 级)

实时 SM 的工程特点 + 应用场景:

  • CPU lockstep CCC: LFDT ≈ 100 μs(每 cycle 对比)
  • Bus protection: LFDT ≈ 1 μs
  • 适合"即时" SM

4.2 准实时 SM (ms 级)

准实时 SM 的工程特点 + 应用场景:

  • SBC fast WD: LFDT 8-10 ms
  • E2E CRC: LFDT 1 ms
  • 主驱 PWM 任务监督

4.3 周期 SM (秒级)

周期 SM 的工程特点 + 应用场景:

  • SRAM ECC scrubbing: LFDT 100 ms
  • Flash CRC 周期校验: LFDT 10 s
  • 低优先级 background task

4.4 驾驶周期 SM (~1h / 上电周期)

驾驶周期 SM 的工程特点 + 应用场景:

  • Power-on BIST (LBIST / MBIST)
  • 每次启动跑
  • 限期发现 latent

5. Power-on BIST 设计

LBIST + MBIST 是 LFDT 最长 SM:

5.1 LBIST (Logic BIST)

LBIST 的工程特点 + 应用场景:

  • 启动时跑 logic 自检
  • 覆盖 ALU + register + control
  • Aurix TC397 内置,跑 50-100ms

5.2 MBIST (Memory BIST)

MBIST 的工程特点 + 应用场景:

  • 启动时跑 SRAM + Flash 自检
  • March-test pattern (March-C+, March-LR)
  • 跑 10-50ms

5.3 周期 LBIST

周期 LBIST 的工程特点 + 应用场景:

  • 部分 MCU 支持运行时 LBIST(short pulse)
  • 不打断 ASIL D 任务
  • 进一步降 LFDT

6. SRAM ECC + scrubbing

SRAM ECC scrubbing 是中等 LFDT:

6.1 ECC 编码

ECC 编码的工程特点 + 应用场景:

  • SECDED (Single Error Correct, Double Error Detect):单 bit 错自动校正、双 bit 错检出报警
  • 每 64-bit word 加 ~8 个 ECC 校验位(Hamming 扩展码);单个 parity bit 只能做单 bit 检测 (SED),无校正能力
  • Aurix / S32K3 默认支持(~8 ECC bit / 64-bit data word)

6.2 scrubbing 流程

scrubbing 流程的工程特点 + 应用场景:

  • 周期 read-modify-write 整个 SRAM
  • 每个地址 100ms 内访问 1 次
  • 触发 ECC 自动校正

6.3 LFDT 估算

LFDT 估算 = SRAM size / 单 cycle 访问 + safety margin = 100ms 典型


7. Flash CRC 周期校验

Flash CRC 周期 SM:

  • 启动时全 Flash CRC 算 1 次
  • 运行时低优先级 task 周期算
  • 整个 Flash 算完 ~10 s
  • LFDT ≈ 10 s

8. ASIL D 主驱 LFDT 预算示例

EV 主驱 ASIL D 项目典型:

SMLFDT实施
CPU lockstep100 μsDCC 每 cycle
PWM read-back100 μs硬件 read-back
ADC redundancy1 ms2 ADC 对比
E2E CRC1 ms每 frame
SBC fast WD8 msQ&A
SRAM ECC100 msscrubbing
Flash CRC10 slow-priority
Power-on BIST~1 驾驶周期 (~1h)每次启动

总 LFM = ~95%,满足 ASIL D ≥ 90% 要求


9. ASIL D LFDT 验证 5 项

ASIL D LFDT 验证清单:

  • SM 完整性测试 — Fault Injection 每个 SM 注入 latent fault,验证检测到
  • 检测时间测试 — 实测 LFDT,不超 datasheet
  • LFM 计算FMEDA 工具自动算 ≥ 90%
  • Power-on BIST 覆盖 — 测试 LBIST + MBIST 覆盖率 ≥ 95%
  • 周期 task 不影响 ASIL D — 验证周期 SM 不抢 ASIL D 任务时间

10. 实战 — Aurix TC397 LFM 计算

Aurix TC397 (典型 EV 主驱 ASIL D MCU) safety manual 列:

  • Total FIT: ~150 FIT
  • SPF: 5 FIT (after lockstep)
  • Residual: 3 FIT (after CCC)
  • Latent detected: 135 FIT
  • Latent undetected: 7 FIT
  • LFM = 1 - 7/(150-5-3) = 95% ✓
  • PMHF ≈ 8 FIT ≤ 10 FIT ✓

11. 国产 MCU LFDT 现状

国产 MCU LFDT 现状:

  • 杰发 AC78xx — LFM 80% (ASIL B+)
  • 国民技术 N32G45x — LFM 85% (ASIL B)
  • 核芯互联 CXLD-MCU — LFM 90%+ (ASIL D 在路上)
  • 芯擎 ELXi — LFM 95% (ASIL D cert)

国产LFDT/LFM 接近 Tier 1,但 cert 跟不上,主驱仍 NXP / Infineon。


12. 一句话总结

LFDT 是 ASIL D 项目的 latent fault 时间预算 — latent SM 必在 primary fault 前被发现,LFM ≥ 90% 强制主流 SM:CPU lockstep CCC (100μs) + SRAM ECC (100ms) + Flash CRC (10s) + Power-on BIST (~1 驾驶周期 ~1h)。主驱 ASIL D:典型 LFM 95%,PMHF 8 FIT。新项目设计 SM 时按 LFDT 分层 — 短 LFDT 用硬件 SM,长 LFDT 用周期 SM + 启动 BIST。LFDT 估错 = FMEDA 拒签 = 项目重做。


核心要点

  • LFDT = latent fault → primary fault 之间检测时间
  • ASIL D LFM ≥ 90% 强制
  • LFDT 分层:实时 (μs) / 准实时 (ms) / 周期 (秒) / 驾驶周期 (~1h,上电周期)
  • SRAM ECC + Flash CRC + Power-on BIST 三件套
  • LFDT 估错 = FMEDA 拒签

缩写表

只列本页用到的工业标准缩写;通用英语…

只列本页用到的工业标准缩写;通用英语 / 单位 / 月份 / 我们的 层/Lx tag 不列。覆盖不到的术语见正文 inline 注释。

缩写全称中文 / 备注
ISOInternational Organization for Standardization国际标准化组织
SGSafety Goal安全目标(ISO 26262-3)
FMEDAFailure Modes, Effects and Diagnostic Analysis含诊断覆盖的 FMEA
NXPNXP Semiconductors恩智浦半导体
ASILAutomotive Safety Integrity LevelISO 26262 安全完整性等级 QM→A→B→C→D
SMSafety Mechanism安全机制
MCUMicrocontroller Unit微控制器(本页多指车规多核 MCU)
LFMLatent Fault Metric潜伏故障度量
FITFailures In Time1e9 小时失效率单位 (1 FIT = 1 failure / 1e9 h)
SPFMSingle-Point Fault Metric单点失效度量
MTBFMean Time Between Failures平均失效间隔时间
SBCSystem Basis Chip系统基础芯片(电源 + 收发器 + 监控集成)
E2EEnd-to-End protection端到端通信保护 (AUTOSAR)
PWMPulse Width Modulation脉冲宽度调制
EVElectric Vehicle电动车
ADCAnalog-to-Digital Converter模数转换器
PMHFProbabilistic Metric for Hardware Failures硬件随机失效概率指标
DFADependent Failure Analysis相关失效分析(ISO 26262-9)

Cross-references