LFDT 深度 — Latent Fault Detection Time + MPF 演化
本质与导读
本质 Latent fault 的危险在于第一次坏的是 safety mechanism 本身且静默无害,要等下一次 primary fault 才暴露 SG 违背;LFDT 就是必须在那之前检出 latent 的窗口,所以 power-on BIST(LBIST/MBIST + 周期 ECC/Flash CRC)的 LFDT 上限被一个驾驶周期 key-on→key-off(~1h)、worst-case 受最长连续运行时间约束钉死。ASIL D 强制 LFM ≥ 90%。
1. SPF vs MPF + LFDT 窗口
下图把 SPF / MPF / LFDT 一次说清:
3 个核心区分:
- SPF:单次失效 → 直接 SG 违背(无 SM 缓冲)
- MPF:多次失效累积 → SG 违背
- Latent Fault:SM 本身静默失效,等下一次 primary fault 暴露
2. ISO 26262 Part 5 LFM 定义
LFM (Latent Fault Metric) 公式(SPFM/LFM 架构度量公式见 26262-5 Annex C;ASIL D LFM ≥ 90% 目标见 26262-5 Clause 8.4 目标表):
其中:
ASIL D 目标:LFM ≥ 90%。
3. LFDT 物理意义
LFDT 是检测 latent 的时间窗口:
- latent fault 发生 → 必须在 primary fault 前发现
- 否则 SM 缺位 → primary fault → SG 违背
- LFDT ≤ MTBF (primary fault) — 物理约束
- Power-on BIST 类 SM 的 LFDT 上限 ≈ 一个驾驶周期(key-on→key-off,量级 ~1h);24h 只是车长期不熄火时的最坏连续运行假设,非驾驶周期长度
4. SM 类型 + LFDT 预算
不同 SM 的 LFDT 预算不同:
4.1 实时 SM (μs 级)
实时 SM 的工程特点 + 应用场景:
- CPU lockstep CCC: LFDT ≈ 100 μs(每 cycle 对比)
- Bus protection: LFDT ≈ 1 μs
- 适合"即时" SM
4.3 周期 SM (秒级)
周期 SM 的工程特点 + 应用场景:
- SRAM ECC scrubbing: LFDT 100 ms
- Flash CRC 周期校验: LFDT 10 s
- 低优先级 background task
5. Power-on BIST 设计
LBIST + MBIST 是 LFDT 最长 SM:
5.1 LBIST (Logic BIST)
LBIST 的工程特点 + 应用场景:
- 启动时跑 logic 自检
- 覆盖 ALU + register + control
- Aurix TC397 内置,跑 50-100ms
5.2 MBIST (Memory BIST)
MBIST 的工程特点 + 应用场景:
- 启动时跑 SRAM + Flash 自检
- March-test pattern (March-C+, March-LR)
- 跑 10-50ms
6. SRAM ECC + scrubbing
SRAM ECC scrubbing 是中等 LFDT:
6.1 ECC 编码
ECC 编码的工程特点 + 应用场景:
- SECDED (Single Error Correct, Double Error Detect):单 bit 错自动校正、双 bit 错检出报警
- 每 64-bit word 加 ~8 个 ECC 校验位(Hamming 扩展码);单个 parity bit 只能做单 bit 检测 (SED),无校正能力
- Aurix / S32K3 默认支持(~8 ECC bit / 64-bit data word)
6.2 scrubbing 流程
scrubbing 流程的工程特点 + 应用场景:
- 周期 read-modify-write 整个 SRAM
- 每个地址 100ms 内访问 1 次
- 触发 ECC 自动校正
6.3 LFDT 估算
LFDT 估算 = SRAM size / 单 cycle 访问 + safety margin = 100ms 典型
7. Flash CRC 周期校验
Flash CRC 周期 SM:
- 启动时全 Flash CRC 算 1 次
- 运行时低优先级 task 周期算
- 整个 Flash 算完 ~10 s
- LFDT ≈ 10 s
8. ASIL D 主驱 LFDT 预算示例
EV 主驱 ASIL D 项目典型:
| SM | LFDT | 实施 |
|---|---|---|
| CPU lockstep | 100 μs | DCC 每 cycle |
| PWM read-back | 100 μs | 硬件 read-back |
| ADC redundancy | 1 ms | 2 ADC 对比 |
| E2E CRC | 1 ms | 每 frame |
| SBC fast WD | 8 ms | Q&A |
| SRAM ECC | 100 ms | scrubbing |
| Flash CRC | 10 s | low-priority |
| Power-on BIST | ~1 驾驶周期 (~1h) | 每次启动 |
总 LFM = ~95%,满足 ASIL D ≥ 90% 要求。
9. ASIL D LFDT 验证 5 项
ASIL D LFDT 验证清单:
- SM 完整性测试 — Fault Injection 每个 SM 注入 latent fault,验证检测到
- 检测时间测试 — 实测 LFDT,不超 datasheet
- LFM 计算 — FMEDA 工具自动算 ≥ 90%
- Power-on BIST 覆盖 — 测试 LBIST + MBIST 覆盖率 ≥ 95%
- 周期 task 不影响 ASIL D — 验证周期 SM 不抢 ASIL D 任务时间
10. 实战 — Aurix TC397 LFM 计算
Aurix TC397 (典型 EV 主驱 ASIL D MCU) safety manual 列:
- Total FIT: ~150 FIT
- SPF: 5 FIT (after lockstep)
- Residual: 3 FIT (after CCC)
- Latent detected: 135 FIT
- Latent undetected: 7 FIT
- LFM = 1 - 7/(150-5-3) = 95% ✓
- PMHF ≈ 8 FIT ≤ 10 FIT ✓
11. 国产 MCU LFDT 现状
国产 MCU LFDT 现状:
- 杰发 AC78xx — LFM 80% (ASIL B+)
- 国民技术 N32G45x — LFM 85% (ASIL B)
- 核芯互联 CXLD-MCU — LFM 90%+ (ASIL D 在路上)
- 芯擎 ELXi — LFM 95% (ASIL D cert)
国产LFDT/LFM 接近 Tier 1,但 cert 跟不上,主驱仍 NXP / Infineon。
12. 一句话总结
LFDT 是 ASIL D 项目的 latent fault 时间预算 — latent SM 必在 primary fault 前被发现,LFM ≥ 90% 强制。主流 SM:CPU lockstep CCC (100μs) + SRAM ECC (100ms) + Flash CRC (10s) + Power-on BIST (~1 驾驶周期 ~1h)。主驱 ASIL D:典型 LFM 95%,PMHF 8 FIT。新项目设计 SM 时按 LFDT 分层 — 短 LFDT 用硬件 SM,长 LFDT 用周期 SM + 启动 BIST。LFDT 估错 = FMEDA 拒签 = 项目重做。
核心要点
- LFDT = latent fault → primary fault 之间检测时间
- ASIL D LFM ≥ 90% 强制
- LFDT 分层:实时 (μs) / 准实时 (ms) / 周期 (秒) / 驾驶周期 (~1h,上电周期)
- SRAM ECC + Flash CRC + Power-on BIST 三件套
- LFDT 估错 = FMEDA 拒签
缩写表
只列本页用到的工业标准缩写;通用英语…
只列本页用到的工业标准缩写;通用英语 / 单位 / 月份 / 我们的
层/Lxtag 不列。覆盖不到的术语见正文 inline 注释。
| 缩写 | 全称 | 中文 / 备注 |
|---|---|---|
| ISO | International Organization for Standardization | 国际标准化组织 |
| SG | Safety Goal | 安全目标(ISO 26262-3) |
| FMEDA | Failure Modes, Effects and Diagnostic Analysis | 含诊断覆盖的 FMEA |
| NXP | NXP Semiconductors | 恩智浦半导体 |
| ASIL | Automotive Safety Integrity Level | ISO 26262 安全完整性等级 QM→A→B→C→D |
| SM | Safety Mechanism | 安全机制 |
| MCU | Microcontroller Unit | 微控制器(本页多指车规多核 MCU) |
| LFM | Latent Fault Metric | 潜伏故障度量 |
| FIT | Failures In Time | 1e9 小时失效率单位 (1 FIT = 1 failure / 1e9 h) |
| SPFM | Single-Point Fault Metric | 单点失效度量 |
| MTBF | Mean Time Between Failures | 平均失效间隔时间 |
| SBC | System Basis Chip | 系统基础芯片(电源 + 收发器 + 监控集成) |
| E2E | End-to-End protection | 端到端通信保护 (AUTOSAR) |
| PWM | Pulse Width Modulation | 脉冲宽度调制 |
| EV | Electric Vehicle | 电动车 |
| ADC | Analog-to-Digital Converter | 模数转换器 |
| PMHF | Probabilistic Metric for Hardware Failures | 硬件随机失效概率指标 |
| DFA | Dependent Failure Analysis | 相关失效分析(ISO 26262-9) |
Cross-references
- ← 索引
- 功能安全工程师指南 hub — V-cycle + 8 大主题
- FMEDA 深度 — LFM 计算
- Lockstep Core 深度 — CPU lockstep 是最短 LFDT SM
- ASIL Decomposition 深度 — DFA 与 LFDT
- Confirmation Measures 深度 — LFDT 评审
- SafeState Manager 深度 — SM 缺位后 safe state