MSA 测量系统分析

功能安全L1别名 MSA · 测量系统分析 · GR&R · Gauge R&R · Repeatability · Reproducibility

本质与导读

本质 MSA 回答的问题是"我测出来的数据到底是真的吗"——任何 Cpk / SPC / PV 报告的前提都是"测量靠谱"。MSA 把观测值的方差拆成 真实工艺差异 + 测量系统噪声,然后用 GR&R (Gauge Repeatability & Reproducibility) 量化测量噪声占比。GR&R > 30% 意味着测量噪声盖过工艺真值,所有 Cpk 数据失效——这就是为什么 topic-ppap element 8 强制要求 MSA 先于 element 11 (Cpk) 完成。MSA 不只是"标定量具",它是统计学意义上的"测量信任度证书"。

主线坐标:方法 / 标准层(跨站支撑) · ↑ 全景主线

1. 为什么 MSA 是前提

MSA 不是质量部门可选项,而是所有统计判定的根基——任何 Cpk / SPC / DV / PV 数据的可信度依赖测量本身。

观测到的方差实际是两个独立来源的卷积:

方差分解 — Total = Process + Measurement (GR&R = Repeatability + Reproducibility)

如果 同量级:

  • 看到的"超规"可能是测量误差,不是工艺漂
  • 看到的"分布"是真分布与测量噪声的卷积,不是真分布
  • Cpk 公式分母里的 被人为放大,Cpk 被低估

关键认知:没做 MSA 就报 Cpk 是统计学意义上的"裸奔"。所以 topic-ppap 把 MSA (element 8) 排在 Cpk (element 11) 之前——审计员看到 element 11 就一定会回查 element 8。


2. MSA 五大特性

MSA 不只看 GR&R 一项——完整的测量系统评估有 5 个特性:

特性物理意义测法
Bias (偏倚)测量平均值 vs. 真值的固定偏差与基准件 (NIST 可追溯) 对比
Linearity (线性度)不同量值下 Bias 是否一致在量程上下限分别测 Bias
Stability (稳定性)长期是否漂X-bar/R 控制图监测基准件
Repeatability (重复性, EV)同操作员同件多次测的离散同一人测 10 次取 σ
Reproducibility (再现性, AV)不同操作员/班次测同件的离散3 个操作员各测 10 件

车规默认:Bias + Linearity 在 量具校准 时完成 (年度校验);GR&R (Repeatability + Reproducibility) 在 PPAP 阶段做,作为 element 8 的核心交付。


3. GR&R 实验设计

GR&R 标准做法是"3 操作员 × 10 零件 × 3 次重复"——AIAG MSA 4th 推荐配方。这套 90 个数据点能把 σ²_EV、σ²_AV、σ²_part 三者分离。

维度推荐
零件数10 (覆盖整个过程范围,不是 10 个一模一样)
操作员数3 (代表实际班次/人员多样性)
重复次数每件每人 2–3 次
试验顺序随机化——避免学习/疲劳偏差
总样本量60–90 个测量值

关键陷阱:

  • 零件没覆盖过程范围 → AV 看起来很小,其实是因为零件本身差异小
  • 不随机化 → 第一个操作员测的全是新的、后两个测的全是用过的 → AV 被低估
  • 操作员事先知道结果 → 心理暗示,Reproducibility 失真

4. GR&R 计算

GR&R 核心公式(基于方差和):

其中:

  • = Repeatability 方差 (设备误差)
  • = Reproducibility 方差 (评估员误差)

两种归一化:

4.1 相对于公差 (% Tolerance)

GR&R 相对公差归一化用 6σ / (USL-LSL) — 公差越严测量要求越苛刻,Cpk 计算用这条:

这条用于判定测量系统能不能配这个零件——公差越严,测量要求越苛刻。

4.2 相对于过程方差 (% Study Variation)

第二条归一化用过程实际方差 — 判定测量系统能否监控这个过程,SPC 用这条:

这条用于判定测量系统能不能监控这个过程——SPC 用得上 GR&RP,Cpk 用得上 GR&RT。

4.3 判定门槛 (AIAG)

AIAG 用 < 10% / 10-30% / > 30% 三档判定 — < 10% 才能用于关键特性 SPC,> 30% 必须改测量系统:

GR&R %判定工程含义
< 10%优秀可放心用于 SPC + Cpk
10% – 30%可接受关键特性需评估,一般特性可用
> 30%不可用改进或换量具,数据不可信

ndc (Number of Distinct Categories):

  • ndc ≥ 5 → 系统能分辨足够多的零件类别,适合 SPC
  • ndc < 5 → 测量系统粒度太粗,看不到工艺差异

5. GR&R 失败的根因

GR&R 不达标 来自三种数学场景——EV 大、AV 大、两者都大。识别落在哪一种才能对症下药。

现象数学表现根因修法
EV 大、AV 正常量具本身精度不足 / 零件难夹持换量具 / 改夹具 / 加重复次数
AV 大、EV 正常操作员手法差异 / SOP 模糊培训 / SOP 标准化 / 自动化
EV + AV 都大系统性问题 (环境/校准漂/量具变形)重新校准 / 改测量环境 / 整体替换

6. 计数型 (Attribute) GR&R

上面讲的是计量型 (variable) GR&R——测出连续数值。对计数型 (attribute) 检验 (Go/No-Go、目检、瑕疵分类),要用不同方法:

  • Kappa 系数:衡量评估员一致性, 优秀, 不可用
  • **EMP (Effectiveness, Miss rate, false alarm) **:三个指标分别看正确率/漏判/误判

典型场景:外观瑕疵分级 (A/B/C 级) 通常用计数型 GR&R——3 个 QC 各分 50 件,看一致性。


7. MSA 与 PPAP / SPC / Cpk 的关系

MSA 是底层基础设施——SPC、Cpk、PV 全部依赖它:

依赖关系物理意义
MSA → SPC控制限基于测量数据,测得不准 → 控制限不可信
MSA → CpkCpk 分母含测量噪声,GR&R 越大 Cpk 越被低估
MSA → PVPV 抽样数据全部依赖测量靠谱
MSA → DVDV 加速试验后的数据测量必须可信

PPAP 18 要素串联:DFMEA (4) → PFMEA (6) → CP (7) → MSA (8) → FAI (9) → 试验报告 (10) → Cpk (11)。MSA 在 8 号位置是有逻辑的——它在工艺确定后、统计数据交出前,给所有后续数据盖"可信戳"


8. 5 个常见陷阱

MSA 执行失败集中在 5 个坑——零件没覆盖范围、不随机化、操作员同质、用公差替代过程方差、年度校准混同 MSA。

陷阱描述预防
零件单一10 件都差不多,AV 假装很小零件覆盖过程范围,从 LSL 到 USL
不随机化顺序固定,学习/疲劳偏差进结果用随机数表打乱测序
操作员同质3 个都是熟手,AV 低估抽 1 新手 + 1 中手 + 1 熟手
% T vs % P 混用用 % T 判定 SPC 适用性 (其实该用 % P)看用途选公式:Cpk 用 % T,SPC 用 % P
校准 ≠ MSA只做年度校准认为 MSA 不用做校准只覆盖 Bias/Linearity,GR&R 必须单独做

核心要点

  • MSA 是 SPC / Cpk / PV 的前提——测量不靠谱,所有后续统计失效。
  • GR&R 拆成 Repeatability (EV, 设备)Reproducibility (AV, 评估员) 两个分量。
  • 判定门槛:< 10% 优秀 / 10-30% 可接受 / > 30% 不可用
  • 标准实验:3 操作员 × 10 零件 × 2-3 重复,试验顺序必须随机化。
  • 五大特性:Bias / Linearity / Stability / Repeatability / Reproducibility——前三在校准,后两在 GR&R。
  • 失败三种根因:EV 大 (设备) / AV 大 (人员) / 两者都大 (系统),对症下药。
  • 计数型检验用 Kappa 系数,不是连续 GR&R。
  • topic-ppap element 8 必须先于 element 11 (Cpk) 完成——审计员看到 Cpk 一定回查 MSA。

Engineering Objects

引用此页的结构化 Engineeri…

引用此页的结构化 Engineering Object(v2.0 Copilot 自动生成,不要手动编辑此段)。

  • metric · metric_grr — GR&R — Gauge Repeatability & Reproducibility

Cross-references