AI Ask 质量评测 — 2026-05-29

9 个 eval 打 live /api/ask:9 pass / 0 weak / 0 fail / 0 error。检索(引对页)+ 内容(关键要点)+ 拒答(域外是否触发「没有足够依据」)三维确定性核查。

全部 pass —— 检索引对页、答案含关键要点、域外正确拒答。