知识库›烘焙与冲煮›感官评测方法论

烘焙与冲煮

感官评测方法论

最后更新：2026-06-03

盲测需要统计学框架才有意义——喝对了几次不代表你真的能区分，必须用显著性评分判断结果是否超越随机水平。

核心问题

"我在盲测中喝对了 X 次，能说明我能区分这两种咖啡吗？"

答案取决于：总尝试次数、喝对次数、以及对应的统计显著性。

显著性评分（N-sigma）

Jonathan Gagné 引入物理学中的 N-sigma 显著性评分，用于量化盲测结果的可信度：

N-sigma 分值	对应置信度
1	68.3%
2	95.4%
建议最低门槛：2	约 95%
3	99.7%

分值越高，结果越不可能是随机猜对的。

实验设计

三角测试（推荐）：

·三杯中有一杯不同（入侵杯），识别出"哪杯不同"
·排除了"我喜欢哪个"的主观偏差
·每次测试只有 1/3 的随机猜中概率

建议：

·最少 12 次测试才能获得有意义的统计数据
·每次都完整记录，不得删除失败记录
·删除失败尝试等同于数据造假（类似心理学和生物学的可重复性危机）

Q-Grader 认证标准

Q-Grader 考试要求在 6 次测试中正确识别 5 次，对应 N-sigma 约 2.4，通过率约 97%。这是行业对"具备感官鉴别能力"的基本证明。

三类测试者

任何盲测者都可以被归为以下三类：

类型	描述
有效分类者	持续正确超越随机水平
随机分类者	结果接近随机猜测
误导性分类者	持续猜错，说明有系统性认知偏差

实用工具

作者开发了一个 Wolfram Alpha 小工具：输入杯数、尝试次数和失败次数，自动计算 N-sigma 分值。

应用场景举例

·对比不同磨豆机研磨效果
·验证水质配方是否有可感知差异
·测试滤纸类型是否影响风味
·检验"养豆期"前后是否有实质区别

相关页面

·萃取率与浓度测量 — 量化结果与感官评测互补
·品种与处理法风味图谱 — 数据驱动的风味差异分析
·Jonathan-Gagné — 本文作者

问 AI 关于这篇内容

直接向 AI 提问，基于知识库内容回答