曾经读过一本书叫《女士品茶》,书中提到[1],一个夏天的午后,剑桥大学的几位老师和他们的妻子在喝下午茶,突然,有一位女士说:“我有一种超能力,一杯奶茶放在这里,我只要尝一口,我就能分清楚它是先加的奶还是先加的茶。”在场的先生们都哈哈大笑,认为这一定是她的幻觉,……。 一、假设检验的原理 在工作生活当中,我们也经常碰到类似的问题,比如某制药公司宣称,他们的某款新药对打鼾患者的治愈率高达90%,又如,某团队在经过工艺优化之后,声称产品的合格率提升了5%,抑或如,某客户投诉某塑料生产企业的产品包装不到25kg/包等等。可问题是,我们该如何来分辨这些信息的真伪呢? 首先,我们把这一类以“判断”为输出结果的问题,统一归纳为假设检验[2]问题,处理这类问题的方法是:先把某个结论当成一种假设(统计学上也称为原假设,null hypothesis,记为 ,与之对应的称为备择假设,alternative hypothesis,记为 ),然后收集样本,根据样本观测值的情况,运用统计分析的方法对假设进行检验,并做出判断。 以刚才提到的那位女士为例,我们可以通过试验的方法来判断她所声称的超能力是否属实,如果这位女士品尝了6杯奶茶后,并且她的判断都是正确的话,我们就可能从原先怀疑转为相信她的超能力了,因为如果假设她不具备这种超能力,而是全靠猜,那么她6次全部猜对的概率只有 %≈,这是一个非常小的概率。 由此可以看出,假设检验的基本原理是,在接受假设成立的情况下,计算样本(或事件)发生的概率,如果得出的是一个非常小的概率,则我们开始从接受假设成立变为拒绝假设成立。可是,这个概率到底要多小,我们才会做出倾向于拒绝假设的判断呢?这个值的定义是依据行业领域或者应用场景而定的,一般在化工行业,这个值大部分取为5%,但是在一些高精尖领域或者健康安全相关度高的行业,如医药、航空等行业,这个值更能会取得更小,比如1‰,对于这个值,在统计学上有其专属的名称和符号,叫做显著性水平,记为α,与之相对应的1-α被称之为置信水平。 那么,为什么在某些行业领域对于α的取值要非常小呢?再以刚才的女士品茶为例,假设一家公司准备以非常高的薪水聘用这个具有超能力的女士作为他们的品茶官,招聘人员对她所声称的技能的检验将会更加严格了,可能需要连续10次不出现差错,他们才可以放心地录用该女士,所以,这里我们就体会到了,α取值越小,是为了越好地防止做出错误的决策而造成决策风险。 二、假设检验在工业现场的应用场景 数据大脑产品具有一整套的假设检验模型算法,可以满足工业现场各种应用场景的需求(如表1),并且具备在线服务化计算功能,数据无需导入,就可以实时进行分析和判断,并进行报警。 参考文献: [1].《女士品茶》,[美]DavidSalsburg著 [2].《六西格玛管理统计指南》,马逢时等著