周末了,大家做点儿数字游戏,顺便复习下以前学过的知识。
现实中有一组数据如下:
3.2,0.84,5.15,2.2,6.54,7.15,0.43,1.1,7.9,6.64,
4.11,8.2,2.36,3.75,3.25,1.63,2,2.83,1.42,1.92,
5.6,2,2.35,5.62,3.17,31.7
共26个。按此数据作出统计图表如下:
:
最后那个数据怎么看都有点儿特殊,是不是异常值呀?
统计学里有专门检验异常值的方法,算起来有点儿麻烦。
有另一个简单的方法,四分位法。
Excel对应的函数是QUARTILE(A1:A26,quart)
A1:A26代表上述数据,quart的含义及计算结果如下:
Quart=0,最小值=0.43;
Quart=1,1/4分位点=2;
Quart=2,中值=3.185;
Quart=3,3/4分位点=5.615;
Quart=4,最大值=31.7;
四分位法定义:
四分位距IQR =Q3-Q1=3.615;
上上限Q3+3*IQR=16.46
上限Q3+1.5*IQR=11.0375
超过上限称为异常值,超过上上限称为极端异常值。
设Q3+X*IQR=31.7,即5.615+3.615X=31.7,得X=7.216。
即31.7超过了Q3+7*IQR。
可惜四分位法没有定义。这倒给了我们创新的机会,姑且定义:
Q3+7*IQR为上上上限,超过上上上限称为极端极端异常值。
现实中出现了异常值就值得关注,因为异常值的存在会带来极大的危害。
现实中出现了极端异常值更值得关注。
现实中出现了极端极端异常值,2008年的流行语就变成了:
为什么呢?


意见与建议
沪ICP证:沪B2-20070217 版权所有:东方财富网



