登录论坛

查看完整版本 : 正态概率图解释


poster
2019-12-14, 20:13
我有一个非常基本的问题。正态概率图的基础是什么,即概率代表什么?我正在测试标准正态分布。我的normplot (http://www.mathworks.com/help/toolbox/stats/normplot.html) (在MATLAB中)显示,在直线中,该值或多或少是0.5的概率对应于非零值。

我的问题是,我该怎么解释?这是否意味着我的数据呈正态分布,但均值非零(即非标准正态),或者该概率仅反映了其他情况?我尝试了Google,有一个链接说概率是z表的累积概率,我不知道该怎么做。

同样在MATLAB中,是否只要值适合程序绘制的线(红色虚线),值就来自正态分布?在我的一张图表中,虚线非常陡峭,但数值适合其中,这是否意味着超出该直线的一两个数值只是离群值?

我对统计资料非常陌生,请帮忙!

谢谢!

https://i.stack.imgur.com/kY5T6.jpg

https://i.stack.imgur.com/6hTsr.jpg



回答:

我的问题是,我该怎么解释?这是否意味着我的数据呈正态分布,但均值非零(即非标准正态),或者该概率仅反映了其他情况?

你是对的。如果您运行normplot并获得非常接近拟合线的数据,则意味着您的数据具有非常接近正态分布的累积分布函数 (http://en.wikipedia.org/wiki/Cumulative_distribution_function) 。 0.5 CDF点对应于拟合正态分布的平均值。 (您的情况下大约为0.002)

得到一条直线的原因是y轴是非线性的,并且被“扭曲”,以使理想的高斯累积分布映射为一条线:y轴标记与反方向是线性的误差函数 (http://en.wikipedia.org/wiki/Error_function) 。

当您查看端点时,它们的斜率比拟合线更陡,这意味着您的分布的尾部比正态分布短,即异常值更少,这可能是由于某种物理约束阻止了均值的过度变化。



更多&回答... (https://stackoverflow.com/questions/4858904)