我有一个非常基本的问题。正态概率图的基础是什么,即概率代表什么?我正在测试标准正态分布。我的
normplot (在MATLAB中)显示,在直线中,该值或多或少是0.5的概率对应于非零值。
我的问题是,我该怎么解释?这是否意味着我的数据呈正态分布,但均值非零(即非标准正态),或者该概率仅反映了其他情况?我尝试了Google,有一个链接说概率是z表的累积概率,我不知道该怎么做。
同样在MATLAB中,是否只要值适合程序绘制的线(红色虚线),值就来自正态分布?在我的一张图表中,虚线非常陡峭,但数值适合其中,这是否意味着超出该直线的一两个数值只是离群值?
我对统计资料非常陌生,请帮忙!
谢谢!
回答:
我的问题是,我该怎么解释?这是否意味着我的数据呈正态分布,但均值非零(即非标准正态),或者该概率仅反映了其他情况?
你是对的。如果您运行normplot并获得非常接近拟合线的数据,则意味着您的数据具有非常接近正态分布的
累积分布函数 。 0.5 CDF点对应于拟合正态分布的平均值。 (您的情况下大约为0.002)
得到一条直线的原因是y轴是非线性的,并且被“扭曲”,以使理想的高斯累积分布映射为一条线:y轴标记与反方向是线性的
误差函数 。
当您查看端点时,它们的斜率比拟合线更陡,这意味着您的分布的尾部比正态分布短,即异常值更少,这可能是由于某种物理约束阻止了均值的过度变化。
更多&回答...