¿Qué significa obedecer una distribución normal?
Existen muchos métodos para comprobar si los datos obedecen a una distribución normal, como la prueba de normalidad (prueba S-W, prueba K-S), curtosis y asimetría y gráficos (histograma, gráfico p-p/q-q).
La prueba de normalidad, como su nombre indica, es una prueba para determinar si una población obedece a una distribución normal. Es una prueba de hipótesis importante y especial de bondad de ajuste en el juicio estadístico. SPSSAU proporciona los siguientes tres métodos de prueba generales:
Las diferencias entre los tres métodos de prueba de normalidad son las siguientes:
Las pruebas de software generalmente requieren un tamaño de muestra de menos de 50. Si el tamaño de la muestra es mayor a 50, se recomienda utilizar la prueba K-S. La prueba JB se basa en la asimetría de la muestra de datos (una medida de la dirección y el grado de asimetría de la distribución de datos estadísticos) y el análisis de curtosis (el número de características que representan el pico de la curva de distribución de densidad de probabilidad en la media) y generalmente se utiliza para análisis de muestras grandes. La prueba de normalidad es una prueba no paramétrica. La hipótesis nula es "no hay una diferencia significativa en la distribución normal de las poblaciones de las que provienen las muestras", es decir, cómo probar la distribución normal de los datos cuando P
¿Curtosis y asimetría?
Asimetría y curtosis
La asimetría, también conocida como asimetría, describe la asimetría y la dirección de la distribución de datos, y la curtosis describe la inclinación y suavidad de la curva de distribución de datos. Teóricamente, la asimetría y la curtosis de la distribución normal estándar son ambas 0, pero en realidad los datos no satisfacen la distribución normal estándar. Por lo tanto, si el valor absoluto de curtosis es menor que 10 y el valor absoluto de asimetría es menor que 3, significa que aunque los datos no son absolutamente normales, básicamente pueden aceptar una distribución normal. Referencias: Kline R, Kline R B, Kline R. Principios y práctica del modelado de ecuaciones estructurales [J] Journal of the American Statistical Association, 2011, 101 (12). Además, existen gráficos que se pueden verificar, como histogramas, gráficos p-p/q-q, etc.
Gráfico
Además de las pruebas de normalidad, asimetría, curtosis y otros métodos, también puede utilizar gráficos para analizar si los datos se ajustan a la distribución normal. Incluye histogramas y gráficos p-p/q-q.
Histograma
Si usa un histograma, si el histograma muestra una "alta en el medio, baja en ambos lados, básicamente una forma de campana simétrica a la izquierda y a la derecha", básicamente Obedece al análisis normal, pero hay muy pocos datos. Puede afectar los resultados y dificultar la presentación de una distribución normal estándar. Si este es el caso, es aceptable ver una "forma de campana". Por ejemplo:
Como se puede ver en la figura anterior, la distribución de datos no es muy simétrica, pero también tiene una curva aproximada en forma de "campana", que apenas puede aceptarse.
Gráfico P-p/q-q
Tanto el gráfico p-p como el gráfico q-q se calculan basándose en la teoría de la función de distribución acumulativa. Se pueden usar para probar la distribución de datos, pero generalmente se usan para probar si los datos siguen una distribución normal. Si todas las tiendas de la imagen están agrupadas en línea recta, significa que la distribución de las variables obedece a la distribución que se va a probar. Intuitivamente, si la distribución de puntos dispersos es aproximadamente diagonal, se puede considerar una distribución normal. Por ejemplo:
Como se puede ver en la figura anterior, la distribución de puntos dispersos es aproximadamente diagonal, por lo que puede considerarse una distribución normal. Lo mismo ocurre con los diagramas q-q.
Descripción de varios métodos
Los métodos anteriores para mostrar pruebas de normalidad se pueden dividir aproximadamente en tres tipos: prueba de normalidad, asimetría y curtosis, y método gráfico, entre los que se encuentra la prueba de normalidad. La prueba de normalidad es la más estricta, pero desde un punto de vista práctico, es mucho menos práctica que la asimetría, la curtosis y los métodos gráficos. A veces, estos resultados suelen ocurrir cuando el valor absoluto de la asimetría de los datos es menor que 3Kurtosis. menos de 10, o cuando el gráfico p-p presenta un resultado "diagonal" aproximado. En este momento, se recomienda no confiar demasiado en la prueba de normalidad, porque los requisitos de la prueba de normalidad son relativamente estrictos y generalmente no se pueden cumplir, por lo que se pueden utilizar otros dos métodos para ayudar al juicio en el análisis.