Fórmula de cálculo de la covarianza
1, donde e representa la expectativa matemática y xey son dos variables aleatorias. Esta fórmula se puede entender en varias partes. Primero, (X-E(X)) y (Y-E(Y)) representan las desviaciones de X e Y respectivamente, es decir, la diferencia entre cada valor observado y la expectativa matemática. Multiplicar estas desviaciones y encontrar la expectativa matemática nos da la covarianza.
2. El signo de covarianza se puede utilizar para juzgar la tendencia cambiante de dos variables aleatorias. Si la covarianza es positiva, significa que cuando X aumenta, Y tiende a aumentar, es decir, los dos cambian en la misma dirección, si la covarianza es negativa, significa que cuando La dirección del cambio es opuesta; Si la covarianza es 0, significa que las tendencias de X e Y son independientes.
3. En aplicaciones prácticas, la covarianza puede ayudarnos a comprender el grado de correlación entre dos variables, como analizar los cambios en los precios de las acciones en el campo financiero y analizar la relación entre dos variables en la estadística. . Además, la covarianza se puede utilizar para construir otras estadísticas, como coeficientes de correlación y modelos predictivos.
La diferencia entre covarianza y coeficiente de correlación
1. La covarianza es una medida de la tendencia de cambio simultáneo de dos variables y puede representar el error general entre las dos variables. Si la tendencia de cambio de dos variables es consistente, es decir, si una variable aumenta, la otra también aumenta, la covarianza es positiva, si una variable aumenta, la otra disminuye, la covarianza es negativa si las dos no están correlacionadas, la covarianza; está cerca de 0.
2. El coeficiente de correlación es una estadística más estandarizada y precisa que mide la relación lineal entre dos variables. El coeficiente de correlación varía de -1 a 1, donde -1 indica una correlación negativa perfecta, 1 indica una correlación positiva perfecta y 0 indica ninguna correlación. El coeficiente de correlación puede eliminar la influencia de la dimensión variable y solo reflejar la similitud de dos variables.
3. La covarianza y el coeficiente de correlación se pueden utilizar para medir la relación entre dos variables, pero el coeficiente de correlación es más adecuado para describir relaciones lineales y eliminar efectos dimensionales. Al analizar la relación entre variables, es muy importante elegir estadísticas apropiadas basadas en el problema real y las características de los datos.