Está en la página 1de 5

Coeficiente de correlación

El coeficiente de correlación, el cual es encarga de medir la intensidad de asociación entre


dos variables a través del coeficiente de correlación r de Pearson, asumiendo valores de -
1.00 a +1.00; su cálculo se realiza dividiendo la covarianza por el producto de las
desviaciones estándar de ambas variables:

𝜎𝑥𝑦
𝑟=
𝜎𝑥 ∙ 𝜎𝑦

Siendo:

𝜎𝑥𝑦: 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑑𝑒 (𝑋, 𝑌)

𝜎𝑥 𝑦 𝜎𝑦: 𝑙𝑎𝑠 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖𝑜𝑛𝑒𝑠 𝑒𝑠𝑡á𝑛𝑑𝑎𝑟

El valor del índice de correlación varía en el intervalo [-1, +1]:

 Si r = 1, existe una correlación positiva perfecta. El índice indica una dependencia


total entre las dos variables denominada relación directa: cuando una de ellas
aumenta, la otra también lo hace en proporción constante.
 Si 0 < r < 1, existe una correlación positiva. Puede ser débil, moderada o intensa.
 Si r = 0, no existe relación lineal. Pero esto no necesariamente implica que las
variables son independientes: pueden existir todavía relaciones no lineales entre las
dos variables.
 Si -1 < r < 0, existe una correlación negativa. Puede ser débil, moderada o intensa.
 Si r = -1, existe una correlación negativa perfecta. El índice indica una dependencia
total entre las dos variables llamada relación inversa: cuando una de ellas aumenta,
la otra disminuye en proporción constante.

Covarianza

La covarianza entre dos variables es un estadístico resumen indicador de si las


puntuaciones están relacionadas entre sí. La formulación clásica, se simboliza por la letra
griega sigma (\sigma_{xy}) cuando ha sido calculada en la población. Si se obtiene sobre
una muestra, se designa por la letra "s_{xy}".

La formula suele aparecer expresada como:

ESTADISTICA DESCRIPTIVA

 MEDIDAS DE TENDENCIA CENTRAL


MEDIA MEDIANA MODA
La media aritmética simple La mediana toma en cuenta la posición de los datos y La moda es el valor que
esta dada por la formula se define como el valor central de una serie de datos o, aparece con mayor frecuencia
X/n y que significa: la más específicamente, como un valor tal que no más de en la serie de datos. Así por
suma de todos los valores la mitad de las observaciones son menores que el y no ejemplo, de la serie {14, 15,
dividida por el número de más de la mitad mayores. 17, 17, 21, 21, 21, 33, 36, 40},
datos. la moda es 21.
El primer paso es ordenar los datos de acuerdo a su
DATOS NO Por ejemplo: magnitud, luego se determina el valor central de la
AGRUPADOS serie y esa es la mediana. Si el número de datos es par,
10, 13, 10, 13, 14, 10, 13, existirán dos valores centrales y entonces la mediana se
10, 15 obtiene sacando el promedio de ellos.

Por ejemplo :

7, 8, 8, 10, 12, 19, 23 Med = 10

3, 4, 4, 5, 16, 19, 25, 30 Med = (5+16)/2 = 10.5

𝑥̅ = ∑ 𝑓𝑖 𝑋𝑖 /𝑛
𝑖=1
DATOS Donde: Donde :
AGRUPADOS fi es la frecuencia de la i- Donde : L = Limite inferior de la clase
esima clase n = Número total de observaciones. modal.
Xi: El punto medio de la L = Limite inferior de la clase que contiene la mediana. d1 = Diferencia entre la
clase f = Frecuencia de la clase que contiene la mediana. frecuencia de la clase modal y
n= total de observaciones F = Frecuencia acumulada "menos de" de la clase la frecuencia de la clase
anterior. anterior.
C = Ancho del Intérvalo de clase. d2 = Diferencia entre la
frecuencia de la clase modal y
la frecuencia de la clase
posterior.
C = Ancho del Intervalo de
clase.

 MEDIDAS DE DISPERSIÓN
VARIANZA DESVIACIÓN ESTÁNDAR

𝑠 = ∑(𝑥𝑖 − 𝑥̅ )2 /(𝑛 − 1)
2
𝒏
DATOS NO 𝑖=1 ̅ )𝟐 /(𝒏 − 𝟏)
𝒔 = √∑(𝒙𝒊 − 𝒙
AGRUPADOS
𝒊=𝟏
Donde:
Xi= Punto medio de clase
𝑥̅ = media de los datos
n= total de observaciones
𝑛
𝒏
𝑠 = ∑ 𝑓𝑖 (𝑥𝑖 − 𝑥̅ )2 /(𝑛 − 1)
2
̅ )𝟐 /(𝒏 − 𝟏)
𝒔 = √∑ 𝒇𝒊 (𝒙𝒊 − 𝒙
DATOS 𝑖=1
𝒊=𝟏
AGRUPADOS Donde:
fi= Frecuencia de la clase i-ésima
Xi= Punto medio de clase
𝑥̅ = media de los datos
n= total de observaciones

SUAVIZACION EXPONENCIAL

La planilla de excel de suavización exponencial realiza un forecast de una serie junto con el
gráfico y obtiene los errores de la estimación.

La planilla de suavización exponencial calcula el promedio de una serie de tiempo con un


mecanismo de autocorrección. Obtiene el promedio de las observaciones de manera
exponencial; es decir, los datos se ponderan dando un mayor peso a las observaciones más
recientes y uno menor a las más antiguas.
El pronóstico de suavización exponencial simple es óptimo para patrones de demanda
aleatorios o nivelados donde se pretende eliminar el impacto de los elementos irregulares
históricos.

También se puede expresar así:

Ft+1 =Alfa * Dt + (1-Alfa)* Ft

prueba f para varianza de dos

muestras

En estadística se denomina prueba F de Snedecor a cualquier prueba en la que el


estadístico utilizado sigue una distribución F si la hipótesis nula no puede ser rechazada. El
nombre fue acuñado en honor a

 La hipótesis de que las medias de múltiples poblaciones normalmente distribuidas y


con la misma desviación estándar son iguales. Esta es, quizás, la más conocida de
las hipótesis verificada mediante el test F y el problema más simple del análisis de
varianza

Cálculo de la razón F a partir de datos muestrales

Para calcular F se debe seguir el siguiente procedimiento

1) Calcular la estimación interna (Denominador)


2) Calcular la estimación intermediante (Numerador)

Leer más: http://www.monografias.com/trabajos91/prueba-hipotesis-f-fisher-empleando-


excel-y-winstats/prueba-hipotesis-f-fisher-empleando-excel-y-
winstats.shtml#calculodea#ixzz5706lJRz3