Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ESTADÍSTICA I
Curso Intersemestral de Verano
Por lo tanto, si Syc2 (un sumando) se divide por Sy2 (el total), se tendrá la
parte relativa de la variación total que viene explicada por el modelo. 5. Coeficiente de Correlación Simple Lineal.
Este cociente se denomina coeficiente de determinación y se
representa genéricamente por R2 . Su fórmula de definición es por tanto: Mediante la correlación, lo que se busca es un número,
denominado coeficiente de correlación, para indicar
Syc2 Se2 objetivamente el grado de variación conjunta que tienen las
variables.
R2 = -------- ; R2 = 1 - -------
Sy 2 S y2 Para el caso de dos variables X e Y, y de covariación lineal (de ahí
el nombre de simple y lineal), el coeficiente de correlación que se
representa por r, se define así:
Es una medida de la proporción en que la variación total indicada por
Sy2 viene explicada por uno de sus componentes S yc2, y está definido por
el cociente entre esta parte y el todo. En la segunda fórmula, el
coeficiente de determinación queda expresado en función de la varianza Donde Sxy, es la covarianza, Sx es la desviación estándar de la
total y de la varianza residual. Por tanto es un indicador independiente
variable X y Sy es la desviación estándar de la variable Y.
de toda unidad de medida.
Si bien las varianzas son siempre positivas, y consecuentemente las • Si r = 1, la correlación lineal es perfecta y directa, o sea la
desviaciones estándar, la covarianza puede ser positiva o negativa. Es nube de puntos está sobre una recta creciente.
positiva, cuando las dos variables se mueven en el mismo sentido, es • Si r = -1, la correlación lineal es perfecta e inversa, o sea, los
decir cuando al aumentar una aumenta la otra, y es negativa si se puntos de la nube están todos sobre una recta decreciente.
mueven en sentido contrario. Cuando la covarianza es positiva se dice • Si hay alto grado de asociación entre las variables, en forma
que la covariación de las dos variables es positiva o directa; cuando es directa o inversa, entonces: r tiende a +1 , o r tiende a -1.
negativa la covariación es negativa o inversa, y si es nula, no hay • Si r = 0, no existe en absoluto correlación lineal, en cuyo caso
covariación. puede ocurrir que no exista covariación entre las dos
variables o bien que exista otra no lineal.
• Si r es próximo a 0, entonces no existe correlación lineal,
Es posible demostrar que el cuadrado del coeficiente de correlación
pero puede haber otro tipo de covariación.
(lineal simple) es igual al coeficiente de determinación cuando se utiliza
• En los casos intermedios se puede hablar de una correlación
como modelo una línea recta.
lineal débil.
Es decir, r es igual a la raíz cuadrada de R2:
Σ ( Yi - Yc )2 40
20 90 1800 400 88 -32 1024 2 4 Se2 = ------------------ = ------- = 8
120 4800 9000
1600 120 0 0 2560 0 0 40 0
200 600
150
25600
9000 3600 152 32 1024 -2 4 n 5
140 7000 2500 136 16 256 4 16
100 3000 900 104 -16 256 -4 16
a) Determine la función de regresión, haciendo el ajuste a una línea Sy2 = Syc2 + Se2 = 512 + 8 = 520
recta.
b) Determine la varianza explicada, la varianza residual y la varianza
40 R. Error estándar de estimación, Se , se define como la raíz cuadrada
total.
c) Calcule el error estándar de estimación e interprete de la varianza no explicada o residual
d) Calcule el coeficiente de determinación e interprete.
e) Calcule el coeficiente de correlación lineal simple e interprete Se = = = 2,8284 Los errores son pequeños, por tanto la
representatividad es grande.
60
f) Grafique la función de regresión hallada.
R: Coeficiente de Determinacion, R2 Precio en $us. Yi Cantidad
Se2 demandada, Yi / Xi X
i
2
1 / Xi 2
unidades, Xi
R2 = 1 - -------
Sy2 40 2 20 4 0,25
8 20 4 5 16 0,0625
R2 = 1 - -------- = 0,9846 16 5 3,2 25 0,04
10 8 1,25 64 0,015625
520
8 10 0,80 100 0,01
Las variaciones del volumen de produccion explican en un 98,46 %, las
variaciones del costo de producción, a través del modelo de regresión 30,25 0,378125
Yc = 56 + 1,6 Xi . Yc Yc - Ȳ ( Yc - Yi - Yc (Yi - Yc) 2
Ȳ )2
R. Coeficiente de Correlación (lineal simple), r. Este coeficiente es
igual a la raíz cuadrada del coeficiente de determinación, R2, cuando se 40 21,20 449,44 0 0
utiliza como modelo una línea recta. 20 1,20 1,44 0 0
16 - 2,80 7,84 0 0
10 - 8,80 77,44 0 0
R2 = ; por tanto r = = 0,9923 significa que existe alto grado de 8 -10,80 116,64 0 0
asociación positiva(b es positivo) entre las variables, volumen de
652,80 0
producción y costo total de producción.