Está en la página 1de 25

Estadística Descriptiva con dos

Variables

(MODELO LINEAL DE REGRESIÓN)

Capitulo III
Estadística Descriptiva con dos variables
3.1 Introducción al análisis de Regresión y Correlación
Hasta ahora vimos el análisis de una variable, en este capitulo
trataremos el estudio conjunto de dos variables numéricas, es decir, el
análisis y la representación bidimensional de un par de variables
cuantitativas más sus gráficos, y la eventual relación estadística
existente entre variables.

Ing. Wilson TRUJILLO ARANIBAR, FCyT-UMSS 2


Estadística Descriptiva con dos variables
Los Modelos de Regresión estudian la relación estocástica cuantitativa
entre una variable de interés y una o varias variables explicativas.
Es decir: Y = m (X1 ,X2 ,….., Xk ) + ε

Para iniciar el análisis, debemos determinar primero cual de las dos


variables es la variable dependiente, y cual será la independiente, es
decir cual variable ayuda a predecir a la otra.

Ing. Wilson TRUJILLO ARANIBAR, FCyT-UMSS 3


Estadística Descriptiva con dos variables
¿Cual es la relación estadística entre dos variables?
-Una variable dependiente numérica (explicada), aquella a quien
se va a predecir.
-Y una o más variables independientes numéricas y categóricas
(explicativas), utilizada para la predicción de valores
dependientes.
Si este modelo es valido, entonces existe una relación numérica
entre ambas variables.

Ing. Wilson TRUJILLO ARANIBAR, FCyT-UMSS 4


Estadística Descriptiva con dos variables
3.2 Primera Etapa del Análisis
Realizar un grafico para juzgar visualmente si la relación es lineal.
El Diagrama de dispersión, es una grafica en la que cada punto
trazado, representa un par de valores observados de las variables
independiente y dependiente. El valor de la variable independiente “X”
se identifica respecto del eje horizontal, y el valor de la variable
dependiente “Y” se identifica respecto del eje vertical.

Ing. Wilson TRUJILLO ARANIBAR, FCyT-UMSS 5


Estadística Descriptiva con dos variables

Ing. Wilson TRUJILLO ARANIBAR, FCyT-UMSS 6


Estadística Descriptiva con dos variables
Una vez realizado el Diagrama de Dispersión, si la nube de puntos es
ascendente podemos decir que la relación entre las dos variables es
Directa, es decir si aumenta de valor X, también aumentará de valor Y.
En cambio si la relación es descendente, las variables tienen una
asociación inversa, mientras aumente el valor de X, menor será el
valor de Y.
Si no es ascendente o descendente, es decir paralelo a los ejes o sin
orientación, se concluye que no existe relación estadística entre las dos
variables.

Ing. Wilson TRUJILLO ARANIBAR, FCyT-UMSS 7


Estadística Descriptiva con dos
variables
Ejemplo de Aplicación:
Las empresas de energía eléctrica, que deben planear la operación y
expansión de generación de electricidad, están muy interesadas en
pronosticar la demanda de energía. Se realizó un estudio a corto plazo
para investigar el efecto de la temperatura media diaria de cada mes y
el consumo medio diario (en kWh) por familia. Se obtuvieron datos
durante 2 años.

Los datos son los siguientes:

Ing. Wilson TRUJILLO ARANIBAR, FCyT-UMSS 8


Estadística Descriptiva con dos variables
Temperatura Consumo
media diaria medio diario Realice el grafico correspondiente al
en ºF (kWh) análisis de Regresión en su primera etapa.
31 40
34 41
39 43 ¿Cuál es la variable dependiente?
42 44 ¿Existe una relación estadística entre
47 46
56 48 ambas variables?
62 50 ¿De que tipo es?
66 52
68 55
71 59
75 62
78 65

Ing. Wilson TRUJILLO ARANIBAR, FCyT-UMSS 9


Estadística Descriptiva con dos variables
Solución.- El Diagrama de Dispersión será:

Ing. Wilson TRUJILLO ARANIBAR, FCyT-UMSS 10


Estadística Descriptiva con dos variables
Interpretación:
De acuerdo con el grafico, podemos observar que existe la
aproximación lineal entre las dos variables, por lo que existe una
relación estadística de tipo ascendente.
Lo que significa, que a mayor es la temperatura media diaria, mayor
será el consumo de energía eléctrica diaria.

Ing. Wilson TRUJILLO ARANIBAR, FCyT-UMSS 11


Estadística Descriptiva con dos variables
3.3 Segunda Etapa del Análisis

Modelización de la variación entre las dos variables. Determinación de


la Ecuación de regresión, En un análisis de regresión, es necesario
exprimir las variaciones de una variable “Y” en función de las
variaciones de la otra variable “X” por una relación lineal (el modelo):

Yi = b0 + b1.(Xi) + ε

Ing. Wilson TRUJILLO ARANIBAR, FCyT-UMSS 12


Estadística Descriptiva con dos variables

Ing. Wilson TRUJILLO ARANIBAR, FCyT-UMSS


Estadística Descriptiva con dos variables
Método de los Mínimos Cuadrados:
Para determinar los valores de los parámetros bo y b1, el criterio
matemático utilizado son las ecuaciones normales lineales. De
acuerdo con este criterio la línea de regresión, con el mejor ajuste (la
mejor ecuación) es aquella para la cual se reduce el mínimo la suma
de las desviaciones cuadradas entre los valores estimados y reales de
la variable dependiente para los datos muéstrales.

Ing. Wilson TRUJILLO ARANIBAR, FCyT-UMSS 14


Estadística Descriptiva con dos variables

Ing. Wilson TRUJILLO ARANIBAR, FCyT-UMSS 15


Estadística Descriptiva con dos variables
Para determinar las constantes (bo, b1) del Modelo Lineal:
Yˆi  b 0 b 1X i

Para la Pendiente de la Ecuación, o la constante b1:

 X i   
n n
   Yi  Intercepto, o la constante bo:
X i Yi    
n

 i1

n
i1

b1  i1


2 b 0  Y  b1 X
X i 
n
 
 
n

 2 i1
X i
i 1 n

Ing. Wilson TRUJILLO ARANIBAR, FCyT-UMSS 16


Estadística Descriptiva con dos variables
Interpretación de los coeficientes del Modelo:
1.Respecto a la primera constante bo, representa el valor de la variable
dependiente (Y), cuando X es igual a cero.

2.En el caso de la segunda constante b1, este representa el grado de


crecimiento (+b1, función ascendente), o de disminución (-b1, función
descendente) que tiene la variable Y, por cada unidad que cambia la
variable X.

Ing. Wilson TRUJILLO ARANIBAR, FCyT-UMSS 17


Estadística Descriptiva con dos variables
Ejemplo de Aplicación:
Ya que se ha comprobado gráficamente que el consumo de energía
eléctrica depende de la temperatura media diaria por familia.

Determinar cual es modelo de regresión lineal que se ajusta a los datos,


además de interpretar sus coeficientes que se calculan para este caso.

Ing. Wilson TRUJILLO ARANIBAR, FCyT-UMSS 18


Estadística Descriptiva con dos variables
Solución.- La tabla de cálculos será:
Temperatura en Consumo
N X.Y X^2
ºF (kW h)
(X) (Y)
1 31 40 1240 961
2 34 41 1394 1156
3 39 43 1677 1521
4 42 44 1848 1764
5 47 46 2162 2209
6 56 48 2688 3136
7 62 50 3100 3844
8 66 52 3432 4356
9 68 55 3740 4624
10 71 59 4189 5041
11 75 62 4650 5625
12 78 65 5070 6084
TOTAL: 669 605 35190 40321

MODE -> STAT -> Y=a+bX -> \x,y\ -> OPTN(4)


Ing. Wilson TRUJILLO ARANIBAR, FCyT-UMSS 89
Estadística Descriptiva con dos
variables

Interpretación:
1.Respecto a bo, el consumo energético es de 23,5 kWh cuando la
temperatura es igual a cero ºF.
2.En el caso de b1, por cada grado ºF que aumenta la temperatura, el
consumo de energía aumenta en 0,483 kWh.

Ing. Wilson TRUJILLO ARANIBAR, FCyT-UMSS 20


Estadística Descriptiva con dos variables
3.4 Tercera Etapa del Análisis
Comprende el calculo de la Correlación estadística entre las dos
variables de análisis, el cual varia de -1 a +1, de acuerdo con la
siguiente expresión:

-1,0
Correlaión
Negativa Prfecta

Ing. Wilson TRUJILLO ARANIBAR, FCyT-UMSS 91


Estadística Descriptiva con dos variables
Ejemplo de Aplicación:
Ya que se ha comprobado gráficamente que el consumo de energía
eléctrica depende de la temperatura media diaria por familia. Así
también se ha establecido el modelo de regresión lineal que se
ajusta a los datos. Finalizando ahora con el calculo de la correlación
estadística, para la comprobación del ajuste lineal.

Ing. Wilson TRUJILLO ARANIBAR, FCyT-UMSS 22


Estadística Descriptiva con dos variables
Solución.- De acuerdo con la tabla de datos:
Temperatura en Consumo Cov( X ,Y )
N r   0,962
ºF (kWh) (S x .Sy )
(X) (Y)
1 31 40
2 34 41
3 39 43 • Como el valor de la correlación es próximo
4 42 44
5 47 46 a uno (positivo), se comprueba la
6 56 48
7 62 50 asociación entre las dos variables, y el
8 66 52
9 68 55
correcto ajuste lineal en los datos.
10 71 59
11 75 62
12 78 65
TOTAL: 669 605

• MODE -> STAT -> Y=a+bX -> \x,y\ -> OPTN(4)


Ing. Wilson TRUJILLO ARANIBAR, FCyT-UMSS 93
Con la ayuda del Software Minitab v.18:

Ing. Wilson TRUJILLO ARANIBAR, FCyT-UMSS 24


Con la ayuda del Software Minitab v.18:

Ing. Wilson TRUJILLO ARANIBAR, FCyT-UMSS 25

También podría gustarte