Está en la página 1de 6

TP4 Estadı́stica y Probabilidad - UES21

Maximiliano Gabriel Giuliano


28, Noviembre 2022

Resumen
El trabajo presenta una regresión lineal por minimos cuadrados or-
dinarios referida a las ventas en función al tiempo para la empresa Luz
del mundo. Se concluye de dicha estimación lineal la existencia de una
relación directa entre las ventas y el tiempo medida en meses resultando
sus coeficientes estimados significativos.
Palabras claves: Regresión lineal, Minimos cuadrados ordinarios, Predic-
ción.

1. Introducción
El siguiente trabajo realiza una regresión lineal para la empresa Luz del
mundo cuya principal actividad es la venta de juguetes. La empresa esta in-
teresada en conocer cual es la evolución de sus ventas en función al tiempo
medido en meses. Para conseguir la estimación lineal se procedio a generar los
datos aleatorios para un periodo abarcativo de 12 meses a traves de la siguiente
función:

Figura 1: Función para la simulación

Los datos obtenidos para la muestra fueron los siguientes:

1
Figura 2: Muestra generada con funcion para la simulacion

2. Resultados
2.1. Recta de regresión lineal

Figura 3: Recta de regresión lineal h(t) para doce datos simulados con f(t),
donde Y representa las ventas de juguetes y t representa el tiempo en meses

Como se aprecia en la grafica existe una relación directa entre las ventas
de juguetes y el tiempo medido en meses. Como observaremos en la siguien-
te sección utilizamos el método de los minimos cuadrados ordinarios para la
realización de la regresión lineal.

2
2.2. Análisis completo de regresión lineal

Figura 4: Análisis de regresión lineal

Se observan los siguientes resultados obtenidos el valor de la constante u


ordenada al origen es de 5,66 aproximadamente siendo su desviación tı́pica de
3,04325 y el valor del estadistico t observado u experimental de 1,86 con un p
valor de 0,0926. Los cuales muestran que se trata de un valor estimado signi-
ficativo para un nivel de confianza del 90 porciento. Esta conclusión surge de
realizar una prueba test de hipótesis donde:

H0: (beta 1) = 0 (cero)


H1: (beta 1) distinto de 0 (cero)

t observado u experimental: 1,86 mayor estricto a t crı́tico (gl = 10, nivel de


significación 10 porciento): 1,37 con lo cual decimos que, rechazamos la hipotesis
nula y aceptamos la hipotesis alternativa, siendo el coeficiente estimado beta 1
para la linea de regresión un coeficiente significativo para un 90 porciento de
nivel de confianza. El valor asi corroborado de manera significativa nos dice que
cuando el tiempo es igual a cero el nivel de corte de las ventas es igual a 5,66
es decir que aun cuando el tiempo fuese cero la empresa estaria vendiendo de
base 5,66 juguetes. El coeficiente de la pendiente de la lı́nea de regresión es
apróximadamente igual a 2,05 con una desviación tı́pica de 0,41; y el valor del
estadistico t observado u experimental es de 4,96 con un p valor de 0,0006. Los
cuales muestran que se trata de un valor estimado significativo para un nivel de
confianza no solo del 90 porciento sino tambien del 95 y 99 porciento. Proba-
mos esta afirmacion ahora para una prueba de test de hipotesis con un nivel de
confianza del 95 porciento:

H0: (beta 2) = 0 (cero)


H1: (beta 2) distinto de 0 (cero)

t observado u experimental: 4,96 mayor estricto a t crı́tico (gl = 10, nivel de

3
significación 5 porciento): 1,81 con lo cual decimos que, rechazamos la hipotesis
nula y aceptamos la hipotesis alternativa, siendo el coeficiente estimado beta 2
(la pendiente) para la linea de regresión un coeficiente significativo para un 95
porciento de nivel de confianza.
Bondad del ajuste: la prueba de bondad del ajuste se realiza a traves del estadis-
tico R cuadrado y R cuadrado corregido. Los valores obtenidos son: R cuadrado:
0,71
R cuadrado corregido: 0,68
Estos valores nos indican que, la variable independiente ”t.explica a la variable
dependiente ventas en un 71 porciento, si tomamos en consideración el valor
del R cuadrado. Mientras que cuando corregimos dicho valor nos dice que la
variable independiente explica a la variable dependiente en un 68 porciento.
Prueba global de la regresion: Esta prueba la realizamos utilizando el estadistico
”F”de Snedecor. Dicho estadistico nos permite evaluar si toda la regresion en
termino generales o globales es significativa o no. Para ello debemos realizar una
prueba de test de hipotesis donde:

H0: (beta 1) = (beta 2) = 0 (cero)


H1: (beta 1) distinto de (beta 2) y ambos distintos a cero

F observado u experimental: 24,57 mayor estricto a F crı́tico (gl [numerador] =


1, gl [denominador] = 10, nivel de significación 5 porciento): 4,96 con lo cual
decimos que, rechazamos la hipotesis nula y aceptamos la hipotesis alternati-
va, siendo la regresion en terminos generales y globales significativa para un 95
porciento de nivel de confianza.
Prueba de correlacion entre variables: Para realizar esta prueba utilizamos el
coeficiente de correlacion r”. Dicho coeficiente nos permite observar cual es el
nivel de correlacion que existe entre la variable dependiente e independiente.
A demas podemos apreciar si esta relacion es directa o inversa. Para el caso
estudiado dicho estadistico arroja el siguiente valor: Coeficiente de correlacion
(ventas, t): 0,84 Dicho valor nos indica que entre las ventas y el tiempo medido
en meses existe una correlacion de un 84 porciento. Siendo esta relacion de tipo
directa. Es decir que, a medida que aumenta el tiempo en meses el volumen de
las ventas aumentan. Interpretacion de los coeficientes estimados por la linea
de regresion: La linea de regresion estimada por el metodo de los minimos cua-
drados ordinarios como ya hemos anticipado nos arroja el siguiente resultado:
Ventas = 5,66 + 2,05 * t
Con estos resultados diremos que: Si el tiempo fuese igual a cero, la empresa
tendria unas ventas de base de 5,66 juguetes. Por su parte podemos afirmar
tambien que a medida que el tiempo aumenta en una unidad mensual las ventas
de juguetes lo hacen en 2,05.
Analisis de la varianza de la regresion: Cuando se construye una regresion se
pretende realizar el cambio de una variable dependiente o explicada respecto de
una variable independiente o explicativa. En nuestro caso las ventas (variable
explicada) en funcion al tiempo (variable explicativa). El cambio total de la
variable dependiente se puede descomponer en dos partes:

4
1) la parte explicada por la variable independiente.
2) la parte no explicada por la variable independiente. Cuanto mas cerca a la
linea de regresion caigan las observaciones (es decir cuanto mas pequeños sean
los residuos), tanto mayor sera la variacion en las ventas por la ecuacion de la
regresion estimada. En nuestro caso se puede observar que:

LA SUMA DE LOS CUADRADOS EXPLICADOS (SCE) = 600,71


LA SUMA DE LOS CUADRADOS NO EXPLICADAS O RESIDUALES (SCR)
= 244,5
Y LA SUMA DE LOS CUADRADOS TOTALES (SCT) = 845,21
De estos valores se deduce que al hacer el cociente entre SCE / SCT = 0,71
que es el valor, como ya hemos analizados del coeficiente de determinacion R
cuadrado.

2.3. Cantidad de juguetes vendidos el proximo mes f(13)

Figura 5: Predicción

La prediccion se refiere a la estimacion del valor de la variable dependiente,


ventas futuras dado un valor proyectado de la variable independiente donde
este es igual a 13. En este sentido la cantidad de juguetes estimados para la
observacion numero 13 es de 32,30 siendo su intervalo de confianza para un
nivel del 95 porciento de (19,37; 45,24). Es decir las ventas proyectadas quedan
incluidas dentro del intervalo de confianza del 95 porciento.

2.4. Simulacion de un dato f(13) y comparacion con el


dato predicho por la recta de regresion lineal

Figura 6: Valor simulado

Como puede observarse cuando se ha simulado para el periodo 13 el volumen


de ventas de juguetes este resulta ser de 30,94. Mientras que cuando se ha hecho

5
la prediccion asumiendo un error de significacion del 5 porciento y en consecuen-
cia un nivel de confianza del 95 porciento las ventas resultan ser de 32,30. Este
ultimo es contenido en un intervalo de confianza entre (19,37; 45,24). Resulta
claro, que para el valor f(13) simulado, este no ha surgido de procedimientos es-
tadisticos inferenciales que permiten predecir en el marco de un error estadistico
tipo 1. Asi entonces el valor f(13) resulta ser un calculo deterministico que no
esta sujeto a la variabilidad estocastica que genera el tiempo sobre las ventas.
Por esta razon f(13) no resulta ser un valor confiable o significativo dado que
carece de la rigurosidad de la estadistica inferencial.

3. Conclusion
Luego de realizar la regresion lineal de las ventas en funcion al tiempo se
puede corroborar que para 12 observaciones mensuales que constituyeron la
muestra:
1) existe una relación directa entre la variable explicada ventas y la variable
explicativa tiempo. Dicha relación directa se apoya en un 84 por ciento marcado
por el coeficiente de correlación.
2) las ventas de jugetes aumentas en un 2,05 por unidad de crecimiento de
tiempo.
3) Si este último, fuera cero, entonces las ventas, tienen un volumen de base
ubicado en 5,66 juguetes.
4) La regresión muestra a su vez, que la variable explicativa tiempo logra explicar
el comportamiento de la variable ventas, en un 71 porciento y si lo corregimos
en un 68 porciento.
5) Por ultimo cuando se ha incorporado el mes numero 13 la prediccion arroja
con un 95 por ciento de nivel de confianza que las ventas terminaran creciendo
y lograran alcanzar un volumen de 32,30.

4. Referencias
Listado de referencias utilizados para el desarrollo del trabajo practico:

Notas de catedra: Estadistica y probabilidad, Universidad siglo 21 (2022).


Software: Gretl Cottrell Allin y Luccheti Ricardo (2005) Software de regre-
sion, econometria y serie de tiempo.
Software: Overleaf Generador de pdf mediante Latex.
Bibliografia: Sanchez Fernandez, Jesus (2003) Introduccion a la estadistica
empresarial, Madrid españa.

También podría gustarte