Está en la página 1de 9

Estudio de Caso #2:

Resolución de un planteamiento de caso estadístico

Introducción

La visualización y análisis de datos mediante gráficos de dispersión y regresión lineal son


prácticas esenciales en el campo de la estadística y la ciencia de datos. Estas técnicas nos permiten
explorar y comprender la relación entre dos variables, lo que a su vez puede proporcionar información
valiosa para la toma de decisiones, la formulación de estrategias y la predicción de resultados futuros. En
este contexto, consideremos un ejemplo hipotético en el que se investiga la relación entre los sueldos y
los ahorros de diferentes familias.

Al representar esta relación en un gráfico de dispersión, con los sueldos en el eje horizontal y los
ahorros en el eje vertical, cada punto en el gráfico representa los datos de una familia. La pregunta
fundamental que buscamos responder es si existe una tendencia que sugiera que, a medida que los
sueldos aumentan, los ahorros también aumentan. Esta pregunta es crucial en diversas áreas, como la
economía, las finanzas personales y la planificación financiera, ya que puede proporcionar información
valiosa sobre cómo los ingresos influyen en la capacidad de ahorro de las familias.

La línea de regresión que mejor se ajusta a estos datos nos ofrece valiosa información. El punto
en el que esta línea cruza el eje vertical, conocido como el intercepto, representa el ahorro promedio
esperado cuando el sueldo es cero, lo que nos brinda una idea del ahorro base antes de que los sueldos
tengan un efecto significativo. La pendiente de la recta nos muestra cómo los ahorros cambian con cada
aumento en el sueldo, lo que puede tener implicaciones importantes para la toma de decisiones
financieras.

Planteamiento de caso estadístico

Se quiere saber si existe relación entre el salario de los trabajadores de una empresa y el ahorro
que cada uno realiza, se tomó una muestra de 10 trabajadores con los resultados que se muestran en la
tabla adjunta, resuelva lo siguiente:

Variable independiente Variable pendiente


Sueldo ($) Ahorro ($)
8600 2600
9300 2300
1000 450
3300 950
7700 2500
7500 1930
2000 370
6250 2000
4500 1300
5500 2100
Resolución

1. Tabulación de cálculos de variabilidad.

x = Sueldo (Variable independiente)


y = Ahorro (Variable dependiente)

x y xy x2 y2
8,600 2,600 22,360,000 73,960,000 6,760,000
9,300 2,300 21,390,000 86,490,000 5,290,000
1,000 450 450,000 1,000,000 202,500
3,300 950 3,135,000 10,890,000 902,500
7,700 2,500 19,250,000 59,290,000 6,250,000
7,500 1,930 14,475,000 56,250,000 3,724,900
2,000 370 740,000 4,000,000 136,900
6,250 2,000 12,500,000 39,062,500 4,000,000
4,500 1,300 5,850,000 20,250,000 1,690,000
5,500 2,100 11,550,000 30,250,000 4,410,000
55,650 16,500 111,700,000 381,442,500 33,366,800
2. Construcción de la gráfica de dispersión.

Gráfico de dispersión
2,750
2,500
2,250
2,000
1,750
Ahorros ($)

1,500
1,250
1,000
750
500
250
0
0 1,000 2,000 3,000 4,000 5,000 6,000 7,000 8,000 9,000 10,000
Sueldos ($)

3. Determinar el valor de la intersección con las ordenadas.

x=
∑x y=
∑y a= y−b⋅ x
n n

55650 16500
x= y= a=1650−0.277 ⋅5565
10 10

x=5565 y=1650 a=108.29

El valor de la intersección con las ordenadas es 108.29

4. Determinar el valor de la pendiente de la recta.

n⋅ ∑ ( x y )−Σ x ⋅ Σ y
b=
n⋅ ∑ x2 −( ∑ x )
2

10 ⋅111700000−55650 ⋅16500
b=
10 ⋅381442500−3096922500
b=0.277

El valor de la pendiente de la recta es 0.277

5. Determinar la ecuación de la recta de regresión de mejor ajuste.

y=mx+b

y=0.277 x+108.29

6. Tabular los pares ordenados de la recta de estimación

x y
8,600 2,490
9,300 2,684
1,000 385
3,300 1,022
7,700 2,241
7,500 2,186
2,000 662
6,250 1,840
4,500 1,355
5,500 1,632

7. Trazar la recta de estimación en el eje de coordenadas.

Recta de estimación
3,000
2,750
2,500
2,250
Ahorros Estimados ($)

2,000
1,750
1,500
1,250
1,000
750
500
250
0
0 1,000 2,000 3,000 4,000 5,000 6,000 7,000 8,000 9,000 10,000
Sueldos ($)
8. Calcular el error estándar de la estimación.

se =
√ ∑ y 2−( a ⋅ Σy )−( b ⋅∑ xy )
n−2

se =
√ 333366800−( 108.29 ⋅16500 ) −( 0.277 ⋅111700000 )
10−2

se =282.647

El error estándar de la estimación 282.647

9. Calcular el coeficiente muestral de determinación.

2
∑ y ( )2 se 2

sy =2 −y R2=1−
n sy 2

33366800 2 79889.33
sy =
2 −2722500 R =1−
10 614180

s y =614180
2
2
R =0.8699

El coeficiente muestral de determinación es 0.8699

10. Calcular el coeficiente muestral de correlación.

r =√ R 2

r =√ 0.8699

r =0.9327

El coeficiente muestral de correlación es 0.9327

11. Determinar el intervalo de confianza al 90% del sueldo de un trabajador que ahorra $750.

y=0.277 x+108.29

750=0.277 x+108.29

750−108.29=0.277 x
641.71=0.277 x

641.71
=x
0.277

x=2316.64

Intervalo de confianza del sueldo al 90% con un ahorro de $750 es de $1731.29 a $2901.39
12. Determinar el intervalo de predicción de ahorro al 95% para un trabajador con un sueldo de $2700
mensuales.
y=0.277 x+108.29

2700=0.277 x+ 108.29

2700−108.29=0.277 x

6412591.71=0.277 x

641.71
=x
0.277

x=9356.35

Intervalo de predicción del sueldo al 95% con un sueldo de $2700 es de $ 140.34 a $ 1572.23

13. Realice un análisis respectivo del caso que evidencie argumentos estadísticos y de la realidad
cotidiana.

Visualizamos los datos en un gráfico de dispersión, con los sueldos en el eje horizontal y los
ahorros en el vertical. Cada punto representa los datos de una familia, y al observar cómo se distribuyen,
buscamos una tendencia que sugiera que a mayores sueldos corresponden mayores ahorros. La línea de
regresión que mejor se ajusta a nuestros datos cruza el eje Y, el eje de ahorro, en un punto. Este punto,
conocido como el intercepto, nos indica el ahorro promedio esperado cuando el sueldo es cero. Es una
forma de entender el ahorro base antes de que el efecto del sueldo entre en juego. La pendiente de la
recta nos indica cómo cambian los ahorros con cada incremento en el sueldo. Una pendiente más
pronunciada significaría que incluso pequeños aumentos en el sueldo podrían llevar a grandes aumentos
en el ahorro. La ecuación de la recta nos da una fórmula para predecir el ahorro basado en el sueldo. En
nuestro caso, encontramos que la ecuación tiene una pendiente moderada y un intercepto positivo, lo
que indica que hay un punto de partida para los ahorros incluso para aquellos con sueldos más bajos.
Con la ecuación de la recta, podemos calcular y tabular los ahorros estimados para diferentes niveles de
sueldo, creando una tabla que nos permite ver cómo el modelo predice que los ahorros cambiarán con
el sueldo. Superponemos la recta de regresión sobre el gráfico de dispersión.

Esto nos ayuda a visualizar cómo el modelo se ajusta a los datos reales y a identificar dónde
podrían estar las discrepancias. Se calculo el error estándar de la estimación, que nos da una idea de
cuán dispersos están los puntos reales alrededor de la recta de regresión. Esto es vital porque, aunque la
recta nos da una predicción media, cada familia es única y podría tener ahorros que se desvían de esa
media por una variedad de razones no capturadas por el modelo de sueldo solo. Este coeficiente nos da
una medida de cuán bien la variabilidad en los ahorros puede ser explicada por los sueldos. En términos
más simples, nos dice cuánto de los cambios en los ahorros se debe a los cambios en los sueldos. En
nuestro análisis, lo que indica que una gran parte de la variación en el ahorro puede atribuirse a las
diferencias en los sueldos. El coeficiente muestral de correlación refleja la fuerza y la dirección de la
relación lineal entre los sueldos y los ahorros. Un valor cercano a 1 indica una relación positiva fuerte, lo
que en nuestro caso significa que a medida que los sueldos aumentan, lo hacen también los ahorros, y
esto ocurre de manera bastante consistente.

Conclusiones y consideraciones finales

Una de las conclusiones más importantes que se obtiene al realizar un análisis de regresión lineal
es la interpretación del intercepto y la pendiente de la recta. El intercepto es el punto en el eje vertical
(eje de ahorro) donde la línea de regresión cruza cuando el sueldo es igual a cero. Esto proporciona una
estimación del ahorro promedio esperado antes de que el efecto del sueldo entre en juego. Por otro
lado, la pendiente de la recta nos indica cómo cambian los ahorros con cada incremento en el sueldo.
Una pendiente pronunciada sugiere que pequeños aumentos en el sueldo pueden resultar en grandes
aumentos en los ahorros, mientras que una pendiente más suave indica un cambio más gradual. Estos
valores son esenciales para comprender la relación entre las variables y para realizar predicciones
basadas en la ecuación de la recta.

Al calcular el coeficiente de determinación (R²), se obtiene una medida de cuánto de la


variabilidad en los ahorros puede ser explicada por las diferencias en los sueldos. En términos más
simples, R² nos indica cuánto de los cambios en los ahorros se debe a los cambios en los sueldos. Un
valor de R² cercano a 1 sugiere que los sueldos son una variable muy influyente en los ahorros y que el
modelo de regresión lineal se ajusta bien a los datos. Por otro lado, un valor bajo de R² indica que otros
factores no considerados en el modelo pueden estar contribuyendo significativamente a la variación en
los ahorros.

El coeficiente de correlación, a menudo denotado como r, refleja la fuerza y la dirección de la


relación lineal entre los sueldos y los ahorros. Un valor de r cercano a 1 indica una relación positiva
fuerte, lo que significa que a medida que los sueldos aumentan, los ahorros también aumentan de
manera consistente. Por el contrario, un valor de r cercano a -1 indica una relación negativa fuerte, lo
que implica que a medida que los sueldos aumentan, los ahorros disminuyen. Un valor cercano a 0
sugiere una relación débil o nula entre las dos variables. La interpretación del coeficiente de correlación
es crucial para comprender la dirección y la magnitud de la relación entre sueldos y ahorros en el
contexto específico del estudio.

También podría gustarte