Está en la página 1de 22

TRABAJO DE ESTADISTICA INFERENCIAL

GISSELLE MESA

ANGELA DONADO

DAYSI MOSQUERA

CAMILA ROJAS

JUAN CAMILO BLANCO

JORGE BARON

ESTADISTICA INFERENCIAL

ADMINISTRACION EN FINANZAS Y NEGOCIOS INTERNACIONALES

UNIVERSIDAD DE CORDOBA

2023
Ejercicio 1: Consumer Reports publica pruebas y evaluaciones sobre televisores de
alta definición. Para cada modelo se elabor una evaluación general basada
principalmente en la calidad de la imagen. Una evaluación más alta indica un mejor
funcionamiento. En los datos siguientes se dan evaluación general y precio de
televisores de plasma de 45 pulgadas (Consumer Reports, marzo 2006).

Precio Puntuación en la
Marca
(X) evaluación (Y) 𝒙𝟐 𝒚𝟐 𝒙𝒚

Dell 2800 62 7840000 3844 173600

Hisense 2800 53 7840000 2809 148400

Hitachi 2700 44 7290000 1936 118800

JVC 3500 50 12250000 2500 175000

LG 3300 54 10890000 2916 178200

Maxent 2000 39 4000000 1521 78000

Panasonic 4000 66 16000000 4356 264000

Phillips 3000 55 9000000 3025 165000

Proview 2500 34 6250000 1156 85000

Samsung 3000 39 9000000 1521 117000

29600 496 90360000 25584 1503000

Use estos datos para obtener una ecuación de regresión estimada que pueda emplearse
para estimar la puntuación en la evaluación general de una televisión de 42 pulgadas
dado el precio.

• La variable dependiente (Y) y la variable independiente (X).

La variable dependiente (Y) está definida como “Puntuación en la evaluación” la variable


independiente (X) seria “Precio”
• Diagrama de dispersión e interpretación

Puntuación en la evaluación por Precio


y = 0,0127x + 12,017
70
65 66
62
PUNTUACIÓN EN LA EVALUACIÓN

60
55 55 54
53
50 50
45 44
40 39 39
35 34
30
25
20
15
10
5
0
0

250

500

750

1000

1250

1500

1750

2000

2250

2500

2750

3000

3250

3500

3750

4000

4250
PRECIO

El gráfico de dispersión muestra claramente una relación linealmente positiva y


significativa entre el costo del televisor y la puntuación de la evaluación.

• Covarianza e interpretación

Para hallar la covarianza usaremos la expresión:

𝑛
1
𝐶𝑜𝑣(𝑋, 𝑌) = ∑(𝑥𝑖 − 𝑥̅ )(𝑦 − 𝑦̅)
𝑛−1
𝑖=1

𝑥̅ = 2960 , 𝑦̅ = 49.6
Así:

1
= [(2800 − 2960)(62 − 49.6) + (2800 − 2960)(53 − 49.6) + (2700 − 2960)(44 −
10−1
49.6) + (3500 − 2960)(50 − 49.6) + (3300 − 2960)(54 − 49.6) + (2000 − 2960)(39 −
49.6) + (4000 − 2960)(66 − 49.6) + (3000 − 2960)(55 − 49.6) + (2500 − 2960)(34 −
49.6) + (3000 − 2960)(39 − 49.6)]
1
= [(−160)(12.4) + (−160)(3.4) + (−260)(−5.6) + (540)(0.4) + (340)(4.4) +
9
(−960)(−10.6) + (1040)(16.4) + (40)(5.4) + (−460)(3.4) + (40)(−10.6)]
1
= [−1984 − 544 + 1456 + 216 + 1496 + 10176 + 17056 + 216 + 7176 − 424]
9

1
= (34840)
9
𝐶𝑜𝑣(𝑋, 𝑌) = 3871.1111

El resultado obtenido indica una correlación positiva entre la puntuación y el


precio del producto, ya que el valor de la covarianza es positivo.

• Coeficiente de correlación de Pearson, interprete.


Para hallar el coeficiente de correlación de Pearson usaremos la expresión:

𝐶𝑜𝑣(𝑋, 𝑌)
𝑟=
√∑(𝑥𝑖 − 𝑥̅ )2 √∑(𝑦𝑖 − 𝑦̅)2

∑(𝑥𝑖 − 𝑥̅ )2 = [(2800 − 2960)2 + (2800 − 2960)2 + (2700 − 2960)2 + (3500 − 2960)2 +


(3300 − 2960)2 + (2000 − 2960)2 + (4000 − 2960)2 + (3000 − 2960)2 +
(2500 − 2960)2 + (3000 − 2960)2 ]

∑(𝑥𝑖 − 𝑥̅ )2 = [(−160)2 + (−160)2 + (−260)2 + (540)2 + (340)2 + (−960)2 +


(1040)2 + (40)2 + (−460)2 + (40)2 ]

∑(𝑥𝑖 − 𝑥̅ )2 = [25600 + 25600 + 67600 + 291600 + 115600 + 921600 + 1081600 + 1600


+ 211600 + 1600]

∑(𝑥𝑖 − 𝑥̅ )2 = 2744000

∑(𝑦𝑖 − 𝑦̅)2 = [(62 − 49.6)2 + (53 − 49.6)2 + (44 − 49.6)2 + (50 − 49.6)2 + (54 − 49.6)2 +
(39 − 49.6)2 + (66 − 49.6)2 + (55 − 49.6)2 + (34 − 49.6)2 + (39 − 49.6)2 ]

∑(𝑦𝑖 − 𝑦̅)2 = [(12.4)2 + (3.4)2 + (−5.6)2 + (0.4)2 + (4.4)2 + (−10.6)2 + (16.4)2 + (5.4)2 +
(−15.6)2 + (−10.6)2 ]

∑(𝑦𝑖 − 𝑦̅)2 = [153.76 + 11.56 + 31.36 + 0.16 + 19.36 + 112.36 + 268.96 + 29.16 + 243.36
+ 112.36]

∑(𝑦𝑖 − 𝑦̅)2 = 982.4


Así:

3871.1111 3871.1111 3871.1111


𝑟= = = = 0.0746
(√2744000)(√982.4) (1656.5023)(31.3433) 51920.1849

Dado que el coeficiente de correlación 0.0746 > 0, podemos afirmar que hay una correlación
positiva, sin embargo, esta es muy débil y casi nula entre las dos variables que se están
analizando. Un valor tan cercano a cero indica que no hay una relación lineal significativa
entre las variables.

• Prueba de significancia del coeficiente de correlación de Pearson.

1. Se plantean las hipótesis

𝐻𝑖𝑝ó𝑡𝑒𝑠𝑖𝑠 𝑛𝑢𝑙𝑎: 𝐻0: 𝐶𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖ó𝑛 = 0


𝐻𝑖𝑝ó𝑡𝑒𝑠𝑖𝑠 𝑎𝑙𝑡𝑒𝑟𝑛𝑎𝑡𝑖𝑣𝑎: 𝐻1: 𝐶𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖ó𝑛 ≠ 0

2. Se establece el nivel de significancia


𝛼 = 0.05

Utilizamos las funciones de la distribución t para hallar los valores críticos


de 𝑡𝑐 a un valor de confianza de 0.95.

Nota: si se evalua diferente de cero entonces el valor de alfa es:

(1 − 𝑐𝑜𝑛𝑓𝑖𝑎𝑛𝑧𝑎) (1 − 𝛼)
𝛼= =
2 2

A esto se le llama prueba de dos colas.

𝑡 (𝑎,𝑛−2) = 𝑡 0.05 = 𝑡 (0.025,8) = 2.31


2 ( 2 ,10−2)

3. Calculamos el estadístico de prueba


√𝑛 − 2 √10 − 2
𝑡=𝑟 = (0.0746) = 0.2119
√1 − 𝑟 2 √1 − (0.0746)2

4. Decisión

Dado que el valor de 𝑡 = 0.2119 está dentro del rango del valor crítico
de 𝑡(0.025,2) = 2.31, se puede afirmar que está en zona de no rechazo.

5. Conclusión
Entonces con esto se puede asegurar y probar que el valor del coeficiente de
correlación que se obtuvo de la muestra sería absolutamente igual a cero en una
población con un nivel de confianza del 95%.

• Modelo de regresión lineal simple, interprete cada uno de los


coeficientes.

Para hallar el modelo de regresión necesitamos calcular los estimadores,


teniendo en cuenta de unas sumatorias:

𝑛 𝑛 𝑛 𝑛

∑ 𝑥𝑖 = 29600 , ∑ 𝑦𝑖 = 496 , ∑ 𝑥𝑖 𝑦𝑖 = 1503000, ∑ 𝑥𝑖2 = 90360000


𝑖=1 𝑖=1 𝑖=1 𝑖=1

∑ 𝑥𝑖 𝑦𝑖 − 𝑛𝑦̅𝑥̅ 1503000 − 10(49.6)(2960)


𝛽1 = = = 0.01269
∑ 𝑥𝑖2 − 𝑛𝑥̅ 2 90360000 − 10(49.6)2

𝛽0 = 𝑦̅ − 𝑥̅ 𝛽1 = 49.6 − 0.01269679 (2960) = 12.01749

El modelo de regresión estaría dado como:

𝑦̂ = 𝛽0 + 𝛽1 × 𝑃𝑟𝑒𝑐𝑖𝑜

𝑦̂ = 12.01749 + 0.01269 × 𝑃𝑟𝑒𝑐𝑖𝑜

El valor 𝜷𝟎 = 𝟏𝟐. 𝟎𝟏𝟕𝟒𝟗 indica que a un 0 El valor 𝜷𝟏 = 𝟎. 𝟎𝟏𝟐𝟔𝟗 indica que a un 1 %


% de incremento del precio de venta de un de incremento del precio de venta de un
televisor, la puntuación en la evaluación televisor, la puntuación en la evaluación
incrementa un 𝟏𝟐. 𝟎𝟏𝟕𝟒𝟗. incrementa un 𝟎. 𝟎𝟏𝟐𝟔𝟗.

• Estimación de la respuesta media, para un determinado valor de la


variable independiente.

Según nuestro modelo, tenemos:

𝑦̂ = 12.01749 + 0.01269 × 𝑃𝑟𝑒𝑐𝑖𝑜

Entonces para un televisor con un precio de 5000, se estima una puntuación de


𝟕𝟓. 𝟒𝟔𝟕𝟓

𝑦̂ = 12.01749 + 0.01269(5000) = 75.4675


• Coeficiente de determinación (R2), interprete.

Para hallar el coeficiente de determinación usaremos la expresión:

∑(𝑦̂ − 𝑦̅)2
𝑅2 =
∑(𝑦 − 𝑦̅)2

4.1269389 + 34.1117297 + ⋯ + 0.2579337 442.3563


𝑅2 = = = 0.4503
153.76 + 11.56 + ⋯ + 112.36 982.4

𝑅 2 = 0.4503

Al observar el gráfico, se puede apreciar una relación positiva. A medida que el


precio aumenta, lógicamente se obtiene un puntaje más alto. El coeficiente de
determinación, calculado como R cuadrado, muestra un ajuste de 0,45. Esto indica
que el modelo se ajusta de manera significativa pero limitada a la variable real.
Aunque no sería completamente preciso desde el punto de vista técnico, podríamos
afirmar que el modelo explica aproximadamente el 45.03 % de la variabilidad de la
variable real.

• Pruebas de significancia de los coeficientes

Hipótesis para 𝛽1

1. Planteamos las hipótesis

𝐻0 : 𝛽1 = 0
Vs
𝐻0 : 𝛽1 ≠ 0

2. Establecemos el nivel de significancia

𝛼 = 0.05, 𝑡(𝛼,𝑛−2) = 𝑡 0,05 = 𝑡(0.025,8) = 2.31


2 ( 2 ,10−2)

3. Calculamos el estadístico de prueba

̂1 − 𝑏1
𝛽 0.01269 − 0 0.01269
𝑇0 = = = = 2.5599
𝑠2 0.0049
√ √ 67.5055
𝑆𝑥𝑥 2744000

4. Dado que 𝑻𝟎 = 𝟐. 𝟓𝟓𝟗𝟗 > 𝒕(𝟎.𝟎𝟐𝟓,𝟖) = 𝟐. 𝟑𝟏, se rechaza la hipótesis nula por tanto
𝜷𝟏 ≠ 𝟎
Hipótesis para 𝛽0

1. Planteamos las hipótesis

𝐻0 : 𝛽0 = 0
vs
𝐻0 : 𝛽0 ≠ 0

2. Establecemos el nivel de significancia

𝛼 = 0.05, 𝑡(𝛼,𝑛−2) = 𝑡 0,05 = 𝑡(0.025,8) = 2.31


2 ( 2 ,10−2)

3. Calculamos el estadístico de prueba

̂0 − 𝑏0
𝛽 12.01749 − 0 12.01749
𝑇0 = = = = 0.8060
1 𝑥̅ 2 √14.9096 0.0049
√𝑠2 [ + ]
𝑛 𝑆𝑥𝑥

4. Dado que 𝑻𝟎 = 𝟎. 𝟖𝟎𝟔𝟎 < 𝒕(𝟎.𝟎𝟐𝟓,𝟖) = 𝟐. 𝟑𝟏, se rechaza la hipótesis alternativa por
tanto 𝜷𝟎 = 𝟎
Ejercicio 2: Una aplicación importante del análisis de regresión a la contaduría es la
estimación de costos. Con datos sobre volumen de producción y costos y empleando
el m todo de mínimos cuadrados para obtener la ecuación de regresión estimada que
relacione volumen de producción y costos, los contadores pueden estimar los costos
correspondientes a un determinado volumen de producción. Considere la siguiente
muestra de datos sobre volumen de producción y costos totales de una operación de
fabricación.

Volumen
Costos totales 𝒙𝟐 𝒚𝟐 𝒙𝒚
producción
400 4000 160000 16000000 1600000

450 5000 202500 25000000 2250000

550 5400 302500 29160000 2970000

600 5900 360000 34810000 3540000

700 6400 490000 40960000 4480000

750 7000 562500 49000000 5250000

3450 33700 2077500 194930000 20090000

• Defina la variable dependiente (Y) y la variable independiente (X).

La variable que se ve afectada o depende de otra variable se conoce como variable


dependiente. En este caso, la variable dependiente (Y) se define como "Costos
totales". Por otro lado, la variable independiente (X) es "Volumen de producción".
En resumen, podemos decir que la variable Y, que representa los costos totales,
varía en función de la variable X, que es el volumen de producción.

• Grafique un diagrama de dispersión e interpretación.


Volumen producción x Costos totales
8000 y = 7,6x + 1246,7

7000

6000
Costos totales

5000

4000

3000

2000

1000

0
0

50

100

150

200

250

300

350

400

450

500

550

600

650

700

750

800
Volumen producción

El gráfico de dispersión revela una clara relación positiva y significativa entre el


precio del televisor y la puntuación de la evaluación. En otras palabras, a medida
que el precio del televisor aumenta, también lo hace la puntuación de la evaluación,
lo que sugiere una tendencia linealmente positiva entre estas dos variables.

• Covarianza e interpretación.

Para hallar la covarianza usaremos la expresión:

𝑛
1
𝐶𝑜𝑣(𝑋, 𝑌) = ∑(𝑥𝑖 − 𝑥̅ )(𝑦 − 𝑦̅)
𝑛−1
𝑖=1

𝑥̅ = 575 , 𝑦̅ = 5616.667
Así:

1
𝐶𝑜𝑣(𝑋, 𝑌) = [(400 − 575)(4000 − 5616.66) + (450 − 575)(5000 − 5616.66) +
6−1
(550 − 575)(5400 − 5616.66) + (600 − 575)(5900 − 5616.66) +
(700 − 575)(6400 − 5616.66) + (750 − 575)(7000 − 5616.66)]
1
= [(−175)(−1616.6667) + (−125)(−616.6667) + (−25)(−216.6667) + (25)(283.3333) +
5
(125)(783.3333) + (175)(1383.3333)]
1
= [282916.6667 + 77083.3333 + 5416.6667 + 7083.3333 + 97916.6667 + 242083.3333]
5
1
= (712500)
5

𝐶𝑜𝑣(𝑋, 𝑌) = 142500

El resultado positivo obtenido indica que existe una relación positiva entre el
volumen y los costos.

• Coeficiente de correlación de Pearson, interprete.

Para hallar el coeficiente de correlación de Pearson usaremos la expresión:

𝐶𝑜𝑣(𝑋, 𝑌)
𝑟=
√∑(𝑥𝑖 − 𝑥̅ )2 √∑(𝑦𝑖 − 𝑦̅)2

∑(𝑥𝑖 − 𝑥̅ )2 = (400 − 575)2 + (450 − 575)2 + (550 − 575)2 + (600 − 575)2 +


(700 − 575)2 + (750 − 575)2

∑(𝑥𝑖 − 𝑥̅ )2 = (−175)2 + (−125)2 + (−25)2 + (25)2 + (125)2 + (175)2

∑(𝑥𝑖 − 𝑥̅ )2 = 30625 + 15625 + 625 + 625 + 15625 + 30625

∑(𝑥𝑖 − 𝑥̅ )2 = 93750

∑(𝑦𝑖 − 𝑦̅)2 = (4000 − 5616,6667)2 + (5000 − 5616,6667)2 + (5400 − 5616,6667)2 +


(5900 − 5616,6667)2 + (6400 − 5616,6667)2 + (7000 − 5616,6667)2

∑(𝑦𝑖 − 𝑦̅)2 = 2613611.1111 + 380277.7778 + 46944.4444 + 80277.7778 +


613611.1111 + 1913611.1111

∑(𝑦𝑖 − 𝑦̅)2 = 5648333.333

Así:

142500 142500
𝑟= = = 0.9791
√93750√5648333 (306.1862)(2376.622)

Podemos inferir que hay una fuerte correlación positiva entre las
variables de estudio, ya que el valor del coeficiente se encuentra en el
rango de 0 a 1. En otras palabras, podemos concluir que existe una
correlación positiva significativa entre las variables, lo que indica una
relación fuerte entre ellas.
• Prueba de significancia del coeficiente de correlación de Pearson.

1. Se plantean las hipótesis

𝐻𝑖𝑝ó𝑡𝑒𝑠𝑖𝑠 𝑛𝑢𝑙𝑎: 𝐻0: 𝐶𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖ó𝑛 = 0


𝐻𝑖𝑝ó𝑡𝑒𝑠𝑖𝑠 𝑎𝑙𝑡𝑒𝑟𝑛𝑎𝑡𝑖𝑣𝑎: 𝐻1: 𝐶𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖ó𝑛 ≠ 0

2. Se establecen el nivel de significancia


𝛼 = 0.05

Utilizar funciones de la distribución t para encontrar valores críticos de 𝑡𝑐 a un


valor de confianza que puede ser 0.95.

Nota: si se va a evaluar diferente de cero entonces el valor de alfa es:

(1 − 𝑐𝑜𝑛𝑓𝑖𝑎𝑛𝑧𝑎) (1 − 𝛼)
𝛼= =
2 2
A esto se le llama prueba de dos colas.

𝑡(𝛼,𝑛−2) = 𝑡 0.05 = 𝑡(0.025,4) = 2.77


2 ( 2 ,6−2)

3. Calculamos el estadístico de prueba


√𝑛 − 2 √6 − 2
𝑡=𝑟 = (0.9791271) = 11.80
√1 − 𝑟 2 √1 − (0.9791271)2

4. Decisión

El valor de t, que es igual a 11.80, se encuentra fuera del rango del valor crítico
de t_(0.025, 4) = 2.77. Esto implica que está en la región de rechazo. En otras
palabras, el valor de t es significativamente mayor que el valor crítico, lo que
nos lleva a concluir que hay evidencia estadística para rechazar la hipótesis
nula.

5. Conclusión

Con base en esta evidencia estadística, podemos afirmar y respaldar que el


valor del coeficiente de correlación obtenido de la muestra es significativamente
distinto de cero en una población, con un nivel de confianza del 95%. En otras
palabras, tenemos una alta confianza de que la correlación no es nula y existe
una relación significativa entre las variables en la población en general.
• Modelo de regresión lineal simple, interprete cada uno de los
coeficientes.

Para hallar el modelo de regresión necesitamos calcular los estimadores,


tendremos en cuentas unas sumatorias:

𝑛 𝑛 𝑛 𝑛

∑ 𝑥𝑖 = 3450 , ∑ 𝑦𝑖 = 33700 , ∑ 𝑥𝑖 𝑦𝑖 = 2077500, ∑ 𝑥𝑖2 = 2077500


𝑖=1 𝑖=1 𝑖=1 𝑖=1

∑ 𝑥𝑖 𝑦𝑖 − 𝑛𝑦̅𝑥̅ 2077500 − 6(5616.667)(575)


𝛽1 = = = 7.6
∑ 𝑥𝑖2 − 𝑛𝑥̅ 2 2077500 − 6(575)2

𝛽0 = 𝑦̅ − 𝑥̅ 𝛽1 = 5616.667 − 7.6 (575) = 1246.6667

El modelo de regresión estaría dado como:

𝑦̂ = 𝛽0 + 𝛽1 × 𝑐𝑜𝑠𝑡𝑜𝑠 = 1246.6667 + 7.6 × 𝑐𝑜𝑠𝑡𝑜𝑠

El valor de 𝜷𝟎 = 𝟏𝟐𝟒𝟔. 𝟔𝟔𝟔𝟕, nos indica El valor de 𝜷𝟏 = 𝟕. 𝟔, nos indica que


que cuando no hay incremento en el costo cuando hay un incremento del 1% en el
(0% de incremento), la puntuación en la costo, la puntuación en la producción se
producción se incrementa en 1246.6667.
incrementa en 7.6 unidades. En otras
En otras palabras, este valor representa el
incremento esperado en la producción palabras, este valor representa el cambio
cuando el costo se mantiene constante y no esperado en la producción por cada
experimenta cambios. incremento del 1% en el costo.

• Estimación de la respuesta media, para un determinado valor de la


variable independiente.

De acuerdo con nuestro modelo, tenemos:

𝑦̂ = 1246.6667 + 7.6 × 𝑐𝑜𝑠𝑡𝑜𝑠

Ahora para un televisor con un precio de venta de 4250, se estima una


puntuación de:

𝑦̂ = 1246.6667 + 7.6 × 5000 = 39246.6667

• Coeficiente de determinación (R2) e interpretación.

Para hallar el coeficiente de determinación usaremos la expresión:


∑(𝑦̂ − 𝑦̅)2
𝑅2 =
∑(𝑦 − 𝑦̅)2

1768900 + 902500 + 36100 + 36100 + 902500 + 1768900


𝑅2 =
2613611.11 + 380277.78 + 46944.44 + 80277.78 + 613611.11 + 1913611.11

5415000
𝑅2 = = 0.9587
5648333

Como se puede observar en el gráfico, existe una relación positiva. Cuanto más
alto es el precio, lógicamente se obtiene un puntaje más alto. Según el cálculo
del coeficiente de determinación (R cuadrado), el ajuste del modelo es de
0.9587. Esto indica que las estimaciones del modelo se ajustan
considerablemente, aunque en menor medida, a los valores reales. Aunque no
sería técnicamente preciso, podríamos expresar que el modelo explica
aproximadamente el 95.87% de la variabilidad de la variable real.

• Pruebas de significancia de los coeficientes.

Hipótesis para 𝛽1

1. Se plantean las hipótesis

𝐻0 : 𝛽1 = 0
Vs
𝐻0 : 𝛽1 ≠ 0

2. Establecemos el nivel de significancia

𝛼 = 0.05, 𝑡(𝛼,𝑛−2) = 𝑡 0.05 = 𝑡(0.025,4) = 2.77


2 ( 2 ,6−2)

3. Calculamos el estadístico de prueba

̂1 − 𝑏1
𝛽 7.6 − 0 7.6
𝑇0 = = = = 9.6347
𝑠2 0.7888
√ √58333.33
𝑆𝑥𝑥 93750

4. Como 𝑇0 = 9.6347 > 𝑡(0.025,8) = 2.31, rechazamos la hipótesis nula, por tanto 𝛽1 ≠
0
Hipótesis para 𝛽0

1. Se plantean las hipótesis

𝐻0 : 𝛽0 = 0
Vs
𝐻0 : 𝛽0 ≠ 0

2. Establecemos el nivel de significancia

𝛼 = 0.05, 𝑡(𝛼,𝑛−2) = 𝑡 0.05 = 𝑡(0.025,4) = 2.77


2 ( 2 ,6−2)

3. Calculamos el estadístico de prueba

̂0 − 𝑏0
𝛽 1246.6667 − 0 1246.6667
𝑇0 = = = = 2.6859
1 𝑥̅ 2 √215444.4 464.1599
√𝑠2 [ + ]
𝑛 𝑆𝑥𝑥

4. Como 𝑇0 = 2.6859 < 𝑡(0.025,4) = 2.77, se rechaza la hipótesis nula por lo cual 𝛽0 ≠
0
Ejercicio 3: PC World public evaluaciones de las cinco mejores impresoras l
ser de o cina y de las cinco mejores impresoras l ser corporativas (PC World,
febrero 2003). La impresora de o cina mejor evaluada fue la Minolta-QMS
PagePro 1250W, que en la evaluación general obtuvo una puntuación de 91
puntos. La impresora l ser corporativa mejor evaluada fue la Xerox Phase
4400/N, que en la evaluaci n general obtuvo una puntuación de 83 puntos. En
la tabla siguiente se da rapidez, en páginas por minuto (ppm), en la impresión
de texto y precio de cada impresora.

x y
Velocidad Costos x2 y2 xy
(Ppm) totales
12 199 144 39601 2388

10 499 100 249001 4990

12,2 299 148,84 89401 3647,8

10,3 299 106,09 89401 3079,7

11,7 399 136,89 159201 4668,3

17,8 1850 316,84 3422500 32930

16,1 1000 259,21 1000000 16100

11,8 1387 139,24 1923769 16366,6

19,8 2089 392,04 4363921 41362,2

28,2 2200 795,24 4840000 62040


149,9 10221 2538,39 16176795 187572,6

• Defina la variable dependiente (Y) y la variable independiente (X).

La variable que se ve afectada o depende de otra variable se conoce como


variable dependiente. En este caso, la variable dependiente (Y) se define como
"Costos totales". Por otro lado, la variable independiente (X) se define como
"Velocidad". En resumen, podemos decir que los costos totales, representados
por la variable Y, varían en función de la velocidad, que es la variable
independiente X.
• Grafique un diagrama de dispersión e interpretación.

Velocidad (Ppm) x Costos totales


y = 117,92x - 745,48
2750
2500
2250
COSTOS TOTALES

2000
1750
1500
1250
1000
750
500
250
0
0 3 6 9 12 15 18 21 24 27 30
VELOCIDAD (Ppm)

En el gráfico de dispersión se aprecia una relación clara y significativa de tendencia


linealmente positiva entre la velocidad y los costos totales. Esto significa que a medida que
la velocidad aumenta, los costos totales también tienden a aumentar, indicando una relación
directa entre estas dos variables.

• Covarianza e interpretación.

Para hallar la covarianza usaremos la expresión:

𝑛
1
𝐶𝑜𝑣(𝑋, 𝑌) = ∑(𝑥𝑖 − 𝑥̅ )(𝑦 − 𝑦̅)
𝑛−1
𝑖=1

𝑥̅ = 14.99 , 𝑦̅ = 1022.1
Así:

1
𝐶𝑜𝑣(𝑋, 𝑌) = [(12 − 14.99)(199 − 1022.1) + (10 − 14.99)(499 − 1022.1) +
10−1
(12.2 − 14.99)(299 − 1022.1) + (10.3 − 14.99)(299 − 1022.1) +
(11.7 − 14.99)(399 − 1022.1) + (17.8 − 14.99)(1850 − 1022.1) +
(16.1 − 14.99)(1000 − 1022.1) + (11.8 − 14.99)(1387 − 1022.1) +
(19.8 − 14.99)(2089 − 1022.1) + (28.2 − 14.99)(2200 − 1022.1)]
1
= [(−2.99)(−823.1) + (−4.99)(−523.1) + (−2.79)(−723.1) + (−4.69)(−723.1) +
9
(−3.29)(−623.1) + (2.81)(827.9) + (1.11)(−22.1) + (−3.19)(364.9) +
(4.81)(1066.9) + (13.21)(1177.9)]
1
= [2461.069 + 2610.269 + 2017.449 + 3391.339 + 2049.999 + 2326.399 − 24.531 −
5
1164.031 + 5131.789 + 15560.059]

1
= (34359.81)
9
𝐶𝑜𝑣(𝑋, 𝑌) = 3817.757

El resultado obtenido muestra un valor positivo, lo cual indica que existe una
relación positiva entre el volumen y los costos. En otras palabras, a medida que
aumenta el volumen, también se observa un incremento en los costos, lo que
sugiere una asociación directa entre estas dos variables.

• Coeficiente de correlación de Pearson

Para hallar el coeficiente de correlación de Pearson usaremos la expresión:

𝐶𝑜𝑣(𝑋, 𝑌)
𝑟=
√∑(𝑥𝑖 − 𝑥̅ )2 √∑(𝑦𝑖 − 𝑦̅)2

∑(𝑥𝑖 − 𝑥̅ )2 = (12 − 14.99)2 + (10 − 14.99)2 + (12.2 − 14.99)2 + (10.3 − 14.99)2 +


(11.7 − 14.99)2 + (17.8 − 14.99)2 + (16.1 − 14.99)2 + (11.8 − 14.99)2 +
(19.8 − 14.99)2 + (28.2 − 14.99)2

∑(𝑥𝑖 − 𝑥̅ )2 = (−2.99)2 + (−4.99)2 + (−2.79)2 + (−4.69)2 + (−3.29)2 + (2.81)2 + (1.11)2


+ (−3.19)2 + (4.81)2 + (13.21)2

∑(𝑥𝑖 − 𝑥̅ )2 = 8.9401 + 24.9001 + 7.7841 + 21.9961 + 10.8241 + 7.8961


+ 1.2321 + 10.1761 + 23.1361 + 174.5041

∑(𝑥𝑖 − 𝑥̅ )2 = 291.389

∑(𝑦𝑖 − 𝑦̅)2 = (199 − 1022.1)2 + (499 − 1022.1)2 + (299 − 1022.1)2 + (299 − 1022.1)2 +
(399 − 1022.1)2 + (1850 − 1022.1)2 + (1000 − 1022.1)2 + (1387 − 1022.1)2 +
(2089 − 1022.1)2 + (2200 − 1022.1)2
∑(𝑦𝑖 − 𝑦̅)2 = (−823.1)2 + (−523.1)2 + (−723.1)2 + (−723.1)2 + (−623.1)2 + (827.9)2 +
(−22.1)2 + (364.9)2 + (1066.9)2 + (1177.9)2

∑(𝑦𝑖 − 𝑦̅)2 = 677493.61 + 273633.61 + 522873.61 + 522873.61 + 388253.61


+ 685418.41 + 488.41 + 133152.01 + 1138275.61 + 1387448.41

∑(𝑦𝑖 − 𝑦̅)2 = 5729910.9

Así:

3817.757 3817.757
𝑟= = = 0.8409
√291.389√5729910.9 (17.0701)(2393.7232)

Dado que el coeficiente se encuentra entre 0 y 1, podemos concluir que


existe una correlación alta entre las variables de estudio. Esta
correlación es positiva, lo que indica que hay una relación significativa y
fuerte entre las variables.

• Prueba de significancia del coeficiente de correlación de Pearson.

✓ Planteamos las hipótesis

𝐻𝑖𝑝ó𝑡𝑒𝑠𝑖𝑠 𝑛𝑢𝑙𝑎: 𝐻0: 𝐶𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖ó𝑛 = 0


𝐻𝑖𝑝ó𝑡𝑒𝑠𝑖𝑠 𝑎𝑙𝑡𝑒𝑟𝑛𝑎𝑡𝑖𝑣𝑎: 𝐻1: 𝐶𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖ó𝑛 ≠ 0

✓ Establecemos el nivel de significancia


𝛼 = 0.05

Utilizar funciones de la distribución t para encontrar valores críticos


de 𝑡𝑐 a un valor de confianza que puede ser 0.95.

Nota: se va a evaluar diferente de cero entonces el valor de alfa es:

(1 − 𝑐𝑜𝑛𝑓𝑖𝑎𝑛𝑧𝑎) (1 − 𝛼)
𝛼= =
2 2

A esto se le llama prueba de dos colas.

𝑡(𝛼,𝑛−2) = 𝑡 0.05 = 𝑡(0.025,8) = 2.31


2 ( 2 ,10−2)

✓ Calculamos el estadístico de prueba


√𝑛 − 2 √10 − 2
𝑡=𝑟 = (0.8409) = 4.4
√1 − 𝑟 2 √1 − (0.8409)2

✓ Decisión

El valor de t, que es igual a 4.4, se encuentra fuera del rango del valor
crítico de 𝑡(0.025,8) = 2.31. Por lo tanto, podemos interpretar que el valor
de t está en la zona de rechazo.

✓ Conclusión

Con esta evidencia, se puede afirmar y probar que el valor del


coeficiente de correlación obtenido de la muestra es significativamente
diferente de cero en una población, con un nivel de confianza del 95%.

• Modelo de regresión lineal simple, interprete cada uno de los


coeficientes.

Para hallar el modelo de regresión necesitamos calcular los estimadores,


necesitaremos de unas sumatorias:

𝑛 𝑛 𝑛 𝑛

∑ 𝑥𝑖 = 149.9 , ∑ 𝑦𝑖 = 10221 , ∑ 𝑥𝑖 𝑦𝑖 = 187572.6, ∑ 𝑥𝑖2 = 2538.39


𝑖=1 𝑖=1 𝑖=1 𝑖=1

∑ 𝑥𝑖 𝑦𝑖 − 𝑛𝑦̅𝑥̅ 187572.6 − 10(1022.1)(14.99)


𝛽1 = = = 117.917
∑ 𝑥𝑖2 − 𝑛𝑥̅ 2 2077500 − 10(14.99)2

𝛽0 = 𝑦̅ − 𝑥̅ 𝛽1 = 1022.1 − 117.9173 (14.99) = −745.481

El modelo de regresión estaría dado como:

𝑦̂ = 𝛽0 + 𝛽1 × 𝑣𝑒𝑙𝑜𝑐𝑖𝑑𝑎𝑑 = −745.481 + 117.917 × 𝑣𝑒𝑙𝑜𝑐𝑖𝑑𝑎𝑑

o El valor 𝛽0 de -745.481 indica que cuando no hay ningún incremento


en la velocidad, la puntuación en la producción disminuye en -
745.481.

o El valor 𝛽1 = 117.917 indica que a un 1 % de incremento de la


velocidad, la puntuación en la producción crece un 117.917.

• Estimación de la respuesta media, para un determinado valor de la


variable independiente.

De acuerdo con nuestro modelo, tenemos:

𝑦̂ == −745.481 + 117.917 × 𝑣𝑒𝑙𝑜𝑐𝑖𝑑𝑎𝑑

Ahora para un televisor con un precio de venta de 20, se estima una puntuación
de:

𝑦̂ = −745.4806 + 117.9173(20) = 1612.859

• Coeficiente de determinación (R2), interprete.

Para hallar el coeficiente de determinación usaremos la expresión:

∑(𝑦̂ − 𝑦̅)2
𝑅2 =
∑(𝑦 − 𝑦̅)2

124307.57 + 346223.30 + ⋯ + 2426391.28


𝑅2 =
677493.61 + 273633.61 + ⋯ + 1387448.41

4051617
𝑅2 = = 0.7071
5729911

Al analizar el gráfico, se puede observar que existe una relación positiva entre
el precio y el puntaje. A medida que el precio aumenta, es lógico esperar que el
puntaje también aumente. El cálculo del coeficiente de determinación (R
cuadrado) arroja un valor de 0.7071. Esto significa que el modelo tiene un ajuste
considerable pero relativamente bajo a la variable real. Podríamos decir, en
términos generales, que el modelo explica aproximadamente el 70.71% de la
variabilidad de la variable real.

• Pruebas de significancia de los coeficientes.

Hipótesis para 𝛽1

1. Planteamos las hipótesis

𝐻0 : 𝛽1 = 0
Vs
𝐻0 : 𝛽1 ≠ 0

2. Establecemos el nivel de significancia

𝛼 = 0.05, 𝑡(𝛼,𝑛−2) = 𝑡 0.05,10−2 = 𝑡(0.025,8) = 2.31


2 ( )
2
3. Calculamos el estadístico de prueba

̂1 − 𝑏1
𝛽 117.9173 − 0 117.9173
𝑇0 = = = = 4.3946
𝑠2 26.832
√ √209786.8
𝑆𝑥𝑥 291.389

4. Como 𝑇0 = 4.3946 > 𝑡(0.025,8) = 2.31, se rechaza la hipótesis nula por tanto 𝛽1 ≠ 0

Hipótesis para 𝛽0

1. Se plantean las hipótesis

𝐻0 : 𝛽0 = 0
Vs
𝐻0 : 𝛽0 ≠ 0

2. Se establecen el nivel de significancia

𝛼 = 0.05, 𝑡(𝛼,𝑛−2) = 𝑡 0.05,10−2 = 𝑡(0.025,8) = 2.31


2 ( )
2

3. Calculamos el estadístico de prueba

̂0 − 𝑏0
𝛽 −745.4806 − 0 −745.4806
𝑇0 = = = = −1.744
1 𝑥̅ 2 √182752.5 427.4956
√𝑠2 [ + ]
𝑛 𝑆𝑥𝑥

4. Como 𝑇0 = −1.744 < 𝑡(0.025,8) = 2.31, se rechaza la hipótesis alternativa por tanto
𝛽0 = 0

También podría gustarte