Documentos de Académico
Documentos de Profesional
Documentos de Cultura
GISSELLE MESA
ANGELA DONADO
DAYSI MOSQUERA
CAMILA ROJAS
JORGE BARON
ESTADISTICA INFERENCIAL
UNIVERSIDAD DE CORDOBA
2023
Ejercicio 1: Consumer Reports publica pruebas y evaluaciones sobre televisores de
alta definición. Para cada modelo se elabor una evaluación general basada
principalmente en la calidad de la imagen. Una evaluación más alta indica un mejor
funcionamiento. En los datos siguientes se dan evaluación general y precio de
televisores de plasma de 45 pulgadas (Consumer Reports, marzo 2006).
Precio Puntuación en la
Marca
(X) evaluación (Y) 𝒙𝟐 𝒚𝟐 𝒙𝒚
Use estos datos para obtener una ecuación de regresión estimada que pueda emplearse
para estimar la puntuación en la evaluación general de una televisión de 42 pulgadas
dado el precio.
60
55 55 54
53
50 50
45 44
40 39 39
35 34
30
25
20
15
10
5
0
0
250
500
750
1000
1250
1500
1750
2000
2250
2500
2750
3000
3250
3500
3750
4000
4250
PRECIO
• Covarianza e interpretación
𝑛
1
𝐶𝑜𝑣(𝑋, 𝑌) = ∑(𝑥𝑖 − 𝑥̅ )(𝑦 − 𝑦̅)
𝑛−1
𝑖=1
𝑥̅ = 2960 , 𝑦̅ = 49.6
Así:
1
= [(2800 − 2960)(62 − 49.6) + (2800 − 2960)(53 − 49.6) + (2700 − 2960)(44 −
10−1
49.6) + (3500 − 2960)(50 − 49.6) + (3300 − 2960)(54 − 49.6) + (2000 − 2960)(39 −
49.6) + (4000 − 2960)(66 − 49.6) + (3000 − 2960)(55 − 49.6) + (2500 − 2960)(34 −
49.6) + (3000 − 2960)(39 − 49.6)]
1
= [(−160)(12.4) + (−160)(3.4) + (−260)(−5.6) + (540)(0.4) + (340)(4.4) +
9
(−960)(−10.6) + (1040)(16.4) + (40)(5.4) + (−460)(3.4) + (40)(−10.6)]
1
= [−1984 − 544 + 1456 + 216 + 1496 + 10176 + 17056 + 216 + 7176 − 424]
9
1
= (34840)
9
𝐶𝑜𝑣(𝑋, 𝑌) = 3871.1111
𝐶𝑜𝑣(𝑋, 𝑌)
𝑟=
√∑(𝑥𝑖 − 𝑥̅ )2 √∑(𝑦𝑖 − 𝑦̅)2
∑(𝑥𝑖 − 𝑥̅ )2 = 2744000
∑(𝑦𝑖 − 𝑦̅)2 = [(62 − 49.6)2 + (53 − 49.6)2 + (44 − 49.6)2 + (50 − 49.6)2 + (54 − 49.6)2 +
(39 − 49.6)2 + (66 − 49.6)2 + (55 − 49.6)2 + (34 − 49.6)2 + (39 − 49.6)2 ]
∑(𝑦𝑖 − 𝑦̅)2 = [(12.4)2 + (3.4)2 + (−5.6)2 + (0.4)2 + (4.4)2 + (−10.6)2 + (16.4)2 + (5.4)2 +
(−15.6)2 + (−10.6)2 ]
∑(𝑦𝑖 − 𝑦̅)2 = [153.76 + 11.56 + 31.36 + 0.16 + 19.36 + 112.36 + 268.96 + 29.16 + 243.36
+ 112.36]
Dado que el coeficiente de correlación 0.0746 > 0, podemos afirmar que hay una correlación
positiva, sin embargo, esta es muy débil y casi nula entre las dos variables que se están
analizando. Un valor tan cercano a cero indica que no hay una relación lineal significativa
entre las variables.
(1 − 𝑐𝑜𝑛𝑓𝑖𝑎𝑛𝑧𝑎) (1 − 𝛼)
𝛼= =
2 2
4. Decisión
Dado que el valor de 𝑡 = 0.2119 está dentro del rango del valor crítico
de 𝑡(0.025,2) = 2.31, se puede afirmar que está en zona de no rechazo.
5. Conclusión
Entonces con esto se puede asegurar y probar que el valor del coeficiente de
correlación que se obtuvo de la muestra sería absolutamente igual a cero en una
población con un nivel de confianza del 95%.
𝑛 𝑛 𝑛 𝑛
𝑦̂ = 𝛽0 + 𝛽1 × 𝑃𝑟𝑒𝑐𝑖𝑜
∑(𝑦̂ − 𝑦̅)2
𝑅2 =
∑(𝑦 − 𝑦̅)2
𝑅 2 = 0.4503
Hipótesis para 𝛽1
𝐻0 : 𝛽1 = 0
Vs
𝐻0 : 𝛽1 ≠ 0
̂1 − 𝑏1
𝛽 0.01269 − 0 0.01269
𝑇0 = = = = 2.5599
𝑠2 0.0049
√ √ 67.5055
𝑆𝑥𝑥 2744000
4. Dado que 𝑻𝟎 = 𝟐. 𝟓𝟓𝟗𝟗 > 𝒕(𝟎.𝟎𝟐𝟓,𝟖) = 𝟐. 𝟑𝟏, se rechaza la hipótesis nula por tanto
𝜷𝟏 ≠ 𝟎
Hipótesis para 𝛽0
𝐻0 : 𝛽0 = 0
vs
𝐻0 : 𝛽0 ≠ 0
̂0 − 𝑏0
𝛽 12.01749 − 0 12.01749
𝑇0 = = = = 0.8060
1 𝑥̅ 2 √14.9096 0.0049
√𝑠2 [ + ]
𝑛 𝑆𝑥𝑥
4. Dado que 𝑻𝟎 = 𝟎. 𝟖𝟎𝟔𝟎 < 𝒕(𝟎.𝟎𝟐𝟓,𝟖) = 𝟐. 𝟑𝟏, se rechaza la hipótesis alternativa por
tanto 𝜷𝟎 = 𝟎
Ejercicio 2: Una aplicación importante del análisis de regresión a la contaduría es la
estimación de costos. Con datos sobre volumen de producción y costos y empleando
el m todo de mínimos cuadrados para obtener la ecuación de regresión estimada que
relacione volumen de producción y costos, los contadores pueden estimar los costos
correspondientes a un determinado volumen de producción. Considere la siguiente
muestra de datos sobre volumen de producción y costos totales de una operación de
fabricación.
Volumen
Costos totales 𝒙𝟐 𝒚𝟐 𝒙𝒚
producción
400 4000 160000 16000000 1600000
7000
6000
Costos totales
5000
4000
3000
2000
1000
0
0
50
100
150
200
250
300
350
400
450
500
550
600
650
700
750
800
Volumen producción
• Covarianza e interpretación.
𝑛
1
𝐶𝑜𝑣(𝑋, 𝑌) = ∑(𝑥𝑖 − 𝑥̅ )(𝑦 − 𝑦̅)
𝑛−1
𝑖=1
𝑥̅ = 575 , 𝑦̅ = 5616.667
Así:
1
𝐶𝑜𝑣(𝑋, 𝑌) = [(400 − 575)(4000 − 5616.66) + (450 − 575)(5000 − 5616.66) +
6−1
(550 − 575)(5400 − 5616.66) + (600 − 575)(5900 − 5616.66) +
(700 − 575)(6400 − 5616.66) + (750 − 575)(7000 − 5616.66)]
1
= [(−175)(−1616.6667) + (−125)(−616.6667) + (−25)(−216.6667) + (25)(283.3333) +
5
(125)(783.3333) + (175)(1383.3333)]
1
= [282916.6667 + 77083.3333 + 5416.6667 + 7083.3333 + 97916.6667 + 242083.3333]
5
1
= (712500)
5
𝐶𝑜𝑣(𝑋, 𝑌) = 142500
El resultado positivo obtenido indica que existe una relación positiva entre el
volumen y los costos.
𝐶𝑜𝑣(𝑋, 𝑌)
𝑟=
√∑(𝑥𝑖 − 𝑥̅ )2 √∑(𝑦𝑖 − 𝑦̅)2
∑(𝑥𝑖 − 𝑥̅ )2 = 93750
Así:
142500 142500
𝑟= = = 0.9791
√93750√5648333 (306.1862)(2376.622)
Podemos inferir que hay una fuerte correlación positiva entre las
variables de estudio, ya que el valor del coeficiente se encuentra en el
rango de 0 a 1. En otras palabras, podemos concluir que existe una
correlación positiva significativa entre las variables, lo que indica una
relación fuerte entre ellas.
• Prueba de significancia del coeficiente de correlación de Pearson.
(1 − 𝑐𝑜𝑛𝑓𝑖𝑎𝑛𝑧𝑎) (1 − 𝛼)
𝛼= =
2 2
A esto se le llama prueba de dos colas.
4. Decisión
El valor de t, que es igual a 11.80, se encuentra fuera del rango del valor crítico
de t_(0.025, 4) = 2.77. Esto implica que está en la región de rechazo. En otras
palabras, el valor de t es significativamente mayor que el valor crítico, lo que
nos lleva a concluir que hay evidencia estadística para rechazar la hipótesis
nula.
5. Conclusión
𝑛 𝑛 𝑛 𝑛
5415000
𝑅2 = = 0.9587
5648333
Como se puede observar en el gráfico, existe una relación positiva. Cuanto más
alto es el precio, lógicamente se obtiene un puntaje más alto. Según el cálculo
del coeficiente de determinación (R cuadrado), el ajuste del modelo es de
0.9587. Esto indica que las estimaciones del modelo se ajustan
considerablemente, aunque en menor medida, a los valores reales. Aunque no
sería técnicamente preciso, podríamos expresar que el modelo explica
aproximadamente el 95.87% de la variabilidad de la variable real.
Hipótesis para 𝛽1
𝐻0 : 𝛽1 = 0
Vs
𝐻0 : 𝛽1 ≠ 0
̂1 − 𝑏1
𝛽 7.6 − 0 7.6
𝑇0 = = = = 9.6347
𝑠2 0.7888
√ √58333.33
𝑆𝑥𝑥 93750
4. Como 𝑇0 = 9.6347 > 𝑡(0.025,8) = 2.31, rechazamos la hipótesis nula, por tanto 𝛽1 ≠
0
Hipótesis para 𝛽0
𝐻0 : 𝛽0 = 0
Vs
𝐻0 : 𝛽0 ≠ 0
̂0 − 𝑏0
𝛽 1246.6667 − 0 1246.6667
𝑇0 = = = = 2.6859
1 𝑥̅ 2 √215444.4 464.1599
√𝑠2 [ + ]
𝑛 𝑆𝑥𝑥
4. Como 𝑇0 = 2.6859 < 𝑡(0.025,4) = 2.77, se rechaza la hipótesis nula por lo cual 𝛽0 ≠
0
Ejercicio 3: PC World public evaluaciones de las cinco mejores impresoras l
ser de o cina y de las cinco mejores impresoras l ser corporativas (PC World,
febrero 2003). La impresora de o cina mejor evaluada fue la Minolta-QMS
PagePro 1250W, que en la evaluación general obtuvo una puntuación de 91
puntos. La impresora l ser corporativa mejor evaluada fue la Xerox Phase
4400/N, que en la evaluaci n general obtuvo una puntuación de 83 puntos. En
la tabla siguiente se da rapidez, en páginas por minuto (ppm), en la impresión
de texto y precio de cada impresora.
x y
Velocidad Costos x2 y2 xy
(Ppm) totales
12 199 144 39601 2388
2000
1750
1500
1250
1000
750
500
250
0
0 3 6 9 12 15 18 21 24 27 30
VELOCIDAD (Ppm)
• Covarianza e interpretación.
𝑛
1
𝐶𝑜𝑣(𝑋, 𝑌) = ∑(𝑥𝑖 − 𝑥̅ )(𝑦 − 𝑦̅)
𝑛−1
𝑖=1
𝑥̅ = 14.99 , 𝑦̅ = 1022.1
Así:
1
𝐶𝑜𝑣(𝑋, 𝑌) = [(12 − 14.99)(199 − 1022.1) + (10 − 14.99)(499 − 1022.1) +
10−1
(12.2 − 14.99)(299 − 1022.1) + (10.3 − 14.99)(299 − 1022.1) +
(11.7 − 14.99)(399 − 1022.1) + (17.8 − 14.99)(1850 − 1022.1) +
(16.1 − 14.99)(1000 − 1022.1) + (11.8 − 14.99)(1387 − 1022.1) +
(19.8 − 14.99)(2089 − 1022.1) + (28.2 − 14.99)(2200 − 1022.1)]
1
= [(−2.99)(−823.1) + (−4.99)(−523.1) + (−2.79)(−723.1) + (−4.69)(−723.1) +
9
(−3.29)(−623.1) + (2.81)(827.9) + (1.11)(−22.1) + (−3.19)(364.9) +
(4.81)(1066.9) + (13.21)(1177.9)]
1
= [2461.069 + 2610.269 + 2017.449 + 3391.339 + 2049.999 + 2326.399 − 24.531 −
5
1164.031 + 5131.789 + 15560.059]
1
= (34359.81)
9
𝐶𝑜𝑣(𝑋, 𝑌) = 3817.757
El resultado obtenido muestra un valor positivo, lo cual indica que existe una
relación positiva entre el volumen y los costos. En otras palabras, a medida que
aumenta el volumen, también se observa un incremento en los costos, lo que
sugiere una asociación directa entre estas dos variables.
𝐶𝑜𝑣(𝑋, 𝑌)
𝑟=
√∑(𝑥𝑖 − 𝑥̅ )2 √∑(𝑦𝑖 − 𝑦̅)2
∑(𝑥𝑖 − 𝑥̅ )2 = 291.389
∑(𝑦𝑖 − 𝑦̅)2 = (199 − 1022.1)2 + (499 − 1022.1)2 + (299 − 1022.1)2 + (299 − 1022.1)2 +
(399 − 1022.1)2 + (1850 − 1022.1)2 + (1000 − 1022.1)2 + (1387 − 1022.1)2 +
(2089 − 1022.1)2 + (2200 − 1022.1)2
∑(𝑦𝑖 − 𝑦̅)2 = (−823.1)2 + (−523.1)2 + (−723.1)2 + (−723.1)2 + (−623.1)2 + (827.9)2 +
(−22.1)2 + (364.9)2 + (1066.9)2 + (1177.9)2
Así:
3817.757 3817.757
𝑟= = = 0.8409
√291.389√5729910.9 (17.0701)(2393.7232)
(1 − 𝑐𝑜𝑛𝑓𝑖𝑎𝑛𝑧𝑎) (1 − 𝛼)
𝛼= =
2 2
✓ Decisión
El valor de t, que es igual a 4.4, se encuentra fuera del rango del valor
crítico de 𝑡(0.025,8) = 2.31. Por lo tanto, podemos interpretar que el valor
de t está en la zona de rechazo.
✓ Conclusión
𝑛 𝑛 𝑛 𝑛
Ahora para un televisor con un precio de venta de 20, se estima una puntuación
de:
∑(𝑦̂ − 𝑦̅)2
𝑅2 =
∑(𝑦 − 𝑦̅)2
4051617
𝑅2 = = 0.7071
5729911
Al analizar el gráfico, se puede observar que existe una relación positiva entre
el precio y el puntaje. A medida que el precio aumenta, es lógico esperar que el
puntaje también aumente. El cálculo del coeficiente de determinación (R
cuadrado) arroja un valor de 0.7071. Esto significa que el modelo tiene un ajuste
considerable pero relativamente bajo a la variable real. Podríamos decir, en
términos generales, que el modelo explica aproximadamente el 70.71% de la
variabilidad de la variable real.
Hipótesis para 𝛽1
𝐻0 : 𝛽1 = 0
Vs
𝐻0 : 𝛽1 ≠ 0
̂1 − 𝑏1
𝛽 117.9173 − 0 117.9173
𝑇0 = = = = 4.3946
𝑠2 26.832
√ √209786.8
𝑆𝑥𝑥 291.389
4. Como 𝑇0 = 4.3946 > 𝑡(0.025,8) = 2.31, se rechaza la hipótesis nula por tanto 𝛽1 ≠ 0
Hipótesis para 𝛽0
𝐻0 : 𝛽0 = 0
Vs
𝐻0 : 𝛽0 ≠ 0
̂0 − 𝑏0
𝛽 −745.4806 − 0 −745.4806
𝑇0 = = = = −1.744
1 𝑥̅ 2 √182752.5 427.4956
√𝑠2 [ + ]
𝑛 𝑆𝑥𝑥
4. Como 𝑇0 = −1.744 < 𝑡(0.025,8) = 2.31, se rechaza la hipótesis alternativa por tanto
𝛽0 = 0