Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Materia:
Estadística II
Plan ADT-0427
Horario 13 – 14 Horas, A - 32
Evaluación: 80%: la evaluación podrá ser cualquier día a partir del final de cada
unidad.
Asistencia: 10%
Tareas y Trabajos: 10%
Consideraciones
En Asistencia: Después de la entrada del Asesor al aula, no entrará nadie más; 1 Falta
-4% de su porcentaje asignado a su calificación, 2 Faltas -7%, 3 Faltas -10% y 4
Faltas pierde derecho a calificación de la unidad correspondiente.
Nota: Toda inasistencia justificada con comprobante del ITH, será borrada. (*)
Tareas y Trabajos
El porcentaje para cada trabajo será acordado mutuamente entre el Asesor y el Jefe de
Grupo; todos los trabajo que dará derecho a presentar examen de la misma, aún los
exámenes de nivelación. (*)
Generales
Queda prohibido el uso de mp3 players, pda’s, video juegos portátiles y celulares,
hacer / recibir llamadas y/o mensajes.
Prueba de Hipótesis
Unidad 1: Prueba de Hipótesis
Una hipótesis estadística es una proposición o supuesto sobre los parámetros de una o
más poblaciones.
Entonces, las dos conclusiones posibles de un análisis por prueba de hipótesis son
rechazar Ho o no rechazar Ho.
Para probar si la hipótesis nula es cierta, se toma una muestra aleatoria y se calcula la
información, como el promedio, la proporción, etc. Esta información muestral se
llama estadística de prueba.
El error tipo II ó error β se define como la aceptación de la hipótesis nula cuando ésta
es falsa.
Unidad 1: Prueba de Hipótesis
Bilateral
Zona de Aceptación H0
(1-α)
Unilateral Izquierda
Zona de Aceptación H0
(1-α)
Zona de Rechazo H0
(α)
Unidad 1: Prueba de Hipótesis
Unilateral Derecha
Zona de Aceptación H0
(1-α)
Zona de Rechazo H0
(α)
Unidad 1: Prueba de Hipótesis
1. Interpretar correctamente hacia que distribución muestral se ajustan los datos del
enunciado.
Esta se puede establecer en función del valor crítico, el cual se obtiene dependiendo
del valor de α (Error tipo I o nivel de significancia) o en función del estadístico límite
de la distribución muestral. Cada una de las hipótesis deberá ser argumentada
correctamente para tomar la decisión, la cual estará en función de la hipótesis nula o
Ho.
Consideraciones:
H0: μ=X
H1:μ≠X
Zona de Aceptación H0
(1-α)
Consideraciones:
H0: μ≥X
H1:μ<X Zona de Aceptación H0
(1-α)
Zona de Rechazo H0
(α)
Unidad 1: Prueba de Hipótesis
Consideraciones:
H0: μ≤X
H1:μ>X
Zona de Aceptación H0
(1-α)
Zona de Rechazo H0
(α)
Unidad 1: Prueba de Hipótesis
Solución:
1) Identificar Datos
= 71.8 μ = 70 σ = 8.9 n = 100 α = 0.05
2) Establecer Hipótesis
H0: μ = 70 años
H1:μ > 70 años
Unidad 1: Prueba de Hipótesis
Zona de Rechazo H0
(α)
Z(1.645) = 0.95
Unidad 1: Prueba de Hipótesis
Zona de Aceptación H0
(1-α)
Zona de Rechazo H0
(α)
Z(1.645) = 0.95
Unidad 1: Prueba de Hipótesis
7) Aceptar o Rechazar H0
Se Rechaza H0 y Se Acepta H1
8) Emitir Conclusión
Ejemplo 2: Una empresa eléctrica fabrica focos que tienen una duración que se
distribuye de forma aproximadamente normal con una media de 800 horas y una
desviación estándar de 40 horas. Si una muestra aleatoria de 30 focos tiene una
duración promedio de 788 horas, ¿muestran los datos suficiente evidencia para decir
que la duración media ha cambiado? Utilice un nivel de significancia del 0.04.
Unidad 1: Prueba de Hipótesis
Solución:
1) Identificar Datos
= 800 μ = 788 σ = 40 n = 30 α = 0.04
2) Establecer Hipótesis
Zona de Aceptación H0
(1-α)
7) Aceptar o Rechazar H0
Se Acepta H0 y Se Rechaza H1
8) Emitir Conclusión
Solución:
1) Identificar Datos
= 5.5 μ = 5.23 σ = 0.24 n = 64 α = 0.05
2) Establecer Hipótesis
Zona de Aceptación H0
(1-α)
Zona de Rechazo H0
(α)
Z(-1.645) = 0.05
Unidad 1: Prueba de Hipótesis
Zona de Rechazo H0
(α)
Z(-1.645) = 0.05
Unidad 1: Prueba de Hipótesis
7) Aceptar o Rechazar H0
Se Rechaza H0 y Se Acepta H1
8) Emitir Conclusión
Ejemplo 4: El Instituto Eléctrico Edison publica cifras del número anual de Kilowatt-
hora que gastan varios aparatos electrodomésticos. Se afirma que una aspiradora gasta
un promedio de 46 kilowatt-hora al año. Si una muestra aleatoria de 12 hogares que
se incluye en un estudio planeado indica que las aspiradoras gastan un promedio de
42 kilowatt-hora al año con una desviación estándar de11.9 kilowatt-hora.
Unidad 1: Prueba de Hipótesis
¿Esto sugiere con un nivel de significancia de 0.05 que las aspiradoras gastan, en
promedio, menos de 46 kilowatt-hora anualmente? Suponga que la población de
kilowatt-hora es normal.
Solución:
1) Identificar Datos
= 42 μ = 46 s = 11.9 n = 12 α = 0.05
2) Establecer Hipótesis
H0: μ = 46 kilowatt-hora
H1: μ < 46 kilowatt-hora
Zona de Aceptación H0
(1-α)
Zona de Rechazo H0
(α)
-t(0.05,11) = -1.796
Unidad 1: Prueba de Hipótesis
Zona de Rechazo H0
(α)
-t(0.05,11) = -1.796
Unidad 1: Prueba de Hipótesis
7) Aceptar o Rechazar H0
Se Acepta H0 y Se Rechaza H1
8) Emitir Conclusión
Ejemplo 5: Los pesos en libras de una muestra aleatoria de bebés de seis meses son:
14.6, 12.5, 15.3, 16.1, 14.4, 12.9, 13.7 y 14.9. Haga una prueba con nivel de 5% de
significancia para determinar si el peso promedio de todos los bebés de seis meses es
distinto a 14 libras, suponga que sus pesos se distribuyen normalmente.
Unidad 1: Prueba de Hipótesis
Solución:
1) Identificar Datos
= 14.3 μ = 14 s = 1.21 n=8 α = 0.05
2) Establecer Hipótesis
H0: μ = 14 libras
H1: μ ≠ 14 libras
Zona de Aceptación H0
(1-α)
7) Aceptar o Rechazar H0
Se Acepta H0 y Se Rechaza H1
8) Emitir Conclusión
1.5 Dos muestras: pruebas sobre dos medias utilizando la distribución Normal y
“t” student.
Solución:
1) Identificar Datos
= 121 σ1 = 8 n1 = 10 α = 0.05
= 112 σ2= 8 n2= 10
2) Establecer Hipótesis
H0: μ1 = μ2
H1: μ1 > μ2
Zona de Aceptación H0
(1-α)
Zona de Rechazo H0
(α)
Z(1.645) = 0.95
Unidad 1: Prueba de Hipótesis
Zona de Aceptación H0
(1-α)
Zona de Rechazo H0
(α)
Z(1.645) = 0.95
Unidad 1: Prueba de Hipótesis
7) Aceptar o Rechazar H0
Se Rechaza H0 y Se Acepta H1
8) Emitir Conclusión
Ejemplo 7: Se utilizan dos máquinas para llenar botellas de plástico con un volumen
neto de 16.0 onzas. Las distribuciones de los volúmenes de llenado pueden suponerse
normales, con desviaciones estándar σ1= 0.020 y σ2 = 0.025 onzas. Un miembro del
grupo de ingeniería de calidad sospecha que el volumen neto de llenado de ambas
máquinas es el mismo, sin importar si éste es o no de 16 onzas. De cada máquina se
toma una muestra aleatoria de 10 botellas. ¿Se encuentra el ingeniero en lo correcto?
Utilice a = 0.05
Unidad 1: Prueba de Hipótesis
Solución:
1) Identificar Datos:
H0: μ1 = μ2
H1: μ1 ≠ μ2
Unidad 1: Prueba de Hipótesis
Zona de Aceptación H0
(1-α)
Zona de Aceptación H0
(1-α)
7) Aceptar o Rechazar H0
Se Acepta H0 y Se Rechaza H1
8) Emitir Conclusión
Ejemplo 8: Existen dos tipos de plástico apropiados para su uso por un fabricante de
componentes electrónicos. La tensión de ruptura de ese plástico es un parámetro
importante . Se sabe que σ1=σ2= 1.0 psi. De una muestra aleatoria de tamaño 10 y 12
para cada plástico respectivamente, se tiene una media de 162.5 para el plástico 1 y
de 155 para el plástico 2. La compañía no adoptará el plástico 1 a menos que la
tensión de ruptura de éste exceda a la del plástico 2 al menos por 10 psi. Con base a la
información contenida en la muestra, ¿la compañía deberá utilizar el plástico 1?
Utilice α = 0.05 para llegar a una decisión.
Unidad 1: Prueba de Hipótesis
Solución:
1) Identificar Datos:
H0: μ1 = μ2
H1: μ1 > μ2
Zona de Aceptación H0
(1-α)
Zona de Rechazo H0
(α)
Z(1.645) = 0.95
Unidad 1: Prueba de Hipótesis
Zona de Aceptación H0
(1-α)
Zona de Rechazo H0
(α)
Z(1.645) = 0.95
Unidad 1: Prueba de Hipótesis
7) Aceptar o Rechazar H0
Se Acepta H0 y Se Rechaza H1
8) Emitir Conclusión
¿Se puede decir en el nivel de significancia del 0.05 que el suero es efectivo?
Suponga que las dos poblaciones se distribuyen normalmente con varianzas iguales.
Solución:
1) Identificar Datos
2)Establecer Hipótesis
Zona de Rechazo H0
(α)
t(0.05,7) = 1.895
Unidad 1: Prueba de Hipótesis
Zona de Aceptación H0
(1-α)
Zona de Rechazo H0
(α)
t(0.05,7) = 1.895
Unidad 1: Prueba de Hipótesis
7) Aceptar o Rechazar H0
Se Acepta H0 y Se Rechaza H1
8) Emitir Conclusión
Calcule con α = 0.05 si existe diferencia entre los tiempos promedio. Suponga
varianzas iguales.
Solución:
1) Identificar Datos:
2) Establecer Hipótesis
Zona de Aceptación H0
(1-α)
7) Aceptar o Rechazar H0
Se Rechaza H0 y Se Acepta H1
8) Emitir Conclusión
Ejercicio 11: Un constructor afirma que se instalan bombas de calor en 70% de todas
las casas que se construyen hoy en día en la ciudad de Richmond. ¿Estaría de acuerdo
con esta afirmación si una investigación de casas nuevas en esta ciudad muestra que 8
de 15 tienen instaladas bombas de calor? Utilice un nivel de significancia de 0.10.
Solución:
1) Identificar Datos
x=8 po = 0.70 α = 0.10 n = 15
2) Establecer Hipótesis
H0: po = 0.70
H1: po ≠ 0.70
Unidad 1: Prueba de Hipótesis
Zona de Aceptación H0
(1-α/2)
Zona de Aceptación H0
(1-α/2)
7) Aceptar o Rechazar H0
Se Acepta H0 y Se Rechaza H1
8) Emitir Conclusión
“Con un 90% de confianza ó con un 10% de significancia se puede decir que existe
suficiente evidencia estadística para determinar el 70% de las casas tienen bombas de
calor instaladas ”
Solución:
1) Identificar Datos:
2) Establecer Hipótesis
H0: po = 0.05
H1: po < 0.05
Zona de Aceptación H0
(1-α)
Zona de Rechazo H0
(α)
Z(-1.645) = 0.05
Unidad 1: Prueba de Hipótesis
Zona de Rechazo H0
(α)
Z(-1.645) = 0.05
Unidad 1: Prueba de Hipótesis
7) Aceptar o Rechazar H0
Se Rechaza H0 y Se Acepta H1
8) Emitir Conclusión
Ejemplo 13: Se evalúan dos tipos diferentes de soluciones para pulir, para su posible
uso en una operación de pulido en la fabricación de lentes intraoculares utilizados en
el ojo humano después de una cirugía de cataratas. Se pulen 300 lentes con la primera
solución y, de éstos, 253 no presentaron defectos inducidos por el pulido. Después se
pulen otros 300 lentes con la segunda solución, de los cuales 196 resultan
satisfactorios. ¿Existe alguna razón para creer que las dos soluciones para pulir son
diferentes? Utilice a = 0.01
Solución:
1) Identificar Datos:
2) Establecer Hipótesis
H0: P1 – P2 = 0
H1: P1 – P2 ≠ 0
Zona de Aceptación H0
(1-α)
Zona de Aceptación H0
(1-α)
7) Aceptar o Rechazar H0
Se Rechaza H0 y Se Acepta H1
8) Emitir Conclusión
Ejemplo 14: Se tomará el voto entre los residentes de una ciudad y el condado
circundante para determinar si se debe construir una planta química propuesta. El
lugar de construcción está dentro de los límites de la ciudad y por esta razón muchos
votantes del condado consideran que la propuesta pasará debido a la gran proporción
de votantes que favorecen la construcción. Para determinar si hay una diferencia
significativa en la proporción de votantes de la ciudad y votantes del condado que
favorecen la propuesta, se realiza una encuesta.
Unidad 1: Prueba de Hipótesis
Solución:
1) Identificar Datos:
2) Establecer Hipótesis:
H0: P1 – P2 = 0
H1: P1 – P2 > 0
Unidad 1: Prueba de Hipótesis
Zona de Aceptación H0
(1-α)
Zona de Rechazo H0
(α)
Z(1.96) = 0.975
Unidad 1: Prueba de Hipótesis
Zona de Aceptación H0
(1-α)
Zona de Rechazo H0
(α)
Z(1.96) = 0.975
Unidad 1: Prueba de Hipótesis
7) Aceptar o Rechazar H0
Se Rechaza H0 y Se Acepta H1
8) Emitir Conclusión
“Con un 97.5% de confianza ó con un 2.5% de significancia se puede decir que existe
suficiente evidencia estadística para determinar que la proporción de votantes de la
ciudad que favorecen la propuesta es más alto que la proporción de votantes del
condado”
Unidad 1: Prueba de Hipótesis
Ejemplo 15: Se hizo un estudio para definirse si los ejercicios aeróbicos reducen el
ritmo cardiaco de una persona durante el descanso, y al examinar a diez voluntarios
antes y después de seguir un programa de ese tipo durante seis meses, sus
pulsaciones, en latidos por minuto, dieron los siguientes registros:
Use α = 0.05 para calcular si los ejercicios aeróbicos reducen el ritmo cardiaco
durante el reposo.
Unidad 1: Prueba de Hipótesis
Solución:
1) Identificar Datos:
sd = 1.57 = 3.6 n = 10 α = 0.05
2) Establecer Hipótesis:
H0: μA = μB
H1: μA > μB
Unidad 1: Prueba de Hipótesis
Zona de Rechazo H0
(α)
t(0.05,9) = 1.833
Unidad 1: Prueba de Hipótesis
Zona de Aceptación H0
(1-α)
Zona de Rechazo H0
(α)
t(0.05,9) = 1.833
Unidad 1: Prueba de Hipótesis
7) Aceptar o Rechazar H0
Se Rechaza H0 y Se Acepta H1
8) Emitir Conclusión
Ejemplo 16: Diez hombres se sometieron a una dieta especial registrando sus pesos
antes de comenzarla y después de un mes de estar en ella. Los resultados de los pesos,
en libras, se muestran a continuación:
Unidad 1: Prueba de Hipótesis
Haga una prueba con α = 0.05 para determinar si la dieta logró alguna diferencia, ya
sea positiva o negativa.
Solución:
1) Identificar Datos:
sd = 3.52 =2 n = 10 α = 0.05
2) Establecer Hipótesis:
H0: μA = μB
H1: μA ≠ μB
Unidad 1: Prueba de Hipótesis
Zona de Aceptación H0
(1-α)
7) Aceptar o Rechazar H0
Se Acepta H0 y Se Rechaza H1
8) Emitir Conclusión
Supóngase que en una determinada muestra se observan una serie de posibles sucesos
E1, E2, E3, . . . , EK, que ocurren con frecuencias o1, o2, o3, . . ., oK, llamadas
frecuencias observadas y que, según las reglas de probabilidad, se espera que
ocurran con frecuencias e1, e2, e3, . . . ,eK llamadas frecuencias teóricas o esperadas.
A menudo se desea saber si las frecuencias observadas difieren significativamente de
las frecuencias esperadas. Para el caso en que solamente son posibles dos sucesos E1
y E2 como, por ejemplo, caras o cruces, defectuoso, etc., el problema queda resuelto
satisfactoriamente con los métodos de los temas anteriores.
Unidad 2: Pruebas de la bondad del ajuste y análisis de varianza
Definición de X2
v=k–1–m
en donde:
Debe advertirse que en aquellas circunstancias en que X2 esté muy próxima a cero
debe mirarse con cierto recelo, puesto que es raro que las frecuencias observadas
concuerden demasiado bien con las esperadas. Para examinar tales situaciones, se
puede determinar si el valor calculado de X2 es menor que las X2 críticas o de tabla
(ensayo unilateral izquierdo), en cuyos casos se decide que la concordancia es
bastante buena.
Ejemplo 17: La siguiente tabla muestra las frecuencias observadas al lanzar un dado
120 veces. Ensayar la hipótesis de que el dado está bien hecho al nivel de
significación del 0.05.
Unidad 2: Pruebas de la bondad del ajuste y análisis de varianza
Solución:
a) Primero se procede a calcular los valores esperados. Como es bien sabido por todos
la probabilidad de que caiga cualquier número en un dado no cargado es de 1/6.
Como la suma de los valores observados es de 120, se multiplica este valor por 1/6
dando un resultado de 20 para cada clasificación.
1) Identificar Datos:
2) Establecer Hipótesis:
H0: Las frecuencias observadas y esperadas son significativamente iguales (dado bien
hecho)
Zona de Aceptación H0
(1-α)
Zona de Rechazo H0
(α)
χ2(0.05,5) = 11.07
Zona de Aceptación H0
(1-α)
Zona de Rechazo H0
(α)
χ2(0.05,5) = 11.07
7) Aceptar o Rechazar H0
Se Acepta H0 y Se Rechaza H1
Unidad 2: Pruebas de la bondad del ajuste y análisis de varianza
8) Emitir Conclusión
Ejemplo 18: En los experimentos de Mendel con guisantes, observó 315 lisos y
amarillos, 108 lisos y verdes, 101 rugosos y amarillos y 32 rugosos y verdes. De
acuerdo con su teoría, estos números deberían presentarse en la proporción 9:3:3:1.
¿Hay alguna evidencia que permita dudar de su teoría al nivel de significación del
0.01?
Solución:
1) Identificar Datos:
2) Establecer Hipótesis:
Zona de Aceptación H0
(1-α)
Zona de Rechazo H0
(α)
χ2(0.01,3) = 11.34
Unidad 2: Pruebas de la bondad del ajuste y análisis de varianza
Zona de Aceptación H0
(1-α)
Zona de Rechazo H0
(α)
χ2(0.01,3) = 11.34
Unidad 2: Pruebas de la bondad del ajuste y análisis de varianza
7) Aceptar o Rechazar H0
Se Acepta H0 y Se Rechaza H1
8) Emitir Conclusión
Ejemplo 19: Una encuesta sobre 320 familias con 5 niños dio la distribución que
aparece en la siguiente tabla. ¿Es el resultado consistente con la hipótesis de que el
nacimiento de varón y hembra son igualmente posibles? Use a = 0.05.
Unidad 2: Pruebas de la bondad del ajuste y análisis de varianza
Solución:
1) Identificar Datos
2) Establecer Hipótesis:
Zona de Aceptación H0
(1-α)
Zona de Rechazo H0
(α)
χ2(0.05,5) = 11.07
Unidad 2: Pruebas de la bondad del ajuste y análisis de varianza
Zona de Aceptación H0
(1-α)
Zona de Rechazo H0
(α)
χ2(0.05,5) = 11.07
Unidad 2: Pruebas de la bondad del ajuste y análisis de varianza
7) Aceptar o Rechazar H0
Se Rechaza H0 y Se Acepta H1
8) Emitir Conclusión
Ejemplo 20: Se propone que el número de defectos en las tarjetas de circuito impreso
sigue una distribución Poisson. Se reúne una muestra aleatoria de 60 tarjetas de
circuito impreso y se observa el número de defectos. Los resultados obtenidos son los
siguientes:
Unidad 2: Pruebas de la bondad del ajuste y análisis de varianza
¿Muestran estos datos suficiente evidencia para decir que provienen de una
distribución Poisson? Haga la prueba de la bondad del ajuste con un α = 0.05
Solución:
Con esta fórmula se calculan las probabilidades, mismas que se multiplican por 60
para obtener los valores esperados.
Unidad 2: Pruebas de la bondad del ajuste y análisis de varianza
Puesto que la frecuencia esperada en la última celda es menor que 3, se combinan las
dos últimas celdas.
2) Establecer Hipótesis:
Zona de Aceptación H0
(1-α)
Zona de Rechazo H0
(α)
χ2(0.05,1) = 3.84
Unidad 2: Pruebas de la bondad del ajuste y análisis de varianza
Zona de Aceptación H0
(1-α)
Zona de Rechazo H0
(α)
χ2(0.05,1) = 3.84
Unidad 2: Pruebas de la bondad del ajuste y análisis de varianza
7) Aceptar o Rechazar H0
Se Acepta H0 y Se Rechaza H1
8) Emitir Conclusión
O sea Oij la frecuencia observada para el nivel i del primer método de clasificación y
el nivel j del segúndo método de clasificación. En general, los datos aparecerán como
se muestra en la siguiente tabla. Una tabla de este tipo usualmente se conoce como
tabla de contingencia r x c.
Los procedimientos de prueba exactos son difíciles de obtener, pero puede obtenerse
un estadístico de prueba aproximado válido para n grande.
Solución:
2) Establecer Hipótesis:
Zona de Aceptación H0
(1-α)
Zona de Rechazo H0
(α)
χ2(0.05,6) = 12.592
Unidad 2: Pruebas de la bondad del ajuste y análisis de varianza
Zona de Aceptación H0
(1-α)
Zona de Rechazo H0
(α)
χ2(0.05,6) = 12.592
Unidad 2: Pruebas de la bondad del ajuste y análisis de varianza
7) Aceptar o Rechazar H0
Se Acepta H0 y Se Rechaza H1
8) Emitir Conclusión
Supuestos previos
•Los modelos mixtos describen situaciones donde están presentes ambos tipos de
factores: fijos y aleatorios.
Unidad 2: Pruebas de la bondad del ajuste y análisis de varianza
Tratamientos Donde:
1 2 i k
y11 y21 yi1 yk 1
y12 y22 yi 2 yk 2
y1n y2 n yin yki
Total T1 T2 Ti Tk T
Media y1 y 2 yi yk y
Unidad 2: Pruebas de la bondad del ajuste y análisis de varianza
Con estos datos podemos hacer una tabla de análisis de varianza para la clasificación
en una dirección:
Total SST nk - 1
Unidad 2: Pruebas de la bondad del ajuste y análisis de varianza
Mezcla (% de Peso)
1 2 3 4 5
551 595 639 417 563
457 580 615 449 631
450 508 511 517 522
731 583 573 438 613
499 633 648 415 656
632 517 677 555 679
Total 3,320 3,416 3,663 2,791 3,664 16,854
Media 553.33 569.33 610.50 465.17 610.67 561.80
Unidad 2: Pruebas de la bondad del ajuste y análisis de varianza
1) Identificar Datos:
2) Establecer Hipótesis:
H0: μ1=μ2=μ3=μ4=μ5
H1: que por lo menos 2 promedios de las mezclas son diferentes.
Zona de Aceptación H0
(1-α)
Zona de Rechazo H0
(α)
f(0.05,4,25) = 2.759
Unidad 2: Pruebas de la bondad del ajuste y análisis de varianza
Total 209,376.80 29
Unidad 2: Pruebas de la bondad del ajuste y análisis de varianza
Zona de Aceptación H0
(1-α)
Zona de Rechazo H0
(α)
4.30
f(0.05,4,25) = 2.759
7) Aceptar o Rechazar H0
Se Rechaza H0 y Se Acepta H1
Unidad 2: Pruebas de la bondad del ajuste y análisis de varianza
8) Emitir Conclusión
Bloque
Tratamiento
Tratamiento 1 2 j b Total Media
1 y11 y12 y1 j y1b T1. y1.
2 y 21 y 22 y2 j y 2b T2 . y 2.
i yi1 yi 2 yij yib Ti . y i.
k yk1 yk 2 ykj y kb Tk . y k.
Total T .1 T .2 T. j T .b T ..
Media y .1 y .2 y. j y .b y ..
Unidad 2: Pruebas de la bondad del ajuste y análisis de varianza
Con estos datos podemos hacer una tabla de análisis de varianza para la clasificación
en dos direcciones:
Bloques SSB b -1
Total SST bk - 1
Unidad 2: Pruebas de la bondad del ajuste y análisis de varianza
Donde:
Operador
Máquina 1 2 3 4 5 6 Total
1 42.5 39.3 39.6 39.9 42.9 43.6 247.8
2 39.8 40.1 40.5 42.3 42.5 43.1 248.3
3 40.2 40.5 41.3 43.4 44.9 45.1 255.4
4 41.3 42.2 43.5 44.2 45.9 42.3 259.4
Total 163.8 162.1 164.9 169.8 176.2 174.1 1010.9
1) Identificar Datos:
2) Establecer Hipótesis:
H1: que por lo menos 2 promedios de velocidad de las máquinas son diferentes.
Zona de Aceptación H0
(1-α)
Zona de Rechazo H0
(α)
f(0.05,3,15) = 3.287
Unidad 2: Pruebas de la bondad del ajuste y análisis de varianza
Total 81.86 23
Unidad 2: Pruebas de la bondad del ajuste y análisis de varianza
Zona de Aceptación H0
(1-α)
Zona de Rechazo H0
(α)
3.34
f(0.05,4,25) = 2.759
7) Aceptar o Rechazar H0
Se Rechaza H0 y Se Acepta H1
Unidad 2: Pruebas de la bondad del ajuste y análisis de varianza
8) Emitir Conclusión
NOTA: Eso de andar con mi laptop y mi cañón, haciéndolo todo sin saber que hacen
mis alumnos y ellos sin comprender de dónde salen los resultados no va conmigo,
pero si quieren un paquete computacional, nada como Excel o Minitab, cuando
quieran clases avísenme, también soy una fiera en eso, y en mis clases se aprende
arrastrando lápiz, usando calculadora y razonando, no como en otras clases donde,
bueno, mejor omito mis comentarios!!!
Unidad 3
Análisis de regresión,
correlación lineal simple y
múltiple
Unidad 3: Análisis de regresión, correlación lineal simple y múltiple
Si sabemos que existe una relación entre una variable denominada dependiente y
otras denominadas independientes, puede darse el problema de que la dependiente
asuma múltiples valores para una combinación de valores de las independientes.
Características principales
Ejemplo 24: Los datos que a continuación se proporcionan corresponden a las horas
trabajadas y el sueldo devengado por once empleados de una empresa.
Y = a + βx +
Donde:
b
x yi i n xi y i
a y i b xi
x i
2
n xi
2
x b y
na i i
x a x b x y
i
2
i i i
Unidad 3: Análisis de regresión, correlación lineal simple y múltiple
Como se aplicaba en la desviación estándar; mientras más grande sea el error estándar
de estimación (Se), mayor será la dispersión de los puntos alrededor de la línea de
regresión. De manera que inversa, si Se = 0, esperemos que la ecuación de estimación
sea un estimador perfecto de la variable dependiente. En este caso todos lo puntos
deben caer en la línea de regresión y no habría puntos dispersos.
Usaremos el error estándar como una herramienta de igual forma que la desviación
estándar. Esto suponiendo que los puntos observados están distribuidos normalmente
alrededor de la línea de regresión, podemos encontrar un 68% de los puntos en ± 1
Se, 95.5% en ± 2 Se y 99.7% de los puntos en ± 3 Se. Otra cosa que debemos
observar es que el error estándar de la estimación se mide a lo largo del eje Y, y no
perpendicularmente de la línea de regresión.
Unidad 3: Análisis de regresión, correlación lineal simple y múltiple
Unidad 3: Análisis de regresión, correlación lineal simple y múltiple
Si, en lugar decimos que estamos seguros en aproximadamente 95.5% de que el dato
real estará dentro de ± 2 errores estándar de la estimación. Podríamos calcular los
limites de este intervalo de la siguiente manera:
Los estadísticos han desarrollado dos medidas para describir la correlación entre dos
variables: el coeficiente de determinación y el coeficiente de correlación.
R
nx y x y
i i i i
n x x n y y
2 2 2 2
i i i i
Unidad 3: Análisis de regresión, correlación lineal simple y múltiple
Insisto: Eso de andar con mi laptop y mi cañón, haciéndolo todo sin saber que hacen
mis alumnos y ellos sin comprender de dónde salen los resultados no va conmigo,
pero si quieren un paquete computacional, nada como Excel, cuando quieran clases
avísenme, también soy una fiera en eso, y en mis clases se aprende arrastrando lápiz,
usando calculadora y razonando, no como en otras clases donde, bueno, mejor omito
mis comentarios!!!
H. Estudio Calificación
xi yi x2i y2i xi*yi Ŷ Residuales
0.5 50 0.25 2500 25 47.5989 2.4011
1 45 1 2025 45 50.2643 -5.2643 b= 5.3309
1.5 60 2.25 3600 90 52.9298 7.0702
2 60 4 3600 120 55.5952 4.4048 a= 44.9334
2.5 55 6.25 3025 137.5 58.2607 -3.2607
3 65 9 4225 195 60.9262 4.0738 Ŷ = a + bx
3.5 60 12.25 3600 210 63.5916 -3.5916
5 55 25 3025 275 71.5880 -16.5880 R= 0.9156
6 75 36 5625 450 76.9189 -1.9189
6.5 85 42.25 7225 552.5 79.5843 5.4157 R2 = 0.8383
7 90 49 8100 630 82.2498 7.7502
8 85 64 7225 680 87.5807 -2.5807
9 95 81 9025 855 92.9116 2.0884
Σ 55.5 880 332.25 62800 4265
Medias 4.2692 67.6923 25.5577
xi Ŷ
5.5 74.2534
7.5 84.9153
8.5 90.2462
Unidad 3: Análisis de regresión, correlación lineal simple y múltiple
x b y
na i i 13a 55.5b 880
x a x b x y
i
2
i i i 55.5a 332.25b 4,265
880 55.5
4,265 332 .25 880 332.25 4,265 55.5 55,672.5
a 44.9334
13 55.5 13 332.25 55.5 55.5 1,239
55.5 332.25
13 880
b
55.5 4,265
13 4,265 880 55.5 6,605 5.3309
13 55.5 13 332.25 55.5 55.5 1,239
55.5 332.25
Unidad 3: Análisis de regresión, correlación lineal simple y múltiple
Unidad 3: Análisis de regresión, correlación lineal simple y múltiple
Análisis Residual
Unidad 3: Análisis de regresión, correlación lineal simple y múltiple
y a0 a1 x1 a2 x2
n x x
1 2 a0 y
x 1 x x x
2
1 1 2 a1 x y
1
x 2 x x x
1 2
2
2 a2 x y
2
Unidad 3: Análisis de regresión, correlación lineal simple y múltiple
x a x a y
n a0 1 1 2 2
x a x a x x a x y
1 0
2
1 1 1 2 2 1
x a x x a x a x y
2 0 1 2 1
2
2 2 2
n x x
1 2 y x x 1 2
x 1 x x x
2
1 1 2 x y x x x
1
2
1 1 2
D x 2 x x x
1 2
2
2 x y x x x
2 1 2
2
2
n x x
1 2 y x x 1 2
x 1 x x x
2
1 1 2
a
x y x 1 x x 2
1 1 2
0
D
Unidad 3: Análisis de regresión, correlación lineal simple y múltiple
n y x 2 n x 1y
x 1 x y
1 x x
1 2 x 1 x x y
2
1 1
x 2 x y
2 x 2
2 x 2 x x x y
1 2 2
n y x 2 n x 1y
a
x 1 x y
1 x x
1 2
a
x 1 x x y
2
1 1
1 2
D D
? 1 2.8
? 0.65 2.4
? 1.1 2.9
Unidad 3: Análisis de regresión, correlación lineal simple y múltiple
2,175 4 14.1
1452 .25 2.825 9.565
5113 .5 9.565 33.31
6 4 14.1
2,175 4 14.1
4 2.825 9.565
1452 .25 2.825 9.565 1.17275000
D 14.1 9.565 33.31 0.00289999 a0 404.3965518
D 0.00289999
6 4 14.1
4 2.825 9.565
Unidad 3: Análisis de regresión, correlación lineal simple y múltiple
6 2,175 14.1
4 1,452.25 9.565
14.1 5,113.5 33.31
6 2,175 14.1
4 1,452.25 9.565 0.13499999
a1 46.55172412
0.00289999 0.00289999
6 4 2,175
4 2.825 1452 .25
14.1 9.565 5,113.5
6 4 2,175
4 2.825 1452 .25 0.089999999
a2 31.03448275
0.00289999 0.00289999
Unidad 3: Análisis de regresión, correlación lineal simple y múltiple
Por lo tanto, la ecuación para estimar los siguientes tres contratos es:
364.0517 1 2.8
360.1724 0.65 2.4
365.6034 1.1 2.9
Unidad 3: Análisis de regresión, correlación lineal simple y múltiple
Series de tiempo
Unidad 4: Series de tiempo
El primer paso para analizar una serie de tiempo es graficarla, esto permite:
identificar la tendencia, la estacionalidad, las variaciones irregulares (componente
aleatoria). Un modelo clásico para una serie de tiempo, puede ser expresada como
suma o producto de tres componentes: tendencia, estacional y un término de error
aleatorio.
De forma amplia podemos definir la tendencia como aquella componente que recoge
el comportamiento de la serie a largo plazo. Para poder detectarla es necesario que la
serie conste de un número de observaciones elevado, a lo largo de muchos años, para
que se puede determinar si la serie muestra un movimiento a largo plazo que responda
a una determinada ley de crecimiento, decrecimiento o estabilidad. Ese
comportamiento tendencial puede responder a distintos perfiles: lineal, exponencial,
parabólico, logístico, etc.
Para el ejemplo del paro registrado en la Figura 1, puede observase que la tendencia
de esa serie a lo largo de esos seis años (este periodo de tiempo no es muy largo para
hablar de tendencia a largo plazo) es prácticamente una línea recta con pendiente
negativa, aunque el ritmo de decrecimiento no solo se reduce al final del periodo sino
que a lo largo de 2002 parece tener lugar un incipiente cambio de tendencia.
Unidad 4: Series de tiempo
O sea, que se tiene una serie que es, básicamente, decreciente para el periodo
considerado. Mediante la tendencia se puede ver si la serie es estacionaria o
evolutiva. Al considerar estos movimientos a largo plazo, prescindiremos de las
variaciones a corto y medio plazo.
Figura 1:
Unidad 4: Series de tiempo
Esta componente tiene un marcado carácter económico, pues suele ser el resultado de
la sucesión de las fases expansivas y recesivas de la economía.
Son movimientos a plazo medio, periodos superiores al año, que se repiten de forma
casi periódica, aunque no son tan regulares como las variaciones estacionales. Esta
componente resulta difícil de aislar, pues ocurre, con frecuencia, que se pueden
superponer ciclos de distintos periodos o amplitudes. La amplitud es el número de
años que dura un ciclo completo.
Ejemplo 28:
Periodo Demanda Dt Promedio Móvil para Pronóstico para Error
3 periodos At 3 periodos Ft
1 10
2 18
3 29 19
4 15 20.7 19 -4
5 30 24.7 20.7 9.3
6 12 19 24.7 -12.7
7 16 19.3 19 -3
8 8 12 19.3 -11.3
9 22 15.3 12 10
10 14 14.7 15.3 -1.3
11 15 17 14.7 0.3
12 27 18.7 17 10
13 30 24 18.7 11.3
14 23 26.7 24 -1
15 15 22.7 26.7 -11.7
Unidad 4: Series de tiempo
30
Demanda
25
Promedio Móvil
20 para 3 periodos
Demanda
Pronóstico para 3
15 periodos
10
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Unidad 4: Series de tiempo
Donde:
17.5
Demanda
15 Pronóstico 0.1
12.5 Pronóstico 0.3
10
7.5
5
2.5
0
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Periodos
Unidad 5
Estadística no paramétrica
Unidad 5:Estadística no paramétrica
Para que una escala pueda considerarse como capaz de aportar información objetiva
debe reunir los dos siguiente requisitos básicos:
Unidad 5:Estadística no paramétrica
Validez: indica la capacidad de la escala para medir las cualidades para las cuales ha
sido construida y no otras parecidas. Una escala confusa no puede tener validez, lo
mismo que en una escala que esté midiendo, a la vez e indiscriminadamente, distintas
variables superpuestas. "Una escala tiene validez cuando verdaderamente mide lo que
afirma medir".
Entre estos valores no cabe obviamente ninguna jerarquía, no se puede trazar ningún
ordenamiento. Sin embargo, a la enunciación explícita de todas estas posibilidades la
consideramos como una escala, pues de algún modo es útil para medir el
comportamiento de la variable, indicándonos en que posición se halla en cada caso.
Unidad 5:Estadística no paramétrica
Sin embargo la distancia entre un valor y otro no queda definida sino que es
indeterminada. En otras palabras, tales escalas nos esclarecen solamente el rango que
las distintas posiciones guardan entre sí. Un ejemplo de escala ordinal es el que suele
usarse para medir la variable "grado de escolaridad": podemos decir que una persona
que ha tenido 2 años de instrucción escolar ha recibido más instrucción que quien
solo tiene un año y menos que quien posee tres. Sin embargo no puede afirmarse
válidamente que la diferencia entre quien posee 2 años de instrucción y quien ha
recibido un año es igual a la diferencia entre quienes han recibido 16 y 17años de
educación formal. Por tanto, como no podemos determinar la equivalencia entre las
distancias que separan un valor de otro, debemos concluir que la escala pertenece a la
categoría ordinal.
Unidad 5:Estadística no paramétrica
Un ejemplo típico de las escalas de intervalos iguales esta dado por las escalas
termométricas. Entre 23 y 24 grados centígrados, por ejemplo, existe la misma
diferencia que hay entre 45 y 46 grados. Muchas otras escalas, como las que se
utilizan en los test psicológicos y de rendimiento, pertenecen a este tipo. La
limitación que poseen es que no definen un cero absoluto, un valor límite que exprese
realmente la ausencia completa de la cualidad medida. Por ello no se pueden
establecer equivalencias matemáticas como las de la proporcionalidad: no puede
afirmarse que 24° C es el doble de temperatura que 12° C, porque el cero de la escala
es un valor arbitrario y no se corresponde con la ausencia absoluta de la variable que
se mide.
Unidad 5:Estadística no paramétrica
Por último tenemos las escalas de cocientes, llamadas también de razones. En ellas se
conservan todas las propiedades de los casos anteriores pero además se añade la
existencia de un valor cero real, con lo que se hacen posibles ciertas operaciones
matemáticas, tales como la obtención de proporciones y cocientes.
Esto quiete decir que un valor de 20 en una escala de este tipo es el doble de un valor
de 10, o de las dos terceras partes de un valor de 30. Son escalas de cocientes las que
miden la longitud, la masa, la intensidad de corriente eléctrica y otras variables del
mundo físico. Difícilmente las variables que intervienen en las ciencias sociales son
medidas con escalas de razones, pues son contados los casos en que dichas variables
pueden ser definidas con la exactitud y precisión necesarias. La economía y la
demografía son, entre estas disciplinas, las que más utilizan escalas de razones.
Unidad 5:Estadística no paramétrica
PARAMÉTRICAS NO PARAMÉTICAS
Al computarlas: se suman, se dividen y se Se fija el orden o rango de los puntajes,
multiplican los puntajes de las muestras. sin considerar el valor numérico.
Por lo tanto, sólo deben usarse puntajes Existen otras técnicas en las que ni
que sean verdaderamente numéricos. siguiera es posible meter orden (por
Cuando estas operaciones aritméticas se ejemplo, con datos clasificatorios).
hacen con puntajes que no son
verdaderamente numéricos, ocasionan
naturalmente deformaciones de los datos
y menoscaban el valor de las
conclusiones de la prueba.
Una corrida es una serie de observaciones similares. La prueba de corridas se usa para
probar la aleatoriedad de una serie de observaciones cuando cada observación puede
ser asignada a una de dos categorías.
Ejemplo 30: Se ajusta una máquina para despachar adelgazante de pintura acrílica en
un recipiente. ¿Diría usted que la cantidad de adelgazante que está siendo despachada
por máquina varía aleatoriamente, si los contenidos de los siguientes15 recipientes se
miden y se encuentra que son: 3.6, 3.9, 4.1, 3.6, 3.8, 3.7, 3.4, 4.0, 3.8, 4.1, 3.9, 4.0,
3.8, 4.2 y 4.1 litros? Utilice un α del 1%
Unidad 5:Estadística no paramétrica
Solución:
Unidad 5:Estadística no paramétrica
5.1
Unidad 5:Estadística no paramétrica
5.1
Unidad 5:Estadística no paramétrica
5.1
Unidad 5:Estadística no paramétrica
5.1
Unidad 5:Estadística no paramétrica
5.1
Unidad 5:Estadística no paramétrica
5.1