Documentos de Académico
Documentos de Profesional
Documentos de Cultura
CHIMBORAZO
FACULTAD DE CIENCIAS
ESCUELA DE BIOQUÍMICA Y FARMACIA
BIOMETRÍA Y DISEÑO EXPERIMENTAL
INFERENCIA ESTADÍSTICA
Definición:
El primer paso consiste en establecer la hipótesis que se debe probar. Ésta
recibe el nombre de hipótesis nula, la cual se designa H0.La letra mayúscula H
representa la hipótesis, y el subíndice cero implica que “no hay diferencia”. Por lo
general se incluye un término no en la hipótesis nula, que significa que “no hay
cambio”. En términos generales, la hipótesis nula se formula para realizar una
prueba. O se rechaza o no se rechaza. Es una afirmación que no se rechaza a
menos que la información de la muestra ofrezca evidencia convincente de que es
falsa.
Cabe hacer hincapié en que, si la hipótesis nula no se rechaza con base en los
datos de la muestra, no es posible decir que la hipótesis nula sea verdadera. En
otras palabras, el hecho de no rechazar una hipótesis no prueba que H0 sea
verdadera, sino que no rechazamos H0. Para probar sin lugar a dudas que la
hipótesis nula es verdadera, sería necesario conocer el parámetro poblacional. Para
determinarlo, habría que probar, entrevistar o contar cada elemento de la población.
Esto no resulta factible. La alternativa consiste en tomar una muestra de la
población.
También debe destacarse que con frecuencia la hipótesis nula inicia con las
expresiones: “No existe diferencia significativa entre…” o “La resistencia media del
vidrio a los impactos no es significativamente diferente de…” Al seleccionar una
muestra de una población, el estadístico de la muestra es numéricamente distinto
del parámetro poblacional hipotético.
Tarea en clases: elaboración de hipótesis.
Para ilustrar cómo es posible rechazar una hipótesis verdadera, suponga que una
farmacia adquiere cierto producto. Los proveedores participan en una licitación y
el que presenta la cotización más baja obtiene el contrato. Suponga que mediante
un control de calidad con el que cuente dicha farmacia especifique el tiempo de
entrega del producto entre los envíos que llegan. Si más de 6% de las entregas
realizadas no cumple con la disposición de entrega a tiempo, el envío se rechaza.
La hipótesis nula consiste en que el envío del producto tiene un 6% o menos que
no satisface las entregas a tiempo. La hipótesis alternativa consiste en que más
de 6% de las entregas se entregan con retraso.
No obstante, hay la posibilidad de que en el muestreo se haya tomado
justo las ocasiones que hubo entrega con retraso y todo el resto de
entregas haya sido hecho a tiempo. En este caso, menos de 6% de todo el
envío no satisfacía las normas, y rechazarlo fue un error. En términos de la
prueba de hipótesis, rechazamos la hipótesis nula de que el envío cumplía
con las normas cuando se debió aceptar. Al rechazar la hipótesis nula, se
incurrió en un error tipo I.
En la gráfica siguiente se presenta la región de rechazo de una prueba de
significancia que se efectuará más adelante en este capítulo.
Ejemplo
Retomando el ejemplo de las vacunas en el que se probó la hipótesis nula relativa a que la cantidad de vacunas
producidas a la semana fue de 200. No se rechazó la hipótesis nula, pues el valor z de 1.55 cayó en la región
comprendida entre -2.58 y 2.58. Se decidió no rechazar la hipótesis nula si el valor calculado de z caía en esta
región. La probabilidad de hallar un valor z de 1.55 o más es de 0.0606, que se calcula mediante la diferencia de
0.5000 - 0.4394. En otras palabras, la probabilidad de obtener un > 203.5 si = 200 es de 0.0606. Para
calcular el valor p, es necesario concentrarse en la región menor a -1.55, así como en los valores superiores a
1.55 (pues la región de rechazo se localiza en ambas colas). El valor p de dos colas es de 0.1212, que se calcula
así: 2(0.0606). El valor p de 0.1212 es mayor que el nivel de significancia de 0.01 que se estableció al inicio, así
que no se rechaza H0. En la siguiente gráfica se muestran los detalles. En general, el área se duplica en una
prueba de dos colas. Entonces, el valor p se compara con facilidad con el nivel de significancia. Se aplica la
misma regla de decisión en el caso de una prueba de una cola.
Solución con Excel
Solución con MegaStat
Ya que p>α, se acepta la hipótesis nula; esto es que la media muestral es igual a 50.
Solución con Minitab
Ya que p>α, se acepta la hipótesis nula; esto es que la media muestral es igual a 50.
Comparación de la media de una muestra pequeña (𝑛𝑛 <30)
con un valor referencial
H0: 𝜇𝜇 = 𝜇𝜇0
H1: 𝜇𝜇 ≠ 𝜇𝜇0
Buscar evidencias de error sistemático significativo en los resultados generados por un nuevo
método para determinar selenourea en agua (Aller, AJ. And Robles, L.C., 1998, Analyst, 123:
919).
NO
SI
NO
Cuando las muestras son de más de 30 datos y desvíaciones conocidas,
el zcalc se lo obtiene como sigue:
𝑥𝑥̅1 − 𝑥𝑥̅2
𝑧𝑧 =
𝑠𝑠12 𝑠𝑠22
𝑛𝑛1 + 𝑛𝑛2
Cuando las muestras son independientes y de menos de 30 datos ,
el tcalc se lo obtiene como sigue:
Prueba F
𝐻𝐻0 : 𝜎𝜎12 = 𝜎𝜎22
𝐻𝐻1 : 𝜎𝜎12 ≠ 𝜎𝜎22
El estadístico de prueba es el F
𝑠𝑠12
𝐹𝐹 = 2
𝑠𝑠2
Con 𝑠𝑠12 > 𝑠𝑠22 ; Si 𝐹𝐹 < 𝐹𝐹𝑐𝑐𝑐𝑐𝑐𝑐𝑐 se acepta la hipótesis nula caso contrario se rechaza.
Ejercicio
PRUEBA F
Solución con Minitab
Ya que 𝑝𝑝 > 𝛼𝛼 se concluye que las varianzas de las dos poblaciones son iguales.
Solución con Minitab
PRUEBA t
Solución con Minitab
PRUEBA t
Ya que 𝑝𝑝 > 𝛼𝛼 se concluye que las medias de las dos poblaciones son iguales.
Muestras dependientes
• Recordemos que para muestras pequeñas independientes se utilizan
el estadístico t determinado por las expresiones siguientes, ya vistas
anteriormente.
• En el caso de que las muestras sean dependientes; se debe usar la
prueba t apareada:
Ejercicios
(ejercicio 4 +
siguientes)
Ejercicios
(ejercicio 4 +
siguientes)
ANOVA
ANOVA de una Disponemos de 𝑘𝑘 r poblaciones, generalmente correspondientes a r
sola vía tratamientos experimentales. Cada uno de los tratamientos Ti, (i=1,
…, 𝑘𝑘r) se supone que tiene distribución normal con media µi y
Villardón) 𝑇𝑇1
𝑦𝑦11
𝑇𝑇2
𝑦𝑦21
… 𝑇𝑇𝑘𝑘
… 𝑦𝑦𝑘𝑘1
⋮ ⋮ ⋱ ⋮
𝑦𝑦1𝑛𝑛1 𝑦𝑦2𝑛𝑛2 … 𝑦𝑦𝑘𝑘𝑛𝑛𝑘𝑘
Se denota 𝑥𝑥como
Llamaos ̅ , … , 𝑥𝑥𝑥𝑥̅𝑘𝑘̅1a, 𝑥𝑥las
1 , 𝑥𝑥̅𝑘𝑘 a lasmuestrales
̅2 , …medias medias muestrales
de los de los grupos
grupos y 𝑥𝑥̅ ay 𝑥𝑥la̅
amedia
la media de todas
de todas laslas observaciones.
observaciones.
El análisis de la varianza se basa en la descomposición de la
variabilidad total en dos partes, una parte debida a la
variabilidad entre las distintas poblaciones o tratamientos
(variabilidad entre grupos o variabilidad explicada por el
diseño) y otra parte que puede considerarse como la
variabilidad intrínseca de las observaciones (variabilidad
dentro de los grupos o residual).
𝑘𝑘
2
𝑆𝑆𝑆𝑆𝑆𝑆 = � 𝑛𝑛𝑖𝑖 𝑦𝑦𝑖𝑖 − 𝑦𝑦�
𝑖𝑖=1
𝑘𝑘 𝑛𝑛𝑖𝑖
2
𝑆𝑆𝑆𝑆𝑆𝑆 = � � 𝑦𝑦𝑖𝑖𝑖𝑖 − 𝑦𝑦�𝑖𝑖
𝑖𝑖=1 𝑗𝑗=1
Fuente de Media
Suma de cuadrados g.l. F
variación cuadrática
𝑘𝑘
Entre
𝑆𝑆𝑆𝑆𝑆𝑆 = � 𝑛𝑛𝑖𝑖 𝑦𝑦𝑖𝑖 − 𝑦𝑦� 2 𝑘𝑘 − 1 𝑀𝑀𝑀𝑀𝑀𝑀 = 𝑆𝑆𝑆𝑆𝑆𝑆 𝐹𝐹 = 𝑀𝑀𝑀𝑀𝑀𝑀
tratamientos 𝑖𝑖=1
𝑘𝑘 − 1 𝑀𝑀𝑀𝑀𝑀𝑀
𝑘𝑘 𝑛𝑛𝑖𝑖
Dentro de los
𝑛𝑛 − 𝑘𝑘 𝑀𝑀𝑀𝑀𝑀𝑀 = 𝑆𝑆𝑆𝑆𝑆𝑆
2
𝑆𝑆𝑆𝑆𝑆𝑆 = � � 𝑦𝑦𝑖𝑖𝑖𝑖 − 𝑦𝑦�𝑖𝑖
tratamientos 𝑖𝑖=1 𝑗𝑗=1
𝑛𝑛 − 𝑘𝑘
𝑘𝑘 𝑛𝑛𝑖𝑖
2
Total 𝑆𝑆𝑆𝑆 = � � 𝑦𝑦𝑖𝑖𝑖𝑖 − 𝑦𝑦� 𝑛𝑛 − 1
𝑖𝑖=1 𝑗𝑗=1
Ejercicio
TRATAMIENTOS
Observaciones 1 2 3
1 20 15 12
2 18 20 15
3 18 13 18
4 23 12 20
5 22 16 18
6 17 17 17
7 15 21 10
8 13 15 24
9 21 13 16
Solución con Excel
Solución con Excel
Tabla ANOVA
Fuente de Suma de Media
Decisión:
g.l. F
variación cuadrados cuadrática
Comparison of Groups
,0.0
,0.0
,0.0
,0.0
,0.0
,0.0
,0.0
,0.0
,0.0
,0.0
,0.0
1 2 3
Ya que 𝑝𝑝 > 𝛼𝛼 se concluye que no existe evidencia estadísticamente significativa para rechazar H0.
Solución con Minitab
Ya que 𝑝𝑝 > 𝛼𝛼 se concluye que no existe evidencia estadísticamente significativa para rechazar H0.