Está en la página 1de 12

Inferencia Estadística

Sheila De La Rosa
20176472
RESUMEN

Capítulo 9. Pruebas de Hipótesis

Las pruebas de hipótesis son un procedimiento estadístico que usa datos


muéstrales para determinar si una afirmación acerca del valor de un parámetro
poblacional debe o no rechazarse. Como hipótesis se tienen dos afirmaciones
opuestas acerca de un parámetro poblacional. A una de las afirmaciones se le
llama hipótesis nula (H0) y a la otra, hipótesis alternativa (Ha).

En la sección 9.1 se proporcionaron los lineamientos para elaborar estas


hipótesis para tres situaciones encontradas a menudo en la práctica. Si se tienen
datos históricos o alguna otra información, éstos proporcionan una base para
suponer que se conoce la desviación estándar poblacional, el procedimiento de
prueba de hipótesis para la media poblacional se sustenta en la distribución
normal estándar. Si no se conoce σ, se usa la desviación estándar muestral s
para estimar σ y el procedimiento de la prueba de hipótesis se basa en la
distribución t. En ambos casos, la calidad de los resultados depende tanto de la
forma de la distribución de la población como del tamaño de la muestra. Si la
población tiene distribución normal, los dos procedimientos para la prueba de
hipótesis son aplicables, aun con tamaños de muestra pequeños. Si la población
no está distribuida normalmente, se necesitan tamaños de muestra mayores.

En las secciones 9.3 y 9.4 se proporcionaron los lineamientos generales para el


tamaño de la muestra. En el caso de pruebas de hipótesis para la proporción
poblacional, en el procedimiento de la prueba de hipótesis se usa un estadístico
de prueba sustentado en la distribución normal estándar. En todos los casos el
valor del estadístico de prueba se usa para calcular un valor-p para la prueba.
Un valor-p es una probabilidad que se usa para determinar si se rechaza o no la
hipótesis nula. Si el valor-p es menor o igual que el nivel de significancia α, la
hipótesis nula puede rechazarse. Las conclusiones de una prueba de hipótesis
también pueden obtenerse comparando el valor del estadístico de prueba con el
valor crítico. En pruebas de la cola inferior, la hipótesis nula se rechaza si el
valor del estadístico de prueba es menor o igual que el valor crítico.

En pruebas de la cola superior, la hipótesis nula se rechaza si el valor del


estadístico de prueba es mayor o igual al valor crítico. En las pruebas de las dos
colas hay dos valores críticos: uno en la cola inferior de la distribución muestral
y otro en la cola superior de la distribución muestral. En este caso, la hipótesis
nula se rechaza si el valor del estadístico de prueba es menor o igual al valor
crítico de la cola inferior o mayor o igual que el valor crítico de la cola superior.
También se presentaron extensiones de los procedimientos de prueba de
hipótesis para incluir un análisis del error tipo II. En la sección 9.7 se mostró la
forma de calcular la probabilidad de cometer un error tipo II. En la sección 9.8,
cómo determinar el tamaño de la muestra de manera que se controlen tanto la
probabilidad de cometer un error tipo I como un error tipo II.

Hipótesis nula Hipótesis que en una prueba de hipótesis se supone


tentativamente verdadera.

Hipótesis alternativa Hipótesis que se concluye verdadera cuando se


rechaza la hipótesis nula.

Error tipo I El error de rechazar H0 cuando es verdadera.

Error tipo II El error de aceptar H0 cuando es falsa.

Nivel de significancia Probabilidad de cometer un error tipo I cuando la


hipótesis nula es verdadera como igualdad.
Prueba de una cola Prueba de hipótesis en la que debido a un valor del
estadístico de prueba en una de las colas de la distribución muestral se rechaza
la hipótesis nula.

Estadístico de prueba Un estadístico cuyo valor ayuda a determinar si se


rechaza la hipótesis nula.

Valor-p Probabilidad que proporciona una medida de la evidencia, dada por la


muestra, contra la hipótesis nula. Entre menor sea un valor-p, mayor será la
evidencia contra la H0. En una prueba de la cola inferior, el valor-p es la
probabilidad de obtener, para el estadístico de prueba, un valor tan pequeño o
menor que el proporcionado por la muestra. En una prueba de la cola superior,
el valor-p es la probabilidad de obtener, para el estadístico de prueba, un valor
tan grande o mayor que el proporcionado por la muestra. En una prueba de dos
colas, el valor-p es la probabilidad de obtener para el estadístico de prueba un
valor tan poco, o menos, probable que el proporcionado por la muestra.

Valor crítico Un valor que se compara con el estadístico de prueba para


determinar si se rechaza H0. Prueba de dos colas Prueba de hipótesis en la que
se rechaza la hipótesis nula debido a un valor del estadístico de prueba que se
encuentra en cualquiera de las dos colas de la distribución muestral.

Potencia La probabilidad de rechazar adecuadamente H0 cuando es falsa.

Curva de potencias Gráfica que da la probabilidad de rechazar H0 para cada


uno de los posibles valores del parámetro poblacional que no satisfaga la
hipótesis nula. La curva de potencias proporciona las probabilidades de rechazar
correctamente la hipótesis nula.
Capítulo 10. Inferencia estadística acerca de
medias y de proporciones con dos poblaciones

En este capítulo se estudiaron los procedimientos para desarrollar estimaciones


por intervalos y para realizar pruebas de hipótesis cuando se tienen dos
poblaciones. Primero se mostró cómo hacer inferencias acerca de la diferencia
entre dos medias poblacionales con muestras aleatorias simples independientes.
Enseguida se estudió el caso en que las desviaciones poblacionales s1 y s2 se
conocen. Se usó la distribución normal estándar z para obtener una estimación
por intervalo que sirvió como estadístico de prueba en la prueba de hipótesis.
Después se estudió el caso en que las desviaciones estándar poblacionales no se
conocen y se estiman mediante las desviaciones estándar muestrales s1 y s2.

En este caso se usó la distribución t para obtener una estimación por intervalo
que sirvió como estadístico de prueba en la prueba de hipótesis. A continuación
se estudiaron las diferencias entre medias poblacionales con el diseño de
muestras pareadas. En el diseño de muestras pareadas, cada elemento
proporciona un par de datos, uno de cada población, y la diferencia entre los
pares de datos se usa para el análisis estadístico. El diseño de muestras pareadas
se suele preferir al diseño de muestras independientes debido a que con el
diseño de muestras pareadas se suele mejorar la precisión de la estimación. Por
último, se estudiaron los intervalos de estimación y las pruebas de hipótesis para
la diferencia entre dos medias poblacionales.

Supongamos que usted necesita correr un experimento para estimar una media
poblacional o la diferencia entre dos medias. El proceso de recolectar los datos
puede ser muy costoso o lento. Si no se puede recolectar una muestra grande,
los procedimientos de estimación y prueba de los capítulos 8 y 9 no sirven. Este
capítulo introduce algunos procedimientos estadísticos equivalentes que se
pueden usar cuando el tamaño muestral es pequeño. Los procedimientos de
estimación y prueba comprenden estos parámetros ya conocidos:

• Una sola media poblacional, m

• La diferencia entre dos medias poblacionales, (m1  m2)

• Una sola varianza poblacional, s2

• La comparación de dos varianzas poblacionales, s2 1 y s2 2 Las pruebas e


intervalos de confianza de muestra pequeña para proporciones binomiales se
omitirán para nuestro análisis.

Al efectuar un experimento para evaluar un proceso nuevo pero muy costoso


para producir diamantes sintéticos, usted puede estudiar sólo seis diamantes
generados por el proceso. ¿Cómo puede usar estas seis mediciones para hacer
inferencias acerca del peso promedio m de diamantes a partir de este proceso?
Al estudiar la distribución muestral de x en el capítulo 7, hicimos estos
puntos:

• Cuando la población original muestreada sea normal, x y z ( x m)/(s/


__ n ) tienen distribuciones normales, para cualquier tamaño muestral.

• Cuando la población muestreada no sea normal, x , z  (x   m)/(s/  __


n ), y z ( x m)/(s/ __ n ) tienen distribuciones aproximadamente
iguales, si el tamaño muestral es grande. Desafortunadamente, cuando el
tamaño muestral n sea pequeño, el estadístico (x m)/ (s/ __ n ) no tiene
una distribución normal.

Por tanto, todos los valores críticos de z que utilizamos en los capítulos 8 y 9 ya
no son correctos. Por ejemplo, no se puede decir que x se encontrará a no más
de 1.96 errores estándar de m 95% del tiempo. Este problema no es nuevo; fue
estudiado por expertos en estadística y experimentadores a principios del siglo
xx. Para hallar la distribución muestral de esta estadística, hay dos formas de
proceder:

• Use un método empírico. Saque repetidas muestras y calcule (x  m)/(s/ 


__ n ) para cada muestra. La distribución relativa de frecuencia que usted
construya usando estos valores aproximará la forma y ubicación de la
distribución muestral.

• Use un método matemático para deducir la función real de densidad o curva


que describa la distribución muestral.

Capítulo 11. Inferencias acerca de varianzas


poblacionales

En este capítulo se presentaron los procedimientos estadísticos que se usan en


las inferencias acerca de varianzas poblacionales. Se introdujeron dos
distribuciones de probabilidad nuevas: la distribución chi-cuadrada y la
distribución F. La distribución chi-cuadrada se usa en estimación por intervalos
y pruebas de hipótesis para la varianza de una población normal. Se ilustró el
uso de la distribución F en pruebas de hipótesis para las varianzas de dos
poblaciones normales. En particular, se mostró que si se tienen muestras
aleatorias simples independientes de tamaños n1 y n2, tomadas de dos
poblaciones normales que tienen varianzas iguales la distribución muestral de la
razón entre las dos varianzas muestrales tiene una distribución F con n1 1
grados de libertad en el numerador y n2 1 grados de libertad en el denominador.

El análisis de varianza

La forma en que una muestra sea seleccionada se denomina plan de muestreo o


diseño experimental y determina la cantidad de información en la muestra.
Algunas investigaciones comprenden un estudio observacional, en las que el
investigador no produce en realidad los datos sino que sólo observa las
características de datos que ya existen. Casi todos los estudios muestrales, en
donde se reúne información con un cuestionario, caen en esta categoría, el
investigador forma un plan para recolectar los datos, llamado plan de muestreo
y a continuación utiliza los procedimientos estadísticos apropiados para sacar
conclusiones acerca de la población o poblaciones de donde proviene la
muestra. Otra investigación comprende la experimentación.

El investigador puede deliberadamente imponer una o más condiciones


experimentales, en las unidades experimentales, para determinar su efecto en la
respuesta. Veamos ahora algunos términos nuevos que usaremos para discutir el
diseño de un experimento estadístico. Definición Una unidad experimental es el
objeto en el que se toma una medición (o mediciones). Un factor es una variable
independiente cuyos valores son controlados y variados por el experimentador.
Un nivel es el escenario de intensidad de un factor. Un tratamiento es una
combinación específica de niveles de factor. La respuesta es la variable que es
medida por el experimentador.

QUÉ ES UN ANÁLISIS DE VARIANZA?

Las respuestas que se generan en una situación experimental siempre exhiben


cierta cantidad de variabilidad. En un análisis de varianza, se divide la variación
total de las mediciones de respuesta en partes que pueden ser atribuidas a varios
factores de interés para el experimentador. Si el experimento ha sido
debidamente diseñado, estas partes pueden usarse entonces para contestar
preguntas acerca de los efectos de los diversos factores en la respuesta de
interés.

Se puede entender mejor la lógica que sirve de base a un análisis de varianza al


ver un experimento sencillo. Considere dos conjuntos de muestras seleccionadas
al azar de las poblaciones 1 ( ) y 2 ( ), cada uno con pares idénticos de
medias; x1 y x 2. Los dos conjuntos se muestran en la fi gura 11.1. ¿Es más
fácil detectar la diferencia en las dos medias cuando se vea el conjunto A o el
conjunto B? Es probable que esté de acuerdo en que el conjunto A muestra la
diferencia mucho más claramente. En el conjunto A, la variabilidad de las
mediciones dentro de los grupos (los y ) es mucho menor que la
variabilidad entre los dos grupos. En el conjunto B, hay más variabilidad dentro
de los grupos (los  y ), causando que los dos grupos se “mezclen” y hagan
más difícil ver la diferencia idéntica en las medias.

LAS SUPOSICIONES PARA UN ANÁLISIS DE


VARIANZA

Las suposiciones necesarias para un análisis de varianza son semejantes a las


requeridas para las estadísticas t de Student y F del capítulo 10. Cualquiera que
sea el diseño experimental empleado para generar los datos, se debe suponer
que las observaciones dentro de cada grupo de tratamiento están normalmente
distribuidas con una varianza común s2 . Al igual que en el capítulo 10, el
análisis de procedimientos de varianza es más bien robusto cuando los tamaños
muestrales son iguales y cuando los datos son de forma de montículo. Violar la
suposición de una varianza común es más serio, en especial cuando los tamaños
muestrales no son cercanamente iguales.
EL DISEÑO COMPLETAMENTE ALEATORIZADO:
UNA CLASIFICACIÓN EN UNA DIRECCIÓN

Uno de los diseños experimentales más sencillos es el diseño completamente


aleatorizado, en el que muestras aleatorias se seleccionan de manera
independiente de cada una de k poblaciones. Este diseño comprende sólo un
factor, la población de donde proviene la medición, de aquí la designación como
una clasificación en una dirección. Hay k niveles diferentes correspondientes a
las k poblaciones, que también son los tratamientos para esta clasificación de
una dirección.

¿Las k medias poblacionales son todas iguales, o al menos una media es


diferente de las otras? ¿Por qué se necesita un nuevo procedimiento, el análisis
de varianza, para comparar las medias poblacionales cuando ya se tiene
disponible la prueba t de Student? Al comparar k 3 medias, se podría probar
cada uno de los tres pares de hipótesis: H0 : m1 m2 H0 : m1 m3 H0 : m2
m3 para averiguar dónde están las diferencias. No obstante, se debe recordar
que cada prueba que se realice está sujeta a la posibilidad de error. Para
comparar k 4 medias, se necesitarían seis pruebas y se necesitarían 10
pruebas para comparar k 5 medias.

Cuantas más pruebas se realicen en un conjunto de mediciones, más probable


será que al menos una de las conclusiones sea incorrecta. El análisis de
procedimiento de varianza provee una prueba general para juzgar la igualdad de
las k medias poblacionales. Una vez que haya determinado si hay en realidad
una diferencia en las medias, se puede usar otro procedimiento para averiguar
dónde están las diferencias. ¿Cómo se pueden seleccionar estas k muestras
aleatorias? A veces las poblaciones existen en realidad y se puede usar un
generador computarizado de números aleatorios o una tabla de números
aleatorios para seleccionar al azar las muestras. Por ejemplo, en un estudio para
comparar los tamaños promedio de reclamaciones de seguro médico en cuatro
estados diferentes, se podría usar una base de datos computarizada
proporcionada por las compañías de seguros médicos para seleccionar muestras
aleatorias de los cuatro estados. En otras situaciones, las poblaciones pueden ser
hipotéticas y se pueden generar respuestas sólo después de haberse aplicado los
tratamientos experimentales.

CLASIFICACIÓN DE MEDIAS POBLACIONALES

Numerosos experimentos son exploratorios por naturaleza. No hay nociones


preconcebidas de los resultados y no se ha decidido (antes de realizar el
experimento) de hacer comparaciones específicas de tratamiento. En lugar de
esto, se desea clasificar las medias de tratamiento, determinar cuáles medias
difieren e identificar conjuntos de medias para las cuales no hay evidencia de
diferencia.

Una opción podría ser ordenar las medias muestrales de menor a mayor y a
continuación efectuar pruebas t para medias adyacentes en el ordenamiento. Si
dos medias difieren en más de ta/2 __________ s 2 __1 n1 __1 n2 se
concluye que el par de medias poblacionales difi ere. El problema con este
procedimiento es que la probabilidad de hacer un error tipo I, es decir, concluir
que dos medias difieren cuando en realidad son iguales, es a para cada prueba.
Si se compara un gran número de pares de medias, la probabilidad de detectar al
menos una diferencia en medias, cuando en realidad ninguna existe, es bastante
grande. Una forma sencilla de evitar el alto riesgo de declarar diferencias
cuando no existen es usar el rango de Student, que es la diferencia entre la más
pequeña y la más grande en un conjunto de k medias muestrales, como la
medida para determinar si hay una diferencia en un par de medias
poblacionales. Este método, a veces método de Tukey para comparaciones
apareadas, hace que sea igual a la probabilidad de declarar que existe una
diferencia entre al menos un par en un conjunto de k medias de trata miento,
cuando no existe diferencia. El método de Tukey para hacer comparaciones
apareadas está basado en el análisis usual de suposiciones de varianza. Además,
supone que las medias muestrales son independientes y están basadas en
muestras de igual tamaño. La medida que determina si existe una diferencia
entre un par de medias de tratamiento es la cantidad v (omega minúscula).

También podría gustarte