Está en la página 1de 22

Presentación

Unidad 6: PRUEBA DE HIPOTESIS.

Nombre: Warren Rodríguez

Matricula: 100443949

Materia: Estadística industrial 2

Profesor: Joel Patiño

Semestre: 2019-20

Sección: 3
Prueba de hipótesis
Es un procedimiento, con el que se busca tomar una decisión sobre el valor
de verdad de una hipótesis estadística. Al realizar una prueba de hipótesis
decidimos si rechazar o no rechazar esa hipótesis estadística. Basamos la
decisión en la evidencia muestral.

Hipótesis estadística 
Es una proposición o supuesto sobre los parámetros de una o más
poblaciones. Son la transformación de las hipótesis de investigación, nulas y
alternativas en símbolos estadísticos.

Hipótesis nula (H0)


La hipótesis nula indica que un parámetro de población (tal como la media, la
desviación estándar, etc.) es igual a un valor hipotético. La hipótesis nula
suele ser una afirmación inicial que se basa en análisis previos o en
conocimiento especializado.
Hipótesis alternativa (H1)
La hipótesis alternativa indica que un parámetro de población es más
pequeño, más grande o diferente del valor hipotético de la hipótesis nula. La
hipótesis alternativa es lo que usted podría pensar que es cierto o espera
probar que es cierto.

EJEMPLO: Un fabricante de galletitas produce paquetes en los cuales el peso


nominal impreso es de 500 gramos. Pero el contenido real en gramos es una
variable aleatoria. No tienen exactamente 500 gramos todos los paquetes. El
fabricante, basándose en información histórica, afirma que la media de esa
variable X es μ=500 gramos con un desvío estándar de 55 gramos. Se
desconfía de la afirmación del fabricante acerca de que μ=500 gramos. Se
quiere analizar si en realidad el peso promedio de los paquetes es inferior
a 500 gramos.
--Las hipótesis en juego

Las dos afirmaciones que se contraponen en esta situación son:

 Afirmación del fabricante, que llamaremos hipótesis nula: la media


de X} es 500: μ=500
 Afirmación alternativa: Hipótesis alternativa: la media de X es menor
que 500: μ<500

Errores
Error de tipo I
Si usted rechaza la hipótesis nula cuando es verdadera, comete un
error de tipo I. La probabilidad de cometer un error de tipo I es α, que
es el nivel de significancia que usted establece para su prueba de
hipótesis. Un α de 0.05 indica que usted está dispuesto a aceptar una
probabilidad de 5% de estar equivocado al rechazar la hipótesis nula.
Para reducir este riesgo, debe utilizar un valor menor para α. Sin
embargo, usar un valor menor para alfa significa que usted tendrá
menos probabilidad de detectar una diferencia si esta realmente
existe.

Error de tipo II
Cuando la hipótesis nula es falsa y usted no la rechaza, comete un
error de tipo II. La probabilidad de cometer un error de tipo II es β, que
depende de la potencia de la prueba. Puede reducir el riesgo de
cometer un error de tipo II al asegurarse de que la prueba tenga
suficiente potencia. Para ello, asegúrese de que el tamaño de la
muestra sea lo suficientemente grande como para detectar una
diferencia práctica cuando esta realmente exista.
La probabilidad de rechazar la hipótesis nula cuando es falsa es igual a 1–
β. Este valor es la potencia de la prueba.
Ejemplo de error de tipo I y tipo II
Para entender la interrelación entre los errores de tipo I y tipo II, y para
determinar cuál error tiene consecuencias más graves para su situación,
considere el siguiente ejemplo.

Un investigador médico desea comparar la efectividad de dos medicamentos.


Las hipótesis nula y alternativa son:

Hipótesis nula (H0): μ1= μ2

Los dos medicamentos tienen la misma eficacia.

Hipótesis alternativa (H1): μ1≠ μ2

Los dos medicamentos no tienen la misma eficacia.

Un error de tipo I se produce si el investigador rechaza la hipótesis nula y


concluye que los dos medicamentos son diferentes cuando, en realidad, no lo
son. Si los medicamentos tienen la misma eficacia, el investigador podría
considerar que este error no es muy grave, porque de todos modos los
pacientes se beneficiarían con el mismo nivel de eficacia
independientemente del medicamento que tomen. Sin embargo, si se
produce un error de tipo II, el investigador no rechaza la hipótesis nula
cuando debe rechazarla. Es decir, el investigador concluye que los
medicamentos son iguales cuando en realidad son diferentes. Este error
puede poner en riesgo la vida de los pacientes si se pone en venta el
medicamento menos efectivo en lugar del medicamento más efectivo.

Cuando realice las pruebas de hipótesis, considere los riesgos de cometer


errores de tipo I y tipo II. Si las consecuencias de cometer un tipo de error
son más graves o costosas que cometer el otro tipo de error, entonces elija
un nivel de significancia y una potencia para la prueba que reflejen la
gravedad relativa de esas consecuencias.
Pasos para realizar prueba estadística
1. Especificar las hipótesis.
2. Elegir un nivel de significancia (también denominado alfa o α).

El cuál es el nivel de error que existe de equivocarse

3. Determinar la potencia y el tamaño de la muestra para la prueba.


4. Recolectar los datos.
5. Comparar el valor p de la prueba con el nivel de significancia.
6. Decidir si rechazar o no rechazar la hipótesis nula.
Prueba medias de una muestra
Se utiliza una prueba de una muestra para probar una afirmación con
respecto a una media de una población única.

Nota: Se considera práctico utilizar la distribución t solamente cuando se


requiera que el tamaño de la muestra sea menor de 30, ya que para
muestras más grandes los valores t y z son aproximadamente iguales, y es
posible emplear la distribución normal en lugar de la distribución t.

Ejemplos ilustrativos:
1) La duración media de una muestra de 300 focos producidos por una
compañía resulta ser de 1620 horas.
Como se tiene como dato el tamaño de la población se tiene que verificar si
cumple con la condición para utilizar el factor finito de corrección.
2) La duración media de lámparas producidas por una compañía han sido en
el pasado de 1120 horas. Una muestra de 8 lámparas de la producción actual
dio una duración media de 1070 horas con una desviación típica de 125
horas.
Prueba de proporciones de una muestra
Cuando el objetivo del muestreo es evaluar la validez de una afirmación con
respecto a la proporción de una población, es adecuado utilizar una prueba
de una muestra. La metodología de prueba depende de si el número de
observaciones de la muestra es grande o pequeño.
Como se habrá observado anteriormente, las pruebas de grandes muestras
de medias y proporciones son bastante semejantes. De este modo, los
valoresestadísticos de prueba miden la desviación de un valor estadístico de
muestra a partir de un valor propuesto. Y ambas pruebas se basan en la
distribución normal estándar para valores críticos. Quizá la única diferencia
real entre las ambas radica en la forma corno se obtiene la desviación
estándar de la distribución de muestreo.
Esta prueba comprende el cálculo del valor estadístico de prueba Z

Ejemplo ilustrativo
En un estudio se afirma que 3 de 10 estudiantes universitarios trabajan.
Pruebe esta aseveración, a un nivel de significación de 0,025, respecto a la
alternativa de que la proporción real de los estudiantes universitarios
trabajan es mayor de lo que se afirma, si una muestra aleatoria de 600
estudiantes universitarios revela que 200 de ellos trabajan. La muestra fue
tomada de 10000 estudiantes.
Los datos son:

Como en los datos aparece el tamaño de la población, se debe verificar si el


tamaño de la nuestra es mayor que el 5%. Se remplaza valores en la siguiente
fórmula:
Posteriormente este valor es comparado con el valor de Z, obtenido a partir
de una tabla normal a un nivel de significación seleccionado.
Como ocurrió con la prueba de medias de una muestra, las pruebas de
proporciones pueden ser de una o dos colas.

Prueba medias de dos muestras


Las pruebas de dos muestras se utilizan para decidir si las medias de dos
poblaciones son iguales. Se requieren dos muestras independientes, una de
cada una de las dos poblaciones. Considérese, por ejemplo, una compañía
investigadora que experimentan con dos diferentes mezclas de pintura, para
ver si se puede modificar el tiempo de secado de una pintura para uso
doméstico. Cada mezcla es probada un determinado número de veces, y
comparados posteriormente los tiempos medios de secado de las dos
muestras. Una parece ser superior, ya que su tiempo medio de secado
(muestra) es 30 minutos menor que el de la otra muestra.
Pero, ¿son realmente diferentes los tiempos medios de secado de las dos
pinturas, o esta diferencia muestral es nada más la variación aleatoria que se
espera, aun cuando las dos fórmulas presentan idénticos tiempos medios de
secado? Una vez más, las diferencias casuales se deben distinguir de las
diferencias reales.
Con frecuencia se utilizan pruebas de dos muestras para comparar
dos métodos de enseñanza, dos marcas, dos ciudades, dos distritos escolares
y otras cosas semejantes.
La hipótesis nula puede establecer que las dos poblaciones tienen medias
iguales:
Para tamaños más pequeños de muestra, Z estará distribuida normalmente
sólo si las dos poblaciones que se muestrean también lo están.

Ejemplo ilustrativo
La media de las calificaciones de dos muestras de 15 estudiantes de primer
semestre en la asignatura de Estadística de la universidad UTN resulta ser de
7 y 8,5. Se sabe que la desviación típica de las calificaciones en esta
asignatura fue en el pasado de 1,5.

Prueba de proporciones de dos muestras


El objetivo de una prueba de dos muestras es determinar si las dos muestras
independientes fueron tomadas de dos poblaciones, las cuales presentan la
misma proporción de elementos con determinada característica. La prueba
se concentra en la diferencia relativa (diferencia dividida entre la desviación
estándar de la distribución de muestreo) entre las dos proporciones
muestrales. Diferencias pequeñas denotan únicamente la variación
casual productodel muestreo (se acepta H0), en tanto que grandes
diferencias significan lo contrario (se rechaza H0). El valor estadístico de
prueba (diferencia relativa) es comparado con un valor tabular de la
distribución normal, a fin de decidir si H0 es aceptada o rechazada. Una vez
más, esta prueba se asemeja considerablemente a la prueba de medias de
dos muestras.
La hipótesis nula en una prueba de dos muestras es

Ejemplo ilustrativo
Se ponen a prueba la enseñanza de la Estadística empleando Excel y
Winstats. Para determinar si los estudiantes difieren en términos de estar a
favor de la nueva enseñanza se toma una muestra de 20 estudiantes de dos
paralelos. De paralelo A 18 están a favor, en tanto que del paralelo B están a
favor 14. ¿Es posible concluir con un nivel de significación de 0,05 que los
estudiantes que están a favor de la nueva enseñanza de la Estadística es la
misma en los dos paralelos?.
Los datos son:

Las hipótesis son

Calculando la proporción muestral se obtiene:


La Distribución T
En probabilidad y estadística, la distribución t (de Student) es
una distribución de probabilidad que surge del problema
de estimar la media de una población normalmente distribuida cuando
el tamaño de la muestra es pequeño.
Aparece de manera natural al realizar la prueba t de Student para la
determinación de las diferencias entre dos varianzas muestrales y para la
construcción del intervalo de confianza para la diferencia entre las partes de
dos poblaciones cuando se desconoce la desviación típica de una población y
esta debe ser estimada a partir de los datos de una muestra.
Fue desarrollada por William Sealy Gosset, bajo el seudónimo Student.

Caracterización
La distribución t de Student es la distribución de probabilidad del cociente:

Donde:

 Z es una variable aleatoria distribuida según una normal típica (de


media nula y varianza 1).
 V es una variable continua que sigue una distribución χ² con v grados
de libertad.
 Z y V son independientes

Si μ es una constante no nula, el cociente  es una variable aleatoria


que sigue la distribución t de Student no central con parámetro de no-
centralidad .

En estadística, una prueba t de Student, prueba t de estudiante, o Test-T es


cualquier prueba en la que el estadístico utilizado tiene una distribución t de
Student si la hipótesis nula es cierta. Se aplica cuando la población estudiada
sigue una distribución normal pero el tamaño muestral es demasiado
pequeño como para que el estadístico en el que está basada la inferencia
esté normalmente distribuido, utilizándose una estimación de la desviación
típica en lugar del valor real. Es utilizado en análisis discriminante.
Prueba acerca de una media cuando la desviación estándar
es desconocida y la muestra de población es pequeña

Prueba para la media de la población: muestra pequeña, desviación estándar


poblacional desconocida. El estadístico de la prueba es la distribución t. El
estadístico de la prueba para el caso de una muestra es: 

La tasa de producción de los fusibles de 5 amperios en Neary Co. eléctrico es


250 por hora. Se ha comprado e instalado una máquina nueva que, según el
proveedor, aumentará la tarifa de la producción. Una muestra de 10 horas
seleccionadas al azar a partir del mes pasado reveló que la producción cada
hora en la máquina nueva era 256 unidades, con una desviación estándar de
6 por hora. ¿En el nivel de significancia del .05. Neary puede concluir que la
máquina nueva es más rápida?

Ejemplo

Paso 1: Establezca la hipótesis nula y la hipótesis alternativa. H 0 : µ <= 250; H


1 : µ > 250

Paso 2: Seleccione el nivel de significancia. Es .05.

Paso 3: Encuentre un estadístico de prueba. Es la distribución t porque la


desviación estándar de la población no se conoce y el tamaño de muestra es
menos de 30.
Paso 4: Indique la regla de la decisión. Hay 10 - 1 = 9 grados de libertad. Se
rechaza la hipótesis nula si t > 1.833

Paso 5: Tome una decisión e interprete los resultados. Se rechaza la hipótesis


nula. El número producido es más de 250 por hora.

Distribución Chi-cuadrada
La distribución de chi-cuadrada es una distribución continua que se especifica
por los grados de libertad y el parámetro de no centralidad. La distribución es
positivamente asimétrica, pero la asimetría disminuye al aumentar los grados
de libertad.

-Se puede utilizar para:

 Comprobar qué tan bien se ajusta una muestra a una distribución


teórica. Por ejemplo, puede utilizar una prueba de bondad de ajuste de chi-
cuadrada para determinar si los datos de la muestra se ajustan a una
distribución de Poisson.
 Comprobar la independencia de las variables categóricas. Por ejemplo,
un fabricante desea saber si la ocurrencia de cuatro tipos de defectos
(espárrago faltante, abrazadera rota, sujetador flojo y sello con fugas) está
relacionada con los turnos (diurno, vespertino, nocturno).
Cuando los grados de libertad son 30 o más, la distribución de Chi-cuadrada
puede aproximarse razonablemente con una distribución normal.

Características:
 Su función de densidad es:
donde r es la función gamma.
 Su función de distribución es

Donde    es la función gamma incompleta.


El valor esperado y la varianza de una variable aleatoria X con distribución
χ² son, respectivamente, k y 2k.

Ajuste de Bondad

La bondad de ajuste de un modelo estadístico describe lo bien que se ajusta


un conjunto de observaciones. Las medidas de bondad en general resumen la
discrepancia entre los valores observados y los valores esperados en el
modelo de estudio. Tales medidas se pueden emplear en el contraste de
hipótesis. Por ej: el test de normalidad de los residuos, comprobar si dos
muestras se obtienen a partir de dos distribuciones idénticas (ver test de
Kolmogorov-Smirnov), o si las frecuencias siguen una distribución específica

 
Frecuencias Esperadas Iguales y desiguales
La prueba chi cuadrado consiste en la comparación entre la frecuencia
observada en un intervalo de clase y la frecuencia esperada en dicho
intervalo, calculada de acuerdo con la hipótesis nula formulada. Es decir, se
quiere determinar si las frecuencias observadas en la muestra están lo
suficientemente cerca de las frecuencias esperadas bajo la hipótesis nula.
Para realizar el cálculo de ji cuadrada se siguen los siguientes pasos:

-Determinar las diferencias entre fo y fe. La suma de estas diferencias es


cero.
- Elevar al cuadrado cada una de las diferencias observadas entre fo y fe. Esto
es (fo - fe)2

- Dividir los resultados de la columna 2 entre la frecuencia esperada y sumar


estos valores. La suma es el valor de ji cuadrada.

Frecuencias esperadas iguales


La prueba de bondad de ajuste se dice que es una de las pruebas no
paramétricas más utilizadas. Esta prueba se puede usar para datos de
cualquier nivel. Este tipo de pruebas se utilizan para ver que tan bien se
ajusta un conjunto de datos observados a un conjunto de datos esperados.

Si no hay una diferencia significativa entre las frecuencias observadas y las


frecuencias esperadas, se supondría que las frecuencias observadas fueran
iguales o aproximadamente iguales.
En este caso cualquier diferencia observada entre el conjunto de frecuencias
observadas y esperadas, podría atribuirse al muestreo o a la casualidad.

Frecuencias esperadas diferentes

La prueba de ji cuadrada se puede usar cuando las frecuencias esperadas no


son iguales. Es decir en el caso de que existan una diferencia entre una
frecuencia observada y una frecuencia esperada.

También podría gustarte