Está en la página 1de 18

Tecnológico Nacional de México

Instituto Tecnológico de Mérida


Ingeniería Industrial

Materia: Estadística inferencial i


Profesor: Ing. Luis Eduardo Basto Aguilar
Tema 1
Distribuciones fundamentales de muestreo
Grupo: 3I1

MATRICULAS NOMBRES

1. E19081297 1. Ku Canul Saúl Emmanuel

2. E19081288 2. Pech Dzul Luis Fernando

3. E19081308 3. Pérez Jardón Cesar de Jesús

4. E19081290 4. Romero Chuc Cielo Saraí

Mérida, Yucatán. miércoles, 28


de octubre de 2020

1
3. prueba de hipótesis
3.1 introducción
Para esta unidad es clave tener en cuenta de una prueba de hipótesis es un procedimiento
estadístico que nos permite poner a prueba si una afirmación sobre un parámetro poblacional
puede considerarse verdadera o no, con base en los datos que aporte una muestra de dicha
población.

Este es uno de los aspectos más útiles de la inferencia estadística, puesto que muchos tipos
de problemas de toma de decisiones, pruebas o experimentos en el mundo de la ingeniería,
pueden formularse como problemas de prueba de hipótesis.

Una hipótesis estadística es una proposición o supuesto sobre los parámetros de una o más
poblaciones.

En el siguiente trabajo presentamos las operaciones que debemos de llevar acabo para comprobar
afirmaciones en ciertos casos.

2
Índice
3.2 Confiabilidad y significancia……………………………………………………………4
3.3 Errores tipo l y tipo ll …………………………………………………………………..…4
3.4 Procedimiento de una prueba de hipótesis ……………………………………7
3.5 Prueba de hipótesis para la media con σ conocida…………………………8
3.6 Prueba de hipótesis para la media con σ desconocida……………………9
3.7 Prueba de hipótesis para la diferencia de medias …………………………10
3.8 Prueba de hipótesis para la proporción………………………………………..12
3.9 Prueba de hipótesis para la varianza…………………………………………….14
3.10 Prueba de hipótesis para la relación de varianza…………………………15
Conclusión ………………………………………………………………………………….…………17
Referencias …………………………………………………………………………………………..17

3
3.2 Confiabilidad y significancia
Prueba de Hipótesis

Denominada también prueba de significación, tiene como objetivo principal evaluar


suposiciones o afirmaciones acerca de los valores estadísticos de la población,
denominados parámetros.

La palabra docimar significa probar, cuando se hace indispensable tomar una decisión sobre
la validez de la representación de una población, con base en los resultados obtenidos a
través de una muestra, se dicen que se toman decisiones estadísticas. Para tomar una
decisión es necesario, ante todo plantear posibilidades acerca de la característica o
características a estudiar en una población determinada. La suposición puede ser cierta o
falsa. Estas suposiciones se llaman hipótesis estadísticas.

Hipótesis Estadística:

Es un supuesto acerca de un parámetro o de algún valor estadístico de una población.

Con esta definición encontramos que no todas las hipótesis son hipótesis estadísticas. Se
debe tomar con referencia a un parámetro, ya sea una media aritmética, una proporción
(porcentaje) o varianza para que sea hipótesis estadística.

Una hipótesis estadística también puede considerarse, como la afirmación de una


característica ideal de una población sobre la cual hay inseguridad en el momento de
formularla y que, a la vez, es expresada de tal forma que puede ser realizada.

3.3 Errores tipo l y tipo ll


El procedimiento anterior puede llevarnos a una de dos conclusiones erróneas:

Error Tipo I.- Se rechaza H0 cuando ésta es verdadera

Error Tipo II.- Se acepta H0 cuando ésta es falsa

En el ejemplo se cometerá un error de tipo I cuando µ =50, pero x para la muestra


considerada cae en la región crítica.

4
Y se cometerá un error de tipo II cuando µ ≠ 50 pero x para la muestra considerada cae en

la región de aceptación.

ERROR TIPO I

A la probabilidad de cometer un error de Tipo I se denota por a, y se le llama el nivel o


tamaño de significancia de la prueba, es decir

a = P(error Tipo I) = P(rechazar H0 | H0 es verdadera)

Ejemplo: Calcular a para el ejemplo de la rapidez de combustión para una muestra de N=10
datos, suponiendo que la desviación estándar de la rapidez de combustión es Ϭ=2.5 cm/seg.

Solución: en este caso a = P(x caiga en la región crítica | µ=50), es decir:

a = P(x < 48.5) + P(x > 51.5)

Recordando que La distribución de x es Normal con media µ=50 y desviación estándar s/ √N


=0.79, por lo tanto, usando Matlab:

a = normcdf(48.5,50,0.79) + (1-normcdf(51.5,50,0.79))

= 0.288+ 0.288 = 0.0576

Esto significa que el 5.76% de las muestras de tamaño 10 conducirán al rechazo de la


Hipótesis H0: µ=50 cm/seg, cuando ésta es verdadera.

Es claro que a se puede reducir de dos maneras:

 Aumentando la región de aceptación


 Aumentando el tamaño de la muestra

Ejemplo: recalcular a del ejemplo anterior para a) los nuevos límites de la región de
aceptación 48 y 52. b) Para N=16 con los límites originales c) con ambas modificaciones

Solución:

a) a = normcdf(48,50,0.79) + (1-normcdf(52,50,0.79)) = 0.0114

b) a = normcdf(48.5,50,0.625)+(1-normcdf(51.5,50,0.625)) = 0.0164

5
c) a = normcdf(48,50,0.625)+(1-normcdf(52,50,0.625)) = 0.0014

ERROR TIPO II

Para evaluar un experimento de prueba de hipótesis también se requiere calcular la


probabilidad del error de Tipo II, denotada por β, es decir

β = P(error Tipo II) = P(aceptar H0 | H0 es falsa)

Sin embargo, no es posible calcular β si no se tiene una hipótesis alternativa específica, es


decir, un valor particular del parámetro bajo prueba en lugar de un rango de valores.

Por ejemplo, supongamos que es importante rechazar H0 si la rapidez promedio de


combustión µ es mayor que 52 cm/seg o menor que 48 cm/seg. Dada la simetría sólo se

requiere evaluar la probabilidad de aceptar H0: µ=50 cuando el valor verdadero es µ=52.

De acuerdo a la figura: β = P(48.5 ≤ x ≤ 51.5 | µ=52)

Usando Matlab:

Β = normcdf(51.5,52,0.79) - normcdf(48.5,52,0.79) = 0.2643

La probabilidad de obtener un error de tipo II aumenta muy rápido a medida que el valor
verdadero m tiende al valor hipotético, por ejemplo, si suponemos que µ=50.5, y
recalculamos β, obtenemos.

Usando Matlab:

β = normcdf(51.5,50.5,0.79) - normcdf(48.5,50.5,0.79) = 0.8923

β también depende del tamaño de la muestra, por ejemplo, si N=16 obtenemos en el


ejemplo cuando µ=52: Ϭ=0.625, por lo tanto.

β = normcdf(51.5,52,0.625) - normcdf(48.5,52,0.625) = 0.2119

6
Es decir, β disminuye cuando N aumenta, excepto si el valor real de µ está muy cerca del
hipotético.

3.4 Procedimiento de una prueba de hipótesis


1. Especificar las hipótesis.

En primer lugar, el gerente formula las hipótesis. La hipótesis nula es: la media de la
población de todos los tubos es igual a 5 cm. Formalmente, esto se escribe como: H0: μ = 5

Luego, el gerente elige entre las siguientes hipótesis alternativas:

CONDICIÓN QUE SE PROBARÁ HIPÓTESIS ALTERNATIVA


LA MEDIA DE LA POBLACIÓN ES MENOR unilateral: μ < 5
QUE EL OBJETIVO.
LA MEDIA DE LA POBLACIÓN ES MAYOR unilateral: μ > 5
QUE EL OBJETIVO.
LA MEDIA DE LA POBLACIÓN ES DIFERENTE bilateral: μ ≠ 5
DEL OBJETIVO.

Como tiene que asegurarse de que los tubos no sean más grandes ni más pequeños de 5
cm, el gerente elige la hipótesis alternativa bilateral, que indica que la media de la población
de todos los tubos no es igual a 5 cm. Formalmente, esto se escribe como H1: μ ≠ 5

2. Elegir un nivel de significancia (también denominado alfa o α).

El gerente selecciona un nivel de significancia de 0.05, que es el nivel de significancia más


utilizado.

3. Determinar la potencia y el tamaño de la muestra para la prueba.

El gerente utiliza un cálculo de potencia y tamaño de la muestra para determinar cuántos


tubos tiene que medir para tener una buena probabilidad de detectar una diferencia de 0.1
cm o más con respecto al diámetro objetivo.

4. Recolectar los datos.

Recoge una muestra de tubos y mide los diámetros.

5. Comparar el valor p de la prueba con el nivel de significancia.

Después de realizar la prueba de hipótesis, el gerente obtiene un valor p de 0.004. El valor


p es menor que el nivel de significancia de 0.05.

7
6. Decidir si rechazar o no rechazar la hipótesis nula.

El gerente rechaza la hipótesis nula y concluye que el diámetro medio de todos los tubos no
es igual a 5 cm.

3.5 Prueba de hipótesis para la media con σ conocida


En este caso se trabajará la distribución normal y la fórmula matemática que me permitirá
aceptar o rechazar la hipótesis nula será la que cumpla con los siguientes términos.

Supongamos que tenemos las hipótesis

H0: =0 Contra H1:  0

Donde 0 es una constante especifica. Se tomara una muestra aleatoria X1, X2,…, Xn de la
población.

Si H0: =0 es verdadera, entonces, por lo tanto el estadístico o la fórmula para


la hipótesis para la media conocida seria la siguiente:

Se establecerá, según el tipo de prueba


(unilateral o bilateral), un nivel de significancia;
si por ejemplo es unilateral derecha se tendría
la siguiente gráfica que se presenta.

Problema resuelto:

La estatura promedio de los estudiantes varones en el primer semestre de cierta


universidad es de 172 cm, con una desviación estándar de 9 cm. ¿Hay alguna razón para
creer que hay algún cambio en la estatura promedio, si una muestra de 65 estudiantes en
el grupo actual de primer semestre tiene una altura promedio de 175 cm? Utilice un nivel
de significancia de 0,05.

La formulación de la hipótesis será:

 H0=172
 H1>172

El nivel de significancia: α=0,05 Z = 1.645

8
La región crítica estará representada en la S. Grafica:

Aplicando la formula
175 − 173
𝒁= = 2.69
9/√65

Respuesta: Como Z = 2.69 supera a Z = 1.645 si hay motivos para creer que en el grupo de
primer semestre la estatura promedio ha sufrido un cambio debido a un aumento en la
estatura promedio. De modo que la hipótesis nula se rechaza-

3.6 Prueba de hipótesis para la media con σ desconocida


Si se tiene una variable aleatoria que representa una distribución normal con μ y σ
desconocidas, entonces la variable aleatoria tiene una distribución t de student con n-1
grados de libertad.

La estructura es igual que la anterior, excepto que el valor de σ se reemplaza por la


desviación estándar muestral s y la distribución normal estándar se sustituye con la
distribución t. El estadístico a emplear es:

Si se formula una hipótesis bilateral, el gráfico seria de la siguiente, manera.

Problema resuelto:

Un fabricante de pinturas afirma que el tiempo medio de secado de uno de sus productos,
bajo ciertas condiciones de temperatura exterior y superficie a aplicar es de 2 horas. Para
verificar o rechazar dicha afirmación, se toma una muestra aleatoria de 10 especímenes
bajo las condiciones que especifica el fabricante. Los resultados de los tiempos fueron:

Xi 2,3 2,5 3,2 1,8 1,9 3,2 2,8 2,5 2,6 1,7

9
Con un nivel de significancia de 0,05 de la evidencia tomada, ¿Se puede afirmar que el
tiempo de secado de la pintura es mayor?

La formulación de la hipótesis Grados de libertad (t 0.05, 9) = 1.933 (V.C)

 H0=2horas
 H1>2horas

De la muestra se tiene


 S = 0.536
 N = 10

Aplicando la formula
2.45 − 2
𝒕= = 2.66
0.536/√10

Respuesta: Como el estadístico es mayor que el valor crítico, se puede concluir que el
tiempo medio de secado es mayor a 2 horas, por consiguiente la hipótesis nula es
rechazada.

3.7 Prueba de hipótesis para la diferencia de medias


Varianza conocida

Si se tienen dos muestras aleatorias independientes de tamaño n1 y n2, de dos poblaciones


con medias y varianzas, la variable aleatoria tiene una distribución normal estándar con n1
y n2, suficientemente grande. El estadístico es corresponde a las siguientes
interpretaciones.

Supongamos que tenemos dos variables aleatorias independientes normalmente


distribuidas:

Sean además:

10
El interés recae en probar que es un valor fijado, por ejemplo si
entonces se querrá probar que es decir las medias son iguales por lo cual
la fórmula que le corresponde se consignara de la siguiente manera.

Varianza desconocida

En la práctica, las varianzas poblacionales generalmente no se conocen, motivo por el cual


si se tienen dos poblaciones que se comportan de forma aproximadamente normal y se
asume que la variabilidad entre ambos grupos es similar, se puede utilizar la prueba t
combinada (prueba t de dos muestras).

El estadístico de prueba corresponde a los siguientes requerimientos, debido a que


comprende una serie de fórmulas que ayudan en la resolución de problemas.

Las formulas son las siguientes.


(𝑥1 − 𝑥2) − (𝜇1 − 𝜇2)
𝑡=
1 1
𝑆𝑝 ∗ √𝑛 + 𝑛2

(𝑛2 − 1)𝑠22
𝑫𝒐𝒏𝒅𝒆: 𝑆 2 𝑝 = (𝑛1 − 1)𝑠12 + 𝑉 = 𝑛1 + 𝑛2 − 2 Grados de Libertad
𝑛1 + 𝑛2 − 2
Ejercicio resuelto:

Un ingeniero químico está interesado en reducir el tiempo de secado de una pintura tapa
poros. Se prueban dos fórmulas de pintura: la fórmula 1 tiene el contenido químico
estándar y la fórmula 2 tiene un nuevo ingrediente secante que debe reducir el tiempo de
secado. De la experiencia se sabe que la desviación estándar del tiempo de secado es diez
minutos y esta variabilidad inherente no debe verse afectada por la adición del nuevo
ingrediente. Se pintan diez especímenes con la fórmula 1 y quince con la fórmula 2. Los dos
tiempos promedio de secado muéstrales son 121 min y 112 min, respectivamente. ¿A qué
conclusiones puede llegar el diseñador del producto sobre la eficacia del nuevo ingrediente,
utilizando un nivel de significancia de 0,05?

La formulación de la hipótesis:

 H0:μ1-μ2=0
 H1:μ1-μ2>0

11
Obtenemos que 𝑍 = 0.05, Z = 1 645

Es una prueba unilateral derecha puesto

que se busca rechazar H0

Con los datos del problema obtenemos que:

 1 = 10, n1 = 10
 2 = 10, n2 = 15

Aplicando la formulan:
(121 − 112) − (0)
𝑍= = 2.20
102 102
√(
10 + 15 )

Respuesta: Como el estadístico dio mayor que el valor crítico, con la evidencia tomada se
puede afirmar que el tiempo medio de secado es menor con la fórmula

3.8 Prueba de hipótesis para la proporción


Para elaborar una prueba de hipótesis para la proporción, se sigue el mismo procedimiento
que para la prueba de hipótesis de la media. Debemos recordar que la distribución binomial,
es la distribución teóricamente correcta que debe usarse para las proporciones, pues los
datos son discretos. A medida que aumenta el tamaño de la muestra, la distribución
binomial se acerca a la distribución normal en sus características y podemos aplicar esta
última para aproximar la distribución de muestreo. En resumen, np y nq necesitan cada una
ser por lo menos 5 para que se pueda utilizar la distribución normal de probabilidad en
sustitución de la binomial.

En este caso se utiliza la siguiente prueba estadística adecuada:

12
Ejercicio resuelto:

Un fabricante de blusas para dama cree que su marca se vende en 19% de las tiendas de
ropa para mujer del centro de la ciudad de México. Recientemente tomo una muestra de
85 de esas tiendas y encontró que únicamente el 14.12% venden su marca. Con un nivel de
significancia del 4% ¿Se podría concluir que ha disminuido la presencia de su marca en esa
parte de la ciudad?

Se desea probar una proporción poblacional y np es mayor a 5, por lo tanto, se puede


utilizar la distribución normal, la hipótesis de trabajo es demostrar si ha disminuido la
presencia de la marca en una región, se debe aplicar una prueba de un extremo a la
izquierda.

𝜋 = 19% de las tiendas venden la marca

DATOS:

n = 85

p = .1412

α = 0.04

13
El valor de Zc se encuentra en área de aceptación, por lo tanto, la decisión es aceptar H0.

Conclusión: Se encontró evidencia estadística con un α = 0.04 que el 19% de las tiendas de
ropa para Dama en el centro de Ciudad de México venden la marca del fabricante, por lo
que se puede concluir que no ha disminuido su presencia en la zona.

3.9 Prueba de hipótesis para la varianza


Si se extrae una muestra aleatoria de tamaño n de una población normal con media µ y
varianza σ2, y se calcula la varianza muestral, se obtiene el valor del estadístico s2 que se
utilizará para conocer la σ2, mediante una variable aleatoria chi cuadrada con “n-1” grados
de libertad. Formalizando con el siguiente teorema: si s2 es la varianza de una muestra
aleatoria de tamaño “n” que se toma de una población normal que tiene varianza σ2,
entonces el estadístico:

(𝑛 − 1)𝑆 2
𝑋2 =
𝜎2
n = tamaño de la muestra.

𝑆 2 = varianza de la muestra.

𝜎 2 = varianza hipotética de la población.

Ejercicio resuelto:

La St. Louis Metro Bus Company de Estados Unidos, desea dar una imagen de confiabilidad
haciendo que sus conductores sean puntuales en los horarios de llegada a las paradas. La
empresa desea que haya poca variabilidad en dichos tiempos. En términos de la varianza
de los tiempos de llegada de las paradas, la empresa desea que la varianza sea de 4 minutos
o menos. Esta prueba de hipótesis se realiza con un nivel de significancia de α = 0.05.

Asuma que en una muestra aleatoria de 24 llegadas a cierta parada en una intersección en
el centro de la ciudad, la varianza muestral encontrada es 𝑆 2 =4.9

14
Nivel de significancia de α = 0.05, como la prueba es de una sola cola (la del lado derecho),
se considera una distribución 𝑋 2 .

 Grados de libertad = n-1= 24 – 1 = 23 (renglones de tabla).


 Probabilidad: nivel de significancia α = 0.05 (columnas de tabla).
 Buscando estos valores en la tabla tenemos que 𝑋 2 𝐶 = 35.172.

Si el estadístico de prueba es menor que el valor crítico, se rechaza H0, de manera contraria
se acepta. Por lo tanto, para esta prueba, tenemos que: 28.18 < 35.172, se rechaza H0.

Conclusión: existe evidencia suficiente para rechazar H0, en tal caso habrá que tomar
medidas para reducir la varianza poblacional.

3.10 Prueba de hipótesis para la relación de varianza


Sean X1, X2, …, Xn1 una muestra aleatoria extraída de una población normal con varianza
𝜎 2 sub>1; del mismo modo sea Y1, Y2, …, Yn2 otra muestra aleatoria extraída de una
población normal con varianza σ22. Si s21 y s22 son las varianzas de la primera y segunda
muestra, respectivamente, podemos afirmar que s21/s22 es un estimador de la razón de
varianzas σ21/σ22.

En una forma análoga a las ya descritas para las medias y proporciones, también interesa
determinar si las dos poblaciones tienen o no la misma variabilidad.

Para poder comparar la igualdad de las varianzas de dos poblaciones independientes, se ha


ideado un procedimiento estadístico basado en la razón de las dos varianzas muestrales. Si
los datos de cada población se suponen distribuidos normalmente, entonces la razón S1 2 /
S2 2 sigue una distribución llamada distribución F, que recibe el nombre en honor de R. A.
Fisher.

El valor crítico de la distribución F depende de "dos" conjuntos de grados de libertad: los


grados de libertad en el numerador y en el denominador. El estadístico de la prueba para
probar la razón entre las dos varianzas sería

15
Ejercicio resuelto:

Dos muestras aleatorias de tamaños 10 y 16 se han tomado respectivamente de dos


poblaciones normalmente distribuidas y las varianzas correspondientes fueron de 23 y 20.
Determinar si la primera muestra tiene una varianza significativamente mayor que la
segunda. Nivel de significación del 1%.

Nivel de significación:   01

Si el valor de F calculado es mayor que F.01, 9, 15 = 3.89, se rechaza la hipótesis nula de que
las dos varianzas son iguales y se acepta la alternativa de que la primera varianza es mayor
que la segunda.

N1 = 16 N2 = 10

S12 = 23 S22 = 20

Conclusión: como 1.15 es menor que 3.89, esto quiere decir, que 1.15 se encuentra en la
zona de aceptación; entonces con un nivel de significación del 1%, se acepta la hipótesis
nula de que la variabilidad sea igual para ambas marcas.

16
Conclusión
La probabilidad y la estadística es muy particular tanto como para el ingeniero como para
las personas en la vida diaria, sobre todo hablando del ámbito profesional igual nos ayuda
a reforzar para poder tomar decisiones y ayudarnos en nuestras disyuntivas para que
nuestros márgenes de error sean bajos y poder decidir en algo. Pero ahora con esta
asignatura nos abrimos a unos nuevos temas en el cual nos complementara aún más.
Al finalizar con este tema y sobre todo con este trabajo dejado por el profesor, me llevo con
el aprendizaje de lo que podrá ser la estadística inferencial ya que al ser tema 1, estamos
comenzando por introducirnos en la asignatura.
Y además nos ayudara a comprender los métodos y procedimientos que por medio de la
inducción determina propiedades de una población estadística, a partir de una parte de
esta. Su objetivo es obtener conclusiones útiles para hacer deducciones sobre una totalidad,
basándose en la información numérica de la muestra.

Referencias
Departamento de Estadística e Investigación Operativa. (Sin Fecha). “Introducción a la
Estadística Inferencial”. Recuperado de:
http://www.eio.uva.es/~valentin/ging/materiales_web/Tema10-11_resaltado.pdf

Otzen, T. & Manterola, C. (2017). “Técnicas de Muestreo sobre una Población a Estudio”.
Recuperado de: https://scielo.conicyt.cl/pdf/ijmorphol/v35n1/art37.pdf

Pintarelli, M. B. (23 de Octubre de 2020). Prueba de hipótesis . Obtenido de Hipótesis de la


media: https://www.mate.unlp.edu.ar/practicas/117_13_16072013221648.pdf

Universidad Militar de Nueva Granada. (23 de Octubre de 2020). Hipótesis estadísticas .


Obtenido de Conceptos generales:
http://virtual.umng.edu.co/distancia/ecosistema/odin/odin_desktop.php?path=Li
4vb3Zhcy9pbmdlbmllcmlhX2NpdmlsL3Byb2JhYmlsaWRhZF95X2VzdGFkaXN0aWNh
L3VuaWRhZF81Lw==#slide_8

Monardes. (2012). “Probabilidad y estadística”. Recuperada de:


http://cidecame.uaeh.edu.mx/lcc/mapa/PROYECTO/libro19/74en_relacin_a_varianz

17
18

También podría gustarte