Está en la página 1de 14

__________________________________

INSTITUTO WILLIAMS
KEEMBOL
________________________________________________

MATERIA:
ESTADÍSTICA INFERENCIAL.

DOCENTE:
ING. ADRIANA JANETH TORRES RAMÍREZ.
TRABAJO:

INVESTIGACIÓN DE UNIDAD II.

CARRERA:
ADMINISTRACIÓN DE EMPRESAS.

NOMBRE DE LA ALUMNA:
MARÍA DE LOS ANGELES LUCAS CRUZ.

5° CUATRIMESTRE GRUPO: “A”. FECHA: 10/04/2020

V
INDICE.

2. UNIDAD. PRUEBAS DE HIPÓTESIS CON UNA MUESTRA. ......................... 3

2.1. Metodología para la prueba de hipótesis. .............................................. 3

2.2. La hipótesis nula y la hipótesis alternativa. .......................................... 4

2.3. Error tipo I y error tipo II. ......................................................................... 6

2.4. Pruebas de hipótesis Z para la media (desviación estándar


poblacional). ....................................................................................................... 8

2.5. Pruebas de proporciones. ....................................................................... 9

2.6. Selección del tamaño de la muestra (para estimar la media


poblacional). ..................................................................................................... 12

2.7. Selección el tamaño de la muestra (para estimar la proporción


proporcional). ................................................................................................... 14

V
2. UNIDAD. PRUEBAS DE HIPÓTESIS CON UNA MUESTRA.
2.1. Metodología para la prueba de hipótesis.

Una hipótesis estadística es una aseveración o conjetura respecto a una o más


poblaciones.
En el planteamiento formal de una hipótesis a menudo influye la estructura de la
probabilidad de una conclusión errónea. Si el científico está interesado en apoyar
firmemente un argumento, espera llegar a éste en la forma del rechazo de una
hipótesis. Si el investigador médico desea mostrar evidencia sólida a favor del
argumento de que beber café aumenta el riesgo de contraer cáncer, la hipótesis a
probar debería tener la forma “el riesgo de desarrollar cáncer no aumenta como
consecuencia de beber café”. Como resultado, el argumento se obtiene mediante
un rechazo. De manera similar, para apoyar la afirmación de que un tipo de
medidores es más preciso que otro, el ingeniero prueba la hipótesis de que no hay
diferencia en la pre cisión de los dos tipos de medidores.

Lo anterior implica que cuando el analista de datos formaliza la evidencia


experimental con base en la prueba de hipótesis, es muy importante el
planteamiento formal de la hipótesis.

V
2.2. La hipótesis nula y la hipótesis alternativa.
La estructura de la prueba de hipótesis se establece usando el término hipótesis
nula, el cual se refiere a cualquier hipótesis que se desea probar y se denota con
H0. El rechazo de H0 conduce a la aceptación de una hipótesis alternativa, que se
denota con H1. La comprensión de las diferentes funciones que desempeñan la
hipótesis nula (H0) y la hipótesis alternativa (H1) es fundamental para entender los
principios de la prueba de hipótesis.

La hipótesis alternativa H1 por lo general representa la pregunta que se


responderá o la teoría que se probará, por lo que su especificación es muy
importante. La hipótesis nula H0 anula o se opone a H1 y a menudo es el
complemento lógico de H1. A medida que el lector aprenda más sobre la prueba
de hipótesis notará que el analista llega a una de las siguientes dos conclusiones:

Rechazar H0 a favor de H1 debido a evidencia suficiente en los datos o

no rechazar H0 debido a evidencia insuficiente en los datos.

Observe que las conclusiones no implican una “aceptación de H0” formal y


literal.La

aseveración de H0 a menudo representa el “status quo” contrario a una nueva


idea, conjetura, etcétera, enunciada en H1; en tanto que no rechazar H0
representa la conclusión adecuada. En nuestro ejemplo binomial la cuestión
práctica podría ser el interés en que la probabilidad histórica de artículos
defectuosos de 0.10 ya no sea verdadera. De hecho, la conjetura podría ser que
pexcede a 0.10. Entonces podríamos afirmar que

H0: p =0.10,

H1: p>0.10.

Ahora, 12 artículos defectuosos de cada 100 no refutan p =0.10, por lo que la


conclusión es “no rechazar H0”. Sin embargo, si los datos revelan 20 artículos
defectuosos de cada 100, la conclusión sería “rechazar H0” a favor de H1: p
>0.10.

V
Aunque las aplicaciones de la prueba de hipótesis son muy abundantes en
trabajos científicos y de ingeniería, quizás el mejor ejemplo para un principiante
sea el dilema que enfrenta el jurado en un juicio. Las hipótesis nula y alternativa
son

H0: el acusado es inocente,

H1: el acusado es culpable.

La acusación proviene de una sospecha de culpabilidad. La hipótesis H0(el status


quo) se establece en oposición a H1 y se mantiene a menos que se respalde H1
con evidencia “más allá de una duda razonable”. Sin embargo, en este caso “no
rechazar H0” no implica inocencia, sino sólo que la evidencia fue insuficiente para
lograr una condena. Por lo tanto, el jurado no necesariamente acepta H0 sino que
no rechaza H0.

V
2.3. Error tipo I y error tipo II.

La probabilidad de un error tipo 1

El procedimiento de toma de decisiones recién descrito podría conducir a


cualquiera de dos conclusiones erróneas. Por ejemplo, es probable que la nueva
vacuna no sea mejor que la que se usa en la actualidad (H0 verdadera) y, sin
embargo, en este grupo específico de individuos seleccionados aleatoriamente
más de 8 pasan el periodo de 2 años sin contraer el virus. Si rechazáramos H0 a
favor de H1 cuando, de hecho, H0 es verdadera, cometeríamos un error que se
conoce como error tipo I.

Al probar cualquier hipótesis estadística, hay cuatro situaciones posibles que


determinan si nuestra decisión es correcta o errónea. Estas cuatro situaciones se
resumen en

La probabilidad de cometer un error tipo I, también llamada nivel de significancia,


se denota con la letra griega α. En nuestro ejemplo un error tipo I ocurriría si más
de 8 individuos inoculados con la nueva vacuna superan el periodo de 2 años sin
contraer el virus y los investigadores concluyen que la nueva vacuna es mejor,
cuando en realidad es igual a la vacuna que se utiliza en la actualidad. Por lo
tanto, si X es el número de individuos que permanecen sin contraer el virus por al
menos dos años.

La probabilidad de un error tipo II.

V
La probabilidad de cometer un error tipo II, que se denota con β, es imposible de
calcular a menos que tengamos una hipótesis alternativa específica. Si probamos
la hipótesis nula p = 1/4 contra la hipótesis alternativa p =1/2, entonces podremos
calcular la probabilidad de no rechazar H0 cuando es falsa. Simplemente
calculamos la probabilidad de obtener 8 o menos en el grupo que supera el
periodo de 2 años cuando p = 1/2. En este caso,

Se trata de una probabilidad elevada que indica un procedimiento de prueba en el


cual es muy probable que se rechace la nueva vacuna cuando, de hecho, es mejor
a la que está actualmente en uso. De manera ideal, es preferible utilizar un
procedimiento de prueba con el cual haya pocas probabilidades de cometer el
error tipo I y el error tipo II.

Es posible que el director del programa de prueba esté dispuesto a cometer un


error tipo II si la vacuna más costosa no es significativamente mejor. De hecho, la
única ocasión en la que desea evitar un error tipo II es cuando el verdadero valor
de p es de al menos 0.7. Si p =0.7, este procedimiento de prueba da

Con una probabilidad tan pequeña de cometer un error tipo II es muy improbable
que se rechace la nueva vacuna cuando tiene una efectividad de 70% después de
un periodo de 2 años. A medida que la hipótesis alternativa se aproxima a la
unidad, el valor de β tiende a disminuir hasta cero.

V
2.4. Pruebas de hipótesis Z para la media (desviación estándar
poblacional).

¿Qué es una prueba Z?

Una prueba Z es una prueba de hipótesis basada en el estadístico Z, que sigue la


distribución normal estándar bajo la hipótesis nula.

La prueba Z más simple es la prueba Z de 1 muestra, la cual evalúa la media de


una población normalmente distribuida con varianza conocida. Por ejemplo, el
gerente de una fábrica de caramelos desea saber si el peso medio de un lote de
cajas de caramelos es igual al valor objetivo de 10 onzas. Partiendo de datos
históricos, el gerente sabe que la máquina de llenado tiene una desviación
estándar de 0.5 onzas, así que utiliza este valor como la desviación estándar de la
población en una prueba Z de 1 muestra.

También puede utilizar las pruebas Z para determinar si las variables predictoras
en los análisis probit y en la regresión logística tienen un efecto significativo en la
respuesta. La hipótesis nula indica que el predictor no es significativo.

También tiene la opción de utilizar una prueba Z para realizar una aproximación a
la normal para las pruebas de tasa de Poisson y las pruebas de proporciones.
Estas aproximaciones a la normal son válidas cuando el tamaño de la muestra y el
número de eventos son adecuadamente grandes.

V
2.5. Pruebas de proporciones.

Las pruebas de proporciones son adecuadas cuando los datos que se están
analizando constan de cuentas o frecuencias de elementos de dos o más clases.
El objetivo de estas pruebas es evaluar las afirmaciones con respecto a una
proporción (o Porcentaje) de población. Las pruebas se basan en la premisa de
que una proporción muestral (es decir, x ocurrencias en n observaciones, o x/n)
será igual a la proporción verdadera de la población si se toman márgenes o
tolerancias para la variabilidad muestral. Las pruebas suelen enfocarse en la
diferencia entre un número esperado de ocurrencias, suponiendo que una
afirmación es verdadera, y el número observado realmente. La diferencia se
compara con la variabilidad prescrita mediante una distribución de muestreo que

tiene como base el supuesto de que es realmente verdadera.

En muchos aspectos, las pruebas de proporciones se parecen a las pruebas de


medias, excepto que, en el caso de las primeras, los datos muestrales se
consideran como cuentas en lugar de como mediciones. Por ejemplo, las pruebas
para medias y proporciones se pueden utilizar para evaluar afirmaciones con
respecto a:

1) Un parámetro de población único (prueba de una muestra)

2) La igualdad de parámetros de dos poblaciones (prueba de dos muestras), y

3) La igualdad de parámetros de más de dos poblaciones (prueba de k muestras).


Además, para tamaños grandes de muestras, la distribución de muestreo
adecuada para pruebas de proporciones de una y dos muestras es
aproximadamente normal, justo como sucede en el caso de pruebas de medias de
una y dos muestras.

Prueba de proporciones de una muestra.


Cuando el objetivo del muestreo es evaluar la validez de una afirmación con

V
respecto a la proporción de una población, es adecuado utilizar una prueba de una
muestra. La metodología de prueba depende de si el número de observaciones de
la muestra es grande o pequeño.

Como se habrá observado anteriormente, las pruebas de grandes muestras de


medias y proporciones son bastante semejantes. De este modo, los
valores estadísticos de prueba miden la desviación de un valor estadístico de
muestra a partir de un valor propuesto. Y ambas pruebas se basan en la
distribución normal estándar para valores críticos. Quizá la única diferencia real
entre las ambas radica en la forma corno se obtiene la desviación estándar de la
distribución de muestreo.

Esta prueba comprende el cálculo del valor estadístico de prueba Z

V
Posteriormente este valor es comparado con el valor de Z, obtenido a partir de una
tabla normal a un nivel de significación seleccionado.

Como ocurrió con la prueba de medias de una muestra, las pruebas de


proporciones pueden ser de una o dos colas.

La primera alternativa establece una prueba de cola derecha, la segunda,


izquierda y la tercera, una prueba de dos colas.

V
2.6. Selección del tamaño de la muestra (para estimar la media
poblacional).

¿Qué tan grande debe ser una muestra si la media muestral se va a usar para
estimar la media poblacional? La respuesta depende del error estándar de la
media, si este fuera cero, entonces se necesitaría una sola media que será igual

necesariamente a la media poblacional desconocida , porque = 0. Este caso


extremo no se encuentra en la práctica, pero refuerza el hecho de que mientras
menor sea el error estándar de la media, menor es el tamaño de muestra
necesario para lograr un cierto grado de precisión.

Se estableció antes que una forma de disminuir el error de estimación es


aumentar el tamaño de la muestra, si éste incluye el total de la población,

entonces sería igual a cero. Con esto en mente, parece razonable que para
un nivel de confianza fijo, sea posible determinar un tamaño de la muestra tal que
el error de estimación sea tan pequeño como queramos, para ser mas preciso,
dado un nivel de confianza y un error fijo de estimación , se puede escoger un

tamaño de muestra n tal que P( ) = Nivel de confianza. Con el propósito


de determinar n. El error máximo de estimación esta dado por:

Si se eleva al cuadrado ambos lados de esta ecuación y se despeja n de la


ecuación resultante, obtenemos:

Como n debe de ser un número entero, redondeamos hacia arriba todos los

V
resultados fraccionarios.

En el caso de que se tenga una población finita y un muestreo sin reemplazo, el


error de estimación se convierte en:

De nuevo se eleva al cuadrado ambos lados y se despeja la n, obteniendo:

V
2.7. Selección el tamaño de la muestra (para estimar la proporción
proporcional).

Si se recuerda a la distribución muestral de diferencia de medias se tiene que

error esta dado por:

En esta ecuación se nos pueden presentar dos casos:

 Los tamaños de muestra son iguales.


 Los tamaños de muestra son diferentes.

Para el primer caso no se tiene ningún problema, se eleva al cuadrado la ecuación


y se despeja n ya que n1es igual an2.

Población 1

Población 2

Para el segundo caso se pondrá una n función de la otra. Este caso se utiliza
cuando las poblaciones son de diferente tamaño y se sabe que una es K veces
mayor que la otra.

También podría gustarte