Está en la página 1de 11

1. Explique en que consiste una distribución normal y una distribución normal estándar.

Además, describa dos ejemplos aplicados.


Solución:

Una variable aleatoria continua, X, sigue una distribución normal de media μ y desviación


típica σ, y se designa por N (μ, σ), si se cumplen las siguientes condiciones:

1. La variable puede tomar cualquier valor: (-∞, +∞)

2. La función de densidad, es la expresión en términos de ecuación matemática de la curva de


Gauss:

Función de Densidad 

Curva de la distribución normal

 Curva de la distribución normal

* El campo de existencia es cualquier valor real, es decir, (-∞, +∞).

* Es simétrica respecto a la media µ.

* Tiene un máximo en la media µ.

* Crece hasta la media µ y decrece a partir de ella.

* En los puntos µ − σ y µ + σ presenta puntos de inflexión.

* El eje de abscisas es una asíntota de la curva.

 
El área del recinto determinado por la función y el eje de abscisas es igual a la unidad.

Al ser simétrica respecto al eje que pasa por x = µ, deja un área igual a 0.5 a la izquierda y otra
igual a 0.5 a la derecha.

La probabilidad equivale al área encerrada bajo la curva.

p(μ - σ < X ≤ μ + σ) = 0.6826 = 68.26 %

p(μ - 2σ < X ≤ μ + 2σ) = 0.954 = 95.4 %

p(μ - 3σ < X ≤ μ + 3σ) = 0.997 = 99.7 %

La distribución normal estándar, o tipificada o reducida, es aquella que tiene por media el


valor cero, μ =0, y por desviación típica la unidad, σ =1.

Su función de densidad es:

Distribución Normal Estándar

Su gráfica es:

Gráfica de la Distribución Normal Estándar

 La probabilidad de la variable X dependerá del área del recinto sombreado en la figura. Y para
calcularla utilizaremos una tabla.

Tipificación de la variable

Para poder utilizar la tabla tenemos que transformar la variable X que sigue una distribución N (μ,
σ) en otra variable Z que siga una distribución N(0, 1).

Tipificación de la Variable
Ejercicios:

Los sueldos mensuales en una empresa siguen una distribución normal con media de 1200 soles,
y desviación estándar de 200 soles. ¿Qué porcentaje de trabajadores ganan entre 1000 y 1550
soles?

Solución:

Sumando ambas probabilidades: 0.3413 + 0.4599 = 0.8012

Una población normal tiene una media de 80 una desviación estándar de 14.0
a) Calcule la probabilidad de un valor localizado entre 75.0 y 90.0
p (75 ≤ x ≤ 90)

2. Los ingresos semanales de los supervisores de turno de la industria del vidrio se rigen por
una distribución de probabilidad normal con una media de $1 000 y una desviación
estándar de $100. ¿Cuál es el valor z del ingreso X de un supervisor que percibe $1 100
semanales? ¿Y de un supervisor que gana $900 semanales?
La distribución exponencial es aquella que modela el tiempo transcurrido entre dos sucesos que se
producen de forma independiente, separada y uniforme en el tiempo.

Se dice que una v.a. X sigue una distribución exponencial de parámetro λ, y se denota por X ∼ exp
(λ), si su función de densidad es

Observemos que X toma valores en el conjunto S = [0, +∞).

Ejemplo Hemos observado que en cierta provincia se producen, en promedio, 50 incendios serios
cada año. Suponemos que estos incendios se producen de forma independiente y decidimos
modelar el número de incendios por año mediante una distribución Poisson.

• ¿Cuál es el tiempo medio que transcurre entre dos incendios consecutivos?

• Si acaba de ocurrir un incendio ¿cuál es la probabilidad de que el próximo se produzca al cabo de


dos semanas?

Sabemos que:

• El número de incendios por año N ∼ Pois(λ) con λ = 50.

• El tiempo entre dos incendios X ∼ exp(λ) con λ = 50.

• El tiempo medio entre dos incendios E(X) = 1 λ = 1/50 años, 7.3 días.

• Dos semanas, en años son: 2·7 365 = 0.03836, • P[X > 0.03836] = 1 − P[X ≤ 0.03836] = 1 − (1 − e
−50·0.03836) = 0.147.

¿Qué es una hipótesis?


Una hipótesis estadística es una afirmación acerca de la distribución de una variable aleatoria.

 Si la afirmación es sobre el valor de un parámetro, es una hipótesis estadística


paramétrica.
 Si la afirmación es sobre la forma de la distribución de probabilidades, es una hipótesis
estadística no paramétrica.

Veamos algunos ejemplos de afirmaciones y establezcamos si son o no son hipótesis estadísticas.

 Afirmación 1: «La molécula de agua está compuesta por dos átomos de hidrógeno y un
átomo de oxígeno».
 Afirmación 2: «La variable X tiene distribución Binomial».
 Afirmación 3: «La media de una muestra de 100 observaciones es
de ¯x=45,32x¯=45,32gramos»
 Afirmación 4: «La media de la variable X∼(μ,σ)X∼(μ,σ) es μ=134μ=134»
 Afirmación 5: «La media de la variable X∼(μ,σ)X∼(μ,σ) es μ<134μ<134»

La afirmación 1 predica sobre la composición de una molécula. Será una afirmación… pero no es
de tipo «estadístico». Y en particular no dice nada sobre ninguna variable aleatoria. No es una
hipótesis estadística.
La afirmación 2 predica sobre la forma que tiene la distribución de una variable aleatoria. Está
diciendo algo acerca de una variable aleatoria. Así que podemos decir que es una hipótesis
estadística. Pero es una hipótesis estadística no paramétrica.

La afirmación 3 es sobre la media muestral de una variable aleatoria. La media muestral no es un


parámetro, sino que es una variable aleatoria. No es una hipótesis estadística porque no afirma
nada ni sobre el tipo de distribución (binomial, normal, etc…) ni sobre sus parámetros.

La afirmación 4 sí es una hipótesis estadística (paramétrica) porque asevera que el parámetro


media poblacional de cierta variable es igual a 134.

Ejemplo de prueba de hipótesis detallado paso a paso (incluyendo los detalles «técnicos»)

El enunciado

Un fabricante de galletitas produce paquetes en los cuales el peso nominal impreso es


de 500500 gramos. Pero el contenido real es una variable aleatoria con distribución normal. No
tienen exactamente 500500 gramos todos los paquetes. El fabricante, basándose en información
histórica, afirma que la media de esa variable X es μ=500μ=500 gramos con un desvío estándar
de 55 gramos. Se desconfía de la afirmación del fabricante acerca de que μ=500μ=500 gramos. Se
quiere analizar si en realidad el peso promedio de los paquetes es inferior a 500500 gramos.
Para esto se toma una muestra de tamaño 100, y se obtiene una media muestral de 497,
3497,3gramos.
Realizar una prueba de hipótesis con un nivel de significación de 0, 050,05.
La variable

La variable sobre la que vamos a trabajar es XX: peso real de un paquete de galletitas de 500
gramos de la fábrica.
El enunciado afirma que la distribución de XX es normal. No se conoce μμ, pero sí se
conoce σ=5σ=5.
Hipótesis nula e hipótesis alternativa

H0H0 es la hipótesis nula. Hipótesis nula es la hipótesis de no cambio. Es la hipótesis de que todo
queda igual. Hay otra hipótesis que es la hipótesis de cambio. Siempre en esta hipótesis va a estar
el igual.
H0:μ=500H0:μ=500
H1H1 es la hipótesis alternativa. Es complementaría a la nula. Niega a la hipótesis nula.
Las hipótesis son complementarias. La nula tiene el símbolo de igualdad siempre. Entonces en la
otra no puede aparecer el igual. En la hipótesis alternativa se utiliza o bien el símbolo de
distinto ≠≠, o bien mayor >> o bien menor <<.
H1:μ<500H1:μ<500
Error de tipo 1 y error de tipo 2

Uno querría tomar la decisión correcta. Rechazar la hipótesis nula, cuando esta es falsa, es una
decisión correcta posible. No rechazar la hipótesis nula, cuando esta es verdadera es otra forma de
tomar una decisión correcta.

Pero cuando se toma una decisión basada en información muestral, se pueden cometer errores. Si
la hipótesis nula fuera verdadera, y tomamos la decisión de rechazarla estaremos cometiendo un
error. Este error se conoce cómo el error de tipo 1. Si la hipótesis nula fuera falsa, y no la
rechazamos estaríamos cometiendo otro error. Este otro error se conoce cómo el error de tipo 2.

¿Qué es la prueba de hipótesis?

En un proceso de prueba de hipótesis, no es posible tener garantía absoluta de no estar


cometiendo algún error.

La siguiente tabla resume los escenarios posibles.

Describa el procedimiento para probar una hipótesis y de un ejemplo

Error de tipo 1: Si la hipótesis nula es en realidad verdadera, y se la rechaza, se comete el error de
tipo 1. También se llama nivel se significación de la prueba. La probabilidad de cometerlo se
representa cómo:

α=P(errortipo1)=P(RHo|H0esV)α=P(errortipo1)=P(RHo|H0esV)
Decisión correcta 1: Si la hipótesis nula es en realidad verdadera, y no se la rechaza, se está
tomando una decisión correcta. La probabilidad de que ocurra esto se representa:

1–α=P(NoRHo|H0esV)1–α=P(NoRHo|H0esV)
Error de tipo 2: Si la hip’otesis nula es falsa y no se la rechaza, se comete el error de tipo 2. La
probabilidad de cocmeterlo se representa cómo:
β=P(errortipo2)=P(NoRH0|H0esF)β=P(errortipo2)=P(NoRH0|H0esF)
Decisión correcta 2: Si la hipótesis nula es falsa,  se la rechaza, se está tomando una decisión
correcta. Diferente de la decisión correcta 1, así que le podemos llamar decisión correcta 2. (No es
un nombre estándar). La probabilidad de que esto ocurra se conoce cómo «potencia del test» y se
representa cómo:

1–β=Potenciadeltest=P(RH0|H0esF)1–β=Potenciadeltest=P(RH0|H0esF)
El nivel de significación (probabilidad de cometer el error de tipo 1) se establece a priori. Es la
probabilidad de rechazar la hipótesis nula cuando esta es verdadera. En general el enunciado del
ejercicio (o el investigador) establece un nivel de significación.

El error de tipo 1 se considera un error grave, que se quiere evitar. Hay necesidad de
controlarlo. αα debe ser pequeño. Valores usuales de αα pueden ser:
α=⎧⎪⎨⎪⎩0,010,050,10α={0,010,050,10
Estadístico de prueba

Basándonos en que X∼N(μ,σ)X∼N(μ,σ), y que conocemos σσ, entonces es posible afirmar que:


¯X–μσ√n∼N(0,1)X¯–μσn∼N(0,1)
Este es un estadístico de prueba que nos puede servir para realizar la prueba de hipótesis
sobre μμ.
En el proceso se asume que H0H0 es verdadera hasta que se demuestre lo contrario (cómo en un
juicio se supone la inocencia hasta que se demuestre lo contrario).
Si asumimos que H0H0 es verdadera (μ=500μ=500) entonces el estadístico de prueba es:
eprueba=¯X–5005√100∼N(0,1)eprueba=X¯–5005100∼N(0,1)
En el numerador tenemos la diferencia ¯X–μX¯–μ si esa diferencia es «muy negativa» entonces
rechazaremos la hipótesis nula (porque significa que ¯XX¯ está muy por debajo de μμ).
Entonces ¿cómo se decide si se rechaza o no a la hipótesis nula? Los valores que puede tomar el
estadístico de prueba de dividen en dos zonas: «la zona de rechazo» y la «zona de no rechazo». Si
el estadístico de prueba toma un valor dentro de la zona de rechazo se rechaza la hipótesis nula.
Si el estadístico de prueba toma un valor fuera de la zona de rechazo, no se rechaza la hipótesis
nula.

Rechazaremos H0H0 si:

Más adelante vamos a ver cómo hallar ese valor crítico.

Nivel de significación

En este enunciado se establece que el nivel de significación (probabilidad de cometer el error de


tipo 1) es α=0,05α=0,05.
Zona de rechazo y regla de decisión

Si el estadístico de prueba cae en zona de rechazo (asumiendo H0H0verdadera) estaríamos


cometiendo el error de tipo 1 (RH0|H0esVRH0|H0esV). Luego el nivel de significación es igual al área
bajo la curva del estadístico de prueba y sobre la región de rechazo.
 

Entonces: el nivel de significación determina, conjuntamente con la distribución del estadístico de


prueba, cuál va a ser el valor crítico que define la zona de rechazo.

zCzC debe ser aquel valor de la variable normal estándar que acumula un área de 0,05 a su
izquierda. Mirando la tabla de probabilidades normales, o bien usando un software, se puede
determinar que:
Φ(zC)=0,05⇒zc=–1,64Φ(zC)=0,05⇒zc=–1,64
Regla de decisión:

 Se rechaza H0H0 si el valor observado del estadístico de prueba es menor o igual a –1,64–


1,64.

 No se rechaza H0H0 si el valor observado del estadístico de prueba es mayor que –1,64–


1,64.

Calcular el valor observado del estadístico de prueba

Hasta aquí no se utilizó la información recogida en la muestra. Recién ahora tomamos el dato
sobre la media muestral observada y reemplazamos en la expresión de estadístico de prueba para
obtener el valor observado del estadístico de prueba:
Obtener la conclusión

En general la conclusión tiene dos versiones: una breve, y otra más detallada.

LA CONCLUSIÓN BREVE (O «LA DECISIÓN»)

Cómo el valor observado del estadístico de prueba -5,4, cae en la zona de rechazo (–∞,–1,64)(–∞,–
1,64) se decide rechazar la hipótesis nula.
Esta conclusión está muy bien, pero no refiere a la situación general del problema concreto. Solo
dice si se rechaza o no la hipótesis nula.

LA CONCLUSIÓN DETALLADA

En la conclusión detallada queremos informar:

 El nivel de significación con el que se realiza la conclusión.


 Cuál es la variable en cuestión.
 Cuál es el parámetro en cuestión.
 Si se rechaza o no se rechaza la hipótesis nula a favor de la alternativa.
 Qué implica la decisión tomada en términos del problema concreto

Por ejemplo en este caso podríamos escribir una conclusión detallada así:

Con un nivel de significación de 0,050,05 se rechaza la hipótesis nula, que afirma que la media del
peso de los paquetes de galletitas es de 500500 gramos, a favor de la hipótesis alternativa, que
afirma que la media del peso de los paquetes de galletitas es inferior a 500500 gramos. Habría que
re-calibrar la máquina que rellena los paquetes para que la media sea de 500500gramos.
Pasos que se dan para realizar una prueba de hipótesis

Después de haber resulto completamente un ejercicio de prueba de hipótesis podemos detectar


que se siguió la siguiente secuencia de pasos:

1. Primer paso: Reconocer y definir la o las variables


2. Segundo paso: Formular las hipótesis nula y alternativa
3. Tercer paso: Establecer un estadístico de prueba adecuado
4. Cuarto paso: Seleccionar un nivel de significación
5. Quinto paso: Determinar la zona de rechazo y establecer la regla de decisión
6. Sexto paso: Calcular el valor observado del estadístico de prueba
7. Séptimo paso: Obtener la conclusión
Otros problemas de prueba de hipótesis pueden ser muy diferentes. Otras variables, otros
estadísticos de prueba, hipótesis diferentes… etc. Pero en todos los problemas de prueba de
hipótesis se puede seguir esta secuencia de pasos.

También podría gustarte