Está en la página 1de 20

MAESTRÍA

ESTADÍSTICA APLICADA
Registro Calificado
Resolución No. 14048 de fecha 21 Julio 2017

MUESTREO ESTADÍSTICO

Facultad de Ciencias Exactas, Naturales y Agropecuarias


Universidad de Santander
Institución sujeta a inspección y vigilancia por el Ministerio de Educación Nacional.
Resolución 12220 de 2016. Vigilada MINEDUCACIÓN.
INFERENCIA ESTADISTICA

Definiciones
Prueba de Hipótesis
Hipótesis Estadística
Prueba de Hipótesis Estadísticas
Procedimiento para Prueba de Hipótesis
Ejemplos

GIAMPAOLO ORLANDONI MERLI


POBLACIÓN Y MUESTRA
PARÁMETROS
POBLACIONALES POBLACIÓN
DESCONOCIDOS (θ) (N unidades)
• Media Poblacional: μ
• Varianza Poblacional: σ2
INFERENCIA:
• ESTIMACIÓN DE
MUESTREO
• ALEATORIO
PARÁMETROS
• ESTRATIFICADO
• PRUEBA de HIPÓTESIS • SISTEMATICO
• CONGLOMERADO
ESTIMADORES
VARIABLE ALEATORIA MUESTRALES (ˆ ) MUESTRA
DE LOS PARÁMETROS (n < N)
Función de la Muestra
 = g(x1,x2,…,xn) • Media Muestral: m
Distribución de Probabilidad • Varianza Muestral: S2
• Valor Esperado
• Varianza
Las medidas individuales varían, pero a medida que los datos se acumulan
(aumenta tamaño muestral), generan distribuciones naturales

X X X

X X

Distribuciones varían en

Posición Dispersión Forma


Hipótesis
Las hipótesis son proposiciones sobre la población o distribución bajo
estudio (NO son proposiciones sobre la muestra extraída de la población)
Las Hipótesis pueden formularse a partir de:
• Resultado de experiencias pasadas o del conocimiento del proceso.
– ¿Ha cambiado el valor de los parámetros?
• Alguna teoría o modelo a estudiar.
– Verificar la teoría o modelo.
• Parámetros de consideraciones externas: especificaciones de diseño o
ingeniería, obligaciones contractuales.
– Probar el cumplimiento de las especificaciones u obligaciones.
PRUEBAS DE HIPÓTESIS
•Objetivo: Determinar, basándose en el análisis muestral, cuándo es razonable
concluir que la población de la que proviene la muestra, posee determinada
propiedad, y cuándo no es razonable esta conclusión.
•PH: Procedimiento que se basa en la evidencia muestral y en la teoría de
probabilidades para determinar si las hipótesis planteadas sobre características
poblacionales (parámetros) son enunciados razonables.
•Esencia de las PH: decidir si la afirmación que se hace está sustentada por la
evidencia experimental, obtenida a través de muestras aleatorias.
•Las PH:
1. Establecen un valor o un intervalo de valores para los parámetros de
una variable. Construcción de Intervalos de Confianza
2. Establecen la igualdad de las distribuciones de dos ó mas variables.
Requiere un diseño experimental. Ejemplo: La media de dos poblaciones
normales son iguales con igual varianza.
3. Determinan la forma de la distribución de la variable en estudio. Pruebas
específicas para establecer el tipo de distribución de una variable.
Ejemplo: La distribución de una variable es normal.
PRUEBA DE HIPOTESIS

• Procedimiento de toma de decisiones, relacionada con la elección de una


acción entre dos conjuntos posibles de valores del parámetro poblacional,
reflejados en dos hipótesis estadísticas: Hipótesis nula (H0), Hipótesis
Alternativa (H1)

• Pasos para realizar Pruebas de Hipótesis:

1. Formular las Hipótesis Estadísticas:

o Ho: Hipótesis Nula: ( = 0)

o H1: Hipótesis Alternativa: (  0;  > 0;  < 0 )

2. Fijar el criterio para probar Ho vs H1, con base en la distribución


muestral del estimador correspondiente.

3. Decisión basada en el nivel de significación fijado: p-valor, NS α


8
PRUEBA DE HIPÓTESIS

•Un valor es significativo si la medida excede un cierto valor crítico, según cierta
distribución de probabilidad.
•El valor crítico es un valor tabulado determinado por la distribución de
probabilidad y el riesgo de error a.
•El riesgo de error a indica la probabilidad de que ese valor ocurra naturalmente.
Un a=5%, significa que el valor crítico va a ser excedido por un evento aleatorio,
menos del 5% de las veces

Valor Valor
Crítico Crítico

Ocurrencia Ocurrencia Ocurrencia


Rara Común Rara
DECISIONES EN LAS PRUEBAS DE HIPÓTESIS
Realidad

H0 Verdadera H0 Falsa
Error Tipo II
No Rechazar Decisión Aceptar Ho siendo
Correcta
Decisión

Ho Falsa

Rechazar Error Tipo I


Rechazar Ho siendo Decisión
Ho Correcta
Verdadera

Fdp
Fdp
Hipótesis Alternativa
Hipótesis Nula

Punto Decisión (Valor Crítico)

b
a

VC Región Rechazo
DECISIONES EN LAS PRUEBAS DE HIPÓTESIS
Realidad (Estado de la Naturaleza)

H0 Verdadera H0 Falsa

Coef Confianza = (1-a) Error Tipo II


No Rechazar
b = P(E_II)
Decisión

Ho Nivel Significación = a
Potencia Prueba
Rechazar Error Tipo I
Ho a = P(E_I) = NS (1- b)

Fdp
Fdp
Hipótesis Alternativa
Hipótesis Nula

Relación Inversa entre


los dos tipos de errores: Punto Decisión (Valor Crítico)
Para un n fijo, reducir a,
implica aumentar b b
a
P(E_II) = b P(E_I) = a

VC Región Rechazo
DECISIONES Y TIPOS DE ERRORES

Estado de la Naturaleza
H0 verdadera H0 falsa
Acierto
Error Tipo II
Acepto H0 (1 – α)
Decisión

β =P(E_II)
Coeficiente Confianza
Error Tipo I Acierto
Rechazo H0 α =P(E_I) (1 – β)
Nivel Significación Potencia Prueba

POTENCIA DE PRUEBA ESTADISTICA (1-β)


•Probabilidad de rechazar la hipótesis nula cuando de hecho es falsa y
debería ser rechazada
•Es el complemento (1-β) de la probabilidad de cometer Error Tipo II (b)
•Depende de qué tan diferente es el verdadero parámetro de la población con
respecto al valor supuesto establecido en la Ho y del tamaño de la muestra n.
POTENCIA DE UNA PRUEBA ESTADISTICA

POTENCIA DE LA PRUEBA Y TAMAÑO DE MUESTRA


•Una manera de controlar la probabilidad de cometer un error del tipo II
consiste en aumentar el tamaño de la muestra.

•Tamaños más grandes de muestra permiten detectar diferencias incluso muy


pequeñas entre las estadísticas muestrales y los parámetros poblacionales.

•Cuando se disminuye α, aumenta β. Una reducción en el riesgo de cometer


un E_I implica un aumento en el riesgo de cometer un E_II.

•Una prueba de un extremo es más poderosa que una prueba de dos extremos.
Se deber utilizar siempre que sea adecuado especificar la dirección de la
hipótesis alternativa.
PRUEBAS DE UNA Y DOS COLAS
Prueba Unilateral Prueba Bilateral
Contraste de una cola Contraste de dos colas

a = 0.05

Za =1.65 Za/2 = -1.96 Z (1-a/2)= 1.96


Ejemplo Prueba Unilateral
La vida media calculada con base en una muestra aleatoria de 100 muertes
registradas en 2010, es de 71.8 años. Se tiene una desviación estándar poblacional
conocida de 8.9 años. ¿Es la vida media mayor que 70 años? NS = 0.05.
1-Establecer Hipótesis: H0 y H1: H0:  = 70 años; H1:  > 70 años
2-Seleccionar la Distribución: Distribución muestral de medias con desviación
estándar conocida:  =70 a; s = 8.9 a; X = 71.8 a.
3-Cálculos: n = 100; a = 0.05

X -  71.8 - 70
zc = = = 2.02
s 8.9
n 100

4-Regla Decisión: comparar Z tabulado (N(0,1)) con Zc:


Si zc  1.645 no se rechaza H0
Si zc > 1.645 se rechaza H0
5-Decisión:
Como 2.02 >1.645 se rechaza H0. Se concluye, con un NS del 0.05, que la vida
media es mayor que 70 años (el riesgo de equivocarse es 5%).
PRUEBA HIPOTESIS: Tamaño Muestral Pequeño. Distribución t.
• Especificación de las hipótesis (No se conoce )
– H0:  = 78 ?
– H1:   78 (H1:  > 78; H1:  < 78)
• Ejemplo: X = 75, s = 5, n=16; gl = n-1=15

• Calcular el estadístico t:

 tc = (75-78)/(5/4) = -2.4
X - 0
t=
s
n

• Para a= 5%,15 gl, el valor crítico bilateral t15 = -2.131.

 La probabilidad de obtener un valor de t > 2.131 o t < -2.131 es 5%:


P(|t|>2.131)=0.05
 Como tc= -2.4 < -2.131, se rechaza Ho.
 La media poblacional ≠78, con un NS=5%.
Tabla de Valores Críticos: Distribución t

a
Unilateral 0.10 0.05 0.025 0.01 0.005 0.0005
Bilateral 0.20 0.10 0.05 0.02 0.010 0.0010
Grados de libertad
(=n-1) Valores Críticos
1 3.078 6.314 12.706 31.821 63.657 636.619
2 1.886 2.920 4.303 6.965 9.925 31.598
3 1.683 2.353 3.182 4.542 5.841 12.941
4 1.533 2.132 2.776 3.747 4.604 8.610
5 1.476 2.015 2.571 3.365 4.032 6.859
6 1.440 1.943 2.447 3.143 3.707 5.959
7 1.415 1.895 2.365 2.998 3.499 5.405
8 1.397 1.860 2.306 2.896 3.355 5.041
... ... ... ... ,,, ,,, ,,,
Inf. 1.282 1.645 1.960 2.236 2.576 3.291
INTERVALO DE CONFIANZA
•En la estimación de parámetros poblacionales, un intervalo de confianza es un
rango de valores dentro de los que se encuentra el verdadero valor del parámetro
poblacional, con una probabilidad determinada.
•La probabilidad de que el verdadero valor del parámetro se encuentre en el
intervalo construido se denomina nivel de confianza, (1- α), siendo α el nivel de
significación o probabilidad de error tipo I.
•Intervalo de confianza, para la mediaX ~ Distribución Normal estándar:

P(-1.96 < z < 1.96) = 0.95

•Si va X ~ N(,s), el 95% de las veces se cumple:

•Despejando  en la ecuación se tiene:

•El resultado es un intervalo que incluye a  el 95% de las veces. Es decir, es un


intervalo de confianza 95% para la media , cuando la variable X es normal y s
es conocida.
INTERVALO DE CONFIANZA
de la Media Poblacional
PRUEBA HIPOTESIS POR IC_MEDIA.prg
INTERVALOS DE CONFIANZA
• Se construye un IC para  , con NS a =5%
– IC(95%): ( X ± t ] )  72.34<  <77.66

– Significado: hay una probabilidad del 95% de que el intervalo


contenga la verdadera media poblacional.

• Hipótesis Nula Ho: =78


– Como =78 no pertenece al IC, se rechaza la Ho.

• El IC(95%) define la Región de Aceptación.


– El área exterior define la región Crítica o región de Rechazo.

– μ=78 está en región crítica

• La probabilidad de que  <=78 es menor que 2.5%


Distribucion de la Media y de la Varianza

Poblacion Original Distribucion Continua


4

0
0 1 2 3 4 5 6 7
-1

-2

-3

-4

3
Media Subgrupo Distribucion Normal
2

0
0 1 2 3 4 5 6 7
-1

-2

-3
Varianza Subgrupo Distribucion c2
-4
4

0
0 1 2 3 4 5 6 7

También podría gustarte