Está en la página 1de 20

MAESTRÍA

ESTADÍSTICA APLICADA
Registro Calificado
Resolución No. 14048 de fecha 21 Julio 2017

MUESTREO ESTADÍSTICO

Facultad de Ciencias Exactas, Naturales y Agropecuarias


Universidad de Santander
Institución sujeta a inspección y vigilancia por el Ministerio de Educación Nacional.
Resolución 12220 de 2016. Vigilada MINEDUCACIÓN.
POBLACIÓN Y MUESTRA
PARÁMETROS
POBLACIONALES POBLACIÓN
DESCONOCIDOS (θ) (N unidades)
• Media Poblacional: μ
• Varianza Poblacional:σ2
INFERENCIA: • Proporción Poblacional: p
• Estimación de Parámetros
MUESTREO
• ALEATORIO
• Prueba de Hipótesis • ESTRATIFICADO
• Nivel Significación (a) • SISTEMATICO
• Potencia de la prueba (b) • CONGLOMERADO
ESTIMADORES
VARIABLE ALEATORIA MUESTRALES (ˆ ) MUESTRA
DE LOS PARÁMETROS (n < N)
Función de la Muestra
 = g(x1,x2,…,xn) • Media Muestral: m
Distribución de Probabilidad • Varianza Muestral: s2
• Valor Esperado: E(ˆ ) • Proporción Muestral: p
• Varianza: V(ˆ )
Las medidas individuales varían, pero a medida que los datos se
acumulan (aumenta tamaño muestral) se generan distribuciones
estadísticas naturales

X X X

X X

Distribuciones varían

Posición Dispersión Forma


Hipótesis
Las hipótesis son proposiciones sobre la población o distribución bajo
estudio (NO son proposiciones sobre la muestra extraída de la población)
Las Hipótesis pueden formularse a partir de:
• Resultado de experiencias pasadas o del conocimiento del proceso.
– ¿Ha cambiado el valor de los parámetros?
• Alguna teoría o modelo a estudiar.
– Verificar la teoría o modelo.
• Parámetros de consideraciones externas: especificaciones de diseño o
ingeniería, obligaciones contractuales.
– Probar el cumplimiento de las especificaciones u obligaciones.
PRUEBAS DE HIPÓTESIS
•Objetivo: Determinar, basándose en el análisis muestral, cuándo es razonable
concluir que la población de la que proviene la muestra, posee determinada
propiedad, y cuándo no es razonable esta conclusión.
•PH: Procedimiento que se basa en la evidencia muestral y en la teoría de
probabilidades para determinar si las hipótesis planteadas sobre características
poblacionales (parámetros) son enunciados razonables.
•Esencia de las PH: decidir si la afirmación que se hace está sustentada por la
evidencia experimental, obtenida a través de muestras aleatorias.
•Las PH:
1. Establecen un valor o un intervalo de valores para los parámetros de
una variable. Construcción de Intervalos de Confianza
2. Establecen la igualdad de las distribuciones de dos ó mas variables.
Requiere un diseño experimental. Ejemplo: La media de dos poblaciones
normales son iguales con igual varianza.
3. Determinan la forma de la distribución de la variable en estudio. Pruebas
específicas para establecer el tipo de distribución de una variable.
Ejemplo: La distribución de una variable es normal.
PRUEBA DE HIPOTESIS

• Procedimiento de toma de decisiones, relacionada con la elección de una


acción entre dos conjuntos posibles de valores del parámetro poblacional,
reflejados en dos hipótesis estadísticas: Hipótesis nula (H0), Hipótesis
Alternativa (H1)

• Pasos para realizar Pruebas de Hipótesis:

1. Formular las Hipótesis Estadísticas:

o Ho: Hipótesis Nula: ( = 0)

o H1: Hipótesis Alternativa: (  0;  > 0;  < 0 )

2. Fijar el criterio para probar Ho vs H1, con base en la distribución


muestral del estimador correspondiente.

3. Decisión basada en el nivel de significación fijado: p-valor, NS α


7
PRUEBA DE HIPÓTESIS

•Un valor es significativo si la medida excede un cierto valor crítico, según cierta
distribución de probabilidad.
•El valor crítico es un valor tabulado determinado por la distribución de
probabilidad y el riesgo de error a.
•El riesgo de error a indica la probabilidad de que ese valor ocurra naturalmente.
Un a=5%, significa que el valor crítico va a ser excedido por un evento aleatorio,
menos del 5% de las veces

Valor Valor
Crítico Crítico

Ocurrencia Ocurrencia Ocurrencia


Rara Común Rara
DECISIONES EN LAS PRUEBAS DE HIPÓTESIS
Realidad

H0 Verdadera H0 Falsa

No Rechazar Decisión Error Tipo II


Correcta
Decisión

Ho No Rechazar Ho/Falsa

Rechazar Error Tipo I Decisión


Ho Correcta
Rechazar Ho/Verdadera

Fdp
Fdp
H1
Ho

Punto Decisión (Valor Crítico)

b
a

VC Región Rechazo
DECISIONES EN LAS PRUEBAS DE HIPÓTESIS
Realidad (Estado de la Naturaleza)

H0 Verdadera H0 Falsa

No Rechazar Coef Confianza = (1-a) Error Tipo II


b = P(E_II)
Decisión

Ho
Nivel Significación = a
Potencia Prueba
Rechazar Error Tipo I
Ho a = P(E_I) = NS (1- b)

Fdp
Fdp
H1
Ho

Relación Inversa entre


los dos tipos de errores: Punto Decisión (Valor Crítico)
Para un n fijo, reducir a,
implica aumentar b b
a
P(E_II) = b P(E_I) = a

VC Región Rechazo
DECISIONES EN LAS PRUEBAS DE HIPÓTESIS
Realidad

Inocente (H0V) Culpable (H0F)

No Rechazar Ho Decisión Error Tipo II


Correcta
Decisión

Inocente Inocente/Culpable

Rechazar Ho Error Tipo I Decisión


Culpable Correcta
Culpable/Inocente

Ejemplo: Juicio para determinar Inocencia o Culpabilidad


 Abogado Defensor: minimiza a, tratando que el jurado minimice el riesgo de E_I
 Fiscal: minimiza b, tratando que el jurado minimice el riesgo de E_II

Ejemplo: Investigación sobre presencia de Salmonella en granjas avícolas


 Ho: Presencia de Salmonella en granjas avícolas vs H1: No hay Salmonella
 EI: Se concluye que NO hay Salmonella basado en la evidencia muestral (pero
en realidad: las granjas Sí tienen Salmonella)
 EII: Las granjas avícolas tienen Salmonella/Realidad: No hay Salmonella
DECISIONES Y TIPOS DE ERRORES

Acierto
Error Tipo II
(1 – α)
β =P(E_II)
Coeficiente Confianza
Error Tipo I Acierto
α =P(E_I) (1 – β)
Nivel Significación Potencia Prueba

POTENCIA de PRUEBA ESTADISTICA (1-β)


 Probabilidad (1-β) de rechazar la hipótesis nula cuando de hecho es falsa y
debería ser rechazada
 Complemento de la probabilidad de cometer Error Tipo II (b)
 Depende de:
•diferencia entre el verdadero valor del parámetro poblacional (realidad
desconocida) con respecto al valor supuesto establecido en la Ho
•tamaño de la muestra n.
POTENCIA DE PRUEBA ESTADISTICA Y TAMAÑO DE MUESTRA

•Una manera de controlar b = (probabilidad E_II) consiste en aumentar


el tamaño de la muestra.

•Tamaños más grandes de muestra permiten detectar diferencias


incluso muy pequeñas entre los estadísticos muestrales y los
parámetros poblacionales.

•Cuando se disminuye α, aumenta β. Una reducción en el riesgo de


cometer E_I implica un aumento en el riesgo de cometer E_II.

•Una prueba de un extremo (unilateral) es más potente que una prueba


de dos extremos (bilateral). Se deber utilizar prueba unilateral siempre
que sea adecuado especificar la dirección de la hipótesis alternativa.
PRUEBAS DE UNA Y DOS COLAS
Prueba Unilateral Prueba Bilateral
Contraste de una cola Contraste de dos colas

a = 0.05

Za =1.65 Za/2 = -1.96 Z (1-a/2)= 1.96


Ejemplo Prueba Unilateral
La vida media calculada con base en una muestra aleatoria de 100 muertes
registradas en 2010, es de 71.8 años. Se tiene una desviación estándar poblacional
conocida de 8.9 años. ¿Es la vida media mayor que 70 años? NS = 0.05.
1-Establecer Hipótesis: H0 y H1: H0:  = 70 años; H1:  > 70 años
2-Seleccionar la Distribución: Distribución muestral de medias con desviación
estándar conocida:  =70 a; s = 8.9 a; X = 71.8 a.
3-Cálculos: n = 100; a = 0.05

X -  71.8 - 70
zc = = = 2.02
s 8.9
n 100

4-Regla Decisión: comparar Z tabulado (N(0,1)) con Zc:


Si zc  1.645 no se rechaza H0
Si zc > 1.645 se rechaza H0
5-Decisión:
Como 2.02 >1.645 se rechaza H0. Se concluye, con un NS del 0.05, que la vida
media es mayor que 70 años (el riesgo de equivocarse es 5%).
PRUEBA HIPOTESIS: Tamaño Muestral Pequeño. Distribución t.
• Especificación de las hipótesis (No se conoce )
– H0:  = 78 ?
– H1:   78 (H1:  > 78; H1:  < 78)
• Ejemplo: X = 75, s = 5, n=16; gl = n-1=15

• Calcular el estadístico t:
X - 0
t=  tc = (75-78)/(5/4) = -2.4
s
n

• Para a= 5%, 15 gl, el valor crítico bilateral t15 = -2.131.

 La probabilidad de obtener un valor de t > 2.131 o t < -2.131 es 5%:


P(|t|>2.131)=0.05

 Como tc= -2.4 < -2.131, se rechaza Ho.

 Concluaión: la media poblacional ≠78, con un NS=5%.


Tabla de Valores Críticos: Distribución t

a
Unilateral 0.10 0.05 0.025 0.01 0.005 0.0005
Bilateral 0.20 0.10 0.05 0.02 0.010 0.0010
Grados de libertad
(=n-1) Valores Críticos
1 3.078 6.314 12.706 31.821 63.657 636.619
2 1.886 2.920 4.303 6.965 9.925 31.598
3 1.683 2.353 3.182 4.542 5.841 12.941
4 1.533 2.132 2.776 3.747 4.604 8.610
5 1.476 2.015 2.571 3.365 4.032 6.859
6 1.440 1.943 2.447 3.143 3.707 5.959
7 1.415 1.895 2.365 2.998 3.499 5.405
8 1.397 1.860 2.306 2.896 3.355 5.041
... ... ... ... ,,, ,,, ,,,
Inf. 1.282 1.645 1.960 2.236 2.576 3.291
INTERVALO DE CONFIANZA
•En la estimación de parámetros poblacionales, un intervalo de confianza es un
rango de valores dentro del que se encuentra el verdadero valor del parámetro
poblacional, con una probabilidad determinada.
•La probabilidad de que el verdadero valor del parámetro se encuentre en el
intervalo construido se denomina nivel de confianza, (1- α), siendo α el nivel de
significación o probabilidad de error tipo I.
•Intervalo de confianza, para la media X ~ Distribución Normal Estándar:
P(-1.96 < z < 1.96) = 0.95

•Si va X ~ N(,s), el 95% de las veces se cumple:

•Despejando  en la ecuación se tiene:

•El resultado es un intervalo que incluye a  el 95% de las veces. Es decir, es un


intervalo de confianza 95% para la media , cuando la variable X es normal y s
es conocida.
INTERVALO DE CONFIANZA

Media Poblacional
PRUEBA HIPOTESIS POR
INTERVALOS DE CONFIANZA
• Se construye un IC para , con NS: a =5%
– IC(95%): ( X ± t ] )  72.34<  < 77.66
– Significado: hay una probabilidad del 95% de que el intervalo
contenga la verdadera media poblacional.
• Hipótesis Nula Ho: o =78
– Como o=78 no pertenece al IC, se rechaza la Ho:
(o = 78)  IC95%
• El IC(95%) define la Región de Aceptación.
– El área exterior define la región Crítica o región de Rechazo.
– μ=78 está en región crítica
• La probabilidad de que  <=78 es menor que 2.5%
Distribución de la Media y la Varianza

Población Original Distribución Continua


4

0
0 1 2 3 4 5 6 7
-1

-2

-3

-4

3
Media Subgrupo Distribución Normal
2

0
0 1 2 3 4 5 6 7
-1

-2

-3

-4 Varianza Subgrupo Distribución c2


4

0
0 1 2 3 4 5 6 7