Está en la página 1de 24

Facultad Católica de Química e Ingeniería

del Rosario
Pontificia Universidad Católica Argentina

Inferencia

Cátedra: Estadística Aplicada

Docente: Prof. Lic. Luciana Ruiz


e-mail: lucianaruiz@uca.edu.ar
Inferencia estadística

◼ A partir de la información muestral (estadística)


se desea inferir o tomar decisiones respecto de
la población (parámetro).

Ejemplo: Con los datos de una encuesta de


intensión de voto (muestra) se estima que el
porcentaje de votantes a favor de cierto
candidato es del 35% con un margen de error
del 1,8%.
Estimadores

◼ Llamamos estimador de un parámetro


desconocido a la estadística que se utiliza para
estimar su valor a partir de una muestra.

◼ El valor numérico particular que toma el


estimador, calculado a partir de datos
muestrales, se denomina estimación.

En el ejemplo anterior, el porcentaje de encuestados a


favor del candidato es el estimador y la estimación es 35%.
Distribuciones muestrales

◼ Las estadísticas por lo general difieren de una


muestra a otra por lo que pueden considerarse
como variables aleatorias.

◼ La distribución de probabilidad de todos los


resultados posibles de una estadística para un
mismo tamaño de muestra se conoce como la
distribución muestral de la estadística.
Ejemplo:
Se desea estimar la fracción defectuosa de un lote grande
de componentes. Se decide seleccionar al azar 5
componentes y utilizar la proporción defectuosa en la
muestra como estimador de la verdadera proporción
defectuosa en el lote.
La cantidad de defectuosos Proporción Probabilidad
en la muestra, X, es una muestral (binomial)
variable binomial. Luego, la 0 0,07776
fracción defectuosa en la 0,2 0,2592
muestra, X/5, también lo es.
Si la fracción defectuosa del 0,4 0,3456
lote es 0,4, la distribución 0,6 0,2304
muestral del estimador será: 0,8 0,0768
1 0,01024
Parámetros
Como cualquier distribución, las distribuciones
muestrales se pueden caracterizar a través de
sus parámetros estadísticos: Esperanza y
Variancia.
El desvío estándar del estimador se denomina
Error Estándar.

Ejemplo:
La distribución muestral de la proporción se
distribuye según una ley binomial con Esperanza = p
y Variancia = p(1-p)/n donde p es la proporción
poblacional. (Demostrar)
La distribución muestral de la proporción seguirá
un modelo:

• Hipergeométrico, si se toma una muestra aleatoria


simple de una población finita sin reposición.
• Binomial, si se toma una muestra simple aleatoria
con reposición de una población finita, o bien, si se
toma una muestra simple al azar con o sin
reposición de una población infinita (o muy grande).
• Normal, cuando se toma una muestra simple
aleatoria grande (tal que np > 5 y nq > 5) de una
población infinita o muy grande.
X
pˆ = ~ N(p; √p(1-p)/n)
n
Distribución muestral de la media
◼ Para la mayor parte de las distribuciones
poblacionales, sin importar su forma, la
distribución muestral de la media se aproxima a
la distribución normal si n ≥ 30 (Teorema Central
del Límite)

◼ Si la distribución de la población es bastante


simétrica, la distribución muestral de la media se
aproxima a la normal si n ≥ 15.
◼ Si la población tiene una distribución normal, la
distribución muestral de la media tiene
distribución normal (para cualquier n).
Muestra aleatoria

Cuando se extrae una muestra aleatoria simple


(MAS) de tamaño n de una población finita con
reposición o de una población infinita podemos
describir las n observaciones por el modelo
matemático de n variables aleatorias
independientes igualmente distribuidas (c/u una
réplica de la distribución de la población)
Esperanza y Error estándar de la media

◼ E [(∑x)/n] = 1/n E (∑x) = 1/n . nμ = μ

◼ Var [(∑x)/n] = 1/n2 Var (∑x) = n/n2 σ2 = σ2/n

◼ Error estándar = σ / √n
Problemas centrales de la inferencia
estadística clásica:

Estimación: Hallar el valor del parámetro de


interés (desconocido).

Prueba de hipótesis: Decidir si el parámetro


es igual (mayor o menor) a algún valor
preconcebido.
Pruebas de hipótesis. Ejemplo.
El equipo de empaque de un proceso de manufactura que
llena cajas de cereal de 368 gr. se ajusta de modo tal que
la cantidad de cereal en las cajas siga una distribución
normal con media de 368 gr. y desvío estándar de 15 gr.
Con el tiempo las máquinas pueden sufrir desajustes y
colocar en las cajas mayor (o menor) cantidad que la que
indica la etiqueta. Se estaría regalando cereal o bien se
corre el riesgo de recibir demandas. Sería muy costoso
pesar cada caja; en cambio, se puede seleccionar una
muestra y tomar decisiones en base a la información que
ésta brinde. Si una muestra de 25 cajas de la producción
diaria arroja un peso medio de 365 gr., ¿el proceso de
llenado está funcionando bien o debe detenerse y ser
ajustado nuevamente?
Pasos para realizar una prueba de hipótesis:

1. Planteo de las hipótesis: Ho es la hipótesis o creencia


convencional, de igualdad o de no cambio y Ha, la
hipótesis de cambio o nueva teoría. Ho se asume cierta
hasta que la evidencia permita inferir lo contrario.

2. Elección de la estadística de prueba y definición de su


distribución muestral suponiendo Ho cierta.

3. Construcción de la regla de decisión: Está compuesta


por dos regiones (de rechazo y de no rechazo)

4. Tomar la muestra y calcular el valor de la estadística

5. Concluir (Toma de decisiones)


Riesgos o errores
Para definir la extensión de las regiones de rechazo y
aceptación, se debe definir la magnitud de los riesgos que
estamos dispuestos a asumir.

Al tomar una decisión podemos cometer 2 tipos de error:

◼error tipo I, si rechazamos Ho cuando es cierta


◼error tipo II, si no rechazamos Ho cuando es falsa

Definimos: P(error tipo I) = α -> Nivel de significación


P(error tipo II) = β -> 1-β: Potencia del test
Relación entre los errores
Generalmente, rechazar Ho es más serio o importante
(deriva en acciones costosas) que aceptarla. Pero
ambos errores son probables de ocurrir.
Desearíamos mantener ambas probabilidades de error
lo más pequeñas posible pero al estar relacionados, al
reducir uno estaremos aumentando el otro.
Como el error de tipo I es más importante (es el que
querremos controlar más), suele fijarse en 0,05.
El valor de α nos permite construir la regla de
decisión. ¿Cuán raro debe ser el resultado para que
decidamos rechazar Ho?
Construcción de la regla de decisión
La regla de decisión consiste en la determinación de
las regiones de rechazo y no rechazo de Ho. El límite
de estas regiones se denomina «valor critico». El valor
critico es un valor de la estadística de prueba que deja
un área igual a α en la curva de la función de densidad
de su distribución muestral (suponiendo Ho cierta).
Para un tamaño de muestra dado, no existe región de
rechazo que logre de forma simultánea que α y β sean
pequeños. Debemos construir una regla de decisión
que logre un equilibrio entre ambos. El método
recomendado es seleccionar el α máximo tolerable.
Esto hace β lo menor posible.
Ejemplo (continuación):
Distintos tipos de prueba:
Según la dirección de la región de rechazo la
prueba puede ser:

◼ Unilateral a la derecha (o de cola superior)

◼ Unilateral a la izquierda (o de cola inferior)

◼ Bilateral
Valor p asociado a la prueba

Un método alternativo y equivalente para realizar una


prueba de hipótesis consiste en calcular la
probabilidad de obtener un valor de la estadística igual
al obtenido para la muestra tomada o más extremo
(más raro de ocurrir si la hipótesis nula es cierta).
Luego, se compara este valor con el nivel de
significación del test:
◼Si p ≤ α => se rechaza Ho
◼Si p ≥ α => no se rechaza Ho
Prueba de hipótesis para la proporción
Prueba de hipótesis para la media con σ
desconocido
Cuando se desconoce la desviación estándar de la
población, se utiliza la desviación estándar de la
muestra para estimarla. Con esto se introduce mayor
aleatoriedad en los valores posibles de la estadística
de prueba. Gosset demostró que cuando se toman
muestras pequeñas de poblaciones normales, la
estadística:
__
σˆ
t = ( X − μ) / ~ tn-1
n
La gráfica de la distribución t de Student es similar a la
normal estándar pero con mayor dispersión y se
aproxima a la normal a medida que n crece.
Para recordar:

Una vez observado el resultado y tomada una


decisión, la probabilidad de haber cometido un
error es 0 ó 1.
Un error común es pensar que esa probabilidad es
igual al valor p-asociado o a α.
Otro error común es interpretar al p-asociado
como la probabilidad de que Ho sea cierta. En
realidad tenemos 2 hipótesis postuladas pero sólo
1 de ellas es cierta aunque no sabemos cuál.
Significancia vs. importancia
Un resultado estadísticamente significativo no será
necesariamente importante en la práctica.
Ejemplo: Al probar una nueva droga podemos observar que
presenta un tiempo medio hasta la cura menor a la droga tradicional
en 0,5 días. Si este resultado es estadísticamente significativo
(p<0,001), esto solo indica que una diferencia de medio día en el
tiempo promedio a la cura entre las dos drogas es imposible de
haber ocurrido por azar si realmente las drogas tuvieran el mismo
efecto. Pero considerando otras variables, como efectos adversos,
costos, esta reducción puede no ser relevante.
¡Cuidado! Con un tamaño de muestra suficientemente
grande, aún una diferencia mínima puede encontrarse
estadísticamente significativa pero no ser necesariamente
importante.

También podría gustarte