Está en la página 1de 24

Adriana Paola Pachón

adrianap.pachon@urosario.edu.co

Estadística Inferencial
Outline

Resumen

Tipos de muestreo

Estimación puntual
Resumen
Inferencia Estadística

Para tomar decisiones se necesita información. Dicha


información es desconocida, y por tanto es necesario utilizar
datos recolectados de alguna fuente que ayuden a obtenerla.

La inferencia, es el proceso en el cual se pasa de


observaciones particulares de un fenómeno a la
generalización de la teoría. Cuando el tamaño de la muestra
es mayor, nuestras inferencias sobre la proporción
poblacional mejoran.
Resumen
Inferencia Paramétrica

El papel de la estadística es asegurar que los procesos de


inferencia sean los mejores posibles, esto es, que la
probabilidad de cometer errores sea la más pequeña.

Procedimientos estadísticos y de decisión que están basados


en distribuciones conocidas que son determinadas usando
un número finito de estimadores.
Resumen
Distribución de muestreo
Consideremos una muestra aleatoria extraída de una población
que se utiliza para realizar una inferencia sobre alguna
característica de la población, como la media poblacional, 𝜇,
utilizando un estadístico muestral, como la media muestral, 𝑥.ҧ
La inferencia se basa en la comprensión de que cada muestra
aleatoria tiene una 𝒙ഥ distinta y de que, por lo tanto, 𝒙
ഥ es una
variable aleatoria.
Resumen
Distribución de muestreo

La distribución en el muestreo de este estadístico es la


distribución de probabilidad de las medias muestrales
obtenidas de estas muestras posibles del mismo número de
observaciones extraídas de la población.

La distribución de muestreo se puede usar para proporcionar


información probabilística acerca de la diferencia entre la
media muestral y la media poblacional.
Resumen
Distribución de las medias muestrales
Sea 𝑋ത la media muestral de una muestra aleatoria de n observaciones de una población que tiene una media 𝜇 𝑥 y una varianza
𝜎 2 . En ese caso,

1) La distribución de 𝑋ത en el muestreo tiene la media

𝐸 𝑋ത = 𝜇

2) La distribución de 𝑋ത en el muestreo tiene la desviación típica

𝜎
𝜎𝑥 =
𝑛

3) Si el tamaño de muestran, no es pequeño en comparación con el tamaño de la población, N, el error típico de 𝑋ത es

𝜎 𝑁−𝑛
𝜎𝑥 = ∗
𝑛 𝑁−1
Resumen
Distribución de proporciones muestrales
Podemos utilizar la proporción muestral para hacer inferencias sobre la proporción poblacional.
Proporción muestral
𝑋
𝑃෠ =
𝑛

X es la suma de un conjunto de n variables aleatorias de Bernoulli independientes, cada una de las cuales tiene una probabilidad
de éxito P. El número de éxitos en una distribución binomial y la proporción de éxitos tienen una distribución de la que la
distribución normal es una buena aproximación. La aproximación es muy buena cuando : nP 1 − P > 9

1) La distribución de 𝑃෠ en el muestreo tiene la media P.


2) La distribución de 𝑃෠ tiene una desviación típica

𝑃(1 − 𝑃)
𝜎𝑃෠ =
𝑛
3) Si el tamaño de la muestra es grande, la variable aleatoria

𝑃෠ − 𝑃
𝑍=
𝜎𝑃
Resumen
Teorema del límite central
Sean 𝑋1 , 𝑋2 , … , 𝑋𝑛 una colección de n variables aleatorias INDEPENDIENTES e
IDENTICAMENTE DISTRIBUIDAS (iid) con 𝐸 𝑋𝑖 = 𝜇 y 𝑉𝑎𝑟 𝑋𝑖 = 𝜎 2 .
Entonces, para n suficientemente grande, 𝑛 ≥ 30 , se tiene que:

σ 𝑋𝑖 −𝑛𝜇
i. σ 𝑋𝑖 ~𝑁 𝑛𝜇, 𝑛𝜎 2 ⇒ ~𝑁(0,1)
𝜎 𝑛

σ𝑋 𝜎 2 ത
𝑋−𝜇
ii. 𝑋ത = 𝑖 ~𝑁 𝜇,
𝑛 𝑛

𝜎/ 𝑛
~𝑁(0,1)

Si las distribuciones son simétricas, la distribución normal es una buena aproximación de


las medias de las muestras de tamaño n=20 a 25. En el caso de las distribuciones
sesgadas, el tamaño de la muestra generalmente tiene que ser algo mayor.
Resumen

Si se tienen dos muestras aleatorias de tamaño 𝑛1 y 𝑛2 con distribución normal


𝑋1 ~𝑁(𝜇1 , 𝜎12 ) y 𝑋2 ~𝑁(𝜇2 , 𝜎22 ), entonces:

i. 𝑋1 + 𝑋2 ~𝑁 𝜇1 + 𝜇2 , 𝜎12 + 𝜎22

ii. 𝑋1 − 𝑋2 ~𝑁 𝜇1 − 𝜇2 , 𝜎12 + 𝜎22

Si se tienen una muestra aleatoria de tamaño n con distribución normal, 𝑋𝑖 ~𝑁(𝜇, 𝜎 2 ),


entonces:

σ 𝑋𝑖 𝜎2
𝑋ത = ~𝑁 𝜇,
𝑛 𝑛
Muestreo
1) Primer paso: ¿ Qué información se necesita?
2) Segundo paso: ¿Cuál es la población relevante y existe un listado de esa población?
3) Tercer paso: ¿Cómo deben seleccionarse los miembros de la muestra?
- Tipo de muestreo
- Número de miembros de la muestra
4) Cuarto paso: ¿Cómo debe obtenerse información de los miembros de la muestra?
- Obtener la mayor cantidad de respuestas posibles
- Obtener respuestas que sean lo más exactas y sinceras posible
5) Quinto paso: ¿Cómo debe utilizarse la información muestral para hacer inferencias
sobre la población?
6) Sexto paso: ¿Qué conclusiones pueden extraerse sobre la población?
Errores de muestreo y ajenos a él
No es posible saber cuál es exactamente el valor de cualquier parámetro poblacional como
la media o la proporcional debido a que sólo se dispone de información sobre un
subconjunto de todos los miembros de la población.

También podrían cometerse errores si se tomara un censo completo de la población y son


aquellos errores que llamamos ajenos al muestreo. Algunos ejemplos:

1) La población de la que se hace realmente el muestreo no es la relevante


2) Los sujetos de la encuesta pueden dar una respuesta inexacta o falsa
3) Falta de respuesta a las preguntas de la encuesta
Tipos de muestreo
Muestra aleatoria simple

Todos los miembros de una población tienen la misma probabilidad de ser elegidos para la
muestra.

Supongamos que nuestra población esta formada por 1000 individuos, numerados del 1
al 1000 y que se necesita una muestra aleatoria simple de 100 miembros de la población.
Podemos generar una muestra aleatoria simple sacando al azar cada uno de los números.
Sólo consideraremos el muestreo sin repetición. El proceso continúa hasta que se
obtienen los 100 números diferentes.
Tipos de muestreo
Muestreo sistemático
Supongamos que la lista de la población se ordena de una forma que no tiene ninguna
relación con el tema de interés. El muestro sistemático implica la selección de todo j-
ésimo sujeto de la población, donde j es el cociente entre el tamaño de la población N y el
tamaño que se desea que tenga la muestra, n ; es decir; 𝑗 = 𝑁/𝑛. Se selecciona
aleatoriamente un número del 1 al j para obtener el primer sujeto que va a incluirse en la
muestra sistemática.

Ejemplo

Supongamos que se desea que el tamaño de muestra sea de 100 y que la población está
formada por 5000 nombres en orden alfabético. En ese caso, 𝑗 =50. Seleccionamos
aleatoriamente un número del 1 al 50. Si el número seleccionado es 15, seleccionamos
ese número y los sucesivos números obtenidos sumando 50 al número inicial.

Se analiza de la misma forma que una muestra aleatoria simple.


Tipos de muestreo
Muestreo aleatorio estratificado
Si se sospecha al principio que algunas características identificables de los miembros de
la población están relacionadas con el tema de investigación o si algunos subgrupos de la
población tienen un interés especial para el investigador, se puede dividir la población en
subgrupos o estratos y tomar una muestra aleatoria simple de cada estrato. El único
requisito es que sea posible identificar que cada miembro de la población pertenece a un
estrato y sólo a uno.

Supongamos que una población de N individuos puede subdividirse en K grupos


mutuamente excluyentes y colectivamente exhaustivos. Un muestreo aleatorio
estratificado es la selección de muestras aleatorias simples independientes de cada
estrato de la población. Si los K estratos de la población contienen 𝑁1 , 𝑁2 ,..,
𝑁𝑘 miembros, entonces

𝑁1 + 𝑁2 + ⋯ + 𝑁𝑘 = 𝑁
Tipos de muestreo
Muestreo aleatorio estratificado
Análisis de los resultados de un muestreo aleatorio estratificado

Supongamos que se toman muestras aleatorias de 𝑛𝑗 individuos de estratos que


contienen 𝑁𝑗 individuos (j= 1,2,.., K). Sea

𝐾 𝐾

෍ 𝑁𝑗 = 𝑁 𝑦 ෍ 𝑛𝑗 = 𝑛
𝑗=1 𝑗=1

Sean las medias y varianzas muestrales de los estratos 𝑥ഥ𝑗 y 𝑠𝑗2 ( j=1,2,..,K) y la media del
conjunto de la población 𝜇.

1. Un método de estimación insesgada de la media del conjunto de la población 𝜇


genera la estimación puntual
𝐾
1
𝑥𝑠𝑡 = ෍ 𝑁𝑗 𝑥ഥ𝑗
𝑁
𝑗=1
Tipos de muestreo
Muestreo aleatorio estratificado
Análisis de los resultados de un muestreo aleatorio estratificado

2. Un método de estimación insesgada de la varianza de nuestro estimador de la media del


conjunto de la población genera la estimación puntual

donde
Tipos de muestreo
Muestreo aleatorio estratificado
Estimación del total poblacional
Tipos de muestreo
Muestreo aleatorio estratificado
Afijación del esfuerzo muestral a los distintos estratos ¿Cuántas de estas observaciones
muestrales deben asignarse a cada estrato?

1) Proporcional: Si se sabe poco o nada de antemano sobre la población y si no hay


ningún requisito para la producción de información acerca de estratos poco
poblados.
Tipos de muestreo
Muestreo aleatorio estratificado
Afijación del esfuerzo muestral a los distintos estratos ¿Cuántas de estas observaciones
muestrales deben asignarse a cada estrato?

2) Óptima: Si el único objetivo de un estudio es estimar con la mayor precisión posible un


parámetro relativo al conjunto de la población , como la media, el total o la proporción, y si
se tiene bastante información sobre la población.
Tipos de muestreo
Muestreo por conglomerados

Ante el dilema de no tener una lista fiable de la población (muestra aleatoria simple) o
querer hacer entrevistas personales con miembros de la muestra cuando los recursos
presupuestarios son limitados, el investigador puede recurrir al muestreo por
conglomerados. Este método es atractivo cuando la población puede subdividirse en
unidades relativamente pequeñas y geográficamente compactadas llamadas
conglomerados.

Se subdivide la población en M conglomerados, se selecciona una muestra aleatoria


simple de m de estos conglomerados y se obtiene información de cada miembro de los
conglomerados de la muestra, es decir, se realiza un censo completo en cada uno de los
conglomerados elegidos.
Tipos de muestreo
Muestreo de conveniencia

Es una técnica de muestro no probabilística. Los elementos se incluyen sin que haya una
probabilidad previamente especificada o conocida de que sean incorporados en la
muestra.

Tiene la ventaja de que es relativamente fácil seleccionar la muestra y recabar los datos;
sin embargo, es imposible evaluar su “bondad” en términos de representatividad de la
población. Una muestra de conveniencia puede dar buenos resultados o no, ningún
procedimiento justificado estadísticamente permite un análisis e inferencia
probabilísticos acerca de la calidad de los resultados muestrales.
Estimación puntual
Al efectuar los cálculos de 𝑝,Ƹ 𝑥ҧ y S se lleva a cabo el proceso estadístico conocido como
estimación puntual. A la media muestral 𝑥ҧ se le identifica como estimador puntual de la
media poblacional 𝜇.

Las estimaciones puntuales difieren un poco de los correspondientes parámetros


poblacionales.

Estimadores

Sea X una variable aleatoria (población) cuya 𝑓𝑋 (𝑥) depende de un parámetro 𝜃


desconocido. Un estimador del parámetro 𝜃 es una estadística 𝜽 ෡ = 𝑻 𝑿𝟏 , 𝑿 𝟐 , … , 𝑿𝒏
que se utiliza para estimar el valor de dicho parámetro, con base en los valores observados
de la muestra aleatoria.
Estimadores
Criterios para la selección de un estimador:
1) Insesgadez: Que sea insesgado, es decir, que 𝐸 𝜃መ = 𝜃.
2) Eficiencia: De mínima varianza, en el sentido que si 𝜃መ1 y 𝜃መ2 son estimadores
insesgados de 𝜃, se considera mejor aquel de menor varianza.
3) Consistencia: Un estimador puntual es consistente si su valor tiende a estar más
cerca del parámetro poblacional a medida que el tamaño de la muestra
aumenta. Se deben cumplir las siguientes dos condiciones:

 lim 𝐸 𝜃መ = 𝜃
𝑛→∞

 lim 𝑉𝑎𝑟 𝜃መ = 0
𝑛→∞

También podría gustarte