Está en la página 1de 36

Muestreo y

Distribuciones en el
Muestreo

Población y muestras
• Población es la totalidad de elementos sobre los
que se desea estudiar un tema en particular.
• Muestra es un subconjunto de elementos de una
población.
 ESTADISTICO MUESTRAL
 PARAMETRO
Medida que se calcula
POBLACIONAL
con los elementos de
Medida que se calcula
una muestra.
con todos los elementos
que componen la
, s, p
población
Variable.
,INFERENCIA
P
ESTADÍSTICA: esConocido.
la parte de
la
Desconocido.
Fijo.
estadística que
comprende una serie de técnicas
para generalizar a una población los resultados
obtenidos de una muestra.

Muestreo
Es el procedimiento por el cual se selecciona un
(sub)conjunto de elementos de una población.
Utilizamos el muestreo cuando no es posible contar o
medir todos los elementos de la población.
Para que los resultados de una muestra sirvan para
efectuar inferencias confiables, la muestra debe ser
seleccionada aleatoriamente.
Una muestra es aleatoria si se obtiene de manera que
todos los elementos de la población tienen una
probabilidad conocida de ser seleccionados.

Determinar el tamaño de la muestra (más adelante) Elegir un método de selección de muestra Seleccionar la muestra Definir un procedimiento de estimación (más adelante) 7. Identificar los elementos. 2. Identificar el marco de muestreo (listado de todas las unidades de muestreo que pueden ser seleccionadas) 3. lugar físico y tiempo en el que se recogen los datos. Obtener las estimaciones y los errores del muestreo (más adelante) . Definir la población.Diseño de muestras Contempla una serie de pasos a seguir para obtener la muestra: 1. 5. 6. 4.

-Cada muestra tiene una probabilidad conocida de ser seleccionada. -No conocemos la precisión del estimador.Método de selección de muestras. -Conocemos la precisión del estimador PODEMOS HACER No Probabilístico -Cada muestra tiene una probabilidad desconocida de ser seleccionada. NO PODEMOS HACER INFERENCIA . El muestreo puede ser: Probabilístico -Se usan muestras aleatorias. -Es posible conocer el error de muestreo. -Se usa la teoría de probabilidades. -No es posible conocer el error de muestreo.

. un barrio.Métodos de selección de muestras Muestreo probabilístico • • • • Aleatorio simple Estratificado Sistemático Por Conglomerados Muestreo no probabilístico • Por conveniencia (personas en la caja de supermercado. voluntarios para una prueba. etc) • Por juicio (se elije una escuela.) • Por cuotas (se establecen cantidades de personas con alguna característica (edad y sexo)) .

Se usan números aleatorios (muestras con y sin reemplazo) .Muestreo aleatorio simple Cada posible muestra tiene igual probabilidad de ser seleccionada y cada elemento de la población total tiene una oportunidad igual de ser incluido en la muestra.

• Se determina un “salto” p=N/n. • Se sortea un “arranque” (valor menor a p). existe el problema de introducir un error en el proceso de muestreo.Muestreo sistemático • Los elementos son seleccionados de la población dentro de un intervalo uniforme. – Menos costo que un aleatorio simple – En este tipo de muestreo. • Se saltean p elementos y se selecciona el siguiente. .

o no proporcional) • Supone que los estratos son homogéneos al interior.Muestreo estratificado • Se divide a la población en grupos relativamente homogéneos (ESTRATOS) • Dentro de cada estrato se selecciona aleatoriamente un conjunto de elementos (asignación proporcional. .

• Se sortean aleatoriamente. Al interior de los sorteados.Muestreo por conglomerados • Se divide a la población en conglomerados. heterogéneos al interior. se sortean los elementos. . • Supone que los conglomerados son homogéneos entre sí.

• Podemos definir una variable aleatoria .Si el método de selección de muestras es probabilístico: La selección de la muestra es un EXPERIMENTO ALEATORIO en el que: • Cada muestra posible es un evento aleatorio. • Podemos identificar: – la probabilidad de cada una y – la distribución de probabilidad de las muestras.

C y D. . B.Ejemplo • Tenemos una población compuesta por 4 escuelas rurales: – A. hay 16 muestras posibles: Muestra 1 Muestra 2 Muestra 3 Muestra 4 Muestra 5 Muestra 6 Muestra 7 Muestra 8 Muestra 9 Muestra 10 Muestra 11 Muestra 12 Muestra 13 Muestra 14 AA AB AC AD BA BB BC BD CA Probabilidad de cada muestra 1/16 1/16 1/16 1/16 1/16 1/16 1/16 1/16 1/16 CB 1/16 CC 1/16 CD 1/16 DA 1/16 DB 1/16 CADA MUESTRA TIENE UNA PROBABILIDAD CONOCIDA DE SER SELECCIONADA. • Si queremos seleccionar muestras con reemplazo de tamaño n=2.

X= Media de maestros por escuela (). ALEATORIA. siendo que: A=2 maestros.250 0. Media de Muestr Seleccio maestros por a escuela na Muestra 1 Muestra 2 Muestra 3 Muestra 4 Muestra 5 Muestra 6 Muestra 7 Muestra 8 Muestra 9 Muestra 10 Muestra 11 Muestra 12 Muestra 13 Muestra 14 AA AB AC AD BA BB BC BD CA 2 3 4 5 3 4 5 6 4 CB 5 CC 6 CD 7 DA 5 DB 6 es una VARIABLE Distri = Media de b maestros por proba escuela b. B=4 maestros.P() 2 3 4 5 6 7 8 1/16 2/16 3/16 4/16 3/16 2/16 1/16 0.Ejemplo (continuación) Se •  quiere estudiar el promedio de maestros por escuela.200 0. C=6 maestros.300 0.000 2 3 4 5 6  ES UNA VARIABLE ALEATORIA del tipo “MEDIA MUESTRAL” 7 8 .150 0.100 0.050 0. D=8 maestros .

5 0 0 0.5 p ES UNA VARIABLE ALEATORIA del tipo “PROPORCIÓN MUESTRAL” .5 0.5 1 x= proporción de escuelas p P(X) 0 4/16 0.5 0. así como definimos la variable aleatoria Media muestral.5 0.5 0. podríamos haber definido la variable: Proporción de escuelas Proporción de con más de escuelas con 5 maestros (p).5 0. Muestra Selección Muestra 1 AA Muestra 2 AB Muestra 3 AC Muestra 4 AD Muestra 5 BA Muestra 6 BB Muestra 7 BC Muestra 8 BD Muestra 9 CA Muestra 10 CB Muestra 11 CC Muestra 12 CD Muestra 13 DA Muestra 14 DB Muestra más de 5 maestros 0 0 0.5 8/16 1 4/16 1 0.Ejemplo (continuación) • En el ejemplo.

queremos conocer: la media. la varianza y la distribución.Vamos a estudiar 2 variables aleatorias: Media muestral   y Proporción muestral p Como con todas las v.a. (ES UN EJERCICIO TEORICO!!! ) (No tiene sentido aplicarlo en la práctica!!) .

Queremos conocer cuál sería el comportamiento de todas las muestras posibles. sabemos que cada una puede dar resultados diferentes.Cuál es el sentido  de estudiar y p? Si realizamos varias muestras. Sabiendo cuál es el comportamiento de todas las muestras posibles. vamos a poder hacer inferencia . vamos a tener sólo una muestra. En la práctica.

  V. x x   X  n NO podemos saber cuál será la media de una muestra.A Media Muestral • La media (o valor esperado) de todas las medias obtenidas en infinitas muestras sacadas de una población será igual a la media de la población. pero podemos ver que cualquiera sea su valor fluctuará en torno a su media. con una dispersión conocida s: • La desviación estándar de la variable Media Muestral ( o error típico/estandar) será igual a las desviación estandar de la población dividida por la raíz cuadrada (Factor de del número de casos de la muestra:  S corrección  N  n s   x grande o muestra con reemplazo s  Población Población pequeña) o muestra x n n sin reemplazo n N 1 Y la distribución??? .

o si la distribución no es normal. Estadísticos SUMA • Media Muestral • Proporción Muestral p . pero su tamaño es suficientemente grande (>=30) la distribución de los estadísticos “suma” será NORMAL.Teorema Central del Límite (TCL) • Si   se extraen infinitas muestras de una población con distribución normal.

Distribución de media de muestras para distintas poblaciones y distintos tamaños de muestra .

Por el TCL. la Distribución de la variable Media Muestral es Normal   en símbolos: ) (siempre que la distribución de la variable sea Normal o n>=30) Propiedades de la distribución normal: -Simétrica -Conocida la media y la desviación. se puede conocer la proporción de casos comprendidas en cualquier intervalo de la distribución -Se puede conocer la probabilidad de obtener un determinado valor (una determinada media muestral) .

la probabilidad de las medias muestrales). sabemos que el 95.4% . En símbolos: P( ≤=95. Por ejemplo.4% de las medias x muestrales se encontrará entre la media de medias muestrales (que es igual al parámetro Media de la Población ) y 2 unidades de desvíos estándar . por lo que podemos conocer la probabilidad de obtener cada media en cada muestra (es decir.Para qué sirve? SI •  EL MUESTREO ES PROBABILISTICO. cuál es la probabilidad de que la media (muestral) se encuentre entre la media de la población y 2 unidades de desvío? 95. la distribución de la variable media muestral es NORMAL.4% Si obtengo una única muestra.

954 • Para un z=±1. la Proporción es 99.57)=0. la Proporción es 95.95 • Para un z=±2. la Proporción es 95.57 ≤ z ≤ 2.96.96 ≤ z ≤ 1.0% P(-1.96)=0.4% P(-2 ≤ z ≤ 2)=0.99 .En términos generales: P( •  ≤=?? La proporción/probabilidad está determinada por z: • Para un z=±2.57.0% P(-2.

997 P(μ   .3� x μ + 3� )=0.•P(  ≤=  P(a x b)=? P(μ   . vamos a necesitar una u otra fórmula (ver ejemplos a continuación) .955 Surge de despejar en: P(μ   .z� x μ + z� )=?? P(z ≤ z ≤ )= P( ≤ z ≤ )= Porque z= Según cuál sea la incógnita.2� x μ + 2� )=0.

con una desviación de =1m. 2) Resuelvo: P( ≤=95.Ejemplo Sabemos que la altura promedio de la población de •   niños de 12 años de Córdoba es de =1. 2 = P(1 ≤=?  La incógnita son los límites del intervalo (1.4% de las medias de las muestras ? Y el 95%? P( ≤= 1= . entre qué valores quedará comprendido el 95% de las medias de las muestras? P( <=95% . • Si se realizan muestras de n=100 niños.4% P( ≤=95% • Si las muestras son de n=400 niños. entre qué valores quedará comprendido el 95.4m.

.45)? 1 = = 1. 2 == 1.45)=? P( <z<)=? La incógnita es la proporción/probabili dad (P=?).35 . cuál es la probabilidad que de su media quede comprendida entre ±0.35-1. entre 1.Ejemplo (cont) •  Si elijo una única muestra de n=400.05 (es decir. para un determinado intervalo.45 Convierto a unidades estandarizadas P(1.35<<1. Despejo z para entrar a la tabla Normal.

uso: P( ≤ z ≤ )=? .• Si   la incógnita son los límites del intervalo uso: P( ≤= • Si la incógnita es la probabilidad de que la media de la muestra se encuentre en un intervalo dado.

proporción de pobres. . etc etc. proporción de votos de un candidato.A Proporción   Muestral Proporción=éxitos/eventos posibles ó Proporción=casos favorables/total casos. Ej: proporción de ocupados.V.

(Poblaciones grandes o igual al con muestras reemplazo) .V. n= tamaño de la muestra. Q: probabilidad de fracaso (=1-P) en la población.A Proporción   Muestral •   • El valor esperado/esperanza matemática/media de la Proporción Muestral será igual a la Proporción Poblacional () = π (la media de todas las proporciones muestrales p será parámetro P) • La desviación de p muestral será igual a Siendo P: probabilidad de éxito en la población. • La distribución será Normal (por TCL).

entre qué niveles (proporciones) de pobreza quedará comprendido  La incógnita son los el 95% central de las muestras? límites del intervalo (1.Ejemplo •• La   pobreza en Córdoba alcanza el 20% de la población. cuál es la La incógnita es la probabilidad de que el nivel de pobreza de la muestra probabilidad p sea menor a un 25% en esa muestra? P( ≤ 25%)=? P(z ≤ )=? . 2) para una determinada • P( ≤ =95 % probabilidad P( ≤ =95% • Si las muestras son de n=500 casos? • Si se extrae una única muestra de 500 casos. Si se realizan infinitas muestras de n=100.

9% 500 0.8%     P(< = P(<= Si la muestra es de 100 casos.079 0.025 0.9%) 23.1% 27. el 95% central de las muestras tendrá una proporción entre 12.Para un determinado valor de z.0 P= % 80.5% 22.079 (12.025 17.96 distribución) Q= % Estos n límites variarán según p1 el tamaño p2 de la muestra: n p1 p2 100 0.9% 400 0.0 (95%central de la Z=±1.5% 2000 0.5% 500 0.018 18.035 16. de una población en la que el parámetro es P=20% (y Q=80%). interesa conocer entre qué valores se encuentra el 95% central de las proporciones muestrales.5% 22.2% 21.1% 27.1% y 27.039 16.9%) 100 (12.5% 1000 0.5% 23.1% 23.5% 1000 17.9% . los límites del intervalo varían según el tamaño de la muestra: Por ejemplo.5% 23. P y Q.035 16.1% 400 0.039 16. 20.

1000 40 0 10 0 .

¿entre qué valores quedará comprendida la proporción de votantes a ese candidato en el 95% central de las muestras? • 2.Ejercicio 1 • En una población (grande) el 25% de los ciudadanos tienen la intención de votar al candidato A. Si se extraen “infinitas” muestras probabilísticas de 100 casos: • 1. entre qué valores queda comprendido el 95% central de las muestras? • 3. si las muestras son de 500 casos. cuál es la probabilidad de obtener una muestra en la que la proporción de votantes al candidato A sea menor a 20%? (para n=100 y n=500) .

25 1.Resolución ejercicio 1 • P=0. n=500 P( ≤ =95 % 3. n=100 P( ≤ =95 % •   P( ≤ =95 % 2. P( ≤ 0.2)=? P(z ≤ )=? Z= )= = Z1 (buscamos en la tabla Z1 ) .

se realizó una muestra de 100 hogares en la que 30 hogares eran pobres. ¿entre qué proporciones de pobreza quedará comprendido el 95% central de las muestras? • 2. • 1. si las muestras son de 800 casos.Ejercicio 2 • En una población. ¿cuál es la probabilidad de encontrar una muestra con esas características? . entre qué valores queda comprendido el 95% central de las muestras? • 3. Si se extraen “infinitas” muestras probabilísticas de 200 casos. el 15% de hogares viven bajo la línea de pobreza.

Resolución ejercicio 2 • P=0. n=100 con 30 hogares pobres. P( ≤ 0. n=800 P( ≤ =95 % 3.15 1.3)=? P(z ≤ )=? Z1= )= = Z1 (buscamos en la tabla Z1 ) . n=200 P( ≤ =95 % •   P( ≤ =95 % 2.

( .