Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Probabilidad y Estadística
Muestreo y Distribuciones
Muestrales
MUESTREO PROBABILISTICO
PROBLEMA: Por razones de gobierno se desea
conocer el ingreso promedio de los habitantes de una
determinada provincia "en un momento dado",
entrevistando para tal propósito a las unidades
familiares que viven en la provincia
POBLACION (o UNIVERSO) de nuestro estudio:
¿conjunto de unidades familiares en la provincia en
estudio?
La población es el conjunto de ingresos totales ($) de
las citadas unidades familiares.
Nos interesan las mediciones de la variable "ingreso"
($) y no la entidad física "unidad familiar".
POBLACION es la totalidad de observaciones en las que
se está interesado.
8
N-6 N
5
2
6
... N-2
1
4 N-3 N-5
3
7 N-1
N-4
2 5
1
...
Muestra aleatoria simple de
n
3
4 6 tamaño n
Sin Reemplazamiento:
Cada una de las Comb(N, n) muestras, tiene la misma
probabilidad de ser escogida.
N: tamaño de la Población y n: tamaño de la muestra.
Todas las unidades de la población tienen la misma
probabilidad de ser extraídas, pero si la población es
finita, la probabilidad de que salga un elemento
dependerá de los que fueron separados anteriormente
para formar parte de la muestra y dejaron, por lo tanto,
de pertenecer a los seleccionables.
También se llama a este método: muestreo irrestricto
aleatorio o muestreo aleatorio simple (muestreo al azar sin
reemplazamiento).
Ya sea que se realice el muestreo con reemplazo en
poblaciones finitas o sin reemplazo en poblaciones
infinitas (tal como algunos procesos continuos de
producción) las fórmulas que se utilizan son las
mismas.
b2) MUESTREO ESTRATIFICADO es aquel en que los
elementos de la población se dividen en clases o
estratos, y la muestra se toma asignando un número
determinado de miembros a cada estrato y escogiendo
por muestreo al azar dentro del estrato.
Existen dos criterios básicos para dividir el
tamaño total entre los estratos:
a) A cada estrato le corresponde igual número de
elementos muéstrales.
b) Proporcionalmente al tamaño relativo del
estrato en la población. La distribución se hace de
acuerdo con el peso (tamaño) de la población en
cada estrato.
Esquema de un muestreo aleatorio
estratificado
Población finita de tamaño
N1 + N2 + .. +NL=N
Estrato 1 Estrato 2 Estrato l
. . .
N1 N2 NL
2 2 1
1 1 2 3
4 5
4 3 4 5 6 6
...
3 7
6 7 8
5 N1 8
... ... N2 NL
7 9 ...
Muestra aleatoria Muestra aleatoria
Muestra aleatoria
simple simple
simple
1 1 2 1 2
2 3 ...
... ...
3 n1 3 nL
4 n2
n = n1 + n2+ …+ nL
Ejemplo de muestreo Estratificado
Muestra
Población
b.3 Otro tipo de muestreo que se utiliza cuando los
elementos de la población están ordenados en listas es
el MUESTREO SISTEMATICO.
Si la población tiene tamaño N, se desea una muestra
de tamaño n.
Sea k = entero más próximo a N/n.
Se elige al azar un elemento entre los primeros k
elementos de la lista → n1 es el orden elegido.
Tomamos los elementos n1+k; n1+2k, etc., a
intervalos fijos de k hasta completar la muestra.
• Si el orden de los elementos en la lista es al azar, este
procedimiento es equivalente al muestreo al azar o
aleatorio.
• Si el orden de los elementos es tal que los individuos
próximos tienden a ser mas semejantes que los
alejados, el muestreo sistemático tiende a ser más
preciso que el muestreo al azar, al cubrir más
homogéneamente toda la población.
El muestreo sistemático puede utilizarse
conjuntamente con el estratificado, para seleccionar la
muestra dentro de cada estrato.
Ejemplo de muestreo Sistemático
Población
Muestra (2
grupos)
Población
La regla general que se aplica a todos los
procedimientos de muestreo es que cualquier
información previa debe utilizarse para subdividir la
población y asegurar la mayor representatividad de
la muestra. Una vez que disponemos de
subpoblaciones homogéneas, la selección dentro de
ellas debe realizarse por muestreo al azar.
x1, x2, ... , xn será una muestra al azar con reposición de ingresos
($)
Si nuestro interés: El ingreso promedio de las n familias de la
provincia), podemos tomar el ingreso promedio de las n familias
entrevistadas
n
x
i 1
i
x
n
Si la selección hubiera recaído en otras n familias (lo que es
completamente factible, pues la selección fue hecha "al
azar"), ¿ 𝑿 podría haber tomado un valor distinto?
¿Podrían haberse presentado valores muy alejados del
que obtuvimos, de manera que por "pura casualidad"
tengamos un valor excepcionalmente alto o bajo?
Para analizar todas estas cuestiones, utilizamos el hecho
básico de que la selección fue hecha al azar y utilizaremos
algunas ideas de probabilidad y variables aleatorias.
MODELO: Usemos la v.a. X para designar a la variable
o característica que se quiere investigar.
n= 174.763 familias entrevistadas
En el ejemplo:
X es el “ingreso total de una unidad familiar”
X tiene una distribución de frecuencias relativas, que muestra las
proporciones de unidades familiares que tiene cada nivel de
ingreso total.
Si x es un valor de la v.a. X → x es el ingreso de una unidad
familiar.
Si hay k familias con ingreso x → k/ 174.763 es la proporción de
familias con ingreso x.
LA POBLACION ES UNA VARIABLE ALEATORIA X QUE
TIENE ALGUNA DISTRIBUCION DE FRECUENCIAS
RELATIVAS (que sumen 1).
x P(X = x)
1 0,20 =20/100
2 0,30 =30/100
3 0,50 = 50/100
Las posibles muestras de tamaño 2 y sus respectivas
probabilidades se presentan en la tabla siguiente:
x1 +x2 + … + xn X1 +X2 + … + Xn
=x → será un valor del estadístico x =
n n
3 P{(3,3)} = 0,25
x
E( ) = 1∙ 0,04 + 1,5 ∙ 0,12 + 2∙ 0,29 +2,5 ∙ 0,30 + 3 ∙ 0,25 = 2,3
= E(X)
E(x2 ) = 12∙ 0,04 + 1,52 ∙ 0,12 + 22∙ 0,29 +2,52 ∙ 0,30 + 32 ∙ 0,25 =
5,59
σ2 0,61
V(X) = 5,59 – 2,32 = 0,305 = =
n 2
s2 P(S2 = s2)
P{(1,1), (2,2), (3,3)}=
0 0,04+0,09+0,25 = 0,38
P{(1,2), (2,1), (2,3), (3,2)}= 0,06 +
0,5 0,06 + 0,15 + 0,15 = 0,42
2 P{(1,3), (3,1)}= 0,10 + 0,10 = 0,20
Var(P)=0,029
a) 𝑷 𝟎, 𝟐𝟓 ≤ 𝒑 ≤ 𝟎, 𝟑𝟓 =aplico corrección por continuidad
1 1
𝑃 0,25 − ≤ 𝑝 ≤ 0,35 + = 𝑃 0,248 ≤ 𝑝 ≤ 0,352
2∗250 2∗250
Estandarizo
0,352−0,30 0,248−0,30
P(𝑍 ≤ ) - P(𝑍 ≤ )=
0,029 0,029
P(𝑍 ≤1,79) - P(𝑍 ≤-1,79) = 0,9633 – 0,0367 = 0,9266
1.3 Muestreo de una población X de cualquier forma
funcional (Teorema Central del Límite)
Dada una población X de cualquier forma funcional con una
media y varianza 2 finita y sea X1, X2, … , Xn una muestra
aleatoria de esa población.
Si n es suficientemente grande el estadístico tiene
aproximadamente distribución Normal.
Esto es por ejemplo
𝜎2
Si n es grande, 𝑋 ~ N 𝜇𝑋 = 𝜇 , 𝜎𝑋2 =
𝑛
¿Qué tan grande debe ser la muestra para que el TCL sea
aplicable?
Regla empírica: En la mayoría de las aplicaciones prácticas
una muestra de tamaño 30 es suficiente.
En general, la aproximación a la normalidad del estadístico
mejora a medida que crece el tamaño de la muestra.
Distribución Muestral de la Varianza muestral S2
Si S2 es la varianza de una muestra aleatoria de tamaño n que se toma
de una población normal que tiene varianza 2, entonces el estadístico
𝑛−1 𝑆 2 Xi − X 2
2 = = 𝑛
𝑖=1 𝑛−1
𝜎2
3,52 ∗29
P(𝑆 2 > 3,52) = P(𝜒 2 > )
4,52
=P(( 𝜒 2 > 17,54 )=0,95311, concluimos
que si es mayor la probabilidad
BIBLIOGRAFÍA:
• Elementos de la Teoría del Muestreo - Dr. Raúl Pedro
MENTZ- Instituto de Investigaciones Estadísticas (INIE) -
Universidad Nacional de Tucumán
• Probabilidad y estadística para ingeniería y ciencias, Ronald
E. Walpole, Raymond H. Myers, Sharon l. Myers y Keying Ye.
(2012). Probabilidad y estadística para ingeniería y ciencias, 9ª
Edición. Ed. Pearson educación
• Estadística para Administración. Berenson – Levine –
Krehbiel. 4ta. Edición Ed. Pearson.
• Probabilidad y estadística para Ingeniería y Ciencias. Jay L-
Devore. 6ta. Edición (2005). Ed. Thompson
• Estadística para administración y economía, 10a. Edición
Anderson, David R.,Dennis J. Sweeney y Thomas A. Williams -
Cengage Learning
• Probabilidad y aplicaciones estadística, Meyer, Campos,
Cuellar, Esparza – Edición Revisada – Ed. Addison Whesley