Documentos de Académico
Documentos de Profesional
Documentos de Cultura
fundamentales de muestreo y
descripción de datos
Sub tema: Muestreo aleatorio. Distribuciones
muestrales. Distribuciones muestrales de medias.
Teorema del límite central. Aplicaciones.
DF
1
Organización de la Clase
1. Introducción
2. Distribuciones fundamentales de
muestreo
3. Algunas aplicaciones al caso de
medias muestrales
4. Sugerencias para la gestión del
autoaprendizaje
2
1. Introducción
Posición del tema en la asignatura. Relaciones.
Estadística
Descriptiva Inferencial
3
La cuestión del título del tema
4
Distribuciones de frecuencias
en un contexto dado
Cuatro casos:
1. Las bolsas de cemento
2. Los derrames del Río Grande
3. Los caudales del Río Mendoza
4. La resistencia del hormigón
5
Distribución de frecuencias de las
observaciones individuales
Se extrae una muestra de
x1
tamaño n.
j xj
M1
1 x1
2 x2
3 x3
... ...
n xn
fr
x
6
Caso 1. Las bolsas de cemento
Información obtenida de la muestra
n = 40 X: Peso de las bolsas de cemento, en kg
Media = 49,983 kg Trazado de la densidad empírica.
Desv. Est.= 0,060 kg Comparación con la Curva Normal.
Box-and-Whisker Plot Density Trace for Peso
6
5
4
density
3
2
1
0
49,8 49,9 50 50,1 50,2 49,8 49,9 50 50,1 50,2
Peso Peso
12 12
frequency
frequency
9
8
6
4
3
0 0
49,8 49,9 50 50,1 50,2 49,8 49,9 50 50,1 50,2
Peso Peso
7
Caso 2. Los derrames del Río Grande
Información obtenida de la muestra. 15
Histogram for DMA
frequency
9
estación La Gotera. 6
Registro de 27 años. 0
0 2 4 6 8
(X 1000)
DMA
Density Trace
n = 27 años (X 0,0001)
3
2,5
Media = 3.492,33 hm³ 2
density
1,5
0,6
0,4
0
0 2 4 6 8
DMA
(X 1000)
8
Caso 3. Los caudales del Río Mendoza
Box-and-Whisker Plot
frequency
200
150
Mediana = 31,9 m³/s 100
50
8
Q1 =21 m³/s
density
4
Q3 = 55 m³/s 2
0
0 50 100 150 200 250 300
QMMGUIDO 9
Caso 4: La resistencia del hormigón
Resistencia a compresión del hormigón a la edad de 28 días, en kgf/cm².
Resultados obtenidos por alumnos del ciclo 2004 en el laboratorio de
ensayos del ITIEM.
Histograma Polígono de frecuencias
40 25
20
Porcentaje
30
frequency
15
20
10
10
5
0 0
150 200 250 300 350 400 450 150 200 250 300 350 400 450
Tensión Tensión
30
frequency
density
20 4
10 2
0 0
150 200 250 300 350 400 450 150 200 250 300 350 400 450
Tensión (kg/cm²) Tensión
¿Normalidad?
10
Distribución de las observaciones individuales: Formas
Simetría
Media = Moda
¿Qué tanto se aproxima
a la normalidad?
μ
Sesgo derecho Sesgo izquierdo
Media > Moda Media < Moda
μ μ
0 5 10 15 20 25 0 5 10 15 20 25 30
11
2. Distribuciones
fundamentales de muestreo
Aplicación al caso de la
media muestral
12
Población & Muestra
Total de observaciones que nos
interesan para el estudio
(finitas – infinitas) Muestra
(Estadísticas)
Población
x
(Parámetros)
μ
13
Base conceptual para muestrear poblaciones
Se extraen todas las muestras posibles de
tamaño n.
x1
M1 fr
xk i xi
Mk
x2 1 x1
M2 2 x2
3 x3
xi Mi M3 x3 ... ...
x k xk
14
Comparación de las distribuciones de frecuencias
x j xj
M 1
2
3
x1
x2
x3
X
... ... x
n xn
x1 i xi
xk
Mk
M1
M2
x2
1
2
3
x1
x2
x3
X
xi Mi M3 ... ...
x3 k xk x
15
Muestreo Aleatorio
¡Nuestras inferencias acerca de una población han de ser
válidas, siempre que las muestras que obtengamos sean
representativas de tal población!
Definición
Sean X1, X2, ... , Xn variables aleatorias independientes,
cada una con la misma distribución de probabilidad f(x).
Definimos entonces a X1, X2, ... , Xn, como una muestra
aleatoria de tamaño n de la población f(x) y escribimos
su distribución de probabilidad conjunta como:
f(x1, x2, ... , xn) = f(x1) f(x2) ... f(xn)
16
Distribuciones muestrales
Dado que una estadística es una variable aleatoria que
depende de la muestra observada, debe tener una
distribución de probabilidad.
Definición
La distribución de probabilidad de una estadística se llama
distribución muestral.
17
Comparando distribuciones
Si la estadística fuese la media muestral:
n
∑ Xi
X= i =1
Distribución de
muestreo de la media
Distribución de las
observaciones individuales
de la población
μ
x
18
Distribuciones de medias muestrales
PREGUNTAS DE INTERÉS
La muestra:
¿Se obtiene
¿Qué
de tamaño
una población
tiene? normal?
19
Media y varianza de la media muestral
Si X1, X2, ... , Xn representan una muestra aleatoria
de tamaño n, que se toma de una población con
media μX y varianza σ²X, entonces:
n
∑ Xi
X= i =1
n
⎛1 n ⎞ 1 ⎛ n ⎞ 1
E ( X ) = μ X = E ⎜ ∑ Xi ⎟ = E ⎜ ∑ Xi ⎟ = nμ X = μ X
⎝ n i =1 ⎠ n ⎝ i =1 ⎠ n
⎛ 1 n
⎞ 1 ⎛ n
⎞ 1 σ 2
V ( X ) = σ X2 = V ⎜ ∑ Xi ⎟ = 2 V ⎜ ∑ Xi ⎟ = 2 nσ X2 = X
⎝ n i =1 ⎠ n ⎝ i =1 ⎠ n n
σX
σX = Error estándar de la media muestral
n 20
Muestreo de poblaciones Normales
(
X ~ N x; μ X , σ 2 X )
n
∑ Xi
X= i =1
n μX = μX
(
X ~ N x; μ X ,σ 2 X ) σ 2
=
σ 2X
X
n
X: Variable en estudio
0,15
0,12
0,09
0,06
21
Muestreo de poblaciones No Normales
X ~ No normal o Desconocida
Teorema del Límite Central: Si X es la media de una
muestra aleatoria de tamaño n tomada de una población con
media μX y varianza finita σ²X, entonces la forma límite de la
distribución de:
X − μX
Z=
σX
n
Conforme n→∞, es la distribución normal estándar:
Z ~ N (0; 1)