Está en la página 1de 11

28/03/2018

ESTADÍSTICA II
UAH

Clase 03: Distribuciones muestrales y error estándar.


Teorema del límite central.

~Marcela Moraga Cubillos~


memoraga@uc.cl

3. Distribución de probabilidades

Ejemplo 7: Variables discretas


Habitaciones utilizadas solamente para dormir.
Unidad de análisis: hogares.
Censo (2002)
− ¿Cuál es la variable aleatoria?
0 piezas 0,68 27.773
− Dibuje la distribución de probabilidad.
− Calcule la media y la desv. est. para estos datos. 1 piezas 22,43 919.123
2 piezas 38,55 1.579.780
Media     x  P ( x)   E ( x) 3 piezas 27,58 1.130.259

Varianza  2   ( x   ) 2  P( x)  4 piezas 7,94 325.149


5 piezas 2,02 82.904
   ( x   ) 2
 P( x)  6 + piezas 0,79 32.500
Desv. Est.
   ( x 2

 P( x)   2

~Marcela Moraga Cubillos~ memoraga@uc.cl~ 7

~Marcela Moraga Cubillos~ 1


28/03/2018

3. Distribución de probabilidades

Ejemplo 7: Variables discretas Censo (2002) x*P(x) x2*P(x)

0 piezas 0,0068 0,0 0


− Variable aleatoria  X=Número de
piezas usadas para dormir en el hogar. 1 piezas 0,2243 0,2243 0,2243

2 piezas 0,3855 0,7711 1,5422

3 piezas 0,2758 0,8276 2,4826


0,5
0,4 4 piezas 0,0794 0,3175 1,2696

0,3 5 piezas 0,0202 0,1012 0,5058


0,2 6 + piezas 0,0079 0,0475 0,2855
0,1 Suma 1,0 2,2891 6,3101
0 μ 2,2891
0 1 2 3 4 5 6+
σ2 1,0701
σ 1,0345

~Marcela Moraga Cubillos~ memoraga@uc.cl~ 8

3. Distribución de probabilidades

Ejemplo 8: Variables categóricas


Censo (2002). Mayores de 15 años
Variable aleatoria  X=Afiliación
religiosa 1. Católica 69,96
2. Evangélica 15,14
− Calcule la media y la desv. est. para estos 3. Testigo de Jehová 1,06
datos.
− ¿A qué podría equivaler p y q? 4. Judaica 0,13
5. Mormón 0,92

Media   P( x 1) 6. Musulmana 0,03


7. Ortodoxa 0,06
8. Otra 4,39
Varianza   pq
2
9. Ninguna, ateo, agnóstico 8,30
Total 100
Desv. Est.   pq 11.226.309

~Marcela Moraga Cubillos~ memoraga@uc.cl~ 9

~Marcela Moraga Cubillos~ 2


28/03/2018

3. Distribución de probabilidades

Ejemplo 8: Variables categóricas Censo (2002). Mayores de 15 años


1. Católica 69,96 69,96
X=Afiliación religiosa
2. Evangélica 15,14
p(catolica )  0,6996
3. Testigo de Jehová 1,06
q(no.catolica )  0,3004
4. Judaica 0,13
5. Mormón 0,92 30,04

Media   P( x 1)  0,6996 6. Musulmana 0,03


7. Ortodoxa 0,06
  pq
8. Otra 4,39
Desv. Est.   0,6996  0,3004 9. Ninguna, ateo,
8,30
agnóstico
  0,2102  0,4585 Total 100
11.226.309

~Marcela Moraga Cubillos~ memoraga@uc.cl~ 10

4. Curva normal y probabilidades


Ejemplo

Hace algunos años nuestro país está participando en Estudio Internacional de


la Enseñanza en Matemáticas y Ciencias (TIMSS) . Se realiza una prueba para
ver el rendimiento en matemáticas y ciencias en 4º básico, 8º básico y final de la
secundaria. Esta prueba tiene una distribución normal con un promedio de 500
puntos y una desviación estándar de 100 puntos.

Determine:

1. Si se elige un niño al azar


1.1. ¿Cuál es la probabilidad que obtenga un puntaje TIMSS entre 500 y 590
puntos?
1.2. ¿Cuál es la probabilidad que obtenga un puntaje TIMSS menor a 250 puntos?

2. ¿Sobre que puntajes está el 10% superior de rendimiento?

~Marcela Moraga Cubillos~ memoraga@uc.cl~ 14

~Marcela Moraga Cubillos~ 3


28/03/2018

4. Curva normal y probabilidades

En la práctica, la inferencia estadística se hace a partir de distribuciones de


probabilidad y a distribuciones muestrales (next).

Distribución de Curva que se construye al asociar a cada suceso su



probabilidad probabilidad teórica (de largo plazo).

Distribución Distribución de probabilidad de un estadístico


muestral de un  muestral al obtener infinitas muestras de igual
estadístico tamaño y provenientes de la misma población

~Marcela Moraga Cubillos~ memoraga@uc.cl~ 15

5. Distribución muestral de un estadístico


Distribución muestral de un estadístico (x-barra u otro)

Es la distribución
distribución de
de probabilidad
probabilidad (teórica)
(teórica)de
deununestadístico
estadísticomuestral
muestralquequesurge
surgealal
obtener infinitas muestras
muestras (muestreo
(muestreo repetido)
repetido) de
de igual
igual tamaño
tamaño yyprovenientes
provenientesdedelala
misma población.

− Es consecuencia de trabajar con muestras y no con poblaciones (muestreo)

− Permite estimar cuán probable es que, con una única muestra, se le “achunte” al
parámetro poblacional.

− El resultado siempre es una variable continua.


 Aún si la variable original (de la que se obtiene el estadístico) es
dicotómica, ordinal, o continua.

− A mayor n (tamaño de cada una de las infinitas muestras), la distribución muestral


del estadístico tiende a ser normal (Teorema del Límite Central, next).

~Marcela Moraga Cubillos~ memoraga@uc.cl~ 16

~Marcela Moraga Cubillos~ 4


28/03/2018

5. Distribución muestral de un estadístico

Como la distribución muestral es poblacional (¿por qué?), su promedio y


desviación estándar serán parámetros poblacionales.

El promedio y la dispersión de la distribución muestral serán:

 Promedio  μ Parámetros poblacionales.


Proporción  π Ley de los números grandes (ver diapositiva siguiente).

 Desviación estándar  Error Estándar (next).

~Marcela Moraga Cubillos~ memoraga@uc.cl~ 17

5. Distribución muestral de un estadístico

Ley de los números grandes

- A medida que aumenta la cantidad de observaciones, la probabilidad


empírica tenderá cada vez más a la probabilidad teórica (ver diapositiva
siguiente).

- La diferencia entre el estadístico muestral (xbarra, p) y el parámetro


poblacional (μ, π) tiende a 0 cuando el tamaño de la muestra tiende a
infinito.

- A mayor tamaño de la muestra, menor será el error estándar (menos error


en la distribución muestral) (Ritchey 2006: 201).

-
~Marcela Moraga Cubillos~ memoraga@uc.cl~ 18

~Marcela Moraga Cubillos~ 5


28/03/2018

5. Distribución muestral de un estadístico


Ley de los números grandes
Ejemplo (Bahamón & Martínez, 2014)

- Probabilidad de obtener cierto número al lanzar un dado.


- Probabilidad teórica: 1/6 (16,7%)
Lanzamientos: 100 Lanzamientos: 10.000

~Marcela Moraga Cubillos~ memoraga@uc.cl~ 19

5. Distribución muestral de un estadístico


Error estándar (EE)

− Es la desviación estándar de una distribución muestral.


Es la desviación estándar de una distribución muestral. Describe la variabilidad
de x-barra de muestra a muestra.

Nota Qμ = (1-P μ)
x x  p  P  Q
n n
Ojo:
− Depende de la desviación estándar observada y del tamaño de las muestras.
− Si el n de las “infinitas muestras” aumenta, el error estándar disminuye (ley de
los números grandes).
− Si la variable original es más heterogénea (dispersa), el error estándar aumenta.

~Marcela Moraga Cubillos~ memoraga@uc.cl~ 20

~Marcela Moraga Cubillos~ 6


28/03/2018

5. Distribución muestral de un estadístico


Error estándar (EE)
Si la variable original es más
dispersa, el EE aumenta.

N=1500 Si aumenta n de las muestras, se


reduce el error estándar y la
curva se vuelve más angosta.

Suponga σ=0,5

N=100
x x  0,5  0,05
n 100

x x  0,5  0,013


Agresti & Finlay (1997), p. 103. n 1500

~Marcela Moraga Cubillos~ memoraga@uc.cl~ 21

5. Distribución muestral de un estadístico

Ejemplo 11

Distribución de probabilidad (poblacional) del número de años transcurridos


desde el ingreso a la universidad entre estudiantes de un curso de sociología

~Marcela Moraga Cubillos~ memoraga@uc.cl~ 23

~Marcela Moraga Cubillos~ 7


28/03/2018

5. Distribución muestral de un estadístico


Distribución de probabilidad del número de años Distribución muestral de la media de años
transcurridos desde el ingreso a la universidad entre transcurridos desde el ingreso a sociología
estudiantes de un curso de sociología (n=69) Muestras de tamaño 40
x P (x) X barra P (x)
0 0,0290 .
1 0,0290 .
2 0,4928 .
3 0,2899 2,71 0,08
4 0,1014 2,72 0,10
5 0,0145 2,73 0,08
6 0,0000 2,74 0,05
7 0,0145 . .
8 0,0000 . .
9 0,0290 . .

μ=2,7249 σ=1,4928 μxbarra=2,7249 σxbarra=0,236

x x  x  1,4928
n  0,236
40
~Marcela Moraga Cubillos~ memoraga@uc.cl~ 24

5. Distribución muestral de un estadístico


Distribución de probabilidad del número de años Distribución muestral de la media de años
transcurridos desde el ingreso a la universidad entre transcurridos desde el ingreso a sociología
estudiantes de un curso de sociología (n=69) Muestras de tamaño 40
x P (x) X barra P (x)
0 0,0290 .
1 0,0290 .
2 0,4928 .
3 0,2899 2,71 0,08
4 0,1014 2,72 0,10
5 0,0145 2,73 0,08
6 0,0000 2,74 0,05
7 0,0145 . .
8 0,0000 . .
9 0,0290 . .

μ=2,7249
0,6
σ=1,4928 μxbarra=2,7249 σxbarra=0,236
0,4

0,2

0
0 1 2 3 4 5 6 7 8 9

~Marcela Moraga Cubillos~ memoraga@uc.cl~ 25

~Marcela Moraga Cubillos~ 8


28/03/2018

5. Distribución muestral de un estadístico


100 muestras de 10 casos 100 muestras de 25 casos

100 muestras de 40 casos

~Marcela Moraga Cubillos~ memoraga@uc.cl~ 26

5. Distribución muestral de un estadístico


Teorema del límite central

1) Si la variable se distribuye normalmente en la población, la distribución


muestral de medias (de las infinitas muestras aleatorias) darán lugar a una
distribución muestral que también es normal (para cualquier n).

2) Con independencia de la distribución de una variable en la población


(v. gr. sesgada, dicotómica u otra), la distribución muestral tenderá a ser
normal si es que el tamaño de cada una de las infinitas muestras es
suficientemente grande.

− Habitualmente esto se cumple con muestras de más de 30 (más de 120) casos.


− Si la distribución original es más sesgada, se requieren muestras más grandes.
− Esto permite hacer inferencias cuando la distribución de la población es irregular
(habitual en ciencias sociales) (ver diapositiva siguiente).

~Marcela Moraga Cubillos~ memoraga@uc.cl~ 27

~Marcela Moraga Cubillos~ 9


28/03/2018

5. Distribución muestral de un estadístico

Si el tamaño muestral es
suficientemente grande, la
distribución del estadístico tenderá
hacia la normalidad.

Ello aún si la variable original no


se distribuye normal, por ejemplo,
si la variable es:
dicotómica,
con forma de U,
exponencial
sesgada,
u otra cosa.

Agresti & Finlay (1997), p. 104.


~Marcela Moraga Cubillos~ memoraga@uc.cl~ 29

5. Distribución muestral de un estadístico

¿Y qué pasa si la muestra es pequeña (n<120 casos)?

- Los estadísticos muestrales no se distribuirán normal, sino que siguiendo


a una curva de forma será más chata y alargada en las colas (platicúrtica).

- A esta distribución se le llama T de Student, que busca corregir los


errores de muestras pequeñas (o cuando se usan datos de la muestra como
proxy de los poblacionales).
 Coming soon.

~Marcela Moraga Cubillos~ memoraga@uc.cl~ 31

~Marcela Moraga Cubillos~ 10


28/03/2018

Resumen

En una población En un muestra En una distribución muestral

Parámetro
Estadístico muestral
poblacional

Media x Xx x

Proporción Px ,  x px Px ,  x

Desviación x sx x x
estándar n

Px  Qx px  qx  p  P  Q
n

~Marcela Moraga Cubillos~ memoraga@uc.cl~ 32

7. Distribuciones de probabilidad: Distribución normal estándar


Distribución normal estándar

www.savagechickens.com
~Marcela Moraga Cubillos~ memoraga@uc.cl~ 35

~Marcela Moraga Cubillos~ 11

También podría gustarte