Está en la página 1de 19

Tema 4: Muestreo y Distribuciones

en el muestreo
Introducción

Conceptos de Población y Muestra

Tipos de muestreo

Definición de Muestra Aleatoria Simple (mas)


T4 Parámetros poblacionales y estadísticos muestrales

1
Características de las distribuciones en el muestreo (para
cualquier población)

Muestreo en poblaciones Normales


Introducción
La Estadística es una materia que se ocupa de analizar la realidad recogiendo
observaciones de las que se obtiene información a fin de facilitar la toma de
decisiones. Hasta ahora se han estudiado dos partes/etapas previas de la
Estadística: La estadística Descriptiva y la Probabilidad.

Pues bien, en esta parte del curso de Estadística Teórica nos centraremos en la
Inferencia Estadística. Esto es, si hasta ahora estudiábamos y
modelizábamos un fenómeno aleatorio que se daba en la realidad, ahora
tratamos de INFERIR a partir de unos datos obtenidos de la realidad, las
características de este fenómeno.

Al conjunto de técnicas que tienen como objetivo extraer conclusiones para una
T1
población a partir de la información que proporciona una muestra se le
denomina INFERENCIA ESTADÍSTICA.

El objetivo de este tema es el de ofrecer una introducción acerca de las


nociones básicas de las técnicas utilizadas en Inferencia Estadística:

- Muestra y sus características


2
-Comportamiento de muestras que proceden de poblaciones normales
Conceptos de Población y Muestra
Población: es el conjunto de todos los posibles resultados de un fenómeno sobre el
que estamos interesados en obtener conclusiones (Ej. Empresas, personas,
vehículos, etc…).
 Normalmente es demasiado grande para poder abarcarlo.
 Ya hemos dicho que la población se caracteriza probabilísticamente
mediante variables aleatorias y éstas por sus distribuciones de probabilidad,
que especifican el comportamiento aleatorio de la población.

Muestra: es un subconjunto de la población al que tenemos acceso y sobre el que


realmente tomamos las observaciones (mediciones)
 Si el número de elementos del subconjunto es n, diremos que el tamaño de la
muestra es “n”.
T1
 O bien la observación de una o varias características en “n” elementos de
una población.
 O bien el resultado de repetir n veces el experimento aleatorio.

3
Conceptos de Población y Muestra
Espacio muestral: conjunto de todas las posibles muestras de tamaño n de la
población y que está formado por tantos elementos como muestras distintas de este
tamaño se puedan obtener Xn.

Por tanto, de todas las muestras (o combinaciones de elementos) que se pueden


extraer de una población, podemos considerar que una muestra concreta es el
resultado de un experimento en el que se extrae una muestra de entre todas las
que integran el espacio muestral. Así, X es una muestra genérica que es una
variable aleatoria n-dimensional, cuya distribución de probabilidad depende
de:

 La distribución de probabilidad de la variable aleatoria poblacional (F(X)).


 Del procedimiento de selección de muestra.

T1
 Del tamaño de la muestra.

Como en la muestra elegida puede aparecer cualquier elemento de la población, la


muestra antes de ser elegida es una V.A. con distribución igual a la de la
población. Sin embargo, en cuanto se elige una muestra concreta, ya no
tenemos una V.A., sino un número.

La finalidad ideal de una muestra es que ésta sea representativa


de la población 4
Tipos de Muestreo
El procedimiento para extraer una muestra puede ser aleatorio o no, lo que
conduce a que la muestra sea probabilística o no

Para que la muestra sea representativa debe ser aleatoria. Esto nos permitirá
conocer en términos de probabilidad cuál es el error que se comete al usar una
muestra como reflejo de una población.

Tipos de Muestreo
• Selección no probabilística: Muestreo opinático: el investigador elige, con
criterios no aleatorios, los elementos que va a estudiar.

Selección probabilística: Se conoce cuál es la probabilidad de selección de


T1

cada elemento en la población. Esto permite obtener estimaciones de la
población y determinar el error (o fiabilidad) de dichas estimaciones.
• Muestreo aleatorio con reposición o con reemplazamiento
• Muestreo aleatorio sin reemplazamiento
• Muestreo estratificado (elementos no homogéneos)
• Muestreo por conglomerados
• Otros tipos de muestreo: sistemático, polietápico, doble, múltiple, en
ocasiones sucesivas, etc 5
Muestreo Aleatorio Simple (m.a.s.)
Formalmente, tenemos una variable aleatoria sobre la que se extrae una muestra
aleatoria simple de tamaño “n” (x1, x2, … , xn).
Una muestra aleatoria simple recoge “n” variables aleatorias idénticamente
distribuidas, o de otra forma, es una variable aleatoria n-dimensional. Una vez
más muestra aleatoria simple es sinónimo de muestra aleatoria con
reemplazamiento.

Condiciones del muestreo aleatorio simple:


Decimos que una muestra es aleatoria simple cuando las “n” variables aleatorias
que la forman cumplen:

• Todas las xi son independientes entre sí.


T1 F ( x , x ,, x )  F ( x )  F ( x )    F ( x )
1 2 n 1 2 n

• Todas las xi están idénticamente distribuidas con la misma distribución de


la variable aleatoria x poblacional.

F ( x1 )  F ( x2 )    F ( xn ) ~ i.i.d .

Donde las xi son las extracciones muestrales (muestra genérica) y los números
6
concretos constituyen la muestra específica o realización muestral.
Parámetros Poblacionales y Estadísticos Muestrales
Parámetros poblacionales: son las características numéricas de la población.
En concreto, un parámetro es una característica numérica de la distribución de la
población que permite conocer total o parcialmente su distribución de
probabilidad.

Estadístico: cualquier función matemática de los elementos muestrales (y no del


parámetro).
T(X)=T(x1, x2, x3)

Un estadístico es una función de variables aleatorias, y por tanto, será


también una variable aleatoria, esto es, tendrá su propio campo de variación y su
distribución de probabilidad (los cuales dependerán de los de la población

T1
Los estadísticos más comunes son:
 x  x 
n
2
n i
Media muestral: x i Varianza muestral: m2  i 1
S
a1  i 1
x n
n

 x  x 
n
2
i
Cuasivarianza muestral: S 2 i 1
7
n 1
1
Características de las distribuciones en el muestreo
Dado que los estadísticos son variables aleatorias, podremos estudiar sus
características, como son sus momentos (los cuales nos resumen la información de la
variable aleatoria estudiada). Supondremos que proceden de poblaciones con media
µ y varianza σ2.

Distribución de la media muestral

Esperanza (media): En una muestra aleatoria simple de tamaño “n” (x1, x2, …., xn)
de una variable aleatoria X se define la media muestral o valor medio de los valores
u observaciones muestrales:
1 n
E ( x)   xi donde i  1, 2,  , n
n i 1
T1 x , x ,  , x son las extracciones muestrales
1 2 n
Por ser una variable aleatoria podemos calcular la esperanza matemática de la
media muestral
1 n  1  n  1 n  1 n  n
E ( x)  E   xi   E   xi     E ( xi )          
 n i 1  n  i 1  n  i 1  n  i 1  n
Por tanto, el valor esperado de la media muestral coincide con el valor de la media
poblacional (independientemente de la distribución de probabilidad que siga la 8
población).
Características de las distribuciones en el muestreo
Distribución de la media muestral

Varianza:

1 n  1  n  1  n  1  n 2 n 2 2
V ( x)  V   xi   2 V   xi   2   V ( xi )   2      2  
 n i 1  n  i 1  n  i 1  n  i 1  n n

Por tanto, ahora observamos que la varianza muestral no coincide con la varianza
poblacional, sino que es necesario dividirla por el tamaño muestral.

Entonces la varianza de la media muestral es la variabilidad de las distintas muestras


𝜎2
de la media. Por tanto, el resultado obtenido (𝑉 𝑥ҧ = ) nos indica que tomando un
T1
𝑛
tamaño muestral lo suficientemente grande, podremos asegurar que la varianza de la
media muestral se hará muy pequeña, y por tanto, el valor de la media muestral estará
probablemente muy próximo a su esperanza, esto es, a la media poblacional.

La Desviación Típica de la media muestral recibe el nombre de ERROR ESTÁNDAR de


la media muestral.

Por tanto, lo que estamos diciendo es que, según aumenta el tamaño de la muestra,
aumenta la precisión de la media muestral para estimar la media poblacional. 9
Características de las distribuciones en el muestreo
Distribución de la Varianza muestral

Esperanza: Antes de calcular la E(Sx2), se puede demostrar que

S 
2
n
x  x 
i
2


n
x  x     
i
2
1 n 
  ( xi   ) 2  n( x   ) 2 
x
i 1 n i 1 n n  i 1 

Su esperanza será: 2
x
1
 2 2

1 n
n  i 1

E ( S )  E ( xi   )  n( x   )   E ( xi   ) 2  nE ( x   ) 2  
n 
n 1 2
 se puede demostrar  

T1
n

Vemos que la esperanza de la varianza muestral no es igual a la var. Poblacional.


Debido a esto, la cuasivarianza muestral adquiere gran relevancia, como se
comprobará en temas posteriores. Existe una relación inmediata entre varianza y
n
cuasivarianza muestral. S12  S x2
n 1
n n 1 2
Su Esperanza será: E S1
2
  E
 n
S 2

 n  1 x  n  1 n    2
10
Características de las distribuciones en el muestreo
Distribución conjunta de la media y de la Varianza muestral o LEMA DE
FISHER-COCHRAN

A continuación presentamos dos importantes propiedades de la distribución


conjunta de la media y varianza muestrales. El lema de Fisher-Cochran
demuestra que si:

• Las variables aleatorias 𝑥ҧ y Sx2 son estadísticamente independientes.


2
• El estadístico nS x   2
n 1
2 2
Se puede interpretar este resultado como que la variable
nS x se distribuye
2
T1
como la suma de los cuadrados de (n-1) variables aleatorias distribuidas como una
N(0, 1) independientes.

Este lema va a ser muy importante porque nos va a dar la distribución en el


muestreo de la Sx2, ya que simplemente con despejar tenemos:

 n21   2
S 
2
x
11
n
Muestreo en poblaciones Normales
Distribución de la Media Muestral con σ2 conocida
n
Sabemos que: x i
1 1 1
x i 1
 x1  x2    xn
n n n n

Es decir, tenemos que la media muestral es una combinación lineal de


variables aleatorias normales e independientes (X1, X2, …., Xn), por ser la
muestra aleatoria simple, lo que implica que la combinación lineal es
normal. Los dos momentos de la media muestral los hemos visto antes,
T1
luego:

x ~ N ( , )
n

12
Muestreo en poblaciones Normales
Distribución de la Diferencia de medias muestrales con σ2 conocida

Si en vez de una población se consideran dos, X~N(x, x) e Y~N(y, y), de


cada una de las cuales se extrae una muestra aleatoria simple (x1, x2,..., xn)
y la segunda (y1, y2, …., yn), independientemente de la primera, las medias
muestrales y sus distribuciones muestrales son:
n

x
m
i
x ~ N ( x ,
x y j y
x i 1 )
y
j 1 y ~ N ( y , )
n n m m
Se considera de interés estudiar el estadístico de diferencia de medias
T1 ഥ − 𝑦) , éste será una combinación lineal de n+m variables
muestrales (𝑥
aleatorias normales e independientes, por lo que su distribución será
normal:

      x2  y
  
2
E x  y  E x  E y  x   y V x  y V x V y  
n m

  2  13
   2
x  y ~ N  x   y ;
y 
x

 n m 
 
Muestreo en poblaciones Normales
Distribución de la Diferencia de medias muestrales con σ2 conocida

Si en vez de una población se consideran dos, X~N(x, x) e Y~N(y, y), de


cada una de las cuales se extrae una muestra aleatoria simple (x1, x2,..., xn)
y la segunda (y1, y2, …., yn), independientemente de la primera, las medias
muestrales y sus distribuciones muestrales son:
n

x
m
i
x ~ N ( x ,
x y j y
x i 1 )
y
j 1 y ~ N ( y , )
n n m m
Se considera de interés estudiar el estadístico de diferencia de medias
T1 ഥ − 𝑦) , éste será una combinación lineal de n+m variables
muestrales (𝑥
aleatorias normales e independientes, por lo que su distribución será
normal:

      x2  y
  
2
E x  y  E x  E y  x   y V x  y V x V y  
n m

  2  14
   2
x  y ~ N  x   y ;
y 
x

 n m 
 
Muestreo en poblaciones Normales
Distribución de la Media Muestral con σ2 desconocida
𝜎
Dado que 𝑥~𝑁
ҧ 𝜇, depende de la varianza poblacional y la
𝑛
desconocemos, recurrimos a una distribución no dependiente de la varianza
poblacional, que es la T-Student. Ésta se define como:
𝑁(0,1)
𝑡𝑛 = 2 𝝌𝑛
𝑛
nS x2
Además sabemos que 𝑥~𝑁
ҧ 𝜇,
𝜎
; 𝑥ҧ = 𝜇 +
𝜎
𝑍; y que   n21
𝑛 𝑛 2

T1
Con estos datos nosotros tenemos una N(0,1) y una  n21 por lo que debemos
transformar los datos para que podamos obtener la t de student.
Operando llegamos a:

x x x


   x
n  n n x t ~ t n 1
t   ~ t n 1 Sx
 n21 nS x2

1 Sx

1 Sx
  15
n 1 2 n 1  n n 1 n 1 n 1
Muestreo en poblaciones Normales
Distribución de la diferencia de medias muestrales con σ2
desconocida

Dadas dos V.A. X~N(x, x) e Y~N(y, y), de cada una de las cuales se
extrae una mas (x1, x2, …., xn) y la segunda (y1, y2, …., yn),
independientemente de la primera, para las que no se conoce el valor de x,
y, siendo n y m el tamaño de las respectivas muestras de cada población,
se obtiene que la distribución de la diferencia de medias cuando las
varianzas poblacionales sean desconocidas resulta ser (la demostración
para llegar a ella es un tanto ardua, y puede consultarse en cualquier
manual, por lo que aquí presentamos únicamente el resultado):
T1
t
x  y      y  n  m  n  m  2
x
~ tn m2
n  S x2  m  S y2 nm

16
Muestreo en poblaciones Normales
Distribución de la Proporción Muestral

Resulta de gran interés estudiar la distribución muestral del estadístico


proporción muestral, así como de la diferencia de proporciones, puesto
que en las ciencias sociales es muy común que la información venga
expresada en términos porcentuales, para lo que nos será de gran
utilidad este estadístico.

Partimos de la distribución Binomial, que si recordamos, se corresponde


con sucesos dicotómicos, esto es, con procesos en los que solo existen dos
sucesos posibles, complementarios (éxito y fracaso).
T1
Definimos X como el número de éxitos de una muestra de tamaño “n” que
procede de una población que sigue una distribución Binomial, donde “p” es
la probabilidad de éxito. Por tanto, la proporción de éxitos en la muestra:

𝑿
ෝ=
𝒑 → Proporción muestral donde 𝑋~𝐵(𝑛, 𝑝)
𝒏 17
Muestreo en poblaciones Normales
Distribución de la Proporción Muestral (continuación)

Recordemos que E(X)=np y V(X)=npq


Por lo que:
X
E  pˆ   E    p
n
X 1
V  p  V   
pq
ˆ pq 
 
n n n

Recordemos además que si n·p>5 → B(n,p) por el Teorema Central del


T1
Límite converge a

𝒑𝒒
ෝ~𝑵(𝒑,
𝒑 )
𝒏

Cuanto mayor sea n, menor será la desviación típica del estadístico.


18
Muestreo en poblaciones Normales
Distribución de la diferencia de proporciones muestrales

Dada una muestra aleatoria simple de “nx” observaciones procedentes de


una población de proporción de éxitos px, la cual da lugar a una proporción
muestral de y de una muestra aleatoria simple de “ny” observaciones
procedentes de una población de proporción de éxitos p2, la cual da lugar a
una proporción muestral de , entonces si “nx” y “ny” son suficientemente
grandes:

T1  pˆ  
x  p y  ~ N px  p y ;
 px qx p y q y 
ˆ 
 nx ny 
 

19

También podría gustarte