Está en la página 1de 12

Distribuciones muestrales

Parámetros poblacionales. Medidas de las poblaciones.


Estadísticos muestrales. Medidas de las muestras.

Así, a las medidas de las poblaciones se les denomina parámetros


poblacionales y a las medidas de las muestras se les denomina estadísticos
muestrales. Se les denomina, también, en términos más breves, parámetros y
estadísticos.
Además, como se utilizan símbolos para representar estas diversas medidas,
también se manejan diferentes símbolos para representarlas:

Distribuciones muestrales

Una distribución muestral es el conjunto de todas las muestras distintas de


determinado tamaño n que es posible extraer de una población de tamaño N.

Conviene analizar algunos puntos en la definición anterior. En primer lugar, se


debe observar que se trata del conjunto de todas las muestras distintas que es
posible extraer de determinada población; al analizar este conjunto exhaustivo se
extraen conclusiones respecto al posible comportamiento de una sola muestra; en
otras palabras, lo que interesa es una sola muestra, no todas ellas, pero
analizando ese conjunto de todas las que es posible extraer, se puede conocer el
posible comportamiento de la muestra única que interesa.

Distribución muestral de la media

Distribución muestral de la media. Conjunto de las medias de todas las


muestras de tamaño n que es posible obtener de una población de tamaño N.

Ejemplo:
Suponga que se tiene una población de 5 familias (N = 5) y la
Variable que se estudia es el número de hijos de cada familia. Los datos
correspondientes aparecen en las 2 primeras columnas de
número
de hijos
familia X
Perez 2
Gomez 4
Duran 6
Hidalgo 8
Juarez 10
total 30

Media de la población

µ=30/5=6 las familias tiene en promedio 6 hijos

Desviación estándar de la población

número de
familia hijos X (X-µ)^2
Perez 2 16
Gomez 4 4
Duran 6 0
Hidalgo 8 4
Juarez 10 16
total 30 40
media µ 6 8
Desviación  2,828427125

=2.8284 y entre las familia hay una desviación estándar poblacional 2.8284

Con un tamaño de muestra n = 2 se determina ahora el número total de


muestras sin repetición que es posible obtener de esta población que tiene 5
elementos. La fórmula que se utiliza para determinar
familia hijos hijos
Perez, Gomez 2 4
perez, Duran 2 6
perez, Hidalgo 2 8
Perez,Juarez 2 10
Gomez,Duran 4 6
Gomez,Hidalgo 4 8
Gomez, Juarez 4 10
Duran, Hidalgo 6 8
Duran,Juarez 6 10
Hidalgo, Juarez 8 10

Media de las muestras

media
familia hijo hijo muestras
Perez, Gomez 2 4 3
perez, Duran 2 6 4
perez, Hidalgo 2 8 5
Perez,Juarez 2 10 6
Gomez,Duran 4 6 5
Gomez,Hidalgo 4 8 6
Gomez, Juarez 4 10 7
Duran, Hidalgo 6 8 7
Duran,Juarez 6 10 8
Hidalgo, Juarez 8 10 9
total 60

La media de todas las medias, o sea la media de la distribución muestral de la


media

=60/10=6
Primera conclusión: consiste en que la media de la distribución muestral de las
medias es igual a la media de la población o, dicho en otras palabras, el valor
esperado de la media es igual a la media de la población.

La desviación estándar de todas las medias, o sea la desviación estándar de la


distribución muestral de las medias, es:

familia hijo hijo media muestras


Perez, Gomez 2 4 3 9
perez, Duran 2 6 4 4
perez, Hidalgo 2 8 5 1
Perez,Juarez 2 10 6 0
Gomez,Duran 4 6 5 1
Gomez,Hidalgo 4 8 6 0
Gomez, Juarez 4 10 7 1
Duran, Hidalgo 6 8 7 1
Duran,Juarez 6 10 8 4
Hidalgo, Juarez 8 10 9 9
total 60 30
media 6 3
Desviación de la
Distribución
1,73205081

Conclusión dos: en donde el subíndice señala que es la desviación estándar de


la distribución muestral de la media. A este valor se le conoce como error estándar
de la media y tiene una relación con la desviación estándar de la población que se
expresa mediante la siguiente ecuación:

Entonces =1.73
Se toman las medias y se sacan las frecuencias

medias frecuencia
3 1
4 1
5 2
6 2
7 2
8 1
9 1
total 10

Título del gráfico


2,5

1,5

0,5

0
3 4 5 6 7 8 9

En la gráfica anterior se aprecia que las medias de las muestras tienden a


agruparse alrededor (cerca) del valor de la media de la población, lo cual es una
característica de la distribución normal; aunque en este ejemplo el tamaño de la
muestra es exageradamente pequeño, aun así se nota que la distribución de las
medias muestrales tiende a ser de forma normal. La afirmación anterior,
expresada en el siguiente párrafo de manera más formal, es la última conclusión a
la que se quería llegar y es lo que, junto con las dos primeras conclusiones
revisadas antes, se conoce como el teorema central del límite.

Si X es una variable aleatoria para la que se conocen su media μ y su varianza σ2,


la distribución muestral de la media tiende a ser normal con media μ y desviación
estándar (error estándar)
Mirar con detenimiento

Media de la Frecuencia
muestra X observada f
probabilidad de las medias
muestrales P (X)
3 1 0,1
4 1 0,1
5 2 0,2
6 2 0,2
7 2 0,2
8 1 0,1
9 1 0,1
total 10 1

Mirar, existe una probabilidad de 20% de que la media de esa muestra fuese de 6.

Por otro lado, la probabilidad de sacar una muestra cuya media este entre 5 y 7 es
de 60%.
Esto ilustra que es altamente probable obtener una muestra que contenga el
verdadero valor de la media de la población.
Ejemplo

Se extrae una muestra de n = 30 elementos de una población que se sabe que


tiene un gran número de elementos y cuyas media y desviación estándar son μ =
162 y σ = 20. Encuentre la probabilidad de que la media de esa muestra:

1. Sea superior a 170.


2. Este entre 152 y 172.

Solución 1

Como hablamos de distribución hay que sacar la desviación estándar de


la distribución

Luego hallar el valor de z

Luego encontrar la probabilidad en la tabla


Z= 2.19 entonces la probabilidad es 0.9857

Entonces 1-0.9857= 0.0143


Hay un 1.43% de probabilidad que la media sea superior a 170.

Solución 2

Entonces
p(z= 2.74) entonces P=0.9969

p(z= -2.74) entonces P=(1-0.9969) P= 0.0031


P(−2.74 ≥ z ≤ 2.74) = P(0.9969-0.0031)=P( 0.9938)
Hay un 99.38% de probabilidad que la media este entre 152 y 172

Distribución muestral de la proporción

Se vio en las secciones anteriores que:


•La distribución muestral es el conjunto de todas las muestras de tamaño n que se
pueden sacar de una población de tamaño N.
• Se puede calcular el número de elementos de una distribución muestral así
definida como el número de combinaciones de N elementos tomados de n en n

 Si se calculan las medias de todas las muestras de una distribución muestral,


entonces se tiene la distribución muestral de las medias.
 Desprendido directamente de lo anterior, la distribución muestral de la
proporción es el conjunto de las proporciones de todas las muestras de tamaño
n que se pueden sacar de una población de tamaño N.

Ejemplo
Suponga una población de N = 6 artículos, de los cuales 3 están defectuosos y 3
no. Si se utiliza “1” para representar la característica de estar defectuoso y “0
” para representar la característica de no estarlo. En esta tabla se incluyen los
cálculos necesarios para determinar la proporción y la desviación estándar de esta
población.

La proporción de la población:

π= 3/6=0.5 proporción de defectuosos


Proporción de no defectuosos =1-0.5=0.5

artículo X (x − π ) (X − π )2
A 1 0,5 0,25
B 1 0,5 0,25
C 1 0,5 0,25
D 0 -0,5 0,25
E 0 -0,5 0,25
F 0 -0,5 0,25
TOTAL 3 1,5
La desviación estándar de la población:

Entonces =raíz (1.5/6) = 0.5

La cual también puede calcularse como: entonces raíz (0.5*0.5)= 0.5

El número total de muestras distintas de tamaño n = 2 que es posible obtener:

= 6!/2!*(6-2)! = 15 entonces se pueden obtener 15 posibles


nuestras de dos

Distribución muestral

La media de esta distribución muestral de proporciones es:


Entonces la distribución muestral es 7.5/15=0.5
La media de la distribución de proporciones es igual a la proporción
poblacional, siendo el valor esperado, E(p).

Desviación estándar de esta distribución muestral de proporciones,

proporciones
muestrales p Frecuencias f (p – μp) (p – μp)2 f (p – μp)2
0 3 -0,5 0,25 0,75
0,5 9 0 0 0
1 3 0,5 0,25 0,75
1,5

Entonces raíz (1.5/15)=0.3162

Existe una relación entre esta desviación estándar de la distribución muestral de la


proporción, σp, y la desviación estándar de la población, p:

Entonces =0.3162

Hay que observa que es el mismo valor encontrado a partir de la distribución


muestral.

Fórmula del error estándar de la proporción y factor de corrección por población


finita
Al igual que antes, es posible eliminar el factor de corrección por población finita
de la fórmula del error estándar cuando n/N <=0.05 o cuando la población tiene
una cantidad muy grande o infinita de elementos. Así, la forma simplificada del
error estándar en estos casos seria:

Ejemplo

Una cadena de tiendas de departamentos tiene 5000 cuentas de crédito abiertas


con sus clientes. Se sabe, de acuerdo con la experiencia de varios años que la
proporción de cuentas de crédito que se encuentran atrasadas en sus pagos
(morosas) es de 10%; si se extrae de esta población una muestra aleatoria de 100
cuentas, .cual es la probabilidad de que más de 13 de ellas sean morosas?

La desviación estándar de la población:

Entonces raíz (0.1*0.9)=0.3

n/N <=0.05 entonces 100/5000=0.02<=0.05 por lo tanto no se usa el factor de


corrección de población finita de la proporción.

Por lo tanto entonces 0.3/raíz(100)=0.03

Además, como se trata de una muestra grande (n > 30), se puede utilizar el
teorema central del límite y considerar que la distribución del conjunto de todas las
muestras implicadas tiene una forma aproximadamente normal.

La proporción de la muestra

Entonces 13/100=0.13

Valor de z para la proporción


Entonces (0.13-0.1)/0.03 = 1

Buscamos en la tabla el valor de probabilidad

Probabilidad de que en esa muestra haya más de 13 cuentas morosas

P(z ≥ 1) = 0.8413 entonces 1-0.8413=0.1587 podemos decir que hay un


15.87% que hayan más de 13 cuantas morosas

Ejemplo

Encuentre el error estándar para una situación en la que la π = 0.7 cuando:

1. n = 10.
2. n = 100.

1. entonces raíz ((0.7*0.3)/10)= 0.1745


2. entonces raíz ((0.7*0.3)/100)= 0.046

Lo cual ilustra lo apuntado antes, que el error estándar disminuye


Cuando aumenta el tamaño de la muestra.

También podría gustarte