Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Teoría de Muestras
Teoría de Muestras
Índice
1 Introducción ............................................................................................................................................................ 3
2 Conceptos Básicos ............................................................................................................................................. 3
2.1 Características y Parámetros de Interés ...................................................................... 3
2.2 Muestra Aleatoria ...................................................................................................................... 4
2.3 Muestras Probabilísticas ....................................................................................................... 5
2.4 Diseño Muestral ......................................................................................................................... 5
2.5 Mecanismo de Selección .................................................................................................... 6
2.6 Probabilidades de Inclusión ............................................................................................... 6
2.7 Estadística y Estimador ........................................................................................................ 7
3 Muestreo Aleatoria Simple Sin Reemplazo (MAS) ........................................................................... 7
3.1 Estadística y Estimador .......................................................................................................... 7
3.2 Mecanismo de Selección ..................................................................................................... 7
3.3 Estimación para el Total de Y y su Varianza en el MAS .................................... 9
3.4 Estimación para el Promedio de Y y su varianza en el MAS ......................... 11
4 Resumen ................................................................................................................................................................. 11
5 Referencias Bibliográficas ............................................................................................................................ 12
Objetivos
Objetivo 1: Conocer la base de la teoría de la inferencia estadística, el estudio
de recolección de muestras y la estimación de parámetros por el muestreo.
1 Introducción
En esta unidad centraremos nuestro interés en la base de la teoría de la inferencia
estadística, el estudio de recolección de muestras y estimación de parámetros por el
muestreo. Es preciso mencionar que solo se hará un breve repaso de una extensa y
cuidadosa teoría, debido a la complejidad y pertinencia de algunos de sus conceptos.
Siendo el caso de las muestras aleatorias simples el eje sobre el cual desarrollaremos
los contenidos temáticos, en busca de su utilidad final, la estimación de parámetros
poblacionales.
2 Conceptos Básicos
Conocida una población o universo de nuestro interés, el cual está conformado por 𝑁
elementos y que notaremos como 𝑈 etiquetado como sigue 𝑈 = {1,2, … , 𝑁}, se define
entonces una característica de interés 𝑦 la cual tiene como naturaleza ser una
observación medida directamente en 𝑈 y no una realización de una 𝑣. 𝑎 como en
unidades anteriores, tomará entonces 𝑦 el valor 𝑦𝑘 en el 𝑘-ésimo elemento.
𝑡𝑦 = ∑ 𝑦𝑘
𝑘=1
2
∑𝑁 ̅𝑈 )2
𝑘=1(𝑦𝑘 − 𝑦
𝑆𝑦𝑈 =
𝑁−1
Ejemplo 1: Suponga que se tiene una población 𝑼 tal que está etiquetada de la siguiente
manera 𝑼 = {𝟏, 𝟐, 𝟑, 𝟒, 𝟓} y se quiere estimar una variable de interés 𝒚 para cada elemento
en el universo entonces:
U yk
1 35
2 36
3 40
4 23
5 37
𝑡𝑦 = ∑ 𝑦𝑘 = 35 + 36 + 40 + 23 + 37 = 171
𝑘=1
2
∑𝑁 ̅𝑈 )2 [(35 − 34.2)2 + ⋯ + (37 − 34.2)2 ]
𝑘=1(𝑦𝑘 − 𝑦
𝑆𝑦𝑈 = = = 34.16
𝑁−1 4
“El número de elementos en el modelo El número de elementos en 𝒔 es llamado tamaño de muestra y existen casos particulares
estadístico de selección es llamado donde no es fijado de antemano, en consecuencia se hace variable.
tamaño de la muestra” Muestra aleatoria sin reemplazo
Se dice que una muestra aleatoria es sin reemplazo si la selección de los elementos que
“Sin reemplazo: si la selección de los han sido seleccionados no vuelven a ser parte de la población.
elementos que han sido
Muestra aleatoria con reemplazo
seleccionados no vuelven a ser parte
Se dice que una muestra aleatoria es con reemplazo si la selección de los elementos que
de la población”
han sido seleccionados vuelven a ser parte de la población, es decir, un elemento puede
“Con reemplazo: si la selección de los ser seleccionado más de una vez.
elementos que han sido seleccionados
vuelven a ser parte de la población”
2.3 Muestras Probabilísticas
No toda muestra aleatoria es de tipo probabilística, dando lugar a distintos tipos de muestreo
que dada su metodología de recolección o desconocimiento de los modelos probabilísticos
que garanticen su validez se convierten en mecanismos sin ninguna significancia a la hora
de hacer estimaciones. A continuación se mencionan los requerimientos que hacen a una
muestra aleatoria una muestra probabilística.
Una muestra es probabilística cuando:
Se puede definir el conjunto de todas las posibles muestras derivadas del proceso
de selección.
Es posible conocer de antemano la probabilidad de selección de todas y cada una
de las posibles muestras anteriormente mencionadas.
El proceso de selección garantiza la existencia de una probabilidad mayor a cero
para cada uno de los elementos del universo.
El mecanismo aleatorio de selección que se utilice garantiza la igualdad de
probabilidades de selección para cada muestra en el conjunto de todas las
posibles muestras.
Diseño de muestreo
Desde un punto de vista teórico estricto, un diseño de muestreo es una función 𝒑(𝒔), que a
cada muestra posible le asigna una probabilidad de selección.
Diseño de muestreo sin reemplazo
Un diseño de muestreo se dice sin reemplazo, si todas las muestras en el conjunto de todas
las posibles muestras son sin reemplazo.
Diseño de muestreo con reemplazo
Un diseño de muestreo se dice con reemplazo, si todas las muestras en el conjunto de
todas las posibles muestras son con reemplazo.
0.13
1-2
0.20
1-3
0.15
1-4
0.10
1-5
0.15
2-3
0.04
2-4
0.02
2-5
0.06
3-4
0.07
3-5
0.08
4-5
Se dice un muestreo aleatorio simple sin reemplazo a aquel diseño cuyas posibles muestras
de tamaño 𝒏 fijado de antemano tienen la misma probabilidad de ser seleccionadas. Así:
1
𝑠𝑖 # 𝑠 = 𝑛
𝑝(𝑠) = {(𝑁)
𝑛
0 𝑐 𝑐.
𝜉4 = 0.71795016, 𝜉5 = 0.95200564
𝜉𝑘
𝑈
0.28691106
1
0.97110167
2
0.86655545
3
0.71795016
4
0.95200564
5
𝜉𝑘
𝑈
0.28691106
1
0.71795016
4
0.86655545
3
0.95200564
5
0.97110167
2
1 4 10 0,4 0,70554751 0
2 4 9 0,44444444 0,53342402 0
3 4 8 0,5 0,57951862 0
4 4 7 0,57142857 0,28956246 1
5 3 6 0,5 0,30194801 1
6 2 5 0,4 0,7747401 0
7 2 4 0,5 0,01401764 1
8 1 3 0,33333333 0,76072359 0
9 1 2 0,5 0,81449002 0
10 1 1 1 0,7090379 1
Nótese que como se dio en este ejemplo el método garantiza que los 𝒏 elementos siempre
sean seleccionados, es decir, el método siempre converge.
Las expresiones para la estimación del total y su varianza en el muestreo aleatorio simple
vienen dadas por:
𝑁
𝑡̂𝑦 = ∑ 𝑦𝑘
𝑛
𝑠
𝑁2 𝑛 2
𝑉𝑎𝑟(𝑡̂𝑦 ) = (1 − ) 𝑆𝑦𝑈
𝑛 𝑁
𝑁2 𝑛 2
̂ (𝑡̂𝑦 ) =
𝑉𝑎𝑟 (1 − ) 𝑆𝑦𝑆
𝑛 𝑁
𝒌 𝒚𝒌
19
4
56
5
70
7
60
10
Entonces nuestro interés será el de estimar el total y con su respectiva varianza estimada.
El total vendría dado por:
𝑁 10
𝑡̂𝑦 = ∑ 𝑦𝑘 = ∙ (19 + 56 + 70 + 60) = 512.5
𝑛 4
𝑠
Para estimar la varianza del estimador tenemos que como se muestra en ecuación,
esta depende de la varianza muestral que se calcula como sigue:
2
∑𝑘∈𝑆(𝑦𝑘 − 𝑦̅𝑠 )2
𝑆𝑦𝑆 = = 496.92
𝑛−1
Con lo que:
𝑁2 𝑛 2 102 4
̂ (𝑡̂𝑦 ) =
𝑉𝑎𝑟 (1 − ) 𝑆𝑦𝑆 = (1 − ) ∙ (496.92) = 7453.75
𝑛 𝑁 4 10
Es necesario brindar una medida del error para determinar la calidad de las
estimaciones, para ello se utiliza el coeficiente de variación estimado 𝒄𝒗𝒆 como
sigue:
̂ (𝑡̂𝑦 )
√𝑉𝑎𝑟
√7453.75
𝑐𝑣𝑒 = × 100% = × 100% ≅ 17%
𝑡̂𝑦 512.5
Lo que puede considerarse como una pobre estimación debido a que 𝒄𝒗𝒆 > 𝟓% se
consideran estimaciones de baja calidad, esto puede ser al poco número de elementos de
la población con tamaño de muestra pequeño.
1 1 𝑛 2
𝑉𝑎𝑟(𝑦̂̅) = 𝑉𝑎𝑟(𝑡̂𝑦 ) = (1 − ) 𝑆𝑦𝑈
𝑁2 𝑛 𝑁
1 1 𝑛 2
̂ (𝑦̅̂) =
𝑉𝑎𝑟 ̂ (𝑡̂𝑦 ) = (1 − ) 𝑆𝑦𝑆
𝑉𝑎𝑟
𝑁2 𝑛 𝑁
Ejemplo 6: Considerando los datos del ejemplo anterior, damos estimaciones para la media
y la varianza estimada de la variable de interés 𝒚.
𝑡̂𝑦 512.5
𝑦̂̅ = = = 𝑦̅𝑆 = 51.25
𝑁 4
Con igual medida de calidad para el caso del total, debido a que se trata de los mismos
valores.
4 Resumen
El objetivo de hacer muestreo será el de estimar una característica de interés
determinada en un parámetro poblacional a partir de la observación de un
subconjunto con ciertas características de los elementos del universo.
5 Referencias Bibliográficas
Miranda, I. E., Palacín, F., Sánchez, M. L., Márquez, M., Chía, A. R., Navas, A. S., y otros.
(3ra. Edición 2006). Estadística Descriptiva y Probabilidad. Cádiz: Servicio de
Publicaciones de la Universidad de Cádiz.
Montgomery, D., & R., R. (2da. Edición 2008). Probabilidad y Estadística Aplicada a la
Ingeniería. México: Limusa Wiley.
Walpole, R., Myers, R., & Myers, S. y. (2007). Probabilidad y Estadística para Ingeniería
y Ciencias. México: Pearson.