Está en la página 1de 11

104

U.T.N.-F.R.R.-Año 2005
INFERENCIA ESTADISTICA
Unidad 9 - MUESTREO
Profesor Titular: Eº Mario J. Garber

1 – TEORIA DEL MUESTREO - NOCIONES BASICAS

a) Concepto: Como ya se indicó, el muestreo es un método estadístico que permite


realizar investigaciones referidas a determinadas poblaciones, finitas o infinitas, en corto
tiempo y a menor costo, para observar variables cuantitativas o cualitativas, sin que se
pueda garantizar la exactitud que sólo podría obtenerse consultando a toda la población, lo que
finalmente termina por ser lento y caro, cuando no imposible a veces.
El muestreo es, en algunas ocasiones, el único procedimiento para realizar cierto tipo
de investigaciones en los cuales las verificaciones son destructivas (prueba sobre la calidad de
municiones, lámparas o fósforos, por ejemplo).

b) Condiciones: el muestreo debe basarse en las siguientes condiciones:


 la representatividad: significa que la muestra debe integrarse con una
proporción de elementos similares a la composición existente en la
población. Esta condición, si bien es importante, debe tener algún tipo de
limitación, ya que si se exige una composición exactamente igual a la de la
población, se terminará extrayendo una muestra de tamaño igual a aquélla,
de modo que la representatividad debe cumplirse con aquéllos atributos
que son fundamentales.
 la confiabilidad: resulta ser, en cierto modo, consecuencia de lo anterior,
pero asimismo constituye un principio sobre la seguridad de que la toma de
la información no producirá sesgos o errores en los resultados que se
obtienen, tomando en consideración que un dato erróneo en la muestra
incide en la confiabilidad mucho más que uno en la población.

c) Tipos de muestreo: Los dos tipos fundamentales de muestreo son:


 Muestreo intencional: consiste en seleccionar arbitrariamente los
elementos que integran la muestra, lo cual permite efectuar la selección
con rapidez pero no garantiza la condición de representatividad
indicada más arriba. A pesar de esto suele ser utilizada en algunas
ocasiones, obviamente con resultados muy poco confiables, por lo cual
se desaconseja su uso.
 Muestreo probabilístico: consiste en seleccionar la muestra asignando
a cada elemento constituyente de la población, una probabilidad
(idéntica o diferente, según el caso) de aparecer en la muestra. En este
tipo de muestreo aparecen las condiciones básicas para que se cumpla la
exigencia de la representatividad, porque todos los elementos están en
condiciones de integrar la muestra sin que se excluya
anticipadamente a ninguno.

---------------------------------
Probabilidades y Estadística – Año 2005
105

d) Tamaño de la muestra (n): El tamaño de la muestra no es caprichoso. Puede


determinarse mediante fórmulas apropiadas, para lo cual deben tomarse en consideración los
siguientes elementos:
 La variabilidad de la población: En el caso extremo que todos los elementos
de la población fueran iguales, será suficiente con un tamaño de muestra igual
a un solo elemento, y este tamaño necesariamente deberá crecer si la
variabilidad entre los elementos de la población se incrementa y comienzan a
diferenciarse entre ellos cada vez más. Es decir que hay una relación directa
entre la variabilidad poblacional y el tamaño de la muestra.
 El tamaño de la población (N): Una muestra de determinado tamaño puede
ser suficiente para investigar una cierta población, pero si el número de
elementos de esa población se incrementa al doble, si bien será necesario
incrementar el tamaño de la muestra, no puede asegurarse que deba
incrementarse el tamaño de la muestra al doble (puede ser incrementada a más
o a menos del doble), lo cual quiere decir que la muestra crecerá en el mismo
sentido que la población, pero en proporciones tal vez diferentes. ¿De qué
depende eso? Sin duda, de la variabilidad que asuma la población con su nuevo
tamaño. En definitiva, el tamaño de la población influye en forma directa en el
tamaño de la muestra.
 El margen de error o tolerancia (d): Si se desea realizar una investigación
muestral y se exige que ella conduzca a un resultado sin errores, deberá
tomarse un tamaño de muestra igual al de la población, ya que ése es el único
modo de no cometer un error. Es decir que con un margen de error cero (o
tolerancia cero) el tamaño n de la muestra deberá ser igual al tamaño N de la
población. Pero si se admite un margen de error mayor que cero, la muestra
puede disminuir. Es decir que a medida que crece el margen de error
admitido, disminuye el tamaño de la muestra, lo cual convierte a esa
relación en inversa.

e) Selección probabilística: Como ya se ha visto, en este procedimiento se asigna a cada


elemento de la población una determinada probabilidad de ser incluido en la muestra. La
selección probabilística se realiza por medios manuales o automáticos. Un medio manual de
selección probabilística consiste en asignar a los elementos de la población una numeración y
efectuar un sorteo entre ellos por algún método apropiado (un bolillero, por ejemplo). Un método
automático consiste en instrumentar un procedimiento de selección mediante un sistema de
computación que realice la tarea seleccionando los elementos que integrarán la muestra.
Para la selección probabilística manual, es común utilizar las tablas de números
aleatorios, que son construcciones numéricas de dígitos dispuestos en filas y columnas, de modo
tal que se agrupan de a 25 dígitos (a razón de 5 filas y 5 columnas por grupo). Un grupo de 25
dígitos puede ser el siguiente:
23874
07854
96453
17590
52086
La selección de los números aleatorios permite, con un sistema apropiado de
asignaciones, determinar los elementos que conformarán la muestra. Para iniciar la selección de
los números aleatorios, conviene un ingreso aleatorio a la tabla, seleccionando al azar la página,

---------------------------------
Probabilidades y Estadística – Año 2005
106

la columna y la fila que permitirán encontrar el primer grupo de cinco dígitos de la serie de n que
se requiere.
Seleccionado, entonces, al azar el primer grupo de cinco dígitos que constituye el primer
número aleatorio, se continúa con los siguientes, considerando a la tabla como un texto que debe
leerse de izquierda a derecha.
Por ejemplo, sean los siguientes números los aleatorios seleccionados para conformar una
muestra determinada de tamaño n=6:
23874 56730 05628 34902 17472 96173
A continuación se convierte a estos seis grupos en números decimales, agregándoles a su
izquierda un cero y una coma, procedimiento éste que determina valores que varían entre cero y
uno:
0,23874 0,56730 0,05628 0,34902 0,17472 0,96173
Los números decimales así construidos se simbolizan con xai (número aleatorio iésimo), y
se utilizan en la siguiente fórmula, cuya aplicación permite obtener todos los elementos de la
muestra:
ELEMENTOi  ENTERO N  xai   1 ( para i entre 1 y n)
 
con lo cual, si el tamaño de la población fuera de N=120, los seis elementos que integrarán la
muestra serán:
ELEM1  ENTERO1200,23874  1  ENTERO28,648  1  29
 
ELEM 2   0,56730  1  ENTERO68,076  1  69
ENTERO 120

...............
ELEM n  ENTERO1200,96173  1  ENTERO115,4076  1  116
 
Es decir que los elementos número 29, 69,…, y 116 conformarán la muestra elegida.

f) Muestra piloto: Ya se ha visto que el tamaño de la muestra n está en función de la


variabilidad, del tamaño de la población y del grado de error (o tolerancia) admitido. Estos
elementos, adecuadamente ubicados, se integrarán en una fórmula que permitirá calcular el n,
pero de todos ellos el único que suele no conocerse anticipadamente es la variabilidad
poblacional. Como se trata de un dato propio de la población, desconocido, el investigador
resuelve esta dificultad mediante este método: selecciona una muestra inicial, llamada
“muestra piloto” de tamaño arbitrario nh. Este tamaño debe ser razonable, aunque mínimo,
como para obtener una muestra compuesta por un primer conjunto de elementos (siempre
aplicando el criterio de la selección probabilística) que le permitirán conseguir una primera
aproximación al valor de la variabilidad que él necesita conocer. Una vez obtenido, ese valor es
aplicado en la fórmula de cálculo del n para definir el número de elementos que se deberán
seleccionar en la muestra.
Hecho esto, puede ocurrir tres cosas:
 que nh < n: en este caso se aumenta nh hasta llegar a n.
 que nh = n: en este caso se mantiene nh
 que nh > n: en este caso se mantiene nh.

g) Sistemas de muestreo probabilístico:


 Muestreo simple al azar: Consiste en seleccionar la muestra
considerando que cada elemento de la población tiene similar probabilidad de ser incluido en la
selección. Es decir, una vez identificados los N elementos, se elige una muestra de tamaño n
mediante un sorteo (con los métodos ya vistos y conocidos), lo cual convierte a este sistema en
---------------------------------
Probabilidades y Estadística – Año 2005
107

un procedimiento rápido y eficiente. Este forma de selección es conveniente cuando la


población resulta ser homogénea, es decir cuando la variabilidad es menor.
 Muestreo estratificado: cuando la población tiene una variabilidad
importante, conviene dividirla en h estratos, que son grupos de elementos internamente
homogéneos (o con poca variabilidad) aunque heterogéneos entre los diferentes estratos
conformados. Se calcula el tamaño de cada estrato (nh) y se selecciona una muestra en cada
estrato, de modo que el total de elementos se obtiene haciendo
n   nh
Con este procedimiento se asegura que el total de elementos seleccionados será menor
que si se aplicara directamente el método simple al azar. Además, este sistema permite que se
asignen probabilidades diferentes a los elementos de distintos estratos, para darles una
representación particular de estrato a estrato, como podría hacerse en el caso de seleccionar una
muestra de establecimientos industriales, armándose los estratos partiendo del número de
empleados ocupados, y asignando al estrato de mayor cantidad de empleados (que finalmente
son las empresas más importantes) una probabilidad igual a 1 de aparecer, es decir, se convierten
en establecimientos de inclusión forzosa en la muestra.
 Muestreo sistemático: Este sistema es conveniente utilizarlo cuando
la población se encuentra ordenada de un modo no secuencial (de mayor a menor, por ejemplo).
Si no existe un orden debido a la participación de alguna variable (por ejemplo, un fichero de
clientes ordenados alfabéticamente y no por el valor de sus compras), este sistema es tan
conveniente como el muestreo simple al azar pero operativamente más cómodo. Consiste en
definir el tamaño de la muestra y, posteriormente, dos valores denominados a (arranque) y p
(progresión), donde:

N
p
n ,y
1 a  p
En primer lugar se obtiene p. Luego se calcula a aplicando la siguiente fórmula:
a  ENTERO p  xa   1
 
donde xa es un número aleatorio seleccionado en la tabla correspondiente. La muestra se
conforma eligiendo a los elementos a partir de a y adicionando sucesivamente p.

2 – TEORIA DE LAS MUESTRAS: CONCEPTO Y APLICACIONES:

En los capítulos iniciales del estudio de la Estadística se mencionó la existencia de la


Teoría del Muestreo, que se ocupa de analizar y desarrollar los métodos apropiados para efectuar
la selección de muestras que permitan llevar a cabo investigaciones estadísticas muestrales en
reemplazo de las investigaciones censales, que requieren trabajar con toda la población.
En la Teoría de las Muestras se estudia que tipo de relaciones existen entre una
población y las muestras que pueden seleccionarse a partir de ella, con el objeto de describir
estas relaciones y analizar qué provecho se puede obtener de ellas.
Para evitar desarrollos teóricos complejos, el tema será presentado empíricamente
tomando como modelo un ejemplo publicado en el texto de aplicaciones estadísticas prácticas
titulado “Teoría y Problemas de Estadística” de Murray Spiegel. La resolución del ejemplo
permitirá la obtención de ciertas conclusiones generales que serán indicadas en cada caso.

---------------------------------
Probabilidades y Estadística – Año 2005
108

2- DISTRIBUCION MUESTRAL DE LAS MEDIAS

a) Caso con reposición o para poblaciones infinitas:


Ejemplo: Supongamos la existencia de una población de tamaño N = 5 que posee los
siguientes valores de la variable aleatoria xi:
x1=2; x2=3; x3=6; x4=8; x5=11
Con los datos disponibles se calculan la media y la variancia poblacionales:
x   
xi 2  3 6  8  11
6
N 5

N
 5

 x2    xi   x 2  2  6 2  3  6 2  8  6 2  11  6 2 
1 1 54
5
 10,8
y se construye el siguiente gráfico de la distribución, llamado “de bastones”:

A continuación se procederá a efectuar la selección de muestras con reposición de


tamaño n=2. Como la selección de muestras con reposición impide que con la selección se
agote el conjunto de elementos muestreados, el sistema es equivalente a trabajar con una
población de tamaño infinito.
El siguiente cuadro contiene las muestras que se generan. Como se trata de todas las
muestras posibles, puede considerarse que el cuadro contiene la población de muestras de
tamaño n=2 extraídas con reposición de una población de tamaño N=5:

POBLACION DE MUESTRAS CON REPOSICION DE TAMAÑO n=2

2-2 2-3 2-6 2-8 2-11


3-2 3-3 3-6 3-8 3-11
6-2 6-3 6-6 6-8 6-11
8-2 8-3 8-6 8-8 8-11
11-2 11-3 11-6 11-8 11-11

Como puede verificarse fácilmente, se han logrado construir 25 muestras diferentes de


tamaño n con reposición. Si el tamaño de la muestra hubiera sido de 3 elementos, se hubieran
podido construir 125 muestras diferentes; en cambio, si el tamaño de la población hubiera sido
igual a 6 y se extraían muestras de tamaño n=2, el total de muestras hubiera sido 36. Estas
observaciones permiten obtener la:

1ª Conclusión: El total de muestras con reposición de tamaño n que pueden


extraerse de una población de tamaño N es
M = Nn.

---------------------------------
Probabilidades y Estadística – Año 2005
109

Definido claramente que el cuadro anterior contiene todas las muestras posibles y que en
total ellas son 25, puede plantearse la siguiente pregunta: ¿cuántas muestras de tamaño n
deben extraerse en la vida real, cuando se desea realizar una investigación estadística mediante
el muestreo con reposición?
La respuesta a esta pregunta da lugar a la

2ª Conclusión: Para realizar una investigación estadística por muestreo es suficiente


una sola muestra de tamaño n.
Resulta oportuno aclarar, por supuesto, que la única muestra a la que se alude
precedentemente debe estar bien seleccionada, para lo cual se han dado los lineamientos en el
Unidad 1 - Muestreo.

A continuación se calcularán las medias muestrales de cada una de las M muestras


seleccionadas. El siguiente cuadro contiene los 25 valores:

2 2,5 4 5 6,5
2,5 3 4,5 5,5 7
4 4,5 6 7 8,5
5 5,5 7 8 9,5
6,5 7 8,5 9,5 11

Se observa claramente que hay varios resultados para el valor de la media muestral, y que
ellos dependen de cómo se encuentren conformadas las M muestras diferentes de tamaño n=2.
Los resultados presentados en el cuadro anterior constituyen el conjunto de medias muestrales
posibles de ser calculadas a partir de la población de medias muestrales definidas previamente, lo
que implica que el cuadro contiene una población de medias muestrales de tamaño M, y ese
conjunto se denomina Distribución muestral de las medias.
Esto da a la media muestral una característica no descubierta hasta este momento, que
origina la:
3ª conclusión: la media muestral resulta ser una variable mientras la conformación
de la muestra no se encuentre definida, lo cual no entra en contradicción con la primera
propiedad de la media aritmética, que dice que ella es una constante para un conjunto definido de
valores.
Esta conclusión puede ser generalizada del siguiente modo: cualquier cálculo muestral
(es decir cualquier otra medida de posición e incluso de dispersión que se obtenga a partir de los
datos muestrales) y no sólo la media aritmética debe considerarse como variable, por el
mismo principio vigente para la media.
Atendiendo al hecho de que la media muestral resulta una variable y que el cuadro
precedente constituye la población de medias muestrales, se pueden obtener tanto la media
poblacional como la variancia poblacional de la variable media muestral, es decir que se puede
calcular la

x 
x 150
 6 lo cual permite formular la
M 25
4ª conclusión: la media de la población de medias muestrales es igual a la media de
la variable xi, es decir que
x  x

---------------------------------
Probabilidades y Estadística – Año 2005
110

Para esa misma población de media muestrales se calcula la variancia poblacional, es


decir,
1 135

2
2   xi    
 x
 5,4 , lo cual permite enunciar la
x M 25

5ª conclusión: la variancia de la población de medias muestrales es igual a la


variancia de la variable xi dividida por n, es decir que
2 
2  x    x
x n x n

Si se construye el gráfico de la Distribución muestral de las medias se obtiene la siguiente


figura:

en la cual se observa que:


a) los valores extremos de la variable media muestral son
coincidentes con los de la variable xi (en este caso son 2 y 11), y
b) a medida que el tamaño n de la muestra crece, como la cantidad de
muestras posibles aumentará considerablemente, aparecerán para la
media muestral nuevos valores que siempre oscilarán entre los valores
extremos ya determinados. Es decir que, en ese caso, la gráfica de
bastones que se observa más arriba presentará nuevos valores y una
mayor cantidad de bastones. En el límite, cuando n crezca
indefinidamente, la variable media muestral se convertirá en continua y
la gráfica de bastones se transformará en un área, lo que permite
obtener la:
6ª conclusión: en el muestreo con reposición, cuando n , la variable media
2
muestral se distribuye normalmente con parámetros x  x y  2  x .
x n
 2
Es decir que x   N (x ; x ) si n. Obsérvese que en esta última conclusión no se
n
menciona para nada cuál es la distribución de la variable xi, por lo cual se puede afirmar que esta
conclusión se cumple cualquiera sea la forma que toma la distribución de xi. Si esa forma
fuera normal, el gráfico de la página siguiente permite comparar cómo se verían tanto la
distribución de las dos variables involucradas en este análisis.
Esta última conclusión suele encontrarse en los libros de texto bajo la denominación de
Teorema Central del Límite.

---------------------------------
Probabilidades y Estadística – Año 2005
111

b) Caso sin reposición o para poblaciones finitas:


Partiendo del ejemplo inicial en el cual la población tiene un tamaño N=5, ahora se
selecciona muestras de tamaño n=2 sin reponer. El siguiente cuadro contiene todas las muestras
posibles elegidas de acuerdo con ese procedimiento

POBLACION DE MUESTRAS SIN REPONER DE TAMAÑO n=2

2-3 2-6 2-8 2-11


3-6 3-8 3-11
6-8 6-11
8-11
A partir del cuadro precedente se determina la
1ª conclusión : El total de muestras sin reposición de tamaño n que pueden extraerse
N
de una población de tamaño N es   .
 n
Es decir que esta primera conclusión tiene una diferencia comparada con la indicada para
el caso con reposición.
El siguiente cuadro contiene las medias muestrales de cada una de las muestras que
aparecen en el cuadro anterior:

2,5 4 5 6,5
4,5 5,5 7
7 8,5
9,5

Las conclusiones 2ª y 3ª no tienen modificación alguna en su texto, por lo que son


válidas para los casos sin reposición.
Ahora verificaremos cuál es el valor de la media poblacional de la variable media
muestral.

x   x 60
 6
M 10

---------------------------------
Probabilidades y Estadística – Año 2005
112

con lo cual comprobamos que tampoco se modifica la cuarta conclusión, y que también en el
caso sin reposición x  x .

A continuación calcularemos la variancia de la variable media muestral, es decir que


1 40,5
 2    xi  x  
2
 4,05 , lo cual permite decir que en el
x M 10
caso sin reposición la variancia de la variable aleatoria media muestral es diferente al caso
con reposición. Por consiguiente, la 5ª conclusión es que la

 x2 N  n x N n
2    
x n N 1 x n N 1

N n
en la cual el coeficiente se denomina factor de corrección para casos sin reposición
N 1
(tomar en cuenta que ese coeficiente apareció en el caso de la variancia de la Distribución
Hipergeométrica - ver Unidad 8, que es, sin dudas, un caso sin reposición).
Finalmente, diremos que la 6ª conclusión es similar a la señalada para el caso con
reposición, es decir que en el muestreo sin reposición, cuando n , la variable media muestral
se distribuye normalmente con media poblacional x  x y variancia poblacional
 x2 N  n
2  .
x n N 1
 x2 N  n
Es decir que x   N (x ; ) si n.
n N 1

4 - DISTRIBUCION MUESTRAL DE LOS DESVIOS ESTANDAR:

El desvío estándar muestral (Sx) es, como cualquier cálculo muestral y en función de la
generalización de la 3ª conclusión, una variable que posee su media y su variancia poblacionales,
las cuales son (sin demostración en este caso particular):
E / S x )  S   x
x

 x2
y V ( S x )   S2 
x 2n
por lo cual se puede decir que la variable desvío estándar muestral Sx se distribuye
2
normalmente con parámetros esperanza matemática x y variancia x .
2n
 2
Es decir que Sx  N (  x ; x ) si n  .
2n

---------------------------------
Probabilidades y Estadística – Año 2005
113

TEORIA DE LAS MUESTRAS


DISTRIBUCIONES MUESTRALES
RESUMEN FINAL
Varia- EN POBLACIONES INFINITAS
bles Media Variancia D.Estandar
Poblacional Poblacional Poblacional
Media  x2 x
V ( x)   2  DS( x)   
muestral E ( x)  x  x x n x n
x
Desvío
E (Sx )    x  x2 x
Estandar
Sx V (Sx )   S2  DS (S x )   S 
Sx x
2n
x 2n

Varia- EN POBLACIONES FINITAS


ble Media Variancia D.Estándar
Poblacional Poblacional Poblacional
Media  x2 N  n x N n
V ( x)   2  DS ( x)   
muestral E ( x)  x  x x n N 1 x n N 1
x

PREGUNTAS TEORICAS SOBRE TEORIA DE LAS MUESTRAS:

1) La media muestral es una variable. ¿Cómo es su dispersión respecto de la dispersión


de la variable xi?
a) mayor
b) menor
c) igual

2) Una de estas condiciones es verdadera. Indique cuál es.



a) x  x
n
b)  2   x2
x
c) el total de muestras posibles de tamaño n con reposición es igual a Nn
3) ¿Cuál es la forma de la distribución de la variable media muestral cuando el tamaño de la
muestra tiende a infinito?
a) Poisson
b) Binomial
c) Normal

BIBLIOGRAFIA CONSULTADA:

 Berenson – Levine
“Estadística básica en Administración”
Editorial Prentice Hall - 6ª Edición

---------------------------------
Probabilidades y Estadística – Año 2005
114

 Kazmier L. – Díaz Matta A.


“Estadística Aplicada a Administración y Economía”
Editorial McGraw Hill - 2ª Edición
 Mendenhall – Reinmuth
“Estadística para Administración y Economía”
Grupo Editorial Iberoamérica - Año 1993
 Walpole – Myers
“Probabilidades y Estadística”
Editorial McGraw Hill - 4ª Edición
 Montiel – Ríos – Barón
“Elementos Básicos de Estadística Económica y Empresarial”
Editorial Prentice Hall – Año 1996
 Levin – Rubin
“Estadística para Administradores”
Editorial Prentice Hall - 6ª Edición
 Meyer P.
“Probabilidad y Aplicaciones Estadísticas”
Editorial Fondo Educativo Interamericano S.A. - Año 1973
 Núñez – Núñez – Argüello
“Probabilidades y Elementos de Estadística”
Editorial Nueva Librería - Año 1983
 Cramer H.
“Elementos de la Teoría de las Probabilidades”
Editorial Aguilar - 3ª Edición
 Spiegel M.
“Teoría y Problemas de Estadística” -
Editorial Shaum

---------------------------------
Probabilidades y Estadística – Año 2005

También podría gustarte