Está en la página 1de 10

Dr. C. Ing. José A.

Vilalta Alonso 1

Estadística I. Tema 3. Estadística Inferencial.

Introducción. Muestreo
Objetivo:
Distinguir entre los tipos de muestreo a partir de las características de los mismos y apli-
car el procedimiento para tomar una muestra aleatoria simple.

Bibliografía:

1. 1. Walpole, R.; Myers, R.; Myers S. (2008). Probabilidad y Estadística para Inge-
nieros. Parte I, capítulo 8, pp. 198-208. Sexta Edición, Editorial Félix Varela, La
Habana, Cuba.

Introducción.
Comienza aquí el estudio de la inferencia estadística o estadística inferencial, que ocupará
el resto de la asignatura. Conviene, por lo tanto, dejar claro en qué consiste la misma.

Pero no puede comenzarse el estudio de la inferencia estadística sin antes precisar en qué
consiste de manera general, abordar varios conceptos, algunos de ellos muy utilizados en
la vida diaria, pero que por su importancia para el tema deben precisarse, y estudiar,
aunque sea de manera supercial algunos elementos claves de la teoría del muestreo.

La estadística: descriptiva e inferencial.


Los métodos estadísticos se clasican de diversas maneras, teniendo en cuenta varios crite-
rios. Pero tal vez la clasicación más general es la que divide los métodos de la estadística
(y por lo tanto a la estadística misma) en dos grandes grupos: la estadística descriptiva y
la inferencia estadística.

La estadística descriptiva consiste en la descripción de un volumen relativamente


grande de datos, basadas en técnicas numéricas y grácas.

Un ejemplo de aplicación de la estadística descriptiva pudiera ser el siguiente: Se dispone


de los datos (nombres, edad, sexo, año académico, centro de procedencia, opción en la
que pidió la carrera, y otros) de todos. Describir el comportamiento de estos datos según
las variables medidas es el objetivo de la estadística descriptiva. Y ese análisis puede ser
univariado, bivariado o multivariado. Es decir, puede incluir análisis del comportamiento
para variables individuales, para dos o más variables. Siempre de acuerdo al objetivo que
se persiga.

Así por ejemplo puede decirse que el 70 % de los estudiantes son mujeres, que el 35 % de
los estudiantes están cuarto año, que de los estudiantes de cuarto año el 81 % es mujer y
así sucesivamente.
Dr. C. Ing. José A. Vilalta Alonso 2

La inferencia estadística consiste en tomar decisiones acerca de una población a partir


de los datos de muestra. Los resultados obtenidos con la muestra permiten inferir lo que
ocurre en la población.

Supongamos que la población son todos los estudiantes del curso diurno de la carrera de
Ingeniería Industrial y quiere conocerse sus opiniones acerca del desarrollo del proceso
de formación (calidad de la enseñanza, preparación de los profesores, uso de bibliografía
actualizada, uso de idioma inglés, condiciones de las aulas y otros).

Se toma una muestra de estudiantes y se les hace una encuesta para que viertan su opi-
nión al respecto. Los resultados obtenidos a partir de la muestra se inferirán para toda la
población. Digamos que el 80 % de los encuestados considera que el nivel de preparación
de los profesores es alto. La conclusión será que, aproximadamente, el 80 % de todos los
estudiantes del curso diurno de la carrera de Ingeniería Industrial considera que el nivel
de preparación de los profesores es alto.

Obviamente, para poder hacer estas inferencias la muestra que se tome debe tener ciertas
características. Posteriormente se estudiará lo relacionado con el muestreo.

Algunos conceptos básicos.


El primero de estos conceptos es el de población. La población es el conjunto de todos
los posibles individuos (personas, empresas, talleres, productos, etc.) de interés con una
característica común medible.

La muestra, por su parte, en una porción de la población.


Los conceptos de población y muestra son relativos, es decir, lo que a efectos de un de-
terminado estudio constituye una población, a los efectos de otro estudio pudiera ser una
muestra, o lo que a unos efectos es una muestra a otros pudiera ser la población.

Posteriormente, al adentrarnos en la inferencia estadística, se volverá sobre estos concep-


tos.

Muy asociados a los conceptos anteriores, y de mucha importancia para comprender la


esencia de la inferencia estadística y por lo tanto, resolver adecuadamente los problemas
que se presentan, están los conceptos de parámetros y estadígrafos.

Se entiende por parámetro a un valor constante que caracteriza a una población, mien-
tras que un estadígrafo, estadístico o estadística, es una función que se evalúa con los
datos de una muestra o, de manera más sencilla, una variable aleatoria que caracteriza a
una muestra.

La tabla 1 presenta los parámetros y estadígrafos más utilizados en esta asignatura:


Dr. C. Ing. José A. Vilalta Alonso 3

Tabla 1: Parámetros y estadígrafos.

Parámetro Concepto Estadígrafo


µ Media o promedio X̄
σ2 Varianza S2
σ Desviación típica S
p Proporción p̂

Observe que, tanto la población como la muestra, pueden tener, por ejemplo, media, va-
rianza y proporciones. Conceptualmente, como se deja claro en sus deniciones, son cosas
diferentes, que expresan lo mismo.

Pongamos como ejemplo la media o promedio. En ambos casos es una medida de ten-
dencia central que expresa un valor alrededor del cual se encuentran los valores de una
variable, los que pueden corresponder a la población o a la muestra, según sea el caso. Si
es de la población (µ) es una constante, un valor único para la población. Es la media
o promedio poblacional. Pero si es de la muestra es una variable aleatoria, pues su valor
depende de la muestra.

Esto puede ejemplicarse con dos situaciones:

Suponga que el peso de unas bolsas es una variable aleatoria normal con media 170
2
g y varianza 4 g2. En este caso se está hablando de µ y σ , pues se está haciendo
referencia al comportamiento poblacional de una variable o, sencillamente, no se
está reriendo a una muestra. Estos valores (170 y 4) son constantes, valores únicos
para esa población, a la que caracterizan.

Suponga que se te toma una muestra aleatoria de 16 bolsas y se obtiene que el peso
promedio es de 169 g con una varianza de 4,5 g. se está haciendo referencia a la
2
media y varianza de una muestra, por lo tanto, a X̄ y S . Estos valores caracterizan
a la muestra. Si se toman otras 16 bolsas, los valores obtenidos serán, con una alta
probabilidad, diferentes. Por eso los estadígrafos son variables aleatorias.

Algunos fundamentos del muestreo.


Lo primero que es importante exponer aquí son algunas de las razones que justican la
necesidad del muestreo, es decir, de tomar muestras para estudiar a la población. Entre
las razones más importantes están:

Imposibilidad física de vericar todos los elementos de la población. Ya sea porque


son muchos o porque es difícil el acceso a los individuos que conforman la población.

El costo de estudiar todos los elementos de una población es generalmente alto.

Por la naturaleza destructiva de ciertas pruebas. En muchos casos para estudiar las
características de los individuos de la población es necesario destruirlos: si se quiere
medir la resistencia a la tensión del hormigón fabricado, o de unas piezas a las que
Dr. C. Ing. José A. Vilalta Alonso 4

se le ha aplicado un tratamiento térmico, o medir el contenido de proteínas de un


anticuerpo monoclonal, etc. Si se estudiara toda la pobalción no habría productos
que vender o consumir.

Los resultados de la muestra suelen ser adecuados. Inclusive se ha demostrado que


el estudiar toda la población, en situaciones en que es factible, no garantiza, por
varias razones, que los resultados estén libres de errores.

Uno de los aspectos más importantes en la teoría clásica de la estadística es el muestreo,


toda vez que, en un problema de estadística, es necesario inferir lo que ocurre en la po-
blación a partir de los resultados de una muestra.

La teoría relacionada con el muestro es vasta y muy compleja. Aquí solo se abordarán
elementos muy básicos, que permitan cumplir con los objetivos del curso.

El muestreo consiste en seleccionar de una población un conjunto de elementos, siguien-


do determinadas reglas.

El muestreo puede ser probabilístico o no probabilístico. Este último consiste en


tomar muestras basadas en criterios como la accesibilidad o en un juicio subjetivo rela-
cionado con la opinión personal o intencional de quién lo realiza o diseña, mientras que
en el muestreo probabilístico la muestra es el resultado de un proceso aleatorio.

Muchas veces el muestreo no probabilístico, al no estar sustentado en la teoría de las


probabilidades, es subvalorado por los investigadores e ingenieros. Sin embargo, en deter-
minadas condiciones, como cuando se inicia un estudio o no hay información previa sobre
la población este tipo de muestreo resulta sumamente útil.

Muestreo probabilístico.
El muestreo probabilístico se caracteriza por:

Las unidades muestrales se eligen a través de un proceso aleatorio.

Cada elemento de la población tiene una probabilidad conocida de ser escogido.

Tiene una base probabilística, lo que permite acotar los errores y evaluar la precisión.

Permite evaluar la representatividad de la muestra.

Algo muy importante para que una muestra pueda cumplir con efectividad su cometido, es
decir, predecir o inferir el comportamiento de la población, es que sea representativa. La
representatividad de la muestra está dada, en principio, porque la variabilidad existente
en la población esté adecuadamente representada en la muestra. Esto no es fácil de lograr.

Esta representatividad se consigue mediante una adecuada selección de sus elementos, de


forma tal que todos los individuos de la población tengan una probabilidad conocida de
ser incluidos, como ya se comentaba.
Dr. C. Ing. José A. Vilalta Alonso 5

Esta adecuada selección pasa por dos muy importantes aspectos:

Tamaño de la muestra (n)

Forma de tomar la muestra (muestreo)

Como ya se sugirió, ambos aspectos son muy importantes. Es muy común que las personas
que deseen tomar una muestra pregunten por la manera de determinar el tamaño de la
muestra.

Es cierto que esto no es sencillo. Pero expresiones matemáticas que permiten calcular el
tamaño de muestra en dependencia de lo que se desee estudiar en las poblaciones, de
la manera que se tome la muestra y de algunas decisiones importantes, sobre las que se
profundizará posteriormente, como son la conanza y la precisión con que se deseen los
resultados y que tienen en cuenta algunos aspectos de la población como son su tamaño
y la variabilidad existente desde el punto de vista de lo que se desea estudiar.

Sin embargo, de poco sirve calcular acertadamente el tamaño necesario de una muestra,
si después esa muestra no se toma de la manera adecuada, de manera que se garantice,
en lo posible, que sea representativa de la población que se desea estudiar.

Por ello es que no menos importante que calcular correctamente el tamaño de la muestra,
es seleccionar adecuadamente la muestra, lo que se conoce como muestreo.

Hay varias maneras de tomar una muestra probabilística. Los cuatro tipos básicos de
muestreo probabilísticos son:

1. Muestreo aleatorio simple (m.a.s.)

2. Muestreo agrupado

3. Muestreo estraticado

4. Muestreo sistemático

Muestreo aleatorio simple.


El muestreo aleatorio simple es, como su nombre lo indica, la manera más simple de tomar
una muestra aleatoria. Consiste en una forma de muestreo en que todos los elementos de
la población tienen una probabilidad conocida de ser seleccionados para formar parte de
la muestra y esta probabilidad, además, es la misma para cada uno de ellos.

Un proceder sencillo para tomar una muestra aleatoria simple es el siguiente:

1. Se enumeran los elementos de la población (la unidad de muestreo)

2. Se generan n números aleatorios


Dr. C. Ing. José A. Vilalta Alonso 6

3. Se seleccionan aquellos elementos de la población cuyo número de orden coincidan


con los números aleatorios seleccionados.

Por ejemplo, si en su grupo de clases hay 30 estudiantes y usted quiere tomar una mues-
tra aleatoria simple de tamaño 4 (formada por 4 estudiantes) procederá a enumerar a
todos los estudiantes del 1 al 30 (en este caso pudiera utilizar el listado ocial de cada
grupo), posteriormente selecciona n números aleatorios (estos números pueden obtenerse
de tablas elaboradas con ese n o pueden ser generados en computadoras). Si el pri-
mer número aleatorio seleccionado es el 17, por ejemplo, el primer elemento de la muestra
será el estudiante con ese número. Se procede de igual manera hasta completar la muestra.

La gura 1 representa grácamente este tipo de muestreo.

Figura 1: Representación gráca del muestreo aleatorio simple.

Minitab permite generar números aleatorios. Para ello se sigue la secuencia:

Calc >Randon Data y a continuación se despliega una cantidad de distribuciones de pro-


babilidad que pueden seguir los datos que se generen. Para el caso que nos ocupa puede
utilizarse la opción Integer, lo que permitirá generar la cantidad de números deseados,
entre un mínimo y un máximo denidos.

Hay expresiones matemáticas que permiten calcular el tamaño de muestra cuando se desea
tomar una muestra aleatoria simple. Estas expresiones, particularmente para los casos en
que se desea trabajar con medias y proporciones, serán estudiadas posteriormente en el
curso.

Sin embargo, alrededor de este tema hay algo que vale la pena que sea comentado ahora.
Existe la creencia de que cuando una población es muy grande el tamaño de muestra ne-
cesario para obtener una muestra que garantice los requisitos establecidos es también muy
grande. Y esto es cierto, pero hasta un cierto punto. En la medida que crece el tamaño
de la población, a partir de determinados valores, el tamaño de muestra necesario apenas
crecerá. La gura 2, construida para una situación concreta, así lo muestra.
Dr. C. Ing. José A. Vilalta Alonso 7

Figura 2. Tamaño de la muestra vs. tamaño de la población.

Puede apreciarse que cuando el tamaño de la población es relativamente pequeño tiene


una gran inuencia en el tamaño de la muestra, lo cual se reeja en la pendiente tan
pronunciada en el primer tramo, pero a partir de un determinado valor, el tamaño de la
población apenas inuye en el tamaño de la muestra.

El muestreo aleatorio simple tiene dos grandes limitaciones. Una es que no es efectivo
cuando hay una alta variabilidad en la población, sobre todo si esta alta variabilidad se
debe a la presencia de estratos. La otra es cuando el acceso a los elementos que conforman
la población es difícil.

Estas situaciones son resueltas con la realización de otros tipos de muestreo.

Muestreo estraticado.
Este es un tipo de muestreo recomendado cuando en una población hay una alta varia-
bilidad o pueden denirse estratos. En este caso la población se divide en estratos (que
pueden estar natural o articialmente formados) y para cada uno de ellos se realiza un
muestreo aleatorio simple. De esta manera cada estrato se estudia de forma separada.

Conviene recordar que un estrato es un grupo que tiene la característica de ser homogé-
neo internamente y muy diferente con respecto a los demás, desde el punto de vista de la
característica que se esté estudiando.

Para seleccionar una muestra aleatoria simple en cada estrato se calcula el tamaño gene-
ral de la muestra. Posteriormente en cada estrato se toma una muestra que puede ser del
mismo tamaño para todos, de tamaño proporcional al tamaño del estrato o de acuerdo a
la variabilidad en cada estrato.

Por ejemplo, se quiere hacer un muestreo entre los hoteles de una ciudad con el n de es-
tudiar los niveles de satisfacción de los clientes. Los hoteles se pueden dividir por estratos
(Cinco, Cuatro y Tres Estrellas) y en cada estrato realizar un muestreo aleatorio simple.
Dr. C. Ing. José A. Vilalta Alonso 8

En este caso se ha hecho la consideración, a partir de estudios anteriores, de que el nivel


de satisfacción depende de la categoría de los hoteles, por lo que hay cierta homogeneidad
dentro de una categoría, que a su vez es diferente a las demás.

La gura 3 representa el muestreo estraticado.

Figura 3: Representación gráca del muestreo estraticado.

Muestreo agrupado
Este es un tipo de muestreo adecuado para cuando el acceso a los elementos que confor-
man la población se hace difícil. En este caso la población se divide en grupos, cada uno
de los cuales tiene una variabilidad similar a la variabilidad de la población.

Posteriormente se toma una muestra aleatoria simple en cada grupo. También pudiera
pasar que se tome primeramente una muestra aleatoria simple de grupos y posteriormen-
te una muestra aleatoria simple dentro de cada grupo seleccionado.

Suponga que se quiere estudiar el nivel de satisfacción de los estudiantes de la Cujae con el
proceso de formación. Debido a que los estudiantes están localizados en diferentes lugares,
alejados en algunos casos, dentro del campus, se decide considerar que cada facultad es
un grupo y dentro de cada facultad realizar un muestreo aleatorio simple.

Para este ejemplo se ha hecho la consideración previa de que las condiciones existentes
garantizan que el nivel de satisfacción entre las facultades es similar y representativo del
de toda la universidad.

Una representación gráca de este tipo de muestreo de muestra en la gura 4.


Dr. C. Ing. José A. Vilalta Alonso 9

Figura 4. Representación gráca del muestreo agrupado.

Muestreo sistemático
Esta forma de muestreo bastante utilizada cuando los elementos de la población tienen
un orden sistemático (por ejemplo, personas que llegan una detrás de otras a una estación
de servicios, piezas que salen de una máquina, etc.).

En este caso, y teniendo en cuenta el tamaño de la muestra, se selecciona de forma alea-


toria el primer elemento de la muestra. Y cada cierto tiempo, o cada cierta cantidad de
elementos se va tomando otro elemento.

Suponga que se desea tomar una muestra diaria de 6 piezas en una línea que produce 60
piezas diarias. Se toma de manera aleatoria una pieza entre las primeras 10. Y a partir
de ella, cada 10 piezas, se toma una hasta completar la muestra.

En la gura 5 puede verse una representación gráca del muestreo sistemático.

Figura 5. Representación gráca del muestreo sistemático.

Note que el muestreo aleatorio simple, de alguna manera, siempre se aplica en los otros
métodos de muestreo

Ejercicio 1. Genere tres situaciones en las que sea necesario o conveniente, a partir del
objetivo trazado, hacer un muestreo aleatorio simple, un muestreo estraticado y uno
agrupado.

Hasta aquí, algunos de los elementos básicos de la teoría de muestreo. Como resultado
del muestreo se obtienen muestras, cuya nalidad es permitirnos inferir acerca del com-
Dr. C. Ing. José A. Vilalta Alonso 10

portamiento de determinados aspectos en la población. Ya se dijo que las muestras se


caracterizan con estadígrafos, que son variables aleatorias.

En la siguiente clase se abordarán las leyes o distribuciones de probabilidad de este tipo


de variables aleatorias, aspecto de capital importancia para el estudio de los métodos de
la inferencia estadística.

También podría gustarte