Está en la página 1de 10

Estadística – Módulo 6

Módulo 6: Muest eo aleato io


Introducción
La recolección de datos en forma objetiva y que realmente representen cabalmente lo que se desea
experimentar tiene una gran importancia, ya que la mejor aproximación a lo real lo podemos conseguir a
partir de la selección de las muestras con algún criterio, a partir de la aplicación de diferentes técnicas, que
nos permita aseverar que la misma representa a toda la población sobre la cual se desea realizar el
experimento, siempre y cuando el trabajo se base en una muestra y no en un censo.

Previamente repasemos algunos conceptos importantes a utilizar en este módulo, algunos ya definidos al
inicio del curso:

Población:

•Es todo conjunto de elementos, finito o infinito, definido por una o más características, de las que
gozan todos los elementos que lo componen, y solo ellos.
•En muestreo se entiende por población a la totalidad del universo que interesa considerar, y que es
necesario que este bien definido para que se sepa en todo momento cuales son los elementos que
lo componen.

Censo:

•Cuando es posible estudiar cada uno de los elementos que componen la población, se realiza lo
que se denomina un censo, es decir, el estudio de todos los elementos que componen la población.
•Dos motivos importantes impiden la realización de un censo:
•a) económicos: el estudio de todos los elementos que componen una población, sobre todo si esta
es grande, suele ser un problema costoso en tiempo, dinero, etc.;
•b) tamaño: que la población sea infinita o tan grande que exceda las posibilidades del investigador.

Muestra:

•En todas las ocasiones en que no es posible o conveniente realizar un censo, lo que hacemos es
trabajar con una muestra, entendiendo por tal, una parte representativa de la población. Para que
una muestra sea representativa, y por lo tanto útil, debe de reflejar las similitudes y diferencias
encontradas en la población, ejemplificar las características de la misma. Cuando decimos que una
muestra es representativa indicamos que reúne aproximadamente las características de la
población que son importantes para la investigación.

ISIV-Educación a Distancia Pag. 66


Estadística – Módulo 6

Inferencia estadística:
Así, la inferencia estadística nos permitirá obtener conclusiones sobre el comportamiento de la población a
partir del estudio de la muestra.

Las técnicas de las que hace uso la inferencia estadística puede dividirse atendiendo a los diversos
procedimientos que aplica:

Si del fenómeno aleatorio por el que estamos interesados, conocemos el modelo de probabilidad a falta de
uno o más parámetros que lo determinen estaremos hablando de inferencia paramétrica. Si desconocemos
el comportamiento probabilístico del fenómeno debemos de hacer uso de la inferencia no paramétrica.

Dentro de la inferencia paramétrica la determinación de los parámetros que determinan la distribución


puede realizarse mediante diferentes técnicas:

Estimación Puntual: Estimación por intervalos: Contraste de hipótesis:

•Mediante este •Daremos un rango de •Se plantearan dos


procedimiento daremos variación del parámetro hipótesis de trabajo y se
un valor exacto desconocido asociándole elegirá una de ellas
(estimado) del parámetro una determinada asociándole una
desconocido. fiabilidad a la predicción. determinada fiabilidad en
términos de probabilidad.

Esto lo podemos resumir en el siguiente cuadro sinóptico:

Estimulación puntual

Paramétrica Estimulación por intervalos


Inferencia
estadística
No paramétrica Contrastes de hipótesis

Además puede clasificarse respecto a la información utilizada, dividiendo en clásicos y bayesianos.

Tipos de muestreo
Hay diferentes criterios de clasificación de los diferentes tipos de muestreo, aunque en general pueden
dividirse en dos grandes grupos: métodos de muestreo probabilísticos y métodos de muestreo no
probabilísticos.

ISIV-Educación a Distancia Pag. 67


Estadística – Módulo 6

Métodos de muestreo probabilísticas.


Los métodos de muestreo probabilísticos son aquellos que se basan en el principio de equiprobabilidad. Es
decir, aquellos en los que todos los individuos tienen la misma probabilidad de ser elegidos para formar
parte de una muestra y, consiguientemente, todas las posibles muestras de tamaño n tienen la misma
probabilidad de ser elegidas. Solo estos métodos de muestreo probabilísticos nos aseguran la
representatividad de la muestra extraída y son, por tanto, los más recomendables.

Dentro de los métodos de muestreo probabilísticos encontramos los siguientes tipos:

Muestreo Aleatorio:
Para comenzar, empezaremos distinguiendo dos clases de poblaciones: Poblaciones finitas y poblaciones
infinitas.

Una población es finita si consta de un número finito o fijo de elementos, medidas u observaciones. (O sea el
número de elementos es factible de ser contado) Por ejemplo los pesos netos de 2000 latas de atún, las
calificaciones de todos los estudiantes de una escuela, etc....

A diferencia de las poblaciones finitas, las poblaciones infinitas contienen una infinidad de elementos. Este
es el caso de cuando observamos una variable continua y hay una infinidad de resultados distintos.

Para ver la idea de muestreo aleatorio en una población finita de tamaño N, primero veamos cuantas
muestras distintas se pueden tomar de tamaño n.

El número de muestras distintas es ( ) (Número combinatorio)

Por ejemplo si ( ) muestras distintas.

Con base en el resultado de que hay ( ) muestras distintas de tamaño n de una población finita de tamaño
N, podemos definir como muestra aleatoria o muestra aleatoria simple de una población finita:

“U a uestra de tamaño n de una población finita de tamaño N es una variable aleatoria si se selecciona de
manera tal que cada una de las ( ) muestras posibles tienen la misma probabilidad de ser seleccionada.
( )

Por ejemplo si una población consistente en 5 elementos y los elegimos grupos de


tendremos las siguientes combinaciones:

Hay muestras posibles de tamaño n = 3.

Estas constan de los elementos: 123, 124, 125, 134, 135, 145, 234, 235, 245, 345 si seleccionamos una de
esas muestras de forma que esta muestra tenga probabilidad 1/10 de ser elegida, decimos que dicha
muestra es aleatoria.

En la práctica el describir todas las posibles muestras sería complicado si N y n son grandes. Por ejemplo si
tendríamos 64.684.950 muestras distintas.

ISIV-Educación a Distancia Pag. 68


Estadística – Módulo 6

Por suerte podemos realizar una muestra aleatoria, sin necesidad de describirlas todas.

Basta con numerar los N elementos de la población y retirar una a una hasta completar los n- elementos de
la muestra.

Este procedimiento también da una probabilidad de de ser seleccionada la muestra por los que sería
( )
aleatoria.

Ahora bien si la población es infinita: diremos que:

Una muestra de tamaño n de una población infinita es aleatoria si consta de valores de variables
aleatorias independientes que tienen la misma distribución.

Por ejemplo si lanzamos un dado 12 veces y obtenemos 2, 5, 5, 3, 3, 3, 5, 1, 6, 1, 4, 1.

Estos números constituyen una variable aleatoria si son valores aleatorios independientes que tienen la
misma distribución de probabilidad

Tipos de muestreos aleatorios:


Muestreo aleatorio simple:
El procedimiento empleado es el siguiente:

A través de algún medio mecánico: Se eligen tantos


Se asigna un •bolas dentro de una bolsa, sujetos como sea
número a cada necesario para
•tablas de números aleatorios,
individuo de la completar el tamaño
población. •números aleatorios generados con de muestra
una calculadora u ordenador, etc. requerido.

Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad práctica cuando la población que
estamos manejando es muy grande.

Muestreo aleatorio sistemático:


Este procedimiento exige, como el anterior, numerar todos los elementos de la población, pero en lugar de
extraer n números aleatorios solo se extrae uno. Se parte de ese número aleatorio i, que es un numero
elegido al azar, y los elementos que integran la muestra son los que ocupan los lugares
, es decir se toman los individuos de k en k, siendo k el resultado de dividir el tamaño de
la población entre el tamaño de la muestra: .

El numero i que empleamos como punto de partida será un número al azar entre 1 y k.

El riesgo se este tipo de muestreo está en los casos en que se dan periodicidades en la población ya que al
elegir a los miembros de la muestra con una periodicidad constante (k) podemos introducir una
homogeneidad que no se da en la población.

ISIV-Educación a Distancia Pag. 69


Estadística – Módulo 6

Imaginemos que estamos seleccionando una muestra sobre listas de 10 individuos en los que los 5 primeros
son varones y los 5 últimos mujeres, si empleamos un muestreo aleatorio sistemático con k=10 siempre
seleccionaríamos o solo hombres o solo mujeres, no podría haber una representación de los dos sexos.

Muestreo aleatorio estratificado:


Trata de obviar las dificultades que presentan los anteriores ya que simplifican los procesos y suelen reducir
el error muestral para un tamaño dado de la muestra. Consiste en considerar categorías típicas diferentes
entre sí (estratos) que poseen gran homogeneidad respecto a alguna característica (se puede estratificar,
por ejemplo, según la profesión, el municipio de residencia, el sexo, el estado civil, etc.). Lo que se pretende
con este tipo de muestreo es asegurarse de que todos los estratos de interés estarán representados
adecuadamente en la muestra. Cada estrato funciona independientemente, pudiendo aplicarse dentro de
ellos el muestreo aleatorio simple o el estratificado para elegir los elementos concretos que formaran parte
de la muestra. En ocasiones las dificultades que plantean son demasiado grandes, pues exige un
conocimiento detallado de la población. (Tamaño geográfico, sexos, edades,...).

La distribución de la muestra en función de los diferentes estratos se denomina


afijación,

puede ser de diferentes tipos:

Afijación Simple: Afijación Proporcional: Afijación Óptima:


•A cada estrato le •La distribución se hace de •Se tiene en cuenta la previsible
corresponde igual acuerdo con el peso dispersión de los resultados, de
número de elementos (tamaño) de la población modo que se considera la
muestrales. en cada estrato. proporción y la desviación típica.
Tiene poca aplicación ya que no
se suele conocer la desviación.

Supongamos que estamos interesados en estudiar el grado de aceptación que la implantación de la reforma
educativa ha tenido entre los padres de una determinada provincia.

A tal efecto seleccionamos una muestra de 600 sujetos. Conocemos por los datos del ministerio que de los
10000 niños escolarizados en las edades que nos interesan, 6000 acuden a colegios públicos, 3000 a colegios
de gestión privada con aporte estatal y 1000 a colegios netamente privados. Como estamos interesados en
que en nuestra muestra estén representados todos los tipos de colegios, realizamos un muestreo
estratificado empleando como variable de estratificación el tipo de centro.

Si empleamos una afijación simple elegiríamos 200 niños de cada tipo de centro, pero en este caso parece
más razonable utilizar una afijación proporcional pues hay bastante diferencia en el tamaño de los estratos.
Por consiguiente, calculamos que proporción supone cada uno de los estratos respecto de la población para
poder reflejarlo en la muestra.

 Colegios públicos: 6000/10000=0.60


 Colegios de gestión privada con aporte estatal: 3000/10000=0.30
 Colegios netamente privados: 1000/10000=0.10

ISIV-Educación a Distancia Pag. 70


Estadística – Módulo 6

Para conocer el tamaño de cada estrato en la muestra no tenemos más que multiplicar esa proporción por el
tamaño muestral.

 Colegios públicos: 0.60x600=360 sujetos


 Colegios privados concertados: 0.30x600=180 sujetos
 Colegios netamente privados: 0.10x600= 60 sujetos

Muestreo aleatorio por conglomerados:


Los métodos presentados hasta ahora están pensados para seleccionar directamente los elementos de la
población, es decir, que las unidades muestrales son los elementos de la población. En el muestreo por
conglomerados la unidad muestral es un grupo de elementos de la población que forman una unidad, a la
que llamamos conglomerado. Las unidades hospitalarias, los departamentos universitarios, una caja de
determinado producto, etc., son conglomerados naturales. En otras ocasiones se pueden utilizar
conglomerados no naturales como, por ejemplo, las urnas electorales.

Cuando los conglomerados son áreas geográficas suele hablarse de "muestreo por áreas".

El muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto número de conglomerados


(el necesario para alcanzar el tamaño muestral establecido) y en investigar después todos los elementos
pertenecientes a los conglomerados elegidos.

En una investigación en la que se trata de conocer el grado de satisfacción laboral los profesores de instituto
necesitamos una muestra de 700 sujetos. Ante la dificultad de acceder individualmente a estos sujetos se
decide hacer una muestra por conglomerados.

Sabiendo que el número de profesores por instituto es aproximadamente de 35, los pasos a seguir serían los
siguientes:

1- Recoger un listado de todos los institutos.


2- Asignar un número a cada uno de ellos.
3- Elegir por muestreo aleatorio simple o sistemático los 20 institutos (700/35=20) que nos
proporcionaran los 700 profesores que necesitamos.

Para finalizar con esta exposición de los métodos de muestreo probabilísticos es necesario comentar que
ante lo compleja que puede llegar a ser la situación real de muestreo con la que nos enfrentemos es muy
común emplear lo que se denomina muestreo polietapico.

Este tipo de muestreo se caracteriza por operar en sucesivas etapas, empleando en cada una de ellas el
método de muestreo probabilístico más adecuado.

A veces, para estudios exploratorios, el muestreo probabilístico resulta excesivamente costoso y se acude a
métodos no probabilísticos, aun siendo conscientes de que no sirven para realizar generalizaciones, pues no
se tiene certeza de que la muestra extraída sea representativa, ya que no todos los sujetos de la población
tienen la misma probabilidad de ser elegidos. En general se seleccionan a los sujetos siguiendo determinados
criterios procurando que la muestra sea representativa.

ISIV-Educación a Distancia Pag. 71


Estadística – Módulo 6

Muestreo por cuotas:


También denominado en ocasiones "accidental". Se asienta generalmente sobre la base de un buen
conocimiento de los estratos de la población y/o de los individuos más "representativos" o "adecuados" para
los fines de la investigación. Mantiene, por tanto, semejanzas con el muestreo aleatorio estratificado, pero
no tiene el carácter de aleatoriedad de aquel. En este tipo de muestreo se fijan unas "cuotas" que consisten
en un número de individuos que reúnen unas determinadas condiciones, por ejemplo: 20 individuos de 25 a
40 años, de sexo femenino y residentes en Gijon. Una vez determinada la cuota se eligen los primeros que se
encuentren que cumplan esas características. Este método se utiliza mucho en las encuestas de opinión.

Por ejemplo, se desea estudiar la incidencia de las drogas en la adolescencia. Lo que deberíamos hacer seria:
conocer por los informes de las entidades responsables cuales son los centros más afectados por el
problema, fijar un numero de sujetos a entrevistar proporcional a cada uno de los estratos (cuotas) y
finalmente dejar en manos de los responsables del trabajo de campo a que sujetos concretos se deberá
entrevistar.

Muestreo opinático o intencional:


Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener muestras "representativas"
mediante la inclusión en la muestra de grupos supuestamente típicos. Es muy frecuente su utilización en
sondeos preelectorales de zonas que en anteriores votaciones han marcado tendencias de voto.

Muestreo casual o incidental:


Se trata de un proceso en el que el investigador selecciona directa e intencionadamente los individuos de la
población. El caso más frecuente de este procedimiento el utilizar como muestra los individuos a los que se
tiene fácil acceso (los profesores de universidad emplean con mucha frecuencia a sus propios alumnos). Un
caso particular es el de los voluntarios.

Bola de nieve:
Se localiza a algunos individuos, los cuales conducen a otros, y estos a otros, y así hasta conseguir una
muestra suficiente. Este tipo se emplea muy frecuentemente cuando se hacen estudios con poblaciones
"marginales", delincuentes, sectas, determinados tipos de enfermos, etc.

Noción de muestra aleatoria


Definición de Estadístico.
Desde el punto de vista estadístico y para el desarrollo de lo que sigue es de vital importancia diferenciar
entre muestra y realización muestral. Con este objetivo introducimos el siguiente ejemplo:

Supongamos que tenemos la población formada por los 5 primeros números enteros y que deseamos
extraer una muestra de tamaño dos.

1
2
3
4 5

ISIV-Educación a Distancia Pag. 72


Estadística – Módulo 6

Dependiendo de la extracción podremos obtener diferentes resultados, en este caso, podemos enumerar
todos los resultados posibles (1,2), (1,3)... etc.

Desde un punto de vista formal podemos definir: Una muestra aleatoria simple de tamaño n de una
población (v.a.) X es un vector aleatorio dónde:

a) Todas las variables aleatorias están igualmente distribuidas y proceden de la misma población.
b) Son independientes.

Es importante aclarar que:

1) Xi representa el valor de la característica X en el i-esimo elemento de la muestra.


2) Suponer la independencia de las observaciones es cómodo para el desarrollo teórico del modelo. Esta
independencia puede entenderse bien de una forma exacta (de tal forma que cada vez que se
examina un elemento este se devuelve a la población) o bien de forma aproximada en el caso de que
el número de elementos de la población sea muy grande y el no reemplazamiento no afectase).

Una de las primeras necesidades será la de operar con los valores obtenidos en la muestra (por ejemplo
calcular la media de las observaciones), esto se traduce teóricamente operando con las variables estadistas
que componen la muestra aleatoria .

Esta necesidad nos lleva a la definición de estadístico:

Un estadístico es una función real de la muestra aleatoria

T . “e lee T del ve to

Por tanto un estadístico es una variable aleatoria y, en consecuencia, podemos trabajar con ella atendiendo
a esa característica.

Para realizar adecuadamente el proceso de inferencia con una fiabilidad determinada será necesario conocer
el comportamiento probabilístico de las muestras.

Algunos estadísticos importantes.


Alguno de los estadísticos más utilizados en todo tipo de situaciones son los siguientes:

 Media muestral: ̅ ∑

 Varianza muestral: ∑ ̅ ∑ ̅̅̅̅

 Cuasi varianza muestral: ∑ ̅

La media ya se utilizó en estadística descriptiva. Aunque el envoltorio (la formula) es la misma, hay una
diferencia sustancial entre la media aritmética que se estudió en estadística descriptiva y la media muestral
que presentamos aquí. La media aritmética es un valor "a posteriori", esto es una vez que tenemos la

ISIV-Educación a Distancia Pag. 73


Estadística – Módulo 6

realización muestral, por el contrario la media muestral es un valor "a priori", su comportamiento es
aleatorio (no toma un valor concreto) sino que tiene cierto rango de variación asociado a un determinado
modelo de probabilidad. Esto será objeto de nuestro estudio: Determinar la distribución de probabilidad de
los estadísticos arriba presentados.

Momentos de la media y la varianza muestral.


En inferencia estadística hay que tener muy clara la diferencia entre características poblacionales y
características muestrales:

Las características poblacionales


•generalmente no se conocen (por
ejemplo la media de toda la población,
etc.) (Generalmente las notaremos con
let as g iegas μ ,σ .

Las características muestrales


• siempre se pueden obtener, son las
características de las realizaciones
muestrales. (Generalmente las
escribiremos con letras latinas x,s).

La inferencia pretende "acertar" las características poblacionales de un modo optimo a partir de la muestra y
sus características.

POBLACIÓN MUESTRA
media poblacional media muestral
varianza poblacional varianza muestral
Tamaño de la población Tamaño de la muestra

Hemos realizado hasta aquí un estudio introductorio al mundo de la estadística y la probabilidad. El alumno
no debe interpretar que aquí está todo lo que necesita para ealiza u t a ajo estadísti o p ofu do… es
verdad, si, que hay herramientas que nos permitirían realizar trabajos más o menos sencillos y que se tienen
los principios de la materia, pero como ocurre en las matemáticas, parecería que nunca se llegara a estudiar
y comprender todo lo que existe en su basto universo, y la estadística como parte de la matemática no
escapa a esta apreciación.

Queda, de acuerdo al interés de los alumnos, seguir profundizando, seguir leyendo la bibliografía
suge ida… ealiza do p á ti as ue vaya de lo se illo a lo o plejo y e la solución a los distintos
problemas que vayan surgiendo, se irán sentando las bases de una comprensión y aprendizaje cada vez más
profundo.

ISIV-Educación a Distancia Pag. 74


Estadística – Módulo 6

Trabajo Práctico Nro. 6

Resolver las siguientes consignas:

1) ¿Cuál es el objetivo de la inferencia estadística? ¿Cómo se clasifica?


2) ¿Qué es y qué tipo de muestreos probabilísticos conoces?
3) Dada una población finita de tamaño N=15: ¿Cuántas muestras aleatorias de tamaño n=3 se pueden
obtener? Escribir 10 de dichas muestras.
4) Realiza un cuadro sinóptico (Síntesis) de los distintos tipos de muestreos aleatorios.
5) Selecciona la cantidad de individuos por estratos, utilizando la afijación proporcional:

U si di ato está e fo a ió dentro de un grupo económico y se desean elegir 50 representantes


del grupo: Sabemos que el grupo está conformado por un sector agropecuario donde trabajan 200
personas, un sector industrial donde trabajan 180 personas y un sector servicios con 120 personas.

¿Cómo elegirías a las personas y cuántos de cada sector?

6) ¿Qué es un estadístico? ¿Cuáles son algunos de los estadísticos más utilizados?

ISIV-Educación a Distancia Pag. 75

También podría gustarte