Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Previamente repasemos algunos conceptos importantes a utilizar en este módulo, algunos ya definidos al
inicio del curso:
Población:
•Es todo conjunto de elementos, finito o infinito, definido por una o más características, de las que
gozan todos los elementos que lo componen, y solo ellos.
•En muestreo se entiende por población a la totalidad del universo que interesa considerar, y que es
necesario que este bien definido para que se sepa en todo momento cuales son los elementos que
lo componen.
Censo:
•Cuando es posible estudiar cada uno de los elementos que componen la población, se realiza lo
que se denomina un censo, es decir, el estudio de todos los elementos que componen la población.
•Dos motivos importantes impiden la realización de un censo:
•a) económicos: el estudio de todos los elementos que componen una población, sobre todo si esta
es grande, suele ser un problema costoso en tiempo, dinero, etc.;
•b) tamaño: que la población sea infinita o tan grande que exceda las posibilidades del investigador.
Muestra:
•En todas las ocasiones en que no es posible o conveniente realizar un censo, lo que hacemos es
trabajar con una muestra, entendiendo por tal, una parte representativa de la población. Para que
una muestra sea representativa, y por lo tanto útil, debe de reflejar las similitudes y diferencias
encontradas en la población, ejemplificar las características de la misma. Cuando decimos que una
muestra es representativa indicamos que reúne aproximadamente las características de la
población que son importantes para la investigación.
Inferencia estadística:
Así, la inferencia estadística nos permitirá obtener conclusiones sobre el comportamiento de la población a
partir del estudio de la muestra.
Las técnicas de las que hace uso la inferencia estadística puede dividirse atendiendo a los diversos
procedimientos que aplica:
Si del fenómeno aleatorio por el que estamos interesados, conocemos el modelo de probabilidad a falta de
uno o más parámetros que lo determinen estaremos hablando de inferencia paramétrica. Si desconocemos
el comportamiento probabilístico del fenómeno debemos de hacer uso de la inferencia no paramétrica.
Estimulación puntual
Tipos de muestreo
Hay diferentes criterios de clasificación de los diferentes tipos de muestreo, aunque en general pueden
dividirse en dos grandes grupos: métodos de muestreo probabilísticos y métodos de muestreo no
probabilísticos.
Muestreo Aleatorio:
Para comenzar, empezaremos distinguiendo dos clases de poblaciones: Poblaciones finitas y poblaciones
infinitas.
Una población es finita si consta de un número finito o fijo de elementos, medidas u observaciones. (O sea el
número de elementos es factible de ser contado) Por ejemplo los pesos netos de 2000 latas de atún, las
calificaciones de todos los estudiantes de una escuela, etc....
A diferencia de las poblaciones finitas, las poblaciones infinitas contienen una infinidad de elementos. Este
es el caso de cuando observamos una variable continua y hay una infinidad de resultados distintos.
Para ver la idea de muestreo aleatorio en una población finita de tamaño N, primero veamos cuantas
muestras distintas se pueden tomar de tamaño n.
Con base en el resultado de que hay ( ) muestras distintas de tamaño n de una población finita de tamaño
N, podemos definir como muestra aleatoria o muestra aleatoria simple de una población finita:
“U a uestra de tamaño n de una población finita de tamaño N es una variable aleatoria si se selecciona de
manera tal que cada una de las ( ) muestras posibles tienen la misma probabilidad de ser seleccionada.
( )
Estas constan de los elementos: 123, 124, 125, 134, 135, 145, 234, 235, 245, 345 si seleccionamos una de
esas muestras de forma que esta muestra tenga probabilidad 1/10 de ser elegida, decimos que dicha
muestra es aleatoria.
En la práctica el describir todas las posibles muestras sería complicado si N y n son grandes. Por ejemplo si
tendríamos 64.684.950 muestras distintas.
Por suerte podemos realizar una muestra aleatoria, sin necesidad de describirlas todas.
Basta con numerar los N elementos de la población y retirar una a una hasta completar los n- elementos de
la muestra.
Este procedimiento también da una probabilidad de de ser seleccionada la muestra por los que sería
( )
aleatoria.
Una muestra de tamaño n de una población infinita es aleatoria si consta de valores de variables
aleatorias independientes que tienen la misma distribución.
Estos números constituyen una variable aleatoria si son valores aleatorios independientes que tienen la
misma distribución de probabilidad
Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad práctica cuando la población que
estamos manejando es muy grande.
El numero i que empleamos como punto de partida será un número al azar entre 1 y k.
El riesgo se este tipo de muestreo está en los casos en que se dan periodicidades en la población ya que al
elegir a los miembros de la muestra con una periodicidad constante (k) podemos introducir una
homogeneidad que no se da en la población.
Imaginemos que estamos seleccionando una muestra sobre listas de 10 individuos en los que los 5 primeros
son varones y los 5 últimos mujeres, si empleamos un muestreo aleatorio sistemático con k=10 siempre
seleccionaríamos o solo hombres o solo mujeres, no podría haber una representación de los dos sexos.
Supongamos que estamos interesados en estudiar el grado de aceptación que la implantación de la reforma
educativa ha tenido entre los padres de una determinada provincia.
A tal efecto seleccionamos una muestra de 600 sujetos. Conocemos por los datos del ministerio que de los
10000 niños escolarizados en las edades que nos interesan, 6000 acuden a colegios públicos, 3000 a colegios
de gestión privada con aporte estatal y 1000 a colegios netamente privados. Como estamos interesados en
que en nuestra muestra estén representados todos los tipos de colegios, realizamos un muestreo
estratificado empleando como variable de estratificación el tipo de centro.
Si empleamos una afijación simple elegiríamos 200 niños de cada tipo de centro, pero en este caso parece
más razonable utilizar una afijación proporcional pues hay bastante diferencia en el tamaño de los estratos.
Por consiguiente, calculamos que proporción supone cada uno de los estratos respecto de la población para
poder reflejarlo en la muestra.
Para conocer el tamaño de cada estrato en la muestra no tenemos más que multiplicar esa proporción por el
tamaño muestral.
Cuando los conglomerados son áreas geográficas suele hablarse de "muestreo por áreas".
En una investigación en la que se trata de conocer el grado de satisfacción laboral los profesores de instituto
necesitamos una muestra de 700 sujetos. Ante la dificultad de acceder individualmente a estos sujetos se
decide hacer una muestra por conglomerados.
Sabiendo que el número de profesores por instituto es aproximadamente de 35, los pasos a seguir serían los
siguientes:
Para finalizar con esta exposición de los métodos de muestreo probabilísticos es necesario comentar que
ante lo compleja que puede llegar a ser la situación real de muestreo con la que nos enfrentemos es muy
común emplear lo que se denomina muestreo polietapico.
Este tipo de muestreo se caracteriza por operar en sucesivas etapas, empleando en cada una de ellas el
método de muestreo probabilístico más adecuado.
A veces, para estudios exploratorios, el muestreo probabilístico resulta excesivamente costoso y se acude a
métodos no probabilísticos, aun siendo conscientes de que no sirven para realizar generalizaciones, pues no
se tiene certeza de que la muestra extraída sea representativa, ya que no todos los sujetos de la población
tienen la misma probabilidad de ser elegidos. En general se seleccionan a los sujetos siguiendo determinados
criterios procurando que la muestra sea representativa.
Por ejemplo, se desea estudiar la incidencia de las drogas en la adolescencia. Lo que deberíamos hacer seria:
conocer por los informes de las entidades responsables cuales son los centros más afectados por el
problema, fijar un numero de sujetos a entrevistar proporcional a cada uno de los estratos (cuotas) y
finalmente dejar en manos de los responsables del trabajo de campo a que sujetos concretos se deberá
entrevistar.
Bola de nieve:
Se localiza a algunos individuos, los cuales conducen a otros, y estos a otros, y así hasta conseguir una
muestra suficiente. Este tipo se emplea muy frecuentemente cuando se hacen estudios con poblaciones
"marginales", delincuentes, sectas, determinados tipos de enfermos, etc.
Supongamos que tenemos la población formada por los 5 primeros números enteros y que deseamos
extraer una muestra de tamaño dos.
1
2
3
4 5
Dependiendo de la extracción podremos obtener diferentes resultados, en este caso, podemos enumerar
todos los resultados posibles (1,2), (1,3)... etc.
Desde un punto de vista formal podemos definir: Una muestra aleatoria simple de tamaño n de una
población (v.a.) X es un vector aleatorio dónde:
a) Todas las variables aleatorias están igualmente distribuidas y proceden de la misma población.
b) Son independientes.
Una de las primeras necesidades será la de operar con los valores obtenidos en la muestra (por ejemplo
calcular la media de las observaciones), esto se traduce teóricamente operando con las variables estadistas
que componen la muestra aleatoria .
T . “e lee T del ve to
Por tanto un estadístico es una variable aleatoria y, en consecuencia, podemos trabajar con ella atendiendo
a esa característica.
Para realizar adecuadamente el proceso de inferencia con una fiabilidad determinada será necesario conocer
el comportamiento probabilístico de las muestras.
Media muestral: ̅ ∑
La media ya se utilizó en estadística descriptiva. Aunque el envoltorio (la formula) es la misma, hay una
diferencia sustancial entre la media aritmética que se estudió en estadística descriptiva y la media muestral
que presentamos aquí. La media aritmética es un valor "a posteriori", esto es una vez que tenemos la
realización muestral, por el contrario la media muestral es un valor "a priori", su comportamiento es
aleatorio (no toma un valor concreto) sino que tiene cierto rango de variación asociado a un determinado
modelo de probabilidad. Esto será objeto de nuestro estudio: Determinar la distribución de probabilidad de
los estadísticos arriba presentados.
La inferencia pretende "acertar" las características poblacionales de un modo optimo a partir de la muestra y
sus características.
POBLACIÓN MUESTRA
media poblacional media muestral
varianza poblacional varianza muestral
Tamaño de la población Tamaño de la muestra
Hemos realizado hasta aquí un estudio introductorio al mundo de la estadística y la probabilidad. El alumno
no debe interpretar que aquí está todo lo que necesita para ealiza u t a ajo estadísti o p ofu do… es
verdad, si, que hay herramientas que nos permitirían realizar trabajos más o menos sencillos y que se tienen
los principios de la materia, pero como ocurre en las matemáticas, parecería que nunca se llegara a estudiar
y comprender todo lo que existe en su basto universo, y la estadística como parte de la matemática no
escapa a esta apreciación.
Queda, de acuerdo al interés de los alumnos, seguir profundizando, seguir leyendo la bibliografía
suge ida… ealiza do p á ti as ue vaya de lo se illo a lo o plejo y e la solución a los distintos
problemas que vayan surgiendo, se irán sentando las bases de una comprensión y aprendizaje cada vez más
profundo.