Está en la página 1de 6

Inferencia Estadística

En las técnicas de muestreo, se persigue como objetivo analizar estadísticamente las propiedades de
una población a partir del estudio de muestras representativas de todo el conjunto. La extrapolación de
las conclusiones obtenidas para las muestras a toda la población se denomina inferencia estadística.
Para valorar el grado de validez de una inferencia de esta clase, es preciso indicar algunas
características esenciales de las muestras: errores contemplados, tamaño de la muestra e intervalos de
confianza.

Aproximación mediante una distribución muestral


Para expresar las propiedades de una población estadística a través de un muestreo se
determinan muestras representativas de la población y se procede a analizar sus parámetros estadísticos
según dos técnicas posibles: distribución muestral de las medias o distribución muestral de las
proporciones (ver t64).
Al tratarse de una aproximación, por exacta que sea, el muestreo introduce una diferencia entre las
propiedades de la muestra y el valor real que se obtendría si se analizara el conjunto de toda la
población.
Por ejemplo, dada una población de tamaño N con media aritmética  y desviación típica , y
obtenida por distribución muestral de las medias una muestra de la misma de tamaño n, media
aritmética   y desviación típica  , el error absoluto introducido en el cálculo de cada media tendría el
valor | -  |. A escala global, la media de las medias de la distribución coincide con la media de la
población, así que las diferencias | -  | serán bajas, aunque en general no nulas.

La distribución de todas las medias obtenidas a partir de una población mediante una distribución
muestral de las medias tiene forma de campana de Gauss (distribución normal).

Error muestral
Para determinar en términos estadísticos el error introducido en el muestreo se define el concepto
de error muestral como la desviación típica de la distribución muestral de las medias o de las
proporciones.
Valor del error muestral en los diferentes tipos de distribuciones muestrales:
Error máximo admisible
Una distribución muestral de las medias o de las proporciones se representa a modo de una curva
o campana de Gauss. Por tanto, nunca es posible abarcar estadísticamente todo el área de la curva, ya
que tiende asintóticamente a infinito.
Para evaluar la validez del muestreo, se maneja el concepto de nivel de confianza, establecido como el
porcentaje del área de la curva que se contempla en el estudio (por ejemplo, el 90%, el 95%, etcétera).
Llamando d al error máximo admisible en el muestreo, la probabilidad de que la media de la
distribución muestral y la media de la población difieran en una cantidad menor que d se llama nivel de
confianza, y se expresa por (1 - ).
En una distribución muestral de las medias, el nivel de confianza se calcula como:

Como casos particulares, se obtiene que:


 Si d =  , P = 0,6826, es decir, un nivel de confianza del 68,26%.
 Si d = 2  , P = 0,9544, lo que significa un nivel de confianza del 95,44%.
 Si d = 3  , P = 0,9974, con un nivel del confianza del 99,74%.
Así, el nivel de confianza puede expresarse en función de la desviación típica de la distribución muestral
de las medias, a través del valor de un coeficiente denominado k.

En una distribución muestral de las proporciones, el nivel de confianza obedece a la fórmula siguiente:

Entre el error máximo admisible y el error muestral existe una relación a través del valor del coeficiente
k:

Tamaño de la muestra
En la realización de estudios estadísticos, el tamaño n de una muestra representativa depende del tamaño
de la población N, del error máximo admisible d y del nivel de confianza (1 - ), según las expresiones
siguientes para determinar el tamaño de una muestra representativa:
Muestreo Estadístico
Un estudio estadístico ideal sería aquel que considerara en detalle los caracteres y parámetros de todos
los elementos del espacio muestral. Sin embargo, por motivos de coste, operatividad o limitación de
recursos, normalmente los estudios se refieren a grupos representativos dentro de un colectivo, llamados
muestras, cuya elección ha de seguir unas normas que garanticen su idoneidad y su facilidad de manejo.

Población y muestra
En una investigación estadística, se llama población al conjunto o colectivo de elementos considerados
en la misma. El número de elementos de este conjunto se conoce como tamaño de la muestra, que
puede ser finito o infinito.
Normalmente, las observaciones no se realizan de modo exhaustivo para toda una población estadística,
sino que se restringen a un subconjunto representativo de la misma. Cada uno de estos subconjuntos
recibe el nombre de muestra. Para que una muestra pueda considerarse significativa de una población,
debe cumplirse que:
 El tamaño de la muestra y el de la población estén proporcionados.
 Los elementos no presenten distorsiones importantes.
 La muestra sea representativa de la población.

Muestreo aleatorio
Se llama muestreo a la operación que consiste en elegir unidades estadísticas significativas dentro del
conjunto de una población. Existen diversos métodos para seleccionar las muestras, que han de regirse
siempre por el principio aleatorio: todos los elementos de la población deben tener una misma
probabilidad de ser elegidos para la muestra. Los dos procedimientos más sencillos de muestreo son:
 Muestreo aleatorio simple, que consiste en seleccionar n elementos en una población de
tamaño N, de forma que no existe reemplazamiento y todas las muestras que se pueden formar
tienen la misma probabilidad de ser elegidas.
 Muestreo aleatorio sistemático, en el que se asigna un número a cada elemento de la población
y se aplica después un procedimiento de selección al azar utilizando este número.
En técnicas de muestreo aleatorio simple, la probabilidad de elegir una muestra es la inversa de
las combinaciones sin repetición de N elementos tomados en grupos de n:

La probabilidad de que se elija un elemento determinado de la población para la muestra viene dada por:

Coeficiente de elevación
En la técnica de muestreo aleatorio sistemático, se numeran primero los elementos de la población, de 1
a N, y se determina un coeficiente de elevación dado por:

siendo n el tamaño de la muestra.


Después, se toma al azar un número i, que se llama origen, tal que 1  i  h, y se forma la muestra con
los elementos de numeración: i, i + h, i + 2h, ..., i + (n - 1) h.
El muestreo aleatorio sistemático exige que la variable sometida a estudio no presente ninguna
ordenación previa.

Muestreo aleatorio estratificado y por conglomerados


En poblaciones estadísticas no homogéneas, a menudo es conveniente dividir la población
en estratos o subpoblaciones de composición más homogénea, de manera que la operación de muestreo
pueda realizarse, con garantías, por el método simple o el sistemático. La suma de todos los estratos
debe conformar la población. De cada estrato de la población (Ni) se obtendrá un estrato de muestra (ni).
Grupo
Grupo 1 Grupo 2 Total División de una población en
3
estratos o subpoblaciones. La
muestra total es igual a la suma
Subpoblación o estrato N1 N2 N3 N=N1+N2+N3 de las muestras elegidas para
cada estrato.
Si todos los estratos tienen el
Muestra de cada mismo tamaño, se habla
n1 n2 n3 n=n1+n2+n3
estrato de muestreo aleatorio
estratificado constante, o
de igual afijación. Entonces, si
se divide la muestra en L
estratos, el tamaño de cada muestra vendrá dado por:

El muestreo se denomina estratificado proporcional, o de afijación proporcional, cuando la muestra


de cada estrato es proporcional al tamaño del estrato. Es decir:

En el muestreo por conglomerados, la unidad muestral está formada por un grupo de elementos, y no
por un elemento individual. Se usa para concentrar las muestras en zonas geográficas, unidades de
población (municipios, familias, colegios), etcétera.

Distribución Muestral
A partir de las muestras seleccionadas de una población pueden construirse variables aleatorias
alternativas, de cuyo análisis se desprenden interesantes propiedades estadísticas. Las dos formas
más comunes de estas variables corresponden a las distribuciones muestrales de las medias y de
las proporciones.

Distribución muestral de las medias


Dada una población constituida por un número n de elementos, cuya media aritmética es  y donde
la desviación típica viene dada , pueden formarse n2 muestras con reemplazamiento distintas, formadas
por dos elementos de la población.
Para cada una de estas muestras es posible una media muestral, que denotaremos con el símbolo  . Un
ejemplo de la tabla de muestras de tamaño 2, tomada de la población {1, 3, 5}, con sus medias
aritméticas reflejadas, sería:

A partir de la variable estadística original x de la población se puede construir una nueva variable
estadística  , que tendría como valores las medias de las muestras tomadas de la población. La media
aritmética de esta distribución muestral de las medias se denota por  , y su desviación típica por  .

Parámetros de la distribución muestral de las medias de tamaño


2
Establecida una distribución muestral de las medias de tamaño 2, su esperanza matemática adopta el
valor siguiente:

siendo  la media aritmética de la población,   la media aritmética de cada muestra,   la media
aritmética de todas las medias, E [x] la esperanza matemática de la variable aleatoria x (para la
población) y E [   ] la esperanza matemática de la variable aleatoria   (para la distribución muestral de
las medias).
Por su parte, los valores de la varianza y la desviación típica de esta distribución muestral de tamaño 2
son:

donde  es la desviación típica de la población,   la desviación típica de la distribución muestral, V [x]
la varianza de la variable x (población) y V [ ] la varianza de la variable   (distribución muestral de las
medias).

Distribución muestral de las medias de tamaño n


En una distribución muestral de las medias, la variable aleatoria media muestral sigue una ley normal
descrita como N (,/n).
Parámetros estadísticos de una distribución muestral de las medias de tamaño n:

Distribución muestral de las proporciones


Sea una población formada por n elementos, de los cuales algunos poseen una determinada característica
y otros no (llamaremos p a la proporción de los elementos que poseen la característica, y q = 1 - p a la de
los restantes elementos). Entonces, es posible extraer muestras de la población de manera que a cada una
se asocie como valor la proporción de la característica analizada.
Por ejemplo, en la población {1, 2, 3}, la característica par tiene un valor p = 1 / 3, mientras que la impar
es q = 2 / 3. Mediante la tabla siguiente de muestras se construye una nueva  distribución muestral de
las proporciones.
2, 3,
Muestra 1,1 1,2 1,3 2,2 2,3 3,2 3,3
1 1

Proporción 0,
0 0,5 0 0 0,5 0 0,5 0
f/n 5

Parámetros estadísticos de una distribución muestral de las proporciones de tamaño n:

Una distribución muestral de las proporciones se comporta como una distribución normal descrita por
los parámetros N  .

También podría gustarte