Está en la página 1de 3

10.

CONCEPTOS DE INFERENCIA ESTADIÍSTICA y DE DISTRIBUCIONES


MUESTRALES

10.1. Conceptos generales


La inferencia estadística es aquella parte de la metodología estadística que, a través de un razonamiento
inductivo, extiende los resultados obtenidos en las muestras a su universo de origen.

Dos son los objetivos de la inferencia: la estimación de parámetros y, la docimasia de hipótesis, esta última
más conocida como prueba de significación estadística.

Antes de explicar en qué consisten las estimaciones de parámetros y la docimasia de hipótesis conviene
definir algunos términos. Se llama parámetro a una medída que describe un universo. Cuando la medída
correspondíente describe una muestra se la denomina estadística.

Supongamos por ejemplo que se conocen las estaturas de todos los individuos de un universo. Si
quisiéramos una medida que describa la posición central de este universo, calcularíamos el promedío de
todas las estaturas, lo que constituiría el parámetro /-Lx. Si sólo tuviéramos información sobre las estaturas
de una muestra extraída de este universo, el promedío x calculado en la muestra sería la estadística
correspondíente.

De la misma manera, si nos interesara la díspersión de los valores indíviduales de las estaturas,
calcularíamos la desviación estándar, que para el universo se simbolizará por O'x y para la muestra por S¿
El procedímiento de cálculo del parámetro O'x difiere en este caso del de la estadística S, , ya que en esta
última la suma de las desviaciones cuadráticas se divide por (n-l) en vez de dividir por N como se hace en
el universo.

Aceptando estas definiciones la estimación de parámetros consiste en el cálculo de estadísticas para


muestras, con el :finde obtener información sobre el valor de los parámetros del universo. Esta inducción se
basa en la teoría de probabilidades y sólo es posible cuando se conoce la conducta o "distribución
muestral" de las estadísticas.

Cuando en una investigación explicativa se verifica la veracidad de la hipótesis, los procedímientos


estadísticos empleados en la prueba de significación ayudan al científico a tomar una decisión respecto de la
hipótesis planteada.

La docimasia de hipótesis consiste en conocer la probabilidad de ocurrencia del resultado obtenido en la


investigación, basándose en la distribución muestral de la estadística utilizada para medir tal resultado.

10.2. Distribuciones muestrales


Tanto para la estimación de parámetros como para la docimasia de hipótesis se mencionó la importancia de
conocer las distribuciones muestrales. Estas adoptan diferentes formas según las estadísticas investigadas.

Para entender lo que es una distribución muestral analizaremos un ejemplo concreto. Supongamos que
disponemos de un universo de fichas que llevan cada una un número que corresponde al valor de una
variable distribuida normalmente con /-Lx = 500 Y O'x = 100. Si de este universo extraemos repetidas
muestras de tamaño n = 25 (reponiendo cada ficha al universo antes de sacar la próxima) y para cada

73
muestra calculamos el promedio de los valores que aparecen en las fichas, ocurrirá que la mayoría de los
promedios estarán cerca del f.lx del universo, es decir, de 500 y, pocas estarán muy alejadas de este valor. Si
los resultados se llevan a un gráfico, este histograma tendrá el aspecto de una curva normal. Por lo tanto
podríamos descríbir esta distribución con el promedio y la desviación estándar de los promedios muestrales.
Esta última recibe el nombre de error estándar, error muestral o error de muestreo.

Veremos que en nuestro ejemplo, el promedio de los promedios estará cerca de 500 y su error estándar
tendrá un valor cercano a 20.

A través de la teoría estadística se puede demostrar que si se extraen todas las distintas muestras posibles de
tamaño n de un universo con f.lx y O"x conocidos, los promedios de estas muestras se distribuyen
normalmente con
, ()x
Promedio: f.i x = f.i x Y Error Estandar: a x = Ji1
en el presente ejemplo
, d; 100
Promedio: f.ix = 500 Y Error Estan ar: ax = r::::; = 20
",25

Supongamos ahora que en vez de tener un universo de fichas con valores en escala de intervalos continua,
tenemos un universo con una variable en escala nominal, por ejemplo, un universo de bolitas en que el 40%
de las bolitas son azules y el 60% grises. En este caso el parámetro del universo es P = 0,4: la proporción o
tasa de bolitas azules, siendo Q su complemento: 1 - P, la proporción de bolitas grises.

Al sacar todas las distintas muestras posibles de tamaño n = 20 de este universo (reponiendo las bolitas
después de cada extracción), la proporción p de bolitas azules de las muestras se distribuirá en forma
aproximadamente normal con:

Promedio: f.i p = tnd.ar: a


P y Error Estan p = ~PQ
----;;

en el presente ejemplo
0,4 x 0,6 = O 11
Promedio: f.ip = 0,4 Y Error Estándar: a p =
20 '

Nota: Es aceptable describir esta distribución como normal siempre que la muestra tenga tamaño suficiente
para que ambos, nP y nQ tengan valores iguales o superiores a 5.

Estos dos ejemplos de muestreo de un universo nos servirán para entender el procedimiento de estimación de
parámetros.

Para comprender las distribuciones muestrales que se utilizan en la docirnasia de hipótesis será útil
considerar los siguientes casos:

Supongamos que en vez de extraer cada vez una muestra de nuestro universo de fichas, sacamos pares de
muestras de 25 fichas cada una y que estudiamos la diferencia entre los promedios de estos pares. Si
x
llamamos XI al promedio de la primera muestra del par y 2 al promedio de la segunda muestra, ocurre
que la estadística XI - x2
se distribuye normalmente con

74
Promedio: I.L _ = O Y Error Estándar: a: _
xl - x2 xl - x2

En el presente ejemplo:
10000 10000
Promedio: IL _ = O Y Error Estándar: (j - - 1---+1 -- = 283
xl - x2 xl - x2 25 25 '

Si igual procedimiento se sigue en el universo de bolitas, extrayendo pares de muestras de tamaño n = 20, la
distribución de diferencias entre porcentajes de pares de muestras tendrá una distribución normal con

PQ PQ
Promedio: J..l Y Error Estándar: a -+-
P - P P1 - P2
1 2 ni nz
En el presente ejemplo:
Promedio: J..lP -p
1 2
= ° Y

0,4 x 0,6
Error Estándar: o -,--'-------'-- + O, x 0,6 0,16
PI - P2 20 20

Por los ejemplos expuestos pudiera quedar la impresión de que toda distribución muestra1 es una
distribución normal. Esto no es efectivo. Por ejemplo, una de las distribuciones más importantes en
inferencia estadística es la distribución t de Student. Cuando se desconoce el O"x del universo, lo que en la
práctica es la situación más corriente, el error estándar del promedio debe calcularse a partir de la
desviación estándar de la muestra:

S --2-
s
x - .¡;;
En este caso ya no es lícito trabajar con la distribución normal y la variable normal estándar,

X-J..l
z
(j-
X

sino que se trabajará con la variable t de Student


x-J..l
t=--
s_
X

que tiene una distribución parecida a la normal, pero más amplia. Los valores de t dependen del número de
grados de libertad, los que se determinan a partir del número usado en el denominador para el cálculo de S;
Se observa, por ejemplo, que el percentil 97,5 que en la curva normal corresponde a un valor de z = 1,96, en
la distribución de t para 24 grados de libertad corresponde a un t de 2,064. Para n infinito la distribución t
de Student es igual a la normal, pero en la práctica cuando el número de observaciones es superior a 30, los
. valores de z y t ya son tan parecidos que se puede utilizar como aproximación, la distribución normal.

75

También podría gustarte