Documentos de Académico
Documentos de Profesional
Documentos de Cultura
La teoría del muestreo puede emplearse para obtener información acerca de muestras ex-
traídas al azar de una población conocida. Sin embargo, desde un punto de vista práctico, es fre-
cuentemente más importante el poder inferir información sobre una población mediante muestras
extraídas de ellas. Estos problemas son tratados en la inferencia estadística, basándose en la teor-
ía del muestreo.
ESTIMACIÓN PUNTUAL
Los estimadores puntuales están constituidos por las estadísticos, denominación que se
da a los cálculos muestrales conocidos que permiten estimar a los correspondientes valores po-
blacionales desconocidos, denominados parámetros. Los estadísticos a los que se hace referen-
cia son, por ejemplo: la media muestral x ; la mediana Me; la variancia muestral Sx2 ; el desvío
estándar Sx; la proporción muestral hi. Cada uno de ellos estima al correspondiente paráme-
tro, es decir, a la media poblacional x; a la variancia poblacional x2; al desvío estándar pobla-
cional x; o a la proporción poblacional p.
Siendo los estadísticos variables y los parámetros fijos, es imposible considerar que un
estadístico sea igual a un parámetro. Por consiguiente, y sólo a modo de ejemplo, no es factible
aceptar la igualdad que se indica a continuación:
x x
Como esta igualdad es incorrecta, para indicar el hecho de que una estadístico estima a un
parámetro (en este ejemplo, que la media muestral estima al parámetro media poblacional), se
utiliza la conocida simbología de estimador (denominada comúnmente “sombrerito”):
Idéntico criterio se utiliza para indicar que las restantes estadísticas estiman a los corres-
pondientes parámetros, es decir,
Me = ̂ x
S x2 = ˆ x2
Sx = ˆ x
hi = p
En todos los casos la simbología utilizada indica que cada uno de los estadísticos estima
al parámetro, que lleva precisamente el símbolo del “sombrerito” para señalar que se lo está
estimando.
un estimador puntual del precio promedio de todos los autos vendidos por la conce-
sionaria es:
x x $92,25 mil
p̂ h 62,50 %
i
Estadística I 213
Un buen estimador debe cumplir con determinadas propiedades. Las más importantes
son:
Estimador insesgado o no viciado: Se denomina así a aquel estimador cuya esperanza ma-
temática da como resultado el parámetro a estimar.
1 1 1 1 1
E (x) E xi E xi E (xi ) x nx x
n n n n n
Caso del estimador hi: Según se ha demostrado en la Teoría de las Muestras la E(hi)
= p, con lo cual se verifica que hi es un estimador no viciado.
Caso del estimador Sx2: para poder desarrollar esta demostración, debe tenerse pre-
sente que:
E ( xi x ) 2 x2 (1)
x2
y que E ( x x ) 2 (2)
n
A partir de esto, se obtiene la esperanza matemática de Sx2 procediendo del siguiente
modo:
2 2
xi x xi x x x
Estadística I 214
1 1 2
( xi x) 2 (xi x ) (x x )
n n
1 ( xi x )2 2( xi x )( x x ) ( x x ) 2
n
1 1 1
(xi x )2 2(x x ) xi x ) n (x x ) 2
n n n
2 2 (x ) i n x (x ) 2
1 x
i x
( x ) x x
n n
n
1
n
2
xi x 2 2 x x x x 2
1
n
xi x 2 x x
2
1 x21 x2 x2 n 1
x2 2
n 2
2
n n n x n x n x
n
1 n 1
E (Sx2 ) E (xi x)2 x2
n n
Estadística I 215
Efectuando el pasaje de los términos del coeficiente que acompaña a x al primer
miembro de la igualdad, y recordando que la Esperanza es un operador lineal, obte-
nemos:
n 1 n 1 1
E (S x2 ) E ( xi x) 2 E ( xi x) 2 E ( xi x)2 x2
n 1 n n 1 n n 1
1
E (Sc2 ) E (xi x)2 x2
n 1
1
donde S c2
n 1
xi x
2
No siempre es necesario efectuar la corrección del vicio en el caso del estimador S x2,
n
ya que cuando n crece indefinidamente, el término tiende a la unidad. Luego,
n 1
si
n
n 1
n 1
Cálculo de Sc2: En todos los ejemplos planteados, cuando se debió calcular una me-
dida de dispersión, se obtuvo el Sx2. En caso de resultar necesario el cálculo de la va-
riancia corregida Sc 2, se procede del siguiente modo:
1
2
Se sabe que: S x2 xi x
n
1
2
y que: Sc2 xi x
n 1
x x
2
nS x2 i
Estadística I 216
x x
2
( n 1 )S c2 i
Se verifica que en estas dos igualdades, sus segundos miembros son iguales, por lo
que también lo serán sus dos primeros miembros. O sea que:
nS x2 ( n 1 )Sc2
a partir de lo cual se despeja Sc2:
n 2
Sc2 Sx
n 1
Como se ha visto anteriormente, hay varios estimadores que estiman al mismo parámetro.
Además, como todos son variables, tienen una varianza que podría llegar a calcularse. Un
ejemplo de ello puede verse en el caso que se desee estimar la media poblacional: son esti-
madores posibles la media aritmética o la mediana. De ambos, la media aritmética posee la
menor varianza, por lo que resulta ser un estimador eficiente. Para confirmarlo, bastará sa-
ber que así como la varianza de la media aritmética es x2/n, la varianza de la Mediana es
(x2/n)(/2), resultado éste que, como puede verificarse fácilmente, resulta mayor que el an-
terior.
Estimador suficiente: Se denomina suficiente a aquel estimador que contiene toda la in-
formación que proviene de la muestra. Para entender este concepto conviene comparar a la
media aritmética con la mediana: la primera contiene toda la información contenida en la
muestra, mientras la segunda no contiene toda la información disponible en la muestra (en
su cálculo no intervienen todos los valores de la variable). Luego, la media aritmética es un
estimador suficiente, mientras que la mediana no lo es.
Hemos desarrollado una serie de demostraciones que han permitido verificar la existencia
de numerosas ventajas y propiedades de la media aritmética. En este punto se detallará ese con-
junto de ventajas, que permiten mostrarla como una herramienta extraordinaria en el campo de la
estadística en general y de la estimación en particular.
El valor de la estimación puntual variará de una muestra a otra, porque en cada muestra
sólo se selecciona una parte de la población. Pero, la distribución de la media muestral, sigue una
distribución normal. Esta información relacionada con el estadístico muestral se toma en cuenta
al desarrollar una estimación por intervalos del parámetro de la población. En lugar de tener una
estimación basada en un solo valor, el intervalo se utiliza para estimar el parámetro de la pobla-
ción. Este intervalo tiene una confianza específica o probabilidad de estimar en forma correcta el
valor real del parámetro de la población.
Necesitamos tomar una única media muestral y estimar una media poblacional desco-
nocida, con cierto grado de confianza o probabilidad.
En este caso, como la variable que se utiliza para estimar la media poblacional es la me-
dia muestral x , y tiene distribución normal, podemos construir un gráfico. En ese gráfico se ob-
serva a la variable x tiene distribución normal con media poblacional x y que, como
x
Estadística I 218
cualquier variable, puede ser estandarizada mediante su conversión a una variable zi, la cual se
representa en un segundo eje. Recordemos, además, que el desvío estándar de x es igual a x .
n
x x
zi x x
x x
n
El nivel de confianza (NC) se ubica en el centro de la figura (zona grisada) y una vez de-
terminado cuál es su valor concreto, se verifica que existen dos valores de la variable estandari-
zada zi, simétricos entre sí (-z1 y +z1), tales que la P( z1 zi z1 ) NC
x
P z1 x z NC
x
n
x
P z1 x x z1 x NC
n n
P x z1 x x x z1 x NC
n n
Estadística I 219
Finalmente se multiplica todo por menos uno para modificar los signos, con lo cual cam-
bia también el sentido de las desigualdades:
P x z1 x x x z1 x NC
n n
La anterior es una primera expresión para el intervalo de confianza, que está compuesta
por los siguientes elementos:
x : es el estimador puntual media muestral, que, como toda estadística, puede ser cal-
culada sin ningún inconveniente a partir de la muestra disponible.
+z1 y –z1: son dos valores simétricos que se obtienen a partir de la tabla de la distribu-
ción normal una vez fijado el valor de NC.
n: es el tamaño de la muestra y como tal debe ser un dato conocido.
x: es el desvío estándar poblacional, un parámetro (y como tal, desconocido). Por
consiguiente se lo reemplaza directamente por su estimador Sx sin efectuar corrección
alguna por tratarse de muestras grandes, con lo que, en definitiva, la expresión final
del intervalo de confianza para estimar la media poblacional queda del siguiente mo-
do.
S S
P x z1 x x x z1 x NC
n n
en el que todos los elementos son conocidos y puede calcularse sin inconvenientes.
17,50 17,50
P 92,25 1,64 x 92,25 1,64 0,90
80 80
Si el Nivel de confianza llegara a tomar el valor extremo máximo para una probabili-
dad, es decir un valor igual a 1, el valor de los z1 sería, según se puede observar en la
tabla normal, el máximo posible, es decir que los z1 serían iguales a . En ese caso,
no sería posible obtener resultados para los límites del intervalo de confianza
porque darían un resultado indefinido. Conclusión: no puede exigirse un nivel de
confianza igual a la unidad porque no se obtendrían resultados prácticos para
los límites del intervalo.
hi p
zi
hi 1 hi
n
y existirán dos valores de zi, simétricos respecto del origen( -z1 y +z1) tales que
P( z1 zi z1 ) NC
hi p
P z1 z1 NC
hi 1 hi
n
hi 1 hi h 1 hi
P hi z1 p hi z1 i NC
n n
Si hi = 0,6250, luego
pˆ qˆ h (1 h ) (0,625)(0,375)
ˆ i i
0,0541
h n n 80
Para construir este intervalo de confianza para estimar el desvío estándar poblacional, el
estimador puntual que se utiliza es Sx. Este estimador es una estadística que, como todas en el
Estadística I 222
caso de muestras grandes, tiene distribución normal con media poblacional S x x y con va-
x2
riancia poblacional S2x . Esto permite construir la siguiente variable estandarizada zi:
2n
S
zi x x
Sx
2n
Con estos datos, se parte fijando el correspondiente Nivel de Confianza, para el cual
existen dos valores de la variable zi, simétricos, tales que la
P(z1 zi z1) NC
Sx x
P z1 z1 NC
Sx
2n
Procediendo del mismo modo que en los casos anteriores, es decir mediante un pasaje de
términos en el interior del paréntesis, se obtiene la siguiente expresión final que permite esti-
mar el desvío estándar poblacional por intervalos de confianza:
S S
P S x z1 x x S x z1 x NC .
2n 2n
Ejemplo: En el caso de la concesionaria, se desea estimar por intervalos para el desvío estándar
poblacional de los precios de los autos con una confianza del 99 %.
Estadística I 223
17,50 17,50
P17,50 2,58 x 17,50 2,58 0,99
80 80
P22,5479 x 12,4521 0,99
Debe considerarse que para la construcción de estos intervalos se presentan las siguientes
condiciones:
1 – El tamaño de la muestra es menor o igual que 30.
2 – En ese caso la distribución de las estadísticas suele no ser normal.
3 – El estimador Sx2 la variancia poblacional es viciado y debe corregirse.
Para muestras pequeñas, si la variable bajo estudio posee distribución normal, para la
construcción de este intervalo de confianza se utiliza la variable “t de Student:
x x
tStudent
xi x
2
n (n 1)
Fijado el nivel de confianza, existirán dos valores de la variable tSt, iguales en valor abso-
luto pero de distinto signo, simétricos entre sí, tales que la
P t1 t St ,v t1 NC
x
P t1 x
t1 NC
Sx
n 1
Sx Sx
P x t1 x x t1 NC
n 1 n 1
Esta expresión está compuesta por un conjunto de elementos todos conocidos y, por lo
tanto, calculables por lo que el resultado final puede obtenerse sin mayores dificultades.
t25;0,95 2,06 .
6,25 6,25
P 42,62 2,06 x 42.62 2,06 0,95
25 25
P 45,19 40,04 0,95
x
ESTIMACIÓN POR INTERVALOS DE CONFIANZA PARA LA VARIANZA POBLA-
CIONAL
2
Para la construcción de este intervalo de confianza se vgl (Chi cuadrado) con v grados de
libertad.
x x
2
n S x2 i
v2 gl
x2 x2
Fijado el NC, existen dos valores de la variable y ) tales que
P 12 v2 22 NC
Estadística I 225
nSx2
P 12 22 NC
x2
Invirtiendo la expresión:
1 2 1
P 2 x2 2 NC
1 nS x 2
nS 2 nS 2
P 2x x2 2x NC
1 2
con lo cual se ha encerrado el parámetro a estimar, x, entre dos límites con una cierta probabi-
lidad NC, obteniéndose de ese modo el intervalo de confianza requerido.
Resulta importante destacar que, en este caso, el intervalo de confianza conseguido resul-
tará mínimo si las dos superficies que quedan fuera del NC bajo la curva son iguales, cada una
1 NC
de ellas, a .
2
P 26,93 2x 69,54 0,90
ESTIMACIÓN POR INTERVALOS DE CONFIANZA PARA LA PROPORCIÓN PO-
BLACIONAL
Como ambos elementos son diferentes, es lógico entender que entre ellos hay una dife-
rencia, que se simbolizará con d, positiva o negativa, y que se denominará margen de error o
tolerancia. Es decir que
x x d
x x d
z1
x x
x
Siendo x igual a , se tiene
n
x x d
z1
x x
n n
d
z1
x
n
z12 x2
n
d2
obteniéndose un primer cálculo para el tamaño de la muestra, para la estimación de la media
poblacional.
de la varianza de la variable bajo estudio (x2), en forma directa (la varianza apare-
ce multiplicando), con lo cual a mayor variabilidad de la variable bajo estudio,
mayor tamaño de la muestra.
del valor z1, que representa al coeficiente que indica el grado de confianza exigido
en la estimación, también en forma directa: a mayor grado de confianza exigido,
mayor tamaño de la muestra. Si el grado de confianza fuera igual a 1, z1 sería infi-
nito, por lo que el tamaño de la muestra n .
El procedimiento que se sigue es similar al del cálculo para poblaciones infinitas, sólo
que en el momento de reemplazar x , se recurre a la fórmula del desvío estándar para poblacio-
nes finitas o sin reposición, lo cual dará la siguiente igualdad:
d
z1
x N n
n N 1
Operando para despejar n, se obtiene la siguiente fórmula:
z12 x2 N
n
d 2 N 1 z12 x2
Para poder efectuar empíricamente el cálculo del tamaño de la muestra, el valor que in-
terviene en la fórmula correspondiente a la tolerancia d se suele presentar como un porcentaje
de alguno de los valores conocidos en juego. En este caso aparece el concepto de tolerancia
Estadística I 228
relativa, es un porcentaje del valor de la media muestral, que es, precisamente, el valor que se ha
obtenido para la estimación de la media poblacional.
Ejemplo: En la concesionaria se desea evaluar el precio promedio de los autos vendidos,
cuál debería ser el tamaño de la muestra si se desea efectuar el trabajo de estimación con una
confianza del 95 % y una tolerancia relativa del 10 % respecto del valor estimado para la media
poblacional.
Como la media muestral resultó igual a $ 92,25 mil, el 10 % es 9,225; el nivel de con-
fianza del 95 % se corresponde con un valor de z1=1,96, y la varianza (desconocida) se reempla-
za por su estimador, igual a 306,25 miles de $2. Con estos datos, aplicando la fórmula que co-
rresponde a un tamaño de población infinita, tenemos:
Si trabajamos con una muestra de un tamaño determinado se puede obtener el valor por-
centual de la tolerancia relativa d, con los datos disponibles. Para ello, a partir de la fórmula para
n y mediante pasaje de términos, se obtiene una fórmula de cálculo para d.
z12 x2
d
n
1,96 2306,25
d 3,8349 miles de $
80
d 3,8349
0,0416 d 4,16%
x 92,25
PREGUNTAS TEORICAS
1) La E S x2 E Sc2
a) Siempre
b) Nunca
c) A veces
Estadística I 229