Está en la página 1de 19

Estadística I 211

Unidad XIII - TEORIA DE LA ESTIMACIÓN ESTADISTICA

1. CONCEPTO. ESTIMACIÓN PUNTUAL Y POR INTERVALOS. PRINCIPALES


ESTIMADORES PUNTUALES. PROPIEDADES DE LOS ESTIMADORES PUN-
TUALES.

La teoría del muestreo puede emplearse para obtener información acerca de muestras ex-
traídas al azar de una población conocida. Sin embargo, desde un punto de vista práctico, es fre-
cuentemente más importante el poder inferir información sobre una población mediante muestras
extraídas de ellas. Estos problemas son tratados en la inferencia estadística, basándose en la teor-
ía del muestreo.

Un importante problema de la inferencia estadística es la estimación de parámetros po-


blacionales o brevemente parámetros (tales como la media, la varianza de la población, etc.) a
partir de los correspondientes estadísticos muestrales o brevemente estadísticos (es decir, media
muestral, varianza muestral, etc.)

En síntesis, los valores muestrales conocidos, llamados estadísticos, se convierten en es-


timadores de los valores poblacionales desconocidos llamados parámetros.

La “Teoría de la Estimación Estadística” es la parte de la Inferencia Estadística que


trata acerca de los procedimientos específicos que posibilitan inferir o estimar, sobre la base de
resultados muestrales conocidos - estadísticos - cuáles son los valores poblacionales desco-
nocidos correspondientes – parámetros- .

En estos procedimientos los valores muestrales conocidos, las “estadísticas”, se convier-


ten en estimadores de los valores poblacionales desconocidos, los “parámetros”.

El siguiente cuadro permite apreciar más claramente el tema:

CONCEPTOS EN LA MUESTRA EN LA POBLACION


Denominación Estadísticas Parámetros
Simbología x ; Me; Sx2; Sx; hi x; x2;x; p
Función Son Estimadores Deben Ser estimados
Características Son conocidos Son desconocidos
Son variables Son fijos

Hay dos tipos fundamentales de estimaciones:


 Estimación puntual: es un procedimiento de estimación en el que se estima al pará-
metro mediante un solo valor muestral.
 Estimación por intervalos: es un procedimiento que permite, a partir de un estima-
dor puntual, obtener dos valores que limitan un intervalo denominado intervalo de
confianza dentro del cual se encuentra el parámetro a estimar con una cierta probabi-
lidad conocida cercana a uno, denominada nivel de confianza.
Estadística I 212

ESTIMACIÓN PUNTUAL

Los estimadores puntuales están constituidos por las estadísticos, denominación que se
da a los cálculos muestrales conocidos que permiten estimar a los correspondientes valores po-
blacionales desconocidos, denominados parámetros. Los estadísticos a los que se hace referen-
cia son, por ejemplo: la media muestral x ; la mediana Me; la variancia muestral Sx2 ; el desvío
estándar Sx; la proporción muestral hi. Cada uno de ellos estima al correspondiente paráme-
tro, es decir, a la media poblacional x; a la variancia poblacional x2; al desvío estándar pobla-
cional x; o a la proporción poblacional p.

Siendo los estadísticos variables y los parámetros fijos, es imposible considerar que un
estadístico sea igual a un parámetro. Por consiguiente, y sólo a modo de ejemplo, no es factible
aceptar la igualdad que se indica a continuación:
x  x

Como esta igualdad es incorrecta, para indicar el hecho de que una estadístico estima a un
parámetro (en este ejemplo, que la media muestral estima al parámetro media poblacional), se
utiliza la conocida simbología de estimador (denominada comúnmente “sombrerito”):

x  x , que se lee “mu estimado” o “estimador de mu”.

Idéntico criterio se utiliza para indicar que las restantes estadísticas estiman a los corres-
pondientes parámetros, es decir,
Me = ̂ x
S x2 = ˆ x2
Sx = ˆ x
hi = p

En todos los casos la simbología utilizada indica que cada uno de los estadísticos estima
al parámetro, que lleva precisamente el símbolo del “sombrerito” para señalar que se lo está
estimando.

Ejemplo: En la distribución de frecuencias de la concesionaria calculamos el precio me-


dio de los autos x  92,25 mil $, la proporción de autos nacionales vendidos: hi = 62,50 % y la
varianza muestral s 2x  306,34 mil $2. Estos estadísticos se calcularon con una muestra de 80
clientes.

 un estimador puntual del precio promedio de todos los autos vendidos por la conce-
sionaria es:

 x  x  $92,25 mil

 un estimador puntual de la proporción de autos nacionales es:

p̂  h  62,50 %
i
Estadística I 213

 un estimador puntual para la variancia poblacional y para el desvío estándar



 x2  S2x  306,34 mil $2 ˆ  S  17,50 mil $
x x

PROPIEDADES DE LOS ESTIMADORES PUNTUALES

Un buen estimador debe cumplir con determinadas propiedades. Las más importantes
son:

 Estimador insesgado o no viciado: Se denomina así a aquel estimador cuya esperanza ma-
temática da como resultado el parámetro a estimar.

 Caso del estimador x : se verificará si el estimador media muestral es insesgado o no


viciado. Para ello, calcularemos su esperanza matemática, recordando, que esa media
muestral es una variable y que, como tal, su esperanza matemática puede calcularse.

Aplicando Esperanza, se obtiene el siguiente desarrollo, recordando que:

 la esperanza de una suma de variables es la suma de sus esperanzas, y


 la E (xi )  x .

1  1 1 1 1
E (x)  E  xi   E  xi   E (xi )   x  nx  x
n  n n n n

con lo cual se ha demostrado que el estimador x es no viciado o insesgado.

A diferencia de la media aritmética, los estimadores mediana (Me) y modo (Mo)


son viciados.

 Caso del estimador hi: Según se ha demostrado en la Teoría de las Muestras la E(hi)
= p, con lo cual se verifica que hi es un estimador no viciado.

 Caso del estimador Sx2: para poder desarrollar esta demostración, debe tenerse pre-
sente que:
E ( xi  x ) 2   x2 (1)
 x2
y que E ( x  x ) 2 (2)
n
A partir de esto, se obtiene la esperanza matemática de Sx2 procediendo del siguiente
modo:

en la igualdad xi  x  xi  x  x  x se agrupan los elementos haciendo


xi  x  ( xi  x )  ( x  x )

Elevando al cuadrado ambos miembros y sumando:

2 2
  xi  x  xi  x    x  x  
Estadística I 214

dividiendo la igualdad por n

1 1 2
  ( xi  x) 2   (xi  x )  (x  x ) 
n n

 1  ( xi  x )2  2( xi  x )( x  x )  ( x  x ) 2  
n  

1 1 1
  (xi  x )2  2(x  x )  xi  x )  n (x  x ) 2 
n n n

 
2  2 (x   )  i  n x   (x   ) 2 
1 x
  i x
( x   ) x   x
n  n
 n 

1

n
 
2
 
 xi   x 2  2 x   x  x   x 2 
1

n
 
 xi   x 2  x   x 
2

Aplicando Esperanza Matemática, y de acuerdo con lo indicado en (1) y en (2), se


obtiene:
1  1 
E (S x2 )  E   ( xi  x) 2   E   ( xi  x ) 2  ( x  x )2  
   
n  n 
1
  E ( x   ) 2 E ( x   ) 2
n i x x

1  x21  x2  x2  n 1
   x2  2
 n  2
    2 
n n n x n x n x
 n 

con lo cual se verifica que el estimador Sx2 es un estimador viciado o sesgado: su


esperanza matemática no da un resultado igual al parámetro a estimar, porque se
obtuvo el parámetro a estimar acompañado por un coeficiente que, precisamente,
convierte al estimador en viciado. Se verifica, también, que el estimador Sx2 estima al
parámetro x por defecto, ya que el coeficiente que acompaña al estimador da un
resultado menor que 1.

 Corrección del vicio: Cuando un estimador es viciado, ¿puede corregirse el vicio?.


Analizaremos la posibilidad de realizar tal corrección en el caso del estimador Sx2,
procediendo del siguiente modo:

1  n 1
E (Sx2 )  E   (xi  x)2    x2

n n
Estadística I 215

Efectuando el pasaje de los términos del coeficiente que acompaña a x al primer
miembro de la igualdad, y recordando que la Esperanza es un operador lineal, obte-
nemos:

n 1   n 1   1 
E (S x2 )  E   ( xi  x) 2   E   ( xi  x) 2   E   ( xi  x)2    x2
     
n 1 n   n 1 n   n 1 

con lo que se verifica que la esperanza matemática de un nuevo “estadístico”, que en


este caso es 1  ( xi  x) 2 , da como resultado el parámetro variancia poblacional,
n 1
por lo que ese nuevo estadístico es no viciado. Observando con detenimiento, se
comprueba que tiene forma de una varianza, sólo que en lugar de estar dividida por
n, lo está por (n-1). Por eso mismo se la denomina varianza corregida y se simboli-
za con Sc2. Por consiguiente, se ha comprobado que Sc2 es insesgada o no viciada, por
cuanto su esperanza es el parámetro a estimar, es decir que

 1 
E (Sc2 )  E   (xi  x)2    x2

 n 1
1
donde S c2 
n 1
 
xi  x
2

No siempre es necesario efectuar la corrección del vicio en el caso del estimador S x2,
n
ya que cuando n crece indefinidamente, el término tiende a la unidad. Luego,
n 1
si
n
n  1
n 1

Empíricamente se considera que si el tamaño de la muestra n es menor o igual que 30


se está trabajando con las llamadas “muestras pequeñas”, en cuyo caso debe efec-
tuarse la corrección, transformando Sx2 en Sc2. En cambio, si n > 30, se está trabajan-
do con “muestras grandes”, en cuyo caso no debe corregirse el vicio. En este últi-
mo caso, además, todas los estadísticos tienen distribución normal.

 Cálculo de Sc2: En todos los ejemplos planteados, cuando se debió calcular una me-
dida de dispersión, se obtuvo el Sx2. En caso de resultar necesario el cálculo de la va-
riancia corregida Sc 2, se procede del siguiente modo:
1
 
2
Se sabe que: S x2  xi  x
n
1
 
2
y que: Sc2  xi  x
n 1

Por consiguiente, en ambas expresiones, por pasaje de términos, se puede obtener:

 x  x 
2
nS x2  i
Estadística I 216

 x  x 
2
( n  1 )S c2  i

Se verifica que en estas dos igualdades, sus segundos miembros son iguales, por lo
que también lo serán sus dos primeros miembros. O sea que:

nS x2  ( n  1 )Sc2
a partir de lo cual se despeja Sc2:

n 2
Sc2  Sx
n 1

 Estimador eficiente: Se denomina eficiente a aquel estimador que, de un conjunto de esti-


madores, posee la menor variancia, mientras que al otro estadístico se llama estimador inefi-
ciente.

Como se ha visto anteriormente, hay varios estimadores que estiman al mismo parámetro.
Además, como todos son variables, tienen una varianza que podría llegar a calcularse. Un
ejemplo de ello puede verse en el caso que se desee estimar la media poblacional: son esti-
madores posibles la media aritmética o la mediana. De ambos, la media aritmética posee la
menor varianza, por lo que resulta ser un estimador eficiente. Para confirmarlo, bastará sa-
ber que así como la varianza de la media aritmética es x2/n, la varianza de la Mediana es
(x2/n)(/2), resultado éste que, como puede verificarse fácilmente, resulta mayor que el an-
terior.

 Estimador suficiente: Se denomina suficiente a aquel estimador que contiene toda la in-
formación que proviene de la muestra. Para entender este concepto conviene comparar a la
media aritmética con la mediana: la primera contiene toda la información contenida en la
muestra, mientras la segunda no contiene toda la información disponible en la muestra (en
su cálculo no intervienen todos los valores de la variable). Luego, la media aritmética es un
estimador suficiente, mientras que la mediana no lo es.

Hemos desarrollado una serie de demostraciones que han permitido verificar la existencia
de numerosas ventajas y propiedades de la media aritmética. En este punto se detallará ese con-
junto de ventajas, que permiten mostrarla como una herramienta extraordinaria en el campo de la
estadística en general y de la estimación en particular.

Esas ventajas de la media aritmética son:


a) La suma de desvíos respecto de ella es igual a cero.
b) La suma de los desvíos respecto de ella, al cuadrado, es un mínimo.
c) Puede ser considerada una variable en el campo de la teoría de las muestras.
d) Su distribución tiende a ser normal cuando el tamaño de la muestra n   .
e) La media poblacional de su distribución muestral es igual a la media poblacio-
nal de la variable xi, es decir que es no viciada.
f) La dispersión de su distribución es menor que la distribución de la variable xi,
es decir que  2   x2 .
x
g) Es suficiente y eficiente.
Estadística I 217

2. ESTIMACIÓN DEL INTERVALO DE CONFIANZA PARA LA MEDIA.

La estimación por intervalos es un procedimiento que permite, a partir de un estimador


puntual, encontrar dos valores que limitan un intervalo denominado intervalo de confianza,
dentro del cual puede encontrarse el parámetro a estimar con una cierta probabilidad conocida,
cercana a uno, que se denomina nivel de confianza y que se simboliza NC.

Algo que es común en el caso de la construcción de todos los intervalos de confianza, es


que en primer lugar debe fijarse el Nivel de confianza, que consiste en una probabilidad cerca-
na a uno que se establece de antemano y que es fijada por quien encarga el trabajo de estimación
(no puede ser una decisión de quien construye el intervalo). Los valores más comunes (aunque
no los únicos) para el nivel de confianza son: 0,99; 0,95 o 0,90.

El valor de la estimación puntual variará de una muestra a otra, porque en cada muestra
sólo se selecciona una parte de la población. Pero, la distribución de la media muestral, sigue una
distribución normal. Esta información relacionada con el estadístico muestral se toma en cuenta
al desarrollar una estimación por intervalos del parámetro de la población. En lugar de tener una
estimación basada en un solo valor, el intervalo se utiliza para estimar el parámetro de la pobla-
ción. Este intervalo tiene una confianza específica o probabilidad de estimar en forma correcta el
valor real del parámetro de la población.

Un intervalo de confianza para la media poblacional permite especificar la probabilidad


de que incluya el valor de la media poblacional. El nivel de confianza señala el porcentaje a lar-
go plazo de esa clase de intervalos que incluirían el parámetro que se estima.

Sea x y x la media y el desvío estándar de la distribución muestral del estadístico S. En-


tonces, si la distribución muestral de S es en forma aproximadamente normal (lo que es verdade-
ro para muchos estadísticos si el tamaño de la muestra n > 30), se puede esperar encontrar un
estadístico muestral S real que caiga en los intervalos S - S a S + SS - 2S a S + 2SS -
3S a S + 3S cerca del 68,27 , 95,45 % y 99,73 % de las veces, respectivamente.

De manera equivalente, se espera encontrar (o se puede tener confianza en hacerlo) S en


los intervalos S - S a S + SS - 2S a S + 2SS- 3S a S+ 3S cerca del 68,27, 95,45 % y
99,73 % de las veces, respectivamente. Los extremos del intervalo se denominan límites de con-
fianza o límites fiduciales.

Necesitamos tomar una única media muestral y estimar una media poblacional desco-
nocida, con cierto grado de confianza o probabilidad.

En una situación real, la media de la población es desconocida y es la cantidad que se


debe estimar. El desvío estándar de la población rara vez se conoce y suele estimarse con los
resultados de la muestra. Supongamos que estamos haciendo un muestreo con reemplazamiento
y que el desvío estándar de la población es conocido.

En este caso, como la variable que se utiliza para estimar la media poblacional es la me-
dia muestral x , y tiene distribución normal, podemos construir un gráfico. En ese gráfico se ob-
serva a la variable x tiene distribución normal con media poblacional   x  y que, como
x
Estadística I 218

cualquier variable, puede ser estandarizada mediante su conversión a una variable zi, la cual se

representa en un segundo eje. Recordemos, además, que el desvío estándar de x es igual a x .
n

La estandarización mencionada más arriba se realiza del siguiente modo:

x x
zi  x   x
x x
n

El nivel de confianza (NC) se ubica en el centro de la figura (zona grisada) y una vez de-
terminado cuál es su valor concreto, se verifica que existen dos valores de la variable estandari-
zada zi, simétricos entre sí (-z1 y +z1), tales que la P( z1  zi   z1 )  NC

Reemplazando en este término la variable zi obtenemos la siguiente expresión:

 
 
 x  
P  z1   x   z  NC 
 x 
 
 n 
 

Al efectuar en el interior del paréntesis las transformaciones apropiadas, pasando el


término que divide en el centro del paréntesis como producto a ambos lados de las desigualda-
des:

 x  
P  z1  x  x   z1 x   NC
 n n

Luego se despeja la media poblacional, dejándola en el centro:

   
P  x  z1 x    x   x  z1 x   NC
 n n
Estadística I 219

Finalmente se multiplica todo por menos uno para modificar los signos, con lo cual cam-
bia también el sentido de las desigualdades:
   
P x  z1 x   x  x  z1 x   NC
 n n

La anterior es una primera expresión para el intervalo de confianza, que está compuesta
por los siguientes elementos:
 x : es el estimador puntual media muestral, que, como toda estadística, puede ser cal-
culada sin ningún inconveniente a partir de la muestra disponible.
 +z1 y –z1: son dos valores simétricos que se obtienen a partir de la tabla de la distribu-
ción normal una vez fijado el valor de NC.
 n: es el tamaño de la muestra y como tal debe ser un dato conocido.
 x: es el desvío estándar poblacional, un parámetro (y como tal, desconocido). Por
consiguiente se lo reemplaza directamente por su estimador Sx sin efectuar corrección
alguna por tratarse de muestras grandes, con lo que, en definitiva, la expresión final
del intervalo de confianza para estimar la media poblacional queda del siguiente mo-
do.

 S S 
P x  z1 x   x  x  z1 x   NC
 n n

en el que todos los elementos son conocidos y puede calcularse sin inconvenientes.

Por ejemplo, en la concesionaria, el precio promedio de los autos es de $ 92,25 mil, el


desvío estándar es de $ 17,50 mil y n = 80. A partir de los resultados de la muestra podemos
construir un intervalo con un nivel de confianza del 90%, para estimar el precio promedio de
todos los autos vendidos por la concesionaria.

 17,50 17,50 
P 92,25  1,64   x  92,25  1,64   0,90
 80 80 

P95,45   x  89,04  0,90

Los intervalos de confianza tienen las siguientes características:

 El intervalo de confianza tiene dos límites que se obtienen sumando y restando un


mismo valor al estimador puntual media muestral ( x ). Estos límites se denominan
límite superior y límite inferior del intervalo de confianza.

 Si el Nivel de Confianza aumenta, su superficie en el gráfico sería mayor y eso se co-


rrespondería con mayores valores para los z1. En ese caso, a mayor NC, mayor ampli-
tud en el intervalo de confianza. Pero asimismo, una mayor amplitud para el intervalo
implica que hay más valores posibles para estimar la media poblacional  x, lo que
convierte a la estimación en algo menos precisa, es decir que a mayor amplitud del in-
tervalo, menor precisión en la estimación. Conclusión: a mayor nivel de confianza,
menor precisión en la estimación.
Estadística I 220

 Si el Nivel de confianza llegara a tomar el valor extremo máximo para una probabili-
dad, es decir un valor igual a 1, el valor de los z1 sería, según se puede observar en la
tabla normal, el máximo posible, es decir que los z1 serían iguales a  . En ese caso,
no sería posible obtener resultados para los límites del intervalo de confianza
porque darían un resultado indefinido. Conclusión: no puede exigirse un nivel de
confianza igual a la unidad porque no se obtendrían resultados prácticos para
los límites del intervalo.

 La decisión de tomar al Nivel de Confianza entre dos valores simétricos de z1 no sólo


es la única solución posible desde el punto de vista de la búsqueda inversa en la ta-
bla; también conduce a un intervalo mínimo, ya que el intervalo conseguido es más
pequeño que cualquier otro que pueda obtenerse tomando los valores de zi de cual-
quier otra forma diferente.

 El Nivel de Confianza es una probabilidad, y como tal, es el resultado de realizar un


cociente entre el número de casos favorables sobre el número de casos posibles. Re-
cordando este concepto, puede decirse entonces que de cada cien intervalos que se
construyan, en una proporción de ellos igual a NC el parámetro quedará ence-
rrado en el intervalo construido. Esta es una forma de medir la confianza existente
de que en un porcentaje de los casos se estime correctamente el parámetro desconoci-
do.

3. ESTIMACIÓN DEL INTERVALO DE CONFIANZA PARA LA PROPORCIÓN.

En este caso se utilizará la estadística hi y el procedimiento no difiere en nada del aplica-


do para los casos de la media. Deberá recordarse, sin embargo, que como toda estadística, el es-
timador hi es una variable que tiene distribución normal con media poblacional h  p y varian-
pq
cia  h2  Si se desea calcular la variancia en un caso concreto, como p y q son parámetros
n
desconocidos, se reemplazan por sus estimadores, p̂  hi y q̂  ( 1  hi )

Por consiguiente, la variable estandarizada zi se construye del siguiente modo:

hi  p
zi 
hi 1  hi 
n

y existirán dos valores de zi, simétricos respecto del origen( -z1 y +z1) tales que

P( z1  zi   z1 )  NC

Reemplazando zi por la expresión indicada más arriba, se tiene que


Estadística I 221

 
 
 hi  p 
P   z1   z1   NC
 hi 1  hi  
 
 n 

En la última expresión algebraica, efectuando en el interior del paréntesis los pasajes de


términos con el propósito de despejar p, objeto de la estimación, finalmente se encuentra que la

 hi 1  hi  h 1  hi  
P hi  z1  p  hi  z1 i   NC


n n 

que constituye el intervalo de confianza buscado.

Ejemplo: En el problema de la concesionaria, se desea realizar una estimación por inter-


valos para la proporción de autos nacionales vendidos con un nivel de confianza del 95 %.

Si hi = 0,6250, luego

pˆ qˆ h (1  h ) (0,625)(0,375)
ˆ   i i
  0,0541
h n n 80

P0,6250  1,96(0,0541)  p  0,6250  1,96(0,0541)  0,95

P(0,7310  p  0,5190)  0,95

4. ESTIMACIÓN DEL INTERVALO DE CONFIANZA PARA EL DESVÍO ESTÁN-


DAR.

Para construir este intervalo de confianza para estimar el desvío estándar poblacional, el
estimador puntual que se utiliza es Sx. Este estimador es una estadística que, como todas en el
Estadística I 222

caso de muestras grandes, tiene distribución normal con media poblacional  S x  x y con va-
 x2
riancia poblacional  S2x  . Esto permite construir la siguiente variable estandarizada zi:
2n
S 
zi  x x
Sx
2n

Con estos datos, se parte fijando el correspondiente Nivel de Confianza, para el cual
existen dos valores de la variable zi, simétricos, tales que la

P(z1  zi  z1)  NC

En este término, reemplazando zi por la expresión a la que es igual, tenemos:

 
 
 Sx   x
P  z1    z1   NC
 Sx 
 
 2n 

Procediendo del mismo modo que en los casos anteriores, es decir mediante un pasaje de
términos en el interior del paréntesis, se obtiene la siguiente expresión final que permite esti-
mar el desvío estándar poblacional por intervalos de confianza:

 S S 
P S x  z1 x   x  S x  z1 x   NC .
 2n 2n 

Este intervalo se puede convertir en un intervalo para estimar la variancia poblacional


simplemente elevando al cuadrado los términos incluidos dentro del paréntesis:
2 2
 S   S  
P  S x  z1 x    x2   S x  z1 x    NC
 2n   2n  

Ejemplo: En el caso de la concesionaria, se desea estimar por intervalos para el desvío estándar
poblacional de los precios de los autos con una confianza del 99 %.
Estadística I 223

 17,50 17,50 
P17,50  2,58   x  17,50  2,58   0,99
 80 80 
P22,5479   x  12,4521  0,99

5. ESTIMACIÓN DEL INTERVALO DE CONFIANZA PARA MUESTRAS PEQUEÑAS.

Debe considerarse que para la construcción de estos intervalos se presentan las siguientes
condiciones:
1 – El tamaño de la muestra es menor o igual que 30.
2 – En ese caso la distribución de las estadísticas suele no ser normal.
3 – El estimador Sx2 la variancia poblacional es viciado y debe corregirse.

ESTIMACIÓN POR INTERVALOS DE CONFIANZA PARA LA MEDIA POBLACIO-


NAL

Para muestras pequeñas, si la variable bajo estudio posee distribución normal, para la
construcción de este intervalo de confianza se utiliza la variable “t de Student:
x  x
tStudent 

 xi  x
2

n (n  1)

Sabiendo que  x   x y modificando el denominador, se obtienen las siguientes dos al-


ternativas de solución:
x  x x  x
tSt  
Sx Sc
n 1 n
v=n–1

Fijado el nivel de confianza, existirán dos valores de la variable tSt, iguales en valor abso-
luto pero de distinto signo, simétricos entre sí, tales que la

P  t1  t St ,v  t1   NC
 
 
x  
P  t1  x
 t1   NC
 Sx 
 
 n 1 

Efectuando los correspondientes pasajes de términos en el interior del paréntesis de modo


de despejar la media poblacional que debe ser estimada (en un procedimiento ya repetido en los
anteriores intervalos de confianza construidos), se obtiene
Estadística I 224

 Sx Sx 
P x  t1   x  x  t1   NC
 n 1 n 1 

Esta expresión está compuesta por un conjunto de elementos todos conocidos y, por lo
tanto, calculables por lo que el resultado final puede obtenerse sin mayores dificultades.

Ejemplo: Partiendo del ejemplo de la concesionaria se desea investigar la edad de los


compradores, si tomamos una muestra aleatoria de 26 ventas, se trata de un problema de mues-
tras pequeñas. Se calcula la edad media, que resulta ser de 42,62 años y el desvío estándar que es
6,25 años. Se construye un intervalo de confianza para la edad promedio de todos los clientes de
la sucursal, con una confianza del 95 %. En este caso:

t25;0,95  2,06 .

 6,25 6,25 
P 42,62  2,06   x  42.62  2,06   0,95
 25 25 


P 45,19    40,04  0,95
x

ESTIMACIÓN POR INTERVALOS DE CONFIANZA PARA LA VARIANZA POBLA-
CIONAL

2
Para la construcción de este intervalo de confianza se  vgl (Chi cuadrado) con v grados de
libertad.
 x  x 
2
n S x2 i
   v2 gl
 x2  x2

Fijado el NC, existen dos valores de la variable y ) tales que


P 12   v2   22  NC 
Estadística I 225

Reemplazando la variable por la expresión a la que es igual, se obtiene

 
 nSx2 
P 12   22   NC

  x2 

Invirtiendo la expresión:

 1 2 1 
P 2  x2  2   NC
 1 nS x  2 

 nS 2 nS 2 
P 2x   x2  2x   NC
 1 2 

con lo cual se ha encerrado el parámetro a estimar, x, entre dos límites con una cierta probabi-
lidad NC, obteniéndose de ese modo el intervalo de confianza requerido.

Resulta importante destacar que, en este caso, el intervalo de confianza conseguido resul-
tará mínimo si las dos superficies que quedan fuera del NC bajo la curva son iguales, cada una
1  NC
de ellas, a .
2

Ejemplo: Retomando el ejemplo de la concesionaria se desea investigar la variabilidad


de la edad de los compradores. La muestra aleatoria de 26 ventas, dio como resultado un desvío
estándar que es 6,25 años. Se construye un intervalo de confianza para la variancia poblacional,
con un nivel de confianza de 0,90.

Como los valores de 12 y son

12;25 g .l  37 ,7  22;25 g .l .  14,6

 2639,05 2639,05  0,90


P   2x 
 37,7 14,6 
Estadística I 226


P 26,93   2x  69,54  0,90 
ESTIMACIÓN POR INTERVALOS DE CONFIANZA PARA LA PROPORCIÓN PO-
BLACIONAL

No resulta conveniente construir intervalos de confianza para estimar la proporción po-


blacional en el caso de muestras pequeñas. Fundamentalmente por que, siendo el tamaño de la
muestra menor o igual a 30, la proporción muestral hi resulta mucho menos confiable que en el
caso de una muestra grande. Adicionalmente, eso también determina que el valor de la varianza
de la proporción, que se obtiene haciendo hi (1-hi) y que interviene en el cálculo de los límites
inferior y superior del intervalo de confianza, estén exageradamente distanciados entre sí, por lo
que el intervalo en sí mismo carece de sentido.

6 - CALCULO DEL TAMAÑO DE LA MUESTRA PARA POBLACIONES INFINITAS Y


FINITAS

Se parte de la siguiente negación: la media muestral no es igual a la media poblacional.


Por consiguiente
x  x

Como ambos elementos son diferentes, es lógico entender que entre ellos hay una dife-
rencia, que se simbolizará con d, positiva o negativa, y que se denominará margen de error o
tolerancia. Es decir que
x  x  d

Dividimos ambos miembros de esta igualdad por una misma expresión

x  x d
  z1
x x

x
Siendo  x igual a , se tiene
n
x  x d
  z1
x x
n n

Se toma la segunda parte de la igualdad:

d
 z1
x
n

De allí se despeja n con el siguiente resultado:


Estadística I 227

z12 x2
n
d2
obteniéndose un primer cálculo para el tamaño de la muestra, para la estimación de la media
poblacional.

Si se observa detenidamente la expresión hallada, se verá que el tamaño de la muestra


n depende de los siguientes factores:

 de la varianza de la variable bajo estudio (x2), en forma directa (la varianza apare-
ce multiplicando), con lo cual a mayor variabilidad de la variable bajo estudio,
mayor tamaño de la muestra.

 del valor z1, que representa al coeficiente que indica el grado de confianza exigido
en la estimación, también en forma directa: a mayor grado de confianza exigido,
mayor tamaño de la muestra. Si el grado de confianza fuera igual a 1, z1 sería infi-
nito, por lo que el tamaño de la muestra n   .

 del valor de la tolerancia d, en forma inversa: a mayor margen de error o tole-


rancia admitida, menor tamaño de la muestra. Si la tolerancia fuera cero, eso im-
plicaría que la diferencia entre las medias muestral y poblacional debería ser cero, o,
lo que es lo mismo, ambas media deberían ser iguales, con lo que el n deberá ser igual
al N, es decir, infinito.

TAMAÑO DE LA MUESTRA PARA POBLACIONES FINITAS O MUESTREO SIN


REPOSICIÓN

El procedimiento que se sigue es similar al del cálculo para poblaciones infinitas, sólo
que en el momento de reemplazar  x , se recurre a la fórmula del desvío estándar para poblacio-
nes finitas o sin reposición, lo cual dará la siguiente igualdad:
d
 z1
x N  n
n N 1
Operando para despejar n, se obtiene la siguiente fórmula:

z12 x2 N
n
d 2  N  1  z12 x2

Puede verificarse fácilmente que si en la última fórmula deducida N→  , aplicando


algún método de resolución de casos indeterminados (Regla de L´Hopital, por ejemplo), se ob-
tiene la que corresponde a los casos para poblaciones infinitas.

ANÁLISIS DE LA TOLERANCIA O MARGEN DE ERROR

Para poder efectuar empíricamente el cálculo del tamaño de la muestra, el valor que in-
terviene en la fórmula correspondiente a la tolerancia d se suele presentar como un porcentaje
de alguno de los valores conocidos en juego. En este caso aparece el concepto de tolerancia
Estadística I 228

relativa, es un porcentaje del valor de la media muestral, que es, precisamente, el valor que se ha
obtenido para la estimación de la media poblacional.
Ejemplo: En la concesionaria se desea evaluar el precio promedio de los autos vendidos,
cuál debería ser el tamaño de la muestra si se desea efectuar el trabajo de estimación con una
confianza del 95 % y una tolerancia relativa del 10 % respecto del valor estimado para la media
poblacional.

Como la media muestral resultó igual a $ 92,25 mil, el 10 % es 9,225; el nivel de con-
fianza del 95 % se corresponde con un valor de z1=1,96, y la varianza (desconocida) se reempla-
za por su estimador, igual a 306,25 miles de $2. Con estos datos, aplicando la fórmula que co-
rresponde a un tamaño de población infinita, tenemos:

z12  2x 1,96 2306,25


n   13,82  14
d2 9,225 2

(se redondea hacia arriba).

Si trabajamos con una muestra de un tamaño determinado se puede obtener el valor por-
centual de la tolerancia relativa d, con los datos disponibles. Para ello, a partir de la fórmula para
n y mediante pasaje de términos, se obtiene una fórmula de cálculo para d.

z12 x2
d
n

En el ejemplo de la concesionaria, la muestra tomada fue de 80 cliente, con ese tamaño


de muestra calculamos la tolerancia

1,96 2306,25
d  3,8349 miles de $
80

La tolerancia relativa se obtiene dividiendo el valor de d por la media aritmética (y luego


se multiplica por 100 ese resultado para convertirlo en un valor porcentual), entonces:

d 3,8349
  0,0416  d  4,16%
x 92,25

PREGUNTAS TEORICAS

1) La E S x2   E Sc2 
a) Siempre
b) Nunca
c) A veces
Estadística I 229

2) En un intervalo de confianza, a mayor precisión exigida, ¿cómo varía el tamaño del


intervalo?
a) Aumenta
b) Disminuye
c) No varía

3) Con una muestra de tamaño 17 se obtuvieron estos resultados: x i  340 y

 xi2  7.888 ¿Cuál es el valor del estimador puntual no viciado de  x ?


a) 20
b) 64
c) 340