Está en la página 1de 5

CALDWELL CAP 6 - INTERVALOS DE CONFIANZA

En este capítulo trabajaremos la construcción de intervalos de confianza. Más específicamente, nos ocuparemos de
la construcción de un intervalo de confianza para la media y la construcción de un intervalo de confianza para una
proporción.

INTERVALO DE CONFIANZA PARA LA MEDIA


Nos interesa estimar la media de una población ( μ) sobre la base de un promedio muestral ( X ). No podemos
simplemente calcular el promedio muestral ( X ) y asumir que es igual al promedio poblacional ( μ). Un promedio
muestral podría ser igual al promedio poblacional, pero no podemos asumir que así será→ siempre hay una
posibilidad de error. Por ello debemos usar un método que tome en cuenta la posibilidad del error muestral.
Usaremos nuestra media muestral como punto de partida para nuestra estimación. Luego construiremos una banda
de valores, o un intervalo, alrededor de la media muestral: sumamos un cierto valor a la media muestral y restamos
un cierto valor de nuestra media muestral. Cuando hayamos terminado, podremos afirmar que creemos que la
verdadera media poblacional ( μ) está entre este valor y aquel valor. Entonces, un intervalo de confianza para la
media poblacional se basa en una media muestral.
Los dos valores son el límites superior e inferior del intervalo: un intervalo dentro del cual creemos que la media
poblacional se encuentra. Puede que tengamos razón (nuestro intervalo puede contener la media real de la
población) o podemos estar equivocados (nuestro intervalo puede no contener la media real de la población).
Aunque existe cierta incertidumbre en nuestra estimación, sabremos la probabilidad de que hayamos cometido un
error.

INTERVALO DE CONFIANZA PARA LA MEDIA CON σ CONOCIDO


Utilizamos la media muestral como punto de partida, y construimos un intervalo de confianza a su alrededor.
Sabemos que el valor de nuestra media muestral puede no ser igual a la media real de la población, es por ello que
“amortiguamos” nuestra estimación. ¿cómo? Amortiguamos nuestra estimación agregando un cierto valor a la
media muestral y restando un cierto valor de la media de la muestra. Cuando agregamos un valor a la media
muestral, establecemos el límite superior de nuestro intervalo de confianza; cuando restamos un valor de la media,
establecemos el límite inferior del intervalo de confianza. Entonces:
Intervalo de confianza( IC )=media muestral (X )± Z( ?)
Revisando los valores Z
Un valor Z es un punto a lo largo de la línea base de la curva normal, los valores Z son expresiones de unidades de
desviación estándar. Es por ello que, si la distribución de la población es normal, para conocer los límites del
intervalo todo lo que hay que hacer es multiplicar la desviación estándar por un valor particular de Z (1,96 si
trabajamos con el 95% de confianza; 2,58 si trabajamos con el 99%) y luego restar y sumar ese resultado al valor
que arroja la media.
Valores Z y amplitud del intervalo
Para determinar el valor Z correcto, primero decidimos que tan amplio queremos que sea nuestro intervalo. Los
estadísticos suelen elegir entre un intervalo de confianza del 95% y un intervalo de confianza del 99%. En el caso
en que se conoce σ , un intervalo de confianza del 95% se construye utilizando un valor Z de 1.96 en la fórmula. Un
intervalo de confianza de 99% se construye usando un valor Z de 2.58.
Introduciendo el error estándar de la media
El error estándar de la media se introduce para tomar en cuenta un promedio general de cuánto se desviarán las
diferentes medias muestrales de la media poblacional real ( μ). El error estándar, justamente, indica la desviación
estándar de la distribución muestral. Como ahora vamos a trabajar con muestras, usaremos el error estándar en
lugar de la desviación estándar a la hora de multiplicar por un valor Z. Ahora bien, ¿por qué usamos el error
estándar? Bueno, porque partimos de uno de los corolarios del teorema central del límite:
Si se toman muestras aleatorias repetidas de tamaño n de una población con un media o mu ( μ) y una desviación
estándar (σ ), la distribución muestral de las medias muestrales tendrán una media igual a mu ( μ) y un error
σ
estándar igual a . Además, a medida que n aumenta, la distribución muestral se acerca a una distribución
√❑
normal→ de allí que el error estándar es igual a σ dividido por la raíz cuadrada del tamaño muestral n.
La relevancia del teorema del límite central y el error estándar
Para referirnos al error estándar de la media utilizaremos la simbología σ X , tal que
σ
σ X=
√❑
de allí
IC= X ± Z ( σ X )
IC= X ± Z ¿
Todo lo que resta para construir un intervalo de confianza es multiplicar el error estándar por el valor Z apropiado o
asociado y ajustar el producto alrededor de la media muestral (sumarlo a nuestra media y restarlo de la media). De
esta manera obtenemos nuestro intervalo.
El método que utilizamos producirá un intervalo que contiene el verdadero parámetro poblacional, la media
poblacional, un 99% o 95% de las veces (varía depende del nivel de confianza que se elija). El método produce un
intervalo que contiene la media poblacional unas 99 de 100 veces (si trabajamos con un IC de 99%) justamente lo
que se encuentra debajo de esta aplicación: muestreo aleatorio, el teorema central del límite y la curva normal.
Tenemos confianza en nuestra estimación por el método que utilizamos.
Confianza y amplitud del intervalo
IC= X ± Z ¿
Cambiar únicamente el valor de Z, por ejemplo pasar de usar 1.96 a 2.58, provoca que obtengamos un intervalo
más acotado; esto es razonable ya que estamos multiplicando el error estándar por un valor ligeramente menor.
Aquí se evidencia la relación entre el nivel de confianza y la amplitud del intervalo: todos los factores siendo
iguales, un IC del 95% producirá una estimación más precisa -esto es, con un rango más estrecho- que un IC del
99%, cuyo intervalo será más amplio. Decir qué una estimación es más precisa es otra forma de decir que un
estimador tiene un rango más estrecho. En resumen, existe una relación inversa entre el nivel de confianza y la
precisión. A medida que aumenta nuestra confianza, la precisión de nuestra estimación disminuye.
Alternativamente, a medida que aumenta nuestra precisión, nuestra confianza disminuye.
También es posible afectar la precisión de una estimación cambiando el tamaño de la muestra. Dado un nivel
constante de confianza, puede aumentar la precisión de una estimación aumentando el tamaño de la muestra.
INTERVALO DE CONFIANZA PARA LA MEDIA CON σ DESCONOCIDO
El caso más típico de aplicación de la construcción del intervalo de confianza son las que implican una estimación
de la media de una población cuando la desviación estándar de la población es desconocida. En este caso no solo
que no se conoce el valor de las desviaciones estándar de la población ( σ ), sino que tampoco se puede confiar en la
curva normal, por lo que no puede confiar en esos valores familiares como 1,96 (para un intervalo de confianza del
95%) o 2,58 (para un intervalo de confianza del 99%).
Estimación del error estándar de la media
Cuando no conocemos el valor de la desviación estándar de la población ( σ ), que suele ser el caso, tendremos que
estimar el error estándar. Para estimar el error estándar de la media todo lo que tenemos que saber es la desviación
estándar de nuestra muestra (s) y nuestro tamaño de muestra (n). Asumiendo que tenemos la desviación estándar de
nuestra muestra en cuestión, simplemente la dividimos por la raíz cuadrada de nuestro tamaño muestral (n).
La estimación del error estándar de la media se designa como s X y su fórmula es
s
sX =
√❑
Si la desviación estándar de nuestra muestra se obtuvo usando el factor de corrección n - 1, dividiremos las
desviaciones estándar de la muestra por la raíz cuadrada de nuestro tamaño de muestra ( n). Si, por otro lado, la
desviación estándar de la muestra (s) se obtuvo sin utilizar el factor de corrección n - 1, obtendremos la estimación
del error estándar dividiendo la desviación estándar de la muestra (s) por la raíz cuadrada de n - 1.
La familia de distribuciones t
En lugar de confiar en la distribución normal y sus valores Z familiares, confiaremos en lo que se conoce como la
familia de distribuciones t. La familia de distribuciones t se compone de varias distribuciones. Como la curva
normal, cada distribución t es simétrica, y cada curva tiene una media de 0, ubicada en el medio. Los valores t
positivos se encuentran a la derecha de 0 y los valores t negativos se encuentran a la izquierda, al igual que los
valores Z en la curva normal. La diferencia efectiva con la tabla normal estándar reside en que la forma exacta de
cada distribución está basada en el tamaño muestral (n). Cuando el número de casos es pequeño, la distribución
será relativamente chata. A medida que el número de casos en cada muestra aumenta, la porción del medio de la
curva comienza a crecer. A medida que la porción del medio de la curva crece, la curva comienza a tomar más
altura.

Un valor t (como un valor Z) es solo un punto a lo largo de la línea de base de una distribución (o, más
correctamente, una distribución muestral).
Hay muchas distribuciones muestrales de t diferentes, y cada una tiene una forma ligeramente diferente. Una
distribución t construida sobre la base de pequeñas muestras será más plana que una basada en muestras que son
más grandes. Cuando una distribución es plana, tendremos que recorrer una distancia mayor por encima y por
debajo de la media para abarcar un porcentaje dado de casos o área bajo la curva.
La tabla para la familia de distribuciones t
La columna en el extremo izquierdo de la tabla se llama Grados de libertad (df). Los grados de libertad se calculan
de la siguiente manera: dada la media de una distribución de n valores, n-1 de los valores son libres de variar.
Entonces→ grados de libertad=n-1
Si deseamos construir un intervalo de confianza del 95%, miramos en las columna de nivel de significancia
aquella que arroja el valor .05 (5%) → 1- el nivel de significancia=nivel de confianza. Si queremos construir un
intervalo de confianza del 99%, iremos a las sección que arroja el valor .01 (1%) de nivel de significancia.
Los valores t son directamente análogos a los valores Z; ambos son puntos a lo largo de una base de las diferentes
distribuciones de t.
Entonces, ¿qué elementos necesitamos? el tamaño muestral n, la media muestral ( X ), el desvío estándar, y el
intervalo de confianza con el que deseemos trabajar. Procedemos con la siguiente fórmula:
IC= X ± t (s x )
En resumen, construimos nuestro intervalo sumando y restando a la media un cierto valor determinado por el error
estándar de la distribución muestral.
Dado que todo lo que tenemos es la desviación estándar de la muestra (la desviación estándar de la población, σ , es
desconocida), trabajaremos con la distribución t, y por ello tendremos que estimar el error estándar.
El valor de t que usaremos se encuentra localizando la intersección de los grados apropiados de libertad y nivel de
confianza. Al valor de esta intersección lo llamamos valor t. Luego tendremos que multiplicar el valor t por nuestro
estimador del error estándar; el error estándar ( s x) lo estimamos dividiendo el desvío estándar de la muestra (s) por
la raíz cuadrada del tamaño muestral (n). El resultado es nuestro estimador de error estándar
s
sx=
√❑
Ese valor de error estándar lo multiplicamos por el valor t, y ese resultado lo sumamos y restamos de nuestra media
muestral para calcular los límites del intervalo de confianza.
En este caso también hay una relación inversa entre confianza y precisión→ a mayor nivel de confianza (por
ejemplo un IC de 99%), mayor es la amplitud del IC y por ende menor es la precisión. Dado un nivel
constante de confianza (digamos, 95%), puede aumentar la precisión de una estimación (o disminuir la
amplitud del intervalo) aumentando su tamaño muestral. Para comprender la lógica detrás de esto, pensemos
en el tamaño de muestra más grande posible: sería toda la población. En ese caso, no habría error estándar, y su
estimación sería exactamente igual a la media de la población, ¡el intervalo más estrecho que podría tener!

Un comentario final sobre la interpretación de un intervalo de confianza para la media


Al establecer el intervalo dentro del cual creemos que la media poblacional se encuentra, no hemos establecido
ninguna probabilidad de que nuestra media sea correcta. En otras palabras, no podemos afirmar que las
posibilidades sean de 95 en 100 (o 99 en 100) de que la media de la población es un valor puntual ( X ). Nuestras
afirmaciones son válidas sólo con respecto al intervalo y no con respecto a ningún valor particular de la media
muestral.
Un intervalo de confianza para la media no proporciona una estimación exacta del valor de la media poblacional.
Más bien, proporciona un intervalo, un intervalo de dos valores, el cual se cree que contiene el verdadero media de
la población.
Se trata de la probabilidad y el método, la probabilidad de que el método ha generado una estimación de intervalo
correcta.

Un comentario final sobre Z versus t


Algunos estadísticos usan la distribución Z (en lugar de t), incluso cuando σ es desconocido, siempre que estén
trabajando con una muestra grande. Teniendo en cuenta que el número de grados de libertad es una declaración
indirecta del tamaño de la muestra sucede algo interesante: una vez que haya superado los 120 grados de libertad
los valores de t y Z son idénticos. Por ejemplo, si estuviera trabajando con un muestra de 150 casos y construyendo
un intervalo de confianza del 95% para la media, realmente no haría ninguna diferencia si confiara en el valor de to
Z. Ambos valores serían 1,96.

INTERVALOS DE CONFIANZA PARA PROPORCIONES


El propósito detrás de un intervalo de confianza para una proporción es análogo al de un intervalo de confianza
para la media. Construimos un intervalo de confianza para una proporción sobre la base de información sobre una
proporción en una muestra. Nuestro último propósito, sin embargo, es estimar la proporción en la población.
Usando nuestra proporción observada como un punto de partida, luego construiremos un intervalo, tal como lo
hicimos antes. Para construir el intervalo, sumamos algún error estándar a nuestra proporción observada, y
restamos aquel error estándar de la proporción observada. El resultado será el intervalo de confianza.
La fórmula para estimar el error estándar de una proporción es:
S p= √ ❑

El valor p en la fórmula representa el valor de la proporción observada. El valor 1-p representa la proporción
restante. Sustituyendo los valores de los elementos en la fórmula obtenemos el error estándar de una proporción.
Margen de error:
El margen de error es, en efecto, simplemente una declaración sobre la amplitud del intervalo.
El margen de error es una declaración indirecta de la amplitud del intervalo. Por ejemplo, la afirmación de que la
proporción en una población se estima en 45%, con una margen de error de ± 3%, es en realidad una afirmación de
que el intervalo de la estimación oscila entre el 42% y el 48%. Dado un nivel constante de confianza, un aumento
en el tamaño muestral reducirá el margen de error.

También podría gustarte