Está en la página 1de 28

BIOESTADSTICA APLICADA A LA

NUTRICIN

SEMINARI
O#5

INTERVALOS DE CONFIANZA
INTEGRANTES
(ESTIMACIN
ESTADSTICA. ERROR
Rod Josu Espin
Mara
TPICO DE
LA Leonor
MEDIA. INTERVALO
Garfalo
DE CONFIANZA
PARA K.
Mara Jos Gomero
Jose AndrsDE
Icaza
COMPARACIN
DOS MEDIAS.
Mary Nicola
INTERVALO
DE CONFIANZA PARA
Nelson Salas
Yagual
(1- Giancarlo
2).

Contenido
1.

INTRODUCCION......................................................................................................... 3

2.

DESARROLLO............................................................................................................. 4
2.1.

Estimadores puntuales e intervalos de confianza de una media...........................4

2.2.

Intervalos de confianza de una media poblacional................................................5

2.2.1.

Desviacin estndar poblacional conocida ()...............................................5

2.2.2.

Desviacin estndar poblacional desconocida ().........................................7

2.3.

Intervalos de confianza de una proporcin..........................................................11

2.3.1.
2.4.

Error tpico de la media.......................................................................................15

2.4.1.
2.5.

Ejemplo........................................................................................................13

Usos del error tpico de la media..................................................................16

Eleccin del tamao adecuado de una muestra..................................................17

2.5.1.

Tamao de la muestra para calcular una media poblacional........................18

2.5.2.

Tamao de la muestra para calcular la proporcin de una poblacin...........19

2.6.

Intervalo de confianza para

( 1 2) ...........................................................20

2.6.1.

Poblaciones normales..................................................................................21

2.6.2.

Intervalo de confianza para la diferencia de medias....................................21

3.

CONCLUSIONES......................................................................................................24

4.

BIBLIOGRAFIA..........................................................................................................25

5.

ANEXOS.................................................................................................................... 26
4.1.

Distribucin z......................................................................................................26

4.2.

Distribucin t de Student....................................................................................27

Escuela Superior Politcnica del Litoral

1. INTRODUCCION
En el trabajo a continuacin se estudiaran diversos aspectos importantes del muestreo.
La estimacin, la primera de las dos reas generales de la inferencia
estadstica.
La inferencia estadstica es el procedimiento por medio del cual se llega a inferencias
acerca de una poblacin con base en los resultados obtenidos de una muestra extrada
de esa poblacin.

El proceso de estimacin implica calcular, a partir de los datos de una muestra, alguna
estadstica que se ofrece como una aproximacin del parmetro correspondiente de la
poblacin de la cual se extrajo la muestra.
La explicacin de las razones en que se funda la estimacin en el campo de las ciencias
de la salud se apoya en la suposicin de que quienes trabajan en este campo, tienen
inters en los parmetros de varias poblaciones, si este es el caso existen dos buenas
razones por las que se debe confiar en los procedimientos de estimacin para obtener
informacin respecto a dichos parmetros. Primero, muchas poblaciones de inters,
aunque finitas, son tan grandes que no se podra llevar a cabo un estudio del 100% desde
el punto de vista del costo. Segundo, no es posible estudiar por completo las poblaciones
que son infinitas.
Supngase que el administrador de un hospital grande esta interesando en saber la edad
promedio de los pacientes que fueron admitidos a su hospital durante un determinado
ao. Es posible que considere demasiado laborioso consultar todos los registros de todos
los pacientes admitidos durante ese ao y, como consecuencia decide examinar una
muestra de los registros a partir de los cuales pueda calcular una estimacin de la edad
promedio de los pacientes admitidos ese ao.
El primer paso es el estudio del estimador puntual. Un estimador puntual consiste en
un solo valor (punto) deducido de una muestra para estimar el valor de una poblacin. Por
ejemplo, suponga que elige una muestra de 50 ejecutivos de nivel medio y le pregunta a
cada uno de ellos la cantidad de horas que labor la semana pasada. Se calcula la media

Escuela Superior Politcnica del Litoral

de esta muestra de 50 y se utiliza el valor de la media muestral como estimador puntual


de la media poblacional desconocida.
Ahora bien, un estimador puntual es un solo valor. Un enfoque que arroja ms informacin
consiste en presentar un intervalo de valores del que se espera que se estime el
parmetro poblacional. Dicho intervalo de valores recibe el nombre de intervalo de
confianza.

2. DESARROLLO
2.1.

Estimadores puntuales e intervalos de confianza

de una media
Un estimador puntual es un estadstico nico para calcular un parmetro poblacional.
Suponga que Best Buy, Inc., desea estimar la edad media de los compradores de
televisores de plasma de alta definicin; selecciona una muestra aleatoria de 50
compradores recientes, determina la edad de cada uno de ellos y calcula la edad media
de los compradores de la muestra. La media de esta muestra es un estimador puntual de
la media de la poblacin.

ESTIMADOR PUNTUAL Estadstico calculado a partir de informacin de la


muestra para estimar el parmetro poblacional.
Los siguientes ejemplos ilustran los estimadores puntuales de medias poblacionales.
Estudios mdicos recientes indican que el ejercicio constituye una parte importante de la
salud general de una persona. El director de recursos humanos de OCF, fabricante
importante de vidrio, desea calcular la cantidad de horas semanales que los empleados
dedican al ejercicio. Una muestra de 70 empleados revela que la cantidad media de horas
de ejercicio de la semana pasada fue de 3.3. La media muestral de 3.3 horas aproxima la
media poblacional desconocida, la media de horas de ejercicio de todos los empleados.
La media muestral, , no es el nico estimador puntual de un parmetro poblacional. Por
ejemplo, p, una proporcin muestral, es un estimador puntual de , la proporcin
poblacional; y s, la desviacin estndar muestral, es un estimador puntual de , la
desviacin estndar poblacional.

Escuela Superior Politcnica del Litoral

2.2.

Intervalos de confianza de una media poblacional

Ahora bien, un estimador puntual slo dice parte de la historia. Aunque se espera que el
estimador puntual se aproxime al parmetro poblacional, sera conveniente medir cun
prximo se encuentra en realidad. Un intervalo de confianza sirve para este propsito. Por
ejemplo, se estima que el ingreso anual medio de los trabajadores de la construccin en
el rea de Nueva York a Nueva Jersey es de $85 000. Un intervalo de este valor
aproximado puede oscilar entre $81 000 y $89 000. Para describir cunto es posible
confiar en que el parmetro poblacional se encuentre en el intervalo se debe generar un
enunciado probabilstico. Por ejemplo: se cuenta con 90% de seguridad de que el ingreso
anual medio de los trabajadores de la construccin en el rea de Nueva York a Nueva
Jersey se encuentra entre $81 000 y $89 000.

INTERVALO DE CONFIANZA Conjunto de valores que se forma a partir de


una muestra de datos de forma que exista la posibilidad de que el
parmetro poblacional ocurra dentro de dicho conjunto con una
probabilidad especfica. La probabilidad especfica recibe el nombre de
nivel de confianza.
Para calcular el intervalo de confianza, consideraremos dos situaciones:

Utilizamos los datos de la muestra para calcular con X, mientras que la

desviacin estndar de la poblacin () es conocida.


Utilizamos los datos de la muestra para calcular con X, mientras que la
desviacin estndar de la poblacin es desconocida. En este caso, sustituimos la
desviacin estndar de la(s) muestra(s) por la desviacin estndar de la poblacin
().

Existen diferencias importantes en las suposiciones entre estas dos situaciones.


Consideraremos primero el caso donde se conoce .
2.2.1.

Desviacin estndar poblacional conocida ()

Un intervalo de confianza se calcula con el empleo de dos estadsticos: la media muestral


y la desviacin estndar. Se sabe que la desviacin estndar es un estadstico importante,
porque mide la dispersin, o la amplitud, de una poblacin o de una muestra de
distribucin. Cuando se calcula un intervalo de confianza, se utiliza la desviacin estndar
para estimar el rango del intervalo de confianza.

Escuela Superior Politcnica del Litoral

Los resultados del teorema central del lmite permiten afirmar lo siguiente con respecto a
los intervalos de confianza utilizando el estadstico z:
1. Noventa y cinco por ciento de las medias muestrales seleccionadas de una poblacin
se encontrar dentro de 1.96 errores estndares (desviacin estndar de las medias
muestrales de la media poblacional, .
2. Noventa y nueve por ciento de las medias muestrales se encontrar a 2.58 errores
estndares de la media poblacional.

Escuela Superior Politcnica del Litoral

Ejemplo
Del Monte Foods, Inc., distribuye duraznos en trozo en latas
de 4 onzas. Para asegurarse de que cada lata contenga por
lo menos la cantidad que se requiere, Del Monte establece
que el proceso de llenado debe verter 4.01 onzas de
duraznos y almbar en cada lata. As, 4.01 es la media
poblacional. Por supuesto, no toda lata contendr exactamente 4.01 onzas de duraznos y
almbar. Algunas latas contendrn ms y otras menos. Suponga que la desviacin
estndar del proceso es de 0.04 onzas. Tambin suponga que el proceso se rige por la
distribucin de probabilidad normal. Ahora se selecciona una muestra aleatoria de 64 latas
y se determina la media de la muestra. sta es de 4.015 onzas de duraznos y almbar. El
intervalo de confianza de 95% de la media poblacional de esta muestra particular es:

4.015 1.96(.04 / 64)=4.015 .0098


Interpretacin
El nivel de confianza de 95% se encuentra entre 4.0052 y 4.0248. La media de poblacin
de 4.01 onzas se encuentra en este intervalo.

2.2.2.

Desviacin estndar poblacional desconocida ()

Se utiliza la desviacin estndar de la muestra para estimar la desviacin estndar


poblacional. Es decir, se utiliza s, la desviacin estndar de la muestra, para estimar , la
desviacin estndar de la poblacin. No obstante, al hacerlo no es posible utilizar la
frmula anterior. Como no conoce , no puede utilizar la distribucin z. Sin embargo, hay
una solucin: utilizar la desviacin estndar de la media y sustituir la distribucin z con la
distribucin t. La distribucin t es una distribucin de probabilidad continua, con muchas
caractersticas similares a las de la distribucin z.
Aqu, s es un estimador de . La distribucin t es ms plana y que se extiende ms que la
distribucin normal estndar. Esto se debe a que la desviacin estndar de la distribucin
t es mayor que la distribucin normal estndar.

Escuela Superior Politcnica del Litoral

Grfico 1. Distribucin normal estndar y distribucin t de Student

Como la distribucin t de Student posee mayor dispersin que la distribucin z, el valor


de t en un nivel de confianza dado tiene una magnitud mayor que el valor z
correspondiente. El siguiente grafico muestra los valores de z para un nivel de confianza
de 95% y de t para el mismo nivel de confianza cuando el tamao de la muestra es de
n=5. Con el mismo nivel de confianza, la distribucin t es ms plana o ms amplia que la
distribucin normal estndar.

Grfico 2. Valores de z y t para el nivel de confianza de 95%

Para crear un intervalo de confianza de la media poblacional con la distribucin t, se


ajusta la anterior de la siguiente manera.

Escuela Superior Politcnica del Litoral

La decisin de utilizar t o z se basa en el hecho de que se conozca , la desviacin


estndar poblacional. Si se conoce, se utiliza z. Si no se conoce, se debe utilizar t.

Ejemplo#1
Un fabricante de llantas desea investigar la durabilidad de sus productos. Una muestra de
10 llantas que recorrieron 50 000 millas revel una media muestral de 0.32 pulgadas de
cuerda restante con una desviacin estndar de 0.09 pulgadas. Construya un intervalo de
confianza de 95% de la media poblacional. Sera razonable que el fabricante concluyera
que despus de 50 000 millas la cantidad media poblacional de cuerda restante es de
0.30 pulgadas?
Solucin
Para comenzar, se supone que la distribucin de la poblacin es normal. En este caso no
hay muchas evidencias, pero tal vez la suposicin sea razonable. No se conoce la
desviacin estndar de la poblacin, pero s la desviacin estndar de la muestra, que es
de 0.09 pulgadas. Se aplica la frmula

De acuerdo con la informacin dada, =0.32, s=0.09 y n =10. Para hallar el valor de t El
primer paso para localizar t consiste es desplazarse a lo largo de las columnas
identificadas como Intervalos de confianza

Escuela Superior Politcnica del Litoral

Grfico 3. Una parte de distribucin t

En este caso, desea el nivel de confianza de 95%, as que vaya a la columna con el
encabezamiento 95%. La columna del margen izquierdo se identifica como gl. Estas
palabras se refieren al nmero de grados de libertad, esto es, el nmero de observaciones
incluidas en la muestra menos el nmero de muestras, el cual se escribe n-1. En este
caso es de 10-1=9
Para determinar el intervalo de confianza se sustituyen los valores en la frmula

Interpretacin
Los puntos extremos del intervalo de confianza son 0.256 y 0.384. Cmo interpretar este
resultado? la media poblacional se encuentra en este intervalo. El fabricante puede estar
seguro (95% seguro) de que la profundidad media de las cuerdas oscila entre 0.256 y
0.384 pulgadas. Como el valor de 0.30 se encuentra en este intervalo, es posible que la
media de la poblacin sea de 0.30 pulgadas.

Escuela Superior Politcnica del Litoral

10

Ejemplo #2
El gerente de Inlet Square Mall, cerca de Ft. Myers, Florida, desea estimar la cantidad
media que gastan los clientes que visitan el centro comercial. Una muestra de 20 clientes
revela las siguientes cantidades.

Cul es la mejor estimacin de la media poblacional? Determine un intervalo de


confianza de 95%. Interprete el resultado. Concluira de forma razonable que la media
poblacional es de $50? Y de $60?
Solucin
El gerente del centro comercial no conoce la media poblacional. La media muestral
($49.35) constituye la mejor aproximacin de dicho valor.
Se aplica la frmula establecida para determinar el intervalo de confianza. El valor de t se
localiza en la tabla de distribucin t. Hay n-1 = 20-1=19 grados de libertad. Al desplazarse
por el rengln con 19 grados de libertad a la columna del intervalo de confianza de 95%,
el valor de esta interseccin es de 2.093.

Interpretacin
Los puntos extremos del intervalo de confianza son $45.13 y $53.57. Resulta razonable
concluir que la media poblacional se encuentra en dicho intervalo. El gerente de Inlet
Square se preguntaba si la media poblacional podra haber sido $50 o $60. El valor de
$50 se encuentra dentro del intervalo de confianza. Resulta razonable que la media
poblacional sea de $50. El valor de $60 no se encuentra en el intervalo de confianza. De
ah que se concluya que no es probable que la media poblacional sea de $60.

2.3.

Intervalos de confianza de una proporcin

El material hasta ahora expuesto en este captulo utiliza la escala de medicin de razn.
Es decir, se emplean variables como ingresos, pesos, distancias y edades. Ahora se
considerarn casos como los siguientes:

Escuela Superior Politcnica del Litoral

11

Un representante de ventas afirma que 45% de las ventas de Burger King se lleva

a cabo en la ventana de servicio para automviles.


Un estudio de las casas del rea de Chicago indic que 85% de las construcciones

nuevas cuenta con sistema de aire acondicionado central.


Una encuesta reciente entre hombres casados de entre 35 y 50 aos de edad
descubri que 63% crea que ambos cnyuges deben aportar dinero.

Estos ejemplos ilustran la escala de medicin nominal. Cuando se mide con una escala
nominal, una observacin se clasifica en uno de dos o ms grupos mutuamente
excluyentes. Slo hay dos posibilidades, y el resultado debe clasificarse en uno de los dos
grupos.

PROPORCIN Fraccin, razn o porcentaje que indica la parte de la


muestra de la poblacin que posee un rasgo de inters particular.
Como ejemplo de proporcin, una encuesta reciente indic que 92 de cada 100
entrevistados estaban de acuerdo con el horario de verano para ahorrar energa. La
proporcin de la muestra es de 92/100, o 0.92, o 92%. Si p representa la proporcin de la
muestra, X el nmero de xitos y n el nmero de elementos de la muestra, se determina
una proporcin muestral de la siguiente manera:

PROPORCIN MUESTRAL

Para estimar la proporcin de una poblacin se procede en la misma forma que cuando
se estima la media de una poblacin. Se extrae una muestra de la poblacin de inters y
se calcula su proporcin, p. Esta proporcin de la muestra se utiliza como el estimador
puntual de la proporcin de la poblacin.
Para crear el intervalo de confianza de una proporcin de poblacin se aplica la frmula:

Escuela Superior Politcnica del Litoral

12

2.3.1.

Ejemplo

De acuerdo con el reglamento del sindicato de BBA, por lo menos tres cuartas partes de
los miembros del sindicato deben aprobar cualquier fusin. Una muestra aleatoria de 2
000 miembros actuales de BBA revela que 1 600 planean votar por la propuesta.
Qu es el estimador de la proporcin poblacional? Determine el intervalo de confianza
de 95% de la proporcin poblacional. Fundamente su decisin en esta informacin de la
muestra: Puede concluir que la proporcin necesaria de miembros del BBA favorece la
fusin? Por qu?
Solucin
Primero calcule la proporcin de la muestra de acuerdo con la frmula (9-3). sta es de
0.80, que se calcula de la siguiente manera:

p=

X 1600
=
=.80
n 2000

Por consiguiente, se calcula que 80% de la poblacin favorece la propuesta de fusin.


Determine el intervalo de confianza de 95% con ayuda de la frmula (9-4). El valor z
correspondiente al nivel de confianza de 95% es de 1.96.

p z

p (1 p)
n

.80 1.96

.80 (1.80)
2000

.80 .018 Los puntos extremos del

intervalo de confianza son 0.782 y 0.818. El punto extremo ms bajo es mayor que 0.75.
As, es probable que se apruebe la propuesta de fusin, pues el estimador del intervalo
incluye valores superiores a 75% de los miembros del sindicato.
Un repaso de la interpretacin del intervalo de confianza: si la encuesta fue aplicada 100
veces con 100 muestras distintas, los intervalos de confianza construidos a partir de 95 de
las muestras contendrn la verdadera proporcin de la poblacin. Adems, la
interpretacin de un intervalo de confianza resulta de mucha utilidad en la toma de
decisiones, y desempea un papel muy importante en especial la noche de las
elecciones. Por ejemplo, Cliff Obermeyer se postula para representar ante el Congreso al
6o. distrito de Nueva Jersey. Suponga que se entrevista a los electores que acaban de
votar y 275 indican que votaron por Obermeyer.

Escuela Superior Politcnica del Litoral

13

Considere que 500 electores es una muestra aleatoria de quienes votan en el 6o. distrito.
Esto significa que 55% de los electores de la muestra vot por Obermeyer.

p=

X 275
=
=.55
n 500

Ahora, para estar seguros de la eleccin, Obermeyer debe ganar ms de 50% de los
votos de la poblacin de electores. En este momento se conoce un estimador puntual,
que es de 0.55, de la poblacin de electores que votarn por l. Ahora bien, no se conoce
el porcentaje de la poblacin que votar por el candidato. En estas circunstancias, la
pregunta es: es posible tomar una muestra de 500 electores de una poblacin en la que
50% o menos de los electores apoye a Obermeyer para encontrar que 55% de la muestra
lo apoya? En otras palabras, el error de muestreo, que es

p=.55.50=0.5 , se

debe al azar, o la poblacin de electores que apoya a Obermeyer es superior a 0.50? Si


se establece el intervalo de confianza de la proporcin de la muestra y halla que 0.50 no
se encuentra en el intervalo, concluir que la proporcin de electores que apoya a
Obermeyer es mayor que 0.50. Qu significa esto? Bien, significa que puede resultar
electo. Qu pasa si 0.50 pertenece al intervalo? Entonces concluir que es posible que
50% o menos de los electores apoyen su candidatura y no es posible concluir que ser
electo a partir de de la informacin de la muestra. En este caso, si se utiliza el nivel de
significancia de 95% y la frmula se tiene que:

p z=

p (1 p)
n

.55 1.96=

.55(1.55)
500

.55 .044 As, los puntos extremos del

intervalo de confianza son: 0.55, -0.044 =0.506 y 0.55 -0.044 =0.594. El valor de 0.50 no
pertenece al intervalo. Por lo tanto, se concluye que probablemente ms de 50% de los
electores apoya a Obermeyer, lo cual es suficiente para que sea elegido.
Siempre se utiliza este procedimiento en las cadenas de televisin, revistas de noticias y
sondeos en la noche de las elecciones.

Escuela Superior Politcnica del Litoral

14

2.4.

Error tpico de la media

Segn el teorema del lmite central, si de cualquier poblacin se extraen muestras


aleatorias del mismo tamao N, al aumentar el nmero de muestras sus medias se
distribuyen normalmente, con media y una desviacin tpica, o error tpico

Esta distribucin muestral de las medias es independiente de la distribucin de la


poblacin:
Aunque la distribucin en la poblacin no sea normal, las medias de las muestras
aleatorias extradas de esa poblacin s tienden a tener una distribucin normal.
El error tpico de la media (desviacin tpica de la distribucin muestral de las medias)
podemos expresarlo de dos maneras:
La desviacin tpica del numerador se supone calculada dividiendo
por N-1 la suma de cuadrados (o la suma de las puntuaciones
diferenciales, X- X, elevadas previamente al cuadrado).
La desviacin tpica se ha calculado dividiendo por N, como es
normal hacerlo cuando se calcula la desviacin tpica como dato
descriptivo de la muestra. Ambas frmulas son equivalentes y dan el
mismo resultado; la nica diferencia est en cundo se ha restado 1 a N.
Observando la frmula del error tpico de la media podemos ver que:
1. Es claro que el error tpico de la media ser menor que la desviacin tpica de
cualquier muestra: el cociente siempre ser menor que el numerador. Esto quiere
decir que las medias de las muestras son ms estables y tienden a oscilar menos que
las puntuaciones individuales; dicho de otra manera, las medias de muestras de la
misma poblacin se parecen entre s ms que los sujetos (u objetos) de una muestra
entre s.
2. Observando las frmulas vemos tambin que el error tpico de la media ser ms
pequeo en la medida en que N sea grande: si aumentamos el denominador,
disminuir el cociente.

Escuela Superior Politcnica del Litoral

15

Es natural que al aumentar el nmero de sujetos (N) el error sea menor: la media de la
muestra se aproximar ms a la media de la poblacin. Si N es muy grande, el error
tiende a cero; y si N no comprende a una muestra sino a toda la poblacin, el error sera
cero: en este caso la media de la poblacin coincide con la media de la muestra y no hay
error muestral (o variacin esperable de muestra a muestra).
3. Por otra parte si la desviacin tpica de la muestra es grande, el error tpico estimado
de la media ser tambin mayor: si aumentamos el numerador, el cociente ser
mayor.

2.4.1.

Usos del error tpico de la media

Establecer los lmites probables (intervalos de confianza) entre los que se


encuentra la media de la poblacin, un planteamiento tpico y frecuente en

estadstica inferencial.
Nos permite comprobar si una muestra con una determinada media puede
considerarse como perteneciente a una poblacin cuya media conocemos, es
tambin de inters y es simplemente una aplicacin del anterior. Igualmente

podemos aplicarlo si la media es una proporcin.


Determinar el nmero de sujetos que necesitamos en la muestra para extrapolar
los resultados a la poblacin. Cuando a partir de los datos de una muestra nos
interesa extrapolar los resultados a la poblacin (por ejemplo cuntos van a votar a
un partido poltico en unas elecciones), lo hacemos con un margen de error (en
cuyo clculo tenemos en cuenta el error tpico y nuestro nivel de confianza): si
queremos un margen de error pequeo, necesitaremos ms sujetos por eso en
las frmulas para determinar el nmero de sujetos de la muestra entrar el error
tpico.

2.5.

Eleccin del tamao adecuado de una muestra

Una variable importante cuando se trabaja con intervalos de confianza es el tamao de la


muestra. Sin embargo, en la prctica, no es una variable, sino una decisin que se toma
para que la estimacin del parmetro de poblacin sea bueno. Esta decisin se basa en
tres variables:

Escuela Superior Politcnica del Litoral

16

1. El margen de error que tolerar el investigador.


2. El nivel de confianza deseado.
3. La variabilidad o dispersin de la poblacin que se estudia.
La primera variable es el margen de error. El mximo error admisible, designado E, es
la magnitud que se suma y resta de la media muestral (o proporcin muestral) para
determinar los puntos extremos del intervalo de confianza. Por ejemplo, en un estudio de
salarios, podemos decidir que deseamos estimar el salario promedio de la poblacin con
un margen de error de ms o menos $1000. O en una encuesta de opinin, podemos
decidir que deseamos calcular la proporcin de la poblacin con un margen de error de
ms o menos 5%.
El margen de error es la magnitud del error que se tolerar al estimar un parmetro
poblacional.
Quizs se pregunte por qu no elegir mrgenes pequeos de error. Existe una
compensacin entre el margen de error y el tamao de la muestra. Un margen de error
pequeo requiere de una muestra ms grande y de ms tiempo y dinero para recolectarla.
Un margen de error ms grande permitir tener una muestra ms pequea y un intervalo
de confianza ms amplio.
La segunda eleccin es el nivel de confianza. Al trabajar con un intervalo de confianza,
lgicamente se elegirn niveles de confianza relativamente altos como de 95% y 99%,
que son los ms comunes. Para calcular el tamao de la muestra, se necesitar un
estadstico z que corresponda al nivel de confianza elegido. El nivel de confianza de 95%
corresponde al valor z de 1.96, y el nivel de confianza de 99%, a un valor z de 2.58. Note
que las muestras ms grandes (con su consecuente requerimiento de ms tiempo y
dinero para recolectarlas) corresponden a niveles de confianza ms altos. Asimismo,
observe que utilizamos un estadstico z.
El tercer factor en la determinacin del tamao de una muestra es la desviacin
estndar de la poblacin. Si la poblacin se encuentra muy dispersa, se requiere una
muestra grande.
Por el contrario, si se encuentra concentrada (homognea), el tamao de muestra que se
requiere ser menor. No obstante, puede ser necesario utilizar un estimador de la
desviacin estndar de la poblacin. He aqu algunas sugerencias para determinar dicho
estimador.

Escuela Superior Politcnica del Litoral

17

2.5.1.

Tamao de la muestra para calcular una media

poblacional
Para calcular una media poblacional, se puede expresar la interaccin entre estos tres
factores y el tamao de la muestra se expresa con la frmula siguiente. Note que esta
frmula es el margen de error que se utiliza para calcular los puntos extremos de los
intervalos de confianza para estimar una media poblacional.

E=z

Al despejar n en esta ecuacin se obtiene el siguiente resultado:

Donde:
n es el tamao de la muestra.
z es el valor normal estndar correspondiente al nivel de confianza deseado.
es la desviacin estndar de la poblacin.
E es el error mximo admisible.
El resultado de este clculo no siempre es un nmero entero. Cuando el resultado no es
un entero, se acostumbra redondear cualquier resultado fraccionario. Por ejemplo, 201.21
se redondeara a 202.

Ejemplo
Un estudiante de administracin pblica desea determinar la cantidad media que ganan al
mes los miembros de los consejos ciudadanos de las grandes ciudades. El error al
calcular la media debe ser inferior a $100, con un nivel de confianza de 95%. El
estudiante encontr un informe del Departamento del Trabajo en el que la desviacin
estndar es de $1 000. Cul es el tamao de la muestra que se requiere?
Solucin
El error mximo admisible, E, es de $100. El valor z de un nivel de confianza de 95% es
de 1.96, y el estimador de la desviacin estndar, $1 000. Al sustituir estos valores en la
frmula se obtiene el tamao de la muestra que se requiere:

Escuela Superior Politcnica del Litoral

18

2
( 1.96 ) (1000 )
z
2
n=
=19.6 =384.16
E
100

( ) (

n=

El valor calculado de 384.16 se redondea a 385. Se requiere una muestra de 385 para
satisfacer las especificaciones. Si el estudiante desea incrementar el nivel de confianza,
por ejemplo, a 99%, se requerir una muestra ms grande. El valor z correspondiente al
nivel de confianza de 99% es 2.58.
2

( 2.58 ) (1000 )
z 2
n=
n=
=25.82=665.64
E
100

( ) (

Se recomienda una muestra de 666. Observe cunto modific el tamao de la muestra el


cambio en el nivel de confianza. Un incremento del nivel de confianza de 95% al de 99%
dio como resultado un incremento de 281 observaciones o 73% [(666/385)*100]. Esto
puede incrementar mucho el costo del estudio, en trminos de tiempo y dinero. De ah
que deba considerarse con cuidado el nivel de confianza.
2.5.2.

Tamao de la muestra para calcular la proporcin de

una poblacin
Para determinar el tamao de la muestra en el caso de una proporcin, es necesario
especificar estas mismas tres variables:
1. El margen de error.
2. El nivel de confianza deseado.
3. La variacin o dispersin de la poblacin a estudiar.
En el caso de la distribucin binomial, el margen de error es:

E=z

( 1 )
n

Si se resuelve la ecuacin para despejar n se obtiene lo siguiente:

Escuela Superior Politcnica del Litoral

19

Donde:
n es el tamao de la muestra.
z es el valor normal estndar correspondiente al nivel de confianza deseado.
es la proporcin de la poblacin.
E es el mximo error tolerable.

Ejemplo
En el estudio del ejemplo anterior tambin se calcula la proporcin de ciudades que
cuentan con recolectores de basura privados. El estudiante desea que el margen de error
se encuentre a 0.10 de la proporcin de la poblacin; el nivel de confianza deseado es de
90%, y no se encuentra disponible ningn estimador de la proporcin de la poblacin.
Cul es el tamao de la muestra que se requiere?
El estimador de la proporcin de la poblacin se encuentra a 0.10, por lo que E=0.10. El
nivel de confianza deseado es de 0.90, que corresponde a un valor z de 1.65. Como no
se encuentra disponible ningn estimador de la poblacin, se utiliza 0.50. El nmero de
observaciones que se sugiere es

n=( .5 )( 1.5 )

1.65 2
=68,0625
.10

( )

El investigador necesita una muestra aleatoria de 69 ciudades.

2.6.

Intervalo de confianza para

( 1 2)

A veces surgen casos en los que se tiene inters en estimarla diferencia entre la media de
dos poblaciones. A partir de cada poblacin se extrae una muestra aleatoria
independiente y, de los datos de cada una, se calculan las medias de las muestras 1 y
2 respectivamente. El estimador 1 - 2 proporciona una estimacin insesgada de

12 , la diferencia entre las medias de las poblaciones. Dependiendo de las


condiciones, la distribucin muestral de 1-2, puede presentar al menos una
distribucin aproximadamente normal, de modo que en muchos casos se utiliza la teora
pertinente a las distribuciones normales para calcular un intervalo de confianza para 1-2.

Escuela Superior Politcnica del Litoral

20

En el caso de que ambas poblaciones sean normales,

2, 2
X2 N ( )
, veremos cmo
X 1 N (1, 21)

obtener intervalos de confianza para la diferencia de las medias de las varianzas.


2.6.1.

Poblaciones normales

Las variables correspondientes a las dos poblaciones son:

X 1 N ( 1, 21)

X 2 N ( 2, 22)

Y tenemos una muestra de X1 (de tamao n1) y una muestra de X2 (de tamao n2).
2.6.2.

Intervalo de confianza para la diferencia de medias

Suponemos que las muestras de las dos poblaciones son independientes entre s, lo que
implica independencia entre las medias muestrales 1 y 2. En este caso, a partir de la
funcin correspondiente tenemos el intervalo de confianza de nivel de confianza para

( 1 2) , donde
como es habitual

S 21

S 22

son las varianzas muestrales de las dos muestras, y

=1 :

Escuela Superior Politcnica del Litoral

21

Ejemplo#1
En un hospital grande para el tratamiento de retrasados mentales, una muestra de 12
individuos con sndrome Down proporcion una concentracin media de cido rico en
suero de 1= 4.5 mg/100 ml. En un hospital general, se encontr que una muestra de 15
individuos normales de la misma edad y sexo tena un valor medio de 2= 3.4. Si resulta
lgico suponer que las dos poblaciones de concentraciones presentan una distribucin
normal con variancias iguales a 1, encuentre el intervalo de confianza del 95% para

12
Solucin
Para una estimacin puntual de

12 , utilcese
1 - 2=4.5-3.4=1.1

El coeficiente de confiabilidad que corresponde a .95 es de 1.96. El error estndar est


dado por la expresin.

El intervalo de confianza del 95% es entonces

1.1 1.96(.39)
1.1 1.8

.3 1.9

El 95 por ciento de confianza de que la diferencia real,

12

est entre .3 y 1.9,

porque, al repetir el muestreo, el 95% de los intervalos construidos de esta manera


incluiran la diferencia entre las medias reales.

Escuela Superior Politcnica del Litoral

22

Ejemplo#2
Se llev a cabo un estudio sobre el ritmo cardaco (en pulsaciones por minuto) de los
deportistas, en reposo, comparndolo con el de los no deportistas. Para ello, se tomaron
dos muestras aleatorias independientes, cada una de ellas del ritmo cardaco en reposo
de 10 personas, la primera en la poblacin de no deportistas y la segunda en la de los no
deportistas (todos en edades comprendidas entre los 20 y 35 aos) Los datos obtenidos
fueron:
No

65, 70, 75, 72, 74, 73, 72, 78, 68,

deportistas
Deportistas

73
71, 65, 69, 64, 63, 60, 61, 62, 65,
60

Identificamos con X1 la variable ritmo cardiaco de los no deportistas y con X 2 la variable


ritmo cardiaco de los deportistas, que podemos suponer con distribuciones aproximadas
2

N (1, 1 )

N (2, 2 ) . Respectivamente. Tenemos, por lo tanto, una muestra de

tamao n1=10 de X1 y una muestra de tamao n2=10 de X2, independientemente. Vamos a


encontrar un intervalo de confianza, con nivel de confianza =0,95, por ejemplo, para la
diferencia de los ritmos cardiacos medios,

( 1 2) . Para ello tenemos en cuenta que

n1=n2=10, 1=72 y 2=64.


a) Las varianzas poblacionales, conocidas, son
el intervalo de confianza para

( 1 2)

siguiente, teniendo en cuenta que

1 =10 y

2=9 . En este caso,

con nivel de confianza = 0,95 es el

=1 =0,05 ,

1 =0,975
2

Z 0,975=1,96

Escuela Superior Politcnica del Litoral

23

Redondeando al quinto decimal. Como el intervalo es positivo, podemos decir con una
confianza de un 95% que
podemos decir que que

12 >0 , o lo que es lo mismo, que

1> 2 , adems

12 >5 , con ese grado de confianza.

b) Las varianzas son desconocidas pero se pueden suponer iguales, esto es,

12=22 . En este caso, lo primero que necesitamos es calcular las varianzas de


cada muestra s1 y s2

Escuela Superior Politcnica del Litoral

24

3. CONCLUSIONES

Despus de la investigacin podemos decir que un intervalo de confianza aporta


ms informacin que un estimador puntual cuando se quiere hacer inferencias
sobre parmetros poblacionales. Pero se debe tener en cuenta que su amplitud
est determinada por el nivel de confianza determinado, la variabilidad de los

datos y el tamao de la muestra.


Estar conscientes del error de muestreo nos permite darle importancia a los
resultados y no tomar decisiones ante la creencia de que los valores estimados
estn cercanos a la verdad; es aceptable hasta el 10% ya que variaciones

mayores reducirn la validez del estudio.


En muchos estudios una estimacin puntual no es suficiente ya que dar un numero
como estimacin de un parmetro nos indica el error que cometemos, esto es
consecuencia de la aleatoriedad del muestreo.

4. BIBLIOGRAFIA

Toms Merino. Intervalos de confianza. Revisado 2007 [En lnea] [fecha de acceso
18

de

junio

de

2015]

URL

disponible

en:

http://escuela.med.puc.cl/recursos/recepidem/epianal9.html. Univer. Catlica de

Chile.
Dr. Jacobo Daz Portillo. Gua Prctica del Curso de bioestadstica Aplicada a las

Ciencias de la Salud. Ed Corpus. Madrid


Guillermo Restrepo Ch., Juan Carlos Gonzlez Q. Texto Bsico de Biometra.
Colombia. 2010

Escuela Superior Politcnica del Litoral

25

Ruth Henquin. Epidemiologia y estadstica para principiantes. 1 ed. Buenos Aires.

Corpus Libros Mdicos, 2013.


Escrig Sos J et al. Intervalos de confianza: por qu usarlos. Cir Esp.

2007;81(3):121-5.
Lind Douglas A, Wathen Samuel A. Estadistica aplicada a los negocios y la

economa. Mexico: Mc Graw Hill; 2012


Wiley Jhon. Bioestadstica base para el anlisis de las ciencias de salud. Mexico:

LIMUSA; 1991
Wikihow. Como calcular el interval de confianza. [En lnea] [fecha de acceso 18 de
junio de 2015] URL disponible en: http://es.wikihow.com/calcular-el-intervalo-deconfianza

5. ANEXOS
4.1.

Distribucin z

Escuela Superior Politcnica del Litoral

26

4.2.

Distribucin t de Student

Escuela Superior Politcnica del Litoral

27

Escuela Superior Politcnica del Litoral

28