Está en la página 1de 15

Estadística

Intervalos de confianza

Unidad Intervalos de confianza

Autores Walter Velárdez

Agustina Padovani Santiago Kawanishi


Revisores
Federico Cribioli Lucía Martinez Chamorro
Estadística Intervalos de confianza Pág. 01

Los derechos de autor de esta obra, que pertenecen al autor,


están protegidos por la ley 11.723 y se prohíbe la reproducción
total o parcial de esta obra, sea cual fuere el medio, electrónico
o mecánico, sin el consentimiento por escrito del editor.
01. Tipos de estimaciones 02

D. R. © 2023 02. La lógica e interpretación de los intervalos de confianza 04


Derecho sobre ilustraciones:
Ilustraciones en base al trabajo del artista Manuel Paz 03. Intervalos de confianza para la media poblacional 06
https://www.manuelpaz.com.ar/

04. Intervalos de confianza para la proporción poblacional 09

05. Intervalos de confianza para la varianza poblacional 10

Esta obra está bajo una Licencia Creative Commons


Atribución-NoComercial-CompartirIgual 4.0 Internacional 06. Algunos aspectos de los intervalos de confianza 11
Estadística Intervalos de confianza Pág. 02

01. Tipos de
Tras esta primera aproximación, ahora sí podemos avanzar de una manera un
poco más técnica. Cuando hablamos de estimar puntualmente lo que estamos diciendo es
que vamos a determinar el valor de aquellas medidas que resumen información obtenidas

estimaciones desde la muestra, es decir, vamos a conocer el valor que asumen los estimadores (media
muestral, desvío muestral, proporción muestral).

Supongamos que estamos trabajando con la población cantidad de materias


En este nuevo capítulo continuaremos trabajando con la premisa de que ante la aprobadas, y que a partir de una muestra de tamaño cuatro (n = 4), se busca conocer la
imposibilidad de realizar censos, la mejor alternativa que tenemos es la de tomar cantidad media muestral de materias aprobadas, su variabilidad absoluta y la proporción
muestras. de personas que aprobaron cuatro materias.

Ahora bien, debemos tener presente que cuando queramos dar información
desde lo recabado en una muestra, podremos hacerlo de dos maneras: brindando una 2
estimación puntual o presentando una estimación por intervalo. X̅ = 3,00 materias Estimador media muestral
3
Para aproximarnos a estas nociones, te invito a que pienses cuánto mide, en S = 0,81 materias Estimador desvío muestral
metros, el obelisco de la Ciudad Autónoma de Buenos Aires. Tomate tu tiempo, ya que la
4
respuesta que pienses puede ayudarnos a comprender los tipos de estimaciones. p = 0,25
X̅ Estimador proporción muestral
3
¿Listo? Bueno, en general, en relación a la pregunta del obelisco, suelen haber
tres respuestas posibles:
75 mts Los valores [3,00; 0,81; 0,25] que se calcularon a partir de la muestra,
corresponden al valor de los estimadores media muestral, desvío muestral y proporción
70 mts muestral. Por lo que estos tres valores son estimaciones puntuales.

65 mts
Lo ideal para este último ejemplo sería que se pudiera censar a todas las unidades
de análisis que componen el universo para conocer con certeza cuánto valen el promedio
de materias aprobadas y su desvío, así como también conocer la proporción poblacional
de de personas que aprobaron cuatro materias. Pero como no podríamos hacerlo (muy
“No se” “Quizás unos 70 metros” “Entre 65 y 75 metros”
posiblemente por una cuestión de costos), lo mejor que podemos hacer es estimar
cuánto valdrían.
Sinceramente, la medida exacta del obelisco (67,5 metros) no es relevante, así
como tampoco la primera respuesta. Si será de nuestro interés la segunda y tercera
respuesta, pero, ¿por qué? Ahora bien, cuando nos referimos a la estimación por intervalo, lo que haremos
es calcular los valores correspondientes a un límite inferior y un límite superior, que
La segunda corresponde a la idea de lo que es una estimación puntual, ya que podrían cubrir el verdadero valor del parámetro.
se estaría dando un único valor como respuesta.
Límite inferior ≤ θ ≤ Límite superior
En cambio la tercera respuesta, al tener dos valores como límites entre los que
podría estar la altura del obelisco, podríamos pensar cómo es la lógica de las Pero, ¿por qué la definición habla en potencialidad? ¿Por qué menciona que el intervalo
estimaciones por intervalo. podría cubrir el verdadero valor del parámetro?
Estadística Intervalos de confianza Pág. 03

Esto es así porque existe la posibilidad de que ese intervalo que determinemos Se realizó un estudio mediante un cuestionario estructurado, para lactantes que
no cubra al verdadero del parámetro: concurrieron en forma espontánea a hospitales del sector público entre agosto
y septiembre de 2017 (n =15 322). Tamaño de muestra
Al no conocer el valor del
parámetro, en este caso la media La prevalencia de Lactancia Materna Exclusiva (LME) en infantes menores a los
poblacional μ (porque para ello tendríamos 6 meses fue del 53,5% (intervalo de confianza del 95% [IC95%]: 52,7-54,3).
que hacer un censo), vamos a tomar μ=?
muestras que nos permitan construir
Nivel de confianza
intervalos de confianza. Muestra 1
Li Ls
El problema está en que quizás Límite inferior
alguna de esas muestras genere un Muestra 2 Estimación puntual
Li Ls
intervalo que no cubra el verdadero valor (proporción muestral) Límite superior
del parámetro.

Por ello no tendremos certeza que el intervalo que calculemos efectivamente ¿Qué aspectos estadísticos podemos rescatar de este párrafo? Primero, como
contempla al valor del parámetro que estemos estimando, por lo que diremos que esto no se puede censar a todas las personas, se opta por tomar una muestra compuesta por
será probable. 15.322 lactantes.

P( Límite inferior ≤ θ ≤ Límite superior ) = En segundo lugar, se pudo estimar (de manera puntual) que la proporción de
infantes menores a 6 meses que se alimentan de manera exclusiva con lactancia materna
Esa probabilidad, la que el intervalo de confianza contenga al valor del es del 53,5% (p = 0,535).
parámetro es lo que se conoce como nivel de confianza (1 - ε). Es costumbre en el mundo
de la estadística y en diferentes ciencias, que se trabaje con una probabilidad de 0.95 Y por último, se estimó con una confianza del 95% que el intervalo 52,7%-
cuando se realizan este tipo de estimaciones. 54,3% podría contener a la proporción de infantes menores a 6 meses que se alimenta de
manera exclusiva con lactancia materna.
P( Límite inferior ≤ θ ≤ Límite superior ) = 1 - ε
¿Sabemos exactamente cuál es la proporción de infantes que se alimentan de
De todo esto se concluye que: manera exclusiva con lactancia materna? No, pues para eso deberíamos hacer un censo,
pero podemos estimar con una confianza del 95% que el intervalo 52,7% - 54,3% podría
(1 - ε): Nivel de confianza cubrir ese verdadero valor de la proporción.
Siendo la probabilidad de que el intervalo contenga al verdadero valor del
parámetro. Acostumbrándose a usar de confianza el valor 0,95. Este tipo de estimaciones es lo que se conoce como intervalos de confianza. No
tendremos certezas de que el intervalo que justo calculamos cubra al valor del parámetro,
(1 ε -): Nivel de riesgo
pero es lo mejor que podemos hacer. Como dice Walter Sosa Escudero: “estimar es
Siendo la probabilidad de que el intervalo no contenga el valor del parámetro. Al
conocer con cierto margen de error”.
ser el complemento del de la confianza, se acostumbra a que su valor sea 0,05.

Hasta acá vimos unos primeros aspectos teóricos de los intervalos de confianza. En lo que sigue veremos la lógica tras ellos, como se calculan, y en detalle cómo
Pero, para comenzar a darle un poco más de sentido a este método de estimación, vamos se interpretan.
a ver un ejemplo real extraído del artículo Prevalencia de lactancia materna en el sector
público de salud de Argentina, según la Encuesta Nacional de Lactancia Materna, 2017
(Mangialavoria Guadalupe, et al):
Estadística Intervalos de confianza Pág. 04

02. La lógica e interpretación


En definitiva, podemos decir que:

de los intervalos de confianza


Antes de irnos de lleno con el cálculo de los intervalos de confianza,
μ μ
corresponde que nos detengamos en la interpretación que surge de estos. Pero, ¿por
qué? Porque en general se hacen malas interpretaciones y porque al comprender su
lógica podremos conocer un poco mejor los alcances y limitaciones de este método de
estimación. Li Ls Li Ls
No se trata de que el verdadero valor Sino que los límites estimados pueden
Vamos con un ejemplo para abordar esta sección. Supongamos que tomamos pueda estar entre los límites estimados, (o no) cubrir al valor del parámetro.
una muestra de 20 clientes y estimamos el monto medio de deuda el cuál resulta de
US$2.907,8 IC 95%: [US$2.645,3; US$3.170,3].
Entonces no es el parámetro el que podría estar dentro de los límites, sino que
Ahora bien, como se adelantó en el párrafo anterior, en general se suelen la estimación por intervalos busca determinar los límites que pudieran cubrir al
interpretar de dos maneras los intervalos de confianza: correcta o incorrectamente. Pero verdadero valor del parámetro.
ojo, no significa que sean las únicas maneras, sino las que más escuchamos se pueden
resumir de la siguiente manera: ¿Pero a qué se debe esta
diferencia? ¿O por qué es tan
importante? Resulta que por lo que
vimos en la unidad anterior, dada una
4 6 11
determinada población, el valor que
μ=7
asume un parámetro es único. Si
μ=7 μ=7
distintas personas realizan el censo
sobre la misma población obtendrían el
“Se estima con una confianza del “Se estima con una confianza del mismo valor del parámetro.
95% que el monto medio de deuda 95% que el intervalo US$2.645,3 y
estaría entre los US$2.645,3 y los los US$3.170,3 cubriría valor del Pero cuando hablamos de
US$3.170,3” monto medio de deuda” estimaciones, la cosa es diferente
porque cada persona podría tomar
Parece que dicen lo mismo, ¿no? Y si bien tienen los mismos valores, hablan del distintos valores dentro de su muestra,
mismo parámetro (media poblacional, μ), de la misma población (el monto de deuda), por lo que las estimaciones de cada
estas interpretaciones son completamente distintas. Incluso, una de ellas está mal. persona serían aleatorias:

La primera interpretación es incorrecta porque supone que el parámetro (la Muestra 1 Muestra 2 Muestra 3
media poblacional) es quien puede estar dentro de los límites del intervalo de confianza,
4 6 4 11 6 11
cuando en realidad son los límites son los que podrían (o no) cubrir al verdadero valor del
X̅1 = 5 X̅2 = 7,5 X̅3 = 8,5
parámetro.
Estadística Intervalos de confianza Pág. 05

A partir de esto surge otra interpretación correcta respecto a los intervalos de En resumen, cuando se trata de interpretar intervalos de confianza podemos
confianza: considerando un nivel de confianza del 95%, si estimará 100 intervalos de identificar las siguientes maneras correctas e incorrectas de hacerlo:
confianza, 95 de ellos podrían cubrir al verdadero valor del parámetro. Esto es así porque
el nivel de confianza sería el porcentaje de veces que se espera que el intervalo de Interpretaciones correctas de los intervalos de confianza
confianza incluya al verdadero valor del parámetro de la población en un gran número de • Hay una confianza del 95% de que el intervalo contiene el valor del parámetro.
repeticiones del experimento. • De cada 100 intervalos estimados, 95 contendrán el verdadero valor del parámetro.

Interpretaciones incorrectas de los intervalos de confianza


No sabemos cuanto vale • Hay un 95% de confianza de que el parámetro esté entre los límites del intervalo.
• Un 95% de los datos están incluidos en el intervalo de confianza.
• Hay 95% de probabilidad de que el intervalo de confianza incluye al estimador.

μ=?

Muestra 01 Ahora sí, habiendo visto las principales cuestiones teóricas de los intervalos de
Muestra 02 Si calculamos 20 confianza, pasaremos a trabajar en la manera en que se calculan los intervalos de
Muestra 03 muestras distintas
, el confianza para la media, el desvío estándar y la proporción.
95% de los interv
Muestra 04 alos
generados
Muestra 05 (19 intervalos) cu
brirán
Muestra 06 el verdadero valor
del
Muestra 07 parámetro.

Muestra 08
Muestra 09
Muestra 10
Muestra 11
Muestra 12
Muestra 13
e al
Muestra 14 El problema es qu
lcu lar un intervalo de
Muestra 15 ca
remos
confianza, no sab
Muestra 16 al
si es el que cubre
Muestra 17 parám etro, pe ro
% de
Muestra 18 tendremos un 95
an ces de que sí.
Muestra 19 ch

Muestra 20

Cuando calculamos intervalos de confianza no sabemos si efectivamente ese


que determinamos cubre al parámetro que estamos estimando. Pero en palabras de
Behar (2007): “la verdad es que jamás se sabrá si el intervalo establecido contiene al
parámetro no; no obstante, por las credenciales del procedimiento, si toca decidir, yo
puedo actuar como si el intervalo particular hubiera atrapado al verdadero parámetro, con
el riesgo asociado al procedimiento generador”.
Estadística Intervalos de confianza Pág. 06

03. Intervalos de confianza


Algunos detalles a tener en cuenta:

• Si mirás con atención, los tres intervalos tienen la misma estructura:

para la media poblacional Estimación Factor de Desvío del Estimación Factor de Desvío del
P - confianza • estimador ≤ θ ≤ =1-ε
puntual puntual + confianza • estimador

Un aspecto clave para la construcción de intervalos de confianza para la media


tiene que ver con la distribución que tiene su estimador: la media muestral (X̅).
σ σ
P X̅ - z(1-ε/2) . ≤ μ ≤ X̅ + z(1-ε/2) . =1-ε
Recordemos por lo que vimos en la unidad pasada: la media muestral puede n n
tener distintas distribuciones, dependiendo de las características que tenga el
experimento asociado a la muestra que se toma. A la estimación puntual (X̅), se le resta para el límite inferior y se le suma para el
límite superior, la multiplicación entre el factor de confianza y el desvío del estimador
(dependiendo de los datos que tengamos, este puede ser σ/√n o S/√n.
01. Distribución 02. Distribución 03. Distribución
Normal T de Student aproximadamente normal

Cuando la población tiene Cuando la población tiene Cuando la población no • El (z(1-ε/2)) y el (t(1-ε/2)) es lo que se conoce como factor de confianza, y es el percentil
distribución normal y se distribución normal y sólo tiene distribución normal, que se obtiene de buscar el valor (1 - ε/2) en la distribución correspondiente en el
sabe el valor del desvío se sabe el valor del desvío pero la muestra es superior Probability Distribution.
poblacional (σ). muestral (S). a 30 (n > 30).
X ~ N(μ,σ) X ~ t(v)

Y tenemos esto presente porque dependiendo la distribución del estimador,


será la manera en que construiremos el intervalo de confianza. En efecto, tendremos tres μ= 0 σ= 1 v = GL
maneras distintas de plantear el cálculo del intervalo para la media.
x= P(X<x) = 0.975 x= P(X<x) = 0.975

Factor de confianza Factor de confianza


01. Distribución σ σ
P X̅ - z(1-ε/2) . ≤ μ ≤ X̅ + z(1-ε/2) . =1-ε Si se emplea una confianza del 95% (1 - ε = 0.95) el valor del percentil que se
Normal n n debe buscar es 0,975 (1 - ε/2).

02. Distribución S S 1-ε ε ε/2 1 - ε/2


P X̅ - t(1-ε/2) . ≤ μ ≤ X̅ + t(1-ε/2) . =1-ε
T de Student n n 0.95 0.05 0.025 0.975

03. Distribución Más adelante veremos porqué ocurre esto, por ahora nos concentramos
S S
aproximadamente P X̅ - z(1-ε/2) . ≤ μ ≤ X̅ + z(1-ε/2) . =1-ε únicamente en determinar cómo se calculan los límites. Ahora simplemente vamos a ver
n n cómo se calculan los tres intervalos de confianza que presentamos anteriormente, dando
normal
cuenta que su aplicación dependerá de los datos que brindan los problemas.
Estadística Intervalos de confianza Pág. 07

• Situación 01: Media muestral con distribución normal • Situación 02: Media muestral con distribución T de student

Ejemplo: El tiempo que se demora en completar un proceso productivo se distribuye Ejemplo: El tiempo que se demora en completar un proceso productivo se distribuye
normalmente con un desvío de 1,2 minutos. Se desea estimar el tiempo medio que normalmente. Se desea estimar el tiempo medio que demora el proceso y para ello se
demora el proceso y para ello se toma una muestra de 64 operaciones, obteniéndose un toma una muestra de 64 operaciones, obteniéndose un tiempo medio muestral de 8,1
tiempo medio muestral de 8,1 minutos. Realizar la estimación con una confianza del 95%. minutos con un desvío de 1,5 minutos. Realizar la estimación con una confianza del 95%.

Si leemos con atención el enunciado dice que la población (tiempo que se Nuevamente podemos leer como el enunciado dice que la población (tiempo
demora en completar un proceso) se distribuye normalmente y se conoce el valor del que se demora en completar un proceso) se distribuye normalmente pero en este caso no
desvío poblacional (σ = 1,2), por lo que la media muestral tendrá distribución normal, menciona nada sobre el valor del desvío poblacional (σ = ¿?), pero al tener el dato del
siendo esta distribución la que usaremos para averiguar el valor (1 - ε/2) del factor de desvío muestral (S = 1,5), la media muestral tendrá distribución T de Student con 63
confianza. Así, los datos que tenemos para determinar el intervalo de confianza serían: grados de libertad (n - 1 gl). De esta manera, será la distribución T la que nos permitirá
hallar el valor del (1 - ε/2) del factor de confianza. Así, los datos que tenemos para
Datos determinar el intervalo de confianza serían:
Población (x): Tiempo de demora ; σ = 1,2 ; x ~ No
Variable (X̅): Tiempo medio muestral de demora; X̅ ~ No ; n = 64 ; X̅ = 8,1 Datos
(1 - ε) = 0,95 ⇒ Factor de confianza: z(0.975) = 1,960 Población (x): Tiempo de demora ; σ = ¿? ; x ~ No
Variable (X̅): Tiempo medio muestral de demora; X̅ ~ No ; n = 64 ; X̅ = 8,1 ; S = 1,5
Resolución (1 - ε) = 0,95 ⇒ Factor de confianza: t(0.975) = 1,998

σ σ
P X̅ - z(1-ε/2) . ≤ μ ≤ X̅ + z(1-ε/2) . =1-ε Resolución
X ~ N(μ,σ)
n n
S S
P X̅ - t(1-ε/2) . ≤ μ ≤ X̅ + t(1-ε/2) . =1-ε X ~ t(v)
1,2 1,2 μ= 0 σ= 1 n n
8,1 - 1,96 . ≤ μ ≤ 8,1 +1,96 .
64 64
x = 1.9599 P(X<x) = 0.975 1,5 1,5 v = 63
8,1 - 1,998 . ≤ μ ≤ 8,1 +1,998 .
64 64
8,1 - 0,294 ≤ μ ≤ 8,1 +0,294 x = 1.998 P(X<x) = 0.975

8,1 - 0,37275 ≤ μ ≤ 8,1 +0,37275


7,806 ≤ μ ≤ 8,394

7,7272 ≤ μ ≤ 8,4727
Interpretación
Podemos decir entonces que se estima con una confianza del 95% que el
intervalo 7,806 minutos - 8,394 minutos cubriría el verdadero valor del tiempo medio de Interpretación
demora. Podemos decir entonces que se estima con una confianza del 95% que el
intervalo 7,7272 minutos - 8,4727 minutos cubriría el verdadero valor del tiempo medio de
Es usual que en la literatura estadística, se exprese el resultado de un intervalo demora. Pudiéndose expresar:
de confianza de las siguientes maneras:
[IC95%]: 7,7272 - 8,4727 [IC95%]: 8,1 ± 0,37275
[IC95%]: 7,806 - 8,394 [IC95%]: 8,1 ± 0,294
Estadística Intervalos de confianza Pág. 08

• Situación 03: Media muestral con distribución aproximadamente normal Ahora bien, para finalizar con este apartado debemos develar un concepto muy
importante para las estimaciones. Páginas anteriores mencionamos que “estimar es
Ejemplo: Se desea estimar el tiempo medio que demora en completar un proceso conocer con cierto margen de error”, y ese margen de error (también llamado error de
productivo y para ello se toma una muestra de 64 operaciones, obteniéndose un tiempo muestreo) se puede cuantificar, porque está presente en el intervalo de confianza para la
medio muestral de 8,1 minutos con un desvío de 1,5 minutos. Realizar la estimación con media poblacional.
una confianza del 95%.
Vimos que la estructura general de la estimación por intervalo para el promedio
Si prestamos atención, en ningún momento el enunciado menciona la se puede expresar de la siguiente manera:
distribución de la población, pero como el tamaño de la muestra es superior a 30,
podemos considerar que la media muestral tiende a tener una distribución aproximada a Estimación Factor de Desvío del Estimación Factor de Desvío del
P - confianza • estimador ≤ θ ≤ =1-ε
la normal (gracias a lo expuesto en el Teorema Central del Límite). Entonces, usaremos la puntual puntual + confianza • estimador
distribución normal para averiguar el valor (1 - ε/2) del factor de confianza. Así, los datos
Margen de error
que tenemos para determinar el intervalo de confianza serían:

Resulta que el producto entre el valor del factor de confianza y el desvío del
Datos
estimador, es el margen de error. Ese error de muestreo es la máxima diferencia entre el
Población (x): Tiempo de demora ; σ = ¿? ; x ~ Desconocida
estimador y el parámetro, y se suele usar como vimos anteriormente, para expresar la
Variable (X̅): Tiempo medio muestral de demora; X̅ ~ No ; n = 64 ; X̅ = 8,1; S = 1,5
respuesta de los intervalos de confianza presentando a la estimación puntual, sumando y
(1 - ε) = 0,95 ⇒ Factor de confianza: z(0.975) = 1,960
restando el margen de error:

Resolución
[IC95%]: 7,7325 - 8,4675 [IC95%]: 8,1 ± 0,3675
S S
P X̅ - z(1-ε/2) . ≤ μ ≤ X̅ + z(1-ε/2) . =1-ε X ~ N(μ,σ) Margen de error
n n

Este concepto del margen de error está también presente en el intervalo de


1,5 1,5 μ= 0 σ= 1 confianza para la proporción que veremos a continuación.
8,1 - 1,96 . ≤ μ ≤ 8,1 +1,96 .
64 64
x = 1.9599 P(X<x) = 0.975

8,1 - 0,3675 ≤ μ ≤ 8,1 +0,3675

7,7325 ≤ μ ≤ 8,4675

Interpretación
Podemos decir entonces que se estima con una confianza del 95% que el
intervalo 7,7325 minutos - 8,4675 minutos cubriría el verdadero valor del tiempo medio de
demora. Pudiéndose expresar los resultados de la siguiente manera:

[IC95%]: 7,7325 - 8,4675 [IC95%]: 8,1 ± 0,3675


Estadística Intervalos de confianza Pág. 09

04. Intervalos de confianza


Resolución

p . (1 - p) p . (1 - p)
P p - z(1-ε/2) . ≤ π ≤ p + z(1-ε/2) . =1-ε
para la proporción poblacional n n

0,20 . (1 - 0,20) 0,20 . (1 - 0,20)


En el caso del intervalo de confianza para la proporción, la situación es menos 0,20 - 1,96 . ≤ π ≤ 0,20 + 1,96 .
compleja porque consideraremos que su estimador (p) tendrá distribución normal. Por lo 200 200
que estaremos trabajando con un único caso, en dónde la expresión del intervalo de
confianza será:
0,20 - 0,055 ≤ π ≤ 0,20 + 0,055
p . (1 - p) p . (1 - p)
P p - z(1-ε/2) . ≤ π ≤ p + z(1-ε/2) . =1-ε
n n 0,1446 ≤π≤ 0,2554

Como podemos ver, también se puede identificar el margen de error (o error de


muestreo) en este intervalo.
Interpretación
Podemos decir entonces que se estima con una confianza del 95% que el
p . (1 - p) p . (1 - p) intervalo 14,46% - 25,54% cubriría el verdadero valor de la proporción de personas que
P p - z(1-ε/2) . ≤ π ≤ p + z(1-ε/2) . =1-ε
n n conocen su función, rol y descripción de puestos. Pudiéndose expresar:

Margen de error [IC95%]: 14,46% - 25,54% [IC95%]: 20% ± 0,055%

Ejemplo: Una consultora especialista en procesos fue contratada por una empresa de
medicina prepaga que cuenta aproximadamente con 4.500 empleados en todo el país. En
la fase de diagnóstico de la organización, desean estimar la proporción de personas que
no conocen los roles, funciones y descripción del puesto que desempeñan. Para eso
tomaron una muestra de 200 personas, determinando que tan solo 40 saben cuál es su
rol, función y la descripción del puesto. Realizar la estimación con una confianza del 95%.

Datos
Variable (p): Proporción muestral de personas
X ~ N(μ,σ)
que conocen rol, funciones y descripción.
p ~ No ; n = 200 ; r = 40 ; p = 0,20
(1 - ε) = 0,95 ⇒ μ= 0 σ= 1
Factor de confianza: z(0.975) = 1,960
x = 1.9599 P(X<x) = 0.975

Factor de confianza
Estadística Intervalos de confianza Pág. 10

05. Intervalos de confianza


Datos
Población (x): Tiempo de demora; x ~ No X ~ Chisq(v)
Variable (S): Desvío del tiempo de demora;

para la varianza poblacional S2 ~ χ2; n = 64 ; X̅ = 8,1; S = 1,2


GL = 63 (n - 1); (1 - ε) = 0,95 v = 63
a: χ2(0.975) = 86,82 y b: χ2(0.025) = 42,95
x = 42,95 P(X<x) = 0.025
Y finalmente vamos a ver los últimos intervalos de confianza, los que Resolución
corresponden a las medidas de variabilidad: varianza y desvío estándar.
S2 . (n - 1) S2 . (n - 1)
P ≤ σ2 ≤ =1-ε X ~ Chisq(v)
En este caso la estimación por intervalo para la varianza sería:
b a

S2 . (n - 1) S2 . (n - 1) v = 63
P ≤ σ2 ≤ =1-ε
1,22 . (64-1) 1,22 . (64-1)
b a ≤ σ2 ≤ x = 86,82 P(X<x) = 0.975
86,82 42,95

Siendo a el percentil (1 - ε/2) de la Mientras que b es el percentil (ε/2) de la


distribución Ji cuadrado, misma distribución.
1,0449 ≤ σ2 ≤ 2,1122
Aplicar raíz cuadrada para obtener el
X ~ Chisq(v) X ~ Chisq(v) intervalo del desvío estándar
1,0222 ≤σ≤ 1,4533
v = GL v = GL

x= a P(X<x) = 0.975 x= b P(X<x) = 0.025


Interpretación
Podemos decir entonces que se estima con una confianza del 95% que el
Ahora bien, un detalle interesante a recordar: la varianza no tiene interpretación. intervalo 1,0222 minutos - 1,4533 minutos cubriría el verdadero valor de la desviación
Por ello en general nos acostumbramos a utilizar el desvío estándar para resumir estándar del tiempo de demora. Pudiéndose expresar:
información. Es así que si necesitamos el intervalo de confianza para el desvío, vamos a
aplicar raíz cuadrada a los límites del intervalo para la varianza. [IC95%]: 1,0222 - 1,4533

Nótese que para obtener estos intervalos de confianza no se suma ni se resta el


S2 . (n - 1) S2 . (n - 1) valor de un error de muestreo, las razones de porqué esto ocurre lo veremos en el
P ≤σ≤ =1-ε
siguiente apartado dónde trabajaremos con aspectos a tener en cuenta de los intervalos
b a
de confianza.

Ejemplo: Se sabe que el tiempo que se demora en completar un proceso productivo se


distribuye normalmente. Y se desea estimar la desviación del tiempo que demora el
proceso y para ello se toma una muestra de 64 operaciones, obteniéndose un tiempo
medio muestral de 8,1 minutos con un desvío de 1,2 minutos. Realizar la estimación con
una confianza del 95%.
Estadística Intervalos de confianza Pág. 11

06. Algunos aspectos


Lo mismo ocurre con la proporción
muestral (p) que consideramos que se
distribuye normalmente. Por ello es posible

de los intervalos de confianza sumar y restar un mismo valor de margen de


error (±e) al valor de la estimación puntual
para obtener los límites de la estimación por -e +e

intervalo. Li Ls
En este anteúltimo apartado vamos a ver algunos aspectos fundamentales de
los intervalos de confianza los cuales decidimos no profundizar previamente para no Esto no se replica en la varianza cuya distribución Chi Cuadrado es una
quitar el foco de la metodología de cálculo. Habiendo visto cómo es que se realizan distribución asimétrica, por ello no se puede sumar ni restar el error de muestreo.
estimaciones por intervalos, es que podemos adentrarnos en la letra chica de estos:

El intervalo para la media y la proporción son intervalos aditivos, mientras que el S2 . (n - 1) S2 . (n - 1)


P ≤ σ2 ≤ =1-ε
intervalo para la varianza o el desvío estándar es un intervalo no aditivo.
b a

Como sabemos, el concepto de aditivo tiene que ver con añadir, sumar, agregar.
En el caso de los intervalos para la media y la proporción, decimos que son aditivos
porque se suman (y restan) el valor del margen de error (o error de muestreo) a la El error de muestreo tiene una relación inversa con el tamaño de muestra.
estimación puntual para obtener la estimación por intervalo.
Si tomamos los intervalos de confianza de la media (elegimos arbitrariamente el
que emplea la distribución normal, podría ser igual de válido observar el que emplea la
Estimación Factor de Desvío del Estimación Factor de Desvío del
P - confianza • estimador ≤ θ ≤ =1-ε
puntual puntual + confianza • estimador distribución T de Student) y el intervalo para la proporción, podríamos ver que el margen
de error sería:
Margen de error Margen de error
σ p . (1 - p)
Siendo en definitiva: P X̅ ± z(1-ε/2) . =1-ε P p ± z(1-ε/2) . =1-ε
n n
P(X̅ - e ≤ µ ≤ X̅ + e) = 1 - ε P(p - e ≤ π ≤ p + e) = 1 - ε
Margen de error Margen de error

En el caso del intervalo de la varianza, como no hay error de muestreo que se


sume o reste, se considera al mismo como no aditivo.
En ambos, el tamaño de muestra se encuentra en el denominador dando cuenta
de la relación inversa que existe entre estos dos componentes. Y si lo pensamos
intuitivamente, esto tiene sentido, porque si el tamaño de muestra (n) se incrementa, éste
comienza a acercarse al tamaño del universo (N) haciendo que el margen de error sea
Los intervalos de confianza aditivos trabajan con estimadores cuyas distribuciones
cada vez menor.
de probabilidad son simétricas, mientras que los no aditivos emplean distribuciones
asimétricas. ↑ e = z(1-ε/2) . σ ↑ e = z(1-ε/2) .
p . (1 - p)
n

↑ n
Como vimos en la unidad anterior de Introducción al muestreo, la media muestral
(X̅) puede tener distribución normal, T de Student o una distribución aproximadamente
A menor tamaño de muestra mayor error de muestreo. A mayor tamaño de
normal. Cual fuera el caso, todas ellas se caracterizan por ser simétricas respecto a la
muestra menor error de muestreo.
esperanza matemática.
Estadística Intervalos de confianza Pág. 12

Entenderemos que si tomamos una muestra tan grande como el mismo Para comprenderlo hay que ver cómo es que se
universo, dejaríamos de inferir y estaríamos trabajando con un censo eliminando así todo representa gráficamente el nivel de confianza. La parte 1-ε
margen de error. Por ello, es que inevitablemente si queremos un menor margen de error que no está coloreada representa el complemento del nivel 0,95
en nuestras estimaciones, vamos a tener que incrementar el tamaño de muestra. de confianza: el nivel de riesgo, el cuál para este ejemplo
es del 5%.

El error de muestreo tiene una relación directa con el nivel de confianza. Cómo podemos identificar, el nivel de riesgo se encuentra dividido en dos
partes, ambas de un mismo tamaño (ε/2 = 0,025).
Si miramos las fórmulas del error de muestreo para la estimación de la media y
la proporción, notaremos que el factor de confianza (quien vincula al error con el nivel de
confianza) se encuentra en el numerador de la fórmula, dando cuenta de su relación ε/2 = 0,025 1-ε ε/2 = 0,025
directa. 0,95

Pero podemos hacer todavía más visual la explicación, supongamos que Ahora bien, ¿de dónde sale el (1 - ε/2)? Si miramos con atención el gráfico
tenemos la posibilidad de realizar estimaciones con tres niveles de confianza distintos: tenemos dos puntos en dónde se pasa del nivel de riesgo al nivel de confianza:
90% - 95% - 99%

90% de confianza 95% de confianza 99% de confianza 1-ε


ε/2 = 0,025 ε/2 = 0,025
0,95
-1,960 1,960
-e +e -e +e -e +e ε/2 = 0,025
Li Ls Li Ls Li Ls 1 - ε/2 = 0,975

e = 1,645 . σ e = 1,960 . σ e = 2,576 . σ


Cada uno de esos puntos acumula un determinado porcentaje de la distribución,
n n n en el caso del primero acumula un (ε/2)%, mientras que para el segundo se acumula un
Nota: los valores del factor de confianza surgen de la distribución normal sólo para simplificar el (1 - ε/2)%. Si buscáramos esos percentiles en alguna de las distribuciones simétricas que
ejemplo venimos trabajando (normal o t), nos encontraríamos que ambos puntos tienen el mismo
valor solo que uno positivo y otro negativo.
A medida que el nivel de confianza se incrementa (es decir que el nivel de riesgo
disminuye), vemos como los límites se alejan más entre sí. Esto se debe a que el error de Para nuestro trabajo, decidimos emplear el positivo que surge del valor (1 - ε/2).
muestreo se va incrementando. Es decir que mientras más alto sea el nivel de confianza, Pero, ¿por qué? Porque si usaramos el percentil cuyo resultado es negativo tendríamos la
mayor valor tendrá el factor de confianza (el percentil 1 - ε/2), por lo que el error de respuesta de los límites al revés por la operatoria de los signos:
muestreo se incrementará, y la amplitud del intervalo (A = Ls - Li) se agrandará.
Al usar el percentil
σ σ
(ε/2) terminariamos sumando P X̅ - (-1,960). ≤ μ ≤ X̅ + (-1,960). =1-ε
El factor de confianza es el percentil de orden (1 - ε/2). en el límite inferior el error de n n
muestreo, y restando en el
Hasta el momento siempre dijimos que para los intervalos aditivos (μ; π) el límite superior el mismo error σ σ
factor de confianza se buscaría en el valor (1 - ε/2) de la distribución correspondiente al P X̅ + 1,960 . ≤μ≤ X̅ - 1,960 . =1-ε
de muestreo, lo que sería n n
estimador pero, ¿por qué se asume ese valor? metodológicamente incorrecto.
Estadística Intervalos de confianza Pág. 13

Ahora bien, ¿qué representa el factor de confianza? Si miramos la fórmula del Límite superior - Límite inferior
Margen de error =
intervalo para la media con distribución normal (podríamos haber elegido cualquiera de 2
los intervalos aditivos), veremos que el factor de confianza nos viene a decir cuántos
desvíos del estimador se suman y restan a la estimación puntual para obtener la
estimación por intervalo.
8,4675 - 7,7325
Margen de error = = 0,3675
Usando una confianza del 95%, se 2
σ σ restará y sumará 1,960 desvíos del
P X̅ - 1,960. ≤ μ ≤ X̅ + 1,960. =1-ε
n n estimador (σ / √n) a la estimación
puntual para obtener los límites del
intervalo.

La semidiferencia de los límites da como resultado el error de muestreo.

Muchas veces nos encontraremos en la situación de no ser los responsables de


calcular intervalos de confianza, sino de usarlos para la toma de decisiones. Es así que
será importante para nuestro trabajo conocer cuál es el margen de error que poseen esas
estimaciones que otra persona calculó.

Por ello, si restamos el valor del límite inferior al valor del límite superior, y luego
lo dividimos por dos, obtendremos cuánto vale el margen de error de dicha estimación:

Límite superior - Límite inferior


Margen de error =
2

Obviamente, esto solamente es útil para los intervalos de confianza aditivos, ya


que son los únicos que poseen margen de error en sus cálculos.

• Ejemplo

Tomando uno de los ejemplos previos para calcular la media, podemos ver cómo se
cumple este cálculo:

1,5 1,5
8,1 - 1,96 . ≤ μ ≤ 8,1 +1,96 .
64 64

8,1 - 0,3675 ≤ μ ≤ 8,1 +0,3675


Margen de error

7,7325 ≤ μ ≤ 8,4675
Estadística Intervalos de confianza Pág. 13

Referencias bibliográficas Sobre la autoría del material

Bacchini, R and Vázquez, L. (2007). “Estadística. Probabilidad e Inferencia” Omicron Es licenciado en Administración y Especialista en Docencia
Editorial. Universitaria por la Universidad de Buenos Aires. Profesor en el
área Estadística desde el 2008 y Coach Ejecutivo certificado
Behar, R. (2007). ¿Estamos buscando el ahogado aguas arriba? El caso de la estimación internacionalmente por la ICF abocado al trabajo en
con intervalos de confianza. Primer Encuentro Nacional de Educación Estadística organizaciones en materia de Cambio Cultural, Habilidades de
(ENAES), Bogotá. Walter liderazgo, entrenamiento en Pensamiento Analítico y
Velárdez Storytelling con Datos.
Behar, R. (2001). Aportaciones para la mejora del proceso de enseñanza aprendizaje de la
estadística. Tesis doctoral no publicada. Universidad Politécnica de Catalunya. Barcelona,
España.

Capriglioni, C. (2003). “Estadística. Tomo I” 3C Editores.

Cobb, G. and Moore, D. (2000). “Statistics and Mathematics: Tension and Cooperation,”
American Mathematical Monthly.

Franklin, C. et al. (2005). “Guidelines for Assessment and Instruction in Statistics


Education (GAISE) Report” American Statistical Association.

Franklin, C. et al. (2014). “Statistical Education of Teachers (SET)” American Statistical


Association.

Yánez, G; Behar, R (2009) Interpretaciones erradas del nivel de confianza en los intervalos
de confianza y algunas explicaciones plausibles. En M. J. González; M. T. González y J.
Murillo (Eds.), Investigación en Educación Matemática. Comunicaciones de los grupos de
investigación. XIII Simposio de la SEIEM. Santander.

Derecho sobre las imágenes

Imágenes extraídas de www.storyset.com, Copyright ©2022 Freepik Company S.L.


Todos los derechos reservados.

Esta obra está bajo una Licencia Creative Commons


Atribución-NoComercial-CompartirIgual 4.0 Internacional

También podría gustarte