Está en la página 1de 8

INFERENCIA ESTADÍSTICA: INTERVALOS DE CONFIANZA (Statgraphics y Ejercicios)

JULIA SANTAMARINA PUERTAS

PRÁCTICA INFERENCIA ESTADÍSTICA:


INTERVALOS DE CONFIANZA
Contenido:

1. Estimación: Intervalo de confianza en una población normal

1
INFERENCIA ESTADÍSTICA: INTERVALOS DE CONFIANZA (Statgraphics y Ejercicios)

1. Estimación: Intervalo de confianza en 1 población normal

El intervalo de confianza es un procedimiento para añadir la información de la incertidumbre que


tenemos sobre la estimación realizada con una muestra.

¿Cómo variaría la media muestral X si tomáramos muchas muestras de esta misma población?

El propósito de un intervalo de confianza es estimar un parámetro desconocido con indicación de


la precisión de la estimación y del grado de confianza que tenemos en la estimación. Cuando
calculamos un intervalo de confianza damos dos informaciones:

1. Un intervalo de valores, calculado a partir de los datos


2. Una probabilidad o nivel de confianza de que en un muestreo repetido, el intervalo
contenga el verdadero valor del parámetro.

α = NIVEL DE SIGNIFICACIÓN. Normalmente 0.05 (5%). En ocasiones 0.01 (1%).

100(1-α)% = NIVEL DE CONFIANZA. Normalmente 95%. En ocasiones 99%. Es la probabilidad que


existe (antes de tomar la muestra) de que el intervalo a construir a partir de la muestra incluya el
verdadero valor del parámetro a estimar. Refleja la "confianza" en la "construcción" del intervalo
y de que éste tras concretar la muestra contendrá el valor a estimar. De ahí que en términos
numéricos dicho nivel o probabilidad haya de tomar un valor alto (0.9, 0.95, 0.99).

25 intervalos de confianza obtenidos a partir de


25 muestras

2
INFERENCIA ESTADÍSTICA: INTERVALOS DE CONFIANZA (Statgraphics y Ejercicios)

Si tomamos infinitas muestras, y con cada muestra calculamos un intervalo de confianza,


entonces, el 100(1-α)% de esos intervalos tendrían el verdadero valor del parámetro poblacional

Sin embargo, en la práctica,


 Solo una muestra
 Solo un intervalo de confianza
 El intervalo de confianza SÍ o NO contendrá el verdadero valor del parámetro poblacional
 A la incertidumbre de si lo contendrá le llamaremos CONFIANZA

Cálculo de intervalos de confianza en poblaciones normales:


INTERVALO DE CONFIANZA PARA μ CON σ CONOCIDA PARA UN Nivel de Confianza (1-𝛂):
2

X−μ
X N μ,
( σ
√n ) → σ
√n
N ( 0,1 )

IC μ ¿ (estimación ± error_estimación)
¿
z α (o z ) = valor crítico de una distribución N(0,1) que deja
2
α⁄2 de probabilidad a la derecha (tener en cuenta la simetría
de la Normal)

Conforme aumenta el Nivel de Confianza ( disminuye el Nivel de Significación)


el intervalo es más amplio

El error de estimación se hace menor cuando:

1.  se hace menor. La desviación típica  mide la variación de la población. Podemos


pensar en ella como en un ruido que oculta el valor medio . Es más fácil estimar 
con precisión cuando  es pequeña.
2. n se hace mayor. Un incremento del tamaño de la muestra reduce el error de
estimación para un nivel de confianza determinado. Debido a que n está dentro de la
raíz cuadrada, tenemos que multiplicar por cuatro el tamaño de la muestra para
reducir a la mitad el error de estimación.
3
INFERENCIA ESTADÍSTICA: INTERVALOS DE CONFIANZA (Statgraphics y Ejercicios)

3. z* se hace menor. Un valor crítico z* menor es lo mismo que un nivel de confianza


menor. Existe una relación entre el nivel de confianza y el error de estimación. Con
unos mismos datos, para tener un error de estimación menor, tenemos que aceptar
una confianza menor. Si se reduce el Nivel de Confianza, también se reduce el error
de estimación (al reducir z*)

Para conseguir a la vez un nivel de confianza elevado y un error de estimación pequeño,


se deben tener suficientes observaciones.

INTERVALO DE CONFIANZA PARA μ CON σ DESCONOCIDA PARA UN Nivel de Confianza (1-𝛂):


2

IC μ ¿ (estimación ± error_estimación)
α
2 = valor crítico de una distribución t de Student con n-1
t n−1
grados de libertad que deja α⁄2 de probabilidad a la
derecha.

INTERVALO DE CONFIANZA PARA σ 2Y σ PARA UN Nivel de Confianza (1-𝛂):


Asumiendo la normalidad de los datos:
IC σ ¿
2

IC σ ¿

α
g 1/P ( χ 2n−1> g 1 ) =1−
2
α
g 2/ P ( χ n−1 > g 2) =
2
2

4
INFERENCIA ESTADÍSTICA: INTERVALOS DE CONFIANZA (Statgraphics y Ejercicios)

Ejercicio 1: (Statgraphics)
 OBTENCIÓN DE INTERVALOS DE CONFIANZA PARTIENDO DE OBSERVACIONES

De un lote grande de barras de acero para las armaduras del hormigón armado se ha procedido a
extraer una muestra aleatoria de 100 barras. Las barras fueron sometidas a carga de tracción
hasta su rotura y los resultados obtenidos han sido almacenados en la variable Cargas2 del
fichero MUESTREO.sf6.

a) Representar los datos sobre papel probabilístico normal ¿Es adecuado el modelo normal
para describir la distribución de la variable Cargas2? ¿Por qué?

Statgraphics: Desplegar el menú Describir, el submenú Datos Numéricos y elegir la opción


Análisis de una variable. Activar en la barra de herramientas del Statfolio la opción gráfica
Gráfico de Probabilidad normal. (También se podría haber utilizado el comando Describir/
Ajuste de Distribuciones/Gráficos de Probabilidad y seleccionar Gráfico de Probabilidad
Normal)

Gráfico de Probabilidad Normal

99,9
n:100
99 Media:4005,99
Sigma:67,3073
95
W:0,993165
P:0,8978
80
porcentaje

50

20

5
1

0,1
3800 3900 4000 4100 4200
Cargas2

El modelo normal si es adecuado para describir la distribución de la variable Cargas2

5
INFERENCIA ESTADÍSTICA: INTERVALOS DE CONFIANZA (Statgraphics y Ejercicios)

b) Obtener mediante estadísticos una estimación puntual de los parámetros del modelo
normal para la variable Cargas2. ¿Cuál es el valor de la media muestral? ¿y el de la cuasi-
varianza?

Statgraphics: Activar en la barra de herramientas del Statfolio la opción de Tablas: Resumen


Estadístico
Resumen Estadístico para Cargas2
Recuento 100
Promedio 4005,99
Desviación Estándar 67,3073
Coeficiente de Variación 1,68017%
Mínimo 3857,55
Máximo 4174,64
Rango 317,09
Sesgo Estandarizado 0,406537
Curtosis Estandarizada -0,70314

El StatAdvisor
Esta tabla muestra los estadísticos de resumen para Cargas2. Incluye medidas de tendencia central,
medidas de variabilidad y medidas de forma. De particular interés aquí son el sesgo estandarizado y la
curtosis estandarizada, las cuales pueden utilizarse para determinar si la muestra proviene de una
distribución normal. Valores de estos estadísticos fuera del rango de -2 a +2 indican desviaciones
significativas de la normalidad, lo que tendería a invalidar cualquier prueba estadística con referencia a la
desviación estándar. En este caso, el valor del sesgo estandarizado se encuentra dentro del rango
esperado para datos provenientes una distribución normal. El valor de curtosis estandarizada se encuentra
dentro del rango esperado para datos provenientes de una distribución normal.

c) Calcular un intervalo de confianza al 95% para cada uno de los parámetros del modelo
normal ¿Qué propiedad tienen estos intervalos?

Statgraphics: Activar en la barra de herramientas del Statfolio la opción de Tablas y


Gráficos y marcar Intervalos de confianza.
Intervalos de Confianza para Cargas2
Intervalos de confianza del 95,0% para la media: 4005,99 +/- 13,3553 [3992,63; 4019,34]
Intervalos de confianza del 95,0% para la desviación estándar: [59,0963; 78,1892]

El StatAdvisor
Este panel muestra los intervalos de confianza del 95,0% para la media y la desviación estándar de
Cargas2. La interpretación clásica de estos intervalos es que, en muestreos repetidos, estos intervalos
contendrán la media verdadera ó la desviación estándar verdadera de la población de la que fueron
extraídas las muestras, el 95,0% de las veces. En términos prácticos, puede establecerse con 95,0% de
confianza, que la media verdadera de Cargas2 se encuentra en algún lugar entre 3992,63 y 4019,34, en
tanto que la desviación estándar verdadera está en algún lugar entre 59,0963 y 78,1892.

Ambos intervalos asumen que la población de la cual proviene la muestra puede representarse por la
distribución normal. Mientras que el intervalo de confianza para la media es bastante robusto y no muy
sensible a violaciones de este supuesto, los intervalos de confianza para la desviación estándar son muy
sensibles. Si los datos no provienen de una distribución normal, el intervalo para la desviación estándar
puede ser incorrecto. Para verificar si los datos provienen de una distribución normal, seleccione Resumen
Estadístico de la lista de Opciones Tabulares, ó escoja Gráfica de Probabilidad Normal de la lista de
Opciones Gráficas.

Ambos intervalos asumen que la población de la cual proviene la muestra puede representarse por la
distribución normal:
- Mientras que el intervalo de confianza para la media es bastante robusto y no muy sensible al
incumplimiento de este supuesto,
- Los intervalos de confianza para la desviación estándar son muy sensibles. Si los datos no
provienen de una distribución normal, el intervalo para la desviación estándar puede ser
incorrecto.

6
INFERENCIA ESTADÍSTICA: INTERVALOS DE CONFIANZA (Statgraphics y Ejercicios)

d) Calcular un intervalo de confianza al 99% para cada uno de los parámetros del modelo
normal ¿Qué variación experimentan los intervalos al aumentar el nivel de confianza? ¿Por
qué?

Statgraphics: Pulsar el botón derecho del ratón, elegir Opciones de ventana y cambiar el nivel de
confianza del intervalo
Intervalos de Confianza para Cargas2
Intervalos de confianza del 99,0% para la media: 4005,99 +/- 17,6777 [3988,31; 4023,67]
Intervalos de confianza del 99,0% para la desviación estándar: [56,8058; 82,1175]

El StatAdvisor
Este panel muestra los intervalos de confianza del 99,0% para la media y la desviación estándar de
Cargas2. La interpretación clásica de estos intervalos es que, en muestreos repetidos, estos intervalos
contendrán la media verdadera ó la desviación estándar verdadera de la población de la que fueron
extraídas las muestras, el 99,0% de las veces. En términos prácticos, puede establecerse con 99,0% de
confianza, que la media verdadera de Cargas2 se encuentra en algún lugar entre 3988,31 y 4023,67, en
tanto que la desviación estándar verdadera está en algún lugar entre 56,8058 y 82,1175.

Ambos intervalos asumen que la población de la cual proviene la muestra puede representarse por la
distribución normal. Mientras que el intervalo de confianza para la media es bastante robusto y no muy
sensible a violaciones de este supuesto, los intervalos de confianza para la desviación estándar son muy
sensibles. Si los datos no provienen de una distribución normal, el intervalo para la desviación estándar
puede ser incorrecto. Para verificar si los datos provienen de una distribución normal, seleccione Resumen
Estadístico de la lista de Opciones Tabulares, ó escoja Gráfica de Probabilidad Normal de la lista de
Opciones Gráficas.

Conforme aumenta el nivel de confianza, los valores críticos son mas grandes (en valor absoluto), y por
tanto, los intervalos de confianza son mas anchos.

Ejercicio 2: (calculadora y tablas)


 INTERVALO DE CONFIANZA PARA LA MEDIA CON σ 2 CONOCIDA

Para estimar la calificación media de los expedientes de los alumnos en una Facultad se ha
obtenido una muestra de 25 alumnos. Se sabe por otros cursos que las puntuaciones se
distribuyen normalmente y que la desviación típica de las puntuaciones en dicha Facultad es de
2.01 puntos. La media de la muestra fue de 4.9. Calcular:
a) Intervalo para la media con una confianza del 90%.
b) Intervalo para la media con una confianza del 99%.

SOL: a) (4.24, 5.56); b) (3.86, 5.94)

Ejercicio 3: (calculadora y tablas)


 INTERVALO DE CONFIANZA PARA LA MEDIA CON σ 2 DESCONOCIDA
 INTERVALO DE CONFIANZA PARA LA σ 2

El valor de las ventas (en miles de euros) en una editorial se distribuye según una normal. Para
estimar el valor medio de las ventas por trabajador en la editorial se ha obtenido una muestra de
15 vendedores de la empresa. La media y cuasi-varianza de la muestra son 5 y 2.143
respectivamente. Calcular:
7
INFERENCIA ESTADÍSTICA: INTERVALOS DE CONFIANZA (Statgraphics y Ejercicios)

a) Intervalo de confianza del 90% para la venta media por trabajador en la editorial.
b) Intervalo de confianza del 90% para la varianza de las ventas por trabajador en la

editorial.

SOL: a) (4.334, 5.666); b) (1.267, 4.567)

Ejercicio 4: (calculadora y tablas)


 CÁLCULO DEL ERROR DE LA ESTIMACIÓN. DETERMINACIÓN DEL TAMAÑO DE LA
MUESTRA

El peso, en kilogramos, de un determinado colectivo se distribuye según una normal con


desviación típica igual a 5 kg. ¿Cuántos individuos debemos seleccionar en la muestra si
queremos que la media de la muestra no difiera en más de 1kg de la media de la población, con
un nivel de confianza del 95%?
SOL: 97 individuos

También podría gustarte