Está en la página 1de 15

Estimación

intervalar para
la media

Herramientas
Matemáticas V -
Estadística II

1
Estimación intervalar para la
media

Estimación puntual y por intervalos

Hasta ahora hemos visualizado el proceso de estimación simplemente como


proporcionar un valor único que sirva como referencia indicativa del valor
que suponemos que alcanza el parámetro poblacional de interés. En
definitiva, como se indica en Berenson y Levine: “La estimación puntual
consiste en una sola estadística de muestra que se utiliza para estimar el
valor verdadero del parámetro de la población” (1996, p. 344).

Tabla 1: Estimadores puntuales

Fuente: elaboración propia.

Sin embargo, debido a que con este procedimiento no estamos


aprovechando realmente la potencialidad de conocer con qué probabilidad
de acertar hacemos nuestra afirmación, debemos considerar la variabilidad
posible que es propia de un estimador, ya que el valor de este dependerá de
la muestra que haya sido seleccionada.

Para tener en cuenta esta característica, la estimación por intervalos


considera justamente las distribuciones en el muestreo de los respectivos
estimadores. Cuando obtengamos un intervalo, estaremos considerando
una determinada confianza de estimar acertadamente el parámetro. En
definitiva, vamos a poder decir, a través del intervalo, con una confianza
establecida por el investigador (por ejemplo, para la estimación de la media

2
poblacional) que un intervalo, a partir de la estimación puntual más / menos
un cierto margen de error o error de muestreo, atrapa al verdadero valor del
parámetro. Los intervalos en este caso tendrán la siguiente estructura:

Bibliografía básica
Estimación por intervalo de la media
Capítulo 9: repaso de
conceptos como
distribución de Caso: Desviación estándar conocida
muestreo y teorema
central del límite. Por el teorema del límite central (que conoces de la materia previa, pero
Capítulo 10: desarrollo recordaremos más adelante en el módulo), sabemos que es posible
de los procedimientos determinar qué porcentaje de las medias muestrales se ubican a
para estimación de la determinada distancia de la media de la población, teniendo en cuenta la
media y la proporción. distribución de las medias muestrales.

Si bien tenemos en cuenta ese razonamiento, permanentemente en las


diferentes investigaciones que llevemos a cabo, tomaremos una única
muestra, a partir de la cual haremos la estimación, considerando lo que
probabilísticamente podemos deducir de la distribución de muestreo de la
media.
Error de muestreo de la
media: es la diferencia
La idea de este tipo de estimación es considerar que la muestra que fue
entre la media de la seleccionada nos proporciona una de las medias muestrales posibles, que
muestra y la media de la con una probabilidad 1-a se encuentra a una distancia de con respecto del
población. Su fórmula es:
n Z × σ α 2 1−.
valor de la media poblacional.
Observa que debe
diferenciarse del error
estándar de la media,
dado que debe
multiplicarse por Z.
Donde Z1-𝛼/2 es el valor de la tabla estandarizada normal que tiene acumulado
hasta ese valor 1- 𝛼/2 de probabilidad. Este valor se denomina valor crítico
de la distribución. Algunos de los valores críticos más usados,
correspondientes a los niveles de confianza (1-α) usuales, son:

3
Tabla 2:

Tabla de la
distribución normal

Es importante que
puedas manejar con
suficiente solvencia
la tabla de la
distribución normal.
En el anexo del
módulo, tienes
disponible una tabla
y en los anexos del
texto de la
bibliografía básica Por lo tanto, a través de la construcción de un intervalo de confianza, con un
otra con un formato nivel de confianza de 1-α, podemos decir que la media poblacional es
diferente. Verifica
atrapada por el intervalo:
cuál te resulta más
práctica para
trabajar. A modo de
ejercitación, intenta
encontrar los valores
Donde LI = límite inferior y LS = límite superior.
críticos más usados
que se presentan en
la tabla a la derecha.
Si se tomaran todas las muestras posibles de tamaño n de la población bajo
estudio, en el (1-α) porcentaje de los intervalos surgidos de tales
estimaciones de la media poblacional, la media poblacional (que es fija,
aunque desconocida para nosotros) quedaría incluida en tales intervalos.
Como destacamos antes, ya que en cualquier estimación trabajaremos con
una muestra al azar, podemos decir que la probabilidad de que se cumpla la
condición detallada es (1-α).

Veamos un ejemplo:

Deseamos estimar la altura promedio de una población de estudiantes


varones de esta universidad. Utilizaremos para ello una muestra aleatoria de
10 estudiantes. Los valores obtenidos de la medición de la altura son:

Tabla 3:

4
De un estudio previo, se conoce que la varianza de esta población es 16 cm2.

¿Cómo podemos estimar la altura promedio?

En primer lugar, veamos una estimación puntual de la media que va a estar


dada por la media muestral.

Para obtener el intervalo de confianza, suponemos que la variable aleatoria


se distribuye normalmente y calculamos cada uno de los valores que
indicamos. Trabajaremos con un 1-α = 0,95.

5
Por lo tanto, el intervalo que surge será:

Y podemos expresar la siguiente conclusión: con un nivel de confianza del


95 %, la altura promedio de los varones de la población de estudiantes de la
universidad es atrapada por el intervalo [166,92 cm; 171,88 cm].

Como puede analizarse a partir del ejemplo, el intervalo que surge depende
de la muestra que ha sido seleccionada. En el caso de haber elegido a otros
estudiantes y no a esos, el resultado de la media muestral podría haber sido
distinto y, en consecuencia, también el intervalo obtenido.

Estimación por intervalo de la media

Caso: Desviación estándar desconocida

En general, cuando no se dispone de información referida a la media


poblacional, tampoco resulta conocido el valor de la varianza poblacional. Si
tal es la situación, no podemos aplicar la distribución normal para la
estimación por intervalos de la media poblacional.

Para solucionar esta situación, se aplica la distribución t, que presentaremos


para calcular el intervalo de confianza.

Distribución t de Student1

La distribución t de Student fue estudiada por William Gosset (1876-1937),


quien se ocupaba de tareas de control de calidad en la fábrica de cervezas
Guiness, en Irlanda (MatematicasVisuales, s. f.).

1 http://www.matematicasvisuales.com/html/probabilidad/varaleat/tstudent.html. En este sitio se


pueden realizar visualizaciones de las diferentes distribuciones que estudiaremos en este módulo,
simplemente ajustando los parámetros de las mismas.
En la página http://www.matematicasvisuales.com/html/probabilidad/varaleat/tstudentprob.html
pueden calcularse y compararse las respectivas probabilidades de la tabla normal y la tabla t de
Student.

6
Figura 1: Comparación de la distribución t y la normal estándar para
diferentes grados de libertad

Tabla de la
distribución t

Es importante que
puedas manejar con
suficiente solvencia la
tabla de la
distribución t de
Student. En el anexo
del módulo, tienes
disponible una tabla.
Más adelante en el
módulo se explica
cómo trabajar con la
tabla.

7
Fuente: elaboración propia a base de Geogebra, s. f., https://goo.gl/b1iimB

Desarrolló trabajos acerca de esta distribución que le permitieran analizar


muestras pequeñas. Debido a ciertas restricciones que le imponía la fábrica,
no pudo publicar sus trabajos con su nombre y usó el seudónimo de Student,
dado que consideró que su aporte podría servir a otros.

La distribución t, en realidad, está conformada por una familia de variables


aleatorias continuas. Esta familia se diferencia entre sí de acuerdo con un
parámetro que se denomina grados de libertad.

La distribución t es similar a la distribución normal estándar: tiene forma de


campana, su media es 0 y es simétrica. Su varianza es mayor que 1. Cuantos
más grados de libertad posee, más cercana a 1 es la varianza y más se
aproxima la distribución t de Student a la normal estándar. Si trabajamos
con más de 30 grados de libertad, se considera despreciable la diferencia
entre la t de Student y la normal estándar.

Para buscar valores de t en la tabla, se procede de manera similar a la


correspondiente a la búsqueda en la tabla normal estándar. En este caso
deberán considerarse los grados de libertad (indicados en las filas de las
tablas).

Por ejemplo, si queremos buscar el t (con 25 grados de libertad) que acumula


0,90 de probabilidad hasta ese valor, en primer lugar, ubicamos la fila que
corresponde a esos grados de libertad. Como la tabla que presentamos en
este caso señala las probabilidades a la derecha del valor respectivo, se debe
seleccionar el valor de t asociado con una probabilidad a la derecha de 0,10.
A continuación, hacemos un recuadro en el valor de t buscado.

8
Tabla 4: Valor de t

En otras ocasiones, como ya has aprendido para la distribución normal,


queremos conocer cuál es la probabilidad acumulada hasta determinado
valor de la variable aleatoria. Podemos querer saber qué probabilidad hay
de que una variable t con 17 grados de libertad sea menor o igual a 2,1098.
Nuevamente, buscamos en la tabla la fila correspondiente a los grados de
libertad que nos interesan. Luego, entre los valores de la fila, identificamos
el valor que nos interesa. En este caso, la columna donde se ubica el 2,1098
nos señala que la probabilidad de obtener un número mayor a ese valor de
t es 0,025. Por lo tanto, la probabilidad acumulada hasta ese número será su
complemento: 1 – 0,025 = 0,975.

9
Tabla 5: Valores de la tabla t (según la probabilidad de la cola superior)

Estadística I

En el curso anterior, se
ha estudiado la
distribución normal,
sus parámetros y la
manera de obtener
probabilidades en la
tabla correspondiente.
Si no recuerdas esos
conceptos y Para los diversos problemas en los cuales se requieren valores de t o
procedimientos, probabilidades asociadas con valores de la variable t, se pueden utilizar las
deberás repasarlos a tablas que indicamos a continuación. Existen diversas tablas publicadas. La
partir del material de única recomendación importante para el uso es considerar cuidadosamente
ese curso. qué probabilidad están informando y hacer uso de la propiedad de simetría
de la distribución t (que se debe aplicar de manera análoga a la de la
distribución normal, que ya conocemos del curso anterior).

Tabla 4: Valores de la tabla t (según la probabilidad de la cola superior)

10
Fuente: Anderson, Sweeney y Williams, 2008.

11
Tabla 5: Valores de la tabla t (según la probabilidad de la cola superior):
continuación

Las distribuciones t de Student son parecidas a la normal. Se pueden utilizar


para hacer estimaciones de la media cuando se desconoce la varianza
(situación que, de más está decirlo, es la habitual) y se usan muestras
pequeñas.

12
Tabla de la Los intervalos así obtenidos son más grandes y menos precisos que los que
distribución t se obtendrían si conocemos la varianza en una distribución normal.

En el punto 10.3 del Si la variable aleatoria X es normal, el estadístico:


texto de Berenson y
Levine (1996) se
desarrolla el tema de
estimación de un
intervalo de
confianza de la media
cuando la desviación
Se distribuye t con n-1 grados de libertad.
estándar es
desconocida. Te
recomendamos que
Para buscar valores de probabilidad o de la variable aleatoria en la tabla t,
sigas con detalle los
se deben considerar los grados de libertad de la variable que se está
ejemplos propuestos analizando.
en el texto,
verificando si llegas a
los mismos
resultados. Grados de libertad

La idea de grados de libertad remite a la cantidad de valores de una muestra


que podrían asumir cualquier valor. Si nosotros conocemos o calculamos en
función de tales datos un estadístico, podemos perder grados de libertad o
valores que pueden variar del total de datos disponibles de la muestra. El
Diccionario de metodología estadística (Gonzalvo Maynar, 1978) indica que,
cuando un estadístico se usa en la estimación de un parámetro poblacional,
los grados de libertad dependen de las restricciones impuestas sobre las
observaciones: cada restricción hace perder un grado de libertad.

Estimación del intervalo de confianza

El intervalo de confianza para la media se construirá según el siguiente


esquema:

Nivel de confianza: (1-α) %

Límites del intervalo:

 Inferior:

13
 Superior:

Veamos un ejemplo:

Repitamos el ejercicio vinculado con la altura promedio de una población de


estudiantes varones de esta universidad, pero ahora suponiendo que no
conocemos la varianza poblacional.

Supongamos que estimamos con los datos de la muestra la varianza


muestral s2 = 16,16 cm2.

Por lo tanto, el intervalo que surge será:

[LI, LS] = [166,52;172,26].

La conclusión en este caso será: con un nivel de confianza del 95 %, la altura


promedio de los varones de la población de estudiantes de la universidad es
atrapada por el intervalo [166,52 cm; 172,26 cm].

Si comparamos el resultado con el caso de varianza conocida (a pesar de la


pequeña diferencia de varianzas implicadas), el intervalo que surge de
considerar que no conocemos la varianza implica un intervalo más amplio
(menos preciso), lo cual está asociado con un mayor margen de seguridad
debido a que no conocemos el verdadero valor de la varianza.

14
Referencias
Anderson, D. R., Sweeney, D. J. y Williams, T. A. (2008). Estadística para
administración y economía (10.a ed.). México D. F., MX: Cengage Learning.

Berenson, M. L. y Levine, D. M. (1996). Estadística para administración y


economía (6.a ed.). México D. F., MX: Prentice Hall Hispanoamericana.

Gonzalvo Maynar, G. (1978). Diccionario de metodología estadística.


Madrid, ES: Morata.

Levine, D. M., Krehbiel, T. C. y Berenson, M. L. (2014). Estadística para


administración (6.a ed.). México D. F., MX: Pearson.

MatematicasVisuales. (s. f. a). Distribuciones t de Student. Recuperado de


http://www.matematicasvisuales.com/html/probabilidad/varaleat/tstuden
t.html

MatematicasVisuales. (s. f. b). Probabilidades en distribuciones t de


Student. Recuperado de
http://www.matematicasvisuales.com/html/probabilidad/varaleat/tstuden
tprob.html

15

También podría gustarte