Está en la página 1de 32

ESTIMACIÓN

Introducción

 Todo el mundo hace estimaciones. Cuando está por cruzar una calle, hace una
estimación de la velocidad del automóvil que se acerca, de la distancia que
hay entre usted y el auto y de su propia velocidad. Habiendo hecho
rápidamente todas estas estimaciones, usted decide si espera, camina o
corre.
 Universidades
 Industrias textiles…
Tipos de estimaciones

Podemos hacer dos tipos de estimaciones concernientes a una población:


 Una estimación puntual es un solo número que se utiliza para estimar un parámetro de
población desconocido.
El jefe de departamento de una universidad estaría haciendo una estimación puntual si
afirmara: “Nuestros datos actuales indican que en esta materia tendremos 350 estudiantes
el siguiente semestre.”
una estimación puntual es mucho más útil si viene acompañada por una estimación del
error que podría estar implicado.
 Una estimación de intervalo es un rango de valores que se utiliza para estimar un
parámetro de la población. "tendremos entre 330 y 380 estudiantes el siguiente
semestre”
Una estimación de este tipo indica el error de dos maneras: por la extensión del intervalo y
por la probabilidad de que el verdadero parámetro poblacional se encuentre dentro del
intervalo.
Estimador y estimaciones

 Un estimador es un estadístico de la muestra utilizado para estimar un


parámetro poblacional. La media de la muestra puede ser un estimador de
la media de la población µ. Al igual que la proporción, rango y la mediana.
 una estimación es un valor específico observado de un estadístico.

 Suponga que calculamos la lectura media de un odómetro (kilometraje) a


partir de una muestra de taxis en servicio y encontramos que es 156,000
kilómetros. Si utilizamos este valor específico para estimar el kilometraje de
la flotilla de taxis completa, el valor obtenido de 156,000 kilómetros sería
una estimación.
Estimador y estimaciones
Criterios para seleccionar un buen
estimador
1. Insesgado. se refiere al hecho de que la media de la muestra es un estimador
no sesgado de la media de la población porque la media de la distribución
muestral de las medias de las muestras es igual a la media de la población.
2. Eficiencia. se refiere al tamaño del error estándar del estadístico.
3. Consistencia. Una estadística es un estimador consistente de un parámetro
de población si al aumentar el tamaño de la muestra, se tiene casi la certeza
de que el valor de la estadística se aproxima bastante al valor del parámetro
poblacional.
4. Suficiencia. Un estimador es suficiente si utiliza tanta información de la
muestra que ningún otro estimador puede extraer información adicional
acerca del parámetro de población que se está estimando.
Estimaciones puntuales

 La media de la muestra es el mejor estimador de la media de la población


µ. Es insesgada, consistente, el estimador más eficiente y, siempre y cuando
la muestra sea suficientemente grande, su distribución muestral puede ser
aproximada por medio de la distribución normal.
 Si conocemos la distribución muestral de , podemos obtener conclusiones
respecto a cualquier estimación que podamos hacer a partir de la información
muestral.
 Así, al usar la media de la muestra, como estimador, la estimación puntual
de la media de la población, es un numero real.
Estimación puntual de la varianza y la
desviación estándar de la población
 El estimador más utilizado para estimar la desviación estándar de la población
σ, es la desviación estándar de la muestra, s.
Estimación puntual de la proporción de
la población
 La proporción de unidades de una población dada que tiene una característica
particular se denota por p. Si conocemos la proporción de unidades de una
muestra que tiene la misma característica (denotada por pˆ), podemos
utilizar esta pˆ como estimador de p.

 pˆ tiene todas las características deseables analizadas; es insesgado,


consistente, eficiente y suficiente.
Estimaciones de intervalo:
conceptos básicos
 Una estimación de intervalo describe un rango de valores dentro del cual es
posible que esté un parámetro de la población.
 Si utilizamos la estimación puntual de la media de la muestra como
estimador de la media de la población , informaríamos un solo dato numérico,
Pero nos piden una conclusión acerca de la incertidumbre que acompañará a
esta estimación; es decir, una afirmación acerca del intervalo dentro del cual
es probable que esté la media de la población desconocida. Para proporcionar
tal afirmación, necesitamos encontrar el error estándar de la media. Y el
rango seria la media mas y menos el erros estándar.

Ó Para poblaciones finitas


Probabilidad de que el verdadero parámetro
poblacional caiga dentro de la estimación del
intervalo
 el 95.5% de todas las medias muéstrales está dentro de ±2 errores estándar de
µ y, en consecuencia, la µ está dentro de ±2 errores estándar del 95.5% de
todas las medias muéstrales.
 De manera parecida, la probabilidad de que la media de la muestra esté
dentro de 1 error estándar de la media de la población es 0.683, y así
sucesivamente.
Probabilidad de que el verdadero parámetro
poblacional caiga dentro de la estimación del
intervalo
Estimaciones de intervalo e intervalos
de confianza
 Al utilizar estimaciones de intervalo no nos estamos limitando a 1, 2 y 3
errores estándar. De acuerdo con la tabla 1 del apéndice, 1.64 errores
estándar, por ejemplo, incluyen aproximadamente el 90% del área bajo la
curva y así, 0.4495 del área a ambos lados de la media en una distribución
normal. De manera parecida, 2.58 errores estándar incluyen alrededor de 99%
del área o el 49.51% a cada lado de la media.
 En estadística, la probabilidad que asociamos con una estimación de
intervalo se conoce como nivel de confianza.
 En la estimación, los niveles de confianza que se utilizan con más frecuencia
son 90, 95 y 99%, pero somos libres de aplicar cualquier nivel de confianza.
 El intervalo de confianza es el rango de la estimación que estamos
haciendo.
 Así, expresaremos los intervalos de confianza de esta forma:
Relación entre nivel de confianza e
intervalo de confianza
 Podría pensarse que deberíamos utilizar un alto nivel de confianza, como 99%,
en todos los problemas sobre estimaciones.

 En la práctica, sin embargo, altos niveles de confianza producen intervalos de


confianza grandes, y éstos de hecho, dan estimaciones bastante imprecisas.

 Si informamos que tenemos el 90% de confianza de que la media de la


población de ingresos de las personas que viven en una cierta comunidad está
entre $8,000 y $24,000, entonces el rango $8,000-$24,000 es nuestro
intervalo de confianza.
Uso de muestreo y estimación de
intervalos de confianza
 Intervalo de confianza y el nivel de confianza: “Tenemos el 95% de confianza
de que la vida media de las baterías de la población se encuentra entre 30 y
42 meses.”
 Esta afirmación no significa que se tiene 0.95 de probabilidad de que la vida
media de todas las baterías caiga dentro del intervalo establecido para esta
muestra.
 Más bien, indica que si seleccionamos muchas muestras aleatorias del mismo
tamaño y calculamos un intervalo de confianza para cada una de esas
muestras, entonces en alrededor del 95% de los casos la media de la
población caerá dentro de dicho intervalo.
Cálculo de estimaciones de intervalo de
la media a partir de muestras grandes
 Un mayorista de refacciones automotrices necesita una estimación de la vida
media que puede esperar de los limpiadores de parabrisas en condiciones
normales de manejo. La administración de la empresa ya ha determinado que la
desviación estándar de la vida útil de la población es 6 meses. Suponga que
seleccionamos una sola muestra aleatoria de 100 limpiadores, tomamos los datos
referentes a su vida útil y obtenemos los siguientes resultados:

 Como el distribuidor utiliza decenas de miles de limpiadores al año, nos pide que
encontremos una estimación de intervalo con un nivel de confianza del 95%.

 El tamaño de la muestra es mayor que 30, de modo que el teorema central del límite nos permite usar la
distribución normal como distribución de muestreo, aun cuando nuestra población no tenga distribución
normal.
Cuando no se conoce la desviación
estándar de la población
 El departamento está interesado en estimar el ingreso medio anual de 700
familias que viven en una sección de cuatro manzanas de una comunidad.
Tomamos una muestra aleatoria simple y encontramos los siguientes
resultados:

 El departamento nos pide que calculemos una estimación de intervalo del


ingreso anual medio de las 700 familias, de modo que pueda tener el 90% de
confianza de que la media de la población se encuentra dentro de ese
intervalo.
Cuando no se conoce la desviación
estándar de la población

 Como tenemos un tamaño de población finito y nuestra muestra constituye


más del 5% de la población, utilizaremos la fórmula para derivar el error
estándar de la media de poblaciones finitas:
Cálculo de estimaciones de intervalo de la
proporción a partir de muestras grandes
 Teóricamente, la distribución binomial es la distribución correcta a utilizar en
la construcción de intervalos de confianza para estimar una proporción de
población.
 conforme aumenta el tamaño de la muestra, la distribución binomial puede
aproximarse por una distribución normal apropiada, que podemos utilizar
para aproximar la distribución muestral.
 Los estadísticos recomiendan que en la estimación, n sea lo suficientemente
grande para que tanto np como nq sean al menos 5 cuando se utiliza la
distribución normal como sustituto de la binomial.
Cálculo de estimaciones de intervalo de la
proporción a partir de muestras grandes
 Expresemos en símbolos la proporción de éxitos en una muestra con pˆ (se lee
p gorro).
 µ=np muestra que la media de la distribución binomial es igual al producto
del número de ensayos, n, por la probabilidad de obtener un éxito, p.
 Para cambiar este número de éxitos a la proporción de éxitos, dividimos np
entre n y obtenemos sólo el valor de p. La media, que se encuentra al lado
izquierdo de la ecuación se convierte en µpˆ , es decir, en la media de la
distribución de muestreo de la proporción de éxitos.
Cálculo de estimaciones de intervalo de la
proporción a partir de muestras grandes
 De forma parecida podemos modificar la fórmula para la desviación estándar
de la distribución binomial, , que mide la desviación estándar del número
de éxitos.
 Para cambiar el número de éxitos a la proporción de éxitos, dividimos ,
entre n y obtenemos:
Cálculo de estimaciones de intervalo de la
proporción a partir de muestras grandes
 Podemos ilustrar cómo utilizar estas fórmulas si, para una organización muy
grande, hacemos la estimación de qué proporción de sus empleados prefieren
planificar su propios beneficios de retiro en lugar de seguir un plan patrocinado
por la compañía. Primero, tomamos una pequeña muestra aleatoria de 75
empleados y encontramos que el 0.4 de ellos están interesados en seguir sus
propios planes de retiro. Nuestros resultados son:

 A continuación, la administración solicita que utilicemos esta muestra para


encontrar un intervalo en el que puedan tener el 99% de confianza de que
contiene a la proporción verdadera de la población.
Estimaciones de intervalos con la
distribución t
 Los primeros trabajos teóricos sobre la distribución t fueron realizados por W.
S. Gosset, a principios del siglo XX. Gosset era empleado de la Cervecería
Guinness en Dublín, Irlanda; la empresa no permitía que los empleados
publicaran sus hallazgos de investigación con su propio nombre. De modo que
Gosset adoptó el seudónimo de Student para publicar. En consecuencia, la
distribución t se conoce como distribución t de Student o simplemente
distribución de Student.
 Debido a que se usa cuando el tamaño de la muestra es 30 o menos, los
especialistas en estadística, suelen asociar la distribución t con estadísticas
de muestras pequeñas.
 Además la desviación estándar de la población debe ser desconocida. y, al
utilizar la distribución t, suponemos que la población es normal o
aproximadamente normal.
Características de la distribución t
 En general, la distribución t es más plana que la distribución normal y hay una
distribución t diferente para cada tamaño posible de muestra.
 Aún así, conforme el tamaño de muestra se hace más grande, la forma de la
distribución t deja de ser plana y se aproxima más a la distribución normal.
 los anchos de intervalo de una distribución de Student son mayores que los
basados en la distribución normal. (para poder incluir la misma área bajo la
curva)
Grados de libertad

 Existe una distribución t diferente para cada tamaño de muestra. En un


lenguaje estadístico apropiado, diríamos: “existe una distribución t distinta
para cada uno de los grados de libertad posibles”.
 ¿Qué son los grados de libertad? Podemos definirlos como el número de
valores que podemos escoger libremente.
 Utilizaremos los grados de libertad cuando elijamos una distribución t para
estimar una media de población, y utilizaremos n-1 grados de libertad,
cuando n es igual al tamaño de la muestra.
Uso de la tabla de distribución t

 La tabla t es más compacta y muestra áreas y valores de t sólo para algunos


porcentajes (10, 5, 2 y 1%). Debido a que hay una distribución t diferente
para cada número de grados de libertad, una tabla más completa sería
bastante grande.
 La tabla t no se concentra en la probabilidad de que el parámetro de
población que se está estimando se encuentre dentro del intervalo de
confianza. En lugar de ello, mide la probabilidad de que el parámetro de
población que estamos estimando no esté dentro de nuestro intervalo de
confianza (es decir, la probabilidad de que esté fuera).
Uso de la tabla de distribución t

 Si estamos haciendo una estimación a un nivel de confianza del 90%,


buscaríamos en la tabla t en la columna de 0.10 (100% - 90% = 10%). Esta
probabilidad de 0.10 del error se representa con el símbolo α, la letra griega
alfa. Encontraríamos los valores t apropiados para intervalos de confianza del
95, 98 y 99% en las columnas α con títulos 0.05, 0.02 y 0.01, respectivamente.
 A demás al utilizar la tabla t debemos especificar los grados de libertad
que se manejan.
 Suponga que hacemos una estimación a un nivel de confianza del 90% con una
muestra de tamaño 14.
 Del mismo modo que el valor z, el valor t de 1.771 indica que si señalamos
una distancia de más menos 1.771σ (errores estándar estimados de ) a
ambos lados de la media, el área bajo la curva que se encuentra entre estos
dos límites será el 90% del área total
Uso de la tabla de distribución t

Recuerde que en cualquier problema de estimación donde el tamaño de la muestra sea


menor o igual que 30, la desviación estándar de la población no se conozca y la
población en cuestión sea normal o aproximadamente normal, utilizamos la
distribución t.
Determinación del tamaño de muestra
en estimación
 ¿Qué tan grande deberá ser la muestra? Si ésta es muy pequeña, podemos
fallar en el logro de los objetivos de nuestro análisis; si es demasiado grande,
desperdiciamos recursos al tomar la muestra.
 Examinemos algunos métodos útiles en la determinación del tamaño
necesario de muestra para cualquier nivel específico de precisión:

1. Tamaño de muestra para estimar una media


2. Tamaño de muestra para estimar una proporción
Tamaño de muestra para estimar una media

 Suponga que una universidad está efectuando una investigación acerca de los
ingresos anuales de los estudiantes del último año de su escuela de
administración. Se sabe, por experiencia, que la desviación estándar de los
ingresos anuales de la población completa (1,000 estudiantes) de los
egresados es alrededor de $1,500. ¿Qué tan grande debe ser la muestra que
debe tomar la universidad con el fin de estimar el ingreso medio anual de los
estudiantes graduados el año pasado, dentro de más menos $500 y con un
nivel de confianza del 95%?
Tamaño de muestra para estimar una
proporción
 Suponga que deseamos encuestar a estudiantes de una universidad grande.
Deseamos determinar qué proporción de éstos está a favor de un nuevo
sistema de evaluación. Nos gustaría contar con un tamaño de muestra que nos
permita tener una certeza del 90% de que estamos estimando la proporción
verdadera de la población de 40,000 estudiantes a favor del nuevo sistema de
evaluación, más menos 0.02.