Está en la página 1de 4

CORPORACIÓN UNIVERSITARIA DEL CARIBE – CECAR

FACULTAD DE CIENCIAS ECONÓMICAS Y ADMINISTRATIVAS


ESTADÍSTICA INFERENCIAL: ESTIMACIÓN DIFERENCIA DE MEDIAS Y PROPORCIONES
(Mendenhall, Beaver, & Beaver, 2010)
PROFESOR: Hernando Castaño Buitrago Septiembre de 2016

ESTIMACIÓN DE LA DIFERENCIA ENTRE DOS MEDIAS Aun cuando la elección entre estimación puntual y de
POBLACIONALES intervalo depende de la preferencia personal del usuario,
Un problema de igual importancia que la estimación de casi todos los experimentadores escogen construir
una sola media poblacional , para una población intervalos de confianza para problemas de dos muestras.
cuantitativa, es la comparación de dos medias Las fórmulas apropiadas para ambos métodos se dan a
poblacionales. continuación.
Intuitivamente, la diferencia entre dos medias muestrales
daría la máxima información acerca de la diferencia real ESTIMACIÓN PUNTUAL DE ( ) DE MUESTRA
entre dos medias poblacionales y éste es de hecho el GRANDE
Estimador puntual: ( ̅ ̅ )
caso. El mejor estimador puntual de la diferencia
( ) entre las medias poblacionales es ( ̅ ̅ ). 95% margen de error: √
La distribución muestral de este estimador no es difícil de
deducir, pero la expresamos aquí sin demostración. UN INTERVALO DE CONFIANZA DE MUESTRA GRANDE DE
( ) PARA ( )
PROPIEDADES DE LA DISTRIBUCIÓN MUESTRAL DE
(̅ ̅ ), LA DIFERENCIA ENTRE DOS MEDIAS
(̅ ̅ ) ⁄ √
MUESTRALES
Cuando muestras aleatorias independientes de n1 y n2 Ejemplo 1:
observaciones han sido seleccionadas de entre Las resistencias al desgaste de dos tipos de llantas para
poblaciones con medias y y varianzas y , automóvil se compararon en muestras de pruebas en
respectivamente, la distribución muestral de la diferencia camino de n1=n2= 100 llantas para cada tipo. El número
(̅ ̅ ) tiene las siguientes propiedades: de millas hasta el completo desgaste se definió como una
1. La media de ( ̅ ̅ ) es cantidad específica de desgaste de la llanta. Los
resultados de la prueba se muestran en la tabla siguiente.
y el error estándar es √
Estime ( ), la diferencia en la media de millas
hasta el completo desgaste, usando un intervalo de
que se puede estimar como √
confianza de 99%. ¿Hay diferencia en el promedio de
cuando los tamaños muestrales son grandes. calidad de desgaste para los dos tipos de llantas?
2. Si las poblaciones muestreadas están distribuidas Resumen de datos muestrales para dos tipos de llantas
normalmente, entonces la distribución muestral Llanta 1 Llanta 2
de ( ̅ ̅ ) está distribuida normalmente ̅ ̅
exactamente, cualquiera que sea el tamaño
muestral. Solución:
3. Si las poblaciones muestreadas no están La estimación puntual de ( ) es ( ̅ ̅ )
distribuidas normalmente, entonces la ( )
distribución muestral de ( ̅ ̅ ) está
distribuida normalmente aproximadamente √ √
cuando n1 y n2 son ambas de 30 o más, debido al
teorema del límite central.
Como ( ) es la media de la distribución muestral, El intervalo de confianza de 99% se calcula como
se deduce que ̅( ̅ ) es un estimador insesgado de
( ) con una distribución aproximadamente normal (̅ ̅ ) ⁄ √
cuando n1 y n2 son grandes. Esto es, el estadístico
( )
(̅ ̅ ) ( )

o sea ( ) . La diferencia en el

promedio de millas hasta el completo desgaste para los
tiene una distribución z normal aproximadamente dos tipos de llantas se estima que está entre el límite
estándar y los procedimientos generales de la sección inferior LCL = 824,2 y el límite superior UCL = 1775,8
anterior se pueden usar para construir estimaciones millas de desgaste.
puntuales y de intervalo. Con base en este intervalo de confianza, ¿se puede
concluir que hay una diferencia en el promedio de millas
hasta el completo desgaste para los dos tipos de llantas? ( ) ( )
√ que se estima como
Si no hubiera diferencia en las dos medias poblacionales,
entonces y serían iguales a ( ) . Si ( ) ( )

observamos el intervalo de confianza construido, se verá
que 0 no es uno de los posibles valores para ( ). 2. La distribución muestral de ( ) puede ser
Por tanto, no es probable que las medias sean iguales; se aproximada por una distribución normal cuando
puede concluir que hay una diferencia en el promedio de n1 y n2 son grandes debido al teorema del límite
millas hasta el completo desgaste para los dos tipos de central.
llantas. El intervalo de confianza ha permitido tomar una Recuerde que debe cumplirse simultáneamente que
decisión acerca de la igualdad de las dos medias ( ) sea mayor que 5, y (
poblacionales. ) también sea mayor que 5
La distribución muestral de
ESTIMACIÓN PUNTUAL DE MUESTRA GRANDE DE
(̅ ̅ ) ( )
( ).
Estimador puntual: ( ).

95% de margen de error:
tiene una distribución normal estándar para todos los ( ) ( )

tamaños muestrales cuando ambas poblaciones
muestreadas son normales, y una distribución normal UN INTERVALO DE CONFIANZA DE MUESTRA GRANDE
estándar aproximada cuando las poblaciones ( ) PARA ( ).
muestreadas no sean normales pero los tamaños
( ) ( )
muestrales sean grandes (≥30). Cuando no se ( ) ⁄ √
conocen y son estimadas por las estimaciones , la
estadística resultante todavía tendrá una distribución Suposición: n1 y n2 deben ser sufi cientemente grandes
normal estándar aproximada cuando los tamaños para que la distribución muestral de ( ) pueda ser
muestrales sean grandes. El comportamiento de esta aproximado por una distribución normal, es decir, si
( ) ( ) son todas mayores
estadística cuando las varianzas poblacionales son
desconocidas, y los tamaños muestrales sean pequeños, a 5.
se estudiará más adelante. Ejemplo:
ESTIMACIÓN DE LA DIFERENCIA ENTRE DOS La propuesta de un bono para la construcción de una
PROPORCIONES escuela será enviada a los votantes en la siguiente
Una simple extensión de la estimación de una proporción elección municipal. Una parte importante del dinero
es la estimación de la diferencia entre dos derivado de esta emisión de bonos se empleará en
proporciones. construir escuelas en una zona de rápido desarrollo de la
Pueden hacerse comparaciones con la diferencia ciudad y lo demás se usará para renovar y actualizar los
( ) entre dos proporciones, . Muestras edificios escolares del resto de ésta. Para evaluar la
aleatorias independientes formadas por n1 y n2 intentos viabilidad de la propuesta de un bono, a una muestra
se sacan de poblaciones 1 y 2, respectivamente, y se aleatoria de n1 = 50 residentes de la zona de rápido
calculan las estimaciones muestrales . El desarrollo y n2 = 100 de las otras partes de la ciudad, se
estimador insesgado de la diferencia ( ) es la les preguntó si piensan votar por la propuesta. Los
diferencia muestral ( ). resultados se tabulan en la tabla siguiente.
Valores muestrales para opinión sobre propuesta de
PROPIEDADES DE LA DISTRIBUCIÓN MUESTRAL DE LA bono
DIFERENCIA ( ) ENTRE DOS PROPORCIONES Sección en Resto de la
MUESTRALES desarrollo ciudad
Suponga que las muestras aleatorias independientes de Tamaño muestral 50 100
las observaciones n1 y n2 han sido seleccionadas de Número a favor de
propuesta 38 65
poblaciones binomiales con parámetros ,
Proporción a favor de
respectivamente. La distribución muestral de la diferencia propuesta 0,76 0,65
entre proporciones muestrales
( ) ( ) 1. Estime la diferencia en las proporciones
verdaderas a favor de la propuesta de bono con
tiene estas propiedades:
un 99% de intervalo de confianza.
1. La media de ( ) es ( ) y el error
2. Si ambas muestras se agrupan en una muestra de
estándar es
tamaño n = 150, con 103 a favor de la propuesta,
dé una estimación puntual de la proporción de
residentes de la ciudad que votarán para la confianza de una cola para el parámetro de interés, por
propuesta del bono. ¿Cuál es el margen de error? ejemplo .

Solución UN LÍMITE INFERIOR DE CONFIANZA ( ) ( )


1. La mejor estimación puntual de la diferencia ( ) ( )
( ) está dada por ( )
UN LÍMITE SUPERIOR DE CONFIANZA
y el error estándar de ( ) se
( ) ( )
estima como
( ) ( )
( ) ( ) El valor z para un límite de confianza de una cola

( ) , localiza un área a en una sola cola de
la distribución normal, como se muestra en la siguiente
( )( ) ( )( ) figura:

Para un intervalo de confianza de 99%,


y el intervalo aproximado de
confianza de 99% se encuentra como
( ) ( )
( ) ⁄ √

( )( )

o sea, 0,089 ≤  ≤ 0,309. Como este intervalo


contiene el valor ( ) , es posible que Ejemplo:
, lo cual implica que puede no haber Una corporación planea emitir algunos documentos a
diferencia en las proporciones a favor del asunto corto plazo y espera que el interés que tendrá para pagar
del bono en las dos secciones de la ciudad. no rebasará el 11,5%. Para obtener alguna información
2. Si no hay diferencia en las dos proporciones, acerca de este problema, la corporación vendió 40
entonces las dos muestras no son realmente documentos, uno a través de cada una de las 40
diferentes y podrían bien combinarse para empresas de corretaje de acciones. La media y desviación
obtener una estimación total de la proporción de estándar para las 40 tasas de interés fueron 10,3% y
los residentes de la ciudad que votarán por el 0,31%, respectivamente. Como la corporación está
asunto del bono. Si ambas muestras se agrupan, interesada en sólo un límite superior en las tasas de
entonces n = 150 y interés, encuentre un límite superior de confianza de 95%
para la tasa media de interés que la corporación tendrá
que pagar por los documentos.
Por tanto, la estimación puntual del valor total de
p es 0,69, con un margen de error dado por Solución:
( )( ) Como el parámetro de interés es , el estimador puntual
√ ( )
es ̅ con error estándar . El coeficiente de

confianza es 0,95, de modo que y
Observe que produce el intervalo . Por lo tanto, el límite superior de confianza de
0,62 a 0,76, que incluye sólo proporciones 95% es
mayores a 0,5. Por tanto, si las actitudes de
̅ ( ) ( )
votantes no cambian de manera adversa antes de √ √
la elección, la propuesta del bono debe aprobarse
por una mayoría razonable. Entonces, se puede estimar que la tasa media de interés
que la corporación tendrá que pagar sobre sus
LÍMITES DE CONFIANZA A UNA COLA documentos será menos al 10.3806%. La corporación no
Los intervalos de confianza estudiados en las secciones debe preocuparse por sus tasas de interés que rebasen
anteriores a veces reciben el nombre de intervalos de del 11.5%. ¿Qué tan seguro está usted de esta
confianza a dos colas, porque producen límites superiores conclusión? Bastante seguro, porque los intervalos
(UCL) e inferiores (LCL) para el parámetro de interés, pero construidos en esta forma contienen a , el 95% del
a veces un experimentador está interesado en sólo uno tiempo.
de estos límites; esto es, necesita sólo un límite superior
(o posiblemente un límite inferior) para el parámetro de DETERMINACIÓN DEL TAMAÑO MUESTRAL
interés. En este caso, se puede construir un límite de En las secciones anteriores se habló del papel del tamaño
de la muestra para obtener una buena aproximación a los
intervalos de confianza en los casos en que la población
no tiene una distribución normal. Ahora se enfoca la El margen de error para la estimación de intervalo de la
atención en otro aspecto relacionado con el tamaño de la ( )
proporción está dado por: ⁄ √ . Este margen se
muestra, y se describe cómo elegir un tamaño
suficientemente grande para obtener un margen de error basa en el valor de ⁄ , en la proporción muestral “p” y
deseado. en el tamaño de la muestra “n”. Muestras mayores
La cantidad ( ) es el margen de error. De manera proporcionan márgenes de error menores y mejor


precisión.
que, como se ve, ⁄ la desviación estándar poblacional
Sea deseado:
σ, y el tamaño de la muestra “n” se combinan para
determinar el margen de error. Una vez que se selecciona ( )
⁄ √
el coeficiente de confianza ( ) ⁄ puede ser
determinado. Sin embargo, debido a que no se conocerá “p” sino hasta
Por tanto, si se tiene el valor de σ, es posible encontrar el que se tome la muestra, no es posible usar esta fórmula
tamaño de muestra “n” necesario para proporcionar para calcular el tamaño de la muestra con el que se
cualquier margen de error deseado. A continuación se obtendrá el margen de error deseado. Se necesita,
presenta el desarrollo de la fórmula utilizada para calcular entonces, un valor planeado de "p” útil para hacer este
el tamaño “n” de muestra deseado. cálculo. Debido a que el mayor valor del error se obtiene
Sea deseado: cuando “p” y “(1-p)” sean 0,5, la fórmula para calcular el
( ) tamaño de la muestra con el que se obtendrá el error E

√ queda como se presenta a continuación.

√ ( ⁄ ) ( )
( ⁄ )
( ⁄ ) ( )

TAMAÑO DE LA MUESTRA PARA UNA ESTIMACIÓN POR


INTERVALO DE LA MEDIA POBLACIONAL
( ⁄ )

De igual modo se procede para determinar el tamaño de


la muestra cuando se va a estimar la proporción.

EJERCICIOS
(En el documento que anexo a continuación encontrarán más ejercicios)
Se realizó un estudio para comparar los números medios se registraron sus bajas de peso en un periodo de 30 días.
de llamadas de emergencia a la policía por turno de 8 Las medias y desviaciones estándar de las mediciones de
horas en dos distritos de una gran ciudad. Muestras de baja de peso para los dos grupos se muestran en la tabla.
100 turnos de 8 horas se seleccionaron al azar de entre Encuentre un intervalo de confianza de 95% para la
los registros policiales para cada una de las dos regiones y diferencia en reducción media de peso para las dos
el número de llamadas de emergencia se registró para dietas. Interprete su intervalo de confianza.
cada turno. Las estadísticas muestrales se indican a Dieta A Dieta B
continuación: ̅ ̅
Región
1 2
Tamaño muestral 100 100 ¿La compañía Mars Incorporate, usa la misma proporción
Media muestral 2,4 3,1 de dulces rojos en sus variedades sencilla y de cacahuate?
Varianza muestral 1,44 2,64 Una muestra aleatoria de 56 M&M’S sencillos contenía 12
Encuentre un intervalo de confianza de 90% para la dulces rojos y otra muestra aleatoria de 32 M&M’S de
diferencia en los números medios de llamadas de cacahuate contenía ocho dulces rojos.
emergencia a la policía por turno entre los dos distritos Construya un intervalo de confianza de 95% para la
de la ciudad. Interprete el intervalo. diferencia en las proporciones de dulces rojos para las
variedades sencilla y de cacahuate.
Se realizó un experimento para comparar las dietas A y B Con base en el intervalo de confianza del inciso a), ¿se
diseñadas para bajar de peso. Se seleccionaron al azar puede concluir que hay una diferencia en las
dos grupos de 30 personas con sobrepeso de cada grupo. proporciones de dulces rojos para las variedades sencilla
Uno de los grupos fue puesto a la dieta A y el otro a la B y y de cacahuate? Explique.

Mendenhall, W., Beaver, R. J., & Beaver, B. M. (2010). Introducción a la probabilidad y estadística (13 ed.). Mexico, D.F.: Cengage Learning, Inc.

También podría gustarte