Está en la página 1de 7

UNIVERSIDAD DE LOS ANDES

FACULTAD DE CIENCIAS ECONÓMICAS Y EMPRESARIALES


Segundo Semestre 2010

Problema 1: Preguntas directas.

i) [1,5 ptos.] Afirmación 1: En un test de hipótesis, la potencia es la probabilidad de no rechazar


correctamente la hipótesis nula.
La afirmación 1, ¿es verdadera o falsa? Justifique claramente su respuesta.

ii) [1,5 ptos.] Usted tiene una muestra aleatoria simple de individuos. En cada uno de ellos, usted
registra su edad (medida en años). Sea la media poblacional de edades (medida en años). Suponga
que, con un 93% de confianza, está en el intervalo (18,9; 42,1). Calcule el margen de error.
Explique su procedimiento.

iii) [1,5 ptos.] Afirmación 2: Si se rechaza una hipótesis nula ( ) frente a su respectiva hipótesis
alternativa ( ) al 5% de significancia, entonces eso implica que también debe rechazarse al 1% de
significancia, manteniendo constantes las restantes condiciones.
La afirmación 2, ¿es verdadera o falsa? Justifique claramente su respuesta.

iv) [1,5 ptos.] Considere la población de = 5 individuos que se provee en el cuadro 1. En cada
individuo se registra su salario mensual (medido en miles de pesos).

Cuadro 1

687,87 321,71 432,11 496,25 665,3

Considere el siguiente procedimiento para establecer la insesgadez de la mediana muestral, como


estimador de la mediana poblacional, usando muestras de tamaño = 2:

Paso 1: Obtener todas las muestras aleatorias simples de tamaño 2 provenientes de esta población.
Paso 2: En cada muestra del paso 1, calcular la mediana muestral.
Paso 3: De todas las medianas obtenidas del paso 2, calcular la mediana.
Paso 4: Comparar la mediana obtenida en paso 3 con la media poblacional. Si ambas cantidades
son iguales, entonces la mediana muestral es un estimador insesgado de la mediana poblacional. En
caso contrario, es un estimador sesgado.

¿Es correcto este procedimiento? Si su respuesta es no, indique dónde están los errores en este
proceso y señale cómo debiera ser el procedimiento correcto.
UNIVERSIDAD DE LOS ANDES
FACULTAD DE CIENCIAS ECONÓMICAS Y EMPRESARIALES
Segundo Semestre 2010

Problema 2: Rendimiento de modelos de camionetas.

El gerente de una empresa necesita renovar la flota de camionetas para repartos a domicilio. Para
ello, revisa el mercado automotriz y se encuentra con dos modelos (digamos, A y B) muy semejantes. Uno
de los aspectos importantes en la decisión de compra es mantener el gasto en combustible. El gerente se
encuentra con el siguiente estudio:

Para comparar rendimientos se le pidió a 8 conductores que manejasen dos modelos de camionetas
(A y B) y se anotó el rendimiento (medido en kilómetros por litro) que obtuvieron al manejar ambos
modelos. Los resultados fueron:

Conductor 1 2 3 4 5 6 7 8

Modelo A 17 16,2 15,5 14,6 18 14,5 16,2 15,5

Modelo B 13 12 16,5 15,8 13,5 16,5 12,8 11,5

i) [0,5 ptos.] ¿Cómo podría usar el gerente este estudio para decidir que camioneta comprar? Explique
brevemente.

ii) [1,0 ptos.] Plantee, en palabras, las hipótesis (nula y alternativa) que permitan probar que la
camioneta modelo A tiene mejor rendimiento que el modelo B.

iii) [2,0 ptos.] ¿Con qué nivel de significancia aproximado aceptaría que la camioneta modelo A tiene
mayor rendimiento promedio que la camioneta B? Justifique su respuesta.

iv) [1,5 ptos.] El gerente desea estimar la diferencia de rendimientos, pues él sabe que la camioneta del
modelo A necesita repuestos más caros que la del modelo B. Por ello, si la diferencia de rendimiento
es sobre 2,5 km por litro, entonces el gerente tendría en cuenta sólo el rendimiento para tomar una
decisión de compra y no el costo de los repuestos. Con un intervalo al 90% de confianza, ¿qué le
recomendaría usted al gerente? Justifique su respuesta.

v) [0,5 ptos.] ¿Qué consecuencia (positiva o negativa) acarrea el hecho que un mismo conductor
maneje ambos modelos de camionetas?

vi) [0,5 ptos.] ¿Qué supuesto importante debería tener presente el gerente con respecto a los datos del
estudio si decide hacer un intervalo de confianza o un test de hipótesis?
UNIVERSIDAD DE LOS ANDES
FACULTAD DE CIENCIAS ECONÓMICAS Y EMPRESARIALES
Segundo Semestre 2010

Problema 3: Desempeño de filtros de spams.

Usando una muestra aleatoria simple de 100 correos electrónicos recibidos por funcionarios, una
compañía examina la calidad de un filtro que promete reducir la cantidad de “correos basura” (en adelante,
spams) de entre todos los correos que reciben funcionarios de la compañía. Si este filtro reduce a un 15% el
nivel poblacional de spams que reciben funcionarios, entonces este test tiene un 28% de probabilidad de
rechazar correctamente la hipótesis nula { 0,20}, donde es la proporción poblacional de spams de
entre todos los correos recibidos por funcionarios, una vez implementado el filtro en la compañía.

i) [2,5 ptos.] ¿Con qué nivel de significancia se efectuó este test de hipótesis?

En las partes ii), iii) y iv), suponga que este test se efectúa con una muestra aleatoria simple de 400
correos electrónicos (en lugar de 100). Además, suponga que el nivel de significancia elegido es igual a 6%.

ii) [1,5 ptos.] Para obtener un valor-p igual al 6%, ¿qué porcentaje de spams que debe detectar este
filtro, de entre la muestra aleatoria simple de 400 correos electrónicos recibidos por funcionarios?

iii) [0,5 ptos.] Como ahora se tiene una muestra aleatoria simple de mayor tamaño (en comparación con
la muestra aleatoria simple de 100 correos que se tenía antes), la estimación puntual de obtenida en
ii), ¿debería estar más cerca o más lejos de = 20%, en comparación con el escenario en que el test
se realiza con una muestra aleatoria simple de 100 correos? Justifique su respuesta.

iv) [1,5 ptos.] Si realmente la proporción poblacional es igual a 15%, ¿cuál es la probabilidad que con
una muestra aleatoria simple de 400 correos electrónicos se rechace correctamente la hipótesis nula
{ 0,20}?
UNIVERSIDAD DE LOS ANDES
FACULTAD DE CIENCIAS ECONÓMICAS Y EMPRESARIALES
Segundo Semestre 2010

Respuestas
PROBLEMA 1

i) Falsa. En un test de hipótesis, la potencia es la probabilidad de rechazar correctamente la hipótesis


nula.

ii) Por definición de un intervalo de confianza para la media poblacional, el punto medio del intervalo
debe ser la media muestral. Luego, ̅ 0,5 (18,9 + 42,1) = 30,5. Así, el margen de error es la
distancia entre el punto medio del intervalo y cualquiera de los límites de éste. O sea, el margen de
error pedido es: 42,1 – 30,5 = 11,6 años.

iii) Falso. Si se rechaza una hipótesis nula ( ) frente a su respectiva hipótesis alternativa ( ) al 5% de
significancia, no necesariamente debe rechazarse al 1% de significancia, manteniendo constantes las
restantes condiciones.

iv) El procedimiento es incorrecto. Los errores están en los pasos 3 y 4.

 Paso 3: De todas las medianas obtenidas en el paso 2, uno debe calcular el promedio (no la
mediana) de esas medianas.
 Paso 4: Uno compara el promedio obtenido en el paso 3 con la mediana poblacional (no con
la media poblacional). Si ambas cantidades son iguales, entonces la mediana muestral es un
estimador insesgado de la mediana poblacional. En caso contrario, es un estimador sesgado.
UNIVERSIDAD DE LOS ANDES
FACULTAD DE CIENCIAS ECONÓMICAS Y EMPRESARIALES
Segundo Semestre 2010

PROBLEMA 2

i) El gerente puede usar estos datos como diseño de muestras independientes. Hacer un test de
hipótesis o hacer un Intervalo de confianza para el parámetro poblacional  A  B ,la diferencia de
los rendimientos promedio de las camionetas.

ii) H0: no hay diferencia entre el rendimiento promedio de la camioneta modelo A y el rendimiento
promedio de la camioneta modelo B
Ha: el rendimiento promedio es mayor en la camioneta A

H o :  A  B  0
H a :  A  B  0

iii)
x A  15,94 s A  1,18
xB  13,95 sB  2,02  1,182 2, 022 
2

  
gl   8 8 

0, 68
 8,5
15,94  13,95  0 1,99 
1 1,18 2

2

1 2, 02 2

2
0, 0043  0, 037
t   2, 4
2 2 0,83     
1,18 2, 02 7 8  7 8 

8 8
gl=8

Valor  p  P(t8  2, 4)
es un valor entre 0,025 y 0,01 por lo tanto para una significancia mayor o
igual al 2,5% aceptamos que el modelo A tiene mejor promedio que el modelo B.

iv)
s A2 sB2
IC : x A  xB  t0,05,8 
n n
IC :1,99  1,9(0,83)
IC : (0,34; 3,57)

Valores estimados para la diferencia van desde 0,09 a 3,57. Luego, con un 90% de confianza no se
puede asegurar que la diferencia de rendimiento está sobre los 2,5 kilómetros por litro. Por tanto, se
le recomendaría tomar en cuenta otros aspectos para su decisión.

v) Es un aspecto positivo, pues al ser el mismo conductor el que prueba las dos camionetas se elimina
las diferencias en forma de conducir.

vi) EL supuesto que debe tener presente el gerente es que la población de donde se extrajeron los datos
debe tener una distribución Normal para poder usar la distribución t o cumplir los tamaños
apropiados dependiendo del coeficiente de sesgo y la curtosis.
(OJO si dice que habría que analizar la simetría de los datos también contarlo bueno)
UNIVERSIDAD DE LOS ANDES
FACULTAD DE CIENCIAS ECONÓMICAS Y EMPRESARIALES
Segundo Semestre 2010

PROBLEMA 3
i) La hipótesis nula y la hipótesis alternativa que se testean son:

versus

Según el enunciado, uno tiene que:

({ }|{ })

Con un nivel de significancia, uno rechaza la hipótesis nula si:

O sea, si ̅ √ . Luego,

( ̅ | )

√ √
( )
( )

Según la tabla de la distribución N(0; 1), uno tiene:

Por tanto, = 0,0382.

ii) Se pide el valor de ̅ de modo que:

̅ ̅

√ √
( )

Luego, ̅ √ .
UNIVERSIDAD DE LOS ANDES
FACULTAD DE CIENCIAS ECONÓMICAS Y EMPRESARIALES
Segundo Semestre 2010

iii) Dos formas de responder a la pregunta:

 Forma 1: Si la muestra fuese de tamaño 100, entonces la respuesta a la parte ii) sería

̅ √

Por tanto, la respuesta a la pregunta es que, con una muestra aleatoria simple de 400 correos
electrónicos se obtiene un valor de ̅ que está más cerca de = 20%, en comparación con el
escenario en que el test se realiza con una muestra aleatoria simple de 100 correos.

 Forma 2: Notar que si la hipótesis nula es cierta con igualdad, entonces el valor esperado de ̅ es
0,2 y la varianza de ̅ es (0,2 0,8)/ .

Si uno realiza el test con una muestra aleatoria simple de tamaño 100, entonces ( ̅ )
0,2 y ( ̅ ) (0,2 0,8)/100 = 0,0016. Como 100 0,2 = 20 > 5 y como 100 0,8 = 80
> 5, entonces el Teorema del Límite Central garantiza que

̅ ( )

Si uno realiza el test con una muestra aleatoria simple de tamaño 400, entonces ( ̅ )
0,2 y ( ̅) (0,2 0,8)/400 = 0,0004. Como 400 0,2 = 80 > 5 y como 400 0,8 = 320
> 5, entonces el Teorema del Límite Central garantiza que

̅ ( )

El valor-p se mantiene fijo en un 6%. Luego, al ser menor la varianza de ̅ cuando la muestra es
de 400 correos, entonces valores de ̅ deben estar más cerca de = 20% en este escenario
(definición de varianza). Nota: Observe que en esta forma de responder iii) no era necesario
haber respondido ii).

iv) Si se usa una muestra aleatoria simple de 400 correos electrónicos, entonces uno rechaza la hipótesis
nula con un 6% de significancia si:

̅
̅

Luego, la probabilidad pedida es:

̅
( ̅ |{ })
√ √
( )
( )

También podría gustarte