Está en la página 1de 8

UNIVERSIDAD AUTONOMA DE OCCIDENTE

FACULTAD DE CIENCIAS BASICAS


AREA DE ESTADISTICA
PROBABILIDAD Y ESTADISTICA
TALLER PREPARATORIO PARA EL EXAMEN FINAL

 Antes de responder lea atentamente las preguntas.

 El conjunto de datos adjunto (tabla de frecuencias) esta formado con observaciones del gasto anual en
publicidad (millones de pesos) para una muestra de 240 empresas comerciales del Valle del Cauca.

LINF , LSUP  Xi
'
ni hi Ni Hi hi
*

45 - 53 49 12 5% 12 5% 0,625%

53 - 61 57 48 20% 60 25% 2,5%

61 - 69 65 76 31,66% 136 56,66% 3,957%


69 - 77 73 56 23,33% 192 80% 2,916%

77 – 85 81 48 20% 240 100% 2,5%

X  65,8 M 0  65,2 S  7,24 M e  67,31 P76  75,63 Coef. Asimetría = 1,16 Coef. Curtosis = 0,09

1. Cuál es el significado de la Media aritmética para estos datos?


2. Cuál es el significado de la Moda para estos datos?
3. Cuál es el significado de la desviación estándar para estos datos?
4. Cuantas empresas presentan un gasto anual en publicidad entre $56.700.000 y $73.400.000?
5. Que porcentaje de empresas presentan un gasto anual en publicidad máximo de $57.500.000?
6. Cuál es el significado de la Mediana para estos datos?
7. Cuál es el significado del Percentil 76 para estos datos?
8. El gasto anual en publicidad de estas empresas es heterogéneo?
9. La desviación estándar de los gastos en publicidad es pequeña? Explique!!
10. El gasto anual en publicidad de estas empresas presenta una distribución asimétrica negativa?
11. El gasto anual en publicidad de estas empresas presenta un tipo de distribución platicurtica?

En la siguiente tabla se encuentra el registro de algunos estadísticos descriptivos del gasto anual en publicidad
(millones de pesos) para una muestra de 200 empresas comerciales de Antioquia.

Gasto anual en publicidad


Peso en Kg.
Media 68,1
Varianza 54,1696
Rango 43
Mínimo 42
Máximo 85

12. ¿En qué departamento hay más homogeneidad en el gasto anual en publicidad de estas empresas
comerciales?

Para las siguientes ocho preguntas plantee el modelo adecuado con sus respectivos parámetros,
indicando la probabilidad que usaría para resolver el problema, por ejemplo:

 20 
X ~ Binomial (n = 20, p = 0.3) P( x)    (0, 3) X (0, 7) 20 X
 x 

P x5
x2   1   P(0)
P (3)  P (4)
 P (1)  P (2) 

Con la información contenida en el siguiente párrafo, responda las siguientes dos preguntas

 El número promedio de reclamos por hora hechos a la empresa “Trasteos el Hogar” por daños o pérdidas
incurridas durante una mudanza es de 6.

13. ¿Si en un intervalo de 10 minutos se presentan al menos dos reclamos, cual es la probabilidad de que se
presenten menos de cuatro reclamos en ese intervalo?

14. ¿En la siguiente hora, cual es la probabilidad de que se presenten menos de cuatro reclamos?

Marco Antonio Triana 1


Docente Departamento Matemáticas - UAO
Con la información contenida en el siguiente párrafo, responda las siguientes dos preguntas

 Suponga que los registros de garantías muestran que el 5% de los carros nuevos necesitan reparación de
garantía en los primeros noventa días.

15. En una muestra de 15 nuevos carros, cual es la probabilidad de que más de dos pero menos de seis
carros necesiten una reparación de garantía?

16. En una muestra de 12 nuevos carros, cual es la probabilidad de que más de dos carros necesiten una
reparación de garantía?

Con la información contenida en el siguiente párrafo, responda las siguientes cuatro preguntas

 El número de solicitudes de asistencia recibido por un servicio de remolque de vehículos con fallas es en promedio
10 por minuto.

17. ¿Cuál es la probabilidad de que pase más de 5 segundos sin que se presenten solicitudes de asistencia?

18. ¿Cuál es la probabilidad de que pase menos de 5 minutos hasta que se presente una solicitud de
asistencia?

19. ¿Cuál es la probabilidad de que pase entre 12 y 36 segundos hasta que se presenten 8 solicitudes de
asistencia?

20. ¿Cuál es la probabilidad de que pase entre 2 y 5 minutos hasta que se presenten 2 solicitudes de
asistencia?

Con la información contenida en el siguiente párrafo, responda las siguientes cuatro preguntas
indicando el procedimiento

 Suponga que el diámetro de los árboles de determinado tipo, a la altura del pecho, se distribuye normalmente
con una media de 8 pulgadas y una desviación estándar de 0,8 pulgadas.

21. El porcentaje de árboles que presentan diámetros entre 6,752 y 9,2 pulgadas es:

a) 93,32%
b) 43,32%
c) 6,68%
d) 87,38%

22. Si los árboles presentan diámetros menores de 9,68 pulgadas; cual es el porcentaje de árboles que
presentan diámetros mayores de 7,2 pulgadas?

a) 83,84%
b) 43,32%
c) 6,68%
d) 6,55%

23. El porcentaje de árboles que presentan diámetros de por lo menos 9,2 pulgadas es:

a) 93,32%
b) 43,32%
c) 6,68%
d) 6,55%

24. Supóngase que el 6,3% de los árboles con menos diámetro no se cortan. ¿A partir de que diámetro los
árboles se cortan?

a) 9,22 pulgadas
b) 6,3 pulgadas
c) 6,78 pulgadas
d) 7,65 pulgadas

Marco Antonio Triana 2


Docente Departamento Matemáticas - UAO
Responda la siguiente pregunta indicando el procedimiento

25. Supóngase que la resistencia a la ruptura de un lote de vigas se distribuye normalmente con una
desviación estándar de 12 (psi). Usted selecciona una muestra aleatoria de 25 vigas. Después de
procesar los datos encuentra una resistencia promedio de 1200 ( psi). Decide construir un intervalo de
confianza del 99% para estimar la media poblacional. ¿Cuál es el error de estimación?

a) 6,71
b) 6,17
c) 5,59
d) 5,98

Responda las siguientes 3 preguntas justificando su respuesta

26. El tiempo promedio de entrega de algunos proveedores en la empresa OMEGA es de 15 minutos. La empresa
estudia los tiempos de entrega de un proveedor particular de materia prima. En general estaría satisfecha
con el proveedor, si este ofrece un tiempo óptimo de entrega. ¿Cuál es la hipótesis nula y la hipótesis
alterna en este caso?

H 0:
H 1:

27. En un estudio de Investigación de mercados para estudiar el comportamiento de compra de los


consumidores en la ciudad de Cali, el investigador encargado decidió reducir la región de rechazo de su
hipótesis de trabajo. ¿Qué efecto se logró?

a. Se disminuye el error tipo I.


b. Se disminuye el nivel de confianza.
c. Se disminuye el error tipo II.
d. Aumenta la potencia de la prueba.

28. La cadena Roder’s Discount emite su propia tarjeta de crédito. La gerente de crédito, considera que el
promedio mensual de saldos no pagados no es mayor que $400,000. Usted realizó una prueba de hipótesis
para comprobar la hipótesis de la gerente y obtuvo en la prueba un valor P igual a 0.08 ¿A un nivel de
significancia del 5%, usted que concluye?

a. No hay suficiente información para tomar una decisión.


b. Con la información suministrada se rechaza la afirmación de la gerente de crédito.
c. Con la información suministrada no se rechaza la afirmación de la gerente de crédito.
d. Con la información suministrada se rechaza la hipótesis nula.

Responda la siguiente pregunta indicando el procedimiento

29. Encuentre el tamaño de muestra que se requiere para probar la hipótesis anterior, si la potencia de
nuestra prueba debe ser del 97,5%, cuando realmente el promedio de saldos no pagados es de
$405,000. Supóngase que la desviación estándar es de $18,000. Utilice un Nivel de significancia del
2,5%.

Responda las siguientes 3 preguntas justificando su respuesta

30. Un intervalo del 95% de confianza para estimar la media poblacional µ quedo de la siguiente forma: 
1.7, 3.1  . Se decide probar la hipótesis H0: µ=0 contra H1: µ ≠ 0 para  = 0.05, usando los mismos
datos que fueron usados para construir el intervalo de confianza:

a) Nosotros no podemos probar la hipótesis sin los datos originales.


b) Nosotros no podemos probar la hipótesis al nivel  = 0.05 puesto que el  = 0.05 se relaciona con un
intervalo del 97,5% de confianza.
c) Nosotros rechazamos H0 al nivel  = 0.05
d) Nosotros aceptaríamos H0 al nivel  = 0.05

31. Usted construyo un intervalo de confianza para estimar la medía poblacional del consumo de energía en
los hogares de la ciudad de Cali. Para disminuir la amplitud del intervalo usted debe:

a. Reducir el tamaño de la muestra.


b. Incrementar la media muestral.
c. Reducir el nivel de confianza.
d. Reducir la desviación estándar poblacional.

Marco Antonio Triana 3


Docente Departamento Matemáticas - UAO
32. Un Analista del Banco de la Republica, con una muestra de 500 familias colombianas obtuvo el siguiente
intervalo de confianza del 99% para estimar el promedio de ingreso familiar mensual: 
$250.000, $650.000  . Si el analista decide cambiar el nivel de confianza al 90%, el intervalo sería:
a. Más estrecho e involucraría un riesgo más grande de ser incorrecto.
b. Más ancho e involucraría un riesgo más pequeño de ser incorrecto.
c. Más estrecho e involucraría un riesgo más pequeño de ser incorrecto.
d. Más ancho e involucraría un riesgo más grande de ser incorrecto.

Responda la siguiente pregunta indicando el procedimiento

33. En una entrevista a 100 personas en Cali, se les preguntó: ¿Qué edad tiene usted? Con los resultados
obtenidos, se encontró una media de 35 años con una desviación estándar de 5 años. Con la información
anterior conteste la siguiente pregunta:

¿Con un nivel de confianza del 95%, cual es el error de estimación?

a) 35 años
b) 1 año
c) 5 años
d) 25 años

Responda la siguiente pregunta indicando el procedimiento

34. Se quiere estimar la edad promedio de un grupo de personas que laboran en la empresa XYZ con una
confianza del 95% y un margen de error de 1,56 años. Supóngase que la desviación estándar es de 6
años. ¿Cuántas personas hay que encuestar?

a) 59 personas.
b) 57 personas.
c) 80 personas.
d) 89 personas.

Responda las siguientes cuatro preguntas indicando el procedimiento para llegar a la respuesta

35. Las ganancias (dólares) por acción para todas las corporaciones de servicios financieros en Estados
Unidos, como American Express se distribuyen normalmente.

a) ¿De que tamaño se debe tomar la muestra para estimar la ganancia promedio por acción para estas
corporaciones de servicios financieros, si se desea tener una confianza del 96,52% de que la media
muestral esté dentro de 1,56 dólares del promedio real? Por estudios previos, se sabe que la desviación
estándar es de 6,89 dólares.

b) Se selecciono una muestra aleatoria de tamaño 24, se encontró una media de 98,76 dólares con una
varianza de 46,24. Construya un intervalo de confianza del 98% para estimar la media poblacional.
Interprete claramente el intervalo de confianza.

c) Un representante de estas corporaciones asegura que la ganancia promedio para estas corporaciones
de servicios financieros es como máximo 98 dólares por acción. En una muestra de 76 de estas
corporaciones, se encontró una media de 98,82 dólares y una desviación estándar de 6,91 dólares.

 Enunciar la hipótesis nula y la hipótesis alterna. Tomar una decisión. Utilice un nivel de
significancia del 2,22%.

d) Encuentre el tamaño de muestra que se requiere si la potencia de nuestra prueba debe ser del 97.78%,
cuando realmente la ganancia promedio por acción para estas corporaciones es de 98,75 dólares. Utilice
un Nivel de significancia del 2,22%. Por estudios previos, se sabe que la desviación estándar es de 6,85
dólares.

Marco Antonio Triana 4


Docente Departamento Matemáticas - UAO
Responda las siguientes preguntas indicando la justificación o el procedimiento para llegar a la
respuesta

36. En una oficina de ingenieros esta es la distribución del nivel educativo de los 10 empleados

Máximo nivel Número de


educativo alcanzado personas
Secundaría 1
Tecnólogo 5
Pregrado 3
Postgrado 1
10

A las personas con estudios superiores al nivel tecnológico, les corresponde pagar Retención en la Fuente ¿Qué
porcentaje de las personas de la oficina les toca pagar el mencionado gravamen?

a. 50%
b. 60%
c. 90%
d. 40%

37. Para elegir el presidente en un país de 40 millones de habitantes, de los cuales solo 7 millones están
habilitados para votar, un candidato contrato una firma consultora la cual decide encuestar 10,000
votantes potenciales, la encuesta arrojo un 55% de intención de voto por el candidato rival. La población
de interés (bajo estudio) en este caso es:

a. 40 millones de habitantes
b. 10,000 votantes potenciales
c. 7 millones que están habilitados para votar
d. 55% de los habilitados para votar.

38. Estos son los resultados obtenidos por diez estudiantes en una prueba: 4, 5, 8, 9, 11, 13, 15, 18, 18 y 20.
El profesor calcula las estadísticas descriptivas usuales con los resultados, pero descubrió el siguiente
error: uno de los datos, en este caso un 18 debería haber sido un 16. ¿Cuál de las siguientes medidas ya
calculadas cambiaría?

a. La Mediana
b. El Rango
c. La Media
d. La Varianza
e. La media y la varianza

39. Si se desea premiar con un bono, al 25% de los empleados con mejor desempeño, Si usted cuenta con
la información para entregar los bonos, ¿con cual indicador usted trabajaría?

a. El percentil 25
b. La Mediana
c. Q3
d. La Moda

40. En una muestra de 100 artesanos de una región se encontraron:

 60 hombres que tienen un promedio de 50 unidades fabricadas por día.


 40 mujeres que tienen un promedio de 20 unidades fabricadas por día.

¿Cuál es el promedio de unidades fabricadas por día por artesano?

a. 35
b. 50
c. 38
d. 70

Marco Antonio Triana 5


Docente Departamento Matemáticas - UAO
41. Se ha tomado una muestra de parejas de casados y se han observado las variables: Ingreso mensual
del esposo e ingreso mensual de la esposa. Se encontró que el ingreso promedio mensual de los esposos
es de $800.000 y de las esposas es de $500.000. ¿Cuál es el ingreso familiar Promedio?

a. $600,000
b. $800,000
c. $1,300,000
d. $500,000

42. Una de las siguientes afirmaciones no es Válida.

a. El grado de Aceptación de un nuevo producto, es una variable cualitativa.


b. Cuánto gasta usted al mes en cereal, es una variable cuantitativa continua.
c. La ciudad donde reside, es una variable cualitativa nominal.
d. El grado de Aceptación del nuevo sabor de Pepsi, es una variable cuantitativa ordinal.

43. Sabe que la media del Cociente de Inteligencia IQ de la población de estudiantes de Ingeniería en una
gran ciudad es 130. Usted ha seleccionado una muestra de 50 estudiantes de Ingeniería para un estudio
educativo. El primer estudiante de la muestra tiene un Cociente de Inteligencia de 150. ¿Cuál es el valor
que usted espera tenga la media muestral?

a) 130
b) 120
c) 110
d) 150

44. Una escala nominal para datos cualitativos se caracteriza porque:

a) Establece un orden o jerarquía entre las unidades.


b) Permite clasificar las unidades según cierto atributo o característica.
c) Entre los datos existe una relación de orden.
d) Las diferencias entre los datos tienen sentido.

45. En un problema de regresión lineal simple, el coeficiente de correlación Lineal r y la pendiente de la


recta b

a) Pueden tener signos opuestos


b) Deben tener el mismo signo
c) Son iguales en valor absoluto
d) Son exactamente iguales

Responda las preguntas 46 y 47 indicando el procedimiento

46. Una máquina automática de refrescos en un restaurante se ajusta de tal forma que la cantidad de líquido
servido está distribuido aproximadamente normal con una desviación estándar de 10 mililitros. Después
de seleccionar una muestra de tamaño n y calcular la media muestral X , un investigador construye un
intervalo del 98% de confianza para estimar la media poblacional. El intervalo es el siguiente
250  252,1 .

¿Cuál es el error de estimación?

a. 4,2
b. 2,1
c. 1,05
d. No se puede determinar a partir de la información proporcionada.

47. Supóngase que las edades de todos los estudiantes de la UAO se distribuyen normalmente con una
media de 25 años y una desviación estándar de 2 años. En una muestra aleatoria de 9 estudiantes, cual
es la probabilidad de que la edad promedio del grupo sea mayor de 27 años?

a. 50%
b. 15,87%
c. Aproximadamente 0%
d. Ninguna de las anteriores.

Marco Antonio Triana 6


Docente Departamento Matemáticas - UAO
Para las preguntas 48 y 49 justifique su respuesta

48. Se realizó un experimento sobre la cantidad de lluvia y la contaminación removida del aire. Un
investigador está interesado en conocer la relación entre las partículas removidas (microgramos/m3) y
la cantidad de lluvia diaria (centímetros). Toma una muestra de datos para pronosticar las partículas
removidas, a partir de la cantidad de lluvia diaria y encontró el siguiente modelo:
Y = 153,175 – 6,324 X

¿Qué interpretación tiene en el anterior modelo la pendiente?

a) Por Cada centímetro adicional de cantidad de lluvia diaria se obtienen 6,324 microgramos/m3 menos de
partículas removidas.
b) Por Cada partícula removida adicional se obtienen 6,324 centímetros menos de cantidad de lluvia removida.
c) Por Cada centímetro adicional de cantidad de lluvia diaria se obtienen 6,324 microgramos/m3 adicionales
de partículas removidas.
d) Por Cada centímetro adicional de cantidad de lluvia diaria se obtiene en promedio 6,324 microgramos/m3 de
partículas removidas.

49. Se llevó a cabo un estudio con el fin de determinar los efectos de la privación del sueño en la capacidad
de las personas para resolver problemas. Se toma una muestra de diez personas para pronosticar el
número de errores que se cometieron al resolver un conjunto de problemas, a partir del número de horas
sin dormir de cada individuo. El modelo ajustado es: Y = 2,83 + 0,37 X y se encontró un coeficiente de
determinación de 0,92.

Con respecto al coeficiente de determinación se puede concluir lo siguiente:

a) Las variables X e Y están fuertemente relacionadas, cuando X aumenta, Y aumenta.


b) El 92% de la variabilidad total del número de horas sin dormir es explicada por el modelo ajustado.
c) El modelo de regresión lineal explica el 92% de la variabilidad total del número de errores que se
cometieron al resolver un conjunto de problemas.
d) Ninguna de las afirmaciones es correcta.

Para la pregunta 50 indicar el procedimiento para llegar a la respuesta (Plantear hipótesis


correspondientes, utilizar criterios de decisión, etc.)

50. En un informe de investigación de la Escuela de Medicina de UNIVALLE, se afirma que los ratones
llegarán hasta una vida promedio de 40 meses cuando las calorías en su alimentación se reemplacen
con vitaminas y proteínas. Usted realizó una inspección por muestreo y obtuvo un valor P igual a 0,023.
¿A un nivel de significancia del 2,5%, usted que concluye?

a) Existe evidencia para creer en el informe de investigación de la Escuela de Medicina de UNIVALLE.


b) No hay suficiente información para concluir que los ratones llegarán a una vida promedio mayor de 40
meses cuando las calorías en su alimentación se reemplacen con vitaminas y proteínas.
c) Con la información suministrada se concluye que no es correcto el informe de investigación de la Escuela
de Medicina de UNIVALLE.
d) Con la información suministrada se concluye que es correcto el informe de la investigación de la Escuela
de Medicina de UNIVALLE.

51. La empresa Nielsen recopila datos acerca de la cantidad de hogares que ven programas de Televisión
donde se pasa determinado anuncio. Esta información es utilizada para definir tarifas de los anuncios. A
continuación se muestran información recolectada y procesada de la cantidad de hogares Caleños que
vieron un determinado comercial y el número de veces que salio al aire el comercial en una semana.

Veces que 95 46 41 38 29 32 25 21 21 16
salio el Anuncio

Numero 759 323 275 242 220 199 194 190 162 160
de Hogares

a. Aplique el método de los mínimos cuadrados ordinarios para plantear la ecuación de regresión estimada.
b. Realice una interpretación adecuada de  1 .
c. Qué significado tiene el coeficiente de correlación?

d. ¿Qué porcentaje de la variabilidad del número de hogares que ven un anuncio es explicada por el modelo
planteado en el literal a?

Marco Antonio Triana 7


Docente Departamento Matemáticas - UAO
e. Pronostique Y para X = 45. Interprete claramente el resultado.
f. Pronostique X para Y = 200. Interprete claramente el resultado.
g. Interprete claramente el coeficiente de Determinación.

h. Es razonable concluir que existe relación lineal entre las dos variables?

 Defina claramente la hipótesis nula y la hipótesis alterna para este problema.


 Utilice un nivel de significancia de 0.05.
 ¿Cuál es la región de aceptación y de rechazo?
Calcule el valor del estadístico de prueba.
 Tomar una decisión.

i. Suponiendo que todos los supuestos de la regresión se cumplen para el modelo, determine e interprete
claramente el intervalo de predicción del 98% para una predicción individual para un valor de X =45.
Interprete claramente el intervalo encontrado.

j. Use la información de la tabla de diagnóstico presentada a continuación para probar el supuesto de


Homogeneidad de Varianzas.

Prueba de diagnóstico Valor P


Estadístico Jarque - Bera 1,93327 0,4967
Estadístico Kolmogorov–Smirnov 0,250534 0,23821
Estadístico Breusch y Pagan 2,1456 0,06821
Estadístico Anderson - darling 0,3764 0,6164

 Defina claramente la hipótesis nula y la hipótesis alterna para este problema.


 Utilice un nivel de significancia de 5%. Tomar una decisión.

Los resultados del procesamiento de los datos en STATGRAPHICS se presentan a continuación:

TABLA 1
-----------------------------------------------------------------------------
Standard T
Parameter Estimate Error Statistic P-Value
-----------------------------------------------------------------------------
Intercept -8,41702 21,6579 -0,388635 0,7077
Slope 7,71475 0,511992 15,0681 0,0000
-----------------------------------------------------------------------------

TABLA 2
Analysis of Variance
-----------------------------------------------------------------------------
Source Sum of Squares Df Mean Square F-Ratio P-Value
-----------------------------------------------------------------------------
Model 276423,0 1 276423,0 227,05 0,0000
Residual 9739,71 8 1217,46
-----------------------------------------------------------------------------
Total (Corr.) 286162,0 9

TABLA 3

Correlation Coefficient = 0,982835


R-squared = 96,5964 percent
R-squared (adjusted for d.f.) = 96,171 percent
Standard Error of Est. = 34,8922
Mean absolute error = 27,7096
Durbin-Watson statistic = 1,33375 (P=0,0690)

Marco Antonio Triana 8


Docente Departamento Matemáticas - UAO

También podría gustarte