Está en la página 1de 6

UNIVERSIDAD NACIONAL DE COLOMBIA.

DEPARTAMENTO DE ESTADÍSTICA. BOGOTÁ D.C. 2019-II


BIOESTADÍSTICA FUNDAMENTAL, grupos 3 y 5
PROBABILIDAD Y ESTADÍSTICA FUNDAMENTAL, grupo 12
_______________________________________________________________________________
EVALUACIÓN 4 (20% de la nota final)

Nombre: ________________________ Identificación: ____________ Usuario SIA: ________


Nombre: ________________________ Identificación: ____________ Usuario SIA: ________
Nombre: ________________________ Identificación: ____________ Usuario SIA: ________
Nombre: ________________________ Identificación: ____________ Usuario SIA: ________

Instrucciones: La evaluación 4 parte I (reforzamiento práctico) y parte II (reforzamiento teórico) se


entregan en físico (NO SE RECIBEN TRABAJOS POR CORREO ELECTRÓNICO NI EN
HORARIOS DESPUÉS DE LOS FIJADOS) en las siguientes franjas horarias:
7 de febrero 7 am a 9 am Salón 3, edificio 561C (producción animal)
7 de febrero 11 am a 1 pm Salón 201, edificio 454 (Ciencia y Tecnología, CyT)
11 de febrero 7 am a 9 am Salón 222 A, edificio 471 (Medicina)

Se entrega en grupos de 3 a 4 estudiantes (no más no menos).

REFORZAMIENTO PRÁCTICO (2.5/5):

Resuelva cada uno de los ejercicios con ayuda de las tablas y el material suministrado en clase. Cada
solución debe tener una justificación detallada o una conclusión en términos de los enunciados,
además de un procedimiento completo que la sustente.

Ejercicio 1: Se quiere determinar la efectividad de 3 fertilizantes sobre la zanahoria. Para ello se


tomaron 23 plantas de zanahoria, todas con condiciones biológicas y físicas similares. Se formaron
dos grupos de grupos de 8 plantas y un grupo de 7 plantas. Al primer grupo se le aplicó el fertilizante
A, al segundo grupo el fertilizante B y al tercer grupo el fertilizante C. Luego de dos meses se
volvieron a revisar las plantas para determinar la longitud que creció cada una, encontrando los datos
(en centímetros) correspondientes de la siguiente tabla:

Fertilizante A Fertilizante B Fertilizante C


Longitud
crecimiento 3.4 3.5 4.3 2.3 4.3 4.5 5.0 5.4 5.4 5.6 7.2 4.0 3.5 4.5 3.8 3.8 3.7 2.3 2.1 2.0 3.6 7.0 3.4

¿Se puede asumir que los tres fertilizantes tienen la misma efectividad para el crecimiento de las
plantas de zanahoria con una confiabilidad del 95%?
Ejercicio 2 (Sólo para Bioestadística Fundamental): Para determinar si existe alguna asociación o
no entre la presencia de cierta cantidad de un compuesto en el agua y el aumento de los niveles de
glucosa en la sangre de una comunidad ribereña se determinó a ciertas personas que viven cerca de
los lugares con niveles excesivos del compuesto (Niveles excesivos), a ciertas personas que viven
cerca de lugares con niveles normales del compuesto (Niveles normales) y a ciertas personas que
viven cerca de lugares con niveles bajos del compuesto (Niveles bajos) sobre sus niveles de azúcar
en la sangre. Al final se construyó la siguiente tabla de contingencia:
Niveles excesivos Niveles normales Niveles bajos
Niveles altos de
128 17 7
azúcar
Niveles normales de
334 456 367
azúcar
Niveles bajos de
45 8 112
azúcar

¿Se puede asumir que los niveles azúcar en la sangre no dependen de los niveles de concentración del
compuesto en el agua con una confiabilidad del 95%?

Ejercicio 3 (Sólo para Probabilidad y Estadística Fundamental): Se encontraron los siguientes


datos correspondientes a la longitud de la escama dorsal de algunos peces Dorado en el municipio de
Tumaco
0.3, 0.2, 0.5, 0.8, 0.5, 0.3, 0.4, 0.2, 0.9, 0.6

3.1. ¿Se puede asumir normalidad en los datos?


3.2. En caso de asumir normalidad ¿qué distribución se estima que tengan los datos?
3.3. ¿Se puede asumir que 𝜎 2 = 0.06 (valor de la varianza insesgada encontrado en un estudio
inmediatamente anterior con una confianza del 95%?
3.4. Estime la varianza utilizando un intervalo de confianza con una confiabilidad del 95%. Para ello
utilice la siguiente ecuación:
(n − 1)SX2 (n − 1)SX2
ICσ2 =( 2 , 2 )
𝒳(n−1,1−α⁄ ) 𝒳(n−1, α⁄ )
2 2
3.5. Calcule un estimado del margen de error utilizando la ecuación:

Límite Superior del intervalo de confianza − Límite inferior del intervalo de confianza
ME =
2

De acuerdo con el valor encontrado ¿es adecuado o no el intervalo de confianza?

Ejercicio 4: Utilizando los datos y el contexto del ejercicio anterior responda las siguientes preguntas:

4.1. Estime la longitud media de la escama dorsal del pez dorado de Tumaco usando un intervalo de
confianza al 95% de confiabilidad y una varianza conocida 𝜎 2 = 0.06. Note que tiene menos de 30
datos.
4.2. Determine el margen de error del ejercicio 4.1. y haga una interpretación del mismo ¿es buena
la estimación por intervalo de la longitud media dorsal de la escama?
4.3. Estime la longitud media de la escama dorsal del pez dorado de Tumaco usando un intervalo de
confianza al 95% de confiabilidad y una varianza desconocida. Note que tiene menos de 30 datos.
4.4. Determine el margen de error del ejercicio 4.3. y haga una interpretación del mismo ¿es buena
la estimación por intervalo de la longitud media dorsal de la escama? ¿Cuál cree que es el mejor
estimador entre los intervalos encontrados en los ejercicios 4.1 y 4.3? Justifique
4.5. Determine el tamaño de muestra mínimo para tener un error máximo (margen de error) de 0.2
cm con una confianza del 95%. Asuma el tamaño mínimo de muestra debe ser más de 30

Ejercicio 5: Para determinar la relación entre el ingreso recibido por una familia y su consumo
promedio de calorías diarias se construyó la siguiente tabla de datos bivariados:

Ingresos M ensuales (smmv) 3 3.2 3.4 1 1.6 4.5 4.7 3.8 5.6 3.4 2 4.5 2.3 5.6 7 2.3 1.5 0.8 7.6 3
Consumo promedio de
calorías diarias (miles) 3 3.2 2.1 2.6 2.8 3.2 3.4 3.2 3.2 3.1 2.1 3.4 2.9 3.4 2.9 3.4 2.6 1.9 4 3.2

5.1. Construya el diagrama de dispersión haciendo explícita la variable dependiente y la


independiente ¿En qué se basó para hacer dicha escogencia?
5.2. Estime los valores de 𝑎 y de 𝑏 de la recta de regresión 𝑦 = 𝑎𝑥 + 𝑏 bajo el modelo de regresión
lineal simple. Interprete tales estimadores. Represente dicha recta en el diagrama de dispersión
presentado en el ejercicio 5.1.
5.3. Determine el coeficiente de correlación e interprételo.
5.4. Estime el valor de 𝜎 2 (la varianza del error en el modelo de regresión lineal simple) ¿la varianza
indica una buena calidad en las predicciones del modelo?
5.5. Calcule el coeficiente de determinación, 𝑅2 ¿El modelo de regresión lineal simple se ajusta a los
datos tomados?
5.6. Estime de acuerdo al modelo de regresión lineal simple cuál sería el consumo de calorías diario
(consumo esperado) de una familia si esta ganara 8 smmv.

Ejercicio 6: En un estudio realizado en un año anterior se encontró que la ganancia media de un


restaurante fue de $1058 diarios. Para este año se tomaron los siguientes datos correspondientes a la
ganancia diaria (en miles) en ciertos días

1, 2.3, 4, 0.6, 0.3, 0.8, 2, 0.3, 0.6, 0.7, 0.3, 1.5, 1.4, 1.6, 1.7, 1.7, 1.3, 2, 0.3, 0.3, 0.6, 0.8, 0.9, 1.4, 1.5,
1.4, 1.3, 0.1, 0.2, 0.4, 0.5, 0.7, 0.9, 0.7, 0.8

6.1. ¿Se puede afirmar con una confiabilidad del 95% que la ganancia media de este año es igual a la
ganancia media del año pasado? Asuma una varianza desconocida
6.2. ¿Se puede afirmar con una confiabilidad del 95% que la ganancia media de este año no superó la
ganancia media del año pasado? Asuma una varianza desconocida
6.3. Realice la prueba de hipótesis del ejercicio 6.1. usando una varianza conocida 𝜎 2 = 0.6
6.4. Realice la prueba de hipótesis del ejercicio 6.2. usando una varianza conocida 𝜎 2 = 0.6
6.5. Determine el tamaño de muestra mínimo para no tener un error mayor a $100 con una
confiabilidad del 95%

Ejercicio 7: Los siguientes corresponden a los resultados de una pregunta de una encuesta de
satisfacción; donde A significa “buen servicio”, B significa “servicio regular” y C “mal servicio”

A, B, B, B, A, A, A, A, B, B, B, B, B, B, A, B, A, B, A, B, B, B, B, A, A, A, A, A, A, B, B, A, A, A,
B, B, B, C, A, A, A, B, B, B, B, B, B, B, A, A, A, A, A, A, A, A, A, B, A, B, A, B, A, C, C, A, A, C,
C, C, C, C, C, A, A, B, B, A, C, C, C, A, A, A, C, B, B, B, C, A, B, C, A, C, A, A, A, C, C, A, B, B

7.1. Estimar (usando un intervalo de confianza al 95% de confiabilidad) la proporción de clientes que
sintieron que recibieron un buen servicio
7.2. ¿Cuál es el margen de error para los datos dados?
7.3. Si el año inmediatamente anterior se encontró que el 56% de los clientes recibieron un buen
servicio ¿se mantuvo igual o mejoró la calidad del servicio de la empresa con un 95% de
confiabilidad?
7.4. Determine el tamaño de la muestra asumiéndose que los datos presentados son heterogéneos
(describen perfectamente el comportamiento de la población). En este ejercicio tome 𝑝 = 𝑝̂ de manera
que se realizó una prueba piloto.
7.5. Consulte el valor de 𝑛 para el cual no se puede utilizar distribución normal para determinar el
intervalo de confianza y realiza la prueba de hipótesis, es decir, cuando para una proporción no se
tienen “grandes muestras”.
REFORZAMIENTO TEÓRICO (2.5/5.0)

La evaluación 4 parte II es un cuestionario de verdadero y falso. Escriba V (verdadero) o F (Fal-


so) con esfero de tinta no borrable según corresponda. NO SE CALIFICARÁ PROCEDIMIENTO
ALGUNO. RESPUESTA ESCRITA SIN ESFERO NO BORRABLE SERÁ ANULADA. Cada numeral
tiene un valor de 0.5/50 en la nota de la evaluación 4.

1. Un estimador es eficiente si su error cuadrático


 medio es cercano a cero.
máx(Xi )ni=1 si θ̂ = máx(Xi )ni=1
2. Si X1 , ..., Xn ∼ U (0, θ), el estimador θ̂ = es suficiente
0 en otro caso
3. Si a medida que aumentan la cantidad de variables aleatorias de los valores que toman los datos,
el estimador se aproxima al parámetro real entonces el estimador es consistente.
4. La media aritmética no les “cree” a todos los datos de la misma manera.
5. La media geométrica no es una medida de tendencia central
6. El cuantil α · 100 % de una variable aleatoria X es el valor q para el cual P (X = q) = α · 100 %
7. En un qqplot se tiene interés en hacer un análisis de regresión
8. Una medida de dispersión indica que tan lejano está un dato xi de la media aritmética.
9. En la práctica, la varianza muestral y la varianza poblacional nunca coinciden.
10. Si la curtosis es mayor que 3 se puede considerar que los datos tienen una concentración más
2
baja con respecto de una distribución normal de parámetros x̄ y SX
11. Un coeficiente de asimetrı́a distinto de 0 indica que la media aritmética y la media geométrica
no coinciden
12. Bajo la notación X1 , ..., Xn ∼ Distribución(P arámetros), se tiene que X1 , ..., Xn corresponden
a los datos de una sóla muestra.
13. El nivel de significancia α es siempre conocido (nunca supuesto) al momento de estimar un
parámetro por medio de un intervalo de confianza.
14. Para asumir una varianza conocida σ 2 = a se podrı́a realizar un intervalo de confianza para la
varianza y observando si a pertenece o no a dicho intervalo
15. Se tiene que asumir la varianza conocida para determinar el tamaño de una muestra para la
diferencia de medias con varianzas desconocidas pero iguales a nivel poblacional
16. Una prueba piloto es adecuada cuando se toman los datos ampliamente heterogéneos
17. Es necesario hacer prueba piloto para determinar el tamaño mı́nimo de la muestra para la
proporción de grandes muestras
18. Para realizar la prueba de hipótesis H0 : pA = pB Vs H0 : pA 6= pB es necesario conocer
únicamente el valor de pA − pB
19. La potencia de una prueba de hipótesis es la probabilidad de que se rechace la hipótesis nula
dado que esta es falsa
20. Si X1 , ..., Xn ∼ t(n) entonces se puede hacer una prueba de hipótesis para la media (con varianza
desconocida) dado en el curso si n > 30
21. Al tener mayor cantidad de datos se tendrá un margen de error más pequeño
22. Todos los intervalos de confianza son de la forma (Estimador puntual ∓ M arg en de error)
23. Una forma de rechazar la hipótesis nula es no rechanzado la hipótesis alternativa
24. Para calcular el estadı́stico de prueba de una prueba de hipótesis es necesario tener propuesto el
valor del parámetro real
25. Para calcular el p − valor se necesita conocer el valor del nivel de significancia
26. Los estimadores µ̂ = x̄ y σ 2 = V ar(X) son  insesgados si X1 , ..., Xn ∼ N (µ, σ 2 )
máx(Xi )i=1 si θ̂ = máx(Xi )ni=1
n
27. Si X1 , ..., Xn ∼ U (0, θ), el estimador θ̂ = no es suficiente
0 en otro caso
28. El estimador para el parámetro σ 2 (X ∼ N (µ, σ 2 )) dado por σ 2 = V ar(X) es insesgado.
29. Para calcular la mediana no considera los datos atı́picos.
30. Es recomendable usar la moda como medida de tendencia central si se tienen datos bimodales.
31. El primer cuartil de una variable aleatoria X es el valor q para el cual P (X ≤ q) = 0,20
32. Si en un qqplot los puntos están cercanos a la recta y = x entonces se puede considerar que los
datos siguen la distribución teórica comparada.
33. La varianza poblacional y la varianza muestral son distancias promedio de los datos a x̄
34. La desviación media indica que tan distante está un dato xi de la media aritmética.
35. Si la curtosis es menor que 3 se puede considerar que los datos tienen una concentración más
2
alta con respecto de una distribución normal de parámetros x̄ y SX
36. Un coeficiente de asimetrı́a igual a 0 indica que la media y la moda coinciden.
37. Bajo la notación X1 , ..., Xn ∼ Distribución(P arámetros), se tiene que inicialmente la distribu-
ción y los parámetros son conocidos.
38. Para asumir una varianza conocida σ 2 = a se podrı́a realizar una prueba de hipótesis para
verificar H0 : σ 2 = a con una significancia relativamente baja
39. Se tiene que asumir la varianza conocida para determinar el tamaño de una muestra para la
media
40. Una manera de hacer una prueba piloto es considerar el comportamiento de algunos datos de
fácil extracción como el comportamiento general de toda la población
41. No es necesario hacer prueba piloto para determinar el tamaño mı́nimo de la muestra para la
diferencia de proporciones de grandes muestras
42. Para realizar la prueba de hipótesis H0 : pA = pB Vs H0 : pA 6= pB es necesario conocer
únicamente los valores de pA y pB
43. La potencia de una prueba de hipótesis es la probabilidad de que se rechace la hipótesis nula
dado que esta es verdadera
44. Si X1 , ..., Xn ∼ P (λ) entonces se puede hacer una prueba de hipótesis para la media (con varianza
conocida) dado en el curso si λ > 30
45. El margen de error es el nivel de significancia
46. En el margen de error del cociente de varianzas propuesto en clase asume que el punto del medio
del intervalo de confianza es el estimador puntual
47. Una forma de rechazar la hipótesis nula es observado que p − valor > N ivel de signif icancia
48. Para calcular el intervalo de confianza es necesario tener propuesto el valor del parámetro real
49. Si el nivel de significancia disminuye, también lo hará la potencia de la prueba
50. El nivel de significancia α es asignado de acuerdo a la certeza que se tenga de la toma y la
medición de los datos

También podría gustarte