Documentos de Académico
Documentos de Profesional
Documentos de Cultura
TRABAJO PRÁCTICO Nº 1
MANEJO DE DATOS Y ESTADÍSTICA DESCRIPTIVA
Problema 2. Este problema forma parte de las TAREAS OBLIGATORIAS que deben responderse
a través del campus
Definir las variables aleatorias que permitan estudiar las siguientes situaciones e indicar la unidad
experimental, la población y la población estadística.
2.1- Se quiere estudiar la hipótesis de que el tamaño del caparazón de ejemplares de tortuga
Testudo chilensis de La Pampa es isométrico. Para ello, se estudia la relación entre el ancho y el
alto del caparazón.
2.2.- Un entomólogo está interesado en estimar la cantidad de especímenes deteriorados en cajas
entomológicas con cinco ejemplares cada una, ubicadas en el Museo Argentino de Ciencias
Naturales Bernardino Rivadavia.
2.3.- En el Partido de Exaltación de la Cruz, Provincia de Buenos Aires, se desea estimar la
cantidad de gallinas parasitadas por granja.
1
Biometría 2024 FCEN - UBA
2.4.- Para una campaña publicitaria en la Provincia de Buenos Aires, se está interesado en estudiar
la relación entre el hábito de fumar (no fumador, ex fumador o fumador) y el haber tenido infarto de
miocardio en individuos mayores de 50 años.
2.5.- Para un estudio genético realizado en el Laboratorio de Genética de la FCEN, se desea
comparar la fecundidad de dos cepas de Drosophila melanogaster. Se registra la cantidad de
huevos depositados por hembra en un grupo de 50 hembras, de las cuales 25 pertenecen a una
cepa (SS) y 25 a otra (NS) de Drosophila melanogaster.
2.6.- Para un estudio nutricional, se quiere comparar el efecto de tres dietas con distinto
suplemento proteico sobre la ganancia de peso en cerdos de la raza A.
Problema 3. La araucaria o pehuén (Araucaria araucana) es una especie arbórea endémica de los
bosques del extremo noroeste de la Patagonia argentina y chilena, distribuida en zonas muy
restringidas de la cordillera de los Andes. Es una especie de alto valor de conservación en ambos
países y desde 2001 se encuentra incluida en el listado de CITES (Convención Internacional de
Tráfico de Especies Silvestres), principalmente debido a la disminución de su área de distribución.
Se realizaron ensayos prospectivos en laboratorio con el fin de evaluar la capacidad germinativa de
semillas colectadas en la localidad de Caviahue (Neuquén). Para ello, se sembraron las semillas en
bandejas con solo seis lugares (una semilla por lugar) usando un suelo de tipo arcilloso como
sustrato. Al cabo de un tiempo se tomó una muestra aleatoria de 50 bandejas y se contó la
cantidad de semillas germinadas por bandeja con los siguientes resultados:
1 3 2 0 5 1 5 2 5 3
2 4 3 1 2 3 4 0 2 3
6 3 4 3 6 4 3 2 1 4
4 3 3 3 1 5 4 3 2 5
0 6 5 3 6 3 2 4 3 4
2
Biometría 2024 FCEN - UBA
5.1.- Definir la variable aleatoria, la unidad experimental y especular cuál podría ser la población.
5.2.- La siguiente figura muestra un histograma común y un histograma de áreas donde la
frecuencia ha sido representada como el número de casos por año de edad para cada intervalo.
Interpretar la información que proporciona la ordenada en cada caso. ¿Cuál de los dos tipos de
histograma representa más adecuadamente la información entregada? Justificar.
3
Biometría 2024 FCEN - UBA
Problema 7. Los pozos frecuentemente son la única fuente de agua para la población humana en
extensas zonas del Gran Buenos Aires (GBA). Los microorganismos, incluidos bacterias, virus,
hongos y parásitos, pueden contaminar el agua subterránea que abastece los pozos, siendo su
principal origen la materia fecal de aguas residuales procedente de seres humanos y animales. La
forma más habitual de detectar contaminación por heces es a través de la detección de bacterias
coliformes en el agua del pozo. El Código Alimentario Argentino ha establecido que aguas con a lo
sumo 3 bacterias coliformes en 100 ml serán aptas para el consumo humano. En una localidad del
GBA que carece de agua corriente se determinó la cantidad de bacterias coliformes en muestras de
100 ml de agua extraída de pozos para uso doméstico. Los resultados se encuentran en el archivo
“BD_bacterias.txt”.
7.1.- Definir la variable, clasificarla, determinar cuál es la unidad experimental y si se trata de una
muestra o de una población. Justificar la respuesta. A través de una tabla de frecuencias y un
gráfico, señalar la forma de la distribución de la variable de interés.
7.2.- Detectar qué porcentaje de pozos en esta localidad no estará apto para el consumo humano.
7.3.- Determinar cuál es el promedio de bacterias coliformes en los pozos con agua potable. Indicar
el promedio en los no potables y el promedio general. Ayuda: para realizar los cálculos hay que
dividir la base de datos en dos grupos: ≤3 colonias y >3 colonias. En R se puede usar la función
“subset()”, que permite una selección del objeto (vector, matriz, data.frame) indicado según un
determinado criterio. Por ejemplo, “subset(Data,colonias > 3)” selecciona las observaciones
cuyo número de colonias es mayor a 3. Más información en:
https://www.statmethods.net/management/subset.html
7.4.- Determinar en qué tipo de pozo (potable/no potable) la cantidad de bacterias/100 ml es más
homogénea.
7.5.- Identificar cuál es la cantidad de bacterias/100 ml más frecuente.
7.6.- Determinar el tipo de asimetría de la distribución.
Problema 8. En una empresa hay 600 empleados que cobran $350.000; 400 que cobran $450.000;
100 que perciben $800.000 y los 5 gerentes que perciben $5.000.000 cada uno. Calcular la media,
la mediana y la moda. Discutir qué estadístico estima mejor cuánto cobran en general los
empleados de la empresa.
Problema 9. Dentro del manejo de un relleno sanitario es necesario monitorear múltiples variables,
entre ellas la calidad de los líquidos lixiviados, dado que los mismos constituyen una potencial
fuente de contaminación del suelo y el agua. Conocer sus características físicas y químicas resulta
relevante para determinar el tipo de tratamiento a efectuarles. Se tomaron muestras de líquido
lixiviado de diferentes módulos de un relleno sanitario y entre otras variables se determinó su
conductividad específica (S/cm). Nota: los módulos constituyen unidades operativas independientes
de un relleno sanitario. Los resultados se encuentran en el archivo “BD_conductividad.txt”.
9.1.- Definir y clasificar la variable.
9.2,- ¿A qué población representa la muestra?
Biometría 2024 FCEN - UBA
9.3.- Identificar, a través del gráfico que considere más adecuado, si existen datos atípicos.
9.4.- Señalar a través de un gráfico la forma de la distribución de esta variable y calcular los
estadísticos de tendencia central en el conjunto de datos originales y eliminando el o los datos
atípicos si los hubiera. Interpretar en contexto los valores obtenidos. ¿Cuál representaría mejor las
observaciones en cada caso? Justificar.
9.5.- Del 30% de las observaciones de menor conductividad, ¿cuál es el valor máximo aproximado
de conductividad?
Problema 10. Como parte de un estudio para comparar la variabilidad del peso de semillas de
cierta especie vegetal en un hábitat restringido con el de otra especie caracterizada por sobrevivir
en un amplio rango de ambientes, se obtuvieron los siguientes datos:
Genotipo AA Aa aa
Machos 6 11 5
Hembras 7 13 8
2
Biometría 2024 FCEN - UBA
12.2.1.- Graficar los diagramas de barras para: i) los tres genotipos de machos; ii) los tres
genotipos de hembras; iii) los tres genotipos sin discriminación de sexo.
12.2.2.- ¿Qué conclusiones pueden sacarse de la observación de los gráficos anteriores?
12.2.3.- ¿Se puede concluir a partir de esta muestra que en la población hay más hembras
que machos para cada uno de los genotipos?
12.2.4.- ¿Se puede concluir a partir de esta muestra que en la población lo más abundante es
hembras con genotipo Aa?
Problema 13. Un docente de Biometría tiene que corregir 20 exámenes. Como el primer ejercicio,
a pesar de ser sencillo, demanda demasiadas cuentas, decide no hacerlo y estima el resultado
verdadero a partir de los resultados de los 20 alumnos. ¿Qué estadístico de tendencia central
debería utilizar?
Problema 14. Analizar y discutir la afirmación "La Estadística enseña que: si Pedro se come dos
pollos y Juan ninguno, esto equivale a que coma un pollo cada uno". (Sugerencia: calcular la
desviación estándar en la situación en la que uno consume dos pollos y el otro ninguno, y
compararla con la situación en la cual ambos consumen un pollo).
Problema 15. Veinte personas adultas sanas de entre 30 y 40 años participaron en un estudio en
un centro asistencial para evaluar el efecto de cierto régimen de salud específico, que incluye dieta
y ejercicio, en los niveles de colesterol sanguíneo. Se seleccionaron 10 de estas personas de
manera aleatoria para el grupo control, mientras que las otras 10 fueron asignadas al grupo
tratamiento, durante un período de 6 meses. Los siguientes datos muestran la reducción en los
niveles de colesterol que experimentaron los 20 individuos en este período (en dg/ml). Los valores
positivos indican una disminución en el colesterol al final del ensayo, mientras que los valores
negativos indican un aumento del mismo.
Control 6 1 4 5 3 2 0 5 5 -1
Tratados 5 1 7 5 6 6 5 4 -37 7
15.1.- Para ambos conjuntos de datos, definir y clasificar la variable aleatoria, identificar la unidad
experimental, muestra(s) y población(es). ¿Se trata de un estudio experimental u observacional?
15.2.- Explicar por qué la diferencia entre las medias de ambos grupos sugiere una conclusión
acerca del efecto del régimen, mientras que la diferencia entre las medianas sugiere otra.