Está en la página 1de 74

Guía de Clases

Prácticas 2023

BIOESTADÍSTICA I

Ejercicios prácticos recopilados y editados por los docentes del


Departamento de Bioestadística.
ÍNDICE

INTRODUCCIÓN .................................................................................................................................................4
OBJETIVO GENERAL ........................................................................................................................................5
PROGRAMA .......................................................................................................................................................5

ESTADÍSTICA DESCRIPTIVA ........................................................................................................................ 9


Conceptos previos para trabajar en clase ........................................................................................................................... 9
Ejercicios .............................................................................................................................................................................. 9
Ejercicios suplementarios .................................................................................................................................................. 17

PROBABILIDAD ............................................................................................................................................ 23
Conceptos previos a trabajar en clase ............................................................................................................................... 23
Ejercicios ............................................................................................................................................................................ 24
Ejercicios suplementarios ................................................................................................................................................ 299

DISTRIBUCIONES DE PROBABILIDAD .................................................................................................. 33


Conceptos previos a trabajar en clase ............................................................................................................................... 33
Ejercicios ............................................................................................................................................................................ 34
Ejercicios suplementarios .................................................................................................................................................. 38

MUESTREO Y DISTRIBUCIONES EN EL MUESTREO........................................................................ 40


Conceptos previos a trabajar en clase ............................................................................................................................... 40
Ejercicios ............................................................................................................................................................................ 40

ESTIMACIÓN DE MEDIAS Y PROPORCIONES....................................................................................... 43


Conceptos previos para trabajar en clase ........................................................................................................................ 43
Ejercicios ............................................................................................................................................................................ 43

VERIFICACIÓN DE HIPÓTESIS - INTRODUCCIÓN - UNA MUESTRA .............................................. 47


Conceptos previos ............................................................................................................................................................. 47
Ejercicios ............................................................................................................................................................................ 47
Ejercicios Complementarios .............................................................................................................................................. 50

PRUEBA DE HIPÓTESIS PARA DOS MUESTRAS.................................................................................. 51


Conceptos previos a trabajar en clase ............................................................................................................................... 51
Ejercicios ............................................................................................................................................................................ 51

ANÁLISIS DE VARIANZA (ANOVA) ......................................................................................................... 56


Conceptos previos a trabajar en clase ............................................................................................................................... 56
Ejercicios ............................................................................................................................................................................ 56

APLICACIONES DE CHI CUADRADO........................................................................................................ 57


Conceptos previos a trabajar en clase .............................................................................................................................. 57
Ejercicios ............................................................................................................................................................................ 57

pág. 2
REGRESIÓN Y CORRELACIÓN LINEAL SIMPLE.................................................................................... 58
Conceptos previos a trabajar en clase ............................................................................................................................... 58
Ejercicios ............................................................................................................................................................................ 58

TABLAS Y FÓRMULAS ................................................................................................................................. 63


Fórmulas para descriptiva ............................................................................................................................................... 64
Fórmulas para Probabilidad ............................................................................................................................................. 65
Relación entre las distribuciones ....................................................................................................................................... 66
Tabla de Números Aleatorios ............................................................................................................................................ 66
Proporciones y Medias un grupo ....................................................................................................................................... 67
Proporciones y Medias dos grupos.................................................................................................................................... 68
ANOVA ............................................................................................................................................................................... 69
Asociación Lineal ............................................................................................................................................................... 69
Aplicaciones Chi2 ................................................................................................................................................................................................................................................70
Tabla Distribución Normal Estandar.................................................................................................................................. 71
Tabla Distribución t de Student ......................................................................................................................................... 72
Tabla Distribución F α=0.05 ............................................................................................................................................... 73
Tabla Distribución F α=0.01 ............................................................................................................................................... 74
Tabla Distribución 2 .......................................................................................................................................................................................................................................75

pág. 3
INTRODUCCIÓN

Docentes del Curso


José Piaggio Valerie Cayssials Fernando Vila
Pablo E. Bobadilla Ignacio Alcántara Vernadet Bianchinotti
Martín Díaz Micaela Garcén Nicole Rosenstock Mariana Barros

Fundamentación del curso


Todas las actividades racionales que implican toma de decisiones necesitan contar con
información a los efectos de elegir la mejor de las opciones. Así se han popularizado las investigaciones
de mercados, las encuestas de opinión, la creación de bases de datos y las técnicas de muestreo que nos
permiten a través del estudio de una pequeña parte de la población tener una idea de lo que pasa en el
conjunto de la misma.
La ciencia que se dedica a la planificación de la toma de datos, al control de su calidad, al
procesamiento de los mismos y a sacar conclusiones dentro de algunos márgenes de errores es la
Estadística. Las actividades profesionales de los veterinarios son extremadamente variadas pero en el
actual Plan de Estudios se definen tres, que abarcan las áreas de Medicina, Producción y Tecnología de
los Alimentos. Sin pretender agotar las aplicaciones de la Bioestadística a estas tres grandes áreas
mencionaremos algunas a modo de ejemplo.
En el área médica es fundamental la aplicación de pruebas diagnósticas de las cuales a través de
estudios de probabilidad podremos determinar su grado de certeza o error tanto cuando tienen un
resultado negativo como cuando el mismo es positivo. También deberemos realizar un estudio de
probabilidad cuando se realice un análisis de riesgo para determinar la probabilidad de exportar o
importar una enfermedad grave a través de animales o productos de este origen. La aprobación y el
control de calidad de drogas para uso en animales deberán ser realizados a través de ensayos
experimentales donde la bioestadística juega un rol preponderante en su planificación, procesamiento y
evaluación. Los sistemas de monitoreo y vigilancia de las enfermedades animales descansan sobre la
planificación, procesamiento o interpretación de los mismos donde la Bioestadística es una protagonista
de primer nivel.
En el área de producción animal, la alimentación, el mejoramiento genético, la reproducción, la
prevención sanitaria, la administración, la gestión económica, el conocimiento del mercado y las
apetencias del consumidor es la clave del éxito. La Bioestadística juega roles en cada una de estas
actividades toda vez que se deba planificar la toma de datos, su recolección, procesamiento e
interpretación. La actividad de cada una de las subáreas mencionadas será controlada al nivel de cada
explotación a través de indicadores (producción por hectárea, intervalo interpartos, velocidad de
crecimiento, respuesta a la selección, tasas de retorno, etc.) los cuales requieren para su elaboración e
interpretación el conocimiento básico de bioestadística
Las ciencias de los alimentos implican muchos aspectos, uno de los aspectos sobre el cual cabe
al profesional veterinario la mayor responsabilidad es el de la seguridad alimentaria en la que la mayoría
de las veces los problemas son atacados con la metodología llamada análisis y control de puntos críticos
(HACCP), la que implica determinar los aspectos de riesgo en cada una de las etapas del proceso y su
manejo. Las actividades de control de calidad, que tienen un lugar muy destacado en la industria de los
alimentos y en los sistemas productivos están basadas en principios de control estadístico.
En conclusión los principios estadísticos son de aplicación universal y toda vez que se quiera
adquirir datos y utilizar información habrá que recurrir a sus bases y metodología.

pág. 4
Curso de Bioestadística I – 1er. año
OBJETIVO GENERAL
Al finalizar el curso de Bioestadística el estudiante estará capacitado para describir y resumir datos de
interés veterinario. Podrá interpretar estadísticamente los trabajos de investigación del área
veterinaria. Comprenderá los principios estadísticos básicos del diseño experimental aplicable a las
poblaciones de interés zootécnico.

PROGRAMA
1. Introducción a la Bioestadística.
Objetivo:
Al finalizar esta unidad el estudiante será capaz de:
1.1 Definir Bioestadística y dar ejemplos de sus aplicaciones en Veterinaria.
1.2 Reconocer y dar ejemplos de diferentes tipos de variables de interés en Veterinaria.
1.3 Identificar y dar ejemplos de las diferentes escalas de medidas.
Contenido:
1.1 Definiciones, historia y principios de la bioestadística.
1.2 Variabilidad biológica. Concepto de Variables.
1.3 Tipos de variables y Escalas de medidas.

2. Descripción de datos.
Objetivos:
Al finalizar esta unidad el estudiante será capaz de:
2.1 Calcular medidas de tendencia central
2.2 Calcular medidas de dispersión.
2.3 Identificar y comparar métodos numéricos para resumir datos.
2.4 Evaluar las ventajas y limitaciones de los métodos gráficos y tabulares para la organización y
resumen de datos.
Contenidos:
2.1 Medidas de tendencia central
2.2 Medidas de dispersión.
2.3 Métodos gráficos.

3. Probabilidad.
Objetivos:
Al finalizar esta unidad el estudiante será capaz de:
3.1 Definir que es la probabilidad y describir ejemplos de aplicación veterinaria de sus principios.
3.2 Calcular probabilidades para situaciones simples.
3.3 Calcular probabilidades para situaciones con combinaciones de eventos.
Contenidos:
3.1 Eventos, Espacios muestrales y probabilidad.
3.2 Principios básicos de la probabilidad y sus aplicaciones.

4. Distribución de Variables Discretas.


Objetivos:
4.1 Al finalizar esta unidad el estudiante será capaz de:
4.2 Describir las distribuciones Binomial y de Poisson.
4.3 Calcular probabilidades aplicando estas distribuciones.
4.4 Analizar situaciones veterinarias donde se apliquen estas distribuciones.
Contenidos:
4.1 Binomial.
4.2 Poisson.
5. Distribución de Variables Continuas.
Objetivos:

pág. 5
5.1 Al finalizar esta unidad el estudiante será capaz de:
5.2 Conocer las diferencias básicas entre las distribuciones discretas y continuas.
5.3 Describir las principales características de la distribución normal.
5.4 Transformar una distribución normal en una estándar.
5.5 Utilizar la distribución normal para estimar probabilidades binomiales.
Contenidos:
5.1 Distribución Uniforme.
5.2 Distribución Normal.
5.3 Aproximación de la distribución normal a la binomial.

6. Distribución del muestreo.


Objetivos:
Al finalizar esta unidad el estudiante será capaz de:
6.1 Describir situaciones donde el muestreo es el método de estudio indicado.
6.2 Describir los métodos de obtención de muestras aleatorias.
6.3 Analizar la relación entre parámetros y estadísticos.
Contenidos:
6.1 Poblaciones y muestras.
6.2 Parámetros y Estadísticos
6.3 Muestreo aleatorio
6.4 Propiedades de la distribución en el muestreo.
6.5 Teorema Central del límite.

7. Estimaciones y Pruebas de Hipótesis para una muestra.


Objetivos:
Al finalizar esta unidad el estudiante será capaz de:
7.1 Analizar el concepto de estimación.
7.2 Calcular y comparar estimadores de punto e intervalo.
7.3 Evaluar como es afectada una estimación por el tamaño de la muestra, la dispersión muestral y
el nivel de confianza.
7.4 Formular hipótesis para diferentes situaciones.
7.5 Describir los posibles errores en una prueba de hipótesis.
7.6 Plantear ejemplos veterinarios para analizar, calcular e interpretará los componentes de una prueba
de hipótesis.
Contenidos:
7.1 Estimadores de punto y de intervalo.
7.2 Tamaños muestrales.
7.3 Prueba de hipótesis para muestras grandes.
7.4 Errores tipo I y II.
7.5 Niveles de significación.
7.6 Inferencias con muestras chicas.

8. Prueba de hipótesis para dos muestras.


Objetivos:
Al finalizar esta unidad el estudiante será capaz de:
8.1 Identificar cuando se trata de muestras independientes o no.
8.2 Formular hipótesis adecuadas para las diferentes situaciones.
8.3 Realizar las prueba de hipótesis para dos muestras.
8.4 Interpretar los resultados de la prueba de hipótesis.
Contenidos:
8.1 Inferencias acerca de 2 medias poblacionales con muestras independientes.
8.2 Inferencias acerca de 2 medias poblacionales con muestras apareadas.
8.3 Inferencias acerca de diferencias entre 2 proporciones.

pág. 6
9. Comparando más de dos medias. Análisis de Varianza.
Objetivos:
Al finalizar esta unidad el estudiante será capaz de:
9.1 Describir los elementos estadísticos de un diseño experimental.
9.2 Definir el objetivo de un análisis de varianza.
9.3 Formular hipótesis adecuadas para las diferentes situaciones.
9.4 Describir la distribución de F.
9.5 Construir la tabla de análisis de varianza.
9.6 Calcular F e interpretar los resultados de la prueba de hipótesis.
Contenidos:
9.1 Elementos del diseño de experimentos.
9.2 Supuestos para la aplicación del análisis.
9.3 Análisis de varianza simple.
9.4 Análisis de varianza de dos vías.

10. Chi cuadrado.


Objetivos:
Al finalizar esta unidad el estudiante será capaz de:
10.1 Describir situaciones donde es adecuado la utilización de la prueba de Chi cuadrado.
10.2 Formular hipótesis adecuadas para las diferentes situaciones.
10.3 Calcular la prueba de Chi cuadrado e interpretar los resultados.
10.4 Identificar situaciones donde deba realizar estimaciones de riesgo.
10.5 Estimar e interpretar el riesgo relativo.
Contenidos:
10.1. Distribución de Chi cuadrado.
10.2. Tablas de contingencia.
10.3. Estimación de Riesgo. Razón de Probabilidad.

11. Correlación y Regresión Lineal Simple.


Objetivos:
Al finalizar esta unidad el estudiante será capaz de:
11.1. Definir la finalidad de un análisis de regresión.
11.2. Definir la finalidad de un análisis de correlación.
11.3. Describir los componentes de una ecuación lineal.
11.4. Calcular las rectas de regresión y los coeficientes de correlación.
11.5. Interpretar los resultados.
Contenidos:
11.1. Ecuación lineal.
11.2. Ajuste de mínimo cuadrados.
11.3. Supuestos para la aplicación del análisis.
11.4. Estimación y predicción.

pág. 7
SISTEMA DE EVALUACIÓN
Durante el curso se realizarán dos pruebas parciales presenciales, con un valor máximo de 35 y 55
puntos y 10 puntos de Evaluación continua en la plataforma EVA.

Ganancia de curso (habilitación para rendir examen): 80 % asistencia a clases prácticas y 50 puntos
a obtenerse entre los parciales y las evaluaciones de EVA.

Exoneración: >75 puntos como mínimo en la suma de las actividades propuestas.

Aprobación de examen: 60 puntos como mínimo en una prueba escrita de valor máximo 100.

Bibliografía y recursos
Biometría - Robert R, Sokal, F. James Rohlf. 1979 H. Blume Ediciones
Bioestadística Médica - Beth Dawson-Saunders, Robert G. Trapp 1993.
Editorial El Manual Moderno.
Métodos Estadísticos - George W. Snedecor y William G. Cochran 1975
Editorial CECSA.
Estadística matemática con Aplicaciones - William Mendenhall, Dennis D.
Wackerly, Richard L. Scheaffer - 1994 Grupo editorial Iberoamérica.
Bioestadística - Principios y Procedimientos. Robert G. D. Steel, James H.
Torrie 1988. Editorial Mc Graw Hill. 3ª edición.
Bioestadística, Base para el análisis de las ciencias de la salud. - Wayne
W. Daniel. 1997 UTEHA Noriega Editores
Estadística 2ª edición - Murray R. Spiegel. 1991 McGraw Hill
Estadística para Administración y Economía. 8ª edición Robert Mason,
Douglas Lind. 1998 Alfaomega Grupo Editor S.A
Principios de Bioestadística. - Marcelo Pagano, Kimberlee Gauvreau. 1993
Duxury Press

Sitio Web (plataforma EVA): http://eva2.fvet.edu.uy/moodle/

pág. 8
Estadística descriptiva
Objetivos – UD1 y 2
Al finalizar esta unidad, el estudiante será capaz de:
 Reconocer y dar ejemplos de diferentes tipos de variables de interés en Veterinaria
 Identificar y dar ejemplos de las diferentes escalas de medidas
 Saber representar, de acuerdo al tipo de variable en estudio, el grafico correspondiente
 Calcular medidas de resumen: de tendencia central, de dispersión y de asimetría
 Identificar y comparar métodos numéricos para resumir datos
 Evaluar las ventajas y limitaciones de los métodos gráficos y tabulares para la organización y
resumen de datos

Conceptos previos para trabajar en clase


1. ¿Qué se entiende por variable aleatoria? ¿Por qué las variables que se miden en Veterinaria
son aleatorias? ¿Qué consecuencias prácticas tiene la aleatoriedad de las variables?
2. ¿Cuáles son las escalas de medida de las variables? Explique las propiedades de cada una de
ellas y de ejemplos.
3. ¿Cuáles son los dos grandes tipos de variables, según la forma de expresión de sus valores?
A su vez, se pueden subdividir en subtipos de acuerdo a sus propiedades: enumérelos y
explique qué propiedades tiene cada uno de ellos. De ejemplos.
4. ¿Qué significan las expresiones: población y muestra? Dé ejemplos.
5. Es frecuente considerar las variables continuas como discretas (y viceversa) ¿Por qué y en
qué condiciones es válido (o necesario)?
6. Cuando se habla de frecuencias, se distinguen los conceptos: absoluta versus relativa y
simple versus acumulada. Explique el significado de estos conceptos. De ejemplos de cada uno
de ellos y de sus combinaciones.
7. Las observaciones de una variable numérica se pueden agrupar en clases. ¿En qué casos y
con qué finalidades es preferible agrupar a no hacerlo? ¿Cuáles son los valores óptimos del
número de clases según las distintas situaciones y necesidades?
8. Los intervalos de clase en que se agrupan las observaciones de una variable numérica
pueden ser cerrados o semiabiertos (semicerrados). ¿Qué significan estos conceptos? ¿Cuándo
es más conveniente el uso de uno u otro tipo de intervalo? Dé ejemplos.
9. ¿Qué significan las expresiones - referidas a un intervalo de clase de observaciones
agrupadas- : límite inferior, límite superior, límite real, límite aparente, amplitud total, marca de
clase? Dé ejemplos.
10. ¿Cuáles son los gráficos adecuados según cada tipo de variable? Dé ejemplos.
11. ¿Qué es un diagrama de caja? ¿Para qué sirve? Dé un ejemplo.
12. ¿Cuáles son los gráficos más comunes para representar distribuciones de frecuencias
simples de variables discretas sin y con agrupamiento? De ejemplos.
13. ¿Cuáles son los gráficos más comunes para representar distribuciones de frecuencias
simples de variables continuas? Dé ejemplos.
14. ¿Cuáles son los gráficos más comunes para representar distribuciones de frecuencias
acumuladas de variables discretas y continuas? Dé ejemplos.

pág. 9
Medidas de resumen
1. ¿Por qué es conveniente utilizar medidas de resumen?
2. ¿A qué aspectos de la distribución se refieren las medidas de resumen más comunes?
3. ¿Cuáles son las medidas de tendencia central más usadas?
4. ¿Qué es la media aritmética? ¿La mediana? ¿La moda?
5. ¿Cuándo es preferible el uso de la media aritmética?
6. ¿Cuándo es preferible el uso de la mediana?
7. ¿Cuándo es preferible el uso de la moda?
8. ¿Cuáles son las medidas de dispersión más usadas?
9. ¿Qué es la varianza? ¿Qué es la desviación típica?
10. ¿Qué es el coeficiente de variación?
11. ¿Qué es el semirecorridointercuartílico?
12. ¿Qué es la amplitud total?
13. ¿Qué es una separatriz (cuantil)?
14. ¿Cuándo es preferible el uso de Q? ¿La amplitud total? ¿La desviación típica?
15. ¿Qué es un coeficiente de asimetría (sesgo)?
16. ¿Cuál es la relación entre media, mediana y moda en una distribución según el signo de su
asimetría?
17. ¿Qué es curtosis (apuntamiento)?
18. ¿Cuándo se dice que una distribución es lepto, meso o platicúrtica?

Ejercicios para clase.

1. a.- Indicar en el gráfico: Mediana, P75 Fr


b.- Representar la frecuencia simple
relativa con un polígono de frecuencia.

Recordando que:
* La Mn = P50
* El polígono de frecuencias simples se realiza
con el punto medio (o marca de clase).

0 10 20 30 40 50

2.- Dado el siguiente rol (datos ordenados de menor a mayor) estadístico:


0 5 11 13 17 20 23 26 28 32 33 33 36 39
43 44 45 48 48 49 51 53 56 56 57 58 59 64
64 64 67 69 72 75 75 78 81 85 89 90 94

2.a. ¿De qué tipo de variable cree que se trata?


2.b. Confeccione una tabla de frecuencias agrupadas en intervalos semiabiertos de amplitud 10
2.c. Calcule media, moda y mediana, rango, varianza, desvío, percentiles 25, 50, 75 y 80 para los
datos sin agrupar y agrupados.

3. Comente los resultados de los ejercicios 2.a y 2.b

pág. 10
4. De acuerdo al histograma de frecuencias simples, determinar límite inferior del intervalo de clase que
contiene la moda, tamaño de la muestra, calcular la media y la desviación típica y representarlas en la
gráfica

f
35
30 Li Mo =
25 n=
20
15 media =
10
desv. típica =
5
0
0 5 10 15 20 25 x

5. Un veterinario está interesado en investigar el efecto de la dieta sobre el tiempo de coagulación en


vacas lecheras. Para eso se selecciona al azar 72 vacas y a su vez al azar se las asigna a la dieta A o B.
Los datos siguientes muestran los tiempos de coagulación de la sangre de los animales de las dos dietas.
DIETA A: 57.4 58.2 58.7 58.9 59.0 59.8 60.4 DIETA B: 66.8 67.4 71.2 64.2 65.3 73.2 66.2
60.8 61.2 61.4 61.5 61.9 62.1 62.3 62.3 62.3 75.2 67.7 68.3 66.9 65.8 71.1 67.3 68.3 67.9
62.6 62.6 62.7 62.8 62.9 63.0 63.2 63.3 63.4 70.5 70.7 62.4 69.4 72.5 62.8 70.1 65.2 67.9
63.9 64.0 64.3 64.6 64.6 64.8 64.8 65.1 65.7 62.1 71.8 67.2 65.9 64.2 68.1 67.2 69.1 69.4
66.0 66.1 75.6 77.0
5.a.- Determine la amplitud total de los tiempos de coagulación para cada una de las dietas.
5.b.- Agrupe los tiempos de coagulación de los individuos de la dieta A en forma conveniente y
realice la tabla de frecuencias.
5.c.- Determine las marcas de clase de cada uno de los intervalos.

6. En un establecimiento productor de cerdos se analizó el tamaño de camada (Nº de lechones al


parto) de un grupo de 84 cerdas y se obtuvo los siguientes resultados:

2, 2, 3, 3, 3, 3, 3, 3, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 6, 6, 6, 6, 6, 6, 6, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 8, 8, 8, 8, 8,
8, 8, 8, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 10, 10, 10, 10, 10, 10, 11, 11, 11, 11, 11, 12, 12, 12, 12, 12,
13, 13, 13, 13, 14, 14, 14, 14, 15, 16, 16, 16,16.

6.a.-¿Qué tipo de variable es el tamaño de camada ?


6.b.-¿Cuál es la escala de medida?
6.c.- Haga una tabla con la distribución de frecuencias.
6.d.- Represente gráficamente la frecuencia simple en función del tamaño de la camada.

7. Dentro de la producción de ganadería de carne se encuentran 3 tipos de establecimientos; los que


se dedican al engorde y por lo tanto tienen un alto porcentaje de novillos en sus rodeos, los que se
dedican a la cría y por lo tanto tienen un alto porcentaje de vacas y los que hacen el ciclo completo y
tienen porcentajes intermedios de novillos y vacas. En el Uruguay se muestrearon 260
establecimientos de 3 regiones representativas llamadas A, B, C, y se obtuvieron los siguientes
resultados:

pág. 11
- En la región A se contaron 4000 novillos y 2000 vacas.
- En la región B se contaron 2500 novillos y 2500 vacas.
- En la región C se contaron 4000 novillos y 8000 vacas.

7.a.- Explique en qué escala de medida se expresa la variable tipo de establecimiento


7.b.- Construya una tabla con los porcentajes de novillos por región según las categorías de novillos
y vacas.
7.c.- En función de los resultados, ¿cómo calificaría cada región desde el punto de vista de su
especialización ganadera ?
7.d.- Construya un gráfico que muestre la distribución de las categorías (novillos y vacas) para la
región C.
7.e.- Construya un gráfico diferente que muestre la distribución de las categorías (novillos y vacas)
para la región B.
7.f.- Construya una tabla con los porcentajes por categoría (novillos y vacas) según las regiones A y
C.
7.g.- Construya un gráfico que compare las categorías para las tres regiones involucradas.

8. Se dan las marcas de clase y las frecuencias de una distribución muestral.


marca de clase 5.6 6.0 6.4 6.8 7.2 7.6 8.0 8.4 8.8
frecuencia 5 40 70 240 270 175 140 50 10
9.a.- Tabular por intervalos, f, F, fr, Fr
9.b.- Calcular : media , mediana, moda, desviación típica, percentil 25
9.c.- Confeccionar un gráfico adecuado para las frecuencias acumuladas relativas y representar la
mediana.
9.d.- Emitir juicio respecto a la simetría de la distribución y justificarlo

10. En el período noviembre 1998 - enero 1999 se registró el número de crías que tuvo cada una de
20 gatas adultas, con los siguientes resultados:
0 0 2 2 2 3 3 3 4 4
4 4 4 5 5 5 5 6 6 7
10.a.- ¿Cuál es la variable en estudio? ¿En qué escala está medida?
10.b.- Tabular los datos.
10.c.- Representar gráficamente la distribución de frecuencias.

pág. 12
11. Doscientos estudiantes ingresados en 1999 a la Facultad de Veterinaria fueron clasificados
por origen geográfico (norte: N, suroeste: SO, sureste: SE, Montevideo: M) y por sexo:

sexo masculino femenino total


origen
N 15 15 30
SO 12 18 30
M 41 49 90
SE 22 28 50
total 90 110 200

11.a.- Represente gráficamente la distribución por origen ( sin tomar en cuenta el sexo ) de dos
maneras distintas.
11.b.- Represente gráficamente la distribución conjunta por origen y sexo, considerando como criterio
principal de clasificación el origen, de dos maneras distintas

12. Un test de mastitis se aplica a 36 vacas de un tambo, con los siguientes resultados:
0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 T T T T T T T
T 1 1 1 1 1 2 2 2 3 3 4
Sabiendo que los resultados del test pueden asumir los valores:
0 = ausencia, T = trazas, 1 a 4 = grados crecientes de gravedad
13.a.-Represente gráficamente la distribución
13.b.-Describa la distribución mediante las medidas de resumen que le parezcan más adecuadas.

13. En un relevamiento sobre causas de muerte en corderos recién nacidos, se registró:


ex
causas de parto otras secuelas otras
posición al inanición predación
muerte distócico de parto causas
frío
Nº de 42 30 12 6 4 6
corderos

14.a.-Represente gráficamente la distribución


14.b.-Describa la distribución mediante las medidas de resumen que le parezcan más adecuadas

14. En un establecimiento de producción ovina se registraron al nacimiento el sexo de cada animal y su


peso obteniéndose los siguientes resultados expresados en kg:

MACHOS: 2.1 3.5 4.8 5.2 6.9 3.9 4.2 5.7 6.1 4.4 5.4 6.1 4.2 5.9 4.5
HEMBRAS: 6.1 5.9 4.3 3.9 2.8 2.3 3.9 4.5 5.6 3.3 4.1 3.7 4.6 4.3 4.8

14.a.- ¿Qué tipo de variable son el peso y el sexo y en qué escalas se miden?
14.b.- Muestre gráficamente como se distribuyen los pesos en las hembras.
14.c.- Utilizando una gráfica diferente a la anterior compare las distribuciones de peso para
machos y hembras.

pág. 13
15. Dada la siguiente distribución de frecuencias:
x f Determinar:
0-5 10 Frecuencia simple relativa del intervalo 0 - 5
5-10 20 Frecuencia acumulada absoluta hasta 10
10-15 30 Frecuencia acumulada relativa hasta 5
15-20 25 Límite inferior del intervalo que contiene la Mn
20-25 15 Límite inferior del intervalo que contiene a la Mo
SUMA 100 Amplitud total

16.-En una muestra de tambos, éstos se clasificaron en tres categorías: pequeños (P), medianos (M) y
grandes (G)
categoría Frec. 17..- Represente gráficamente la distribución.
P 15
M 25
G 10

17.-Dado el siguiente conjunto de datos:


x 10-20 20-30 30-40 40-50 50-60 60-70 70-80 80-90 90-100 100-110
frec 3 5 9 10 12 13 9 8 4 1
17.a.- Calcular la varianza y el semi-recorrido intercuartílico.
17.b.- Calcular el coeficiente de variación (CV).

18.- En un proyecto de investigación sobre los niveles de colesterol en los bovinos, se tomaron
muestras sanguíneas y se determinó el colesterol total en el laboratorio, obteniéndose los siguientes
resultados medidos en miligramos por cada 100 cc.

1.08 2.91 1.01 2.24 1.00 1.50 2.05 2.21 1.49 1.50 1.51 1.43 1.28 1.40 1.23 2.00 1.16
1.91 1.28 2.11 1.13 1.70 2.49 2.47 1.09 1.58 1.79 1.93 1.45 1.55 1.69 1.58 1.08 1.51
1.58 1.70 1.82 1.87 1.01 1.72 1.30

18.a. ¿ Qué tipo de variable es?


18.b. ¿Cuál es la escala de medida?
18.c. Realice una tabla con las frecuencias simples, absolutas y relativas, así como sus acumuladas .
18.d. Utilice un gráfico que represente adecuadamente las frecuencias absolutas de colesterol de éstos
novillos e identifique gráficamente la moda.
18.e. Realice un polígono de frecuencias relativas acumuladas e identifique gráficamente donde se
ubica la mediana .
18.f. Calcule la media, la mediana y moda para éstos datos en forma agrupada
18.g. Calcule la media, mediana y moda para los datos individuales (sin agrupar).
18.h. Percentiles 10 y 75 (P10, P75).
18.i. Decil 1 (D1).
18.j. Semi-recorrido intercuartílico

pág. 14
18.k. Calcule la varianza para los datos agrupados y sin agrupar así como su correspondiente desviación
típica.
18.l.. Calcule el coeficiente de Asimetría de Pearson y el coeficiente de variación.

19.- En un establecimiento de faena (frigorífico) se obtuvieron los pesos de las carcasas bovinas de la
última faena con los que se construyó la tabla con sus frecuencias absolutas que a continuación se
presenta: PESO (Kgs) fi
120 - 140 8
19.a. ¿Qué tipo de variable es? 140 - 160 12
19.b. ¿Cuál es la escala de medida? 160 – 180 15
19.c. Complete la tabla con las frecuencias simples 180 – 200 17
relativas, así como sus acumuladas. 200 – 220 14
19.d. Realice un polígono de frecuencias relativas. 220 - 240 11
19.e. Calcule la medida de tendencia central que 240 – 260 9
le parezca apropiada.
19.f. Mediana, P50, Varianza y las correspondientes desviaciones típicas.

20. Se registró el peso de un grupo de terneros de la facultad de Veterinaria los cuales se observan en
el siguiente cuadro:

50 38 56 57 48 64 50 51 46 52
machos
41 60 46 41 53 65 59 42 37 51
50 45 52 42 46 47 63 58 49 55
hembras
58 49 50 38 41 51 48 64 51 50

20.a. Construya un Histograma.


20.b. Calcule las medidas de resumen que más convengan en cada grupo, con los datos agrupados
20.c. Construya un gráfico representando la proporción de animales en cada grupo que pesan más de
50kg.

21. En 50 tambos de similar tamaño, se realizó un test de mastitis, encontrándose las siguientes
proporciones de vacas enfermas.
Con estos datos:

0.00 0.00 0.02 0.04 0.06 0.06 0.07 0.08 0.08 0.09
0.10 0.12 0.12 0.12 0.14 0.15 0.17 0.17 0.17 0.17
0.18 0.18 0.19 0.19 0.20 0.21 0.21 0.22 0.23 0.23
0.23 0.24 0.25 0.26 0.26 0.26 0.26 0.26 0.27 0.29
0.30 0.31 0.33 0.33 0.35 0.36 0.36 0.37 0.38 0.39

21.a. - Confeccione una tabla de frecuencias sin agrupar y determine la media, mediana, moda, la
desviación típica y amplitud a partir de la tabla.
21.b- Confeccione una tabla de frecuencias agrupadas en intervalos de amplitud 0.04 comenzando de
0.00 (Li). Represente gráficamente: frecuencias acumuladas relativas (Fr) y frecuencias simples absolutas
(f ).

pág. 15
22. Se toma una muestra aleatoria de 12 caballos, registrándose su raza y las variables: hematocrito,
PPT, frecuencia cardíaca y frecuencia respiratoria antes y después de un raid.

Caballo Hematocrito (%) PPT (%) F. cardíaca F. respiratoria


raza
Nº antes Después antes después antes después antes después
1 A 31.7 45.10 6.84 7.79 36 48 12 14
2 A 33.62 44.30 7.08 7.55 32 40 16 12
3 A 36.51 46.22 6.24 7.19 36 42 14 14
4 A 37.24 52.30 6.48 7.43 34 36 18 16
5 B 37.46 50.19 6.72 8.15 38 38 18 18
6 B 38.26 51.1 6.96 7.91 32 36 12 20
7 B 43.22 49.21 7.44 7.67 36 40 16 16
8 B 39.38 48.42 7.3 8.39 40 36 14 12
9 B 40.12 54.02 7.20 8.27 34 36 16 12
10 C 41.30 56.21 7.68 8.63 42 34 16 12
11 C 35.14 47.15 6.60 7.72 31 40 12 12
12 C 39.10 48.30 7.30 7.00 36 42 14 16

a) Calcule Media, mediana, moda, varianza y Percentiles 25 y 75 de las variables PPT antes y
después.

b) Grafique diagrama de caja para la variable PPT (%) antes y después del raid.

c) Que otro grafico utilizaría para comparar la variable PPT antes y después.

pág. 16
Ejercicios suplementarios
1. Dada la siguiente distribución de frecuencias:
X 0-6 6-12 12-18 18-24 24-30 30-36 36-42 42-48 48-54 54-60
F 1 2 4 7 11 10 6 3 0 2

1.a.- Grafique el polígono de frecuencias acumuladas.


1.b.- Calcule las medidas de tendencia central y dispersión más adecuadas

2. Describa gráficamente el siguiente conjunto de datos de pH sanguíneo en ratones.


7.43 7.38 7.49 7.49 7.39 7.46 7.50 7.55 7.53 7.50 7.63 7.47 7.31 7.39 7.44 7.55 7.48 7.43
7.55 7.44 7.50 7.49 7.51 7.54 7.49 7.40 7.46 7.43 7.35 7.40 7.46 7.38 7.51 7.53 7.52 7.47

Calcule media y desvío.

3. En un establecimiento de faena se seleccionó en forma aleatoria 13 novillos y a estos se les tomó


una muestra de carne correspondiente a la novena costilla para analizar su composición con respecto al
contenido de colesterol. En el laboratorio se determinó los miligramos de colesterol para cada 100
gramos de carne arrojando los siguientes resultados:
71.1 72.0
3.a.- ¿Cuál es el tipo de variable y la escala de medida?
72.0 78.8 3.b.- ¿Cuál es la moda?
75.4 75.3 3.c.- ¿Cuál es el tercer cuartil?
70.8 75.7 3.d.- ¿Cuál es la desviación típica de esta muestra?
73.5 72.0 3.e.- Agrupe los datos en 3 categorías de igual intervalo de
77.0 74.2 clase y realice una gráfica con los mismos
75.1

4. En una muestra de capones, el peso del vellón (kg) presentó la siguiente distribución:
Peso 2.00 -2.20 2.20-2.40 2.40-2.60 2.60-2.80 2.80-3.00 3.00-3.20 3.20-3.40 3.40-3.60 3.60-3.80 3.80-4.00
Frec. 6 9 17 26 42 44 24 19 9 4

4.a. Indique qué tipo de variable es el peso del vellón y su escala de medida
4.b. Confeccione el polígono de frecuencias simples

pág. 17
5. Durante una investigación acerca del ciclo reproductivo de la corvina blanca Micropogoniasfurmieri en
la Laguna de Rocha se registró el índice gonadosomático de las hembras capturadas:
IGS = (peso gonadal/ peso total) x 100. En una muestra de 200 corvinas maduras (estadio IV) se
obtuvieron los siguientes resultados:

IGS 1.0 - 1.8 1.8 - 2.6 2.6 - 3.4 3.4 - 4.2 4.2 - 5.0 5.0 - 5.8 5.8 - 6.6 6.6 - 7.4 7.4 - 8.2 8.2 -9.0 TOTAL
f 4 9 19 26 42 44 24 17 10 5 200

5.a. ¿Cuál es la variable en estudio?


5.b. ¿De qué tipo es? (atributo, continua, discreta)
5.c. ¿En qué escala está medida?
5.d. En el espacio que sigue, confeccione el histograma de la distribución de frecuencias

Calcule: Media
Desviación típica
Varianza
Mediana
Semirrecorrido
intercuartílico
Moda
Amplitud (rango)
total

pág. 18
6. En un estudio epidemiológico sobre el bocio endémico de las vacas lecheras, se toma una muestra al
azar de 1000 tambos y se encuentra que 600 de ellas pertenecen a zonas donde el bocio no es endémico
(A); 100 son de zonas de bocio endémico, pero suplementan la ración con sales de yodo (B), y 300 son
de zonas de bocio endémico y no suplementan la ración (C). Interesa - en una primera instancia -
describir la composición de la muestra.

6.a ¿Cuál es la variable en estudio?


6.b ¿De qué tipo es?
6.c ¿En qué escala está medida?
6.d En el espacio a la derecha , grafique la distribución de frecuencias

7. En una muestra de 100 establecimientos ganaderos de similares características (superficie, tipo de


explotación, etc.) se registró para cada uno de ellos el porcentaje de la superficie ocupado por praderas
artificiales permanentes (%PAP)

%PAP f 7.a. ¿Cuál es la variable en estudio?


0 -1 2 7.b. ¿De qué tipo es?
1 -2 4 7.c. ¿En qué escala está medida?
2 -3 10 7.d. En el espacio que sigue, confeccione el
3 -4 13
polígono de frecuencias acumuladas.
4 -5 21
Calcular:
5 -6 22
Media
6 -7 12
Varianza muestral
7 -8 9
8 -9 5 Percentil 20
9 - 10 2 Mediana
TOTAL 100 Cuartil 3

8. Sabiendo que (en los establecimientos muestreados


en el ejercicio 7) 70 de los productores son propietarios
de la tierra, 20 son arrendatarios y el resto ocupantes a
otro título se desea representar esta situación:
8.a ¿Cuál es la variable en estudio?
8.b ¿De qué tipo es?
8.c ¿En qué escala está medida ?
8.d En el espacio a la derecha, grafique
la distribución de frecuencias

pág. 19
9. En un estudio acerca de la hidatidosis en el Uruguay, fueron seleccionados 90 establecimientos
productores de bovinos de carne. En cada uno de ellos, se tomó una muestra de terneros de 1 año de
edad, calculándose la proporción de ellos que presentaban quistes hidáticos (QH).
Prop.QH f
9.a. ¿Cuál es la variable en estudio? 0.00 - 0.04 2
9.b. ¿De qué tipo es? 0.04 - 0.08 5
9.c. ¿En qué escala está medida? 0.08 - 0.12 10
9.d. Confeccione el polígono de 0.12 - 0.16 17
frecuencias simples. 0.16 - 0.20 19
0.20 - 0.24 16
Media
0.24 - 0.28 13
Desviación típica (s)
0.28 - 0.32 4
Varianza (s2) 0.32 - 0.36 3

Mediana 0.36 -0.40 1


TOTAL 90
Coeficiente de variación

10. La distribución de log HPG en machos, en un estudio realizado en ovinos fue:


X = log HPG 0-0,5 0,5-1,2 1,2-1,8 1,8-2,4 2,4-3,0 3,0-3,6
Frecuencia 3 15 33 35 12 2
10.a.- ¿Qué tipos de variable se está considerando y en qué escala de medida se está expresando?
10.b.- Represente la distribución de frecuencias acumuladas para el log HPG.

11.-En un estudio taxonómico para identificar ecotipos de abejas, se midieron las longitudes de las
nervaduras de las alas (mm). Las longitudes de una de las nervaduras en una muestra de 50 abejas
fueron:

1.45 1.60 1.61 1.61 1.63 1.63 1.65 1.70 1.74 1.81 1.81 1.82
1.83 1.85 1.86 1.88 1.89 1.90 1.90 1.92 1.93 1.95 1.95 1.95
1.97 1.98 2.00 2.01 2.01 2.02 2.04 2.06 2.08 2.09 2.09 2.11
2.12 2.14 2.16 2.18 2.18 2.19 2.21 2.25 2.28 2.31 2.35 2.39
2.43 2.58

11.a. Describa la distribución observada mediante:


11.a.1. una tabla de frecuencias;
11.a.2. un gráfico;
11.a.3. un conjunto de medidas de resumen;
11.b. Exprese las conclusiones que extrae de la descripción 11.a;
11.c. Justifique el empleo de los procedimientos utilizados en la descripción 11.a.

pág. 20
12.-En un estudio acerca de la leucosis bovina enzoótica (LBE) en ganado lechero se efectuó el recuento
leucocitario total (RLT) de 200 muestras de sangre.12.a. ¿En qué escala está medida la variable?
Nº de 4000- 6000- 8000- 10000- 12000- 14000- 16000- 18000-
leucocitos 6000 8000 10000 12000 14000 16000 18000 20000
frecuencia 5 27 72 69 15 6 4 2

12.b. Calcule

Media: Varianza centrada: MTC MD

Mediana: Q:
12.d. Indique la medida de tendencia central (MTC) y
Moda: Amplitud total: de dispersión (MD) más adecuadas para describir la
muestra

12.c. Represente gráficamente en la


cuadrícula la distribución de frecuencias
simples relativas.

13. Describa el tipo de variable y la escala de medida:


13.a Contaje de bacterias de las playas uruguayas en la 1ª semana de Enero.
13.b. Edad en años de los integrantes del grupo.
13.c. Altura en cm de los integrantes del grupo.
13.d. Tiempo de espera entre la finalización de este ejercicio y la próxima clase de
Bioestadística.
13.e. Equipo de fútbol del cual es hincha cada integrante de su grupo.

14. Indicar para cada uno de los siguientes tipos de gráficos con qué variables se utilizan:
(1) numéricas sin agrupar; (2) numéricas agrupadas; (3) nominales.
Puede haber más de una respuesta correcta por gráfico:

Histograma
Diagrama de frecuencia (bastones)
Diagrama de barras
Polígono de frecuencias acumuladas
Diagrama de sectores

pág. 21
15. Indicar para cada una de las siguientes afirmaciones si es verdadera (V) ó falsa (F).

El percentil 75 de una distribución es el valor de x que deja por encima de él, el 75% de los casos.
Cuando se usa la mediana como medida de tendencia central la medida de dispersión más adecuada es
la amplitud total.
La media aritmética es el centro de gravedad de la distribución.
En una distribución con asimetría positiva, la media suele ser mayor que la moda.
La mediana es la medida de tendencia central más útil para cálculos posteriores.

16.- En los casos que a continuación se mencionan, exprese: qué tipo de variable es, en que escala de
medida está expresada, qué medidas de tendencia central se pueden calcular y cuál recomendaría Ud.
16.a- Porcentajes de novillos, vacas y terneros para un departamento del Uruguay.
16.b- Condición corporal de vacas lecheras con una escala en la cual 0 = Flaca, 1 = Buen Estado, 2 =
Gorda.
16.c- Peso corporal de vacas lecheras medido en libras.

pág. 22
Probabilidad
Objetivos - UD3

Al finalizar esta unidad, el estudiante será capaz de:

 Definir qué es la probabilidad y describir ejemplos de aplicación veterinaria de sus principios.


 Definir que es un espacio muestral, punto muestral y acontecimiento (evento).
 Calcular probabilidades para situaciones simples.
 Calcular probabilidades para situaciones con combinaciones de eventos.
 Explicar qué es una distribución de probabilidad.

Conceptos previos a trabajar en clase


1. ¿Qué significan las expresiones: espacio muestral, punto muestral (evento o acontecimiento
simple), acontecimiento o evento, muestra, población. Dé ejemplos.
2. ¿A qué se llama experimento?
3. ¿Para qué se asignan probabilidades a los acontecimientos?
4. ¿Qué aporta la teoría de la probabilidad a la estadística?
5. ¿Qué plantea el enfoque clásico o a priori?
6. ¿Por qué es lícito utilizar en la práctica la frecuencia relativa como probabilidad?
7. ¿Entre qué valores está comprendida la probabilidad de un acontecimiento cualquiera?
8. ¿Cuánto vale la suma de las probabilidades individuales de todos los acontecimientos
mutuamente excluyentes que comprenden un espacio muestral?
9. ¿A qué se llama?:
a.- acontecimientos mutuamente excluyente? Dé ejemplos.
b.- acontecimientos complementarios? Dé ejemplos.
c.- acontecimientos compatibles o no excluyentes? Dé ejemplos.
d.- acontecimientos independientes? Dé ejemplos.
10. ¿Es lo mismo hablar de acontecimientos mutuamente excluyentes que independientes?
¿Por qué?
11. ¿Cuándo se puede decir que dos acontecimientos son independientes?
12. Si dos acontecimientos A y B son independientes, ¿cuál será la probabilidad de que ocurran
juntos A  B? ¿Para qué puede servir este concepto?
13. ¿A qué se llama probabilidad condicional?
14. ¿En qué casos es de utilidad el empleo del teorema de Bayes?

pág. 23
Ejercicios
1. Una enfermedad tiene una prevalencia de 0,2. Se tomaran muestras compuestas por tres
animales/pacientes.

S 1er Paciente
E

S E S E 2º Paciente

S E S S E S E 3er Paciente
E

S: Paciente Sano
E: Paciente Enfermo

a) Defina el espacio muestral con los resultados posibles de las muestras.


b) Nombre todos los eventos simples y dos acontecimientos del espacio muestral.
c) ¿Cuál es la probabilidad de encontrar al menos un paciente sano?
d) ¿Cuál es la probabilidad de encontrar exactamente un paciente sano?
e) ¿Cuál es la probabilidad de encontrar tres pacientes sanos?
f) ¿Qué probabilidad existe de no encontrar pacientes sanos?
g) Si ahora la prevalencia de la enfermedad aumenta a 0,3. ¿Cuál es la probabilidad de encontrar tres
animales enfermos en una muestra?

2. Complete la tabla con la información siguiente:

Hembras de Cría Toros

Ganado de leche 592

Ganado de carne 107

699

En una encuesta en una zona rural se obtuvieron los siguientes resultados:

Hay 5 tambos con 592 bovinos de leche en total (de los cuales 587 son hembras de cría y 5 toros)*.
También hay 5 establecimientos de carne de 107 animales en total, (de los cuales 3 son machos y 104
son hembras)*. Si juntamos todos los animales y sorteamos con reposición 5 animales sucesivamente

pág. 24
a) determine la probabilidad de:

-Que todos sean bovinos de carne.


-Que al menos uno sea bovino de leche.
-Que los cinco sean del mismo propósito (carne o leche).
-Que el primero sea de leche y hembra.
-Que el primero sea de leche dado que es hembra.

b) ¿Es posible que salgan sorteados 5 toros de carne? Justifique su respuesta.


c) ¿Cuál es la probabilidad de que salgan 5 toros de carne, si respondió afirmativo en b)?

3. Se sabe que los bovinos de leche de Uruguay tienen una prevalencia muy baja de estar infectados
con Brucelosis Bovina, una enfermedad zoonótica infecciosa que causa aborto y disminución de
producción en vacas lecheras. Tomando una muestra de la población, en un rodeo de 1000 animales se
encuentran 6 animales infectados. Si selecciona 5 animales por sorteo aplicando el método de muestreo
con reposición:
a) ¿Cuál es la probabilidad de encontrar algún infectado (mínimo un animal)?
b) ¿Cuál es la probabilidad de que exactamente uno esté infectado?
c) Determine cuál es la probabilidad de que los 5 estén sanos.
d) Ídem (c) sin reposición.
e) Aplicando el método de muestreo con reposición determine cuál es la probabilidad de que los 5
animales estén infectados.
f) ¿Qué probabilidad tengo de detectar la enfermedad en el rodeo (por lo menos un animal
infectado) si selecciono 5 animales, 10 animales y 20 animales con reposición respectivamente?
g) Si la prevalencia es muy baja, ¿por qué cree que es importante la lucha contra BrB?

4. En un predio hay 36 animales de diferentes razas: Hereford (HE), Holando (HO), Jersey (J) y Angus
(A) distribuidos por raza de la siguiente manera:
A A A A A A A A A A A A
HE HE HE HE HE HE HE HO HO HO HO HO
HO HO HO J J J J J J J J J
Si se toma un animal en forma aleatoria, calcule la probabilidad asociada a una determinada raza.

5. En un rodeo se realizó diagnóstico para una determinada enfermedad a vacas y novillos, obteniéndose
los siguientes resultados:
vacas Novillos Calcular (si se extrae un animal en forma aleatoria):
5.a.- La probabilidad de estar enfermo.
Sanos 400 450 5.b.- La probabilidad de estar enfermo y ser vaca.
5.c.- La probabilidad de estar enfermo siendo novillo.
enfermos 50 100
5.d.- La probabilidad de estar sano o ser novillo.

6. En un estudio de 500 animales se encontraron:


320 con tumores pulmonares; 290 con metástasis óseas. El 40% del total de los animales presentó tumores
pulmonares y metástasis óseas.
6.a.- ¿Cuántos animales presentaron tumores pulmonares y metástasis óseas?
6.b.- ¿Cuántos sólo tumores pulmonares sin ninguna metástasis?
6.c.- ¿Cuántos sólo metástasis ósea ?
6.d.- ¿Qué probabilidad habrá de que un animal tomado al azar sea portador de tumor pulmonar o de
una metástasis ósea?
6.e.- ¿Qué probabilidad habrá de que un animal tomado al azar sea portador de metástasis ósea siendo
que no presenta tumor pulmonar?

pág. 25
7. En un establecimiento productor de ovinos, se tomó una muestra de 200 corderos (100 machos y
100 hembras) y se determinó la carga de parásitos gastrointestinales en materia fecal (log HPG). Los
resultados se dividieron en grupos de alta parasitación (A) y baja parasitación (B), dentro de cada grupo
se contabilizó el número de machos y de hembras con los siguientes resultados
A B
machos 76 24
hembras 45 55

7.a. ¿Cuál es la variable de interés, tipo y escala de medida?


7.b. ¿Cuál es la probabilidad de pertenecer al grupo A siendo macho, P(A|M )?
7.c. ¿Cuáles la probabilidad de ser macho y pertenecer al grupo A, P( M  A )?
7.d. ¿Cuál es la probabilidad de que el animal sea una hembra, si se sabe que pertenece al grupo A,
P(H|A)?
7.e. ¿Cuál es la probabilidad de pertenecer al grupo A y no ser macho, P(A  H )?

8.. En una población de 9100 sujetos se constató que algunos estuvieron expuestos durante años a un
factor cancerígeno, mientras que otros no. Se procedió a realizar estudios diagnósticos de cáncer a
todos los sujetos, con los siguientes resultados:
Si se toma al azar un sujeto de esa población, ¿qué probabilidad hay de que:
8.a. haya estado expuesto al factor cancerígeno?
sanos enfermos 8.b. esté enfermo, habiendo estado expuesto?
expuestos 3100 90 8.c. esté enfermo, no habiendo estado expuesto?
8.d. esté sano, habiendo estado expuesto?
no expuestos 5900 10 8.e. esté enfermo o haya estado expuesto?

9. El riesgo (probabilidad) de contraer una enfermedad si se consume un alimento A es P = 0.25. La


proporción de animales enfermos en la población es P = 0.45. El 20% de los animales consume A.
Calcule la probabilidad de que un animal haya consumido el alimento A siendo que enfermó (se supone
que consume un solo alimento).

10. La para-tuberculosis es una enfermedad infecciosa que hasta el momento es incurable. Suponga
que tenemos dos métodos de diagnóstico para determinar si una vaca lechera tiene para-tuberculosis. El
primer método (M1) consiste en una biopsia y es considerado 100% seguro pero es caro y lleva tiempo.
El segundo método (M2) toma una muestra de sangre y realiza una prueba de inmunodifusión que es
relativamente barata y rápida pero no es 100% segura. Suponga que toma una muestra por sorteo de
10000 vacas lecheras de una región dada y usa los 2 métodos para cada vaca para saber si tiene o no la
enfermedad obteniendo los resultados que a continuación se muestran:
método 2
P2 N2 P2 = positivo al diagnóstico M2, N2 = negativo M2
método

P1 400 100 P1 = positivo al diagnóstico M1, N1 = negativo M1


1

N1 300 9200

10.a ¿Cuál es la probabilidad de que sea positivo a la prueba M2?


10.b ¿Cuál es la probabilidad de estar infectado si es positivo a la prueba M2?
10.c ¿Cuál es la probabilidad de estar infectado si es negativo a la prueba M2?
10.d ¿Cuál es la probabilidad de dar un resultado positivo en M2 si es verdaderamente sano?

pág. 26
11. En un establecimiento con 1250 animales se realizaron exámenes de laboratorio de seroaglutinación
para diagnóstico de Brucelosis, con los siguientes resultados:
6% Sospechosos, 14% Positivos
11.a. ¿Cuál es la probabilidad de que un animal tomado al azar sea negativo?
11.b. ¿Cuál es el número de positivos obtenido en los análisis?

12. Un rodeo de 100 bovinos está constituido por 52 animales Hereford, 27 Angus y el resto Shorthorn.
Si se elige un animal por sorteo determine cuál es la probabilidad de que sea Hereford ó Angus.

13. Se tiene 10 animales de los cuales 3 están enfermos. Si extraemos 2 animales por sorteo determinar la
probabilidad de que los 2 estén sanos según el método de muestreo:
13.a.- Con reposición
13.b.- Sin reposición

14. Considere el experimento aleatorio que consiste en el lanzamiento de dos dados equilibrados:
14.a.- Determine el espacio muestral asociado al experimento y asigne probabilidades a
los puntos muestrales.
14.b.- Determine la probabilidad de obtener dos números diferentes.
Si consideramos la suma de los valores obtenidos al lanzar el par de dados determine la probabilidad de los
siguientes eventos:
14.c.- Que la suma sea mayor a 5.
14.d.- Que la suma sea mayor a 10 dado que al menos uno es 6.

15. En un espacio muestral (S) se definen 3 acontecimientos (A, B y C) con las siguientes
características:
 P(A) = 0.6
 P(B) = 0.4
 P (A  B) = 0.2
 P(S) = P(A  B  C) = 1
 P (A  C) = 0.3
 P (B  C) = 0

Se desea saber:
15. a. P (Ac)
15. b. ¿A y B son complementarios? ¿Por qué?
15. c. P(C)
15. d. P(A  C)
15. e. ¿A y C son independientes? ¿Por qué?
15. f. ¿B y C son compatibles? ¿Por qué?
15. g. P (A  B  C)

16. Sean A y B dos sucesos pertenecientes a un mismo espacio muestral. ¿Cuál de las siguientes
afirmaciones no es correcta?
c c
16a. Si A y B son independientes se cumple: P(A  B) = 1 - P(A ) P(B )
16b. Si A y B son mutuamente excluyentes se verifica:
PA | (A  B) = P(A) / P(A) + P(B)
c
16c. Si P(B) 0 se satisface: P (A | B) + P (A |B) = 0
16d. Si A y B son mutuamente excluyentes entonces: P(A  B) = P(A) + P(B)

pág. 27
17. En un campo de recría ingresan 50 bovinos del establecimiento “Doña Dorila” (DD), 30 de “Las
Hortensias “(LH) y 20 de “Tío Pepe” (TP). Se procede a un diagnóstico de leucosis con los siguientes
resultados:

DD LH TP La población en estudio
positivos(+) 15 12 3 son los 100 bovinos
negativos(-) 35 18 17 observados

17.a.- Calcule la probabilidad de que, si se extrae un bovino al azar :


a.1.- Provenga de “Las Hortensias”, P(LH).
a.2.- Esté enfermo (diagnóstico positivo), P(+).
a.3.- Provenga de “Las Hortensias” y esté enfermo.
a.4.- Provenga de “Las Hortensias” o esté enfermo.
a.5.- Provenga de “Las Hortensias” estando enfermo.

17.b.- ¿El resultado del diagnóstico es independiente del establecimiento de origen? ¿Por qué?

pág. 28
Ejercicios suplementarios
1.
-1  p  1 Indique con una cruz la única respuesta correcta o
0p1 la mejor respuesta si hubiera más de una verdadera
0  p  100 Cualquier probabilidad (p) está comprendida en el intervalo
1  p  100

2. En un relevamiento epidemiológico se tomó una muestra aleatoria de 100 vacas lecheras de la


cuenca de Salto y otra de 120 provenientes de la de Durazno, determinándose para cada animal si
presentaba insuficiencia (I) de yodo o bien si los niveles eran suficientes (S).
40 animales de Salto presentaban insuficiencia, mientras que el 65 % de los animales provenientes de
Durazno presentaban niveles suficientes de yodo
2.a. Calcule la probabilidad de presentar insuficiencia de yodo para una vaca perteneciente a la cuenca
de Salto P(ISalto).
2.b. Emita opinión respecto a si los acontecimientos niveles de yodo y cuenca lechera son
independientes. Justifique su respuesta.
3. Dados dos acontecimientos A y B tales que:
P (A) = P( A B ) = 0.3 ; P( B ) = P(B  A ) =0.4

Responda las siguientes preguntas


3.a. P (AB ) = 3.b. P ( A  B ) =
3.c. P( A  B) = 3.d. P( A  B ) =

4 .Para cada una de las siguientes preguntas encierre en un círculo V ó F según la afirmación sea
verdadera o falsa.
4.a. En cualquier función de densidad 0  f(x)  V F
4.b. En cualquier función de probabilidad 0  p(x)  V F
4.c. La distribución binomial se puede aproximar por la Poisson cuando np< 5 y npq> 50 V F
4.d. Cuando la variable en estudio está normalmente distribuida, las medias muestrales tienen
distribución normal aunque la muestra sea menor que 30 V F
5. En una población animal la proporción de enfermos es P(E) = 0.15 . Un test diagnóstico de la
enfermedad tiene una sensibilidad P(positivo|enfermo)=0.9 y una especificidad P (negativo|sano)=0.8.Un
animal es sometido 2 veces al test y en ambos el resultado es positivo. Suponiendo que el resultado del
primer diagnóstico no influye sobre el resultado del segundo. ¿Cuál es la probabilidad de que el animal
esté realmente enfermo? Justifique su respuesta.

6. En el espacio muestral S pueden ocurrir solamente los acontecimientos (eventos) A, B, C y D


A y B son complementarios; P(A) = 0.4; P(CA)= P(C) = 0.3; A y D son incompatibles; P(D) = 0.2
calcular :

P(B ) = P(DB ) = P (C  B )= P (C  B )=

7. P(A) = 0.3, P(B) = 0.7, P (A B ) = 0.1

a.-¿ A y B son complementarios? ¿Por qué?


b.- P(AB) =

pág. 29
8. P(A) = 0.5; P(B) = 0.5 ; P(A  B) = 0.75
8.a.-¿A y B son independientes? ¿por qué?

8.b.- ¿A y B son compatibles? ¿por qué?

8.c.- ¿A y B son complementarios? ¿por qué?

9.- Siendo A y B dos acontecimientos cualesquiera ¿es posible que (marque con X )
9.a.- P( A  B) > P(A) +P(B) ? 9.b.- P( A  B) sea mayor que P(A  B) ?
 SI  NO  SI  NO

Justificación de la respuesta Justificación de la respuesta

10. Se desea estudiar una nueva técnica de laboratorio para el diagnóstico de una enfermedad, para la
cual se cuenta con un método de diagnóstico seguro pero más caro y que demora mayor tiempo que la
técnica a evaluar. Se aplican las dos técnicas a 200 animales (el método seguro determina la condición
real), con los siguientes resultados
nueva técnica 10.a. ¿Qué probabilidad hay de que un animal realmente
positivo negativo enfermo, sea diagnosticado positivo por la nueva técnica?
10.b. ¿Qué probabilidad hay de que un animal que fue
condición enfermo 95 5 diagnosticado negativo por la nueva técnica, esté realmente
real sano 10 90 enfermo?

10.c. ¿Cuál es la probabilidad que tiene un animal sano de ser diagnosticado negativo por la nueva
técnica?

11.-P(A) = 0.6, P(B) = 0.4, P(AB) = 0.7 P(AB) =


11.a .Dos acontecimientos (A y B ) cumplen la condición P( A|B) = P(B|A)
11.a.1 ¿Son independientes ? Justifique su respuesta.

11.a.2 ¿Son compatibles? Justifique su respuesta.

12.-Sean dos acontecimientos A y B, mutuamente excluyentes, con P(A) = 0.4 y P(B) = 0.3.
a. Calcule P(A Bc ) = (Bc es el complemento de B)
b. Justifique su respuesta.

pág. 30
13.- En una muestra de 100 animales, de los cuales 30 están enfermos, un test diagnóstico califica como positivos
a 25 de los enfermos y a 10 de los sanos.
Calcule:
P(Enfermo  Positivo)
P(Positivo  Enfermo)
P(Negativo y Sano)
P(Diagnóstico correcto)

14.- Una prueba diagnóstica presenta una sensibilidad P(Positivo|Enfermo) = 0.95 y una
especificidad P(Negativo|Sano) =0.90. Se sabe que la prevalencia poblacional es P (Enfermo) = 0.3
¿Cuál es la probabilidad de cometer un error de diagnóstico si se aplica la prueba a un animal elegido al
azar? Justifique su respuesta.

P=

Por qué:

15. En un muestreo sin reposición de los dígitos del 0 al 9 ¿Qué probabilidad hay de extraer la
secuencia: 0, 3, 7 en ese orden?
P= Justifique su respuesta

16. Una vacuna consta de dos componentes A y B. El proceso de fabricación es tal que la probabilidad
de un defecto en A es 0.06 y de uno en B es de 0.07. Si se suponen ambos componentes
independientes, ¿cuál es la probabilidad de que la vacuna sea defectuosa? Justifica la respuesta
a. 0.1342
b. 0.1258
c. 0.1300
d. 0.0042

17. Un cierto análisis clínico tiene probabilidad de 1/2 de dar positivo en individuos con una
enfermedad E. Si a tres individuos enfermos se les realizan análisis, ¿cuál es la probabilidad de que
alguno de ellos de positivo? Justifica la respuesta

a. 0.1875 b. 0.375 c.0.125 d 0.8750

18. Dos procedimientos A y B curan una misma enfermedad F en un 60% y 50%, respectivamente, de
los casos. Suponiendo que ambos métodos actúan de forma independiente y que se les aplican a la vez
a los individuos con la enfermedad F. Calcular:
18a.- La probabilidad de que un individuo se cure.
a. 0.1 b. 0.8 c. 0.3 d. 0.7
18b.- La probabilidad de que de dos individuos, al menos uno se cure.
a. 0.64 b. 0.32 c. 0.49 d. 0.96

19. Un paciente con un conjunto de síntomas puede tener cualquiera de las tres enfermedades A1, A2
o A3con probabilidades 0.5, 0.4 y 0.1, respectivamente. Para precisar el diagnostico se somete al
paciente a un análisis de sangre que da positivo en los individuos que padecen A1, A2 oA3 con
probabilidades 0.8, 0.98 y 0.9, respectivamente.

pág. 31
19a.- ¿En qué porcentaje de la población de pacientes con tales síntomas el análisis da positivo?
a. 0.562 b. 0.882 c. 0.706 d. 0.657
19b.- Si a una persona con los síntomas se le realiza el análisis y da positivo, ¿cuál es la enfermedad más
probable?

20. Para estudiar la eficacia de un nuevo test para el diagnóstico de un tipo particular de tumor
mamario que lo padece el 1% de las perras, se aplicó el mismo a un grupo de perras con tal tipo de
tumor y a otro grupo de animales sanos, obteniéndose la siguiente tabla:
diagnostico 20 a.- Estima la sensibilidad P (+T) y la especificidad P(- T )
positivo negativo de la nueva prueba diagnóstica.
si 850 150 20b.- Si se toma una perra y al aplicar el test, éste da positivo,
tumor ¿qué probabilidad tiene de padecer la enfermedad?
no 45 455 20c.- ¿Cuál es el valor predictivo negativo P(T-) de esta prueba
diagnóstica?

21. En un espacio muestral (S) se definen tres acontecimientos (A, B, C) que cumplen las siguientes
condiciones:
Calcular
6.a.- P(A C) P(A  C)  0; P(A B)  P(A B);
6.b.- P(A  B)
6.c.- P(B  C) P(B  C)  0.2; P(A)  0.5; P(B)  04; P(C)  0.3

pág. 32
Distribuciones de Probabilidad
Objetivos - UD 4 y 5
Objetivos de la Unidad didáctica 4 - Distribución de Variables discretas
Al finalizar esta unidad, el estudiante será capaz de:

 Describir las distribuciones Binomial y de Poisson.


 Calcular probabilidades aplicando estas distribuciones.
 Analizar situaciones veterinarias donde se apliquen estas distribuciones.

Objetivos de la Unidad didáctica 5 - Distribución de Variables continuas


Al finalizar esta unidad, el estudiante será capaz de:

 Explicar las diferencias básicas entre las distribuciones discretas y continuas.


 Describir las principales características de la distribución normal.
 Transformar la distribución normal en una estándar
 Utilizar la distribución normal para estimar probabilidades binomiales

Conceptos previos a trabajar en clase


1. ¿Qué es una distribución de probabilidad? ¿Qué es un parámetro? ¿Qué es una distribución
de probabilidad discreta?
2. ¿Qué condiciones se requieren para que una variable se distribuya binomialmente? En la
fórmula de la distribución binomial ¿Qué significan p, q, n y x?
3. ¿Cuáles son los parámetros de la distribución binomial? ¿Cuánto valen la media y la varianza
de una variable distribuida binomialmente?
4. ¿ Qué condiciones se requieren para que una variable tenga distribución Poisson?. En la
fórmula de la distribución Poisson ¿Qué significan , e y x ?
5. ¿Cuál es el parámetro de la distribución Poisson? ¿Cuánto valen la media y la varianza de
una variable distribuida según Poisson?
6. ¿Qué condiciones se requieren para que una distribución binomial pueda ser aceptablemente
aproximada por una Poisson? ¿Cómo se determina  en ese caso?
7. ¿Qué es una función de distribución de probabilidad? ¿Cuánto vale la probabilidad de un
valor x cualquiera, si la variable es continua? ¿Qué es una función de densidad? ¿Cuánto vale
P(a  x  b) en una función de densidad?
8. ¿Cuándo una variable tiene distribución rectangular? ¿Cuáles son los parámetros de la
distribución rectangular?
9. ¿Cuánto vale la media y la varianza de una variable distribuida en forma rectangular?
10. ¿Qué es una distribución normal? ¿Cuáles son sus parámetros? ¿Cuánto vale
P( -   x   + )?
11. ¿Qué es una variable tipificada (estándar)? ¿Cuánto valen los parámetros de la distribución
de una variable normal estándar?

pág. 33
Ejercicios

1. La probabilidad de mortinatos en partos de un rebaño bovino es p= 0.03. ¿Cuál es la probabilidad


de que ocurran por azar más de 2 mortinatos en 5 partos observados?

2. Un acontecimiento tiene una probabilidad constante del 20% de ocurrir en un ensayo.


a) Calcular la media, la varianza y la desviación típica del número de éxitos en 6 ensayos.
b) Construya una tabla con los valores que puede asumir la variable X (número de éxitos), sus
probabilidades y construya el gráfico correspondiente.
c) Calcule la suma de todas las probabilidades.

3. Si la probabilidad de encontrar animales bovinos reaccionantes positivos a una prueba serológica es


p = 0.01. Calcular la probabilidad de que en 500 muestras se obtengan menos de 3 positivos

4. Entre la población de estudiantes de veterinaria, la prevalencia de una enfermedad respiratoria aguda


del adulto (gripe) a fin de mayo del 6 %. Indique qué distribución permitiría calcular la probabilidad de
que en ese período, de un grupo de 30 estudiantes hubiese más de 2 enfermos de gripe y calcúlela.

5. Se tomaron 100 muestras de 5 animales cada una y se registró en cada una de ellas el número de
enfermos, con los siguientes resultados:

Nº de Nº de 5.a. Calcular la media y la varianza del número de éxitos en la distribución de


enfermos muestras frecuencias observadas.
0 17 5.b. Calcular la proporción de enfermos en la muestra.
1 35 5.c. Tomando la proporción calculada, calcular la probabilidad de que en una
muestra de tamaño 5, se encuentren más de 1 y menos de 4 enfermos.
2 32
5.d. Determine la media y varianza esperada en la distribución de
3 14 probabilidad.
4 2 5.e. ¿Cuál es la frecuencia relativa de obtener 2 o 3 éxitos?
5 0

6. La media semanal (número de veces por semana) que se observan lobitos de río en una región es de
2. Asumiendo que el número de avistamientos tiene una distribución Poisson, determinar:

6.a. El desvío estándar del número de lobitos de río observados semanalmente en la región.
6.b. ¿Cuál es la probabilidad de que 2 o menos lobitos sean observados semanalmente?
6.c. ¿Cuál es la probabilidad de que 4 o más lobitos sean observados en una semana?
6.d. ¿Cuál es la probabilidad de que exactamente 4 lobitos sean observados en una semana?

7. Una sub-especie de insecto se encuentra en una proporción del 1 por mil en la población de la
especie. Si se toman muestras de 100 insectos.
7a. Identifique la función de probabilidad.
7b. Calcule la media y la varianza del número de insectos de la sub-especie en las muestras.
7c.Calcule la probabilidad de encontrar algún insecto de la sub-especie en una muestra.

8. Un problema sobre los costos de los servicios médicos es el alto porcentaje de pacientes que
solicitan asistencia sin necesidad de la misma. Una estimación conservadora establece que estos casos
son un 10%, mientras que algunos expertos opinan que se trata de un 40%. Suponga que se toma una

pág. 34
muestra al azar de 9 registros de un médico y se encuentra que 3 visitas corresponden a personas
saludables.
8.a. ¿Cuál es la probabilidad de observar 3 o más personas saludables en una muestra de 9, si la
proporción es del 10%?
8.b. ¿Cuál es la probabilidad de observar 3 o más personas saludables en una muestra de 9, si la
proporción es del 40%?
8.c. ¿Qué proporción cree que describe esta situación en forma más adecuada?

9. En 30 nacimientos, ¿cuál es la probabilidad de que nazcan al menos 3 machos?, considerando que la


probabilidad de ser macho en un nacimiento es 0.5. Calcular a partir de la distribución binomial y a
partir de su aproximación normal. Y compare los resultados.

10. La calificación de un examen de bioestadística se distribuye normalmente con  = 5.8 y  = 1.


Calcular la probabilidad de que un estudiante tomado al azar obtenga una calificación que no difiera de
la media en más de 0.5 puntos.

11. Un criadero de pollos parrilleros cuenta con una población de animales en la que la proporción de
machos es 0.60. Se toma una muestra de 5 animales con reposición en forma sucesiva y se determina su
sexo. Se define una variable aleatoria x como el número de machos encontrados en la muestra.
11.a.-Determine la función de probabilidad de la variable x, mediante una fórmula, una tabla y una
gráfica .
11.b.- Calcule la media y la varianza de x.
11.c.- Grafique F(x), la función de distribución de la variable x.
11.d.- Calcule la probabilidad de obtener al menos una hembra en la muestra .
11.e.- Calcule la probabilidad de obtener menos de tres machos en la muestra.

12. Se tienen 10 animales de los cuales 3 están enfermos. Si extraemos 2 animales por sorteo
determinar la probabilidad de que los 2 estén sanos según el método de muestreo:

12.a.- Con reposición 12.b.- Sin reposición.

13. Un tóxico a determinada dosis mata el 50% de los animales que son sometidos a él.
Si se toman muestras de 5 animales cada una y se les suministra el tóxico:
13.a.-¿Cuál es la media esperada del número de muertos?
13.b.-¿Cuál es la varianza esperada del número de muertos?
13.c.-¿Qué probabilidad hay de, en una muestra, obtener exactamente 2 muertos?
13.d.-¿Qué probabilidad hay de, en una muestra, obtener menos de 2 muertos?
13.e.-¿Qué probabilidad hay de, en una muestra, obtener por lo menos 2 muertos?

14. Una enfermedad tiene una incidencia (proporción de nuevos enfermos por unidad de tiempo) de
0.01 por día. En muestras de 100 sujetos inicialmente sanos (responda con 3 cifras decimales):

14.a.- ¿Cuál es el número de enfermos esperado al finalizar el primer día?


14.b.-¿Cuál es la varianza del número de enfermos?
14.c.-¿Qué probabilidad hay que al finalizar el primer día no haya enfermado ninguno?
14.d.-¿Y de que hayan enfermado más de 2?
14.e.-¿Ud. consideraría difícil que enfermaran exactamente 2? ¿Por qué?

pág. 35
15. En la población de ovinos del Uruguay (millones, a todos los efectos prácticos puede considerarse
como infinita) una enfermedad afecta al 20% de ellos. Se desea estudiar la probabilidad de obtener
cierto número de animales enfermos tomando muestras aleatorias de 100 animales. Se afirma que para
esta población, la distribución de probabilidad del número de animales enfermos obtenidos en una
muestra de tamaño 100 es binomial.
15.a.- ¿Por qué es binomial?
15.b.- ¿Es válida la aproximación de Poisson? ¿Por qué?
15.c.- ¿Es válida la aproximación Normal? ¿Por qué?
15.d.- ¿Cuál es la probabilidad exacta de obtener, en 100 animales, 2 ó 3 enfermos?
15.e.- ¿Cuál es la probabilidad aproximada de obtener 2 ó 3 animales enfermos?

16. La producción individual diaria de leche para una población de vacas tiene distribución normal, con
media 10 litros y desviación típica 2 litros.
16.a.- Calcule la probabilidad de que una vaca seleccionada al azar produzca menos de 8
litros diarios.
16.b.- Ídem más de 14 litros.
16.c.- Ídem entre 10 y 12 litros.
16.d.- Ídem entre 6 y 10 litros.
16.e.- Ídem entre 12 y 14 litros.
16.f.- Calcule la proporción de vacas que producen entre 6 y 12 litros.
16.g.- Calcule la producción individual diaria que solo el 5% de las vacas la supera.
16.h.- Ídem por el 2.5% de las vacas.
16.i.- Calcule la producción individual diaria que no es superada por el 2.5% de las vacas.
16.j. Calcule la probabilidad de encontrar una vaca con una producción diaria de 20 o más litros.

17. La seroprevalencia de diarrea viral bovina en el rodeo lechero del departamento de Florida es de
0.69 (proporción de animales seropositivos). Si de la población de animales del departamento tomamos
una muestra al azar con reposición de 10 animales y definimos la variable x = nº de animales
seropositivos en la muestra.
17.a.- Indique cuál es la distribución de probabilidad de x, si es discreta o continua y cuántos
puntos forman el espacio muestral (si es posible enumérelos).
17.b.- Determine la probabilidad de encontrar 10 animales seropositivos en la muestra
17.c.- Determine la probabilidad de encontrar al menos 1 animal seropositivo en la muestra

18. Una encuesta entre estudiantes de la facultad de Veterinaria investiga cuántos de ellos tienen
decidido dedicarse a actividades clínicas. Se entrevistan 10 estudiantes. Suponga que el 60% de todos
los estudiantes tienen decidido dedicarse a esta actividad.
x es la variable aleatoria discreta que representa el número de estudiantes que contestaron en la encuesta
que piensan dedicarse a actividades clínicas.
Determine:
18.a.- La media y el desvío estándar de x
18.b.- Encuentre la probabilidad de que x sea menor o igual a 5
18.c.- La probabilidad de que x exceda 6
18.d.- La probabilidad de que x sea igual a 4
18.e.- grafique la distribución de x y localice el intervalo  - 2 a  + 2 en el grafico

pág. 36
19. Una urna contiene cuentas azules (A) y cuentas blancas (B). Sabiendo que p = P(A)=0.30.
19.a.-Calcular las probabilidades asociadas a obtener 0, 1,.2, 3, 4, 5 éxitos (cuentas azules) , en un
muestreo con reposición si el tamaño de la muestra n en cada ensayo es 5.
19.b.-Representar gráficamente la distribución.
19.c.-Calcular su media y su varianza.

20. Se estima que la prevalencia de tuberculosis en vacas lecheras es 0.10, en determinada región,
calcular la probabilidad de encontrar en 12 animales:
20.a.- una vaca positiva
20.b.- menos de 2
20.c.- alguna vaca positiva
20.d.- exactamente 5 vacas positivas

21. En un campo el promedio de madrigueras de ratones de campo es de 3 por hectárea. Calcule la


probabilidad de, en una hectárea del campo encontrar:
21.a.-ninguna madriguera
21.b.-exactamente 3
21.c.-hasta 3
21.d.-más de 3

22. La presencia de quiste hidático (QH) en hígados de novillos es causal de decomiso de dicho
órgano. Si la proporción de novillos con QH en hígado es 0.15, se desea saber la probabilidad de
que, en una faena de 10 novillos se decomisen (por QH):
22.a.-todos los hígados ;22.b.- más de 1 hígado ; 22.c.-menos de 3 hígados
22.d.-¿Qué opinaría si se decomisan todos los hígados ( 22.a) ?

23. Un laboratorio de productos zooterápicos posee un sistema de envasado automático en el que


promedialmente, un frasco cada 5000 presenta fallas (llenado insuficiente, mal tapado, rotura, etc).
Calcule la probabilidad que en una muestra de 100 frascos:
23.a.- ningún frasco esté fallado
23.b.- alguno si lo esté
23.c.- todos lo estén
23.d.- estén fallados entre 0 y 2

24. En una población de vaquillonas, el peso corporal se distribuye normalmente con media = 260
kg y desviación típica = 10 kg. Si el criterio para entorar es que la vaquillona pese 250 kg o más:
¿Qué proporción puede ser entorada?

25. Si la mastitis subclínica afecta al 30% en las vacas lecheras y se toma una muestra de 50 vacas:
25.a.- Calcule la probabilidad exacta de obtener 10 vacas enfermas.
25.b.- Compare el resultado anterior con su aproximación normal.

26. La probabilidad de contraer una determinada enfermedad es 72%. De los animales que enferman,
promedialmente muere el 67% a causa de la dolencia. En muestras de 100 animales:
26.a.- ¿ Qué probabilidad hay de que enfermen:
exactamente 75 ; más de 75 ; menos de 75?
26.b.- Antes de saber cuántos animales enfermaron ¿ qué probabilidad hay de que mueran más de
50 .?
26.c.- Sabiendo que enfermaron 80 animales ¿Qué probabilidad hay de que mueran más de 50?

pág. 37
Ejercicios Suplementarios

1. En una cuenca lechera, el 30% de la vacas padece una enfermedad no contagiosa. ¿Qué probabilidad
hay, en una muestra de 30 vacas de :
1.a.-no encontrar ninguna enferma?
1.b.-encontrar dos o tres enfermas?
1.c.-Calcule las probabilidades de a y b utilizando una distribución diferente a la que usó
anteriormente. Compare los resultados
2. Qué condiciones se requieren para que el número de éxitos en un experimento aleatorio tenga
distribución binomial
3. ¿En qué se diferencian entre sí las interpretaciones clásica y frecuencial de probabilidad? ( NO repita
las definiciones).

4. Indicar para los diferentes gráficos el tipo de función, para qué variables se utiliza y qué
representan las
ordenadas

a b opciones:

tipos de función
- función de probabilidad
-función de densidad
-función de distribución

tipo de variables
-variable discreta
c d -variable continua

en ordenadas
- f(x)
- F(x)
- p(x)
- P(x)

5. Sea X una variable aleatoria con distribución de Poisson con parámetro = 2. Calcular la
probabilidad de que dicha variable X tome valores menores o igual a 2 P( X 2 ).
5a. 0.4232 5b. 0.5414 5c. 0.6764 5d. 0.2707

6. Describa la distribución Poisson (tipo de variable, forma, parámetros). Mencione dos


ejemplos conceptualmente distintos de su uso.

7. Una variable tiene una distribución binomial, con media 1 y varianza 0.99

Calcule:
n= p= P(x=2)=

pág. 38
8. Según un criterio de registro de drogas, se autoriza el uso de ectoparasiticidas solamente si en una
muestra con reposición de n=10 ovinos parasitados todos se curan después del tratamiento.
Interesa saber qué probabilidad de ser aceptado P(A), tiene un parasiticida que sólo cura al 80% de los
ovinos:
8.a. Distribución de probabilidad a emplear y sus Parámetros.
8.b. P(A)

9. En una clínica veterinaria, el número de pacientes que concurren a consulta se distribuye en forma
totalmente aleatoria a lo largo del horario de atención, con media  = 2 pacientes/hora ¿Qué
probabilidad hay de que, en una hora cualquiera, no concurra ningún paciente? P
Justifique su respuesta

10.- Según un criterio de registro de drogas, se autoriza el uso de ectoparasiticidas solamente si en una
muestra con reposición de n=10 ovinos parasitados todos se curan después del tratamiento.
Interesa saber qué probabilidad de ser aceptado P(A), tiene un parasiticida que sólo cura al 80% de los
ovinos.

Nombre de la distribución de probabilidad a emplear:

Nombre(s), símbolo(s) y valor(es)


del (los) parámetros de esa distribución: P(A) =

pág. 39
Muestreo y Distribuciones en el
muestreo
Objetivos - UD 6

Al finalizar esta unidad, el estudiante será capaz de :

□ Describir situaciones donde el muestreo es el método de estudio indicado


□ Describir los métodos de obtención de muestras aleatorias
□ Describir la forma y los parámetros de las distribuciones en el muestreo (MAS) de medias,
proporciones y sus respectivas comparaciones, así como calcular esperanzas y varianzas
□ Analizar la relación entre estadísticos y parámetros

Conceptos previos a trabajar en clase

1. ¿Qué es un censo? ¿Cuándo se utiliza?


2. ¿Qué es el muestreo? ¿En qué se diferencia el muestreo probabilístico del no probabilístico?
3. ¿Cuál es la finalidad del muestreo? ¿Cuáles son las razones para muestrear?
4. ¿Qué es la población objetivo (blanco)? ¿Qué es la población muestreada?
5. ¿Qué es el marco del muestreo? ¿Qué es una unidad de muestreo?
6. ¿Cuáles son las características del muestreo aleatorio?
7 ¿Qué es un muestreo aleatorio simple (MAS) ?
8. ¿Qué es un muestreo aleatorio estratificado (MAE)?¿Cómo se realiza? ¿Porqué (para qué)
se usa?
9. ¿Qué es un muestreo por conglomerados (MC)?
10. ¿Qué es un muestreo sistemático?
11. ¿Qué se entiende por distribución en el muestreo?
12. ¿Describa la distribución muestral de las medias y exprese el valor de su media y de su
desviación típica
13. ¿Qué expresa el teorema limite central?
14. Describa la distribución muestral de las proporciones y exprese el valor de su media y de su
desviación típica

pág. 40
Ejercicios

1. Los resultados siguientes representan el calcio iónico en leche (mg/dl) de 60 vacas en ordeñe.

id Ca+2 id Ca+2 id Ca+2 id Ca+2 id Ca+2 id Ca+2 id Ca+2 id Ca+2 id Ca+2 id Ca+2
1 1.64 7 2.17 13 2.28 19 2.45 25 2.55 31 2.68 37 2.8 43 2.95 49 3.23 55 3.41
2 1.7 8 2.21 14 2.29 20 2.45 26 2.62 32 2.7 38 2.85 44 3.05 50 3.28 56 3.52
3 1.97 9 2.21 15 2.32 21 2.46 27 2.64 33 2.73 39 2.88 45 3.07 51 3.4 57 3.63
4 2.05 1 2.25 16 2.37 22 2.51 28 2.64 34 2.75 40 2.88 46 3.08 52 3.41 58 3.94
5 2.05 11 2.26 17 2.41 23 2.53 29 2.66 35 2.75 41 2.88 47 3.1 53 3.41 59 4.13
6 2.08 12 2.28 18 2.44 24 2.55 30 2.66 36 2.79 42 2.91 48 3.2 54 3.41 60 4.35

Usando una tabla de números aleatorios o con los números aleatorios de la calculadora tomar
muestra aleatoria simple con reposición de tamaño 5.
Calcular la media de las muestras obtenidas y la varianza.

2. Se registra la alzada en una población de 100 caballos. Suponga distribución normal con media
1.43m y desviación típica 0.03m.
Se realiza MAS con reposición (muestras n = 9)
2.a. ¿Cuánto vale la media de las medias muestrales (  x )?
2.b. ¿Cuánto vale el error típico (desviación típica de las medias muestrales) (  x ) ?
2.c. ¿Qué tipo de distribución tienen las medias muestrales?
2.d. ¿Cuál es la probabilidad de que una media muestral pertenezca al intervalo (1.41: 1.45 )?
2.e. ¿Qué probabilidad hay de que una media muestral valga más de 1.45?
2.f. Si usted toma una muestra y la media muestral es 1.50 m ¿Qué pensaría y por qué?

3. Una determinada enfermedad tiene una prevalencia del 2%. En una muestra de 1000 animales
determinar la probabilidad de encontrar como máximo 30 enfermos.

4. Una población de un millón de pesos corporales de ovejas tienen una distribución de tipo
desconocido, con media 30 kg y una desviación típica 2 kg
Si se realiza MAS sin reposición (muestras de tamaño n = 64)

Conteste:
4.a. ¿Cuánto vale la media de las medias muestrales?  x
4.b. ¿Cuánto vale el error típico (desviación típica de las medias muestrales)?  x
4.c. ¿Qué tipo de distribución tienen las medias muestrales?
4.d. ¿Cuál es la probabilidad de que una media muestral pertenezca al intervalo (29: 31)?
4.e. ¿Qué probabilidad hay de que una media muestral valga menos de 28?
4.f. Si usted toma una muestra y la media muestral vale 29.5 kg ¿Qué pensaría y por qué?

pág. 41
5. Una variable normalmente distribuida tiene  = 3 y desviación típica  =2. Al tomar una muestra de
un solo valor ¿qué probabilidad hay de que esté comprendido entre 2 y 3.5?

6. En una población de bovinos, el 20% padece una enfermedad. Se realiza MAS con reposición
(muestras n = 4)
7.a. ¿Cuánto vale la media de las proporciones muestrales)?
7.b. ¿Cuánto vale el error típico de las proporciones muestrales?
7.c. ¿A qué distribución están asociadas las proporciones muestrales? ¿Por qué? ¿Cómo?
7.d. ¿Cuál es la probabilidad de que una proporción muestral esté entre p = 0 y p = 0.5?
7.e. ¿Cuál es la probabilidad de que una proporción muestral valga más de 0.75?

pág. 42
Estimación de medias y proporciones
Objetivos - UD7

Al finalizar esta unidad, el estudiante será capaz de :

□ Analizar el concepto de estimación


□ Calcular y comparar estimadores de punto e intervalo
□ Evaluar cómo es afectada una estimación por el tamaño de la muestra, la dispersión muestral y
el nivel de confianza
Conceptos previos para trabajar en clase
1. ¿Qué significa estimar un parámetro?
2. ¿Qué es un estimador?
3. ¿Qué es una estimación?
4. ¿Qué es estimar por punto?
5. ¿Qué es estimar por intervalo?
6. ¿Qué son los límites de confianza?
7. ¿Qué es un intervalo de confianza?
8. ¿Qué es un nivel de confianza?
9. ¿Cuáles son las características de los buenos estimadores y qué significa cada una de ellas?
10. ¿Qué significa grados de libertad?
11. ¿Qué características presenta la distribución de Student( t ) ?
12. ¿Cómo se define el estadístico t y en qué se diferencia del estadístico z ?

Ejercicios

1). En una muestra de 25 perras de 2 años de edad se registró el número de crías de cada una.

MADRE 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
Nº de
2 3 5 9 7 6 2 7 4 8 5 5 6 7 4 8 6 5 5 3 6 4 4 5 6
CRIAS

1. Determine el intervalo de confianza del 90% para la media de crías por madre

2. Calcular el tamaño de la muestra necesario para estimar una proporción poblacional con un error no
mayor que 0.05 y nivel de confianza de 0.95, sabiendo que el muestreo es con reposición y que la
proporción que se desea estimar vale aproximadamente 0.06.

3. Una encuesta aleatoria de ganado bovino encontró 35 animales padeciendo afecciones podales sobre
un total de 140 animales.
3.a. Estime el intervalo de confianza para la prevalencia de la enfermedad a un nivel del 95%
3.b. ¿Cuál sería el tamaño de la muestra para que el error no exceda el 5% a un nivel de confianza de
0.95

pág. 43
4. En una población de 100 lechones se registró el peso individual el cual se distribuye normalmente
con media  = 10.47 kg y desviación típica = 2.19 kg.
id peso id peso id peso id peso id peso
1 10,09 21 14,53 41 10,17 61 9,86 81 9,9
2 5,55 22 10,85 42 11,57 62 11,74 82 12,39
3 10,07 23 6,17 43 12,5 63 12,36 83 13,65
4 10,77 24 7,39 44 9,04 64 12,63 84 8,15
5 9,29 25 14,14 45 13,78 65 6,59 85 9,19
6 8,53 26 12,18 46 9,47 66 10,54 86 11,05
7 6,47 27 7,86 47 15,96 67 11,13 87 11,51
8 15,5 28 10,65 48 10,42 68 11,6 88 8,08
9 11,27 29 10,21 49 10,84 69 12,63 89 12,24
10 11,3 30 7,04 50 9,14 70 8,59 90 7,89
11 5,97 31 11,82 51 10,09 71 8,77 91 10,64
12 13,69 32 8,54 52 14,03 72 10,98 92 10,84
13 13,44 33 11,83 53 11,41 73 10,53 93 8,93
14 9,38 34 8,6 54 10,48 74 12,78 94 9,75
15 10,77 35 9,14 55 11,66 75 14,89 95 10,15
16 8,19 36 8,68 56 9,25 76 9,05 96 8,21
17 11,58 37 7,24 57 10,94 77 12,81 97 10,68
18 7,55 38 11,17 58 13,06 78 9,44 98 7,16
19 9,79 39 13,05 59 6,37 79 13,54 99 9,2
20 10,72 40 12,05 60 11,04 80 10,09 100 12,68

4.a. Determine el tamaño de la muestra necesario para estimar la media poblacional con un error
no mayor de 1.5 y a un nivel de confianza de 0.95.
4.b. Seleccione una muestra aleatoria simple con reposición del tamaño determinado en 4.a
(utilizar los números aleatorios de la calculadora ).
4.c. Determine la media de su muestra, el error estándar y el intervalo de confianza a nivel del 95%
4.d. Repita a, b y c pero utilizando un nivel de confianza del 99%
4.e. Compare sus resultados entre sí y con la verdadera media poblacional

5.. Los niveles de ácido úrico en varones sanos tienen distribución Normal, con media poblacional de
5.4 mg/100cc y desviación típica de 1.0 mg/100cc.
5.a. Entre muestras repetidas de tamaño 25 cada una, procedentes de esta población ¿qué
proporción de las muestras tiene una media de 5.9 mg/100cc o superior?
5.b. ¿Cuál es el valor que elimina el 5% superior de la distribución en el muestreo de medias
con n =25 ?
5.c. ¿ Cuál es el tamaño de muestra requerido para que un 5% de las medias correspondientes
rebasen la media poblacional en 0.2 mg/100 cc o más?

pág. 44
6. En una encuesta se entrevistó aleatoriamente a 400 uruguayos. Estos en promedio consumen 91kg
de carne por año. Sabiendo que el CV poblacional es de 15% estime:
6.a. ¿Cuál sería el tamaño de muestra adecuado para que al estimar , el error no exceda los 5 kg de
carne a un nivel de confianza del 90 %?
6.b. Estime el intervalo de la media de consumo de carne con un nivel de confianza de 99%.

7. A efectos de controlar el buen uso de las balanzas una liga defensora de los consumidores tomó
muestras de 1 kg de carne picada de 20 establecimientos comerciales. Por antecedentes anteriores se
sabe que los pesos tienen distribución normal. Una vez pesada en una balanza testigo cada una de las
muestras se constató que el promedio era de 1kg con una varianza de 0.0049.

7.a. Si definiéramos como infractores al 10 % de los establecimientos que tengan los menores pesos.
¿Cuál sería el peso límite por debajo del cual se debería sancionar?
7.b. A un nivel de confianza del 95% ¿cuál es el intervalo de confianza de la media?

8 Una variable tiene distribución normal con  =10 y  = 2 .¿ Qué probabilidad hay, si se toma una
muestra de tamaño 25, de que x  11.2 ?

9. En una muestra (tomada por MAS) de 40 borregas merino, se registraron los siguientes pesos de
vellón (en kg):

2.05 1.08 1.40 2.08 2.30 2.25 1.30 1.75 1.45 2.30
0.85 1.65 1.58 0.95 1.95 2.15 2.05 2.10 1.70 1.58
1.70 2.50 1.70 1.70 2.10 1.60 1.80 1.80 1.85 1.65
1.65 1.50 1.20 1.30 1.00 0.8 2.55 1.35 1.90 1.00
Suponiendo que la distribución de la variable en la población es aproximadamente normal:
9.a. Calcule una estimación (por punto y centrada) de la varianza en la población.
9.b. Calcule el intervalo de confianza para la media poblacional, a nivel 95%.
9.c. En la población :¿Qué proporción (aproximadamente ) de las borregas superan los 2.4 kg de
vellón?
9.d. En la población : ¿Cuál será el peso de vellón superado por el 25% de las borregas?

10. Una variable tiene distribución desconocida, con desviación típica poblacional conocida,  = 3. Se
toma una muestra de tamaño (n) = 90 cuya media ( x ) es 17.
10.a Determine los límites del intervalo de confianza a nivel del 99%, para la media poblacional.
10.b Determine los límites de confianza a nivel del 95% para la media poblacional
10.c Si la muestra fuese de tamaño (n) = 9 ¿serían válidos los resultados? ¿por qué?

11. Calcular el tamaño de la muestra necesario para estimar una media poblacional con un error no
mayor que 4 a nivel de confianza 0,95 sabiendo que la población es infinita y que = 20.

pág. 45
12. La leucemia mieloblástica aguda es uno de los cánceres más mortales. Considérese la variable X =
"tiempo en meses que sobrevive un paciente después del diagnóstico inicial de la enfermedad". Se
supone que la variable X está distribuida normalmente con media = 13 meses, en la población. Una
muestra aleatoria de 16 pacientes reveló los siguientes resultados:

10.8 12.5 13.4 14.2 13.6 14.2 8.6 15.0 13.2 14.9 11.5 12.9 13.6 14.5 12.0 12.9

12.a. Utilizando esta información calcular el intervalo de confianza a nivel 0.95 para la media
poblacional
12.b. De acuerdo a los límites calculados según las observaciones y la media poblacional ¿qué podría
concluir?

13. En una muestra de 560 perros provenientes de establecimientos rurales, se encontraron 120
positivos a E. granulosus. Suponiendo MAS.
13.a. Justifique el uso de la distribución normal como aproximación, en este caso
13.b. Calcule el tamaño de muestra necesario para estimar la proporción poblacional con un
error menor o igual a 0.01 y a nivel de confianza del 95%.

14. Una variable tiene distribución normal, con desviación típica poblacional conocida,  = 5. Se toma
una muestra de tamaño (n) = 10, cuya media ( x ) es 20.

14.a. Determine los límites del intervalo de confianza a nivel 99%, para la media poblacional
14.b. Determine los límites del intervalo de confianza a nivel 95%, para la media poblacional
14.c. Calcule el tamaño de muestra necesario para estimar por intervalo la media poblacional a
nivel de un 90% de confianza con un error menor que 1.

15. Una variable tiene una distribución aproximadamente normal, con desviación típica poblacional
desconocida. Se toma una muestra de tamaño ( n ) = 100, cuya media ( x ) es 20 y en la que la
desviación típica muestral es sˆ = 5
15.a. Determine los límites del intervalo de confianza a nivel del 95% para la media poblacional
15.b. Determine los límites del intervalo de confianza a nivel del 90% para la media poblacional
15.c. Si la muestra fuera de tamaño (n) = 10 ¿serían válidos estos resultados? ¿Por qué?

pág. 46
Verificación de Hipótesis
Introducción - una muestra
Objetivos - UD7 (continuación)

Al finalizar esta unidad, el estudiante será capaz de:

□ Formular hipótesis para diferentes situaciones


□ Describir los posibles errores en una prueba de hipótesis
□ Plantear ejemplos veterinarios para analizar, calcular e interpretar los diferentes componentes
de una prueba de hipótesis.

Conceptos previos
1. ¿Qué es una decisión estadística? ¿Qué es una hipótesis estadística?
2. ¿Qué es una hipótesis nula? ¿Qué es una hipótesis alternativa?
3. ¿Qué es un error tipo I? ¿Qué es un error tipo II?
Cuando se habla de una prueba de hipótesis:
5. ¿Qué significa la expresión "supuestos"? ¿Qué es un estadístico de prueba? ¿Qué es un valor
crítico?
6. ¿Qué es el nivel de significación?
7. ¿Qué es la potencia de un test?
8. ¿Qué diferencia hay entre una hipótesis unilateral y una bilateral?

Ejercicios

1. Una enfermedad infecciosa aguda tiene - en la población- una incidencia del 50% y una letalidad del
10%

Incidencia: número de enfermos producidos en un período/total de susceptibles en el período


Letalidad: número de muertos a consecuencia de la enfermedad/ número de enfermos

En un establecimiento se toma una muestra de 100 animales susceptibles, de los que enferman 40 y 2
mueren.
Ensaye Ho ( =0.05) para Letalidad y para Incidencia y emita una conclusión respecto a las siguientes
preguntas: ¿podemos afirmar que este establecimiento se comporta diferente del resto de la población
en términos de incidencia y letalidad?

pág. 47
2. A partir del siguiente conjunto de datos (suponga distribución normal de la variable)

x 0.0-0.5 0.5-1.0 1.0-1.5 1.5-2.0 2.0-2.5 2.5-3.0 3.0-3.5 3.5-4.0 4.0-4.5 4.5-5.0
f 8 20 36 50 86 86 50 36 20 8
2.a.- Ensaye Ho:  =2.60 a nivel de significación  =0.05.
2.b.- Determine el tamaño de muestra necesario para estimar la media poblacional a nivel
de confianza del 99% con un error no mayor que 0.05.

3. En una muestra de 1000 peces, se encuentran 400 machos y 600 hembras.


3.a.- Calcule el tamaño de muestra necesario para estimar la proporción de machos a nivel de
confianza 95% con un error menor a 0.01.
3.b.- Estime la proporción de machos a nivel de confianza 95%.
3.c.- Ensaye la hipótesis que, en la población hay tantos machos como hembras ( =0.05 )

4. 100 vacas lecheras son sometidas a una nueva forma de manejo. La media de producción de leche
diaria en ese grupo es de 22 litros y su desviación típica muestral de 3 litros. A nivel de
significación 0.05:
4.a.- ¿La media de producción es significativamente distinta de 20 litros diarios?
4.b.- ¿Determine el valor de producción en litros diarios que deja por debajo al 5% de las vacas en
la nueva forma de manejo (donde la media estimada es 22 litros diarios)?

5. Una variable se distribuye normalmente con  = 8


Ensaye (= 0.05) la Ho:  = 12, si en una muestra de n = 9, se encontró una media = 11

6. Si se obtuvo una muestra con media = 4; n = 26 y sˆ = 9.


2

6.a. Verificar la Hipótesis nula que  =5 a un nivel de significación  = 0.05 .


6.b. Con los mismos datos y el mismo nivel de significación verificar Ho: = 3.5.

7. Sabiendo que  = 4, se plantea la H0:  = 10. Se toma una muestra de tamaño igual a 100 y se elige
un  = 0.01.
7.a Testar la H0 si el valor de la media muestral = 15
7.b Si se toma una muestra de tamaño 16, en la cual la media es igual 8; sabiendo que sˆ2 = 4, estimar la
media poblacional  a un nivel de confianza del 95%.

8. En un establecimiento de bovinos lecheros se obtuvieron 65 positivos a Leucosis bovina (LB) en


una muestra de 225 animales. El productor de ese establecimiento sostiene que la prevalencia de la LB
es de 25%. En base a los datos del muestreo es posible probar que la prevalencia difiere de la opinión
del productor al nivel de significación de 0.05?

9.. La población de novillos de 3 años o más de un establecimiento ganadero en mayo de 1998 tenía un
peso promedio de 445kg En esa oportunidad se determinó que la variable tenía una distribución
aproximadamente normal. Con el objetivo de determinar si las condiciones de producción en el 2003
han sido diferentes a las de 1998 se decidió tomar una muestra aleatoria simple con reposición de 15
novillos de similares condiciones y registrar sus pesos en kg, registrándose una media de 450 kg y una
desviación típica muestral de 15 kg.
9.a. Pruebe a nivel de significación (alfa =0.05), si la muestra puede provenir de una población con las
características determinadas en mayo de 1998.
9.b. Pruebe la hipótesis al mismo nivel de significación anterior si la varianza poblacional fuera
conocida e igual a 400kg2.

pág. 48
10. En una prueba de Bioestadística, los estudiantes de la generación 2015, obtuvieron los siguientes
resultados:

puntaje 1-4 5-8 9-12 13-16 17-20 21-24 25-28 29-32 33-36 37-40
frecuencia 6 10 18 26 44 42 24 16 11 3

10.a. Ensayar la hipótesis de que la media poblacional es igual a 20 puntos ( = 0.01)

Los estudiantes del grupo 9 (n = 30) tuvieron en promedio x = 20.12 puntos, con sˆ = 7.94
10.b. En estas condiciones, responda 10 a.-
10.c. ¿Qué condiciones se requiere para que el test empleado en 10.a sea válido?

11. Se capturan al azar 68 ejemplares de cangrejo azul, de los cuales 47 son machos y 21 hembras.
¿Los valores encontrados en la muestra evidencian diferencias significativas en la proporción de
machos y hembras en el lugar donde se realizó la captura? ( =0.05).

12. Una fábrica produce latas de extracto de carne que deben contener 250 g cada una. El proceso de
fabricación asegura que la distribución de los contenidos reales es normal, con media (  ) = 250 gr. Y
desviación típica () = 10 gr. ¿Cuántas latas será necesario examinar para poder contestar (con  =
0.05) si en realidad el promedio de peso es de 250 gr. con un error menor que 5 gr.?

Ejercicios suplementarios

1. Un mazo de cartas francesas se supone que contienen 26 rojas (diamantes y corazones) y 26 negras
(tréboles y piques). Se extrae una muestra de 6 cartas, de las cuales 1 es roja y 5 son negras. A la vista de
este resultado, ¿es aceptable que la proporción de cartas rojas en el mazo es el 50 %?

1.a.- Plantee las hipótesis


1.b.-Ensaye Ho ( =0.05)
1.c.- Emita una conclusión respecto a la pregunta planteada

pág. 49
Prueba de hipótesis para dos muestras
Objetivos - UD 8
Objetivos de la Unidad didáctica 8 - Prueba de hipótesis para dos muestras
Al finalizar esta unidad, el estudiante será capaz de:

 Identificar cuando se trata de muestras independientes o no


 Formular hipótesis adecuadas para las diferentes situaciones
 Realizar las pruebas de hipótesis para dos muestras
 Interpretar los resultados de las pruebas de hipótesis
Conceptos previos a trabajar en clase
1. ¿Cuándo se dice que dos muestras son independientes? ¿Cuándo son pareadas?
2. ¿Cuándo se utiliza la prueba de z para testar diferencias de medias?
3. ¿Cuáles son los supuestos en que se basa la prueba de t de diferencia de medias entre dos
grupos independientes?
4. ¿Qué significa cada uno de los supuestos mencionados en 3?
5. ¿Cuáles son los supuestos en que se basa la prueba de F del cociente de varianzas entre dos
grupos independientes?
6. ¿Qué se puede hacer para comparar las medias de dos grupos independientes en presencia de
heterocedasticidad?
7. ¿Cómo se puede proceder para comparar las medias de dos grupos pareados?
8. ¿Qué condición se requiere para comparar proporciones en dos grupos independientes?

Ejercicios
1. En una población de ovinos se estableció el sexo genético de cada integrante (machos y hembras) y
si los mismos tenía problemas podales (claudicaban al caminar o no). La población tenía 350 hembras
de las cuales 40 presentaban problemas podales y 100 machos de los cuales 12 presentaban problemas
podales.
1.a.- Identifique los tipos de variables en estudio y sus escalas de medida.
1.b.- Represente gráficamente la distribución de sexos en esta población.
1.c.- ¿A un nivel de significación de 0,05 podemos afirmar que el sexo y los problemas podales
están estadísticamente asociados?

2. - Se desea probar si un sustituto de leche de oveja basado en harina de soja es tan eficiente como la
leche de la propia madre para la cría de corderos. A efecto de probar este sustituto de la leche se tomó una
muestra de 9 pares de corderos gemelos. De cada par al nacimiento uno fue asignado a la alimentación
con sustituto mientras que el otro miembro se crío con su madre. A los 60 días de vida se registró el peso
(kg.) de cada uno de los corderos hijos de cada una de las ovejas involucradas obteniéndose los siguientes
resultados:

OVEJA OVEJA OVEJA OVEJA OVEJA OVEJA OVEJA OVEJA OVEJA


1 2 3 4 5 6 7 8 9
Leche Oveja 15.0 15.3 15.5 12.0 14.7 14.8 13.2 15.8 13.5
Sustituto 14.7 15.2 15.4 11.8 14.5 14.8 12.9 15.9 12.9

¿Podríamos afirmar que el sustituto se comporta diferente de la leche de oveja en la cría de corderos, con
un =0,05?

pág. 50
3. Los pesos corporales de los venados de campo adultos tienen desviación típica poblacional
desconocida pero semejantes (asuma homocedasticidad).
Se tomó una muestra de una subpoblación proveniente de la provincia de Buenos Aires (Argentina)
y otra de una subpoblación de El Tapado (Uruguay), con los siguientes pesos corporales en kg:

buenos aires 30 25 30 33 27 26 27 20 26 23 25 21 26 23
el tapado 23 25 18 23.6 21.5 23 27

¿Los venados de Buenos Aires y de El Tapado presentan diferencias de peso corporal? ( =0.05)

4. El uso de conservantes en la industria de los alimentos es controversial pero su uso se ha


incrementado notoriamente en los últimos años con el cambio de los hábitos alimentarios. Un
procesador quiere comparar dos conservantes, para retardar el proceso de deterioro de la carne. Para eso
se seleccionaron 30 cortes diferentes de carne de los cuales aleatoriamente se los ubicó en 2 grupos de
15 cortes cada uno. Con el conservante A el tiempo medio de retraso en la alteración fue de 106.4 horas
con una desviación típica de 10,3 horas. Con el conservante B el tiempo medio de retraso fue 96.5 horas
y la desviación típica fue de 13.4 horas.

4.a. ¿Cuál es la variable de respuesta?


4.b. ¿Cuál es la variable factor?
4.c. ¿De qué tipo son las variables en estudio?
4.d. ¿En base a su análisis estadístico, podría afirmar que el comportamiento de estos dos conservantes
es diferente a un nivel de significación del 5% ? (asuma homogeneidad de varianzas).
4.e. ¿ Sobre qué supuestos se basa su análisis estadístico?

5. Se tomaron muestras aleatorias sobre carneros de nacimientos de mellizos y otra de partos simples
para establecer si existen diferencias en la producción de lana (en kilos). Las muestras pertenecen a
animales de la misma raza, con edades y manejo similares. Los resultados obtenidos fueron:

5.a. ¿Cuál es la variable de respuesta?


x sˆ n
5.b. ¿Cuál es la variable factor?
parto simple 4 3.9 10 5.c. ¿ De qué tipo son las variables en estudio?
mellizos 3.6 1.9 10 5.d. ¿En base a su análisis estadístico, podría afirmar que la
producción de lana difiere entre los grupos? (utilice un  = 0.01
y asuma que las varianzas son homogéneas).

6. Se somete a un grupo experimental a un tratamiento teniéndose otro grupo de animales como


control y se obtienen los siguientes resultados

6.a. Determinar si hay efecto del tratamiento sobre las



x
n
medias para un  = 0.05. Asuma homogeneidad de
g. experimental 27 4 25 varianzas.
g. control 23 3.5 16

7. Con el fin de determinar el efecto de un suplemento nutricional durante la etapa de cría de lechones
se realizó una prueba experimental con animales provenientes de 12 camadas del criadero. De cada
camada se tomaron 2 lechones y por sorteo se asignó uno al grupo alimentado con ración estándar
(grupo A) y el otro al grupo con ración + suplemento (grupo B). Para cada lechón se determinó la

pág. 51
ganancia diaria de peso (kg) durante el ensayo que se presenta en la siguiente tabla (la columna
representa la camada):
1 2 3 4 5 6 7 8 9 10 11 12
A 0.52 0.64 0.50 0.65 0.66 0.74 0.50 0.80 0.70 0.61 0.68 0.55
B 0.60 0.66 0.49 0.70 0.81 0.70 0.58 0.86 0.70 0.63 0.74 0.60

7.a.- Realice una Prueba de Hipótesis para determinar si el suplemento nutricional tiene efecto
sobre la ganancia diaria de peso de los lechones, con  = 0.01.
7.b.- Sobre que supuestos se basó para realizar esta prueba.

8. Se compararon los pesos promedio de cresta de 15 días de dos lotes de pollitos machos que recibían
testosterona (grupo A) y el otro dihidroandrosterona (grupo B). Once pollitos de 1 día de edad fueron
asignados aleatoriamente a cada uno de los tratamientos se obtuvieron los siguientes resultados de
pesos (mg).

grupo A 57 120 101 137 119 117 104 73 53 68 118


grupo B 89 30 82 50 39 22 57 32 96 31 88

¿Difieren los pesos de cresta promedios que producen las dos hormonas? (α= 0.01, y asuma
homocedasticidad).

9. El porcentaje de destete en ganado de carne en el Uruguay es del 64%. Para establecer las
previsiones del año próximo se tomaron dos muestras de 100 vacas de cría cada una, en forma
aleatoria. Una de las muestras se realizó en el departamento de Lavalleja y de esas vacas 57 destetaron
sus correspondientes terneros. La otra muestra fue en el departamento de Salto y 70 destetaron sus
terneros.
9.a. En función de los resultados ¿la muestra correspondiente a Lavalleja es esperable en relación a los
datos históricos?
9.b. En función de los resultados ¿la muestra correspondiente a Salto es esperable en relación a los
datos históricos?
9.c. Ensaye la hipótesis respecto de la existencia de diferencias entre las muestras de Salto y Lavalleja.
9.d. ¿Las diferencias observadas entre las muestras de Salto y Lavalleja pueden atribuirse al muestreo?

10. Se sospecha que la utilización de suelos húmedos es un factor favorable para el desarrollo de
problemas podales (footrot) en ovinos. A fin de poner a prueba este factor se diseñó un muestreo en el
cual participaron dos poblaciones de individuos de la misma raza y categoría que tenían como
diferencia que unos se encontraban en suelos bajos y húmedos mientras que la otra población se
mantenía en suelos altos y secos. De cada una de estas poblaciones se extrajeron al azar 100 animales y
se los calificó con o sin problemas podales. En la muestra de zonas húmedas (H) se encontraron 36
animales con problemas podales mientras que en la muestra de zonas secas(S) se encontraron 24 con
problemas podales.
¿Con estos elementos se puede afirmar a un nivel de significación de 0.10 que las poblaciones son
diferentes?

11. Un productor desea establecer si la estrategia de suplementar con un kilo de ración semanal la
categoría capones durante seis meses determina una diferencia en la producción de lana. A esos efectos
se diseñó una prueba con 2 grupos de 9 capones gemelos cada uno. Un miembro de cada par fue
seleccionado aleatoriamente suplementándolo con ración (A= Tratado) y el otro no se suplementó

pág. 52
(B= Control), en la esquila se pesan los vellones de cada uno de ellos, obteniéndose los siguientes
resultados:

1 2 3 4 5 6 7 8 9
Tratado = A 3.00 2.95 2.53 3.10 3.55 3.00 2.95 2.20 3.15
Control = B 3.25 2.64 2.61 2.83 2.55 2.00 2.20 4.00 3.55

11.a.- Identifique los tipos de variables en estudio (respuesta y factor) y sus escalas de medida.
11.b.- ¿Qué supuestos debería asumir para realizar una prueba de hipótesis que permita
comparar ambos grupos?
11.c.- Asumiendo sus supuestos pruebe a un nivel de significación de 0.05 si se podría afirmar
que la suplementación afecta la producción de lana.
11.d.- Estime aproximadamente qué proporción de la población B tiene un peso de vellón
inferior a 1.64 kg.

12. Un grupo de 15 perros machos y otro de 15 hembras, de similar peso inicial, fueron sometidos a
dosis diarias de desoxipiridoxina (antivitamina B6) durante un tiempo. Al finalizar la experiencia se
registraron las disminuciones de peso, con los siguientes resultados en kg:
media desviación típica corregida
Machos 1.2 0.3
Hembras 1.4 0.4

¿La pérdida de peso es significativamente mayor en hembras que en machos? ( = 0.05, asuma
homogeneidad de varianzas)

13. Para probar el efecto de un nuevo antibiótico sobre el tiempo de recuperación de diarreas por
intoxicación alimentaria, se tomó una camada de 9 lechones que estaban desarrollando en forma
espontánea este tipo de diarreas. De esta camada se seleccionó en forma aleatoria un grupo de 5
lechones al cual se le aplicó el nuevo tratamiento (grupo tratado) mientras que al resto se le aplicó el
tratamiento convencional (grupo control).
Se registró en horas el tiempo de recuperación para cada media varianza n
uno de los lechones, lo cual se resume en el cuadro control 72 49 4
siguiente. Asumiendo que la distribución en horas de
ambos grupos es aproximadamente normal y que las tratado 62 36 5
varianzas son iguales
¿Podemos establecer si el nuevo tratamiento difiere del actual? ( = 0.05)

14. Una técnica paraclínica de diagnóstico se basa en la medición de una variable, que en los individuos
sanos presenta s = 3 mientras que en los enfermos e = 4. Las medias s y e, en cambio,
dependen parcialmente del equipamiento, los reactivos empleados y las condiciones ambientales.
A los efectos de evaluar la capacidad diagnóstica de la técnica en determinadas condiciones se toma una
muestra de 30 enfermos ( x e  15 ) y de 35 sanos ( x s  10 )

¿Puede considerarse que los niveles de la variable en estudio difieren entre los dos grupos?
(alfa = 0.05)

pág. 53
Prueba de hipótesis para más de dos medias

Análisis de Varianza (ANOVA)


Objetivos - UD 9

Objetivos de la Unidad didáctica 9 - Prueba de hipótesis para más de dos medias


Al finalizar esta unidad, el estudiante será capaz de:
 Describir los elementos estadísticos de un diseño experimental
 Definir el objetivo del análisis de varianza
 Formular hipótesis adecuadas para las diferentes situaciones
 Describir la distribución de F
 Construir la tabla de análisis de varianza
 Calcular F e interpretar los resultados de la prueba de hipótesis
Conceptos previos a trabajar en clase
1. ¿Para qué se utiliza el Análisis de la Varianza (ANOVA)?
2. ¿Cómo se descompone la suma de cuadrados total en el análisis de la varianza?
3. ¿Qué significan las expresiones suma de cuadrados dentro y sumas de cuadrados entre?
Mencione expresiones sinónimas
4. ¿En qué supuestos se basa la validez de la prueba de F en el ANOVA?

Ejercicios
1. Se desea probar el efecto sobre la producción lechera de dos cepas diferentes de levaduras como
aditivo en la alimentación. Para ello se diseño un experimento utilizando un grupo de 12 vacas lecheras
muy similares en todas sus características productivas. Este grupo fue dividido en forma aleatoria en
tres lotes diferentes a los cuales se les aplicó el siguiente tratamiento:
A = Grupo Control, B = Levadura I y C = Levadura II. Luego de aplicar el tratamiento durante 3
meses se tomó el promedio de producción diario de cada vaca obteniéndose los siguientes resultados.
1.a.- ¿Cuál es la variable de respuesta y su escala de medida?
A 15.5 12.5 17.2 14.6 1.b.- ¿Cuál es el factor estudiado y su escala de medida?
B 14.7 18.5 14.3 16.1 1.c.- ¿Puede Ud. establecer si existe algún efecto de los aditivos
C 18.5 15.5 20.3 17.0 sobre la producción de leche a un nivel de significación del
0.05?
1.d.- ¿Sobre qué supuestos realizó la prueba de hipótesis?

2. En un experimento, se forman 4 grupos similares que son sometidos a distintos tratamientos. Se


mide la variable de respuesta y se obtienen los siguientes resultados:
Fuente de Suma de Grados de Media de F calc
variación cuadrados libertad cuadrados
ENTRE 302

DENTRO

TOTAL 3213 22

 Complete el cuadro. Plantee la hipótesis nula y decida si rechazarla o no, a nivel de


significación del 5%.

pág. 54
3. La composición de aminoácidos es muy importante para el crecimiento de monogástricos. Por esta
razón se decidió realizar un experimento de ganancia de peso en cerdos con 3 diferentes concentrados
proteicos: A, B y C. Se formularon raciones con iguales componentes excepto la diferencia en el
concentrado proteico y se utilizaron 18 lechones para su evaluación. Los 18 lechones fueron divididos
en forma aleatoria en 3 lotes de igual número y a cada uno de los lotes se le administró la ración
correspondiente. Antes de iniciar la experiencia se chequearon los pesos iniciales siendo
aproximadamente iguales. Luego de 60 días de tratamiento, los animales fueron nuevamente pesados
con los siguientes resultados:

A 25.0 30.5 28.5 30.8 30.0 28.8 3.a.- Identifique los tipos de variables en estudio
(respuesta y factor) y sus escalas de medida.
B 25.5 30.5 23.5 27.6 23.8 31.5 3.b.- ¿Qué supuestos debería asumir para realizar una
C 35.8 36.5 25.7 32.6 29.8 30.5 prueba de hipótesis?

3.c.- Compruebe si las varianzas son homogéneas para alfa = 0.05


3.d.- Asumiendo sus supuestos pruebe a un nivel de significación de 0.05 si se podría afirmar si los
diferentes tratamientos produjeron algún efecto.

4. La siguiente tabla muestra el contenido de nitrógeno, en miligramos, de plantas de trébol rojo


inoculadas con cultivos de diferentes cepas de Rhizobium (números romanos del I al VI). El
experimento se realizó utilizando un diseño completamente aleatorio con cinco parcelas por
tratamiento.

I II III IV V VI
19.4 17.7 17.0 20.7 14.3 17.3 ¿Difieren las medias de contenido de nitrógeno en las plantas
32.6 24.8 19.4 21.0 14.4 19.4 de trébol rojo entre los distintos tratamientos? (=0.05).
27.0 27.9 9.1 20.5 11.8 19.1
32.1 25.2 11.9 18.8 11.6 16.9
33.0 24.3 15.8 18.6 14.2 20.8

5. Tres grupos de vacas lecheras de similares características son alimentados con diferentes raciones
(una por grupo), registrándose la producción diaria de leche de cada una. En total se emplearon 25
vacas. La media de cuadrados entre raciones es 8, mientras que la media de cuadrados residual es 22.
¿Las raciones tiene efectos diferentes sobre la producción de leche? (=0.05)

6. Se sometieron animales a 4 tratamientos con los siguientes resultados

A 2 5 3 1 4 4 Compare el efecto de los tratamientos sobre


B 1 0 0 1 3 la variable medida (α=0.05). Suponer que se
C 6 4 5 5 6 2 cumplen los supuestos para realizar un
ANOVA.
. D 8 7 6 5

7. En un experimento se compara la efectividad de tres suplementos alimenticios. Para ello, se toman


aleatoriamente 15 individuos con hipomagnesemia (nivel de magnesio bajo): a 5 de ellos se le
administra el suplemento 1, a otros 5 se le administra el suplemento 2 y a los 5 restantes
el suplemento 3. Luego, se mide la concentración de magnesio en sangre (mg/dl) y se obtienen los
siguientes valores:

pág. 55
S1 1.7 2.3 3.1 2.9 2.4
S2 2.5 1.4 1.2 3.9 2.6
S3 1.2 3.8 3.4 1.7 2.1

Suponiendo que se cumplen los supuestos del ANOVA, verificar si existe diferencia entre las medias de
concentración de magnesio de los grupos para un =0.01. ¿Observa diferencias significativas entre los
efectos de los suplementos?

8. Se quiere estudiar si existen diferencias significativas en el volumen de leche producido por 3 razas
de ganado vacuno lechero. Para eso se seleccionan, en forma aleatoria, 4 animales de cada raza y se
registra el volumen de leche en un día. Se obtienen los siguientes valores:
Holando 12 14 8 14
Jersey 9 6 9 8
Pardo Suizo 9 7 10 9
a.) ¿Cuál es la variable factor y la variable respuesta?
b.) Mencione los supuestos del ANOVA y asumiendo que se cumplen, verifique si existen diferencias
significativas entre las razas para un =0.05.

9. Cinco fábricas de productos alimenticios vierten desechos a un río y se desea comprobar si existen
diferencias significativas en la cantidad de desechos arrojados. Se toman 10 muestras de cada una de las
fábricas, se registran los valores de sustancias tóxicas arrojadas y se realiza un ANOVA, asumiendo que
se cumplen los supuestos.
a.) Complete el cuadro siguiente:
Fuente de Var. SC GL MC F
Entre 37.28
Dentro
Total 86.00
b.) ¿Existen diferencias significativas en la cantidad de desechos vertidos por las 5 fábricas? (=0.05).

pág. 56
Análisis de frecuencias yotras

Aplicaciones de Chi cuadrado


Objetivos - UD 10

Objetivos de la Unidad didáctica 10 - Chi cuadrado


Al finalizar esta unidad, el estudiante será capaz de:

 Describir situaciones donde es adecuado la utilización de la prueba de Chi cuadrado


 Formular hipótesis adecuadas para las diferentes situaciones
 Calcular la prueba de chi cuadrado e interpretar los resultados
 Identificar situaciones donde debe realizar estimación de riesgo
Conceptos previos a trabajar en clase
1. ¿Cuándo se analizan frecuencias mediante Chi cuadrado? ¿Qué es una prueba de
homogeneidad?
¿Qué es una prueba de independencia? ¿Qué es una prueba de bondad de ajuste?
2
2. ¿Qué condiciones se requieren para que una prueba de  sea aplicable al análisis de
frecuencias?
3. ¿Qué se puede hacer cuando las condiciones no se cumplen?
4. ¿Puede un test de 2 sustituir a un test de z cuando se comparan dos proporciones? ¿Por
qué?
5. ¿Cómo se calculan los grados de libertad en cada una de las aplicaciones mencionadas en 1?

Ejercicios
1. Un conjunto de 1600 ovejas con enfermedades podales es subdividido al azar en 4 grupos, a cada
uno de los cuales se les aplica un tratamiento distinto. Al finalizar el tratamiento se registra el número
de sanas y enfermas
tratamiento A B C D
sanas 247 341 258 198
enfermas 153 59 142 202

Se desea saber si los tratamientos difieren en sus resultados (alfa = 0.05)


1.a. Calcular la proporción de animales con enfermedades podales dentro de cada grupo.
1.b. ¿Cuál es la prueba de hipótesis a emplear? justifique su respuesta.
1.c. Realice la prueba y emita sus conclusiones.

2. Se toman 100 muestras de 4 vacas cada una y se registra el número de enfermas en cada muestra
Nº de
0 1 2 3 4
enfermas/muestra
Nº de muestras
23 45 25 6 1
(frec. observadas)
2.a. ¿Los datos observados difieren de una distribución binomial para un =0.05?
x

Sugerencia: A partir de la definición de media muestral , calcule el parámetro p de la distribución


binomial. Estime las frecuencias esperadas a partir las probabilidades en cada clase usando la

pág. 57
definición de distribución binomial de parámetros n y p.
2.b. Responda la pregunta anterior (para un =0.05) sabiendo ahora que en la población p =0.3

3. Estudiando la protección a la toxoplasmosis que brinda, en ratones, el tratamiento con taquizoitos;


se diseñó una prueba con dos grupos de 150 ratones (uno tratado y otro control), los cuales fueron
desafiados con ooquistes. La protección se determinó por la ausencia de quistes en el cerebro de los
ratones al finalizar la prueba. Se obtuvieron los siguientes resultados: En el grupo tratado solamente en
30 ratones se encontraron quistes. En el grupo control se desarrollaron quistes en 120 ratones. ¿Se
puede considerar a =0.05 que el tratamiento otorgó protección ante el desafío?

4. Se divide una cuenca lechera en 3 zonas para estudiar ZONA


la prevalencia de la leucosis. DIAGNOSTICO
NORTE CENTRO SUR
Se toman muestras al azar de animales de cada zona y
se contabilizan los enfermos. ENFERMOS 35 30 20
¿Difiere la prevalencia de leucosis entre las 3 zonas en SANOS 65 90 60
que se dividió la cuenca (=0.01)?

5 En el ganado de raza Shorthorn existen tres tipos de pelaje: Colorado (AA), Rosillo (AB) y Blanco
(BB). Este carácter hereditario está determinado por un par de alelos A y B. En la población, P(A) =
P(B) = 0.5.
Se toman muestras de 100 animales y se determina el fenotipo de cada uno obteniendo los siguientes
resultados
Ensaye la hipótesis de que la muestra fue extraída
Fenotipo AA AB BB
de una población donde la proporción del alelo A
Frecuencia 30 48 22 es igual a la proporción del Alelo B (alfa= 0.05).

6 A los efectos de establecer la relación entre la prevalencia de la Leucosis Bovina Enzoótica (LBE) y las
diferentes medidas de manejo que se podrían implementar, se tomaron tres establecimientos con igual
prevalencia inicial y se aplicó una medida de manejo distinta en cada establecimiento.
Luego de 5 años de aplicarse las medidas de manejo se determinó la prevalencia de la enfermedad en 150
vacas de cada uno de los establecimientos, resultando el siguiente número de positivas a LBE:
A 37 positivas; B 84 positivas y C 42 positivas.
Pruebe a un =0.05 si existe alguna asociación entre estas medidas de manejo y la prevalencia de la LBE.

7 Con el objetivo de determinar si los problemas podales están relacionados con la coloración del casco,
se revisó la pata posterior izquierda de una majada de ovinos y se determinó para cada uno la coloración
(pigmentado o blanco) y si tenían problemas clínicos en esa pata (Normal o con problemas). De los 914
animales, 450 presentaron casco pigmentado y 100 estaban afectados. El 36% de los afectados también es
pigmentado. Realice una prueba de hipótesis para un =0.05 de si existe asociación entre la coloración del
casco y los problemas al caminar.

8 Un investigador diseña un experimento en el cual 100 animales deben seleccionar uno de los cuatro
alimentos disponibles: A, B, C y D. El investigador le permite elegir 1 vez a cada uno. Para el
experimento, se obtienen los siguientes resultados que indican las veces que el animal eligió cada
alimento:
Alimento A B C D
Frec. Observada 19 22 28 31

Determinar si el animal mostró preferencia por alguno de los tres alimentos para un = 0.01.

pág. 58
9 Se quiere verificar si la presencia de ovejas por unidad de superficie en una determinada región se
ajusta a una distribución de Poisson. Para eso, se cuantifica la cantidad de ovejas en diferentes zonas de
igual superficie. Se obtienen los siguientes datos:
Núm. de ovejas 0 1 2 3 4 5
Frecuencia 14 31 42 46 29 21
Determine, con un  = 0.01, si la distribución de animales por unidad de superficie no difiere del
modelo de Poisson.

pág. 59
Regresión y correlación lineal simple
Objetivos - UD11

Objetivos de la Unidad didáctica 11 - Regresión y correlación


Al finalizar esta unidad, el estudiante será capaz de:

 Definir la finalidad de un análisis de regresión


 Definir la finalidad de un análisis de correlación
 Describir los componentes de una ecuación lineal
 Calcular las rectas de regresión y los coeficientes de correlación
 Interpretar los resultados

Conceptos previos a trabajar en clase


1. ¿Cuándo se plantean problemas de regresión? ¿Qué condiciones deben cumplir las variables
en los problemas de regresión?
2. ¿Cuándo se plantean problemas de correlación? ¿Qué condiciones deben cumplir las
variables en los problemas de correlación?
3. Describa el modelo de regresión lineal ¿Qué representan los parámetros  y ?
4. ¿Qué es el centroide?
5. ¿Qué es la covarianza?
6. ¿Qué asociación hay entre la correlación y el análisis de varianza?
7. ¿Cómo puede interpretarse el resultado  rho= 0?

Ejercicios
1. Se lleva a cabo un estudio por medio de detectores radiactivos de la capacidad corporal para
absorber Fe y Pb (n=10).
A cada uno de los individuos se los dosifica con Sulfato ferroso y cloruro de Pb-203
Después de 12 días se mide la cantidad de cada componente retenido en el organismo determinando el
porcentaje absorbido por el cuerpo. 1.a. Dibujar el diagrama de dispersión
1.b. Hallar r
X (% Fe) 17 22 35 43 80 85 91 92 96 100 1.c Interpretar r y testarlo (alfa = 0.05)
1.d. Ajustar una recta de regresión si es adecuado
Y(%Pb-203) 8 17 18 25 58 59 41 30 43 58
1.e. Estimar y predecir el porcentaje de Pb
absorbido por un individuo cuyo cuerpo absorbe
15% Fe

pág. 60
2. Se pretende determinar una función que permita estimar el peso de una variedad de peces a partir de
su longitud. El investigador selecciona peces de longitudes conocidas y los pesa, con los siguientes
resultados:
longitud (cm) 10 12 14 16 18 20 22 24
peso (g) 8.0 9.5 11.0 12.6 14.1 15.7 17.2 19.0

Con estos datos y suponiendo una relación lineal se obtuvo:


a = 0.121 b= 0.780 r = 0.9998
2.a.- Represente, en un solo gráfico, los valores observados y la recta estimada
2.b.- Estime los pesos correspondientes a las longitudes 17 cm, 23 cm y 29 cm
2.c.- De las estimaciones anteriores: ¿Cuál no es válida?, ¿Cuál es mejor estimada?
2.d.-¿En qué supuestos se basa la estimación de los pesos? ¿Por qué?
2.e.-¿El problema es de regresión o de correlación? ¿Por qué?
2.f.-Ensaye la hipótesis de independencia lineal entre x e y ( = 0.05)

3. En un estudio de la asociación entre las variables x e y, se obtienen los siguientes resultados, con n =
200 observaciones:
SC regresión = variación explicada = 6400 3a.- Calcular R2
SC total (y) = variación total = 10000 3b.- Calcule el valor absoluto de r para el modelo
lineal
3c.- Ensaye Ho: =0 (=0.05)

4.- En una experiencia, se encontraron los siguientes valores de la presión osmótica reducida (y) en
función de la concentración de hemoglobina (x).

x 1 2 3 4 5 6 7 8 9
y 3.6 3.8 3.7 4.0 3.9 4.2 4.1 4.4 4.3

4.a. Calcule: 4.b. Represente en un mismo gráfico:


- media y desviación típica de x - diagrama de dispersión
- media y desviación típica de y - la recta de regresión
- ecuación de la recta de regresión

5. Determine el coeficiente de correlación


x
lineal y verifique a nivel de significación 0.05 y 0-20 20-40 40-60 60-80 80-100
la hipótesis que el coeficiente de correlación
poblacional es igual a 0. 0-10 10 2 - - -

10-20 1 12 1 - -

20-30 - 3 10 2 -

30-40 - - 5 8 1

40-50 - - - 1 14

pág. 61
TABLAS Y FÓRMULAS

pág. 63
Fórmulas para descriptiva

Medidas de tendencia central (datos agrupados)

Media x   f x x  marca de clase


n f  frecuencia absoluta de la clase
n  total de observacio nes

 n  Fa   Li  límite inferior de la clase que contiene la mediana


Mediana Mn  Li   2  h
  n  nº de observaciones
 f

    Fa  frecuencia acumulada de la clase anterior a la Mn
f  frecuencia absoluta simple de la clase Mn
h  extensión del intervalo de la clase Mn
ver también medidas de posición
Li límite inferior de la clase que contiene la Mo
Moda Mo  Li   1  h 1 Exceso de frecuencias entre la clase modal y la clase anterior
 1  2
 2 Exceso de frecuencias entre la clase modal y la clase siguiente
h  extensión del intervalo de la clase modal

Medidas de dispersión (datos agrupados)

Varianza muestral centrada s2   f x  x 2 Varianza


n 1
muestral centrada
s
CV %   100 Desviación típica
Coeficiente de variación x s  s2
P75  P25
Q ver también medidas de posición
Semirrecorridointercuartílico 2

Medidas de posición Percentil de orden r


 n.r  Fa  
posición del percentil :
(datos agrupados) 
Pr  Li  100
  h ( n +1) r /100
f
  

Medida de asimetría 3x  Mn 


as 
(2º coeficiente de Pearson) s

pág. 64
Fórmulas para Probabilidad

Reglas de Probabilidad
Probabilidad total S = Espacio muestral P(S)=1
c
Acontecimientos complementarios P(A ) + P (A ) = S = 1 P(Ac ) = 1 - P(A )

Acontecimientos mutuamente excluyentes P(A  B ) = P (A ) + P (B )

Acontecimientos compatibles P(A  B ) = P (A ) + P (B ) - P(A  B )

Probabilidad condicional P(A |B ) = P(A  B )/ P (B )

Acontecimientos independientes P(A B ) = P(A). P(B)

P(A Bi ).P(Bi )
Teorema de Bayes P( Bi A)  j
 P(A B j ).P(B j )
i

Funciones de Probabilidad

Distribución Binomial x = nº éxitos n-x = nº fracasos


0 p1 ; q = 1- p
P (x , n, p) C xn . p x .q nx
n = nº de ensayos
media = np n!
varianza = npq C xn 
(n  x )! x !

x .e 
Distribución de Poisson P (x ,  )  media = varianza = 
x!
Funciones de densidad

 1 media = 1 a  b 
a  x b 2
Distribución Uniforme f (x )   (b  a )
12b  a 
2
varianza = 1
0
 x 2
 1 2 
Medidas de dispersión 1agrupados)
e    media = 
Distribución Normal f (x)(datos

 2 varianza = 2

x  
2
1 z
Distribución Normal tipificada f (x)  e 2 media = 0
z 
2 varianza = 1 
Relación entre las distribuciones

pág. 65
Relación entre las distribuciones

cualquiera de * npq>5
estos 3 criterios
* np y nq ambos > 15   np;  npq
 * np  3 npq 0, n
 Normal (  , )
Binomial (n , p)
 n 
   ;  
n

np= cte 
n >50
np< 5 > 5
 = np

Poisson (  )

Tabla de Números Aleatorios

0,10970 0,66895 0,19483 0,69962 0,98675 0,88681 0,16138 0,18151


0,13842 0,14772 0,03426 0,05572 0,74086 0,39483 0,73600 0,22544
0,04787 0,17182 0,24261 0,88440 0,42661 0,12662 0,88486 0,88812
0,50067 0,95640 0,63088 0,04378 0,88826 0,11941 0,56185 0,90491
0,92455 0,81343 0,92587 0,56594 0,77227 0,26338 0,03036 0,11152
0,12010 0,09377 0,62390 0,35027 0,36341 0,52675 0,67867 0,69593
0,23821 0,88206 0,56996 0,10044 0,86930 0,27647 0,44961 0,19449
0,63095 0,84734 0,32230 0,46970 0,76287 0,61967 0,30020 0,50073
0,10049 0,28786 0,01372 0,38207 0,30741 0,01293 0,53800 0,61616
0,51794 0,26864 0,77077 0,94625 0,72063 0,76106 0,15203 0,68474
0,49929 0,17512 0,10172 0,61804 0,81860 0,57034 0,53047 0,84091
0,08303 0,85360 0,77791 0,43557 0,27443 0,49751 0,27422 0,42935
0,38547 0,61920 0,21891 0,39183 0,05880 0,02106 0,71985 0,88754
0,52445 0,23676 0,17864 0,40807 0,94591 0,47377 0,06162 0,97524
0,61888 0,82213 0,03534 0,04579 0,59395 0,28808 0,53188 0,10840
0,93057 0,00733 0,46710 0,90305 0,22289 0,84119 0,30863 0,77328
0,77690 0,99894 0,81795 0,24185 0,10148 0,06297 0,02865 0,98996
0,16166 0,02329 0,60019 0,84713 0,29474 0,41239 0,46960 0,34026
0,34312 0,64422 0,40961 0,28242 0,57101 0,42591 0,08222 0,08657
0,95198 0,55850 0,66661 0,70048 0,33983 0,86883 0,66862 0,12024
0,04506 0,31785 0,70008 0,51455 0,78178 0,35478 0,95134 0,03415
0,99508 0,98521 0,90022 0,37784 0,32526 0,77024 0,30406 0,78618
0,94968 0,99448 0,48618 0,72834 0,06430 0,65261 0,01642 0,18046
0,73864 0,22743 0,03667 0,77709 0,14188 0,36876 0,95664 0,03072
0,06844 0,53572 0,20597 0,27934 0,94355 0,54644 0,73436 0,19686
0,91357 0,24448 0,90802 0,33614 0,05779 0,26846 0,13138 0,25203
0,47541 0,99914 0,95080 0,39159 0,83612 0,30164 0,58037 0,93190

pág. 66
Proporciones y Medias un grupo

PROPORCIONES UN GRUPO

ANEXOTamaño
IVA Formulas
de muestra: n  PQ(z / e )2 p = x / n ; q=1-p

Intervalo de Confianza Prueba de hipótesis Ho: P = k

NO SI
¿ npq 5 ?
cambiar de NO pk
SI
procedimiento z
k(1 k)
n
 pq 
P  p  z 
 n 

MEDIAS: UN GRUPO

Tamaño de muestra: ¿La variable está normalmente NO cambiar de


n  (z  / e ) 2 distribuida o bien n >30 ? procedimiento
SI

¿ La varianza poblacional es conocida ?


SI NO

Intervalo de confianza 
  x  z  Intervalo de confianza
Si n grande
 ˆ 
n    x  ts 
   n 



Prueba de hipótesis Ho:  = k Si n grande Prueba de hipótesis Ho:  = k
 
zc  x  k    tc  x  k   sˆ 
   
 n   n 

pág. 67
COMPARACION DE PROPORCIONES DOS GRUPOS

 p1  x1 n1 p2  x2 n2 n  n1  n2
Cambiar de NO ¿los grupos son SI
p  n1 p1  n2 p2  n1  n2 
procedimiento independientes?
q 1 p
NO
n1p1
n1 q 1
15 ?
z  p  p  pq  1  1 
n2 p2

c 1 2 n  SI n2q2

 1 n 2 

COMPARACION DE MEDIAS DOS GRUPOS



Cambiar de
¿Aproximadamente la distribución es normal?
NO procedimiento
o bien n1>30, n2> 30
SI d
tc  gl  n  1
¿los grupos son independientes? ŝd
NO
SI n
¿varianza poblacional ( 2) es conocida?
NO Ensayar hipótesis de
SI igualdad de varianzas
NO SI
¿iguales? ŝ 2
mayor
Fc  2

menor
x1  x2 x1  x2
zc  zc  gl  (na 1),(nb 1)
12 2 2  1
n1  n2
1
n  n
1 2
¿iguales?
NO
SI
x1  x2
t ' 
  2
 2
ŝ 2 ŝ 2 n1  1 ŝ1  n 2  1 ŝ 2
1  2 sp 
n1 n2
2 n 1  n2  2
 ŝ 2 ŝ 2  x x
 1 
 n1  2 n2  tc  1 2
  1 1
gl  sp
 
2
 
2 n1 n2
 ŝ12   ŝ 2
2 
 n1   n2  gl  n1  n2-2
    
n1  1 n2  1

Con gl>30 como mínimo los valores críticos de t pueden sustituirse por los de z N(0,1)

pág. 68


 COMPARACION DE MEDIAS MAS DE DOS GRUPOS


 ¿Variable normalmente NO
distribuida? Fuente de
SC gl MC F
Variación
SI Cambiar de Entre grupos
¿varianzas iguales? NO SC entre a-1 MC entre F calculado
procedimiento (tratamientos)
Dentro de grupos
SC dentro n-a MC dentro
(residual)
NO
¿Observaciones independientes total SC total n-1
 entre grupos?
 SI

 SC total = x2 – (T2/n) a = número de grupos


SC entre = T i2/n i – (T2/n) ni = número de observaciones del i-ésimo grupo
 SC dentro = SC total - SC entre n= total de observaciones
 MC entre = SC entre / (a - 1)
Ti = Suma de observaciones del i-ésimo grupo
 MC dentro = SC dentro / (n - a)
 Fc = MC entre/MC dentro; gl =(a -1); (n -a) T= Suma total de observaciones


ASOCIACION LINEAL ENTRE DOS VARIABLES NUMERICAS


Covarianza muestral: correlación


regresión

¿Distribución de (x, y)
¿Valores de y independientes
aproximadamente normal
entre sí, normalmente
bivariada?
distribuidos (dentro de cada x) y Cambiar de NO
homocedásticos( x)? NO procedimiento SI
SI
Prueba Ho :( rho) = 0

s rsy r n2
b  xy 2  Prueba de tc 
sx sx H0: = 0
equivale a:
1 r 2
a  y  bx gl  n  2
yˆ a  bx 

pág. 69
Aplicaciones Chi2

ANALISIS DE FRECUENCIAS

Pruebas de Homogeneidad
Prueba de bondad de ajuste
y de independencia

Ei: frec. Esperada de la i-ésima clase


E ij= Oi. Oj / n
Oi: frec. Observada de la i-ésima clase
Oi : frecuencia observada de la i-ésima fila N: número de clases
Oj: frecuencia observada de la j-ésima columna k: número de parámetros estimados a partir de
Oij : frecuencia observada de la i,j-ésima casilla la muestra
Eij: frecuencia esperada de la i,j-ésima casilla
n: total de observaciones
SI Las Ei son NO ¿los parámetros
datos son conocidos?
Unir filas y/o SI ¿Alguna Eij< 5?
columnas para que SI NO
Eij 5 NO
Estimar
¿Alguna Eij< 5? parámetros
Calcular Ei

2 Oij
2
SI
 c  Eij  n NO
Unir clases
gl  ( filas  1)(columnas  1) para que
2  O ij2
Ei  5 c  n
E ij
gl  N  k  1

VARIANZAS, UN GRUPO

Intervalo de confianza 
Prueba de hipótesis Ho:  = k
 
n 1 ŝ 2
σ 2 
n 1 ŝ 2  (gl n - 1)
2 2 Se hace a través del Intervalo de
χ1α/ 2 χ α/ 2 Confianza

pág. 70
Tabla Distribución Normal Estándar

pág. 71
Tabla Distribución t de Student

pág. 72
Tabla Distribución F α=0.05

pág. 73
pág. 74
pág. 75

También podría gustarte