Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Bioestadística
INTRODUCCÍON
Definiciones
1
Bioestadística 2017 FCV-UNL
2
Bioestadística 2017 FCV-UNL
INVESTIGACIÓN
Se pretende dar una idea de lo que implica en la Investigación la aplicación del
método científico, que permite arribar a conclusiones científicamente
comprobadas. Solo se enunciará brevemente algunas definiciones y los pasos
generales del método científico, y quien desee conocer realmente el tema debe
consultar los tratados de Epistemología y/o de Metodología de la Investigación
Científica.
Investigación es una forma de actuación humana orientada al conocimiento de la
realidad observable, del mundo que nos rodea (Sierra Bravo,1995).
Según la técnica empleada para procurar este conocimiento, la investigación
presenta subdivisiones que llamamos Formas de Conocimiento. Entre las formas
de conocimiento tenemos:
El Ensayo-error. Es una forma elemental de descubrir una posible solución
entre varias alternativas. Su mayor inconveniente es que no existe garantía de
que la solución encontrada sea la mejor, además no sabemos en qué medida
es aplicable a situaciones y/o condiciones distintas.
El Razonamiento Lógico. Deduce y explica otros conocimientos a partir de
hechos considerados como evidentes. Es insuficiente ya que muchas
deducciones basadas en métodos racionales son ciertas, pero otras son
erróneas.
El Método Científico. Es la aplicación formal de procedimientos sistemáticos y
ordenados, con el fin de llegar a describir, explicar, predecir, controlar
fenómenos y demostración de la verdad.
3
Bioestadística 2017 FCV-UNL
2. Diseño de la Investigación.
4
Bioestadística 2017 FCV-UNL
5
Bioestadística 2017 FCV-UNL
Xi
i 1
donde: i=1: indica primera observación , n última observación; por consiguiente la
extensión de la sumatoria indica que se debe sumar todos los valores de las
observaciones, desde la primera hasta la última.
Si se desea conocer la suma de los pesos de las vacas 5 a 32, la notación será:
32
X
i 5
i
6
Bioestadística 2017 FCV-UNL
7
Bioestadística 2017 FCV-UNL
Son números que resumen los valores de las observaciones (datos) con el
objeto que puedan comprenderse grandes grupos de observaciones mediante
pocas expresiones numéricas que “representan” esos datos u observaciones.
Xp w .x
i i
w1.x1 w2 .x2 ... wn xn
w i w1 w2 ... wn
Esta medida se usa en aquellos casos en los que las observaciones no tienen el
mismo grado de importancia.
8
Bioestadística 2017 FCV-UNL
Xp
∑w .X
i i
12602,20
3,89
∑w i 3242
190 170 290 370 230 239 260 240 280 220 290
Arreglo ordenado
170 190 220 230 239 240 260 280 290 290 370
n 1 11 1
6
2 2
Entonces el valor que se encuentra en el sexto lugar del arreglo
ordenado, es la mediana. En este ejemplo corresponde a 240 vacas en
ordeño, Mediana = 240 vacas en ordeño
9
Bioestadística 2017 FCV-UNL
10
Bioestadística 2017 FCV-UNL
Los cuartiles, deciles y percentiles son puntos que dividen una serie ordenada
de datos en cuartos, décimos y centésimos respectivamente. De esta forma la
medina es el segundo cuartil, el quinto decil y el percentil 50.
Son las que permiten conocer cómo están distribuidos los datos alrededor del
promedio; cuan alejados se encuentran del mismo, si están cerca de él o no.
Cuanto mayor sea la diferencia entre los valores en análisis, mayor será la
dispersión. Estas medidas son:
Xi
2
2
N
Esta fórmula es el parámetro poblacional. Para la muestra se reemplaza 2 por S2,
___
por X y N por los grados de libertad que es n-1, así tenemos el estimador
estadístico de la varianza.
S 2 Xi X
2
n 1
En forma general, la varianza tiene como numerador una suma de cuadrados y
como denominador los grados de libertad.
11
Bioestadística 2017 FCV-UNL
Xi
2
N
___
De igual forma que la varianza, si reemplazamos por S, por X y N por n-1,
tendremos el estimador estadístico o desvío estándar muestral.
Xi X
2
S
n 1
Otras fórmulas, para calcular el desvío estándar o la varianza de la muestra, más
desarrolladas pero simples de resolver y que se sugiere usen.
n Xi 2 Xi n Xi 2 Xi
2 2
S S
2
nn 1 nn 1
21 23 24 36 39 35 29 32 37 20
44 33 18 16 23 24 47 27 25 19
26 29 34 33 28 65 12 33 9 44 60
Promedio 30,483871
Mediana 29
Moda 33
Varianza 155,658065
Desvío estándar 12,4763001
12
Bioestadística 2017 FCV-UNL
Datos agrupados
64 66,3 65,4 70,5 71,6 80,1 65,2 68,6 74,8 76,1 79,5 66,4 75,9
66,6 77,1 73,7 67 68,7 71,6 70 70,2 74,3 72,8 73,9 71,1 71,6
71,9
13
Bioestadística 2017 FCV-UNL
64 65,2 65,4 66,3 66,4 66,6 67 68,6 68,7 70 70,2 70,5 71,1
71,6
71,6 71,6 71,9 72,8 73,7 73,9 74,3 74,8 75,9 76,1 77,1 79,5
80,1
Xi =1924,1
REFERENCIAS
14
Bioestadística 2017 FCV-UNL
Para calcular las medidas de resumen a partir de datos agrupados, se utilizan las
formulas:
Para el modo usaremos la Clase Modal, que es el Intervalo de Clase que tiene
mayor frecuencia absoluta, y si pretendemos un valor determinado usamos el mi
del intervalo que tiene mayor frecuencia absoluta.
Desvío Estándar,
27(138607,668) (1931,55) 3742389 3730855
2
S 16,47 4,05
27(26) 702 S=
4,05 cm de altura a la cruz
15
Bioestadística 2017 FCV-UNL
NOTA:
Cuando se necesite trabajar con calculadora y la variable de interés tenga valores
muy altos, como miles o mayor, es útil reducir la magnitud de los valores de la
variable. Ejemplo, si los valores son: 2000, 2800, 1950, 1940, 1870, se puede
trabajar como 2, 2,8, 1,95, 1,94, 1,87. Posteriormente a cada medida de
resumen se le debe dar la magnitud de las unidades originales
Del mismo modo se puede proceder cuando la variable está medida en unidades
menores, como gramos: 3000 gr, 2990 gr, 2,850 gr, 3015 gr, se puede trabajar
con unidades mayores como kilos, entonces será 3,0 Kg; 2,99 Kg; 2,85 Kg;
3,015Kg. En este caso se puede convertir luego a gramo o simplemente expresar
las medidas de resumen en kilogramos.
Estas consideraciones son válidas para trabajar con datos simples o agrupados.
16
Bioestadística 2017 FCV-UNL
17
Bioestadística 2017 FCV-UNL
Siendo entonces el error estándar de la distribución de promedios:
n
___
En forma simbólica podemos expresar: X ~ N ;
n
Obviamente que para conocer lo que ocurre en una población siempre se extrae
una sola muestra de tamaño n, pero teniendo en cuenta lo que nos explica el TCL
podemos trabajar en Inferencia Estadística usando la distribución Normal, temática
que veremos en capítulos posteriores.
Sin embargo podemos obtener algunas conclusiones que nos ayudarán en la
tarea de inferir. Si observa la fórmula del error estándar, cuando aumentamos n o
se reduce el desvío estándar, como consecuencia se reducirá el error standard. Es
decir que a medida que aumentamos n, la variabilidad de la distribución de los
promedios muestrales se reduce.
18
Bioestadística 2017 FCV-UNL
PROBABILIDAD
19
Bioestadística 2017 FCV-UNL
TEORIAS DE PROBABILIDAD
20
Bioestadística 2017 FCV-UNL
Tabla de contingencia
Característica A
Sub-Total
Nivel 1 Nivel 2 … Nivel n
Nivel 1 X11 X12 X1n X1●
Nivel 2 X21 X22 X2n X2●
Característica B
… … … …
Nivel m Xm1 Xm2 Xmn Xm●
TOTAL
Sub-Total X●1 X●2 X●n
(N)
Por ejemplo
𝑛(𝐴)
𝑁
Probabilidad Conjunta: es la probabilidad de que un individuo elegido al azar
tenga, al mismo tiempo, un determinado nivel de la característica A y otro nivel de
la característica B. Se calcula dividiendo el n de una intersección de la tabla con el
N TOTAL. En este caso será:
𝑛(𝐴 ∩ 𝐵)
𝑁
Probabilidad Condicional: es la probabilidad de que un individuo elegido al azar
posea algún nivel de una característica sabiendo con anterioridad que tiene un
determinado nivel de otra característica. Se calcula dividiendo el n de una
intersección de la tabla de contingencia con el n de un subtotal correspondiente al
nivel conocido con anterioridad.
𝑛(𝐴 ∩ 𝐵)
𝑛(𝐵)
21
Bioestadística 2017 FCV-UNL
Se puede calcular
PROBABILIDADES MARGINALES
P(muertos) = 15/151 = 0,09933.
En la población de 151 animales existe una posibilidad del 9,93% de que
mueran por la enfermedad.
P(no enfermos) = 110/151 = 0,7284
En la población de 151 animales existe una posibilidad del 72,84% de
que no padezcan dicha enfermedad.
PROBABILIDADES CONJUNTAS
P(enfermos y vacunados) = P(Enf ∩ Vac) = 7/151 = 0,04635
P(muertos y no vacunados) = P(Mu ∩ No vac) = 12/151 = 0,07947
PROBABILIDADES CONDICIONALES
3
P muertos vacunados = 151 = 3 ∗ 151 = 3 ∗ 151 = 3 = 0,04
75 151 ∗ 75 151 ∗ 75 75
151
3
P vacunados muertos = 151 = 3 ∗ 151 = 3 ∗ 151 = 3 = 0,2
15 151 ∗ 15 151 ∗ 15 15
151
65
P no enfermos vacunados = 151 = 65 ∗ 151 = 65 ∗ 151 = 65 = 0,86
75 151 ∗ 75 151 ∗ 75 75
151
22
Bioestadística 2017 FCV-UNL
de veces que ocurre un evento en cada una de las categorías que se están
utilizando.
Probabilidad acumulada
Ejemplo:
Se registra cada parto en un criadero de conejos, en el mes de marzo, anotando
el número de gazapos nacidos vivos en cada uno
Cuando un evento solo puede de tener uno de dos resultados posibles, como
enfermos y no enfermos, vivos y muertos, aprobados y aplazados, presente y
23
Bioestadística 2017 FCV-UNL
Ejemplo:
Se conoce que en la población de vacas adultas del departamento Castellanos
existe una proporción de animales positivos a Leucosis Bovina del 16%. Si se
extrae una muestra al azar de n = 20,
¿qué probabilidad existe que:
a) cuatro o menos de cuatro sean positivos?
b) ninguno sea positivo?
c) por lo menos cuatro sean positivos?.
Respuestas:
En primer término debemos recordar lo referente a probabilidad acumulada que se
ha visto en el tema anterior. Usaremos tablas de distribución binomial de
probabilidad que acumulan la misma desde un valor de x cualquiera hasta x = 0
a) P(X 4| 20; 0,16) = 0,7941
24
Bioestadística 2017 FCV-UNL
I I I I I I I I I I I I I I I I I I I I I
X 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
b) P(X = 0|20;0,16) = 0,0306
I I I I I I I I I I I I I I I I I
X 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Distribución de Poisson
Siméon Denis Poisson (Pithiviers, Francia, 21 de junio de 1781, Francia, 25 de abril de 1840), fue
un físico y matemático francés al que se le conoce por sus diferentes trabajos en el campo de
la electricidad; también hizo publicaciones sobre la geometría diferencial y la teoría de
probabilidades.
Este tipo de distribución se utiliza cuando los eventos están distribuidos al azar
en tiempo o espacio, es decir que con esta probabilidad se pueden calcular
supuestos que se presenten en una unidad de tiempo o espacio. La forma general
de expresarla es P (X xi /), las observaciones se encuentran en la primera
columna y , se encuentra en la primera fila y en el cuerpo de la tabla están los
valores de probabilidad. Se busca igual que en la de distribución Binomial, solo
que no hay un n específico.
Como todas las probabilidades también posee ciertas características propias,
denominado Proceso de Poisson.
25
Bioestadística 2017 FCV-UNL
Ejemplo
Se conoce que en un área de una ciudad existe un promedio de 17 ejemplares de
una plaga urbana por manzana. Cálculo de la probabilidad de que en una
manzana elegida al azar exista:
a) 10 o menos ejemplares
P(X≤ 10│17)= 0,049
b) Exactamente 20
P(X=20│17)= P(X≤ 20│17) – P(X ≤ 19│17)= 0,805 – 0,736= 0,069
c) 15 o más
P(X≥15│17)= 1- P(X≤ 14│17)= 1- 0,281= 0,719
Distribución Normal
“Johann Carl Friedrich Gauss nació en Brunswick, Alemania, el 30 de abril de 1777 fue un matemático, astrónomo y
físico alemán que contribuyó significativamente en muchos campos, incluida la teoría de números, el análisis
matemático, la geometría diferencial, la geodesia, el magnetismo y la óptica.
Dentro de sus innumerables aportes, en matemáticas describió la campana de Gauss
La llamada Campana de Gauss es la representación gráfica de la ecuación matemática de una distribución normal.
Tiene forma de campana. Si se representa en el eje horizontal las medidas obtenidas y en el vertical el número de
veces que se obtiene cada valor, obtendremos lo que se llama un histograma de frecuencias. Si se elimina el error
sistemático, el conjunto de datos obtenido se distribuye de forma simétrica alrededor de la media, dando una curva
en forma de campana”. Fuente: Antonio Pérez Sanz, Historia de las Matemáticas
Para calcular la distribución Normal también contamos con dos formas diferentes
como son la fórmula matemática y las tablas.
1
e ( x ) / 22
2
f( x)
2
26
Bioestadística 2017 FCV-UNL
- < x <
dónde y e son valores conocidos y los dos parámetros de la distribución son ,
que representa la media o promedio de las distribución, y , que es el desvío
estándar. Al ser una variable aleatoria continua los valores que pueden tomar van
de - a .
27
Bioestadística 2017 FCV-UNL
28 − 24
𝑍2 = = 1.05
3,8
P(-1,05 ≤ Z ≤ 1,05) = 0,8531- 0,1469= 0,7062
Cantidad de vacas (n= P.N), que producirían entre 20 y 28Kg =
0,7062 x 345 = 244 vacas
28
Bioestadística 2017 FCV-UNL
PARTE II
Inferencia estadística
Existen dos métodos que permiten inferir sobre una o más poblaciones, intervalos
de confianza y pruebas de hipótesis. Como se llega a la misma conclusión, es
indistinto usar uno u otro método, salvo que expresamente se solicite uno de ellos.
Intervalos de Confianza
Cuando se trabaja con una muestra, se calculan las medidas de resumen de los
datos, que puede ser promedio, desvío estándar, proporción, entre otras. En esos
casos, las medidas de resumen son estimaciones puntuales del parámetro
poblacional respectivo. Así, el promedio (media) de la muestra X es un estimador
del parámetro poblacional µ, el desvío estándar muestral S es un estimador del
parámetro poblacional σ, la probabilidad de la muestra p es un estimador del la
proporción poblacional P, entre otras.
Para evitar los problemas antes citados, se puede realizar la estimación del
parámetro poblacional buscado a través de un intervalo, donde se tenga
determinada probabilidad que en el mismo se encuentre el parámetro en cuestión.
Este procedimiento se denomina estimación por intervalo de confianza.
Pensar en un intervalo significa encontrar un segmento en una recta numérica.
Para establecer ese segmento implica encontrar los límites del mismo, que son
dos. Ello se logra a partir del estimador muestral, la confianza estadística y el error
estándar del estimador muestral. Cada estimación puntual (o estimadores
estadísticos), se vio en el apartado correspondiente.
29
Bioestadística 2017 FCV-UNL
Casi siempre se tiene que calcular las medidas de resumen a partir de datos de de
una muestra que representa a una población, y luego reemplazar en la fórmula. En
ocasiones se presentan solo el promedio y el desvío estándar y no los datos
originales de la muestra. En este último caso solo hay que reemplazar en la
fórmula.
Ejemplo
En una investigación sobre contenido de un mineral en sangre se usaron 35
animales, a los que se les dio un suplemento mineral ad libitum, obteniéndose
lo siguiente: Promedio = 12 ppm S = 1,2 ppm n = 48
Obtenga los límites entre los cuales tenga 0,95 de confianza estadística de
encontrar el parámetro µ. Siga los pasos necesarios que le permitan concluir.
¿Es este promedio poblacional mayor que 11ppm? ¿y de 12,5ppm?
30
Bioestadística 2017 FCV-UNL
Resolución:
Datos: n = 48 X = 12ppm S = 1,2 ppm
1,2 12
X ± Z1- α • S
n
= 12 ± Z 0,975 • = 12 ± 1,96 • = 12 ± 0,340
2 48 48
11,660 ≤ μ ≤ 12,340
Cuando se trabaja con una muestra chica (n< 30), se trabaja con una distribución
que es una familia de la distribución Normal, llamada distribución t de student.
Como depende de los grados de libertad, existen diferentes curvas para cada uno
de ellos.
La distribución t fue publicada por primera vez en 1908 por William Sealy Gosset, que trabajaba en el
departamento de fermentación de la cervecería Guinness en Irlanda. Las circunstancias en las que se llevan a
31
Bioestadística 2017 FCV-UNL
cabo los procesos de fermentación en la producción de cerveza demostraron a Gosset las limitaciones de la
teoría de muestras grandes y le enfatizaron la necesidad de un método correcto para el tratamiento de
muestras pequeñas. Estas circunstancias de su trabajo dirigieron a Gosset al descubrimiento de la distribución
t, quien debido a que la compañía cervecera desaprobaba la publicación de investigaciones de sus
empleados, la publicó con el seudónimo de "student".
32
Bioestadística 2017 FCV-UNL
Ejemplo
Se tomaron dos grupos de cerdos, A y B. Al grupo A (35 cerdos) se le aplicó un
medicamento para conocer si afectaba la frecuencia respiratoria y al grupo B
(34 animales) se lo dejó como control sin tratar. Se desea conocer si el producto
aumentó la frecuencia respiratoria en forma significativa. En el grupo A la
frecuencia fue en promedio 45,1 con desvío estándar de 3,2. En el grupo B la
frecuencia fue en promedio 42,3 con desvío estándar de 3,1.
Resolución:
1,313 ≤ µ1 - µ2 ≤ 4,287
Interpretación:
33
Bioestadística 2017 FCV-UNL
Cuando se dispone de muestras chicas (n1 y/o n2 < 30), la diferencia de los
promedios poblacionales se distribuye en forma semejante a la t de student, por lo
que esa distribución la que corresponde usar
1- 2 S 2* S 2*
X1 - X2 t n1 n 2 - 2 . n1
n2 S 2*
(n 1 - 1) S12 (n 2 - 1) S 22
n1 n 2 - 2
Del mismo modo, cuando en el intervalo se encuentra el 0 se interpreta que no se
encontraron diferencias significativas entre ambos promedios. Si no contiene el 0
se dice que se encontraron diferencias estadísticas entre ambos promedios
poblacionales.
Ejemplo
Las siguientes medidas de resumen fueron calculadas a partir de datos de
altura de machos y hembras de una raza canina. Mediante intervalo de
confianza, determine si existen diferencias estadísticamente significativas entre
los dos sexos. Utilice una significancia del 0,01
1- 2 S2* S 2*
X1 - X 2 t n1 n 2 -2 . n1 n2
37 - 35 2,0423. 7,235
20 715
, 235
34
Bioestadística 2017 FCV-UNL
Cuando se dispone de una variable cualitativa con dos resultados posibles y uno
de los cuales es el de interés, o si son más se pueden agrupar en dos, por un lado
el resultado de interés y por el otro todos los demás resultados. En esos casos se
calcula la proporción de individuos que tiene el resultado de interés.
Ejemplos
1. En una población bovina existe un 15 % de reactores positivos al test de
diagnóstico de tuberculosis, se extrajo una muestra de 200 animales. Sobre
estos datos construya un Intervalo con Confianza para la proporción
poblacional.
Resolución:
Datos: n = 200 p = 0,15 (positivo)
p̂(1- p) 0,15 • 0,85
p̂ ± Z1- α = 0,15 ± 1,96 • = 0,15 ± 1,96 • 0,0252 = 0,15 ± 0,0495
2 n 200
0,1005 ≤ ρ ≤ 0,1995 P = 0,05
Interpretación:
Con un 95% de confianza se puede concluir que ρ (proporción poblacional) se
encuentra entre 0,1005 y 0,1995.
Resolución:
Datos: n1 = 150 pˆ1 45 0,30
150
n2 = 125 pˆ 2 10 0,08
125
35
Bioestadística 2017 FCV-UNL
pˆ1 (1 - pˆ1 ) pˆ 2 (1 - pˆ 2 )
pˆ1 pˆ 2 Z1- 0,30 0,08 1,96
(0,30)(0,70) (0,08)(0,92)
2 n1 n2 150 125
Interpretación:
Como en el intervalo no está incluido el CERO existe diferencia entre las
proporciones de los grupos, o se encontró diferencia estadísticamente
significativa entre las proporciones de perros y gatos aburridos (p = 0,05)
Si las dos proporciones son estadísticamente diferentes, significa que una es
mayor que la otra. En el Intervalo de confianza también se puede evaluar esta
situación y por ser el intervalo positivo (ambos extremos positivos) ρ 1 es mayor
que ρ2.
La proporción de los perros con aburrimiento es mayor que la proporción de
gatos aburridos por vivir en un ambiente pequeño.
Así como se calculan intervalos de confianza para uno y dos promedios, para una
y dos proporciones, se puede calcular el Intervalo de Confianza para los
parámetros de variabilidad como la varianza o razón de dos varianzas y para el
desvío estándar o para la razón de dos desvíos estándar.
Fórmulas
2
columna de 0,975 de probabilidad y por lo tanto X en la columna de 0,025, todo
2
36
Bioestadística 2017 FCV-UNL
esa tabla se busca también en la de 0,975 pero invirtiendo los grados de libertad
(n2-1); n1-1). Para colocar el verdadero valor que reemplazará al denominador del
segundo límite del intervalo, se usa la inversa del valor encontrado en la tabla.
Ejemplos
1. Se midieron las concentraciones de hemoglobina en 16 animales expuestos
a un compuesto químico nocivo. Se registraron los siguientes valores:
15.6 18.6 14.8 16.2 14.4 14.7 16.6 15.7
13.8 16.4 14.0 13.9 17.3 14.8 17.4 17.5
Construya intervalos de confianza de 95 % cierto para S2 y S
Resolución:
Datos: n = 16 S = 1,48 S 2 = 2,19
2
(n - 1)S (n - 1)S 2 (n - 1)S2 (n - 1)S2
< σ 2
< <σ <
X12- α X 2α X12- α X 2α
2 2 2 2
Interpretación:
Con un 95% de confianza se puede concluir que σ2 (varianza poblacional) se
encuentra entre 1,195 y 5,246.
Con un 95% de confianza se puede concluir que σ (desvío estándar
poblacional) se encuentra entre 1,093 y 2,290. P = 0,05
Resolución
Datos: n1 = 21 S12 9 n2 = 16 S22 4
37
Bioestadística 2017 FCV-UNL
S12 S12 9 9
4 1
2
S 2
2
S 22 4
2
1
F1- 2
F 2,76 22 1
2
2
2 2,57
2
0,8152 6,21
1
2
2
Interpretación:
Con un 95% de confianza se puede concluir que la razón de varianzas de las
poblaciones se encuentra entre 0,8152 y 6,21.
Como en el intervalo está incluido el uno (1), significa que no existe diferencia
entre las varianzas de los grupos.
Existen dos tipos de hipótesis, por un lado la hipótesis estadística o hipótesis nula
(H0) y por el otro la hipótesis de investigación o hipótesis alternativa (Ha).
HIPÓTESIS NULA
Verdadera Falsa
No rechazo Ho Acción correcta Error tipo II
Probabilidad del Error Tipo II = β
38
Bioestadística 2017 FCV-UNL
39
Bioestadística 2017 FCV-UNL
Área de
Área de Área de
aceptación Área de
rechazo aceptación
mmnnnnn rechazo
nnnnnnnn
nnnnnnnn
nnnnnnnn
nnnnnn
Test de una cola con área de rechazo a la Test de una cola con área de rechazo a la
izquierda (Ha: µ < µ0) derecha (Ha: µ > µ0)
Test de dos colas o bilateral: es cuando el área de significancia (o α está
dividida en ambas colas, α 2)
Área de Área de
rechazo Área de rechazo
aceptación
40
Bioestadística 2017 FCV-UNL
Resolución:
Datos: n = 18 X = 72 S=6 μ = 67
H0 → μ = μ0 H A → μ > μ0
X - μo 72 - 67 5 • 18
TC = = = = 3,536
S 6 6
n 18
1-α
Regla de decisión: Si t c > t n-1 Rechazo Ho
Como 3,536 > 1,7396 → Rechazo Ho
41
Bioestadística 2017 FCV-UNL
Interpretación:
Con un 95 % de confianza estadística se puede decir que las vacas del
establecimiento produjeron mayor promedio de grasa butirosa en la tercer
semana posparto que la media de 67 (p< 0,05).
Con n=40
Datos: X = 72 S=6 μ = 67
H0 → μ = μ0 H A → μ > μ0
X - o 72 - 67 5. 40
ZC 5,270
S 6 6
n 40
1-
Regla de decisión: Si Z c Z → Rechazo Ho
Como 5,270 > 1,645 → Rechazo Ho
Interpretación:
Con un 95% de confianza estadística se puede decir que las vacas del
establecimiento produjeron mayor media de grasa butirosa que la media de 67
(P < 0,05).
TRATADOS CONTROL
Promedio 8,5 8,7
Desvío estándar 0,46 0,51
En función de estas medidas de resumen ¿puede tener una opinión que le sea
útil? Compruebe la existencia, o no, de diferencias estadísticas (confianza 0,95)
entre el recuento de eritrocitos de ambos grupos.
Resolución:
Datos: Tratados n = 22 X A = 8,5 S = 0,46
Control n = 22 XB = 8,7 S = 0,51
H0 → μA = μB H A → A B
2* (n1 - 1) S12 + (n2 - 1) S22 21• (0,46)2 + 21• (0,51)2 4,4436 + 5,4621
S = = = = 0,23
n1 + n2 - 2 22 + 22 - 2 42
42
Bioestadística 2017 FCV-UNL
En los casos en que a los mismos individuos se los muestrea en dos momentos
diferentes, como antes de un tratamiento determinado y luego de él, aunque
aparentemente se tiene dos conjuntos de datos que en realidad son pares de
muestras de cada individuos. Para cada par de valores, el de después de alguna
forma depende del valor que tenía antes del tratamiento. Por ese motivo, se
deben calcular la diferencia en cada par de valores, restando el de después del de
antes. Se deben respetar los signos.
Ejemplo
Los valores que se presentan a continuación muestran los resultados de un
experimento para comprobar si la ingestión de alimentos tiene algún efecto
sobre la velocidad con que el hígado elimina cierta sustancia inoculada. Cada
animal se midió dos veces, una durante el ayuno y la otra después de haber
comido. Para ello se trabajó con un lote de 10 animales, inyectando la sustancia
en cuestión, midiendo la cantidad eliminada en una hora estando el animal en
ayunas. Luego se los alimentó, y nuevamente se midió la cantidad eliminada a
los 60 minutos (miligramos).
ANIMAL 1 2 3 4 5 6 7 8 9 10
EN AYUNAS 9,6 10,9 9,5 13,5 10,8 9,3 10,1 11,2 10,8 11,8
ALIMENTADO 10,2 11,6 9,3 13,5 11,9 10,1 10,9 11,9 11,5 12,4
43
Bioestadística 2017 FCV-UNL
Resolución
ANIMAL 1 2 3 4 5 6 7 8 9 10 Total
AYUNAS 9,6 10,9 9,5 13,5 10,8 9,3 10,1 11,2 10,8 11,8
ALIMEN 10,2 11,6 9,3 13,5 11,9 10,1 10,9 11,9 11,5 12,4
d 0,6 0,7 -0,2 0 1,1 0,8 0,8 0,7 0,7 0,6 5,8
∑d i 5,8
d= = = 0,58
n 10
Sd
∑d i - d
2
(0,6 - 0,58) 2 (0,7 - 0,58) 2 ... (0,6 - 0,58) 2
1,356
0,3882
n -1 9 9
H0 → δ(diferencia) = 0 HA → δ ≠0
d 0,58
Td 4,724
Sd 0,3882
n 10
1-
td tn -1 2
Regla de decisión: Si Rechazo Ho
4,724 2,2622
Como → Rechazo Ho
Interpretación
Con un 95 % de confianza estadística se ha demostrado que exista diferencia
sobre la velocidad con que el hígado elimina dicha sustancia inoculada, en
ayunas o luego de alimentados (p < 0,05).
44
Bioestadística 2017 FCV-UNL
Análisis de la varianza
45
Bioestadística 2017 FCV-UNL
……………
X mayor X segundo X menor
X menor
…
X segundo
X mayor
46
Bioestadística 2017 FCV-UNL
Ejemplo
Con el objeto de evaluar 3 preparados para controlar la anemia en lechones, se
realizó un estudio midiendo el tiempo, en días, en que se normalizaron los
valores hemáticos. Los individuos se asignaron al azar en cada grupo y del
mismo modo se asignó el tratamiento. Realice la prueba de hipótesis
correspondiente y extraiga conclusiones. Si encontrara diferencias ¿Cuál/es
preparado/s recomendaría?
Preparado 1: 23 – 22 – 21 – 23 – 21 – 20 – 25 – 21 – 23
Preparado 2: 20 – 19 – 21 – 18 – 17 – 21 – 22 – 19
Preparado 3: 22 – 24 – 19 – 22 – 22 – 24 – 26 – 24
Resolución:
Preparado Preparado Preparado
2 2 2 Total
1 X 2 X 3 X
23 529 20 400 22 484
22 484 19 361 24 576
21 441 21 441 19 361
23 529 18 324 22 484
21 441 17 289 22 484
20 400 21 441 24 576
25 625 22 484 26 676
21 441 19 361 24 576
23 529
Total (∑) 199 157 183 539 (∑x)
2
Total (∑) 4419 3101 4217 11737 (∑x )
Promedio
22,11 19,63 22,88
X
n 9 8 8 N=25
H0 → μ1 = μ2 = μ3
H A → Al menos un promedio poblacional es diferente
Regla de decisión: Si RV Fk1-1;N -k Rechazo Ho
47
Bioestadística 2017 FCV-UNL
nj
k
T•2• 5392
SCTotal = ∑ ∑ X ij2 - = 11737 - = 11737,1 - 11620,8 = 116,3
j=1 i=1 N 25
nj
k k
T•2j 1992 1572 1832
SCDentro = ∑ ∑ Xij2 - ∑n = 11737 - ( + + )=
j =1 i =1 j =1 j 9 8 8
= 11737 - 11667,3 = 69,7
k
T•2j T•2• 1992 1572 1832 5392
SCEntre = ∑ - =( + + )- = 11667,3 - 11620,8 = 46,5
j=1 nj N 9 8 8 25
Tabla de ANOVA
Grados
Fuente de Suma de Cuadrados Razón de
de Tabla
Varianza Cuadrados medios varianza
libertad
Tratamiento 46,5 2 23,25 RV 7,33 3,44
Error 69,7 22 3,17
Total 116,3 24
Interpretación:
Se encontraron diferencias significativas entre el promedio 2 (µ2) y los otros dos
promedios (µ2 ≠ µ1 y µ2 ≠ µ3) (p < 0,05)
Se recomendaría el preparado 2 por ser el que recupera los valores hemáticos
en menor tiempo.
48
Bioestadística 2017 FCV-UNL
49
Bioestadística 2017 FCV-UNL
b = Pendiente de la muestra
Ῡ = Promedio de las Y
Suma de Cuadrados
Total Explicada Inexplicada
∑y 2
SCE b 2 .∑x i2 -
∑x 2
SCI SCT - SCE
i
SCT y i2 -
i
n n
50
Bioestadística 2017 FCV-UNL
Ejemplo
Los siguientes son datos obtenidos de un estudio experimental donde se trata de
averiguar las distintas concentraciones de un compuesto y su influencia sobre la
glucemia:
ANIMAL DOSIS GLUCEMIA
1 0,2 56
2 0,6 54
3 0,9 55
4 1,2 58
5 1,5 57
6 1,8 56
Usted debe probar si existe o no influencia
Resolución:
(∑y ) 2
(336)2
SCTotal = ∑y 2 i
i - = 18826 - = 18826 - 18816 = 10
n 6
51
Bioestadística 2017 FCV-UNL
(∑x ) 2
(6,2)2
SCExplicada = b .[ 2
∑x 2
i -
n
i
] = 1,04 2 • (8,14 -
6
) = 1,08 • (8,14 - 6,41) = 1,87
Modelo de correlación
Permite conocer la relación supuesta entre dos variables aleatorias (X e Y), siendo
posible evaluar la intensidad de esta relación.
Para cada valor de “X” existe una subpoblación de valores “Y” normalmente
distribuida.
Para cada valor de “Y” existe una subpoblación de valores de “X”
normalmente distribuida.
La distribución conjunta de “X” e “Y” es una distribución normal Bivariada.
Todas las subpoblaciones de los valores de “Y” tienen la misma varianza.
Todas las subpoblaciones de los valores de “X” tienen la misma varianza
Para evaluar la recta se aplica el coeficiente de correlación (r) que mide la
intensidad de la relación entre las variables. R = 𝑅2 -1 ≤ R ≤ 1
52
Bioestadística 2017 FCV-UNL
Ejemplo
Un investigador proporcionó información acerca del espesor de la grasa del lomo
en mm (y) y el peso muerto limpio en Kg (x) de n lotes de cerdos Poland China,
alimentados con una ración especial. Extraiga conclusiones acerca de la
relación entre ambas variables.
Observación 1 2 3 4 5 6 7 8
Peso (x) 93.4 118.4 126.6 100.2 98 89.1 125.6 113.4
Espesor (y) 34 41 46 36 35 31 45 43
Resolución:
Animal Peso (x) x Espesor (y) x.y
1 93,4 8723,56 34 1156 3175,6
2 118,4 14018,56 41 1681 4854,4
3 126,6 16027,56 46 2116 5823,6
4 100,2 10040,04 36 1296 3607,2
5 98 9604,00 35 1225 3430,0
6 89,1 7938,81 31 961 2762,1
7 125,6 15775,36 45 2025 5652,0
8 113,4 12859,56 43 1849 4876,2
Total 864,7 311 34181,1
94987,45 12309
Promedio 108,09 38,875
(∑y ) 2
(311)2
SCTotal = ∑y i2 -
i
= 12309 - = 12309 - 12090,125 = 218,875
n 8
53
Bioestadística 2017 FCV-UNL
(∑x ) 2
(864,7)2
SCExplicada = b .[2
∑x 2
i -
n
i
] = 0,37 2 • (94987,45 -
8
) = 108,668
Interpretación:
Se encontraron evidencias para afirmar que el peso de la canal está
correlacionado linealmente con el espesor de la capa de grasa del lomo de los
cerdos Poland China (p < 0,05).
SCE 208,668
r2 = = = 0,953
SCT 218,875
SCE 208,668
r 0,953 0,976
SCT 218,875
Interpretación:
La intensidad de la relación entre el espesor de la capa de grasa del lomo de los
cerdos Poland China y el peso de la canal de los mismos y es de 97,6 %.
(P < 0,05)
54
Bioestadística 2017 FCV-UNL
Prueba de independencia
Obviamente que para un ejemplo concreto, en las hipótesis hay que denominar
cuáles son los criterios de que trata el problema en cuestión.
(Oi - Ei )2
Estadístico de prueba: χ =∑
2
Ei
Ejemplo
55
Bioestadística 2017 FCV-UNL
Resolución:
H0: la posibilidad de padecer zoonosis es independiente del lugar de residencia.
Ha: la posibilidad de padecer zoonosis en estudiantes de veterinaria no es
independiente (depende) del lugar de residencia.
Se completa la tabla con los totales marginales y como se tiene que estimar los
valores esperados (Ei), si la hipótesis nula fuera cierta, se identifica cada casilla
comenzando con la letra a, en este caso: a; b; c; d.
Urbano Rural Total
Zoonosis SI 18 (a) 9 (b) 27
Zoonosis NO 545 (c) 57 (d) 602
Total 563 66 629
Para calcular los valores esperados para cada casilla se multiplican los
marginales y se divide por el total.
Interpretación:
Con un 95 % de confianza estadística se puede afirmar que, tener zoonosis
depende del lugar de residencia (p < 0,05).
56
Bioestadística 2017 FCV-UNL
Prueba de homogeneidad
Ejemplo
Se investigó el nivel de riesgo al estudiar Medicina Veterinaria de acuerdo con la
Universidad. Se asistió a cada una de las seis Universidades en las cuales se
encuestó a los alumnos preguntándoles si padecieron y/o padecen alguna
zoonosis.
Univ. 1 Univ. 2 Univ. 3 Univ. 4 Univ. 5 Univ. 6
Zoono. SI 7 5 11 5 3 1
Zoono. NO 151 119 130 118 57 112
Resolución:
H0: Es homogénea la posibilidad de padecer zoonosis en todas las
Universidades.
Ha: No es homogénea la posibilidad de padecer zoonosis en todas las
Universidades.
Se completa la tabla con los totales marginales y como se tiene que estimar los
valores esperados (Ei), si la hipótesis nula fuera cierta, se identifica cada casilla
comenzando con la letra “a”, en este caso, hasta la “l”.
Univ. 1 Univ. 2 Univ. 3 Univ. 4 Univ. 5 Univ. 6 Total
Zoono. SI 7 (a) 5 (b) 11 (c) 5 (d) 3 (e) 1 (f) 32
Zoono. NO 151 (g) 119 (h) 130 (i) 118 (j) 57 (k) 112 (l) 687
Total 158 124 141 123 60 113 719
Para calcular los valores esperados para cada casilla se multiplican los
marginales y se divide por el total.
57
Bioestadística 2017 FCV-UNL
(r - 1)(c - 1)
Significa los grados de libertad ((renglones – 1) por (columnas – 1)).
Estadístico de Prueba:
O - E i (7 - 7,03) 2 (5 - 5,52) 2 .... (112 - 107,97) 2 7,25
X2 ∑ i
2
Interpretación:
Con los datos disponibles, no se puede afirmar que no sea homogénea la
posibilidad de padecer zoonosis de los estudiantes de veterinaria en las
Universidades consideradas (p > 0,05).
58
Bioestadística 2017 FCV-UNL
Muestreo
59
Bioestadística 2017 FCV-UNL
Tipos de muestreo
1- Muestreo probabilístico:
Aleatorio simple o al azar: se sortea la muestra de manea que cada
unidad de la población tenga la misma posibilidad de ser elegida para formar parte
de la muestra. Es práctico cuando la población no es muy variable ni muy grande,
no se sabe de la existencia de subpoblaciones y es posible tener un listado
completo de todos los elementos componentes de la población.
60
Bioestadística 2017 FCV-UNL
2- Muestreo dirigido:
No es probabilístico ni permite sacar conclusiones respecto a la población. Los
muestreos y/o relevamientos se hacen en el lugar de sospecha que exista la
característica de interés. Generalmente se usa en casos de brotes o sospecha de
ingreso fronterizo de ciertas enfermedades.
61
Bioestadística 2017 FCV-UNL
62