Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Bioestadistica MARF
Bioestadistica MARF
Bioestadstica Elemental
en el rea de la Salud
Miguel ngel Rodrguez Feliciano
INTRODUCCIN
Por qu la Bioestadstica?
JUSTIFICACION
CONTENIDO
Distribuciones muestrales
Inferencia Estadstica
Anlisis de Varianza
Regresin y Correlacin
Estadstica no Paramtrica
Bioestadstica
Cuarto
Qumico Farmacobilogo
Estadstica
Crditos 8
Clave QFDD43020819
Hrs./Teora
3
Hrs./Prctica 2
Hrs./Semana 5
Hrs./Semestre 75
SEPTIEMBRE 2001
INTRODUCCION
El conocimiento que se imparte en la materia permitir desarrollar habilidades a
los alumnos en reas especficas como Control de calidad de las materias
primas, Control de Procesos y Productos terminados, Establecimiento de
Normas y Sistemas, Interpretacin
Interpretacin de datos generados por pruebas rutinarias
de laboratorio, o ms general, por las ciencias de la Salud, as como
proporcionarles las bases para Disear Experimentos, crear nuevos productos o
para mejorar los procesos nuevos o ya existentes.
Se requiere
e del desarrollo de un pensamiento matemtico, necesita de la
comprensin, de la habilidad para el Procesamiento de informacin, del
Razonamiento, de la capacidad de Anlisis e interpretacin de resultados.
UBICACIN DE LA MATERIA
La materia de Bioestadstica
Bioestadstica se encuentra insertada en el cuarto semestre del
plan de estudios de la carrera de Qumico Farmacobilogo de la Facultad de
Ciencias Qumicas de la Universidad Autnoma de Chiapas. El plan de estudios
consta de 9 semestres.
El contenido de la materia
materia es de formacin bsica de orden prctico y que
tienen como objetivo principal el de enlazar conocimientos para que se
apliquen en las materias de especializacin de las dos carreras. Le anteceden
la materia de Estadstica, donde se estudi la parte descriptiva
descriptiva de la materia.
ESTRATEGIAS DIDCTICAS SUGERIDAS
El curso ser implantado a partir del aprendizaje grupal y se combinarn las
sesiones tericas con las prcticas de taller, as como eventualmente trabajos
de investigacin o de campo. En las dos pr
primeras,
imeras, la resolucin de problemas
tipo ser interactiva. El avance del programa ser determinado por la clase, de
acuerdo al entendimiento de los temas.
OBJETIVO GENERAL
Al finalizar el curso, el alumno ser capaz de aplicar diferentes tcnicas de
Inferencia estadstica para el anlisis de informacin experimental.
UNIDADES TEMTICAS
UNIDAD I.- INFERENCIA ESTADSTICA
Objetivo Especfico: Al finalizar la unidad, el alumno generalizar sobre
poblaciones a partir de datos mustrales, empleando para ello los mtodos
inferenciales de la estimacin y de las hiptesis.
1.1 Conceptos de Inferencia Estadstica
1.2 Tcnicas de Inferencia Estadstica
1.2.1 Estimadores y sus propiedades
1.2.2 Estimacin puntual y por intervalo
1.2.3 factor de confianza y error estndar
1.2.4 Estimacin de Medias Poblacionales
1.2.5 Estimacin de Proporciones Poblacionales
1.2.6 Estimacin de Varianzas Poblacionales
1.1.7 Estimacin del Tamao Muestral
1.3 Hiptesis
1.3.1 Planteamiento de Hiptesis
1.3.2 Tipos de Hiptesis
1.3.3 Decisin estadstica
1.3.4 Errores tipo I y II
1.3.5 Hiptesis sobre las Medias Poblacionales
1.3.6 Hiptesis sobre las Proporciones Poblacionales
1.3.7 Hiptesis sobre las Varianzas Poblacionales
1.3.8 Pruebas de Bondad, Independencia y Homogeneidad
Tiempo Estimado:
16 hrs.
12 hrs.
6 hrs.
EXMENES PARCIALES
EXAMEN FINAL
PRACTICAS DE TALLER
TRABAJOS DE INVESTIGACIN
CALIFICACION CUALITATIVA
30%
30%
15%
10%
15%
100%
Nombre
Repaso del manejo del Statgraphics
Estimacin por intervalo
Hiptesis
Tamao de la muestra
Microstat
Ajuste de modelos
Regresin no lineal
Estadstica no paramtrica
Anlisis de varianza
Tiempo Estimado:
29 hrs.
BIBLIOGRAFA
Capitulo I:
Distribuciones Muestrales
POBLACION Y MUESTRA
Poblacin
Se le llama as al conjunto de unidades que poseen la caracterstica en estudio.
El conjunto de elementos que poseen la variable por investigar, que han llenado las
condiciones de inclusin y que se encuentran disponibles para la investigacin en
tiempo y espacio
Existen 2 tipos de poblaciones: 1) Finita 2) Infinita
Muestra
Unidad de An
Anlisis: Est definida como el elemento que se examina y del que se
busca la informacin dentro de la unidad de investigacin.
TIPOS DE MUESTREO
Cuando seleccionamos algunos elementos
elementos con la intencin de averiguar algo sobre
una poblacin determinada, nos referimos a este grupo de elementos como muestra.
Por supuesto, esperamos que lo que averiguamos en la muestra sea cierto para la
poblacin en su conjunto.
La exactitud de la informacin
informacin recolectada depende en gran manera de la forma en
que fue seleccionada la muestra.
Cuando no es posible medir cada
uno de los individuos de una
poblacin, se toma una muestra
representativa de la misma.
La muestra descansa en el
principio de que las partes
representan al todo y, por tal,
refleja las caractersticas que
definen la poblacin de la que fue
extrada, lo cual nos indica que es representativa.
Por lo tanto, la validez de la generalizacin depende de la validez y tamao de la
muestra.
LEYES
LEYES DEL MTODO DE MUESTREO
El mtodo de muestreo se basa en ciertas leyes que le otorgan su fundamento
cientfico, las cuales son:
10
MARCO MUESTRAL
Es el proceso de definir y enumerar los elementos sobre los cuales se realizan las
inferencias estadsticas en el muestreo probabilstico. Es importante la construccin
de un marco muestral lo ms perfecto posible a fin de que exista una
correspondencia biunvoca entre las unidades muestrales poblacionales y las listas
fsicas que lo conforman. Entre los factores que contribuyen a distorsionar la
calidad de un buen marco muestral estn: a) Elementos faltantes, b) Unidades
ocultas por estar pareadas con otras, c) Unidades muestrales repetidas y d)
Elementos extraos.
TIPOS DE MUESTREO
Muestreo Probabil
Probabilstico: Es cuando se puede determinar de antemano la
probabilidad de seleccin de cada uno de los elementos de la poblacin siendo esta
distinta de cero. Este muestreo est basado en la teora de la aleatoriedad o del
azar, en la cual se fundamenta la estadstica matemtica. Algunos tipos de
muestreo son:
-
Aleatorio simple
Estratificado
Por conglomerado
Sistemtico
11
Muestreo
Muestreo Aleatorio Simple: La forma ms comn de obtener
una muestra es la seleccin al azar. es decir, cada uno de los
individuos de una poblacin tiene la misma posibilidad de ser
elegido. Si no se cumple este requisito, se dice que la muestra
es viciada. Para
Para tener la seguridad de que la muestra
aleatoria no es viciada, debe emplearse para su constitucin
una tabla de nmeros aleatorios o una tmbola de nmeros
aleatorios.
Muestreo Estratificado: Una muestra es estratificada cuando los elementos de la
muestra son proporcionales a su presencia en la poblacin. La presencia de un
elemento en un estrato excluye su presencia en otro. Para este tipo de muestreo,
se divide a la poblacin en varios grupos
grupos o estratos con el fin de dar
representatividad a los distintos
factores que integran el universo de
estudio. Para la seleccin de los
elementos
o
unidades
representantes, se utiliza el mtodo
de muestreo aleatorio, tomando
elementos de cada estrato.
Muestreo
estreo Por Conglomerado: Este mtodo divide a toda la
Mu
poblacin en K muestras conteniendo n unidades
originales, posteriormente se escoge una muestra de manera
aleatoria de las K muestras realizadas al inicio.
Muestreo Sistemtico: Es un proceso diferente
erente a los anteriores. Si la poblacin
tiene N unidades, estos se enumeran del 1 a N en algun orden (tamao,
edad, pesos, etc..). Para seleccionar una muestrade n unidades, tomamos una
unidad al azar de las primeras K unidades y de ah en adelante
adelant cada K-esima
unidad.
12
Aleatorio
simple
Sistemtico
Estratificado
CARACTERISTICAS
VENTAJAS
INCONVENIENTES
Se selecciona una
muestra de tamao n
de una poblacin de N
unidades, cada
elemento tiene una
probabilidad de
inclusin igual y
conocida de n/N.
Sencillo y de
fcil
comprensin.
Clculo rpido
de medias y
varianzas.
Se basa en la
teora
estadstica, y por
tanto existen
paquetes
informticos
para analizar los
datos
Conseguir un listado
de los N elementos de
la poblacin
Determinar tamao
muestral n.
Definir un intervalo k=
N/n.
Elegir un nmero
aleatorio, r, entre 1 y k
(r= arranque
aleatorio).
Seleccionar los
elementos de la lista.
Fcil de aplicar.
No siempre es
necesario tener
un listado de
toda la
poblacin.
Cuando la
poblacin est
ordenada
siguiendo una
tendencia
conocida,
asegura una
cobertura de
unidades de
todos los tipos.
Si la constante de
muestreo est asociada
con el fenmeno de
inters, las
estimaciones obtenidas
a partir de la muestra
pueden contener sesgo
de seleccin
En ciertas ocasiones
resultar conveniente
estratificar la muestra
segn ciertas variables
de inters. Para ello
debemos conocer la
composicin
estratificada de la
poblacin objetivo a
hacer un muestreo.
Una vez calculado el
tamao muestral
apropiado, este se
reparte de manera
proporcional entre los
distintos estratos
definidos en la
poblacin usando una
simple regla de tres.
Tiende a
asegurar que la
muestra
represente
adecuadamente
a la poblacin en
funcin de unas
variables
seleccionadas.
Se obtienen
estimaciones
ms precisa
Su objetivo es
conseguir una
muestra lo ms
semejante
posible a la
poblacin en lo
que a la o las
Se ha de conocer la
distribucin en la
poblacin de las
variables
utilizadas para la
estratificacin.
13
variables
estratificadoras
se refiere.
Conglomerado
Se realizan varias
fases de muestreo
sucesivas (polietpico)
La necesidad de
listados de las
unidades de una etapa
se limita a aquellas
unidades de muestreo
seleccionadas en la
etapa anterior.
Es muy
eficiente
cuando la
poblacin es
muy grande
y dispersa.
No es preciso
tener un
listado de
toda la
poblacin,
slo de las
unidades
primarias de
muestreo.
El error
estndar es
mayor que en
el muestreo
aleatorio
simple o
estratificado.
El clculo del
error estndar
es complejo.
Muestreo No Probabil
Probabilstico: Es aquel utilizado en forma emprica, es decir, no se
efecta bajo normas probabilstica de seleccin, por lo que sus procesos intervienen
opiniones y criterios personales del investigador o muestrista o no existe norma
bien definida o validada. Normalmente se acude a este tipo de muestreo cuando es
difcil enumerar, listar o precisar el universo objeto de estudio o cuando no existen
registros de los datos. Algunos de estos tipos de muestreo son:
-
Por cuotas
Por criterio
Accidental
14
Muestreo Mixto:
Se combinan diversos tipos de muestreo. Por ejemplo: se puede seleccionar las
unidades de la muestra en forma aleatoria y despus aplicar el muestreo por cuotas.
Muestreo Tipo:
La muestra tipo (master simple) es una aplicacin combinada y especial de los tipos
de muestra existentes. Consiste en seleccionar una muestra "para ser usada" al
disponer de tiempo, la muestra se establece empleando procedimientos sofisticados;
y una vez establecida, constituir el mdulo general del cual se extraer la muestra
definitiva conforme a la necesidad especfica de cada investigacin.
TIPOS DE ERRORES
Error Estndar: La desviacin estndar de una distribucin, en el muestreo de un
estadstico, es frecuentemente llamada el error estndar del estadstico. Por
ejemplo, la desviacin estndar de las medias de todas la muestras posibles del
mismo tamao, extradas de una poblacin, es llamada el error estndar de la
media.
De la misma manera, la desviacin estndar de las proporciones de todas las
muestras posibles del mismo tamao, extradas de una poblacin, es llamada el
error estndar de la proporcin. La diferencia entre los trminos "desviacin
estndar" y "error de estndar" es que la primera se refiere a los valores originales,
mientras que la ltima est relacionada con valores calculados. Un estadstico es un
valor calculado, obtenido con los elementos incluidos en una muestra.
Error Muestral
Muestral o Error de Muestreo: La diferencia entre el resultado obtenido de
una muestra (un estadstico) y el resultado el cual deberamos haber obtenido de la
poblacin (el parmetro correspondiente) se llama el error muestral o error de
muestreo. Un error de muestreo usualmente ocurre cuando no se lleva a cabo la
encuesta completa de la poblacin, sino que se toma una muestra para estimar las
caractersticas de la poblacin. El error muestral es medido por el error estadstico,
en trminos de probabilidad, bajo la curva normal.
El resultado de la media indica la precisin de la estimacin de la poblacin basada
en el estudio de la muestra. Mientras ms pequeo el error de las muestras, mayor
es la precisin de la estimacin. Deber hacerse notar que los errores cometidos en
una encuesta por muestreo, tales como respuestas inconsistentes, incompletas o no
determinadas, no son considerados como errores mustrales. Los errores no
mustrales pueden tambin ocurrir en una encuesta completa de la poblacin.
15
TAMAO DE MUESTRA
MUESTRA
Esta va a variar en relacin al tipo de estudio y de los objetivos a alcanzar
1.-- Promedios
1.
3.-Asociacin
3.
variables
entre
16
TIPOS DE VARIABLES
Por su
Estructura
Simple
Compleja
Se requiere de 2 o ms indicadores
Cualitativas
Por la Forma
de Medirse
Cuantitativas
Por
Dependencia
Independientes
(X)
Dependientes
(Y)
TIPOS DE ESTUDIOS
CARACTERSTICAS DEL ESTUDIO
Tipo de estudio
Interferencia
del
Investigador
Periodo de
captacin de
informacin
Evolucin del
fenmeno
estudiado
Comparacin de
las poblaciones de
estudio
Observacional
Prospectivo o
Retrospectivo
Transversal
Descriptivo
Comparativo
Encuesta
Descriptiva
Encuesta
Comparativa
Observacional
Retrospectivo
Longitudinal
Descriptivo
Revisin de
casos
Observacional
Retrospectivo
Longitudinal
Comparativo de
Efecto-Causa
Casos y
controles
Observacional
Retrospectivo
Longitudinal
Comparativo de
Causa-Efecto
Perspectiva
histrica
Observacional
Prospectivo
Longitudinal
Descriptivo
Comparativo
Estudio de
una cohorte
Estudio de
varias
cohortes
Experimento
Experimental
Prospectivo
Longitudinal
CUESTIONARIO
Es el instrumento por medio del cual,
el investigador recoge la informacin
de la realidad; dicho instrumento
cuenta con 2 tipos de preguntas: a)
abiertas y b) cerradas
Comparativo
PROCESAMIENTO DE LA
INFORMACION
Recoleccin de Datos
Observacin
Experimentacin
Encuestas
Organizacin de Datos
Ordenacin
Tabulacin
Clasificacin
Presentacin de Datos
Grficos
Cuadros
Descripcin
Anlisis e Interpretacin
Conclusiones y
Recomendaciones
17
18
Capitulo II
II:
Inferencia Estadstica
La inferencia Estadstica, es
es el procedimiento mediante el cual se toman decisiones
sobre una poblacin en base al estudio de una muestra extrada de ella.
19
DISTRIBUCIN NORMAL
20
Son ms probables los valores cercanos a uno central que llamamos media
()
Funcin de distribucin
Tipificacin
Si la variable X tiene ~N (, ) entonces la variable tipificada de X es
21
22
INTERVALOS DE CONFIANZA
Se llama intervalo de confianza en estadstica a un intervalo de valores alrededor
de un parmetro poblacional (calculado en una muestra) en el cual se encuentra el
verdadero valor del parmetro, con una probabilidad determinada.
La probabilidad de que el verdadero valor del parmetro se encuentre en el
intervalo construido se denomina nive
nivell de confianza, y se denota 1-. , en donde
es la probabilidad de equivocarnos,
equivocarnos y se le conoce como nivel de significancia.
Generalmente
ralmente
se
construyen intervalos con
confianza al 95% es decir
que
se
tiene
una
significancia del 5%. Menos
frecuentes
son
los
intervalos del 10% y el 1%.
23
Conocida
Varianza Conocida
P = x Z
< < x + Z
= 1
n
2 n
2
2 n
= x Z
Z 0.01 = 2.58
2
x Z
n
2
84.3 2.58(3.10)
84.3 8.0
84.3 8 = 76.3
84.3 + 8 = 92.3
P = p Z
2
p q
< P < p + Z
n
2
p q
= 1
n
p q
P = p Z
n
2
Z 0.05 = 1.96
2
123
= 0.41
p) =
300
p q
P = p Z
n
2
(0.41)(0.59)
P = 0.41 1.96
300
P = 0.41 0.05
24
S
S
P = x t
< < x + t
= 1
n
n
2
2
n
2
= x t
EJEMPLO: El contenido en litros de7 recipientes de H2SO4 son: 9.8, 10.2, 10.4, 9.8,
10.0, 10.2 y 9.6. Con un intervalo de confianza del 95% se desea estimar el volumen
medio de todos los recipientes que contienen este cido, considerando que los
valores tienen una distribucin normal.
t 0.05 = 2.447
x = 10
S = 0.283
s
x t
n
2
10 2.447(0.107 )
10 0.26
10 0.26 = 9.74
10 + 0.26 = 10.26
(n 1) s 2
(n 1) s 2
2
P=
< <
= 1
2
x2
x1
2
2
x =
2
(n 1) s 2
( n 1) s 2
x 2
2
(9)(0.286)
(9)(0.286)
< 2 <
P=
= 1
2.70
19.023
0.135 < 2 < 0.953
25
PRUEBAS DE HIPTESIS
Por lo que, para cada tipo de prueba de hiptesis se debe calcular una prueba
estadstica apropiada. Adems de que los datos deben de mostrar una distribucin
normal para que se pueda a proceder a la verificacin de una hiptesis.
26
Tipos de planteamientos
1.- Ho: = o
Ha: o
2.- Ho: o
Ha: < o
3.- Ho: o
Ha: > o
27
Z 0.99 => p = 2.33
Z 0.95 => p = 1.65
Z=
X o
Ho: = 90
Ha: 90
Z 0.01 = 2.58
2
Z=
X o
84.3 90 5.7
=
= 1.84
12
3.10
15
X o
S
n
EJEMPLO: El contenido en litros de7 recipientes de H2SO4 son: 9.8, 10.2, 10.4, 9.8,
10.0, 10.2 y 9.6. Con un intervalo de confianza del 95% se estima que el volumen
medio de todos los recipientes que contienen este cido es diferente de 11lts,
considerando que los valores tienen una distribucin normal.
Formula:
Ho: = 11
t=
Ha: 11
t 0.05 = 2.447
= 10
S = 0.283
t=
X o 10 11
=
= 9.35
S
0.283
n
7
Ha: 1 2 0
2.- Ho: 1 2 0
Ha: 1 2 < 0
3.- Ho: 1 2 0
Ha: 1 2 > 0
28
Z=
( x1 x2 )
12
n1
Z=
22
n2
(4.5 3.4)
= 2.82
1 1
+
12 15
F=
2
S mayor
2
S menor
Con Varianzas
Varianzas Iguales
t=
( x1 x2 ) ( 1 2 )
S
2
p
n1
S p2 =
2
p
n2
Con Varianzas
Varianzas Diferentes
t=
( x1 x2 )
S12 S 22
+
n1 n2
29
S p2 =
t=
( x1 x2 )
S
2
p
n1
2
p
t=
n2
S p2 =
21(40) 2 14(35) 2
= 1450
22 + 15 2
(120 96)
= 1.88
1450 1450
+
15
22
30
La t de tablas 2.301 (se acepta Ho para medias)
t=
( x1 x2 )
2
1
2
2
S
S
+
n1 n2
t=
(62.6 47.2)
(33.8) 2 (10.1) 2
+
10
20
= 1.41
T(28)0.05/2=2.0484
-2.0484 < 1.41 < 2.0484
Se acepta Ho.
Z=
( x1 x2 )
12
n1
22
n2
Z=
( x1 x2 )
2
1
n1
2
2
n2
Z=
(6800 5450)
(600)2 + (500)2
75
80
= 15.17
31
t=
Una poblacin con distintas mediciones
d
Sd
n
t=
d
Sd
n
t=
2.2
2 .2
=
= 4.42
1.983 0.4977
8
t0.05/2,7 = 2.841
t0.01/2,7 =4.029
32
p) po
Z=
po qo
n
Ho: p = 0.50
Ha: p 0.50
x 123
p) = =
= 0.41
n 300
Z=
0.09
0.41 0.50
=
= 3.11
(0.50)(0.50) 0.0289
300
Se rechaza la Hiptesis nula.
33
Prueba de Hiptesis para: Proporciones dos Poblaciones
Poblaciones
Sus formulas son:
( p)1 p) 2 ) ( p1o p2 o )
Z=
) ) )
p=
p1 p 2
x1 + x2
n1 + n2
p=
x1 + x2
n1 + n2
) p) p) =
1
Z=
p=
p (1 p ) p (1 p )
+
n1
n2
78 + 90
= 0.84
100 + 100
) p) p) =
1
Z=
(.84)(.16) (.84)(.16)
+
= .0518
100
100
(.90 .78)
.12
=
= 2.32
.0518
.0518
Capitulo III
III
II::
Anlisis de Varianza
El anlisis de la varianza, es un mtodo que es necesario cuando se quieren
comparar ms de dos medias.
medias Sin embargo debido a que es un mtodo que permite
comparar varias medias en diversas situaciones; se encuentra ligado, al diseo de
experimentos y, de alguna manera, es la base del anlisis multivaria
multivariado.
yi = + i
con i = 1, 2, 3,........, n
34
yi = + i y
yi
SUPUESTOS DE APLICACION
En la aplicacin
icacin del ANVA se suponen:
1. Los efectos de los tratamientos y los ambientales son aditivos.
2. El Error Experimental constituye un elemento al azar, normal e
independiente, con una distribucin normal con una media 0 y una varianza
2 .
CONCEPTOS DE APLICACIN
3. Dos conceptos en la aplicacin del ANVA.
4. Grados de Libertad (G.L.): Es el nmero de contrastes o comparaciones
ortogonales (datos independientes) menos el nmero de restricciones (son las
medias de las hiptesis) impuestas que se realiza en un grupo de datos.
35
n( y )
S2
Fo =
F1n-1
REGLA DE DESICION
La regla de decisin para la prueba con un nivel de significanca es de:
Grados
os de
Libertad (GL)
Media
Error
Total
n-1
N
Sumas de
Cuadrados (SC)
n(
y - )
(y - y )
o
2
ni=1 i
ni=1(yi-
o)2
Fo
y -) /1
[
(y - y ) /n-1]
1] =S
2
n(
n
i=1
n(
36
y -) /S
2
La estadstica Fo, bajo la hiptesis nula, tiene una distribucin F1nF1n-1, la Regla de
1
Decisin consiste en: Rechazar Ho si Fo > F n-1,
EJEMPLO:
En un estudio de sobre los niveles de hemoglobina de una comunidad que abita
sobre los 1000 m.s.n.m se cuantificaron los niveles de Hb de 28 personas que
participaron de manera voluntaria
voluntaria,, siendo los valores obtenidos:
12.72
13.38
13.94
17.34
15.74
14.60
19.03
14.11
13.01
17.53
19.25
13.72
12.26
13.29
18.92
17.65
12.13
13.90
10.41
15.03
14.44
13.62
11.49
14.75
13.68
14.81
5.21
17.03
37
y2 = 6029.9671
y/n
y/n = = 14.39
231.66
FV
Media
Error
Total
GL
FV
Media
Error
Total
GL
SC
1
27
28
1
n-1
n
F127,0.05 = 4.17
CM
37.67
231.66
269.33
SC
n(-
o)
n
i=1(yi-)2
ni=1(yi-
o)2
2
Fo > Ft
Fo
4.39*
37.67
8.58
CM
Fo
n(-
) /1
n(-
) /S2
[
ni=1(yi-)2/n-1]= S2
2
F127,0.01 = 7.56
Fo < Ft
DISEOS
DISEOS EXPERIMENTALES
Diseo Completamente al Azar
Es el tipo de arreglo ms sencillo; los tratamientos estn asignados completamente
al azar a las unidades experimentales; por lo que la variabilidad
vari
total de las
observaciones del experimento se divide en:
Ventajas:
Desventajas:
La variacin que existe entre las unidades experimentales forma parte del
error experimental.
Yi.
1
Y11
Y12
Y13
...
Y1n1
n1j=1Y1j
Tratamientos
2
3
...
Y21
Y31
...
Y22
Y32
...
Y23
Y33
...
...
...
...
Y2n2
Y3n3
...
n2
n3
j=1Y2j j=1Y3j ...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
t
Yt1
Yt2
Yt3
...
Ytnk
nkj=1Ytj ti=1nkj=1Yij=Y..
38
La tabla del ANVA, para cuando se tiene diferente nmero de repeticiones por
tratamiento es la siguiente:
39
V.S.
40
41
En la tabla, se tiene que las observaciones se denotan con una letra con dos
subndices, el primero indica el tratamiento ( i ) y el segundo el bloque ( j ).
Ventajas:
Es ms preciso que el DCA cuando hay un factor que causa variacin en las
U.E.
Desventajas:
Diseo
gl
DCA
t (r-1)
DBA
(t-1) (r-1)
42
FV
Tratam.
GL
t-1
ti=1(Yi.)2/r
- (Y..) /rt
CM
S.C. Trat./t-1
Trat./t
Bloques
r-1
ti=1(Y.j)2/t - (Y..)2/rt
S.C. Bloq/r
oq/r-1
Error
(t-1)
(r-1)
rt-1
S.C.Tot.-S.C.Tr.-S.C.Bl.
S.C.Err./t--1 r-1
Total
SC
2
Fc
C.M. Trat/
C.M. Error
C.M. Bloq./
C.M. Error
ti=1rj=1Y2ij - (Y..)2/rt
Para tratamientos
Para Bloques
43
Para
ara Tratamientos Fc > Ft0.05 y Fc > Ft0.01
Para Bloques
44
El anlisis estadstico
estadstico es simple, ligeramente ms complicado que DBA.
Puede utilizarse cuando las U.E. forman una lnea continua.
Proporciona una comparacin ms precisa de los efectos de los tratamientos.
45
Para tratamientos
Para Hileras
Para Columnas
46
Ejemplo: Se desea evaluar en un experimento el efecto en la ganancia de peso de
cuatro complementos alimenticios en la dieta de ratones recin nacidos de
diferentes razas. Se pesaron los ratones al nacer y se pesaron despus de 15 das de
estarles dando el complemento
alimenticio; obteniendo de la
diferencias de pesos la ganancia del
mismo, obtenindose los siguientes
resultados en gr.:
Ho1:t1=t2 = t3
VS
Ho2:H1=H2 H3
VS
Ho3:C1=C2 =C3
VS
47
No existe diferencia significativa en la ganancia de pesos por efecto de los
complementos alimenticios, ni por las especies y pesos al nacer.
Capitulo IV
IV:
Correlacin y Regresin
En la prctica con mucha frecuencia es necesario resolver problemas que implican
conjuntos de variables, cuando se sabe que existe una relacin inherente entre ellas.
El aspecto estadstico del problema consiste en lograr la mejor estimacin de la
relacin entre las variables
Ecuaciones de curvas
Lnea recta
Y = ao + a1X
Curva de grado n
Curva exponencial
Y = abx
Curva geomtrica
Y = aXb
Hiperbola
1
Y = ----------------------ao + a1X
48
Grficas de Funciones
49
REGRESIN LINEAL SIMPLE
En este modelo, se considera a la variable X como la variable independiente
independiente, ya
que se encuentra bajo el control del investigador,, es decir los valores de X son
seleccionados para obtener valores de Y,
Y, por lo que se le conoce como variable
dependiente; por lo que se habla de una regresin de Y sobre X.
Linealidad
Independencia
Normalidad
Igualdad de varianzas
a: Es el punto donde la recta cruza el eje vertical. Es el
punto de inicio del valor de los datos de la pendiente.
b: Es el valor de la pendiente. Indica la cantidad con la cual
y cambia por cada unidad que cambia X.
50
Ho: = 0
v.s.
Ha: 0
Fuente de variacin
g.l.
S.C.
C.M.
Regresin lineal
SCR
SCR/1
CMR/CMr
Residual
n-2
SCr
SCr/n-2
n-1
Formulas
(
xi )
b xi
n SCR
=
r2 =
2
SCT
( yi )
2
y
i
n
( y )
SCT = yi2
(
xi )
SCR = b xi
n
(
xi )
b xi
=
r=
2
( y)
yi2 n i
2
b=
a=
n xy ( x )( y )
n x 2 ( x )
SCR
SCT
y b x
n
x
x2
y2
xy
51
Totales
Coeficiente de determinacin
determinacin. Representa la variacin total de los valores
r2:
de la variable Y que se pueden contabilizar o explicar por
por una relacin lineal con
los valores de la variable aleatoria X.
X.
r2=0.36 = 36%. El 36% de la variacin de los valores de Y, se deben a una relacin
lineal con los valores de X.
52
Capitulo V:
V:
Estadstica No Paramtrica
La estadstica paramtrica Estima o Prueba Hiptesis acerca de uno ms
Poblacin. Necesitandose para esto conocer la forma en que se
Parametros de la Poblacin
distribuye la poblacin de donde se tomarn las muestras para la Inferencia
(aproximadamente normal).
La estadstica no paramtrica, estudia procedimientos que no se refieren a
parmetros poblacionales, que adems no dependen del conocimiento del
comportamiento de la distribucin de la poblacin en estudio. Son procedimientos
que no son afirmaciones acerca de los parmetros de la poblacin.
53
Ventajas de la estadstica no paramtrica
1.- Permiten probar hiptesis que no son afirmaciones acerca de valores de los
parmetros poblacionales.
2.- Se pueden utilizar cuando se desconoce la forma de la distribucin de la
poblacin muestreada.
3.- Son fciles de calcular, aplicndose ms fcil y rpidamente.
4.- Pueden aplicarse cuando los datos son solo categoras o clasificaciones.
HIPTESIS
Ho: La mediana de la poblacin es de 5
Ha: La mediana de la poblacin es diferente de 5
= 0.05
54
Alum.
Calif.
Alum.
Calif.
P(k x / n, p ) = n Ck p k q n k
k =0
P(k 1 / 9,0.5) = 9 Ck p k q 9k
10
10
10
k =0
HIPTESIS
Ho: mediana = 5
Ha: mediana 5
Ejemplo: Se desea conocer si existe diferencia entre los niveles de ac. rico de
hombres y mujeres habitantes de la ciudad de San Cristbal de las Casas.
HIPTESIS
Ho: Las medianas de la poblacin de hombres y mujeres son iguales
Ha: Las medianas de la poblacin de hombres y mujeres son di
diferentes
= 0.05
55
1.5
signo
11
C0 (0.5) 0 (0.5)110 +
11
C1 (0.5)1 (0.5)111 +
11
C2 (0.5) 2 (0.5)112 +
3.5
2.5
3.5
HIPTESIS
2.5
Ho: mediana
mediana = mediana
3.5
Ha: mediana
mediana mediana
1.5
1.5
2.5
2.5
2.5
2.5
P (k 2 / 11,0.5) = 0.0327
56
PRUEBA DE WILCOXON de calificacin con signo
Cuando los datos para el anlisis son medidos al menos en una escala de intervalos,
la prueba del SIGNO no es la ms aconsejable; debido a que se desperdicia mucha
informacin contenida en los datos.
En estos casos la prueba de WILCOXON puede ser ms adecuada, debido a que
utiliza las magnitudes de las diferencias entre las mediciones y un parmetro de
ubicacin dada por una HIPTESI
HIPTESIS
S en lugar de los signos de las diferencias.
Esta prueba se basa en las siguientes suposiciones sobre los datos:
Andros.
di=xi-o
di
di c/signo
4.91
-0.14
-1
4.10
-0.95
-7
6.74
1.69
10
10
7.27
2.22
13
13
7.42
2.37
14
14
T+ = 86 T- = 34 T=34
7.50
2.45
15
15
6.56
1.51
4.64
-0.41
-3
5.98
0.93
3.14
-1.91
12
-12
3.23
-1.82
11
-11
5.80
0.75
6.17
1.12
5.39
0.34
5.77
0.72
Ho: =5.05
Ha: 5.05
PRUEBA DE MANNMANN-WHITNEY
Esta prueba utiliza una mayor cantidad de informacin inherente a los datos y se
basa en los rangos de las observaciones.
Los supuestos de esta prueba son:
1.- Las muestras (n y m) son extradas de manera independiente y aleatoria.
2.- La escala de medicin es por lo menos ordinal.
3.- Si las poblaciones son diferentes, difieren solo en lo que respecta a sus medianas.
T =S
n(n + 1)
2
57
T =S
n(n + 1)
2
T = 145
S = 145
15(15 + 1)
= 25
2
58
PRUEBAS DE ASOCIACIN
Este estadstico de prueba, permite evaluar la asociacin entre 2 variables
mediante:
Prueba de independencia:
independencia: Prueba hiptesis nula para 2 criterios de clasificacin y
ver si son independientes cuando se aplican al mismo conjunto
conjunto de entidades.
Prueba de homogeneidad:
homogeneidad: Se utiliza para evaluar si las muestras extradas
provienen de poblaciones homogneas con respecto a algn criterio de clasificacin.
(Vo Ve) 2
Ve
Vo= Valores Observados
X2 =
X2 =
X2 =
(Vo Ve) 2
Ve
X20.05/2=5.024
59
MEDICION DE LA ASOCIACION
Razn de Riesgo
a
RR = ni
c
no
Razn de Momios
RM =
(a )(d )
(b)(C )
60
INDICE DE CONCORDANCIA
K=
Po Pe
1 Pe
Po =
a+d
N
Pe =
-Escala KappaKappa-
(mi)(ni) + (mo)(no)
N2
(14)(10) + (86)(90)
Pe =
= 0.788
(100) 2
Pe =
Po =
a+d
N
K=
Po Pe
1 Pe
Po =
4 + 80
= 0.84
100
K=
0.84 0.788
= 0.245
1 0.788
Conclusin: La concordancia
ambos laboratorios es discreta
entre
Pe = x.i xi.
Pe =
Po =
9 + 29 + 14
= 0.65
80
i =1
k
Po = xii
i =1
Po Pe
K=
1 Pe
0.65 0.383
K=
= 0.433
1 0.383
INDICES DE VALIDEZ
a
*100
a+c
d
Esp. =
*100
b+d
a
Vp (+) =
*100
a +b
Sen. =
Vp () =
d
*100
c+d
Sen.= Sensibilidad
Esp.= Especificidad
Vp(+)= Valor predictivo positivo
Vp(-)=
)= Vaor predictivo negativo
61
TABLAS
62
63
64
65
EJERCICIOS
Suponer que se conoce que en una poblacin de mujeres el 90% de las que
comienzan su tercer mes de embarazo han tenido algn cuidado prenatal. Si se
extrae de esta poblacin una muestra aleatoria de tamao 200 con distribucin
normal, Cual es la probabilidad que hayan tenido cuidados prenatales?
66
s
357,771
312,418
SEXO
Hombres
Mujeres
Como parte de una investigacin nutricional se desean saber cuales son los
valores en los que se encuentra la media de glucosa, colesterol, triglicridos y ac.
Urico, en estudiantes de la facultad de Ciencias Qumicas. Para lo cual se tomo un
na muestra de 24 personas completamente al azar. Suponiendo que los datos
presentan una distribucin normal, cual es el intervalo de confianza para la media
poblacional de cada analito?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
67
31
32
25
33
36
32
31
29
28
30
MUJERES
29
31
33
27
28
30
29
27
26
34
n1 = 20
33
28
29
30
31
33 26
32 25
27
28
27
n2 = 17
35
31
33
34
32
35
34
33
31
35
Niveles de leucocitos
3500 1500 2500 2500
2500 4500 2500 4500
3500 2500 3500 4500
4500 4500 4500 3500
4500 3500 3500 2500
4500
2500
3500
4500
3500
2500
4500
3500
3500
2500
68
Altos
187
166
179
197
166
186
145
191
179
184
172
190
193
170
183
144
178
Costa
194
155
172
140
181
141
179
188
156
152
170
171
174
174
173
168
168
69
18
19
20
21
22
23
24
160
146
181
174
151
165
185
149
176
165
165
160
142
142
5, 7, 4, 5, 5.
4, 4, 5, 6, 6, 4.
4, 5, 7, 6, 7.
70
Guadalajara:
22, 36, 40, 18, 25.
Campeche:
32, 41, 56, 28, 37, 43.
Veracruz:
18, 25, 32, 14, 29.
A que conclusin llega con este estudio. Explique.
5.
El promedio de la frecuencia respiratoria es de 12/min. en reposo. Se estudia
a un grupo de personas para determinar si la complexin es un factor en la
frecuencia respiratoria. Se tomaron muestras al azar de los 3 tipos de complexiones
y los resultados fueron los siguientes:
Delgados:
12, 13, 14, 15, 14.
Medianos:
13, 12, 12, 14, 13.
Gruesos:
16, 15, 14, 15.
Cual es su conclusin. Explique.
Empresas
A
B
C
I
0.90
0.80
0.70
II
0.70
0.70
0.60
III
0.70
0.60
0.80
IV
0.60
0.70
0.70
Existen diferencias en las mediciones de metanol con los equipos. Explique
2.
El nivel mximo en la atmsfera de dixido de azufre (SO2) recomendado por
la OMS es de 40 gr/m3. Se considera al Distrito Federal la ciudad ms
contaminada del pas; para comprobarlo se toman muestras de 4 de las ciudades
con mayor nmero de habitantes del pas (Distrito Federal, Monterrey,
Guadalajara, Tijuana) durante una semana y se obtuvieron los siguientes
resultados:
Das
1
2
3
4
5
6
7
D.F.
82
90
71
60
75
100
110
Ciudades
MTY GDA
70
74
82
68
75
90
88
TJA
67
49
54
72
94
98
85
61
53
48
45
67
62
49
71
3.
La presin arterial promedio de un individuo es de 100 (80-120). Se toman
muestras de las tres zonas del estado (Altos, Centro y Costa) a individuos
seleccionados al azar de diversas edades y se les mide la presin arterial para
determinar si la altitud a la que viven influye en est presin. Los resultados
obtenidos son:
Edades
I
II
III
IV
V
Es la altitud un
Explique.
Zonas
ALT
CEN
COS
110
95
100
115
98
98
105
102
94
108
104
99
104
100
92
factor que influya en la presin arterial de los individuos?
Ciudades
MDA OAX
TJA
I
400
357
800
II
300
421
725
III
600
480
1005
IV
457
300
930
V
525
500
915
72
Edades
Niveles de Adiccin
Alt
Med
I
12
14
II
10
8
III
12
10
IV
8
8
V
4
5
Baj
15
13
10
9
7
consumo de droga de
Marcas
A
B
C
I
t1-12.0
t2-14.0
t3-13.0
II
t2-13.5
t3-14.2
t1-13.6
III
t3-12.0
t1-10.0
t2-14.2
73
Edad
Razas
A
B
C
I
t1-18
t2-16
t3-12
II
t4-22
t1-17
t2-18
III
t3-11
t4-17
t1-19
IV
t2-19
t3-18
t4-19
Existen diferencias entre las diferentes Vacunas? Explique.
D
t4-21
t3-19
t2-17
t1-20
3.
Se evalan 4 diferentes insecticidas (t1, t2, t3 y t4) durante 4 semanas (I, II,
III y IV) en 4 especies de Triatominos (A, B, C y D). Los resultados obtenidos se
dieron en relacin al nmero de triatominos encontrados muertos, siendo estos:
Semanas
Especies
A
B
C
I
t1-12
t2-9
t3-6
II
t4-6
t1-14
t2-10
III
t3-5
t4-7
t1-11
IV
t2-9
t3-5
t4-7
Existen diferencias entre los diferentes Insecticidas? Explique.
D
t4-7
t3-4
t2-8
t1-12
Ciudad
A
B
C
I
t1-80
t2-69
t3-71
II
t3-93
t1-83
t2-72
III
t2-85
t3-88
t1-69
74
5.
Se prueba una hormona sinttica de la somatotropina bovina (STB), la cual
es inductora de la produccin de leche. Se prueba en un lote de vacas ceb con
edades de 3, 4 y 5 aos y con pesos de 400, 450 y 500 kg a 3 dosis diferentes de la
STB. Los resultados fueron los aumentos en la produccin de leche en Kg., siendo
estos:
Edad
Pesos
400
450
500
3
t1-0.5
t2-0.8
t3-1.2
4
t3-1.3
t1-1.6
t2-1.8
5
t2-2.0
t3-2.5
t1-2.5
Existen diferencias entre las diferentes Dosis de STB? Explique.
PRUEBAS DE ASOCIACIN
1.Una industria farmacutica prob Vo
curados
No
curados
un nuevo frmaco para el control de la
20
30
Machos
fiebre causado por el resfriado en 100
28
22
Hembras
ratones. Se est interesado saber si el
48
52
sexo influye en el metabolismo del
frmaco, para ello se dividi la poblacin equivalentemente obtenindose:
50
50
100
Vo
Hombres
Mujeres
Con
S.Down
19
23
42
Sin
S.Down
31
27
58
50
50
100
75
Rosa
de
Bengala
Positivo
Negativo
Positivo
6
2
8
Huixtla
Tapachula
Positivo
Negativo
Positivo
12
3
15
Rivanol
Negativo
6
11
17
12
13
25
Negativo
6
9
15
18
12
30
76
BIBLIOGRAFA
77