Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Manualestaditicaxcurso 120226090000 Phpapp02
Manualestaditicaxcurso 120226090000 Phpapp02
Prctico de
Estadstica Aplicada
a las Ciencias de la
Salud
Sociedad Cientfica de San Fernando
2011
NDICE
1. CREACIN DE VARIABLES E INTODUCCIN DE DATOS.
2. ANLISIS EXPLORATORIO.
2.1 Estudio de la normalidad de variables.
2.2 Transformacin de variables.
2.3 Seleccin de datos.
3. PRUEBAS ESTADSTICAS.
3.1 Variables cualitativas.
3.2 Variables cuantitativas Paramtricas.
3.3 Variables cuantitativas no Paramtricas.
4. Anlisis de supervivencia
4.1 Curvas de Kaplan Meier
4.2 Prueba de Long Rank
R. Valle
La segunda hoja se llama Vista de datos y permite la introduccin de cada uno de los datos
recolectados, estos se completarn segn las caractersticas dadas a la variable en la seccin
anterior.
R. Valle
En el caso de variables cualitativas se tiene que colocar en Tipo de variable la opcin cadena y
dar Valores a cada variable, por ejemplo si la variable es Comorbilidad los valores sern 1=
Presente, 2= Ausente. Finalmente se define la escala en la que se quiere medir (Nominal,
ordinal). En el caso de las variables cuantitativas es ms sencillo se tiene que colocar el nmero de
decimales con que se desea trabajar y en la seccin de medida siempre marcamos la opcin de
escala
De esta forma se irn introduciendo cada una de las variables, y posteriormente cada uno de sus
datos.
Tambin se puede importar base de datos desde otros programas, por ejemplo el Exel, para lo cual
se va a la pestaa Abrir datos y posteriormente se remarca la opcin TIPO de archivo, aqu
escogemos la opcin Excel (*xls) y luego marcamos la ubicacin donde se encuentra el archivo.
Para fines de la presente prctica trabajaremos con la base de datos de un estudio titulado:
Consumo materno de un complejo multivitamnico y su efecto en el estado y peso al nacer de
neonatos en un hospital de la ciudad de Lima. El estudio consisti en suminitrar a las madres un
complejo multivitamnico para que sea tomado durante los 30 das siguientes al diagnstico del
embarazo, se trabaj con 200 madres y posteriormente se tomaron los datos del neonato, las
variables evaluadas se observan en la siguiente tabla.
R. Valle
VARIABLE
ETIQUETA
VALORES
ESCALA
Edad _ madre
Edad de la madre
Aos
Razn
(escala)
Das
Razn
(escala)
Das de
Dias_Tx
tratamiento
1= Si
Comorbilidades
Comorbilidades
Nominal
2= No
1=Ausente
FR
Factores de riego
2=Tabaco
Nominal
3=Alcohol
1= Primigesta
Gravidez
Gravidez
2=Segundagesta
Ordinal
3= Multigesta
Edad_Gestacional
Edad gestacional
Semanas
Razn
(escala)
Peso_nacimiento
Peso de nacimiento
Aos
Razn
(escala)
Estado_nacer
Estado al nacer
1= Vigoroso
Ordinal
2=Deprimido
1=Incompleto
Est_escolares
Estudios escolares
Nominal
2=Completo
R. Valle
HB1_Madre
Nivel de
hemoglobina al
inicio
mg/dl
Razn
(escala)
HB2_Madre
Nivel de
hemoglobina al final
mg/dl
Razn
(escala)
2.Anlisis exploratorio
Es el procedimiento que permite una visualizacin general de los datos y conocer las caractersticas
de su distribucin. Se realiza previo al anlisis definitivo de los datos. Objetivos:
Determinar el tipo de distribucin de las variables.
Codificacin y recuento de datos ausentes.
Evaluar la calidad y la consistencia de los datos.
Mostrar datos atpicos.
Anlisis exploratorio de variables cualitativas. Nos dirigimos a la opcin: Analizar>>Estadsticos
descriptivos>>Frecuencias
En la
pantalla aparecer una ventana en la cual colocamos las variable que queremos analizar, si
marcamos la opcin Grficos obtendremos una segunda ventana en la cual podemos escoger el
tipo de grfico, asi como la forma de presentacin. Finalmente damos aceptar y se abrir una nueva
ventana con los resultados del anlisis.
R. Valle
R. Valle
R. Valle
N
Parmetros normales
Media
Desviacin tpica
Z de Kolmogorov-Smirnov
Sig. asintt. (bilateral)
Edad de
la madre
200
27.43
6.372
1.118
.164
R. Valle
Para desarrollar un grfico P-P nos dirigimos a Analizar>>Estadsticas descriptivas>>Grfico PP. Dentro de la opcin, distribucin de contraste tambin seleccionamos: NORMAL
R. Valle
R. Valle
En la nueva ventana
sealamos la variable
que va a funcionar
como
condicional
(comorbilidad) y luego
escogemos el valor de
la variable que va a
servir para seleccionar
los casos. Como en el
presente caso queremos
trabajar con las madres
sanas marcamos
el
valor 2 (comorbilidad
ausente) y le damos
continuar.
R. Valle
3. Pruebas estadsticas
3.1 VARIBLES CUALITATIVAS
3.1.1 Prueba Chi cuadrado
Esta prueba se utiliza para probar asociacin estadstica entre variables cualitativas, en todos los
casos se trata de comparar los valores observados y esperados. Esta prueba utiliza las tablas de
contigencia
Comparacin de proporciones o frecuencias de dos o ms grupos.
Para mostrar la asociacin entre 2 variables.
Recomendaciones:
Si n> 40 se usa X2 corregido por continuidad.
Si n se esta entre 20 y 40 se usa X2 en el caso que todas las frecuencias esperadas sean 5.
Si n< 20 no se usa X2. Se utiliza la prueba exacta de Fisher.
Para desarrollar esta seccin, nos haremos la siguiente pregunta: La comorbilidad materna influye
en el estado de nacimiento del neonato?
H0: El estado de nacimiento del neonato es independiente de la comorbilidad de la madre.
H1: El estado de nacimiento del neonato NO es independiente de la comorbilidad de la madre.
Nos dirigimos a Analizar>>Tablas de contigencia. Se abre una ventana donde seleccionamos las
variables a analizar y para analizar las variables aplicando el X2 nos dirigimos a Estadsticos.
R. Valle
El valor P en la prueba X2, es menor de 0.05 por lo tanto se rechaza la Ho y se acepta la alterna. El
OR (razn de ventajas) es de 2.76 y es significativo
pues su intervalo no incluye a la unidad.
Estimacin de riesgo
Valor
Comorbilidad
Total
Presente
Ausente
Estado al ancer
Deprimido
vigorozo
49
16
71
64
120
80
Total
65
135
200
2.761
1.430
5.329
1.433
1.160
1.772
.519
.327
.823
200
Pruebas de chi-cuadrado
Chi-cuadrado de Pearson
Correccin por
a
continuidad
Razn de verosimilitudes
Estadstico exacto de
Fisher
Asociacin lineal por
lineal
N de casos vlidos
Sig. asinttica
(bilateral)
.002
8.571
.003
9.869
.002
Valor
9.497b
9.449
gl
Sig. exacta
(bilateral)
Sig. exacta
(unilateral)
.002
.001
.002
200
R. Valle
Intervalo de confianza
al 95%
Inferior
Superior
2. Unilateral:
H0: La proporcin en la poblacin 1 es menor o igual que en la proporcin en la poblacin2, p1p2.
H1: La proporcin en la poblacin 1 es mayor que en la proporcin en la poblacin2, p1>p2.
Estadsticos de grupo
Edad de la madre
Factotores de riesgo
Ausentes
Tabaco
N
136
48
Media
28.49
25.08
Desviacin
tp.
6.080
6.568
Error tp. de
la media
.521
.948
F
Edad de la madre
R. Valle
Se han asumido
varianzas iguales
No se han asumido
varianzas iguales
Sig.
.656
.419
gl
Sig. (bilateral)
Diferencia
de medias
Error tp. de
la diferencia
95% Intervalo de
confianza para la
diferencia
Inferior
Superior
3.270
182
.001
3.409
1.043
1.352
5.466
3.151
77.263
.002
3.409
1.082
1.255
5.564
Par 1
R. Valle
Nivel de Hb al inicio
Nivel de Hb al final
Media
10.878
12.1095
N
200
200
Desviacin
tp.
1.0441
.96145
Error tp. de
la media
.0738
.06798
Media
Par 1
Nivel de Hb al inicio
- Nivel de Hb al final
-1.23140
Desviacin
tp.
1.26643
Error tp. de
la media
.08955
95% Intervalo de
confianza para la
diferencia
Inferior
Superior
-1.40799
-1.05481
t
-13.751
gl
Sig. (bilateral)
199
.000
3.2.3 Anova
Esta prueba permite comparar las medias de 3 o ms grupos, se realiza a travs del anlisis de la
varianza y bsicamente nos dice si los grupos son iguales o diferentes respecto a sus promedios.
Analiza la diferencia entre la variacin de cada individuo y la media de su grupo y la variacin entre
la media de cada grupo y la media global.
En este caso, queremos saber si la gravidez (primigesta, segundagesta, multigesta) de la mujer
influye en el peso del producto, por lo que trabajamos con la variables gravidez y peso del neonato.
Ho: El peso promedio de los neonatos es similar en los grupos de gravidez.
Ha: El peso promedio de los neonatos es diferente en los grupos de gravidez.
Primero analizamos si la variable peso del neonato presenta o no una distribucin normal. De ser
asi, entonces podemos utilizar la prueba. Analizar>>Comparar medias>>Anova. En la nueva
ventana seleccionamos las variables a contrastar, y en la seccin de factor colocamos la variable que
va a formar los grupos de comparacin (gravidez), Para obtener los valores descriptivos del anlisis
seleccionamos opciones y marcamos esta opcin.
Descriptivos
R. Valle
Descriptivos
ANOVA
Peso de nacimiento
Peso de nacimiento
N
Primigesta
Segundagesta
Multigesta
Total
82
40
78
200
Media
2.9598
3.0900
2.9526
2.9830
Inter-grupos
Intra-grupos
Total
Suma de
cuadrados
.575
82.388
82.962
gl
2
197
199
Media
cuadrtica
.287
.418
Sig.
.504
.687
R
.069a
R cuadrado
.005
R cuadrado
corregida
.000
Error tp. de la
estimacin
6.373
R. Valle
Peso de nacimiento
3.00
2.00
4.00
20
30
40
Edad de la madre
R. Valle
Estadsticos de contrastea
U de Mann-Whitney
W de Wilcoxon
Z
Sig. asintt. (bilateral)
Edad
gestacional
4284.000
7524.000
-1.338
.181
Das de tratamiento
Estado al nacer
Deprimido
vigoroso
Total
R. Valle
Media
21.53
21.76
21.63
N
120
80
200
Desv. tp.
7.436
8.046
7.667
Rangos
Das de tratamiento
Peso 2
Bajo peso
Buen peso
Macrosmico
Total
N
55
137
8
200
Rango
promedio
87.43
107.62
68.50
Chi-cuadrado
gl
Sig. asintt.
Das de
tratamiento
7.422
2
.024
En este caso, el anlisis no libera el promedio de das de tratamiento en cada uno de los grupos. Por
lo tanto procedemos como en el caso anterior ANALIZAR>> COMPARAR MEDIAS>>MEDIAS.
Luego escogemos las variables a analizar.
Das de tratamiento
Peso 2
Bajo peso
Buen peso
Macrosmico
Total
R. Valle
Media
19.65
22.68
17.13
21.63
N
55
137
8
200
Desv. tp.
8.269
7.272
6.379
7.667
4. Anlisis de supervivencia
4.1 Kaplan y Meier
Es un anlisis que analiza los tiempos en que se presentan los eventos, en lugar de los eventos
propiamente dichos. El desarrollo del anlisis requiere definir el tiempo de seguimiento, el evento y
la censura
Tiempo de seguimiento (tiempo de falla): Es una variable cuantitativa y corresponde al periodo
correspondiente desde que el paciente ingresa a evaluacin hasta que ocurre el evento de inters.
Evento: Es la situacin de inters que se evala, ejemplos: muerte, cura, accidente, etc.
Censura: Es el sujeto que no presento el evento de inters, pudiendo ser porque fue perdido, retirado
del seguimiento o porque no termino el estudio.
Con motivo de la prctica, la variable tiempo de supervivencia es una variable cuantitativa con
escala de medicin de escala y la variable resultado (cualitativa) abarca los valores de evento o
censura. Accedemos de la siguiente manera: ANALISIS>>SUPERVIVENCIA>>KAPLAN MEIR
En la nueva ventana, tenemos que definir la seccin de tiempo y estado, en esta ltima seccin
seleccionamos la opcin Definir evento con la finalidad de identificar el evento de inters con el
numero que lo representa (La variable Resultado tiene 2 valores: 0 censura y 1 evento).
R. Valle
En la ventana de resultados aparecen una tabla de supervivencia que describe el proceso segn cada
sujeto estudiado, y el tiempo que aporta al anlisis hasta la ocurrencia del evento.
R. Valle
Los resultados nos muestran un anlisis descriptivo de las variable, asi como el resultado del long
rang con su valor de significancia.
R. Valle
El grafico muestra las curvas de supervivencia para el grupo que recibi el tratamiento A(lnea
verde) y B(lnea azul), al evaluar el valor de P con la prueba de Long Rank vemos que estos son
estadsticamente diferentes(0.002) lo cual tambin se observa en el grfico.
R. Valle