Está en la página 1de 10

ANLISIS DESCRIPTIVO DE LOS DATOS DE VARIABLES CUANTITATIVAS

3datos 2011

Variables CUANTITATIVAS

Nmeros con unidad de medida


(con un instrumento, o procedimiento, de medicin formal)

Nivel de Fetuna; LDL-Colesterol; HDL-Colesterol; Troponina; Mioglobina; CPK; Glucemia; Edad Menopausia, Nmero de Hijos; Tiempo de Hospitalizacin, de Recidiba, de Superviviencia; ; Glasgow; Barthel;

Ej.: Tasa cardiaca; Presin arterial; Fiebre (temp. corp.); ndice Tobillo/Brazo; IMC; Nmero de plaquetas;

ANLISIS DESCRIPTIVO 1
EXPLORACIN de datos outliers Su objetivo es comprobar si existen en la variable valores extraos (anmalos, atpicos) fuera del rango habitual en la poblacin de estudio

Grfico: diagrama de caja y bigotes (box-plot)

Estudio de la FORMA de la variable

Su objetivo es comprobar si la variable sigue, o no, el modelo de la distribucin NORMAL de la Campana de Gauss

ndices descriptivos de ASIMETRA y CURTOSIS Prueba (inferencial) de bondad de ajuste al modelo normal

Descriptiva de la CENTRALIDAD y la VARIABILIDAD

Su objetivo es explicar las caractersticas (el cmo son? ) de los sujetos en la variable medida

CENTRALIDAD: media; mediana VARIABILIDAD: desviacin tpica (estandar); amplitud semiintercuartil

Exploracin de outliers (diagrama box-plot = caja y bigotes)


Bigote superior. Se desplaza en funcin de la variabilidad hasta +3 d.t., por encima de la media. Llega hasta los percentiles 98-99, aprox. La CAJA contiene al 50% central de los casos. Por ello el lmite superior es el percentil 75 y el inferior el 25. La lnea central ms oscura es la mediana. P75 Md P25 Bigote inferior. Se desplaza en funcin de la variabilidad hasta 3 d.t., por debajo de la media. Alcanza entre los percentiles 1-2, aprox.

Ejemplo, resuelto con IBM-SPSS.19


220
220 34

34 200 211

Presin arterial sistlica

Sujetos OUTLIERS Casos OUTLIERS

211 200

Presin arterial sistlica

180

180

160

160

140

140

120

120

100

Lo ms adecuado es definirlos como valores perdidos

100 Varn Mujer

Sexo

Estudio de la forma: ajuste al modelo normal


La distribucin normal es un fenmeno natural que permite asociar probabilidades a cada valor de una variable cuantitativa Es importante determinar si una variable cuantitativa sigue, o no, un modelo de CURVA NORMAL

La distribucin normal de la variable es, frecuentemente, una condicin necesaria para la utilizacin de bastante tcnicas paramtricas especialmente de contraste de hiptesis

Anlisis estadstico
Herramientas DESCRIPTIVAS Procedimiento INFERENCIAL

ndice de

ndice de

Test de K-S (Kolmogorov-Smirnov)


de bondad de ajuste
Genera, un valor de p de significacin en funcin del cual, se toma la decisin de aceptar o rechazar que la variable no difiere significativamente del modelo normal

ASIMETRA

CURTOSIS

Generan, cada uno de ellos, un valor numrico que se interpreta bajo ciertas reglas (ver siguiente diapositiva)

ndice de

ASIMETRA
Asimetra Negativa

Grado de desviacin de la igualdad de distancias entre puntos con respecto al valor central (la mediana)

Tendencia Asimetra Neg.

Simtricas

Tendencia Asimetra Pos.

Asimetra Positiva

1
Mayora de casos en los valores altos de la variable

,500

0
Simetra perfecta

+,500

+1
Mayora de casos en los valores bajos de la variable

ndice de

CURTOSIS
Platicrtica

Altura de la curva hasta el eje de abscisas, medida en el valor central (la mediana). NO confundir con la altura mxima. Tendencia Platicrtica Tendencia Leptocrtica

Mesocrtica

Leptocrtica

,500

+,500

+1

Curvas bajas y muy anchas

Curvas estrechas y muy elevadas

Test de K-S (Kolmogorov-Smirnov)


de bondad de ajuste

Tcnica inferencial de tipo no-paramtrico, cuyo objetivo es contrastar la hiptesis de que una variable cuantitativa se acomoda el modelo de una distribucin normal

Hiptesis Nula: La variable se distribuye segn el modelo de la normal Hiptesis Alternativa: La variable NO se distribuye normalmente Se resuelve mediante Estadstico de contraste:

Recurdese que las hiptesis estadsticas aunque no se citan en las publicaciones cientficas, son necesarias para entender la decisin estadstica que se toma

Chi-cuadrado
(Transformado en Z equivalente)

Si p,010 A Ho Conclusin: La variable se distribuye segn el modelo de la normal Si p<,010 R Ho Conclusin : La variable NO se distribuye normalmente,
porque la distribucin emprica difiere significativamente del modelo Advertencia: Si el valor de la p de significacin est comprendido entre ,050 y ,010 (el 5% y el 1%) por lo que habitualmente se R Ho, el desvo de la normalidad NO es grave. El incumplimiento de la condicin de normalidad puede tener efectos de gravedad slo si p<,010 (<1%)

Y un recordatorio, para cuando usamos SPSS

5% 0,05 ,05 ,050

1% 0,01 ,01 ,010

Ejemplo, resuelto con IBM-SPSS.19


Estadsticos descriptivos N Estadstico Presin arterial sistlica Presin arterial diastlica N vlido (segn lista) 226 226 226 Mnimo Estadstico 100 50 Mximo Estadstico 210 110 Media Estadstico 139,11 77,56 Desv. tp. Estadstico 16,070 9,596 Asimetra Estadstico ,556 -,113 Error tpico ,162 ,162 Curtosis Estadstico 1,815 ,193 Error tpico ,322 ,322

Estadsticos descriptivos N Estadstico Presin arterial sistlica Presin arterial diastlica N vlido (segn lista) 224 224 223 Mnimo Estadstico 100 55 Mximo Estadstico 180 100 Media Estadstico 138,52 77,54 Desv. tp. Estadstico 14,868 9,208 Asimetra Estadstico ,027 -,199 Error tpico ,163 ,163 Curtosis Estadstico -,036 -,272 Error tpico ,324 ,324

Prueba de Kolmogorov-Smirnov para una muestra Presin arterial Presin arterial sistlica N Parmetros normalesa,b Media Desviacin tpica Diferencias ms extremas Absoluta Positiva Negativa Z de Kolmogorov-Smirnov Sig. asintt. (bilateral) a. La distribucin de contraste es la Normal. b. Se han calculado a partir de los datos. 224 138,52 14,868 ,124 ,110 -,124 1,862 ,002 diastlica 224 77,54 9,208 ,208 ,131 -,208 3,113 ,000

Descriptiva de: Centralidad y Variabilidad


CENTRALIDAD
Indicador de nivel colectivo del grupo en la variable medida

VARIABILIDAD
Indicador del grado de semejanza/desemejanza entre los casos del grupo

Media Mediana

Desviacin tpica (Varianza) Amplitud Semi-intercuartil

En funcin de la forma
Si la variable se distribuye normalmente Si la variable NO se distribuye normalmente

Media y Desv. Tpica

Mediana y Amp.Semi.

Estadsticos

Ejemplo, resuelto con IBM-SPSS.19


Descriptivos Estadstico Presin arterial sistlica Media Intervalo de confianza para la media al 95% Media recortada al 5% Mediana Varianza Desv. tp. Mnimo Mximo Rango Amplitud intercuartil Asimetra Curtosis Presin arterial diastlica Media Intervalo de confianza para la media al 95% Media recortada al 5% Mediana Varianza Desv. tp. Mnimo Mximo Rango Amplitud intercuartil Asimetra Curtosis Lmite inferior Lmite superior Lmite inferior Lmite superior 138,67 136,73 140,62 138,61 140,00 216,960 14,730 Error tp. ,986

Presin arterial sistlica N Media Mediana Desv. tp. Varianza Asimetra Error tp. de asimetra Curtosis
100 180 80 20 ,051 -,034 77,57 76,36 78,79 77,60 80,00 84,912 9,215 55 100 45 12 -,208 -,267 ,163 ,324 ,163 ,324 ,617

Presin arterial diastlica 224 68 77,54 80,00 9,208 84,788 -,199 ,163 -,272 ,324 55 100 70,00 80,00 82,00

Vlidos Perdidos

224 68 138,52 140,00 14,868 221,049 ,027 ,163 -,036 ,324 100 180

Error tp. de curtosis Mnimo Mximo Percentiles 25 50 75

130,00 140,00 150,00

Muchas gracias por su atencin

www.3datos.es