Está en la página 1de 27

ANALISIS DESCRIPTIVO DE VARIABLES

CUANTITATIVAS
DOCENTE: ESPERANZA GARCA CRIBILLEROS
Ejemplo 1:
En la prctica del curso de Bioestadstica, en el II Semestre Acadmico del 2001,
los estudiantes del tercer ao de enfermera llenaron una pequea encuesta. Entre
otros datos contabilizaron el nmero de respiraciones por minuto en situacin de
reposo. Se desea saber la media de las respiraciones de los estudiantes. Los
datos se presentan a continuacin:
Qu Hago?
Cmo lo hago?
19 19 17 20 16 14 20 21 16 15 20 20 16
24 19 19 20 18 20 15 18 18 16 22 24 17
16 20 20 17 20 20 22 20 18 20 18 16 22
24 16 24 15 19 20 20 15 21 23 21 24 24
20 24 18 17 18 18 20 17 22 17 16 19 21
14 22 21 22 19 21 18 26 18 16 17 21 17
20 23 28 22 23 18 16 24 22 20 18 22 20
20 19 21 21 20 22 13
ANALISIS DESCRIPTIVO DE VARIABLES
CUANTITATIVAS
Primeramente se realiza un anlisis exploratorio de los datos
para:
1. Evaluar su calidad.
2. Observar la simetra o no de la distribucin.
3. Determinar las medidas de resumen.
7 N =
DIASHOSP
14
12
10
8
6
4
2
0
29 24 19 14
20
10
0
RESPIRACIONES
ESTUDIANTES SEGUN RESPIRACIONES
N
4 0 0000
6 0 99
9 1 000
(3) 1 999
8 2 00
6 2 99
4 3 00
2 3 9
1 4 0
MEDIDAS DE RESUMEN PARA VARIABLES
CUANTITATIVAS
MEDIDAS DE TENDENCIA CENTRAL: MEDIA ARITMTICA
MEDIANA
MODA
MEDIDAS DE DISPERSIN: RANGO
VARIANZA
DESVIACION ESTANDAR
COEFICIENTE DE VARIACION
DESVIACION CUARTILAR
OTRAS MEDIDAS : PERCENTILES
CUARTILES
MEDIDAS DE TENDENCIA CENTRAL
DEFINICIN:
Son valores que indican el centro de la distribucin de los datos.
Es el valor representativo de estos. Las ms usadas son: la
media aritmtica o promedio, la mediana y la moda.

Me
Me
MEDIA ARITMETICA:
Medida descriptiva de tendencia central, llamada tambin
promedio. Resulta de sumar los valores de todas las
observaciones y dividir la sumatoria entre el total de ellas.
a)A partir de una muestra (estadstica) ; b) A partir de una poblacin
(parmetro)
n
x x x x
n
x
x
n i
+ + + +
= =

...
3 2 1
N
x
i

=
Se caracteriza por ser:
nica
Fcil de calcular
Es afectada por todos los datos.
Donde: N es la poblacin
n es la muestra
x
i
los valores de la variable,
x
1,
x
2,
x
3,
x
n
es la media. x
PASOS PARA CALCULAR LA MEDIA:
1. Verificar la simetra de los datos:
Se observa que los datos aproximadamente
siguen una distribucin simtrica.
N
x
i

=
=
+ + +
= nes respiracio 5 . 19
98
13 ... 19 19
minuto
29.5 26.5 23.5 20.5 17.5 14.5 11.5
40
30
20
10
0
respiraciones
F
r
e
q
u
e
n
c
y
19 19 17 20 16 14 20 21 16 15 20 20 16
24 19 19 20 18 20 15 18 18 16 22 24 17
16 20 20 17 20 20 22 20 18 20 18 16 22
24 16 24 15 19 20 20 15 21 23 21 24 24
20 24 18 17 18 18 20 17 22 17 16 19 21
14 22 21 22 19 21 18 26 18 16 17 21 17
20 23 28 22 23 18 16 24 22 20 18 22 20
20 19 21 21 20 22 13
Contraste de Kolmogorov-Smirnov
One-Sample Kolmogorov-Smirnov Test
98
19.48
2.847
.113
.101
-.113
1.122
.161
N
Mean
Std. Deviation
Normal Parameters
a,b
Absolute
Positive
Negative
Most Extreme
Differences
Kolmogorov-Smirnov Z
Asymp. Sig. (2-tailed)
respiraciones
por minuto
Test distribution is Normal.
a.
Calculated from data.
b.
Los alumnos tuvieron en promedio 19.5 respiraciones por minuto.
Ejemplo 2: Se seleccion una muestra de 20 alumnos para
calcular el promedio de las respiraciones en las mismas
condiciones. Los datos se presentan a continuacin.
24 23 22 21 20 19 18 17 16
4
3
2
1
0
respiraciones n
F
r
e
q
u
e
n
c
y
RESPIRACIONES DE 20 ALUMNOS 05 . 20
20
401
20
23 ... 16 19
= =
+ + +
= =

n
x
x
i
INTERPRETACION: Los alumnos tuvieron
en promedio 20.5 respiraciones por
minuto.
INTERPRETACION: Los alumnos tuvieron
en promedio 20.5 respiraciones por
minuto.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
19 16 20 22 21 24 23 19 22 17 20 20 20 21 18 22 18 17 19 23
10
MEDIANA:
Es el valor que divide al conjunto ordenado de datos en dos grupos de igual tamao
en cuanto al nmero de observaciones se refiere.
Es nica, fcil de calcular y los valores extremos no afectan su valor.
Pasos:
1. Los datos se ordenan en forma creciente: x
1
+ x
2
++x
n
2. Calcular la mediana teniendo en cuenta:
a) Si n es par: con la frmula
2
1
2 2
+
+
=
n n
x x
Me Donde: Me es la mediana
es el valor de la variable en esa posicin
n es el tamao de la muestra
n/2 es la posicin del dcimo valor
(n/2)+1 es la posicin del valor dcimo primero
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
16 17 17 18 18 19 19 19 20 20 20 20 21 21 22 22 22 23 23 24
Me
20
2
20 20
=
+
= nes respiracio Me
Orden
INTERPRETACIN: El 50% de los alumnos tuvieron 20 respiraciones o menos y el
otro 50% , 20 respiraciones o ms.
b) Si n es impar:
2
1 +
=
n
Me

posicin Me 11
2
1 21
=
+
=
Podemos decir que la mediana se encuentra en el onceavo lugar, el
valor es 20.
Me
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21
Serie ordenada
16 17 17 18 18 19 19 19 20 20 20 20 21 21 22 22 22 23 23 24 25
MODA:
Valor ms frecuente en el conjunto.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Serie ordenada 16 17 17 18 18 19 19 19 20 20 20 20 21 21 22 22 22 23 23 24
Mo
MEDIDAS DE DISPERSIN:
Miden la variabilidad de un conjunto de datos.
1. Rango ( R )
2. Varianza : s
2
;
3. Desviacin estndar: s,
4. Coeficiente de variacin: CV.
5. Desviacin cuartilar: Q

RANGO:
Diferencia entre el valor mximo y mnimo de un conjunto de datos.
La siguiente serie corresponde a las edades aos de una muestra de
11 nios.
R= 26 2 = 24
mnimo x mximo x R =
26 24 21 17 15 14 11 8 6 5 2

VARIANZA:
Es la medida que cuantifica la variabilidad de los datos respecto al valor de la
media.
Usos:
1. En inferencia estadstica
2. Para calcular la desviacin
estndar.
3. Para calcular el tamao de
muestra.
( ) ( ) ( )
( )
1 1
...
2
2 2
2
2
1
2

+ + +
=

n
x x
n
x x x x x x
n
s
Donde:
x
i
valores de la variable, x
1
, x
2
, ., etc.
n nmero de observaciones de la muestra
es la media aritmtica
x

PASOS PARA CALCULAR LA VARIANZA:


Ejemplo:
Los datos de la siguiente tabla son los mismos que se usaron para el clculo
de las medidas de tendencia central.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
19 16 20 22 21 24 23 19 22 17 20 20 20 21 18 22 18 17 19 23

24
23
22
21
20
19
18
17
16
r
e
s
p
i
r
a
c
i
o
n
e
s

n
RESPIRACIONES DE 20 ALUMNOS
Q3
Me
Q1
1. Verificar si los datos siguen una distribucin simtrica
2. Calcular la media:
05 . 20
20
401
20
23 ... 16 19
= =
+ + +
= =

nes respiracio
n
x
x
i
3. Calcular la varianza:
2
2 2 2
2
893 . 4
1 20
) 05 . 20 23 ( ... ) 05 . 20 16 ( ) 05 . 20 19 (
nes respiracio s =

+ + +
=
0 ) ( =

x x
i
Propiedad de la media, por
eso se eleva al cuadrado
One-Sample Kolmogorov-Smirnov Test
20
20.05
2.212
.111
.109
-.111
.496
.966
N
Mean
Std. Deviation
Normal Parameters
a,b
Absolute
Positive
Negative
Most Extreme
Differences
Kolmogorov-Smirnov Z
Asymp. Sig. (2-tailed)
respiraciones
x minuti
(muestra)
Test distribution is Normal.
a.
Calculated from data.
b.
DESVIACION ESTANDAR:
Es la raz cuadrada positiva de la varianza. Mide la variabilidad de los datos en las
unidades en que se midieron originalmente. Los smbolos son: s, si es una
muestra y ; si es una poblacin.
Caractersticas de la desviacin estndar:
1. Siempre es un valor positivo
2. Est influenciada por todos los valores de la muestra o poblacin.
3. Mayor influencia ejercen los valores extremos debido a que son elevados al
cuadrado en el clculo.
4. Sirve para definir la dispersin de los datos alrededor de la media.
2
s s =

= = nes respiracio s 21 . 2 893 . 4


Aproximadamente el 68% de los alumnos
tuvieron 20.052.21 respiraciones.
Desviacin media:
Es el promedio de las diferencias entre las observaciones y su
media sin tomar en cuenta el signo.
23 19 17 18 22 18 21 20 20 20 17 22 19 23 24 21 22 20 16 19
20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2 1
76 . 1
20
) 05 . 20 23 ... ) 5 . 20 16 ( ) 05 . 20 19 (
=
+ + +
= DM
En promedio, las respiraciones se dispersan alrededor de la
media en 1.76 respiraciones por minuto.
( )
n
x x
DM
i


=
3.57 6 B
1.31 6 A
Desviacin Estndar Varianza Media Grupo
Tabla 1. Medidas Descriptivas de las Edades de
dos Grupos
COEFICIENTE DE VARIACIN:
Medida de variabilidad relativa: Se usa para comparar la variabilidad entre dos o
ms muestras medidas en las mismas unidades o no.
% 02 . 11 100
05 . 20
21 . 2
100 = = =
x
s
CV
Si el coeficiente es:
< 10 % poca dispersin
10 33% aceptable
34 50% alta dispersin
> 50% muy alta
til cuando se quieren comparar
el efecto de un tratamiento en
dos o ms grupos.
OTRAS MEDIDAS: PERCENTILES Y CUARTILES
QUARTILES:
Son 3 valores que dividen al conjunto de datos ordenados en forma
ascendente en 4 partes iguales. Primer (Q1); segundo (Q2) y tercer
(Q3) cuartil. A cada uno de ellos corresponde 25 % de los datos.
25% 25% 25% 25%
Q1
Q2 Q3
Cada seala un porcentaje igual o menor del conjunto de datos
FORMULAS PARA CALCULAR LA POSICIN DEL CUARTIL
RESPIRACIONES DE LOS ALUMNOS DE TERCER
AO DE ENFERMERIA. 2001
13 16 17 18 19 20 20 21 22 24
14 16 17 18 19 20 20 21 22 24
14 16 17 18 19 20 20 21 22 24
15 16 17 18 19 20 20 21 22 24
15 16 17 18 19 20 20 22 22 24
15 16 18 18 20 20 21 22 23 24
15 16 18 18 20 20 21 22 23 26
16 17 18 19 20
20
20 21 22 23 28
16 17 18 19
20
20 21 22 24
16 17 18 19 20 20 21 22 24
Q
1
=17
Q
3
=21.25
4
1
1
+
=
n
Q
4
) 1 ( 3
3
+
=
n
Q
Donde: Q
1
es el cuartil 1
n tamao de muestra =98
Q
1
= 24.75
Q
3
= 74.25 Posicin
Valor de Q
3
= 21+ 0.25(22-21) = 21.25
Q
3
Q
2
=Me
Q
1
Usos de los cuartiles:
Para indicar el porcentaje igual o menor que el valor de un cuartil
Para construir la curva endmica
Para describir el 50% central de las observaciones
Elaboracin del grfico de caja.
GRAFICO DE CAJ A
GRAFICO DE CAJ A
RESPIRACIONES DE LOS ALUMNOS DEL TERCER AO DE
ENFERMERIA, UNMSM, 2002.
30
10
15
20
25
0
Q1
M e
Q3
Percentiles:
99 valores que dividen a un conjunto de datos en 100 partes iguales.
Indica el porcentaje de la distribucin igual o menor a su valor.
13 16 17 18 19 20 20 21 22 24
14 16 17 18 19 20 20 21 22 24
14 16 17 18 19 20 20 21 22 24
15 16 17 18 19 20 20 21 22 24
15 16 17 18 19 20 20 22 22 24
15 16 18 18 20 20 21 22 23 24
15 16 18 18 20 20 21 22 23 26
16 17 18 19 20
20
20 21 22 23 28
16 17 18 19
20
20 21 22 24
16 17 18 19 20 20 21 22 24
( )
25 . 74
100
1 75
75
=
+
=
n
P
Valor del percentil 75 es: 21+0.25(22-21) = 21.25.
P
75
=21.25
El 75% de los estudiantes tuvieron 21.25 respiraciones o menos
RESPIRACIONES DE LOS ALUMNOS DE TERCER AO DE
ENFERMERIA. 2001
Uso de los percentiles:
Para comparar un valor de un individuo con un conjunto de
normas.
Para determinar Rangos normales de anlisis de laboratorio .Los
lmites normales de muchos anlisis se ubican entre el percentil
2.5 y 97.5 .
Tambin se usa para establecer el rango intercuartlico.
1. Porqu se usa la media junto con la desviacin estndar en el
anlisis de datos?
Se quiere expresar una medida que represente a todos los datos
(media) pero al mismo tiempo se desea expresar la variacin de los
mismos respecto a esa medida de tendencia central.
2. Cul es la medida que expresa la homogeneidad de un conjunto de
datos?
El coeficiente de variacin
3. Cul es la ventaja de calcular medidas de resumen con los datos sin
agrupar?
La mayor exactitud de stas.
fin