Está en la página 1de 9

AUPSJB Laboratorio Bioestadstica, Ao 2013-I Facultad de Ciencias de la Salud Escuela Profesional de Medicina Humana Curso: Bioestadstica

LABORATORIO N 06 TEMA : MEDIDAS DE DISPERSION O DE VARIABILIDAD 1 ) Introduccin:


En el anlisis de datos biomdicos puede presentarse en el anlisis. El anlisis de dispersin o de variabilidad es la parte medular en la estadstica descriptiva. Objetivo: El estudiante debe saber determinar las varianzas de cada variable biomdica mediante los software estadstico SPSS Vs 19.0, y Excel. Interpretar la variabilidad de los datos en estudio y su importancia en las interpretaciones. Determinar las graficas de dispersin e interpretarlas. despus de agrupar clasificar, ordenar interpretar las verticales y horizontales que frecuencias. Se estudia la variabilidad de los datos y los sesgos

Las medidas de dispersin, tambin llamadas medidas de variabilidad, muestran la variabilidad de una distribucin de los datos en estudio, indicando por medio de un nmero, si las diferentes puntuaciones de una variable estn muy alejadas de la media. Cuanto mayor sea ese valor, mayor ser la variabilidad, cuanto menor sea, ms homognea ser a la media. As se sabe si todos los casos son parecidos o varan mucho entre ellos. Para calcular la variabilidad de las observaciones en estudio se usa:

2 ) Varianza
La varianza (tambin denominada variancia, aunque esta denominacin es menos utilizada) es una medida estadstica que mide la dispersin de los valores respecto a un valor central (media), es decir, la media de las diferencias cuadrticas de las

Bioestadstica I

Ao 2013-

AUPSJB Laboratorio Bioestadstica, Ao 2013-I

puntuaciones respecto a su media aritmtica. Suele ser representada con la letra griega

o una V (x)

cuando la variables en estudio es X . y cuando se refiere a la poblacin.

2 =

(X
i =1

)2
Varianza poblacional ; Ec. (2.1)

Propiedades

La varianza es siempre positiva o 0:

2.1 ) Desviacin tpica


La varianza a veces no se interpreta claramente, ya que se mide en unidades cuadrticas. Para evitar ese problema se define otra medida de dispersin, que es la desviacin tpica, o desviacin estndar, que se halla como la raz cuadrada positiva de la varianza. La desviacin tpica informa sobre la dispersin de los datos respecto al valor de la media; cuanto mayor sea su valor, ms dispersos estarn los datos. Esta medida viene representada en la mayora de los casos por S, dado que es su inicial de su nominacin en ingls.

Desviacin tpica muestral ejemplo

Desviacin tpica poblacional Es la raz cuadrada de la ecuacin ( 2.1)


= 2

Bioestadstica I

Ao 2013-

AUPSJB Laboratorio Bioestadstica, Ao 2013-I

3) Varianza muestral
En muchas situaciones es preciso estimar la varianza de una poblacin a partir de una muestra. Si se toma una muestra de n valores de la poblacin , se puede dar el caso que la muestra sea pequeo o grande , entonces existen dos casos a considerar.

S2 =

( X
i =1

X )2

; cuando n > 30

Cuando n < 30

Cuando los datos estn agrupados:

(Cuando est dividido por n y cuando lo est por n-1) se los denomina varianza muestral. Difieren ligeramente y, para valores grandes de n, la diferencia es irrelevante. El primero traslada directamente la varianza de la muestra al de la poblacin y el segundo es un estimador insesgado de la varianza de la poblacin.

4 ) COEFICIENTE DE VARIACIN
En estadstica el coeficiente de variacin (de Pearson), es una medida de dispersin til para comparar dispersiones a escalas distintas pues es una medida invariante ante cambios de escala. Sirve para comparar variables o grupos que estn a distintas escalas pero que estn correlacionadas estadsticamente y sustantivamente con un factor en comn. Es decir, ambas variables tienen una relacin causal con ese factor. Su frmula expresa la desviacin estndar como porcentaje de la media aritmtica, mostrando una mejor interpretacin porcentual del grado de variabilidad que la desviacin tpica o estndar. Por otro lado presenta problemas ya que a diferencia de la

Bioestadstica I

Ao 2013-

AUPSJB Laboratorio Bioestadstica, Ao 2013-I

desviacin tpica este coeficiente es variable ante cambios de origen. Por ello es importante que todos los valores sean positivos y su media de por tanto un valor positivo. A mayor valor de C.V. mayor heterogeneidad de los valores de la variable; y a menor C.V., mayor homogeneidad en los valores de la variable. Suele representarse por medio de las siglas C.V.. Exigimos que: Se calcula:
C.V . = S x100 X

5) ASIMETRA
Esta medida nos permite identificar si los datos se distribuyen de forma uniforme alrededor del punto central (Media aritmtica). La asimetra presenta tres estados diferentes ( ver figura), cada uno de los cuales se define de forma concisa como estn distribuidos los datos respecto al eje de asimetra. Se dice que la asimetra es positiva cuando la mayora de los datos se encuentran por encima del valor de la media aritmtica, la curva es Simtrica cuando se distribuyen aproximadamente la misma cantidad de valores en ambos lados de la media y se conoce como asimetra negativa cuando la mayor cantidad de datos se aglomeran en los valores menores que la media.

mide la deformacin horizontal.

Para medir el nivel de asimetra se utiliza el llamado Coeficiente de Asimetra, viene definido:

As = X X
I

mo

Bioestadstica

Ao 2013-

AUPSJB Laboratorio Bioestadstica, Ao 2013-I

Los resultados pueden ser los siguientes: As = 0 (distribucin simtrica; existe la misma concentracin de valores a la derecha y a la izquierda de la media) As > 0 (distribucin asimtrica positiva; existe mayor concentracin de valores a la derecha de la media que a su izquierda) As < 0 (distribucin asimtrica negativa; existe mayor concentracin de valores a la izquierda de la media que a su derecha)

6) CURTOSIS El Coeficiente de Curtosis analiza el grado de concentracin que presentan los valores alrededor de la zona central de la distribucin. Mide la deformacin vertical. Se definen 3 tipos de distribuciones segn su grado de curtosis: a) Distribucin mesocrtica: presenta un grado de concentracin medio alrededor de los valores centrales de la variable (el mismo que presenta una distribucin normal). b) Distribucin leptocrtica : presenta un elevado grado de concentracin alrededor de los valores centrales de la variable.

c) Distribucin platicrtica: presenta un reducido grado de concentracin alrededor de los valores centrales de la variable.

El Coeficiente de Curtosis viene definido por los cuartiles y con la siguiente frmula:

Bioestadstica I

Ao 2013-

AUPSJB Laboratorio Bioestadstica, Ao 2013-I

FORMULA K = (Q3 Q1) /( 2 ( P90 P10)) Los resultados pueden ser los siguientes: K = 0 (distribucin mesocrtica) . K > 0 (distribucin leptocrtica ). K < 0 (distribucin platicrtica) . EJEMPLO TABLA 2.1 Distribucin de frecuencias de nmeros de hijos por
familia ( solucin en Excel) o manualmente

0 1 2 3 4 total

3 4 8 6 2 23

0 4 16 18 8 46

Aplicando la formula tenemos:

y = M ( y) =

y f
i =1

i i

46 =2 23

yi 0 1 2 3 4 total

fi yf 3 0 4 4 1 8 6 1 6 8 2 8 2 3

(y ) -2 -1 0 1 2

(y )2 4 1 0 1 4

f(y -

y
2 12 4 0 6 8 30

Bioestadstica I

Ao 2013-

AUPSJB Laboratorio Bioestadstica, Ao 2013-I

varianza S2

1.30

Interpretacin: S2 = 1.30 es la variabilidad de las observaciones de numero de hijos por familia respecto a la su media. La distribucin de nmeros de hijos por familia no es tan disperso.

7 ) CATIVIDADES ACADEMICAS 7.1 ) TAREA 01:


las varianzas y Coeficiente de variacin de las puntuaciones

Determinar

de exmenes obtenidas por 15 estudiantes de medicina de la UJB : GRUPO MA 15 16 10 14 19 16 08 16 13 10 20 18 16 18 11 11 13 10 14 02 16 08 16 11 10 20 14 16 19

GRUPO TB
12

a) Interpretar las varianzas obtenidas por grupos separados. b) Que grupo tiene mejor variabilidad en sus puntuaciones?

7.2 )
Teniendo

TAREA 02:
en cuenta los datos del archivo EVALUACIN

PROFESIONALES.sav (laboratorio n 3) que corresponde a un estudio echo en base a una muestra de 200 profesionales, se construyo la siguiente tabla para la variable ESTATURA:

Tabla N 01
i 1

y 'i 1 , y 'i
1.50,1.55

yi
1.525

fi
9

Fi
9

hi
0.045

Hi
0.045

hi 100%
4.5

H i 100%
4.5

Bioestadstica I

Ao 2013-

AUPSJB Laboratorio Bioestadstica, Ao 2013-I


2 3 4 5 6 7 8 9

1.55,1.60

1.575 1.625 1.675 1.725 1.775 1.825 1.875 1.925

20 54 44 38 16 10 5 4 200

29 83 127 165 181 191 196 200

0.100 0.270 0.220 0.190 0.080 0.050 0.025 0.020

0.145 0.415 0.635 0.825 0.905 0.955 0.980 1.000

10.0 27.0 22.0 19.0 8.0 5.0 2.5 2.0

15 42 64 83 91 96 98 100

1.60,1.65
1.65,1.70

1.70,1.75
1.75,1.80

1.80,1.85
1.85,1.90

1.90,1.95
TOTAL

a) Determinar la varianza y la desviacin estndar , interpretar

b) La estatura se distribuye simtricamente , (calcular de la tabla tabulada )

7.3 ) TAREA N 03

7.3.1USANDO SPSS (USAR BASE DE DATOS: EVALUACION DE PROFESIONALES. SAV )

a) Determinar la varianza de los PESO y EDAD

b) Determinar si los datos PESO y EDAD son simtricos

c) Determinar la curtosis de los datos PESO y EDAD

Bioestadstica I

Ao 2013-

AUPSJB Laboratorio Bioestadstica, Ao 2013-I

Bioestadstica I

Ao 2013-