Está en la página 1de 97

Bioestadstica y uso de software cientfico

TEMA 1 INTRODUCCIN. ESTADSTICA DESCRIPTIVA

Poblacin y muestra Tipos de variable Representacin grfica Medidas que resumen una muestra o una poblacin Medidas de tendencia central Medidas de dispersin Medidas de posicin Medidas de forma

Descripcin e inferencia

Poblacin

Inferencia

Muestreo

Muestra

Resultado

Descripcin e inferencia

Poblacin: Cantabria
Muestreo

Inferencia

Muestra

Tensin arterial

Descripcin e inferencia

Poblacin: La sangre del paciente


Muestreo

Inferencia

Muestra

Potasio

Descripcin e inferencia

Poblacin: 5000 kg de langostinos


Muestreo

Inferencia

Muestra

E. coli

Inferencia
Una poblacin: Cul es la frecuencia de cncer en Cantabria? Qu tensin arterial tiene el paciente X? Dos poblaciones: Es ms frecuente el cncer en varones que en mujeres? Es ms eficaz el tratamiento A que el B?

Tipos de variable
Variables cualitativas (categricas) Binarias (dicotmicas) Categricas no ordenadas (nominales) Categricas ordenadas (ordinales) Variables cuantitativas Discretas (habitualmente son el resultado de contar) Continuas (habitualmente son el resultado de medir)

Tipos de variable: Binaria


Sexo: Varn o mujer Enfermedad: Enfermo / No enfermo Una enfermedad concreta: Infarto / No infarto El resultado de un anlisis: VSG>20 / VSG<=20 Asistencia al curso: Asiste / No asiste Resultado del curso: Aprueba / No aprueba Equipo de ftbol: At. Madrid / No At. Madrid

Tipos de variable: Nominal


Estado civil: Soltero / Casado / Viudo / Divorciado / Separado Tabaquismo: Fumador / Ex fumador / No fumador Enfermedades: Infarto / Diabetes / Alzheimer /... Equipo de futbol: At. Madrid / Real Madrid / Barcelona / Depor / ...

Tipos de variable: Ordinal


Enfermedad: IAM / Angina / Nada Criterios de Ramsom ndice ASA Clase funcional NYHA Tabaquismo: No / 1-5 / 6-10 / 11-20 / >20 Edad: 0-14 / 15-24 / 25-44 / 45-64 / 65-74 / 75 Gravedad: Leve / Moderado / Grave / Crtico Tipo de ciruga: Limpia / Limpia-contaminada / Contaminada / Sucia

Tipos de variable: Cuantitativas


Discretas: Edad (aos cumplidos): 0, 1, 2,... Frecuencia cardaca Nmero de hijos Continuas Edad: 20.3 Altura Peso Temperatura

Tipos de variable
Cualitativa Binomial y nominal: CLASIFICAR Ordinal: JERARQUIZAR Cuantitativa Discreta: CONTAR Continua: MEDIR

Representacin grfica
Una variable Sectores (tarta) Diagrama de barras Histograma Tallo y hojas Polgono de frecuencias Caja Dos variables Dispersin Lneas

Sectores
Grupo sanguneo

0 43%

A 38%

AB 5%

B 14%

Sectores
Grupo sanguneo

0 43% B 14% AB 5%

A 38%

Sectores
Grupo sanguneo

B- AB2% 1% A8%

010%

A+ 30%

0+ 34%

B+ 11% AB+ 4%

Sectores
0- Grupo sanguneo B- AB- 10% A- 2% 1% 8% A+ 30% 0+ 34% B+ 11%

AB+ 4%

barras
Grupo sanguneo
50 40 30 20 10 0 A B AB 0

40

45

15 5

barras
Grupo sanguneo
50 40 30 20 10 0 A B

40

45 15 5
AB

barras

Grupo sanguneo
50 40 30 20 10 0 A B AB 0 60 40 20 0

Grupo sanguneo

AB

barras

Grupo sanguneo
50 40 30 20 10 0 A B AB 0

Grupo sanguneo

0 AB

A B

barras
Grupo sanguneo
50 40 30 20 10 0 A+ B+ AB+ 0+ ABAB0-

45 40

15 10 5 3 1

13

barras
Grupo sanguneo
50 40 30 20 10 0 A+ B+ AB+ 0+ A- B- AB- 0-

Grupo sanguneo

B- ABA-

0A+ B+ AB+

0+

histograma
80 0 20 Frequency 40 60

20

40

60 edad

80

100

Tallo y hojas

7* | 0000000000000000000111111111111111111 7t | 222222222222222222222222222222333333333333333333333 7f | 44444444444444444555555555555555555 7s | 666666666666667777777777777 7. | 8888888888888888899999999999999999 8* | 00000000111111111 8t | 222222333333333 8f | 4444445555 8s | 6677

Diagrama de caja (Box and whiskers)


100 20 40 edad 60 80

Diagrama de caja (Box and whiskers)


100

Cuartil 3 Mediana Cuartil 1

20

40

edad 60

80

Diagrama de caja (Box and whiskers)


100

Ls = Q3 + 1,5 IQR
edad 60 40 80

Li = Q1 1,5 IQR

20

dispersin

logpth 2 1.5 3

2.5 logvitd

3.5

Dispersin+lnea de tendencia

2 1.5

2.5 logvitd

3.5

Lneas
Mortalidad por tuberculosis en Espaa
100

Tasa de mortalidad en varones 20 40 60 80

Tasa de mortalidad en varones 4 10 20 40

100

60-64 aos 85+ aos 75-79 aos 45-49 aos

60-64 aos

75-79 aos 45-49 aos

85+ aos

1960

1970

1980 1990 Ao de muerte

2000

2010

1 1960

1970

1980 1990 Ao de muerte

2000

2010

Escala aritmtica
100

Intervalos iguales = mismo aumento


Tasa de mortalidad en varones 20 40 60 80

60-64 aos

75-79 aos 45-49 aos

85+ aos

0 1960

1970

1980 1990 Ao de muerte

2000

2010

Escala logartmica
100 Tasa de mortalidad en varones 4 10 20 40

60-64 aos 85+ aos 75-79 aos 45-49 aos

Intervalos iguales = mismo % de aumento


1 1960 1970 1980 1990 Ao de muerte 2000 2010

Mortalidad por tuberculosis en Espaa


100

Tasa de mortalidad en varones 20 40 60 80

Tasa de mortalidad en varones 4 10 20 40

100

60-64 aos 85+ aos 75-79 aos 45-49 aos

60-64 aos

75-79 aos 45-49 aos

85+ aos

1960

1970

1980 1990 Ao de muerte

2000

2010

1 1960

1970

1980 1990 Ao de muerte

2000

2010

Escala aritmtica

Escala logartmica

Ms fcil de entender

Ver con lupa algunas zonas del grfico Lneas paralelas = los dos grupos aumentan o disminuyen en el mismo porcentaje

Lneas paralelas = los dos grupos aumentan o disminuyen en la misma cantidad

Diagrama de sectores
Slo para variables binarias o nominales Transmiten muy poca informacin

Diagrama de barras
Variables categricas Binarias Nominales Ordinales Variables cuantitativas discretas

Histograma y diagrama de cajas


Variables cuantitativas Discretas Continuas

Dos variables
Relacionar dos variables categricas Diagrama de barras Relacionar una variable categrica y una cuantitativa Diagrama de barras Histograma Diagrama de caja Relacionar dos variables cuantitativas Diagrama de dispersin Diagrama de lneas

Poblacin espaola

Mortalidad por cncer en Espaa

Fuente: Cabanes et al, Ann Oncol 2010

Cncer de mama, Europa

Fuente: Autier et al. BMJ 2010

Fuente: Chirlaque et al. Ann Oncol 2010

Cncer de esfago en Espaa

Cncer de estmago en Espaa

Fuente: Aragons et al. Ann Ocol 2010

Cncer de mama en Espaa

Fuente: Polln et al. Ann Ocol 2010

Cncer de prstata en Espaa

Fuente: Larraaga et al. Ann Oncol 2010

Cncer de prstata en Espaa

Fuente: Larraaga et al. Ann Oncol 2010

Cncer de prstata en Espaa

Fuente: Larraaga et al. Ann Oncol 2010

Cncer de prstata en Espaa

Fuente: Larraaga et al. Ann Oncol 2010

Tabaquismo en Espaa

Fuente: Regidor et al. Ann Oncol 2010

Inactividad fsica en Espaa

Fuente: Regidor et al. Ann Oncol 2010

Obesidad en Espaa

Fuente: Regidor et al. Ann Oncol 2010

Bebedores de riesgo en Espaa

Fuente: Regidor et al. Ann Oncol 2010

FIGURE 4 Annual Age-Adjusted Cancer Death Rates*Among Males for Selected Cancers, United States, 1930 to 2006

From Jemal, A. et al. CA Cancer J Clin 2010;0:caac.20073v1

FIGURE 5 Annual Age-Adjusted Cancer Death Rates* Among Females for Selected Cancers, United States, 1930 to 2006

From Jemal, A. et al. CA Cancer J Clin 2010;0:caac.20073v1

Riesgo de infeccin por VIH

Nmero de muertes semanales en la UE

Incidencia de cncer en Cantabria

Medidas de una distribucin


Medidas de tendencia central Medidas de dispersin Medidas de posicin Medidas de forma

Medidas de una distribucin


Medidas en la poblacin: letras griegas , 2, Medidas en la muestra: letras latinas m, s2, s

Medidas de tendencia central


Media
n

x
=
i =1

Media de 10, 15, 20, 35, 100

10 + 15 + 20 + 35 + 100 = = 36 5

Medidas de tendencia central


Media de 10, 15, 20, 35, 100

10 + 15 + 20 + 35 + 100 = = 36 5
Media de 10, 15, 20, 35 Sensible a valores extremos

10 + 15 + 20 + 35 = = 20 4

Distribuciones con diferente media

Medidas de tendencia central


Mediana: Valor central de una distribucin Mediana de 10, 15, 20, 35, 100 Mediana de 10, 15, 20, 35 17,5
Poco sensible a valores extremos

Medidas de tendencia central

Bernal et al, 2010

Medidas de tendencia central

Bernal et al, 2010

Medidas de tendencia central


Moda El valor ms frecuente Moda de 10, 15, 15, 15, 20, 20, 35, 100 15
Poco sensible a valores extremos

Moda de 10, 15, 15, 15, 20, 20, 35 15

Medidas de dispersin

Medidas de dispersin
Varianza En la poblacin

( x )
i

2 =

i =1

En la muestra

( x m)
i i =1

s2 =

n 1

Medidas de dispersin
Varianza de 10, 15, 20, 35, 100

(1036) +(1536) +( 2036) +( 3536) +(10036) =


2

=1367,5

Medidas de dispersin
Desviacin tpica (desviacin estndar) En la poblacin n

(x )
i

i =1

n
n

En una muestra

( x m)
i

s=

i =1

n 1

Medidas de dispersin
Desviacin tpica de 10, 15, 20, 35, 100

(1036) +(1536) +( 2036) +( 3536) +(10036)


5

= 36,98

Medidas de dispersin
Coeficiente de variacin

CV =
s CV = m

Medidas de posicin
Percentiles P10: Valor que deja por debajo el 10% de la distribucin. Anlogamente: P1, P2,..., P99

Medidas de posicin
Percentiles

Medidas de posicin
Deciles P10, P20, P30,..., P90. Quintiles P20, P40, P60, P80 Cuartiles P25, P50, P75

Medidas de posicin
Rango Observacin menor - Observacin mayor Rango intercuartlico P25 - P75

Diagrama de caja (Box and whiskers)


100 20 40 edad 60 80

Diagrama de caja (Box and whiskers)


100

Cuartil 3 Mediana Cuartil 1

20

40

edad 60

80

Diagrama de caja (Box and whiskers)


100

Ls = Q3 + 1,5 IQR
edad 60 40 80

Li = Q1 1,5 IQR

20

Diagrama de caja (Box and whiskers)

Gonzalez-Gay et al, 2005

Medidas de forma
Asimetra
n

(x )
i

1 =

i =1

Medidas de forma
Asimetra Figuras con asimetra 0, <0 y >0

Medidas de forma
Curtosis o apuntamiento
n

( x )
i

n 3

g2 =

i =1

Medidas de forma
Curtosis Figuras con curtosis 0, <0, >0

También podría gustarte