Está en la página 1de 65

1

Estadstica para los no


estadsticos
2

Epidemiologa Clnica. Inferencia causal.


Error aleatorio.

Deriva del hecho de tomar slo una muestra de la


poblacin terica sobre la que queremos sacar
conclusiones.
Su importancia puede disminuirse aumentando el
tamao de la muestra.
Su importancia puede cuantificarse mediante test de
hiptesis (probabilidad de error al rechazar la
hiptesis nula de igualdad) y/o el clculo de los
intervalos de confianza (valor del estimador muestral
con rango poblacional).
La ausencia de error aleatorio se denomina precisin.
3

Error aleatorio. Introduccin a favor.

Y as como el analfabetismo cierra a quien lo


padece casi todas las puertas de la cultura, el
anaritmetismo impide el acceso a esa puerta
maestra del conocimiento objetivo que es la ciencia.
Por supuesto, el discurso cientfico tambin utiliza el
lenguaje verbal, incluso ms que el numrico; pero
es en la cuantificacin y en la correlacin
matemtica de las magnitudes donde la ciencia se
realiza como tal, donde se vuelve concreta, precisa y
eficaz.

Carlo
CarloFrabetti.
Frabetti.Anaritmetismo.
Anaritmetismo.El
ElPais,
Pais,mircoles
mircoles24
24de
deenero
enerode
de1996.
1996.
4

Error aleatorio. Introduccin en contra.

La estadstica es una disciplina que debe una gran parte


de su configuracin actual a las matemticas. Las
matemticas, por otro lado, son un conjunto de
conocimientos tericos, abstractos, cuyos creadores, la
mayora de la veces, no pretendan resolver problemas
prcticos, sino generar abstracciones a partir de los
nmeros, deducir otros nuevos conocimientos tericos,
derivables de abstracciones previas o resolver problemas,
incoherencias o curiosidades generadas, como efectos
secundarios, en la creacin de teoras matemticas.
Considerar los conocimientos matemticos como el
resultado de mentes creadoras que jugaron con smbolos
o aceptaron retos de otros jugadores similares, no es
alejarse excesivamente de la historia de esta ciencia.

Manzano
ManzanoV.
V.Inferencia
Inferenciaestadstica.
estadstica.Aplicaciones
Aplicacionescon
conSPSS/PC+.
SPSS/PC+.Madrid:
Madrid:RA-MA,
RA-MA,1995;
1995;98.
98.
5

Estadstica. Proceso de medicin.

La Estadstica es la disciplina encargada del tratamiento de


los datos numricos derivados de los grupos de
indivduos.

La Medicin es el proceso por el que se representan las


propiedades de los fenmenos investigados mediante
nmeros o nombres.

Unidades de anlisis son las entidades objeto de nuestro


estudio (individuos, grupos, ciudades, hospitales, etc).

Las unidades de anlisis tienen caractersticas, que


varian (variables) y son objeto de comparacin entre ellas.
6

Estadstica. Proceso de medicin.

En cada una de estas caractersticas diferentes se incluyen


dimensiones o modalidades (niveles, categorias,
atributos, valores).

Entre las modalidades hay relaciones, en ocasiones


escasas y simples y otras veces mltiples y complejas.

Las Escalas de Medida de estas modalidades establecen


dos tipos de variables: Cualitativas y Cuantitativas.
7

Estadstica. Escalas de medida.


Tipos de Variables Relacin entre valores Ejemplos
Escalas
Nominal Nominales o Igualdad/desigualdad Raza, sexo, religin, estado
Categricas (Di o civil, profesin
Policotmicas
Ordinal Ordinales Igualdad/desigualdad Nivel socioeconmico, grado
Orden de mejora o empeoramiento,
opiniones

De Cuantitivativas Igualdad/desigualdad Grados centgrados, tiempo o


Intervalo contnuas o Orden y longitud sin origen
discretas Unidad de medida emprica determinado
De Razn Cuantitativas Igualdad/desigualdad Tensin arterial, edad, peso,
contnuas o Orden y unidad emprica de grados Kelvin.
Discretas medida, con cero absoluto

Las variables de las escalas nominal y ordinal son cualitativas.


8

Estadstica. Diseo de un cuestionario y transferencia a


soporte en disco. Algunos puntos destacables.
Suele tenerse la tentacin de recoger ms informacin de la que
realmente se necesita, en previsin de que pueda usarse en el
futuro. Recuerda, si slo tienes que rellenar 20 items/indivduo,
les dedicars ms atencin que si rellenas 50.

Define bien las variables.

Para rellenar la base de datos estamos precisamente en este


curso; y casi, casi, slo hacemos el curso para sto.

Guarda alguna copia de seguridad. Si no lo haces, te acordars


de esta advertencia!.

En general, la matriz de datos muestra la informacin en filas


(pacientes) y columnas (variables).
9

Estadstica descriptiva.

Resume los valores que toman las variables en las


unidades de anlisis.
Atencin al examen de los datos, previo a la
realizacin de tcnicas ms complejas de
confirmacin de hiptesis.
Importancia central de la representacin grfica.
Resistencia de los estadsticos a valores extremos.
Distincin entre ajuste y resduo.
Apertura a la transformacin de variables para
conseguir modelos ms ajustados.
10

Estadstica descriptiva y Estadstica inferencial.

Estadstica descriptiva.

Resumen de los datos para condensar la informacin.

Estadstica inferencial.

Inferir los valores de la poblacin (parmetros) basndonos


en el conocimiento de los valores de la muestra
(estadsticos).
11

Estadstica descriptiva.

Resumen de los valores que toman las variables en


las unidades de anlisis:

Variables cualitativas:
Tablas de distribucin de frecuencias absolutas
o relativas.
Grficas (diagramas de barras y tartas).

Variables cuantitativas:
Medidas de tendencia central, de variabilidad, de
posicin, de simetra y de apuntamiento.
Grficas (histogramas, polgonos de
frecuencias, arbol y hoja, caja y bigotes, nube de
puntos, etc.).
12

Estadstica descriptiva. Variables cualitativas

Tablas de distribucin de frecuencias absolutas o


relativas.

Se disponen en filas los valores de la variable y en columnas


las frecuencias absolutas, relativas y acumuladas.

Las variables cuantitativas pueden agrupar los valores en


intervalos (categorizacin) y representarse tambin en una
tabla de distribucin de frecuencias o categorizarse.
13

Estadstica descriptiva. Variables cuantitativas

Variables cuantitativas:
Medidas de tendencia central.

Media aritmtica: = x n
i

(Distribuciones normales) i =1 n

Mediana: Valor que deja 50% de los casos a


ambos lados. Igual que el P50. (distribuciones
que no son normales).

Moda: Valor ms frecuente.


14

Estadstica descriptiva. Variables cuantitativas


Variables cuantitativas:
Medidas de de variabilidad (dispersin).
Rango: Distancia entre mayor y menor.
Percentiles. Valor bajo el que se encuentra una
cierta proporcin (cuartiles, deciles, n-tiles).
Recorrido intercuartlico: P25 a P75.

( )
n

xi x
2


( )
Varianza: 2
= 1
n

xi x
2
n 1
Desviacin estandar: = 1

n 1
s
Coeficiente de variacin: CV ( x ) = 100 %
x Q1 Q3
Coeficiente Variacin intercuartlico: CVI =
Q1 + Q3
15
Ajuste de un modelo
Media: Modelo para resumir nuestros datos.
Varianza: Error promediado para evaluar el ajuste del
modelo a los valores de los sujetos.
Como Desviacin Estandar se expresa en las mismas
unidades que la media.

= xi
n

i =1 n

( )
n

1 x i x
2

=
2

n 1

(xi x )
n 2

= 1

n 1
16

Estadstica descriptiva. Variables cualitativas

Grficas (diagramas de barras y tartas o sectores).


Utilidades:
Presentar la informacin.
Evaluar la estructura de los datos.
Tipos:
Comparaciones de dos o ms nmeros (diagrama de barras o
pictogramas).
Distribucin de objetos individuales o medidas en diferentes
categoras (diagrama de sectores).
Mostrar el cambio en alguna cantidad con el paso del tiempo
(diagrama de lneas)
Mostrar la relacin entre dos mediciones (nube de puntos).
17

Estadstica descriptiva. Variables cuantitativas

Variables cuantitativas:
Grficas (histogramas y polgonos de
frecuencias).
Intervalos de clase, marca de clase, rango del
intervalo. Pedir 22 intervalos para este fichero.
Satisfaccin del usuario en puntuacin 18
Porcentaje Porcentaje

Vlidos 5,00
Frecuencia
1
Porcentaje
,3
vlido
,3
acumulado
,3
Estadstica descriptiva.
10,00 2 ,5 ,5 ,8
15,00
20,00
3
4
,8
1,0 1,0
,8 1,5
2,5
Variables cuantitativas
25,00 5 1,3 1,3 3,8
30,00 6 1,5 1,5 5,3
35,00
40,00
45,00
50,00 10
7
8
9
1,8
2,0
2,3
2,5
1,8
2,0
2,3
2,5
7,0
9,0
11,3
13,8
La distribucin
55,00 11 2,8 2,8 16,5
60,00
65,00
70,00
75,00
12
13
14
15
3,0
3,3
3,5
3,8
3,0
3,3
3,5
3,8
19,5
22,8
26,3
30,0
Normal
80,00 50
16 4,0 4,0 34,0
85,00 17 4,3 4,3 38,3
90,00 18 4,5 4,5 42,8
95,00 19 4,8 4,8 47,5
40
100,00 20 5,0 5,0 52,5
105,00 19 4,8 4,8 57,3
110,00 18 4,5 4,5 61,8
115,00 17 4,3 4,3 66,0
30
120,00 16 4,0 4,0 70,0
125,00 15 3,8 3,8 73,8
130,00 14 3,5 3,5 77,3
135,00 13 3,3 3,3 80,5
20
140,00 12 3,0 3,0 83,5
145,00 11 2,8 2,8 86,3
150,00 10 2,5 2,5 88,8
155,00 9 2,3 2,3 91,0
10
160,00 8 2,0 2,0 93,0 Std. Dev = 40,82
165,00 7 1,8 1,8 94,8
Mean = 100,0
170,00 6 1,5 1,5 96,3
175,00 5 1,3 1,3 97,5 0 N = 400,00
180,00 4 1,0 1,0 98,5
-5
5,
15
25 0
35 0
45 0
55 0
65 0
75 0
85 0
95 0
10 0
11 ,0
12 ,0
13 ,0
14 ,0
15 ,0
16 ,0
17 ,0
18 ,0
19 ,0
20 ,0
0
,0

185,00
,
,
,
,
,
,
,
,
,
5
5
5
5
5
5
5
5
5
5
5,
3 ,8 ,8 99,3

0
190,00 2 ,5 ,5 99,8
195,00 1 ,3 ,3 100,0
VAR00001
Total 400 100,0 100,0
19

50
La distribucin normal
Media, Mediana y Moda,
coinciden
40
Simtrica
Unimodal
30
Dos colas

20
Frecuencia absoluta

Probabilidades de los
valores de la variable en
los intervalos de clase.
10 68% (xsd)
95% (x 2sd) Std. Dev = 40,82

99% (x 2.6sd) Mean = 100,0

0 N = 400,00
-5
5,
15
25 0
35 0
45 0
55 0
65 0
75 0
85 0
95 0
10 0
11 ,0
12 ,0
13 ,0
14 ,0
15 ,0
16 ,0
17 ,0
18 ,0
19 ,0
20 ,0
0
,0

,
,
,
,
,
,
,
,
,
5
5
5
5
5
5
5
5
5
5
5,
0
Estadstica descriptiva. Estandarizacin de los 20

valores de una variable con distribucin normal.


80

x x
Z=
60 i
100

s
80
40

N ( x, s 2 ) N (0,1)
60

20

Std. Dev = 40,82


40
Mean = 100,0

0 N = 400,00
0,0 40,0 80,0 120,0 160,0 200,0
20
20,0 60,0 100,0 140,0 180,0 Std. Dev = 1,00
68% Mean = 0,00

0
VAR00001 95% N = 400,00
-2,50 -1,50 -,50 99% ,50 1,50 2,50
-2,00 -1,00 0,00 1,00 2,00

Zscore(VAR00001)
21

Estadstica descriptiva. Trasformacin de variables

Tipo de Frmula Cambios en forma de Ejemplo


transformacin distribucin
Aritmtica
Lineal xi = a + bxi Ausentes Tipificacin
Potencia xi = xiq Reduccin de asimetra.
xi = log x Si q<1 a la izq.
si q> 1 a la dcha.
xi = xiq Cambio de curtosis
Logaritmos y Ms representativos los
races plegadas valores centrales.
Lgica
22
Estadstica inferencial.
Muestreo
aleatorio

Estadstica Inferencial: Estimacin de un parmetro


poblacional y pertenencia de dos muestras a la misma
poblacin.
Intervalo de confianza y Test de Hiptesis
23

Estadstica inferencial.

Muestreo: Permite aplicar la estadstica inferencial.

Estadstica Inferencial, permite hacer inferencias sobre


los valores poblacionales:
Estima los parmetros poblacionales conociendo
los estadsticos muestrales.
Evalua si dos o ms muestras pertenecen a la
misma poblacin.

Mtodos de inferencia:
Intervalo de confianza.
Test de Hiptesis.
24

Intervalo de confianza
25
Teorema del Lmite Central.
Inferencia de un parmetro poblacional a partir
de un estimador muestral
Descriptive Statistics Descriptive Statistics

Std. Std.
N Mean Deviation N Mean Deviation
Age Age
236 57,07 14,10 236 55,00 13,35
(years) (years)
Valid N Valid N
236 236
(listwise) (listwise)

Descriptive Statistics Descriptive Statistics

Std. Std.
N Mean Deviation Descriptive Statistics N Mean Deviation
Age Age
238 56,46 13,26 Std. 250 55,83 13,10
(years) (years)
N Mean Deviation
Valid N Valid N
238 Age 250
(listwise) 1207 56,39 13,33 (listwise)
(years)
Valid N
Descriptive Statistics 1207 Descriptive Statistics
(listwise)
Std. Std.
N Mean Deviation N Mean Deviation
Age Age
243 56,86 13,30 264 55,94 13,12
(years) (years)
Valid N Valid N
243 264
(listwise) (listwise)

Descriptive Statistics Descriptive Statistics

Std. Std.
N Mean Deviation N Mean Deviation
Age Age
258 56,94 13,63 219 54,93 12,88
(years) (years)
Valid N Valid N
258 219
(listwise) (listwise)
26
Teorema Central del Lmite.
Inferencia de un parmetro poblacional a partir de
un estimador muestral

Ki N = tamao poblacional.
n = tamao muestral.
n,x,s k = nmero de muestras de tamao n.
Ki
N, ,
Ki,x,s N N!
k = =
Ki
Ki Ki
n
n! (N n)!
Ki,x,s

Sea cual sea la distribucin de una variable aleatoria poblacional, con media y varianza
2 , la distribucin de las medias, x, de muestras de tamao n es, aproximadamente, una
normal, con media y varianza 2/n(*) (cuanto mayor sea n, menor es la varianza), y tanto
ms aproximadamente cuanto mayor sea el tamao de n (por tanto, a mayor n, mayor
simetra de la distribucin).
(*) La raiz cuadrada de este valor es el Error estandar del estimador.
27

Teorema Central del Lmite.


Conociendo la media de nuestra muestra podemos
inferir la media de la poblacin de donde se obtuvo.

-1.96*/n 1.96*/n
-1.96 0 1.96
(
xi N , 2 n ) Tipificacin
xi
N (0,1)
n
Distribucin emprica Distribucin estandarizada
28

Clculo del Intervalo de Confianza de un estimador

x
P( 1.96 + 1.96) = 0.95

n

P(1.96 x +1.96 ) = 0.95


n n

P( x .
1 96 x+ .
1 96 ) = 0.95
n n
Parmetro () Estimador () 1.96 x (error estandar del estimador)
29

Error estandar y Error asociado a la estimacin o


error de muestreo.
Parmetro () Estimador () 1.96 x (error estandar del estimador)

El producto 1.96 n se denomina
ERROR ASOCIADO A LA ESTIMACIN
ERROR DE MUESTREO.

El valor se denomina ERROR
n
ESTANDAR de la media (del estimador en
general), es decir la desviacin estandar de
las medias muestrales (recuerda que mide
la bondad de ajuste).
30

Utilidad del Intervalo de Confianza.

Porqu utilizar un nico punto de corte cuando la


eleccin de ese punto es arbitraria?.

Porqu reducir la cuestin de si un tratamiento es


efectivo a un valor dicotmico (si/no) cuando sera
ms apropiado verlo como un continuum?. Guyatt G,
Jaenschke R, Heddle N, et al. Basic statistics for clinicians. 1.
Hypothesis testing. Can Med Assoc J 1995;152:27-32.

El IC proporciona un recorrido de posibilidades para


el valor poblacional en la escala de magnitud de la
variable medida, no una dicotoma arbitraria basada
tan solo en la significacin estadstica.
31

Intervalo de confianza para medias y proporciones

La frmula del IC para un estimador de una media es:



P( x t x+t ) = 1
1 2 n 1 2 n

De manera similar, la frmula del IC para una


proporcin es:

p q p q
P( p t p p + t ) = 1
1 2 n 1 2 n
32

Test de Hiptesis. Objetivo: rechazar la hiptesis nula.

Ho frecuencia de cncer los aos de vida son los


mismos en los sujetos fumadores que en los no
fumadores.
p(A)
H0 p(A) = p(B) p(A) - p(B) = 0 H 0 p(A) = p(B) =1
p(B)
H0 x(A) = x(B) x(A)- x(B) = 0
La decisin del investigador estar basada en los datos
obtenidos en su muestra (informacin emprica).
Si la probabilidad (que vamos a buscar en la tabla con
la distribucin correspondiente al final del libro:
nmero de casos y grados de libertad) de obtener unos
resultados tan extremos o ms que los encontrados en
nuestro estudio es demasiado pequea, nos
atreveremos a rechazar H0.
Un ejemplo para entender el intervalo de confianza 33
34

Intervalo de confianza. Algunas ideas sueltas.

La magnitud del estimador indica la importancia del


efecto y la amplitud del IC la cantidad de variabilidad
(incertidumbre) inherente a la estimacin (muestreo).
Cualquier estadstico tiene su error estandar y por
tanto su IC.
Si el IC no incluye el valor nulo ( para diferencias, 0, y
para cocientes, 1), la p< 0,05 por definicin.
Cuanto menor sea la muestra, los resultados estarn
ms expuestos a no indicar la realidad de la poblacin
sobre la que se desean inferir resultados, debido a la
gran variabilidad del muestreo y al azar.
35
qu sucede si queremos tener ms o menos confianza
(99%, 90%) en que el parmetro poblacional se encuentre
en nuestro intervalo?
Si aumentamos o disminuimos el tamao muestral?
P( x .
1 96 x+ .
1 96 ) = 0.95
n n
Tabla de valores del estadstico Z para y
Nivel Estadstico Z
0.90 bilateral 1.64
0.95 unilateral 1.64
0.95 bilateral 1.96
0.99 bilateral 2.57
0.999 bilateral 3.29
0.20 0.84
0.10 1.28
0.05 1.64
0.01 2.32
36

Intervalo de Confianza. Cambios con el nivel de confianza


Intervalo de Confianza. Cambios con el nivel de confianza y 37

el tamao muestral.
38
Intervalos de Confianza de los estimadores(*)
Decidir lo que constituye una diferencia clnicamente importante es difcil
e inevitablemente arbitrario. Las caractersticas del resultado que se
evala (prevenir una muerte, ictus grave, TIA), el riesgo basal, los efectos
adversos, los inconvenientes y el costo, todo influye.
0 10
A
Diferencia de TA entre
Diabticos y normales
B o entre no tratados y
tratados con un
C frmaco hipotensor.

E
F

G
(*) Recuerda, estamos interesados en conocer la magnitud del efecto (cuanta y
direccin) y no tanto en saber la probabilidad de que hallamos llegado a un
resultado falso positivo (si podemos o no rechazar la hiptesis nula).
39

Clculo del tamao


muestral
40

Clculo del tamao muestral. Estimacin de una media



P( 1.96 x +1.96 ) = 0.95
n n

P( x 1.96 ) = 0.95
n
La distancia entre x y no puede ser mayor que el mximo error
asociado a la estimacin posible para tener una seguridad del
95% de haber elegido una de las k muestras de la poblacin que
nos interesa.

x 1.96 x <
n

El producto 1.96
n se denomina ERROR ASOCIADO A LA ESTIMACIN ERROR DE MUESTREO.

El valor n se denomina ERROR ESTANDAR de la media (del estimador en general).
41

Clculo del tamao muestral. Estimacin de una media



x 1.96 x <
n

= 1.96
n

2

n = (1.96) 2

Tomando muestras de, como mnimo, el tamao n, podemos asegurar


que en el (1- )%, usualmente 95%, de ellas obtendremos medias que no
diferirn de en ms de la cantidad prefijada, .
42

Clculo del tamao muestral. Estimacin de una media


y una proporcin. Factores a considerar

2
2
n = (1.96)
2

2 pq
n = (1 . 96 ) 2

En consecuencia, el tamao muestral depender de las
pretensiones del investigador (lo que indica la subjetividad
inherente), ya que ste establecer las pautas de su estudio.
43

Test de hiptesis
44

Test de Hiptesis.
Test de hiptesis son procedimientos estadsticos que
nos permiten decidir acerca de una hiptesis
establecida sobre el valor de uno o ms parmetros
desconocidos (relaciones entre variables); es decir,

Establecer el grado de consistencia entre la hiptesis


establecida y la experiencia realizada.

El objetivo de los test de hiptesis consiste en ver si se


puede rechazar la hiptesis de independencia entre
dos variables (por ejemplo fumar y cncer de pulmn).
La hiptesis formulada de esta manera se llama
Hiptesis nula, Ho.
45

Test de Hiptesis. Evaluacin de una muestra.

Variable resultado (dependiente):


Frecuencia de cncer de pulmn.
Media de aos de supervivencia.

El objetivo ser saber si los valores de las variables


obtenidas en nuestra muestra son posibles en la
poblacin de referencia.
46

Test de Hiptesis. Evaluacin de dos muestras.

Variable predictora (independiente, factor):


Muestra A: Grupo de no fumadores.
Muestra B: Grupo de fumadores.

Variable resultado (dependiente):


Frecuencia de cncer de pulmn.
Mediana de aos de supervivencia.
47

Test de Hiptesis. Objetivo: rechazar la hiptesis nula.

Ho frecuencia de cncer los aos de vida son los


mismos en los sujetos fumadores que en los no
fumadores.
p(A)
H0 p(A) = p(B) p(A) - p(B) = 0 H 0 p(A) = p(B) =1
p(B)
H 0 x(A) = x(B) x(A) - x(B) = 0
La decisin del investigador estar basada en los datos
obtenidos en su muestra (informacin emprica).
Si la probabilidad de obtener unos resultados tan
extremos o ms que los encontrados en nuestro
estudio es demasiado pequea, nos atreveremos a
rechazar H0.
48

Test de Hiptesis. Aqu viene la p.

Ahora bien, siempre hay alguna probabilidad de que


nos equivoquemos, porque la realidad (la poblacin
terica de donde obtuvimos nuestra muestra) nunca
estar a nuestro alcance.
DECISION INVESTIGADOR
REALIDAD No rechazar Ho Rechazar Ho
Ho verdadera Correcto Error , tipo I
H0 falsa Error , tipo II Correcto (1-)
El test estadstico que aplicamos nos proporciona la
probabilidad (p) de equivocarnos al rechazar H0.
(1- ): Potencia del test.
49

Test de Hiptesis. quin calcula la p(1)?


Naturalmente, ahora lo hacen las mquinas.
Supongamos que conocemos que el verdadero valor del
colesterol de una poblacin de varones con IAM es 240 mg/dl
y la d.e. es 40 mg/dl,
cul es la probabilidad de obtener una muestra de 100
sujetos seleccionados aleatoriamente de esa poblacin con una
media de 260 mg/dl? dicho de otra manera,
cul es la probabilidad de que un grupo de 100 sujetos de
esa poblacin, muestreados al azar, tenga una media de
Colesterol de 260 mg/dl?.
Estandarizamos y obtenemos la puntuacin Z.
( xi i ) valor observado valor poblaciona l
Zi = = N (0,1)
n error estandar del estimador
50

Test de Hiptesis. quin calcula la p (2)?


Naturalmente, ahora lo hacen las mquinas.

( xi ) 260 240
Zi = = =5
n 40 100

una media de 260 mg/dl se coloca a 5 veces el error


estandar de la media poblacional de 240 mg/dl.
La probabilidad de inters ser < 0.001.
La probabilidad de que una muestra de 100 sujetos con nivel
medio de colesterol de 260 mg/dl pertenezca a la poblacin de
referencia es muy pequea; sera muy raro que esta muestra
perteneciera a la poblacin referida.
En consecuencia, nos atrevemos a rechazar la hiptesis nula de que
esta muestra de 100 sujetos pertenece a la poblacin de referencia.
51

Test de Hiptesis. Aqu viene la p.

Debe recordarse siempre que aceptar Ho no significa


que sea verdadera.

Para un tamao de muestras suficientemente grandes


siempre podremos demostrar diferencias
estadsticamente significativas.
( xi ) valor observado valor poblaciona l
Zi = = N (0,1)
n error estandar del estimador

Es fundamental establecer la diferencia clnicamente


relevante ms que la estadsticamente significativa.
52

Puntos a destacar en la valoracin de los aspectos


estadsticos de un estudio

Han elegido los autores el escenario de forma


correcta?
Han establecido si los grupos son comparables y
si es necesario, han realizado ajustes para las
diferencias basales?.
Qu tipo de datos han utilizado?. Han usado los
tests estadsticos apropiados?.
Si los tests estadsticos son oscuros, porqu han
decidido utilizarlos?.
Los datos han sido analizados de acuerdo al
protocolo original del estudio?.
Greenhalgh T. How to read a paper. The basics of evidence based medicine. London:BMJ
Publishing Group. 1997.
53

Puntos a destacar en la valoracin de los aspectos


estadsticos de un estudio

Datos apareados, colas y sujetos extremos.


Se han realizado tests apareados con datos
apareados?.
Se ha realizado una prueba de dos colas si el
efecto de la intervencin puede ser tambin de tipo
negativo?.
Se ha tratado el problema de los sujetos extremos
con sentido comn y con los ajustes estadsticos
apropiados?.

Greenhalgh T. How to read a paper. The basics of evidence based medicine. London:BMJ
Publishing Group. 1997.
54

Puntos a destacar en la valoracin de los aspectos


estadsticos de un estudio

Correlacin, regresin y causalidad:


Se ha distinguido correlacin de regresin y se ha calculado
e interpretado correctamente el coeficiente de correlacin?.
Se han realizado asunciones sobre la naturaleza y direccin
de la causalidad?
Probabilidad y confianza.
Se han calculado e interpretado correctamente los
valores de la p.
Se han calculado los intervalos de confianza y los
reflejan las conclusiones de los autores?.

Greenhalgh T. How to read a paper. The basics of evidence based medicine. London:BMJ
Publishing Group. 1997.
55

Puntos a destacar en la valoracin de los aspectos


estadsticos de un estudio

Se han expresado los resultados en trminos de la


probabilidad de dao o beneficio que puede esperarse
en un paciente individual?

Riesgo Relativo/Odds ratio.


Reduccin del Riesgo Relativo.
Reduccin del Riesgo Absoluto.
Nmero Necesario para Tratar.

Greenhalgh T. How to read a paper. The basics of evidence based medicine. London:BMJ
Publishing Group. 1997.
56
Tipo de test estadstico a utilizar para hacer inferencias (estimacin de parmetros pobla-
cionales o comparacin entre muestras).
DISTRIBU VARIABLE VARIABLE RELACIN ENTRE TEST ESTADSTICO
CION INDEPEN- DEPENDIENTE LAS MUESTRAS
DIENTE
UNIVARIANTE O BIVARIANTE
Normal Una sola Cuantitativa t-student para una muestra
(Param- muestra Cualitativa Chi-cuadrado para una muestra
tricos) (compara con
valor terico)

Dicotmica Categrica No relacionadas No existe (se usa Chi-cuadrado de


Pearson)

Relacionadas Se usa el Test de McNemar

Cuantitativa Relacionadas t-student muestras dependientes

No relacionadas t-student muestras independientes

Policotmica Categrica No relacionadas No existe (se usa Chi-cuadrado de


Pearson
Cuantitativa No relacionadas ANOVA de una va (ONEWAY)
ANOVA de dos vas
57
Tipo de test estadstico a utilizar para hacer inferencias (estimacin de parmetros poblacionales o comparacin entre muestras).
DISTRIBUCION VARIABLE VARIABLE RELACIN ENTRE TEST ESTADSTICO
INDEPENDIENTE DEPENDIENTE LAS MUESTRAS
UNIVARIANTE O BIVARIANTE
No normal Una sola muestra Binomial
(No paramtri- (compara con valor Chi-cuadrado de Pearson
cos) terico) Chi-cuadrado de Mantel-Haenzsel
Kolmogorow-Smirnov
Rachas

Dicotmica Categrica Relacionadas Test exacto de McNemar


Prueba de los Signos

No relacionadas Chi-cuadrado de Pearson


Test exacto de Fisher

Cuantitativas Relacionadas Prueba de los signos


Prueba de los rangos con signo de Wilcoxon

No relacionadas Mann-Whitney
W de Wilcoxon
Mediana
Z Kolmogorov-Smirnov
Rachas de Wald-Wolfowitz
Valores extremos de Moses

Policotmica Categrica No relacionadas Prueba Q de Cochran

Cuantitativa Relacionadas Friedman


W de Kendall (concordancia)

No relacionadas Kruskal-Wallis
Mediana K variables
ANOVA de dos vas por rangos
tras).
58
DISTRIBUCION VARIABLE VARIABLE RELACIN ENTRE TEST ESTADSTICO
INDEPENDIENTE DEPENDIENTE LAS MUESTRAS
UNIVARIANTE O BIVARIANTE

COVARIACION (medidas de dos variables en los mismos sujetos o unidades de anlisis del estudio)
Paramtrico Ambas variables cuantitativas, pero no hay de- Correlacin de Pearson
pendiente o independiente
No paramtrico Ambas variables cuantitativas, pero no hay de- Correlacin de Spearman
pendiente o independiente Correlacin Tau de Kendal
REGRESIN
Paramtrica Cuantitativa o Cuantitativa Regresin lineal simple
Cualitativa
59

Asunciones para el uso de test paramtricos.


Distribucin normal
Distribucin normal de la variable dependiente para los dos
niveles del factor:
Pruebas estadsticas:
Test de Kolmogorov-Smirnov con la correccion de Lilliefors y test
de Shapiro-Wilk.
Asimetra y curtosis.
Evaluacin grfica:
Stem & Leaf.
normal probability plot (Q-Q plot).
detrended normal plot (P-P plot).
Histograma y curva normal: Permite echar un ojo al aspecto del
histograma valorando su distribucin.
60

Asunciones para el uso de test paramtricos:


Homogeneidad de las varianzas.
Homogeneidad de varianzas de la variable dependiente para
cada nivel del factor que se analiza en el modelo.
Pruebas estadsticas:
Test de Levene.
Asimetra (uno u otro lado) y curtosis (alejadas o prximas) .
Representacin grfica
Spread vs. Level
Scatter plots entre observados, predichos y residuales
estandarizados.
61

Asunciones para el uso de test paramtricos:


Variable medida al menos en escala de intervalo.
La variable dependiente debe medirse al menos en una escala
de intervalo, de forma que existe la misma proporcin entre dos
valores consecutivos de la escala.
62

Asunciones para el uso de test paramtricos:


Independencia de las observaciones.
Independencia de las observaciones con distribucin aleatoria
de la muestra en los diferentes subgrupos formados por las
combinaciones de niveles de los factores. Esto significa que la
puntuacin obtenida por un sujeto es independiente de la que
obtiene otro.
Prueba estadstica:
Test de las rachas.
63

Pruebas de inferencia estadstica. Comparacin de


medias entre dos grupos. T de student y pruebas no
paramtricas.
T de studen para una muestra.
T de student para muestras independientes.
T de student para muestras dependientes.
Pruebas no paramtricas:
Test de Mann-Whitney
Test de Wilcoxon
64

Pruebas de inferencia estadstica.


Comparacin de proporciones entre dos o mas grupos.
Test estadstico chi-cuadrado.
Test chi cuadrado:
Pearson.
Correccin de continuidad de Yates.
Razn de verosimilitud.
Prueba exacta de Fisher.
Asociacin lineal.
Prueba de McNemar
Prueba Q de Cochran.
65
Pruebas de inferencia estadstica.
Comparacin de medias entre dos o mas grupos.
Modelos Lineales Generalizados.
ANOVA y pruebas no paramtricas.
ANOVA de una va (factor).
ANOVA de dos o ms vas (factores).
ANCOVA.
MANOVA (anlisis multivariante de la varianza).
ANOVA de medidas repetidas.

También podría gustarte