Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadística
@AcademiaGoBIR www.academiabir.com
GoBR
ÍNDICE ESTADÍSTICA
PREGUNTAS ESTADÍSTICA
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
2.1 VARIABLES CATEGÓRICAS ... .......... ..... ... ...... .. ............ ... .................... 6
2.2 VARIABLES CUANTITATIVAS ... .. .... .. ...... .. .. .............. .. .... ........ .. .......... . 6
GoBIR - - - - - - - 1
Paseo de la Habana 9-1 1, Madrid. 911 610 039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
ESTADÍSTICA
DESCRIPTIVA
•
li1
fil
• •
li1
• • • 28%
li1
•
li1 50% Estadística
• 1111111M
10 %
inferencia!
li1 •
•
li1 li1
•
li1 li1 12%
1
•
li1 Estadística
~OBLACIÓN • descriptiva
li1 li1 ri1
Go51R 2
Paseo de la Habana 9- 11, M adrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
DEFINICIONES
MUESTRA 1
• • •
rm rm íi1
• •
rm rm
••• 1 rm
•
rm rm • •
•
rm rm fil
•
rm
•
rm
••
rm rm 1
•
rm
• •
rm
• rm•
rm
•
,ril
ROBL 1 CIO • •
rm rm
• •
rm rm
GoBIR 3
Paseo de la Habana 9- 11, ivfadrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
ANÁLISIS DE DATOS
Los datos obtenidos, se someten a análisis estadístico para obtener unos resultados . Pueden
darse dos escenarios diferentes:
• No contradicen la hipótesis inicial: Si estos resultados no contradicen la hipótesis
inicial, ésta se acepta provisionalmente.
• Contradicen la hipótesis inicial: Si la contradicen, la hipótesis inicial se rechazará
provisionalmente . Se activará un proceso inductivo donde, se revisarán los
conocimientos teóricos y se formularán nuevas hipótesis y preguntas de investigación.
En la Tabla 1.3, se puede ver el esquema general del proceso de investigación de la salud y
cómo se va modificando el conocimiento teórico a medida que analizamos las diferentes hipótesis
o preguntas de investigación.
...
1
- H ipótes is inicial/
Pregunt a de investigación
1Muestra representativa
1
Estud io de investiQación
1
1 Recogida de datos empíricos
Revisión teoría
1
Resultados
Se acepta
hipótesis
GoBIR 4
Paseo de la Habana 9-11 . Madrid 911 610 039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
VARIABILIDAD BIOLÓGICA
Conceptos básicos:
Se entiende por variable cada una de las características o aspectos que se registran en los
individuos de una muestra.
NOMINAL: Igualdad/Desigualdad
VARIABLES
CATEGÓRICAS
• Nominales :
A. Dicotómicas/Binarias
ORDINAL: Igualdad/Desigualdad/Orden (Cualitativas, datos no B. Politómicas .
métricos)
• Ordinales
DE INTERVALO:
Igualdad/Desigualdad/Orden/Distancia entre • Discretas
cada valor. Carecen de un cero absoluto.
Ejemplo: Escala de temperatura (ºC).
DE PROPORCIÓN O RAZÓN (BIR-2006):
VARIABLES
Igualdad/Desigualdad/Orden/Distancia y CUANTITATIVAS
tienen un cero absoluto; El valor cero
representa la ausencia total de medida, por lo
(Datos métricos)
• Continuas
que se puede realizar cualquier operación
Aritmética (Suma, Resta, Multiplicación y
División) y Lógica (Comparación y
ordenamiento).
GoBIR 5
Paseo de la Habana 9-11 . Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
• Variable categórica nominal (BIR-2000; 2001; 2003; 2005) : Las únicas operaciones que
pueden realizarse son relaciones de igualdad y desigualdad entre las categorías de la
variable. Si tienen dos categorías se denominan variables dicotómicas o binarias, como
por ejemplo, el sexo (Masculino/Femenino) (FIR-2015) . Si tienen más de dos categorías
se denominan politómicas, como por ejemplo, el grupo sanguíneo (BIR-2001; 2003; 2005)
(FIR-2017) . Las variables binarias siempre tienen escala de medida nominal, nunca pueden
ser ordinales.
• Variables cuantitativas discretas (BIR-2000) (FIR-2001; 2005) : Las variables discretas son
el resultado de recuentos. No tiene sentido calcular valores intermedios. El número de
variaciones entre valores es finito . Ejemplos de variables cuantitativas discretas son: El nº
de ingresos, nº de embarazos, número de hijos, nº colonias en una placa de cultivo.
• Variables cuantitativas continuas: El número de variaciones entre valores es infinito. Su
valor estará limitado a la exactitud del instrumento de medida utilizado. Ejemplos de variables
cuantitativas continuas son: Glucemia, colesterol LDL, talla, peso.
Dentro de las variables cuantitativas la escala de medición más utilizada es la de razón, que
es una clasificación de orden numérico donde la representación númerica es real. Por tanto
el cero significa ausencia de característica (QIR-2004 , ojo , pregunta con errata!)
.,
l.
Redondeo: Muchas veces las variables cuantitativas se presentan redondeadas:
Como por ejemplo el peso: 51 Kg, 60 Kg, 65 kg . Pero éstas, tienen valores
intermedios infinitos, condicionados a la exactitud del instrumento de medida: 51, 1
Kg ; 51,12 kg; 51,128 kg ...
6
Paseo de la Habana 9-11, Madrid. 911 610 039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
Ejemplo: Edad. Cuando te preguntan: ¿cuántos años tienes? Tienes la misma edad hasta
1 día antes de tu cumpleaños, no se redondea hacia arriba cuando se está a la mitad del
año y sucesivos meses.
• Recuento articulaciones O, 3, 5, 20 .. .
inflamadas
7
Paseo de la Habana 9-11, Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
Imagina que tienes que realizar un estudio y recoger datos sobre hábito tabáquico y obesidad .
¿Qué sería preferible registrar? ¿Qué te aporta más información?
Deben recogerse los datos tratando de obtener siempre la máxima información. En el ejemplo ,
si registramos el número de cigarrillos/día podemos calcular si el sujeto es o no fumador, sin
embargo , si inicialmente clasificamos a los individuos como Fumador/No fumador, no podríamos
calcular a posteriori el número de cigarrillos/día que el sujeto fuma . Lo mismo ocurre al registrar
la variable obesidad.
Medidas de dispersión:
Absoluta: • Amplitud
intercuartil
• Varianza
• Rango
MEDIDAS DE DISPERSIÓN
•
Desviación
Estándar
Medidas de posición:
Relativa:
• Coeficiente de • Cuantiles:
variación Percentiles,
cuartiles, deciles
MEDIDAS DE FORMA:
• Índice de asimetría • Índice de
ASIMETRÍA asimetría
Una vez que hemos recogido todas las variables individuales de los sujetos de nuestra muestra
o población de estudio, el siguiente paso será organizar esta información.
8
Paseo de la Habana 9- 11, Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
Para la descripción de datos cuantitativos se dispone de dos tipos de índices que nos van a
permitir resumir la distribución (Tabla 1.5):
Dentro de cada uno de estos índices, tenemos medidas de tendencia central, de dispersión y
de forma.
Ejemplo: Para el cálculo de las diferentes medidas emplearemos como ejemplo en los
siguientes apartados la siguiente distribución de valores de peso (kg) de una muestra
seleccionada de 10 adolescentes: 54, 50, 47, 47, 48, 43, 41, 40, 40, 25.
.,
l.
Los índices basados en momentos se calculan con TODOS los valores que
toma la variable . Son los más utilizados y muchas veces erróneamente
pues, la media y la desviación estándar se ven afectados por la presencia de
valores extremos, por lo que sólo deberían usarse en distribuciones
simétricas que no presenten anomalías, es decir cuando la distribución
sigue la ley Normal.
9
Pas eo de la Habana 9-11, ¡\,fadrid. 911610039
, ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
I:;_ (xi -
1 x )2 I:;~ (xi - J-1,x )2
1
n -1 J.V
Numerador:
El resultado de restar a cada valor (x;,) el valor medio (M) se denomina variable
centrada . Si sumáramos todas estas diferencias, los valores se anularían , ya que
habría diferencias positivas y negativas.
(54-43,5)+(50-43,5)+( 4 7-43,5)+( 4 7-43,5 )+( 48-43,5)+( 43-43 ,5)+( 41-43,5)+( 40-43,5)+( 40-43,5)+(25-43,5)=
(10,5) + (6,5) + (3,5) + (3,5) + (4,5) + (-0,5) + (-2.5) + (-3.5) + (-3,5) + (-18,5) =O
Es por esto, por lo que trabajamos elevando al cuadrado dichas diferencias . De esta
forma, obtenemos lo que se denomina la suma de cuadrados de la variable centrada o
suma de cuadrados.
SS= (10,5) 2 + (6 ,5) 2 + (3,5) 2 + (3,5) 2 + (4,5) 2 + (-0,5) 2 + (-2.5) 2 + (-3.5) 2 + (-3,5) 2 + (-18,5) 2
Denominador:
Para el cálculo del denominador debemos introducir el concepto de grados de
libertad (gl) o degrees of freedom (df) de un parámetro.
Grados de libertad: Se define como el número total de observaciones "n", menos el
número de parámetros estimados con estas mismas observaciones que intervienen en
su cálculo.
En este caso concreto, el denominador, es n-1, ya que con los mismos datos sólo se ha
estimado la media . Todos los valores son "libres" de tomar cualquier valor excepto uno.
10
Paseo de la Habana 9- 11, Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
V. muestra!= [(10,5) 2 + (6 ,5) 2 +(3,5) 2 +(3,5) 2 + (4,5) 2 +(-0 ,5) 2 +(-2.5) 2 +(-3 .5) 2 +(-3,5)2+(-18,5)2 ]/ 9 = 63, 389 kg 2
DE=+ ✓ v
Tiene las mismas unidades de medida que la variable, lo que facilita su interpretación.
.l., •
•
El intervalo M ± 1 xDE contiene el 68% central de las
observaciones, aproximadamente (BIR-2009) .
El intervalo M ± 2xDE contiene el 95% central de las
observaciones, aproximadamente (BIR-201 O) (QIR-2011 ).
• El intervalo M ± JxDE contiene el 99, 7% central de las
observaciones, aproximadamente.
• No confundir desviación típica con error típico.
• Si a todos los valores de una variable les sumamos (restamos) , multiplicamos o dividimos
una constante k, la media aritmética queda aumentada (disminuida), multiplicada o
disminuida también en esa constante .
Los parámetros poblacionales son únicos, sin embargo, las medidas muestrales pueden
ser infinitivas, en función del número de muestras que seleccionemos de la población.
Parámetros Estadísticos
poblacionales muestra
Tamaño muestra! N n
Media aritmética M, µ X
Varianza 2 s2
Ci
Desviación
Ci DE, SO
estándar
11
Paseo de la Habana 9-11, Madr1d. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
Si a cada uno de los datos de una muestra se le multiplica por una constante •
El coeficiente de variación no cambia (BIR-2004 ).
Si a todos los datos de la muestra se les suma una constante, la media y el coeficiente
de variación se modifican, la desviación estándar no (BIR-2006) .
• MEDIDAS DE FORMA
• ASIMETRÍA frü.:.
Informa de la magnitud y del sentido de la desviación respecto a la simetría . Puede ser:
12
Paseo de la Habana 9- 11, Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
Mediana
Mediana
• APUNTAMIENTO (r 2 ) O CURTOSIS.
A) El coeficiente de curtosis:
B) Medida de Fisher:
13
Paseo de la Habana 9-11 . M adrid. 911 610 039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
----------
Los índices basados en ordenaciones, se calculan con el orden que ocupan los valores cuando
se ordenan de menor a mayor. Son índices generales que permiten describir correctamente
variables cuantitativas . Utilizan las mismas unidades de medida que la variable. Para variables
cuantitativas que no cumplen la normalidad, situación muy habitual en ciencias de la salud,
y para variables ordinales, es necesario utilizar índices basados en ordenaciones, y no se
deben utilizar índices basados en momentos.
Cálculo mediana:
Posición : (10+1 )/2 = 11 /2=5 ,5 En este caso, la mediana está entre el valor que
ocupe a posición 5ª y 6ª. Se seleccionarán los dos valores que ocupan estas
posiciones (43 y 47) y se calcula la media de estos . En este caso , la mediana
será: 45.
(43+ 47)/2 = 45
GoBIR 14
Paseo de la Habana 9-11, Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
Ejemplo distribución impar: 25, 40, 40, 41, 43, 47, 47, 48, 50, 54, 54.
Posición : (11 +1 )/2=6; La posición 6ª la ocupa el valor 4 7; En este caso , la mediana será:
47.
• Moda (Mo).
Se corresponde con el valor que ocurre más frecuentemente. Una distribución puede
tener varias modas , en caso de haber varios valores de la variable que tengan la misma
frecuencia máxima (bimodal, trimodal) . Sin embargo, sólo tendrá una media y una
mediana. La moda siempre coincide con un valor de la distribución.
25, 40, 40, 41, 43, 47, 47, 48, 50, 54 • Esta distribución tendrá dos modas : 40 y 47 . Es
por tanto, una distribución bimodal.
• MEDIDAS DE POSICIÓN
• Cuantiles .
Los Cuanti/es o n-tiles son medidas de posición . Se corresponden con cada uno de los
n-1 valores de la variable que dividen los datos ordenados en n partes del mismo tamaño .
• Percentiles (P) (BIR-2001; 2002; 2002; 2004; 2006; 2012; 2015) (FIR-2008; 2011) (OIR-
2006; 2006) : Si n=100, los cuantiles son percentiles, cada uno de los 99 valores de la
variable que dividen los datos ordenados en 100 partes de igual tamaño. Así, por ejemplo,
el percentil 70 es el valor de la variable que es igual o deja por debajo de sí al 70%
del total de las puntuaciones.
P10: 32,5; P20:40; P50:45.
• Deciles (D): Si n=1 O, los cuantiles son deciles. 03: 40,5; 05: 45.
• Cuartiles (Q) (FIR-2010; 2013) : En caso de n=4, los cuantiles son cuartiles . Los cuartiles
son los valores de la variable que dejan por debajo de sí el 25%, 50% y el 75% del total
de las puntuaciones y así tenemos por tanto el primer cuartil (01 ), el segundo (02) y el
tercer cuartil (03).
G:o51R 15
Paseo de la Habana 9-11 . Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
La Mediana, coincide con el segundo cuartil (Q2), el decil 5 (D5) y el percentil 50 (P50)
(BIR-2003 ; 2005).
Tipo de
MEJOR OPCIÓN
variables
• Diagrama de barras y
líneas
• DISCRETAS
• Diagrama de tallo y hoja
• Polígono de frecuencias
• CONTINUAS
• Diagrama de tallo y hoja
• BoxPlot
GoBIR 16
Paseo de la Habana 9-11, Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
• DIAGRAMA DE BARRAS
LINAGLIPTINA 47
LIRAGLUTIDA 55
LIXISENA TIDA 11
REPAGLINIDA 24 EXENA TIOA LINAGLI PTINA LI RAGLUTIDA LIX ISENA TI OA REPAGLINIOA
nº envases prescritos
Representación en diagrama de
Ejemplo: Se dispone de los siguientes
sectores .
valores de individuos de una muestra
respecto a su hábito tabáquico:
nº envases
prescritos
• EXE NATIDA
LINAGLIPT INA
0 LIRAGL UTIDA Nº de
• LI XISENATIDA Hábito tabáquico
0 REPAGLI NIDA individuos
No fumador 13
Medio (O a 10
47
ciqarros/d ía)
Alto (11 ó más
55
ciqarros/día)
Representación en diagrama de
sectores.
Representación en diagrama de barras
(frecuencias absolutas).
17
Paseo de la Habana 9- 11, Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
Hábito
tabáquico
• Nulo
Medio (0-10
50,0%
cig/dis)
D Aiio (más de
11 cig/dia) 40,0%
Í J0,0%
~
o
a.
20.0%
10.0%
• DIAGRAMA DE BARRAS
En el eje de abscisas, se colocan los valores de la variable (datos discretos) y en el eje
de ordenadas, las frecuencias absolutas o relativas. Sobre cada valor de la
variable se proyectará la barra perpendicular de tal forma que su altura indique
su frecuencia.
• DIAGRAMA DE LÍNEAS
Es el gráfico que se obtiene al unir los centros de la parte superior de las barras .
10
-~ 6
u
e:
Q)
::,
u
e
u.
nº de hijos
18
Paseo de la Habana 9- 11, Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
La forma correcta de representar las barras debe ser que éstas estén separadas porque no es
una variable continua.
10
o 6
e:
Q)
:l
(.)
Q)
e::
4 El G
o~~------------------------~~
o 2 3 4
Nº de hijos
• HISTOGRAMA
Es la representación gráfica de una variable cuantitativa basada en momentos.
De forma general, en el histograma se agrupan los datos en clases y se cuenta cuántas
observaciones (frecuencia absoluta) hay en cada una de ellas. En las variables
cuantitativas, las clases hay que definirlas explícitamente (intervalos de clase). Los
intervalos de clase deben ser mutuamente excluyentes. El valor central se denomina
marca de clase (BIR-2002) .
Aunque pueden representarse intervalos de clase de diferente amplitud, está más
difundida su utilización con intervalos de igual amplitud.
Las características más relevantes de esta representación son:
19
Paseo de la Habana 9-11. AJ/adrid 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
Ejemplo de histograma:
80
60
"'
·;:;
e:
Cll
:,
U 40
Cll
-
u:
20 -
Es el gráfico que se obtiene al unir los centros de la parte superior de cada rectángulo del
histograma .
80
60
"'
·¡::;
e:
CI>
::J
U 40
~
u..
20
o~ - + - - - - - - + - - - - - - + - - - - - - - + - - - - - - - + - ~
60,00 80,00 100,00 120,00 140,00
Glucosa en sangre mg/dl
20
Paseo de la Habana 9- 11, M adrid. 911 610 039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
O, 5, 6, 8, 18, 20, 25, 25 , 25, 27, 27, 32, 32, 32, 32, 34, 38, 39, 39, 40,40, 41,42, 43, 43,43,43,
43,43,44,44,44,45,45,45,45,46,46,46,47,47,48,48,48,48,48, 50,50,50,52, 52, 52, 54,
56, 57, 58, 58, 59, 60, 61, 65, 70, 70, 95, 96, 99 .
Los diferentes tallos estarán formados por las decenas de cada número y las hojas son las cifras
de las unidades de cada edad .
Frecuencia
21
Paseo de la Habana 9- 11. M adrid. 911610039
1
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
Debemos diferenciar también los valores extremos, que son aquellos que se alejan
del cuartil más próximo más de 1,5 veces la AIC. Asimismo, podemos diferenciar dos
tipos de valores extremos:
• Valores exteriores: Son los que se alejan del cuartil más próximo entre 1,5 y 3 veces
la AIC. Representados con un punto -o-.
• Valores alejados: Son los que se alejan más de 3 veces la AIC. Representados con
asterisco-*- .
100,00
*t
80 ,00
60 ,00
40 ,00
20,00
o
8
0,00 o
Edad
GoBIR 22
Paseo de la Habana 9-11 . Madrid 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
• Mediana(Q2): 45
• Mínimo: O
• Máximo: 99
• Q1: 37
• Q3: 52
• Amplitud intercuartil: 15
• Mínimo no alejado: 18
• Máximo no alejado: 70
• Valores exteriores: O, 5, 6, 8
• Valores alejados: 95, 96, 99
• Rango:99
Nube de puntos
y recra de regres1on 11 eal
O 5 10 15 20 25 JO
Re cir culac ión (%)
mé todo de BTM
23
Paseo de la Habana 9-11, 1\Jladrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
Proporción ..................................................................................................... 25
PREVALENCIA .......................................................................................... 26
Tasa ............................................................................................................... 27
24
Paseo de la Ha bana 9- 11. 1vfadríd 911 61 0 039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
TIPO DE ESTUDIO
ESTUDIOS
ESTUDIOS DE COHORTES CASO CONTROL
TRANSVERSALES
MEDIDAS DE Prevalencia de
Prevalencia Riesgo Tasa
FRECUENCIA exposición
2. MEDIDAS DE FRECUENCIA
Recuerda:
• Razón: cociente en el que el numerador no está incluido en el denominador. Ejemplo:
razón hombres/mujeres .
• Proporción: cociente en el que el numerador está incluido en el denominador. Ejemplo:
proporción de hombres en una clase.
• Tasa: proporción en la que el denominador incluye la variable tiempo.
Proporción
Es una razón en la que el numerador está incluido en el denominador. Expresa la frecuencia
relativa de un evento en tantos por uno y va desde O (frecuencia nula) hasta 1 (frecuencia
máxima). Una proporción puede expresarse en porcentajes si se multiplica por 1OO.
p= a/ a+b
GoBIR 25
Paseo de la Habana 9-11. Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
• PREVALENCIA
Características
Características
• Es un índice estático. No incluyen tiempo en su cálculo .
• Es una proporción , OJO, NO ES UNA TASA.
• Su valor oscila entre O y 1, aunque también se suele expresar como porcentaje.
• Depende del tiempo de seguimiento.
• Se calcula sobre una cohorte fija, es decir no se permiten entradas de nuevos
individuos durante el seguimiento .
• Limitación : a lo largo del seguimiento generalmente se pierden individuos.
Odds (FIR-2016)
Es una razón entre la probabilidad de ocurrencia de un suceso en el numerador y su probabilidad
complementaria (no ocurrencia del suceso) en el denominador. No existe la traducción de este
término en castellano.
GoBIR 26
Paseo de la Habana 9- 11, 1'v1adrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
La odds de fumadores es: OF=70/30 = 2,33 • Por cada no fumador hay 2,33 fumadores. La
probabilidad de ser fumador es 2,33 veces superior a la de ser no fumador.
pF=70/(70+30) = 0,70 (70%) • Hay 70 fumadores de cada 100 individuos . Estima la probabilidad
de que un individuo sea fumador.
Características
Tasa
Una Tasa es la razón de cambio entre dos magnitudes.
Podemos interpretarla como: Cambio de una situación clínica por unidad de tiempo o velocidad
a la que se producen los cambios.
Hay diferentes tipos de tasas, pero en epidemiología clínica, el término tasa hace referencia a la
tasa media relativa.
• TASA (MEDIA) DE INCIDENCIA (TI) también se denomina Hazard Rate. Es una medida
del ritmo/velocidad de ocurrencia de un evento. Podemos interpretarla como número
de casos nuevos en un período dividido entre la suma de unidades de tiempo que la
población ha estado en riesgo en ese período.
Es un índice dinámico. Requiere un diseño de estudio de cohortes con tiempo de
seguimiento (estudio de supervivencia).
TI= nº de nuevos casos durante un periodo/suma de unidades de tiempo que los sujetos han estado en riesgo
GoBIR - - - - - - - - 21
Paseo de la Habana 9- 11, Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
01/06/2014 31/12/2014
Caso 1
Caso 2
Caso 3
Caso 4
Caso 5
Caso 6
Caso 7
Caso 8
Caso 9
Caso 10 a 100
Prevalencia110512014 = ; Prevalencia3111212014 =
Como hemos visto anteriormente, existe un índice estático para medir la incidencia, que era el
riesgo/incidencia acumulada y otro dinámico que es la tasa media de incidencia.
Veremos en el ejemplo la diferencia entre estos dos índices:
28
Pas eo de la Habana 9-11, M adrid. 9 11610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
TI= (200-175) / [(200-175)x2 + 175x4] = 25/(50+700) = 0,033 curaciones por sujeto y mes->
Las curaciones se han producido a un ritmo de 3,3 casos por 100 sujetos expuestos y
mes.
Las medidas de asociación e impacto se usan para evaluar la asociación y cuantificar las posibles
consecuencias entre un evento y la exposición a un determinado factor de estudio (fármaco,
hábito , intervención quirúrgico, factor de riesgo .. . ). En el ámbito de los ensayos clínico es muy
frecuente estudiar la asociación entre un tratamiento (factor) y curación/respuesta (evento) .
Para relacionar dos medidas de frecuencia podemos utilizar: se puede hacer con su cociente (si
son iguales, se obtiene: 1) o con la diferencia (si son iguales, se obtiene: O) .
MEDIDAS DE EFECTO:
Basadas en el cociente. Si son iguales y no existe diferencia entre ambas el resultado será 1.
• Riesgo Relativo.
• Odds Ratio.
• Razón de tasas de incidencia.
MEDIDAS DE IMPACTO:
MEDIDAS DE EFECTO:
Características
No tiene dimensiones.
• Rango de O a infinito (BIR-2006) .
• RR=1 • No hay asociación entre la presencia del factor y el evento.
• RR >1 • Si la asociación es positiva , es decir si la presencia del factor se
asocia a mayor ocurrencia del evento.
• RR<1 si la asociación es negativa.
• Muy útil en estudios de cohortes.
• RAZÓN DE ODDS U ODDS RATIO (OR). Es el cociente entre la Odds del evento en
expuestos y la Odds en no expuestos.
29
Paseo de la Habana 9- 11, Madrid. 911610 039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
Características
• No tiene dimensiones.
• Rango de O a infinito.
• OR=1 si no hay asociación entre la presencia del factor y el evento.
• OR>1 si la asociación es positiva, es decir si la presencia del factor se
asocia a mayor ocurrencia del evento.
• OR<1 si la asociación es negativa .
• A menor prevalencia, más se aproxima a la razón de proporciones, por lo
que en caso de baja prevalencia de la respuesta, la Razón de Odds es
muy similar a la razón de proporciones.
• Muy útil en: Estudios de casos y controles donde no es posible calcular la
Razón de incidencia o Riesgo Relativo.
Relaciones entre el OR y el RR
• RR es más intuitivo.
• OR se puede estimar siempre y de la misma forma; el RR no se puede calcular
en los diseños casos control.
• El OR está siempre más alejado de 1 que el RR: si la razón de proporciones
es > 1, la OR es aún mayor, y si la razón de proporciones es < 1, la OR es aún
menor.
• Si el riesgo es bajo, son muy parecidos.
MEDIDAS DE IMPACTO
Las medidas de impacto cuantifican la fuerza de la asociación, es decir, cuántos casos se evitan
si se elimina el factor de riesgo o si se introduce el factor de protección.
1. RR > 1• Factor de riesgo :
• RIESGO ATRIBUIBLE (RA) : informa del exceso de riesgo de enfermar entre los
expuestos, es decir, la cantidad de incidencia atribuible al factor de estudio
(cuánto disminuye la incidencia en el grupo de los expuestos (le) si se elimina el
factor de riesgo) . Es una medida de la magnitud del riesgo imputable el FR.
RA = le - 10
• FRACCIÓN ETIOLÓGICA DE RIESGO o FRACCIÓN ATRIBUIBLE A LA
EXPOSICIÓN (FAE): informa acerca de la proporción o porcentaje de casos
expuestos que se deben exclusivamente al factor de riesgo. Indica el porcentaje
de casos en expuestos que se evitarían al eliminar la exposición Es una medida
del porcentaje del riesgo que se debe al FR en el grupo de expuestos.
l - l
FAE = _e __ o
le
• NÚMERO DE PACIENTES QUE ES NECESARIO DAÑAR (NNH) : representa
el número de pacientes que deben estar expuestos al factor de riesgo para que
se desarrolle un caso.
GoBIR 30
Paseo de la Habana 9--11 . Madrid. 911 610 039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
1
NNH=--
fe - lo
Ejemplo:
ENFERMOS NO ENFERMOS
EXPUESTOS 10 40
NO EXPUESTOS 15 100
n _¡
RRR =~-f.
fo
• NÚMERO DE PACIENTES QUE ES NECESARIO TRATAR (NNT) : representa
el número de pacientes que deben exponerse al factor de protección para evitar
un caso.
1
NNH=--
fo - fe
Ejemplo:
ENFERMOS NO ENFERMOS
EXPUESTOS 16 84
NO EXPUESTOS 28 72
RAR =l 0
- l
e
= (~)
100'
- (~)
100'
= O' 28 -
O 16 = O 12
12 de cada 100 pacientes no desarrollan la enfermedad debido a la exposición al factor de
protección .
31
Paseo de la Habana 9- 11. i'vfadrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
32
Paseo de la Habana 9-11. Madrid. 911 610 039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
ÍNDICE
1. VARIABLES ALEATORIAS ......................................................................... 34
GoBIR - - - - - - - 33
Paseo de la Habana 9-1 1, M adrid. 911610 039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
1. VARIABLES ALEATORIAS
DEFINICIÓN
Toda variable aleatoria sigue en la población una determinada ley de probabilidad que describe
su comportamiento.
Una de las preocupaciones de los científicos, ha sido construir modelos de distribuciones de
probabilidad que pudieran representar el comportamiento teórico de diferentes fenómenos
aleatorios que aparecían en el mundo real. La pretensión de modelar lo observable, ha
constituido siempre una necesidad básica para el científico empírico, dado que a través de esas
construcciones teóricas (modelos), podía experimentar sobre aquello que la realidad no le
permitía. Por otra parte, un modelo resulta extremadamente útil, siempre que se corresponda
con la realidad que se pretende representar o predecir, de manera que ponga de relieve las
propiedades más importantes del mundo que nos rodea, aunque sea a costa de la simplificación
que implica todo modelo.
La distribución de probabilidad pude resumirse con la media, que en este caso se llamará
esperanza matemática o valor esperado y la varianza .
En las variables continuas, existen distribuciones que sirven de modelo para representar las
distribuciones empíricas más frecuentes:
Función de probabilidad:
Asigna a cada posible valor de una variable discreta su probabilidad.
GoBIR 34
Paseo de la Habana 9- 11, Madrid. 911 610 039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
Función de densidad:
En una distribución continua, las alturas no son probabilidades sino, densidades de
probabilidad. Esto significa que la probabilidad de encontrar a un individuo con una talla
exactamente igual a 49 cm es prácticamente nula . Lo que se define es la probabilidad
asociada a un determinado intervalo de tallas (ejemplo 48,5 a 50,5 cm).
Debemos imaginarnos la función densidad como la generalización del histograma con
frecuencias relativas para variables continuas . Es decir, identificamos la probabilidad de
un intervalo con el área bajo la función de densidad.
VARIABLES CONTINUAS
• La distribución binomial es una distribución discreta muy importante que surge en muchas
aplicaciones bioestadísticas.
• Esta distribución aparece de forma natural al realizar repeticiones independientes de un
experimento que tenga respuesta binaria , generalmente clasificada como "éxito" o "fracaso".
• Este modelo se aplica a poblaciones finitas de las que se toma elementos al azar con
reemplazo, y también a poblaciones conceptualmente infinitas, como por ejemplo las piezas
que produce una máquina, siempre que el proceso de producción sea estable (la proporción
de piezas defectuosas se mantiene constante a largo plazo) y sin memoria (el resultado de
cada pieza no depende de las anteriores) . Por ejemplo, esa respuesta puede ser el hábito de
fumar (sí/no), si un paciente hospitalizado desarrolla o no una infección, o si un artículo de un
lote es o no defectuoso.
Al ser variables discretas los valores que puede tomar el número de éxitos "k", la distribución
constituye siempre un diagrama de barras discontinuo .
• La variable discreta que cuenta el número de éxitos en "n" pruebas independientes de
ese experimento, cada una de ellas con la misma probabilidad de "éxito" igual a p,
sigue una distribución binomial de parámetros n y p.
35
Paseo de la Habana 9- 11, 1\,-ladrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
Función de probabilidad:
- Valores: x: O, 1, 2, ... , n
- Parámetros: n: número de pruebas, n > O entero
- p: probabilidad de éxito, O < p < 1
- k: número de éxitos .
- E[X] = nxp
- VAR[X]= nxp (1-p) (FIR-2009) (QIR-2006)
Figura 3.2. Ejemplo de distribución binomial de lanzar una moneda 100 veces y contar
las caras.
1 1
Eln(1oo;o ,s¡ -
1 to/Q'lprip.J - -
i
O1 ~
1
i
O.OB 1
i
0.06 1
j
i J
1
0.04 ~
1
i
1
0.02 ~
1
o u...,_ _ _ ___Jl'----=-<"1.u..i"f1.L.U,;..U..U.J..U...U..J..U..LJLI.U..L,lLJ..L°l1..u.'t·-=--~-....L.'-----'-'
o ~ ~ m ~ 100
Ejemplos:
La probabilidad de que un medicamento sea eficaz en un individuo de una población con cierta
enfermedad es del 80%. Para obtener la probabilidad de que al administrar el medicamento a 1O
personas tomadas de dicha población, exactamente 3 tuviesen efecto positivo utilizaremos la
distribución de probabilidad de variable aleatoria de tipo binomial
Durante una epidemia, el 10% de la población ha contraído una enfermedad. Para obtener la
probabilidad de que en un grupo de 15 personas, exactamente 7 estuvieran enfermos
utilizaremos la distribución de probabilidad binomial.
36
Paseo de la Habana 9- 11 . Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
Función de probabilidad:
- Valores: x: O, 1, 2, .. ., n
- Parámetros: lambda >-.: media de la distribución; A> O
- Parámetros: n: número de pruebas, n > O entero
- p: probabilidad de éxito , O < p < 1
- Queda caracterizada por un único parámetro A (que es a su vez su media y
varianza.)- > E[X] = VAR[X]= A= nxp
37
Paseo de la Habana 9-11, 1Wadríd. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
Función de probabilidad:
- Valores: x: max{O,n-(N-R)} , .. . , min{R,n} :
- max{O,n-(N-R)} indica el valor máximo entre O y n- (N-R).
- min{R ,n} indica el valor mínimo entre R y n.
Parámetros :
N: tamaño de la población, N>O entero
R: número de éxitos en la población . Re::O entero
n: número de pruebas ; n>O entero.
38
Paseo de la Habana 9- 11, Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
Función de densidad:
- Su función de densidad es : N(µ , o):
- Parámetros :
• Mu(µ): media de la distribución, - 00 < µ < 00 (FIR-2003)
• Sigma(o): desviación estándar de la distribución ; a> O
(Y)
C)
,.......¡
C)
O . l%
C) 1
C)
GoBIR 39
Paseo de la Habana 9-11, i\tfadrid. 911 610 039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
• Una distribución binomial B(n,p) se puede aproximar por una distribución normal,
siempre que "n" sea grande y "p" no esté muy próxima a cero o a uno. La aproximación
consiste en utilizar una distribución Normal con la misma media y desviación típica que
la distribución binomial.
• Corrección de continuidad o de Yates (FIR-2007): cuando aproximamos una
distribución binomial mediante una Normal, estamos convirtiendo una variable X discreta
(toma un número determinado de valores) en una continua X' (toma valores en un
intervalo). Los valores de la probabilidad para valores fijos de la variable continua son
cero (ya que sería el área de un punto), y necesitamos definir un intervalo . Para evitar
este problema en la aproximación de los valores fijos estos se corrigen (corrección de
continuidad o de Yates) sustituyéndolos por un intervalo centrado en el punto y de valor
unidad.
• En la práctica se utiliza la aproximación cuando :
.)í...,. -nJ}
t = - - - : : : ll(ll 11
r--- - ~
1
I
..,/n¡.1q
0 .1 5 p = . 3
. ::.2 5
n 30
o . l.
n 120
O . OS
n = 2 70
. (12 5
·J
o ~.O
11111." .. ....... ,, 1111 ,11111
60
ll11111111 " ............. .
lO C, .120
40
Paseo de la Habana 9- 11, Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
Donde:
* k es el número de grupos que comparamos.
* N es el número de observaciones
• Binomial.
GoBIR 41
Paseo de la Habana 9-11 . iWadrid. 9116-/0039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
42
Paseo de la Habana 9- 11, Madrid. 911 610 039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
1. PROBABILIDAD Y ESTADÍSTICA
INTRODUCCIÓN
En el bloque anterior, hemos estudiado, que la teoría de la probabilidad es la ciencia que
establece las leyes que siguen los fenómenos aleatorios .
Esto es, por ejemplo, conocer la probabilidad de encontrar un número "k" de diabéticos en una
muestra concreta.
Sin embargo, en ciencias de la salud, nos suele interesar la operación contraria : a partir de "k"
diabéticos encontrados en la muestra, estimar la proporción de diabéticos de la población.
La estadística inferencia! es la parte de la estadística que estudia los datos recogidos para
elaborar conclusiones futuras, permitiendo una toma de decisiones más efectiva. Pretende
estudiar si se puede generalizar el estudio realizado sobre los datos de una muestra determinada
a toda la población.
• Principio de Verosimilitud.
• Principio de Suficiencia .
• Principio de Condicionalidad.
• Principio de Birnbaun.
COCEPTOS BÁSICOS
POBLACIÓN: Se define población como el conjunto completo de individuos a
los que se pretende aplicar las conclusiones del estudio.
43
Paseo de la Habana 9-"11, Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
2. ESTIMACIÓN DE PARÁMETROS
DISTRIBUCIÓN MUESTRAL
~~
.
/ - - - -.. ,___ ;f (\...__
X11
\
Muestra 2
Muestra 3
\._~ _/
1/ Muestra)-/~ ~ /::....-X \
l
7
(
(
.,,
x";",
) La distr i bución muestra! de
media es normal
;·
/
J~ \
\~
X=N (µ . cr)
\\...Muestra¡:: ~~
'- /---...... / -
...._____,.,.. - ' X"
GoBIR 44
Paseo de la Habana 9- 11, 1\11adád. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
.,,,.-----------~ 0
(
/~
/' )< /.,...-.,'\
, / MLiestra ·1 _,,,/ '\, \ p;¡ ) ~;
( M1Jestra 2 ~_______\.,...} -__ _/ ( p3
1 ~
~\ Muestra 3 1 • ( p3 )
\ Pk
~
Muestra K
"--..
___
-y__
.....______________,,,.
/
------....
~-------/
Distribución muestra! de Proporciones
POBLACION
Al aumentar el tamaño de las muestras, el valor de las medias se aproximará más a la media
de la población . Si el tamaño de la muestra fuera toda la población, la media estimada coincidiría
con el de la población (no existiría error de muestreo) .
140 140 •
N- 30 IW N-JOO i!O N-250
100 100
11 illt •
,10 r,(l
40 40
20
o ri l.. 20
Como hemos podido apreciar, al realizar un estudio , si seleccionamos muestras distintas de igual
tamaño, la estimación puntual de la media sería un valor distinto en cada una de las muestras.
Por lo tanto, la estimación puntual de un parámetro, debe ir acompañada de su precisión que
denominamos error de muestreo.
45
Paseo de la Habana 9- 11, Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
,o • Error Estándar (EE) (BIR-2001; 2006; 2007; 2007; 2013) (FIR-2006; 2014) (QIR-2003 ;
2006) . Es una medida de la variabilidad de los valores de la media de la distribución
muestra! de medias.
jEE = SD/✓n 1
• Intervalo de Confianza del 95% (IC95%) (BIR-2004; 2007 ; 2008) (FIR-2008) (QIR-
2007) . Es el intervalo que tiene un 95% de probabilidades de éxito de contener la
verdadera media de la población. Es más reducido que el IN95% . Es una medida de la
variabilidad de los errores de muestreo de las med ias, que valora la precisión con que la
media de la muestra estima la media de la población . Al aumentar la amplitud de un
intervalo de confianza, disminuye la precisión de la estimación (BIR-2001; 2002; 2013 ;
2016 ), y viceversa.
• Variables Cuantitativas:
46
Paseo de la Habana 9-11, 1\tladrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
• Variables categóricas:
nxp ~ 5 y nx(1-p) ~ 5 1
Ejemplo:
Para una población simétrica (p=0,50), solamente serán necesarios 10 sujetos para poder
aproximar a una distribución muestra! a la Normal. (1 O x 0,5 = 5 ; 1O x (1- 0,5)=5 )
p= 0,08 • las muestras deben tener al menos 63 sujetos (62 ,5 x 0,08 = 5).
Cuando el tamaño "n" de las muestras es pequeño , el efecto central del límite no tiene potencia
suficiente para aproximar a la ley Normal. En este caso, la distribución muestra! depende de la
distribución de probabilidad de la población .
3. ESTIMACIÓN DE MEDIAS
Si partimos de una muestra aleatoria de una población que sigue una distribución normal , N(M ,
DE), se sabe que la distribución muestra! de la media seguirá también una distribución normal.
Esto es exacto para poblaciones normales y aproximado (buena aproximación con muestras con
n~30 sujetos) para poblaciones cualesquiera . El error estándar será igual a: EE= SD/✓n .
~{ir±Zn.,/;t
"·~
cr
n
Llamando Za al valor de una variable normal tipificada que deja a su derecha un área bajo la
curva de a, es decir, que la probabilidad que la variable sea mayor que ese valor es a (estos son
los valores que ofrece la tabla de la normal).
47
Paseo de la Habana 9- 11, Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
p± Zn¡;;
)i'.
(T
Oi, ...
f7
Ejemplo: De una población normal con desviación estándar igual a 2 se extrae una
muestra aleatoria de tamaño 20 en la que se calcula que su media es igual a 5,3. Se puede
decir que la media de la población tiene una probabilidad de 0,95 de estar comprendida en
el intervalo 4,42 a 6,18 que sería el intervalo de confianza del 95% para la media .
....
5,3±1,96 ~ =(4,42 - 6,18)
-..;20 , .
4. ESTIMACIÓN DE PROPORCIONES
Sea X una variable binomial de parámetros n y p (RECUERDA: una variable binomial es el
número de éxitos en n ensayos ; en cada ensayo la probabilidad de éxito (p) es la misma) .
Si n es grande y p no está próximo a O ó 1 X es aproximadamente normal con media np y
..... :.\;:
varianza npq (siendo q = 1 - p) y se puede el estadístico proporción muestra! ( p =-;;)seguirá
también una distribución normal, con una varianza (FIR-2015) dada por pqln o lo que es lo
GoBIR 48
Paseo de la Habana 9- 11 . Madrid 911 610 039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
¿Qué significa este intervalo? La verdadera proporción de curaciones está comprendida entre,
aproximadamente, 72% y 88% con un 95% de probabilidad. ¿Es suficientemente preciso? Habrá
que juzgarlo con criterios clínicos .
Ejemplo: Para evaluar una vacuna para la gripe se selecciona un grupo de 200 individuos de
riesgo . Se eligen aleatoriamente a 100 de ellos y se les suministra la vacuna; de ellos 1O pasan
la gripe. Construir un IC al 95% para la probabilidad de pasar la gripe si se está vacunado. En
los otros 100 pacientes sin vacunar la pasan 20. ¿Hay evidencia de que la vacuna es eficaz?
.-.
p ±z"n
(!)(/
.:........=....
n
es decir, hay una probabilidad del 95% de que la probabilidad de pasar la gripe si se está
vacunado esté comprendida entre el 4% y el 16%.
n ·')··o 0
IC95'}·ó: 0,2 ± 1,96\ ,. ,"" i<. ' 0 = O, 2 ± 0,08=( O, 12 0,28)
100 ,
Existe solapamiento, aunque pequeño, entre ambos intervalos ; por tanto no podemos asegurar
que la vacuna sea eficaz.
DEFINICIÓN HIPÓTESIS
La hipótesis de trabajo puede definirse como una conjetura plausible. Se formulan como una
declaración . No se formulan como una pregunta.
GoBIR 49
Paseo de la Habana 9-11. 1\rfadrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
• Formulación adecuada:
"El fármaco A no tiene efecto para el tratamiento de la patología de estudio".
• Formulación errónea:
"¿El fármaco A tiene efecto para el tratamiento de la patología de estudio?".
PASOS A SEGUIR
1 Ha: Mo-MN = O
Para poder emplear pruebas de significación unilateral, se debe tener un conocimiento teórico
del tema de investigación muy sólido y poder establecer argumentos de peso que justifiquen que
el resultado sólo puede en un sentido.
Por norma general, en los estudios van a utilizarse pruebas estadísticas de significación
bilaterales .
• Nivel de significación (BIR-2001; 2003; 2003; 2007; 2014) : Podemos definir el nivel de
significación de un contraste, a la probabilidad de cometer un error de tipo l. Esto es,
GoBIR 50
Paseo de la Habana 9-11, Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
como veremos más adelante, el rechazar la hipótesis nula, cuando esta es cierta . Este valor,
se fija de antemano, antes incluso de comenzar el estudio. Por lo general, se suele
seleccionar un nivel de significación de 5% ó 1%.
Dos situaciones donde existe una relación verdadera y otras dos conducen a conclusiones
equivocadas (Tabla 4.1) .
GoBIR 51
Paseo de la Habana 9-11, Madrid. 911 610 039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
• Error tipo 11 (BIR-2003; 2006; 2009; 2014; 2017) (FIR-2016) (QIR-2004) : El error tipo 11
consiste en no rechazar la hipótesis nula, cuando esta es falsa. Cometer un error tipo 11
supone no ver diferencias que si existen. La probabilidad de que ocurra se la denomina
riesgo beta (13.).
- Beta: Por lo tanto, definiremos beta como la probabilidad de no detectar una
relación que en realidad existe. Se suele cuantificar en 0,20 (20%).
Este riesgo es especialmente alto en el caso de muestras pequeñas (estudios
con poca potencia). Esta limitación no se da si se ha realizado el correspondiente
cálculo del tamaño muestra!.
RELACIONES "VERDADERAS"
• Confianza. El contraste de hipótesis nos da un resultado no significativo y la hipótesis
nula es verdadera. Su probabilidad de ocurrencia es 1-alfa, habitualmente el 95%, para
un riesgo alfa de 0,05.
.,
l.
El riesgo alfa y beta están inversamente relacionados.
Sólo pueden disminuirse las dos, aumentando el tamaño
muestra! (Figura 4.4).
A B
52
Paseo de la Habana 9-11, J'viadrid. 911 610 039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
Ejemplo:
Hipótesis nula: El tratamiento con el fármaco A tiene el mismo efecto que el tratamiento con
placebo o dicho de otra forma, el efecto medio obtenido con el fármaco A es igual al efecto medio
obtenido con placebo .
Hipótesis alternativa: El tratamiento con el fármaco A tiene efecto diferente que el tratamiento
con placebo .
Para ver si el tratamiento con el fármaco A se asocia con mejores resultados de respuesta, se
analizan los datos obtenidos en la muestra.
En el grupo de placebo, responden el 8,8% de los individuos, mientras que con el tratamiento A,
el porcentaje de sujetos que alcanzan respuesta terapéutica es de 11 ,7% . La diferencia entre los
grupos es de 2,9% . Si realizamos el mismo estudio con varias muestras distintas extraídas de la
misma población , el resultado sería diferente en cada muestra debido al error aleatorio de
muestreo.
La pregunta es : Esta diferencia encontrada, ¿es una diferencia explicable por el azar?, o si por
el contrario, ¿existe una diferencia entre los dos grupos?
Interpretación:
En el ejemplo , el valor de significación p > 0,05 , esto es una probabilidad grande de que la
diferencia encontrada sea explicable por el azar. No existen diferencias estadísticamente
significativas. En este caso, se acepta la hipótesis nula .
Se acepta que con una confianza del 95% , el tratamiento con el fármaco A tiene el mismo efecto
que el tratamiento con placebo .
Si el valor de significación hubiera sido por ejemplo p=0,001 , la probabilidad de que las
diferencias entre ambas ramas fueran debidas al azar es muy pequeña , por lo que se rechazaría
la hipótesis nula .
53
Paseo de la Habana 9-11, J\iladríd. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
• Magnitud del efecto. Cuanto menor sea la diferencia entre los grupos que quiera detectarse,
mayor será el tamaño de muestra requerido. Esta diferencia es el menor efecto con
importancia clínica o práctica. Es una estimación realizada por el investigador en base a
conocimientos teóricos o estudios previos publicados.
• Riesgo alfa (BIR-2008). Cuanto menor sea el riesgo alfa, mayor será el tamaño de muestra.
Habitualmente se sitúa en 0,05 o 0,01. Se da gran valor a estar seguros de que un efecto
está presente cuando realmente lo está.
• Riesgo beta . En general se admite un riesgo beta < 20% y una potencia > 80%. Suele ser
mayor que el alfa, por lo que se da mas valor a decir que un efecto existe cuando realmente
está presente (riesgo alfa menor) y menos valor a decir que no existe cuando realmente no
está presente (riesgo beta mayor).
• Características de los datos. Para datos binarios depende de las proporciones relativas:
con 50%-50% se requieren menos casos que a medida que esas proporciones se alejan .
Con datos cuantitativos dependen directamente de la dispersión de los datos : a mayor
dispersión mayor muestra y viceversa . Se puede obtener de estudios previos similares o de
un estudio piloto con pocos pacientes . Si los grupos son de tamaño distinto y las varianzas
diferentes, se obtiene la media ponderada por los grados de libertad de las varianzas o
desviación estándar de ambos grupos.
• Prueba estadística unilateral o bilateral. Definir si la hipótesis va a ser unilateral o bilateral.
Las pruebas bilaterales necesitan mayor muestra que las unilaterales.
La predeterminación del tamaño muestra! debe hacerse antes de iniciar el trabajo. En muchas
ocasiones son necesarios demasiados sujetos para los medios de los que se dispone para
realizar la investigación , en cuyo caso se debe abandonar el proyecto inicial o adaptarlo a la
disponibilidad de medios.
Pruebas de Conform idad. Verifican una hipótesis sobre un determinado valor de un parámetro
de la población . Ejemplo : la prueba de comparación de una media observada a una teórica
(comprobar si la muestra procede de una población con IMC =25 kg/m 2 ) o la prueba de
comparación de una proporción observada a una teórica (ver si la muestra procede de una
población con igual proporción de hombres y mujeres).
54
Paseo de la Habana 9-11, Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
Pruebas de Independencia. Verificar la asociación entre dos variables que juegan un papel
simétrico , la hipótesis no contempla una variable independiente y otra dependiente. Son el
objetivo principal en los estudios de asociación, caso frecuente en estudios transversales.
GoBIR 55
Paseo de fa Habana 9-11 .. Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
ÍNDICE
1. INTRODUCCIÓN ........................................................................................... 57
56
Paseo de la Habana 9- 11, Madrid. 9 11 61 0 039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
1. INTRODUCCIÓN
La respuesta a la pregunta de investigación de un estudio se alcanza analizando la relación entre
las variables exposición y respuesta observadas en una muestra . Se dice que las dos variables
están relacionadas, si la variable respuesta se va modificando a medida que la variable
exposición cambia sus valores .
Si la respuesta no se modifica cuando cambia la exposición, se dice que las variables no están
relacionadas. El análisis de esta relación se realiza mediante la utilización de las pruebas
estadísticas para estimar la probabilidad de riesgo alfa.
El tipo concreto de prueba estadística a utilizar depende de la escala de medida de las variables
exposición y respuesta y de que los datos cumplan algunas asunciones que se detallarán en el
desarrollo de cada prueba.
En la Tabla 5.1 se resumen los principales tipos de pruebas estadísticas en función de las
variables de exposición y respuesta.
Tabla 5.1. Clasificación de las principales pruebas estadísticas en función del tipo de
variable.
,o !VARIABLES EXPOSICIÓN
CATEGÓRICA
VARIABLE BINARIA (Obesidad MODELO
CUANTITATIVA (IMC)
RESPUESTA (Obesidad) (No/Leve/Modera GENERAL
da)
Comparación de
dos proporciones :
Regresión
Regresión logística
BINARIA (Diabetes) Prueba de X 2 logística binaria
binaria simple
múltiple
Prueba exacta de
Fisher
CATEGÓRICA DE
Comparación de varias
MÁS DE DOS Regresión
proporciones: Regresión logística
CATEGORÍAS logística
multinomial
(Diabetes multinomial
Nulo/Leve/Grave) Prueba de X 2
Comparación de
Comparación de Comparación
dos variables
dos medias: varias medias:
cuantitativas:
Regresión lineal
CUANTITATIVA
T-Student Análisis de múltiple : tres o
CONTINUA Correlación: R de
Fischer varianza más variables
(Glucemia) Pearson y r de
cuantitativas.
Spearman
U de Mann- Kruskal-
Whitney Wallis
Regresión lineal
Comparación de
SUPERVIVIVENCIA
supervivencia:
Regresión de Cox Regresión de Cox
(Diabetes + tiempo
Método Kaplan-
de diabetes)
Meier
GoBIR 57
Paseo de la Habana 9- 11 . i\rfadrid 911 610 039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
58
Paseo de la Habana 9-11, ivfadrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
59
Paseo de la Habana 9- 11, J\tladrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
El análisis de la relación entre una variable respuesta binaria como Infarto Sí/No con una
exposición binaria como Fumador Sí/No consiste en la comparación de dos proporciones: la
proporción de infartos en los fumadores frente a la proporción de infartos en los no fumadores .
Si la proporción de infartos en los fumadores es distinta que en los no fumadores, las dos
variables están relacionadas o son estadísticamente dependientes . Por el contrario, si la
proporción de infartos es similar en fumadores y en no fumadores, las dos variables no están
relacionadas o son estadísticamente independientes.
Según se aprecia en la Tabla 5.3, en los fumadores hay mayor proporción de infartos (30,2%)
que en los no fumadores (14, 1%), lo que sugiere existencia de asociación.
Infarto
No Sí Total
Fumador No Recuento 243 40 283
% de Fumador 85,9% 14,1% 100,0%
Sí Recuento 81 35 116
% de Fumador 69,8% 30 ,2% 100,0%
Total Recuento 324 75 399
% de Fumador 81,2% 18,8% 100,0%
Esta relación se puede representar gráficamente con un Diagrama de barras agrupado (Figura
5.1 ), con la distribución de la variable respuesta (Infarto) en cada categoría de la variable
exposición (Fumar) . Se puede apreciar que la proporción de infartos en fumadores es mayor que
en no fumadores, aunque por los recuentos absolutos puede dar la impresión de lo contrario.
GoBIR 60
Paseo de la Habana 9- 11, M adrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
Gráfico de barras
250 Infarto
•Osí No
200
.S 150
e:
Q)
::,
(.)
Q)
a::
100
50
o
No Sí
Fumador
Las pruebas estadísticas utilizadas en el análisis de esta relación y sus condiciones de aplicación ,
se muestran en la Tabla 5.4 .
• Prueba de chi-cuadrado
• Razón de verosimilitud
• Prueba exacta de Fisher bilateral
• Corrección
Yates
de continuidad de
61
Paseo de la Habana 9- 11, 1\;ladríd. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
e= p X Ototal
p = proporción muestra!
Para calcular la frecuencia esperada, multiplicar los valores que corresponden a los subtotales
de la fila y la columna de la casilla de interés y dividir por el total de la tabla
Si el número de casillas con frecuencia esperada menor de 5 es menor del 20% (ninguna casilla
en el caso de una tabla de 2x2) se pueden utilizar tres pruebas:
• Prueba de chi-cuadrado
• Razón de verosimilitud
• Corrección de continuidad de Yates
Frecuencias esperadas
1nfarto
o 1 Total
Fuma o Recuento 243 40 283
% de Fuma 85,9% 14 ,1% 100,0%
Frecuencia esperada 229,8 53 ,2 283,0
1 Recuento 81 35 116
% de Fuma 69,8% 30,2% 100,0%
Frecuencia esperada 94,2 21,8 116,0
Total Recuento 324 75 399
% de Fuma 81 ,2% 18 ,8% 100,0%
Frecuencia esperada 324,0 75,0 399,0
En el ejemplo, caso la frecuencia mínima esperada es de 21,8. Por tanto se puede utilizar estas
tres pruebas.
Pruebas de chi-cuadrado
GoBIR - - - - - - - - 62
Paseo de la Habana 9- 11, Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
en esta muestra (33,2 - 14,1 = 19,1%) en la población origen es menor del 0,01%. Por
tanto hay diferencias estadísticamente significativas en la proporción de infartos en
fumadores y en no fumadores. Los grados de libertad se calculan : (filas - 1)(columnas-
1)
• Razón de verosimilitudes. También se puede emplear esta prueba clásica en el análisis
de datos categóricos utilizada en la regresión logística. Su resultado es muy similar al de
la chi-cuadrado, siendo casi idéntico en muestras grandes. En este caso la prueba de la
razón de verosimilitudes es p <0,05.
• Corrección de continuidad de Yates. Consiste en una modificación conservadora en
la prueba de chi-cuadrado que actualmente no tiene aplicación, aunque todavía se puede
encontrar algún revisor que la solicite, sobre todo en tamaños de muestra menor de 200
que es donde pudiera tener alguna aplicación.
Prueba exacta de Fisher bilateral (BIR-2005; 201 O; 2014) (QIR-2002) . En caso de que más
del 20% de las casillas (alguna de las casillas en una tabla de 2x2) tengan una frecuencia
esperada menor de 5 no se pueden aplicar ninguna de las pruebas anteriores y se debe
emplear la prueba exacta de Fisher bilateral, cuyo resultado en este caso es p <0,05.
Las pruebas estadísticas nos informan del grado en que la relación puede ser debida al azar,
pero no informa sobre la magnitud del efecto o la importancia clínica o práctica. La magnitud del
efecto de la relación entre dos variables binarias se valora con las medidas de frecuencia
(proporción , odds), de asociación (riesgo relativo, odds ratio) e impacto (diferencia de riesgos ,
NNT).
El análisis de la relación entre una variable respuesta binaria como Infarto Sí/No con una
predictora categórica con más de dos categorías (politómica) como hábito tabáquico "FumaOr"
(Hábito tabáquico: Nulo/Leve/Moderado consiste en la comparación de varias proporciones: la
proporción de infartos que han sufrido en los sujetos no fumadores , en los que fuman entre 1-15
cigarros al día (Leve) y los que fuman más de 15 cigarrillos al día (moderado) .
Infarto
No Sí Total
FumaOr Nulo Recuento 243 40 283
% de FumaOr 85,9% 14,1% 100,0%
Leve (1-15 cigarros/día) Recuento 58 29 87
% de FumaOr 66,7% 33,3% 100,0%
Moderado (más de 15 Recuento 23 6 29
cigarros día) % de FumaOr 79 ,3% 20,7% 100,0%
Total Recuento 324 75 399
% de FumaOr 81 ,2% 18 ,8% 100,0%
Las proporciones de infartos en los sujetos no fumadores es 14, 1%, en fumadores leves 33,3%
y en fumadores moderados 20,7 %.
GoBIR 63
Paseo de la Habana 9- 11 .. Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
Gráfico de barras
250 Infarto
•Osí
No
200
,S 150
e:
CI)
::::i
(.)
CI)
o:::
100
50
o
Nulo Leve (1-15 cigarros/día) Moderado (más de 15
cigarros día)
FumaOr
Los datos mostrados en la tabla de contingencia 3x2 (Figura 5.2) y el gráfico de barras agrupadas
de la Figura 5.3 sugieren la existencia de asociación .
Las pruebas estadísticas utilizadas en el análisis de esta relación y sus condiciones de aplicación
se muestran en la Tabla 5.5 . Al igual que en el caso anterior, se debe evaluar cuantas casillas
tienen una frecuencia esperada menor de 5. La frecuencia esperada es la que tendría la tabla en
caso de no haber diferencias (igual proporción de infartos en las tres categorías de Fumaür). Si
el número de casillas con frecuencia esperada menor de 5 es menor del 20% (una o ninguna
casilla en el caso de una tabla de 3x2) se pueden uti lizar la prueba de chi-cuadrado y la razón
de verosimilitud . En este caso la frecuencia mínima esperada es de 5,45. Por tanto se puede
utilizar estas dos pruebas.
• Prueba de chi-cuadrado
Comparaciones múltiples
GoBIR 64
Paseo de la Habana 9- 11, Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
Sig. asintótica
Valor cil (bilateral)
Chi-cuadrado de Pearson 16,143(a) 2 ,000
Razón de verosimilitudes 14,739 2 ,001
Asociación lineal por
8,213 1 ,004
lineal
N de casos válidos
399
a. O casillas (,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mínima esperada es 5,45.
Por tratarse de una variable ordinal, se puede aplicar la prueba de tendencia de Asociación
lineal. A diferencia de las pruebas anteriores que valoran la igualdad de las proporciones, esta
prueba valora si hay una tendencia lineal creciente o decreciente de la proporción de infartos
entre las categorías ordenadas de FumaOr. Requiere como condición de aplicación que todas
las frecuencias esperadas sean ~ 2, siempre que las frecuencias cercanas a 2 no se presenten
en casillas contiguas. En este caso la prueba de tendencia de asociación lineal es p=0,004 . Indica
que existe una tendencia lineal estadísticamente significativa de las proporciones de infartos en
los tres niveles de hábito tabáquico . Esta prueba sólo es aplicable en el caso de variables
exposición con escala de medida ordinal. No tiene sentido en variables exposición con escala de
medida nominal.
Cuando la frecuencia esperada es < 5 en más del 20% de las casillas no se puede utilizar la
prueba de chi-cuadrado. En estos casos se pueden utilizar pruebas exactas (como la prueba
exacta de Fisher o la regresión logística exacta), no siempre disponibles en los programas
estadísticos habituales , o bien agrupar categorías con frecuencias esperadas bajas hasta que
sean superiores a 5 y se puedan aplicar las pruebas de chi-cuadrado. La agrupación de
categorías se puede hacer por criterio clínico (la que tenga más sentido) o estadístico (la que
agrupe las categorías de muestra más pequeña).
GoBIR 65
Paseo de la Habana 9-11, Madrid 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
3 niveles de hábito tabáquico, se pueden realizar un total de c(c-1 )/2 comparaciones . En este
caso 3(3-1 )/2 = 3 comparaciones.
Infarto
No Sí Total
Fumaür Nulo Recuento 243 40 283
% de Fumaür 85,9% 14,1% 100,0%
Leve (1-15 cigarros/día) Recuento 58 29 87
% de Fumaür 66,7% 33,3% 100,0%
Total Recuento 301 69 370
% de FumaOr 81,4% 18,6% 100,0%
Infarto
No Sí Total
FumaOr Nulo Recuento 243 40 283
% de Fumaür 85,9% 14,1% 100,0%
Moderado (más de Recuento 23 6 29
15 cigarros día) % de FumaOr
79 ,3% 20,7% 100,0%
66
Pas eo de la Habana 9- 11, Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
Infarto
No Sí Total
FumaOr Leve (1-15 cigarros/día) Recuento 58 29 87
% de FumaOr 66,7% 33,3% 100,0%
Moderado (más de 15 Recuento 23 6 29
cigarros día) % de FumaOr
79 ,3% 20,7% 100,0%
1 casillas (25,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mínima esperada es 4,28.
En todas estas comparaciones no hay ninguna casilla con frecuencia esperada menor de 5 salvo
en la última tabla. En la Tabla 5.8 se muestra la significación estadística por la prueba de chi-
cuadrado de estas tres comparaciones mú ltiples.
Pero esta conclusión no es del todo correcta , porque a medida que se incrementa el número de
comparaciones aumenta el riesgo a de la hipótesis nula inicial. Es decir, el riesgo a global del
conjunto de comparaciones es superior al fijado a priori . Si se fija un riesgo a de 0,05 para cada
una de estas pruebas, la probabilidad de que una prueba tome la decisión correcta es 1 - 0,05
= 0,95 . Si se efectúan tres pruebas , como en este caso , la probabilidad de obtener una decisión
correcta se obtiene aplicando la ley multiplicativa de las probabilidades : 0,95 x 0,95 x 0,95 =
0,95 3 = 0,857 . La probabilidad de equivocarse en alguna de estas 3 pruebas , que equivale al
riesgo a del total de las 3 comparaciones, es a 3 = 1 - 0,95 3 = O, 143 (14 .3%). Por tanto, el riesgo
alfa global no es 0,05, sino 0,143 como puede verse en la Tabla 5.9, en la que se muestra :
67
Paseo de la Habana 9- 11, Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
PROCEDIMIENTO DE BONFERRONI
Los valores de p corregidos por Bonferroni se obtienen a partir de PBONFERRONI = P x k. En
este caso k=3. Cuando se quieren realizar 3 comparaciones con riesgo global a de 0,05, el
procedimiento de Bonferroni consiste en reemplazar la p de cada comparación por el valor p x 3.
Es un procedimiento excesivamente conservador.
Si la corrección da como resultado un valor superior a la unidad, se le asigna valor de p=1 que
es el valor máxima de una probabilidad .
PROCEDIMIENTO DE HOLM
Es una mejora del procedimiento de Bonferroni para aumentar la potencia del conjunto de
comparaciones y hacerle menos conservador. Consiste en ordenar de menor a mayor los valores
p obtenidos en las comparaciones múltiples y aplicar Bonferroni paso a paso.
La comparación de ambas medias (Tabla 5.10) y la inspección de los dos diagramas de caja
mostrados en la Figura 5.4 sugieren que sí son diferentes . Pero para obtener una conclusión se
debe aplicar una prueba estadística.
Tabla 5.10. Comparación de medias Obesidad- Glucosa.
GoBIR 68
Pas e o de la Habana 9- 11, i\tladrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
Figura 5.4. Box Plot de Glucosa No Obesos y Obesos. Comparación de medias Obesidad
- Glucosa.
300
50
o
No Si
Obesidad
Para realizar esta comparación y ver que prueba estadística se debe utilizar se sigue el
organigrama mostrado en la Figura 5.5.
Normalidad
(de Glucosa en cada grupo de Obesidad Si!No )
Pruebas: Ko lmogoroY- Smirnov y Shapi ro-Wilks
Gráficos: de om1ali<lad, de Caja. Hi stograma
Si !\o
Pmeba t de St udent-F isher
para grupos independi entes
Homogene idad de varianws
Pmeba de igualdad de varianzas de Levene Prueba no paramétrica
Varian7as ho mogéneas Va ri anzas no ho mogéneas lT de Mann-\Yhitnc~·
Prueba t de Student-Fisher para Prueb.1 t de Student-Fisher para
grnpos independ ientes y grupos indepcndiN1l es y
varia11z.1s homooé11e,1s v.ll'ianzas 110 homogéneas
SUPUESTO DE NORMALIDAD
Primero se debe evaluar si la variable cuantitativa en cada uno de los grupos de la variable
categórica , (en este caso la Glucosa en Obesos y en No Obesos) , sigue una ley Normal. La
normalidad se evalúa mediante los gráficos y las pruebas estad ísticas de normalidad, tal y como
se detalla a continuación .
GoBIR 69
Paseo de la Habana 9-11, Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
Numerosas pruebas estadísticas exigen que las variables cuantitativas se distribuyan según una
ley normal. El estudio de la normalidad por sí solo puede ser el objetivo de un estudio. Hay
diferentes métodos para comprobar este supuesto. De menor a mayor valor global son:
• Tamaño de muestra. En general se dice que muestras mayores de 30 son grandes y por
lo tanto automáticamente normales . Esto no es cierto, depende de su asimetría y de la
presencia de valores anómalos. El tamaño de muestra es de utilidad para elegir la prueba
estadística de normalidad y para interpretar su resultado . En muestras muy pequeñas
las pruebas estadísticas de normalidad son poco potentes para descartar la normalidad,
y aunque sean no significativas, no se debería asumir la normalidad y directamente se
pasaría a la estadística no paramétrica. En la Tabla 5.11 se muestra el tamaño de
muestra de Glucosa en obesos y no obesos.
• Índices de asimetría y apuntamiento . Las distribuciones que siguen una ley normal
tienen coeficientes de Asimetría (AS) y de Apuntamiento (AP) nulos. El supuesto de
normalidad se rechaza cuando el valor absoluto de alguno de estos coeficientes es
mayor o igual a dos veces su error estándar: !AS! ~ 2 x EEAS y/o IAPI ~ 2 x EEAP . Es
un método muy poco potente . Se utilizaba antes de aparecer las pruebas de normalidad .
En la Tabla 5.12 se muestran los índices de asimetría y apuntamiento con sus EE de
Glucosa en obesos y no obesos . El valor absoluto de los cuatro índices es menor que el
doble de su EE , aunque algunos (AP en obesos y AS en no obesos) están en el límite .
Por tanto, por este criterio, no se puede rechazar que la Glucosa en obesos y en no
obesos sigan la normalidad.
Histograma . Son visualmente los más intuitivos, pero pueden cambiar totalmente su
apariencia al modificar el número de clases. Lo más adecuado es hacerlo con un número de
clases que sea ✓ n. En la Figura 5.6 se muestran los histogramas de Glucosa en obesos y no
obesos . Se puede ver que ambas distribuciones son asimétricas y que no se ajustan a la
normalidad , pero más la de obesos.
70
Paseo de la Habana 9- 11, 1\rfadrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
Obosid~d : Si
.
ue
.
ue
e,
:, :,
u u
o
.:: e
u..
s.
50
Glucosa plasmática (mg/dl) Glucosa plasmática (mg/dl)
o
No Si
Obesidad
71
Paseo de la Habana 9- 11, Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
Gráficos de normalidad (Normal y Normal sin tendencias). Son los más adecuados,
aunque los más complejos de entender.
Se representa cada valor observado con el esperado en caso de seguir una ley Normal. Cuando
la variable sigue una ley normal perfecta la nube de puntos se sitúa sobre la línea inclinada
dibujada en el gráfico. En la Figura 5.7 se muestran los de la Glucosa tanto para obesos como
para no obesos. En ellos la nube se puntos se ajusta más o menos bien a la línea inclinada,
parece que más en los obesos que en los no obesos , lo cual es indicativo de normalidad .
OlMWtUd • Nr9
o
~
i 1
i
• i
•
lo 1o
z z ,1
·o •o•
'°' YalCW' obsc rvado
21ll
Vao, OOHrvado
lOO
Se representan cada valor observado con la desviación de cada valor respecto al valor esperado
en caso de seguir una normal perfecta . En este caso la línea horizontal indica la normalidad .
Además permite diferenciar los casos con anomalías en la asimetría como en el apuntamiento.
Por ejemplo el gráfico normal sin tendencias de la Glucosa de los no obesos de la Figura 5.8
presenta desviación negativa de los valores centrales y desviación positiva en los valores de
ambos extremos . Esto es propio de las distribuciones platicúrticas .
OIM11~4 ~ $1 OIMtld.MI: 1M
.,. ,.,.
. .
. . .
o, ..
.
. ... -.. ...
''°
.' ,.,
VIMll~urv.tdo
,., ,..
.
...
·-
.,_,..
o .
...
• ·\' '"'". .
""
'"
,,.
~ obs.erv~do
... ,,.
.
,..
72
Paseo de la Habana 9-11, Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
Son pruebas de bondad de ajuste, que comparan la distribución de los datos con una distribución
normal teórica. Las más utilizadas son :
Se utiliza para muestras pequeñas, estando el límite de tamaño de muestra entre 30-50 casos,
habitualmente menor o igual que 30 casos. Se puede emplear una prueba de normalidad en uno
de los grupos y la otra prueba de normalidad en el otro grupo dependiendo del tamaño de muestra
de cada uno de ellos.
Las pruebas de normalidad son muy sensibles al tamaño de la muestra . Para muestras muy
grandes, cualquier pequeña desviación de normalidad nos dará unos resultados significativos (p
:5 0,05) rechazando la normalidad. Por el contrario, cuando las muestras sean muy pequeñas,
grandes desviaciones de la normalidad serán estadísticamente no significativas por lo que casi
nunca podremos rechazar la normalidad. En general para tamaño de muestras de 10-11 casos
se pasa directamente a la estadística no paramétrica independientemente de cómo sean las
pruebas de normalidad . Por tanto, el tamaño de muestra es de utilidad para interpretar el
resultado de las pruebas estadísticas.
Prueba Estadístico gl p
Kolmogorov -Smirnov con la corrección de Lilliefors en Obesos 0,141 43 0,031
Shapiro-\Vilks en Obesos 0, 915 43 0,00•
Kolmogorov-Smirnov con la corrección de Lilliefors en o Obesos 0,093 69 0)00
Shapiro -\Vilks en o Obesos 0,924 69 <0,001
GoBIR 73
Paseo de la Habana 9- 11, Madrid. 9 11 610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
Trabajan ordenando los casos de menor a mayor según su valor de Glucosa, asignando a cada
caso el rango correspondiente a su orden o el rango promedio en caso de producirse empates y
realizando el análisis a partir de los números de orden obtenidos. Si no hay diferencias entre las
variables, los rangos estarán uniformemente repartidos en los dos grupos. Si por el contrario hay
diferencias, habrá predominio de rangos menores en uno de los grupos y rangos mayores en el
otro. A diferencia de las pruebas paramétricas en las que se comparan parámetros (la t de
Student se basa en la comparación del parámetro media), la pruebas no paramétricas reciben
este nombre porque no comparan parámetros, comparan la distribución de la variable en general,
contrastando si los grupos son equivalentes en su posición . Se utilizan para variables ordinales
(BIR-2003) o con categorías ordenadas y para variables cuantitativas que no cumplen las
condiciones de aplicación de la prueba paramétrica, tales como no seguir la normalidad (BIR-
2000 ; 2007) o tener asimetrías marcadas. Tienen las siguientes características:
• Tienen menos potencia. En general se estima que la potencia de una prueba no paramétrica
es el 95% de la potencia de su correspondiente prueba paramétrica. Pero a medida que aumenta
el tamaño de muestra aumentan su potencia estadística en relación a las no paramétricas. En
muestras menores de 11 casos la potencia de ambas pruebas es equivalente . Por este motivo
es aconsejable utilizar pruebas no paramétricas cuando la muestra es pequeña (BIR-2007) .
Pero si la variable difiere de forma muy manifiesta de la normalidad las pruebas no paramétricas
pueden tener más potencia que las paramétricas .
74
Pas eo de la Habana 9- 11 . 1\1/adrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
.,
l.
En los test paramétricos, las hipótesis se construyen a partir de la media o
la varianza, mientras que en los test no paramétricos se hace a partir de la
mediana (QIR-2005) (BIR-2017) .
1
Cuantifica el grado en que la
Significación est.1dístirn p = 0.02 relació1~ pueda ser debida al azar
1
Di fer ncia de medias (IC9 _0 o): Cuantifica la importancia clínica o
l\fagnitud del efecto
_ "2 (: - 59) mg , dl práctica del efecto
-- - ¿,La obesidad es la causa del Depende del diseüo d 1 estudio y
-
Relación caus.,I
aumento de la ~lucosa'? de que esté dcspro\·isto de sesgos
GoBIR 75
Paseo de la Habana 9-11, Madrid. 911610039
obtenidas de la misma población en la que no hay diferencias en la Glucosa en obesos y no
obesos, encontraremos una diferencia como la que nos ha salido o mayor.
• La magnitud del efecto. La importancia clínica o práctica del efecto se cuantifica con la
diferencia de medias (32 mg/dl) y sobre todo su IC95%, que en este caso es de 5 a 59 mg/dl
(Figura 5.9). Tomando el extremo más desfavorable del intervalo, se puede concluir que en los
obesos aumenta la glucemia al menos 5 mg/dl respecto a los no obesos. El investigador experto
en el campo de la diabetes es el que debe interpretar si la magnitud de esa diferencia es
clínicamente importante o tiene relevancia pronóstica (p. ej., si aumenta las complicaciones
metabólicas o la mortalidad). La estimación del efecto con la diferencia de medias y su IC95%
tiene las siguientes ventajas:
. --
1 .
lO o
1
1
1
;o
·~
1 1
,,; óO
RELACIÓN CAUSAL. Con la información obtenida de esta relación se puede concluir que la
glucosa plasmática es mayor en los obesos que en los no obesos, pero la evaluación de si la
obesidad es la causa del aumento de glucosa (relación causal) no depende del análisis
estadístico. La obesidad sería la causa del aumento del glucosa si los dos grupos fueran
comparables en todos los factores determinantes del aumento de glucosa (los conocidos y los
desconocidos) excepto en la obesidad. Esto depende del diseño del estudio y de que esté
desprovisto de errores sistemáticos o sesgos. El diseño experimental basado en la aleatorización
de la exposición es el que proporciona mayor evidencia causal. En los diseños observacionales
el análisis estratificado y el análisis multivariante con modelos de regresión permiten aproximarse
a la relación causal.
76
Paseo de la Habana 9-11, Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
Si las medias son similares, las variables no están relacionadas o son estadísticamente
independientes: la Glucosa no depende del nivel de masa corporal.
Si las medias son diferentes, las variables están relacionadas o son estad ísticamente
dependientes: la Glucosa depende del nivel de masa corporal.
]O] . 7 LLL~-•<lh
l 5 ,f .2 mg,•tU
) Obes "dod 174 ..., m,!'!.-dl
1
lm o '-iJ ~mal ,:illf p~ w ,
GoBIR 77
Paseo de la Habana 9-11, Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
~igun1 l 1.~ -2..: Co..!_11JJ~l'!l~iQn d~ res u~ ta rll~1it~1i,•a )_'.l!_rt>dictora p9litón1ic-.a: G/!!_1Y1íj_tí --.: Q ~.s;dadOr. _
Norn.mli,hut
(ck Gl w: o.rt;J e-1 1 ad.a .-.-ntpú d e- Ol,r..údadOr)
Pmeba ~: Kalmo~rov-Smi ~av , , hupiro-\Vilks
Gráficos : de Nm,nalicb-:d, de C:ija._, Histo~rama.
lguahl:.11il di!' Y.-riaurz;.is
Pnrnba d . L .\·en.?
• Supuesto de Normalidad.
Primero se debe evaluar si la variable cuantitativa en cada uno de los grupos de la variable categórica,
(en este caso Glucosa en IMC Normal, Sobrepeso y Obesidad), sigue una ley normal. La normalidad
se evalúa mediante los gráficos y las pruebas estadísticas de normalidad . Las pruebas de normalidad
(Tabla 5.15) de este ejemplo indican que no se cumple la normalidad , porque la prueba de
Kolmogorov-Smirnov con la corrección de Lilliefors en Obesidad (n = 43) es significativa (p = 0,031)
aunque sean no significativas las prueba de Shapiro-Wilks en IMC Normal (n = 18; p = 0,068) y la de
Kolmogorov-Smirnov con la corrección de Lilliefors en Sobrepeso (n = 51 ; p = 0,200).
Los gráficos de normalidad de Glucosa , también sugieren que no se cumple la normalidad. En los
gráficos Normal los puntos serpentean la diagonal y en los gráficos Normal sin tendencias se alejan
de la recta horizontal de manera asimétrica en los lados (Figura 5.12).
GoBIR 78
Paseo de la Habana 9- 11, At/adrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
Orifico n ormal de Glucou p l,nm/a1ic.a (mg.'dl) Gnaflco normal sin tondonclu de Glucosa pl.asm.átic a (mgldll
lmc H.otm•I IMC NotYn•I
3- 1,$
/'
i-
/ • '·º
•
..
1
.
i ✓/ e
1
.,.
1 .i .- 1
.., u -
D
1 1zo o- .1/·
• 1
0
.
~ •
•
'
:,.-,7 o,.
•
•
•
•
·• • •
,,✓'•
1
• • •• •
• •
~ .0,5
G4'áflco normal de Grucoa.a p la-am · ·llca (mgldl) Griflco normal Sin tend•nclH d• GIIJCOH pl.a&m.ltl~ (mg/dll
3
--- ~ obropHO
-- --· ----- 0,6
-- $<)~114~ -
---- -
2
.,~-
.,,, o.•
• ••
••• •
o / .
-¡ _.,,
·' 1 •
/ ....
i
1
✓{ ,. 0
0.2
• •
e •
•
g ,,,,.. ,1/ ..,•
~ • .• •
.,,, .. .. .
0--
o.o -
~
%
1
o • • :• \. •
J,'"7 •
,,,:.
,.,,,.,, •• •• • • • • ••
•I -<J ,2
•
• •
-1' • .o,.-
o 100 too )00 50 100 150 ,w 250 )00
Gt.ifico n ormal de Ghlcou plaam:llica (mgldl) Gráfico Q.Q nom,al sin tendencia-a de Gtucoa.a pl.umátlc.i Cmgtdl)
Ob4tliftd p.tr• Ob.lllld.ldOr• ~ t o
• 0,75'·
1 •
• .-
2
.o.2s-
•
•
••• -
. ... •
•
•
• '
1
-
~
79
Paseo de la Habana 9- 11, Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
Prueba Estadístico }
Prueba Estadístico gJ ))
Igu aldad de varianzas de Le\'enc F = 2,838 2: 109 0,063
A ·ovA F = 6,100 _:109 0.003
H de Kmskal-Wallis X2 = 10.99 2 0,004
de tendencia lineal del OV F = 11. 184 0.001
de Jonckheere-Te stra JT = 2.98 0,003
Pruebas de tendencia
Cuando la variable exposición tiene categorías ordenadas, como sucede en este caso con la
variable ordinal Nivel de masa corporal Normal/Sobrepeso/Obesidad, puede ser interesante
evaluar si el cambio en las categorías de Nivel de masa corporal está asociado a un cambio
de Glucosa, es decir si hay tendencia creciente (al aumentar el Nivel de masa corporal, aumenta
la glucosa) o decreciente (al aumentar el Nivel de masa corporal disminuye la Glucosa) . Es decir
comprobar la siguiente hipótesis: MIMC NORMAL< MSOBREPESO < MOBESIDAD. Viendo las
tres medias, los tres diagramas de caja, parece que a medida que crece el Nivel de masa
corporal hay una tendencia creciente en los valores de Glucosa. Esta tendencia creciente puede
tener varios componentes: lineal, cuadrático, cúbico, etc.
GoBIR 80
Pas eo de la Habana 9- 11, J\l/adríd. 911 6 10039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
Valora la tendencia lineal. Aquí resulta estadísticamente significativo (F=11, 184; p=0,001) (Tabla
5.16) . Esto significa que existe relación lineal positiva entre el Nivel de masa corporal y la Glucosa.
También se puede comprobar si hay tendencia cuadrática, cúbica, etc. con las correspondientes
pruebas de tendencia cuadrática, cúbica, etc. del ANOVA.
81
Paseo de la Habana 9-11, i\lladrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
Tipo de
com ,lmciones múlti les
Todas las posibles Respecto a una
comparaciones múlt iples categoría de referencia
Tammio d~ grupos simil.u,
Normalidad e loual,fa<l Je , ·,lrianz.as
Prueba de
No 1
Dunnett
Prueba de Prueba de
Scheffé Tukey
Prueba de Bonferron i
Al igual que la anterior tiene valor histórico y didáctico. Ambas pruebas son los dos extremos:
DSM no corrige nada el riesgo alfa (aumenta el error aleatorio tipo 1) y Bonferroni lo corrige
demasiado siendo poco potente (aumenta el error aleatorio tipo 11). Se aconseja utilizar las
pruebas de comparaciones múltiples de potencia intermedia que se describen a continuación .
GoBIR 82
Paseo de la Habana 9-11, Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
Tabla 5.18. Comparaciones múltiples t-Student con Bonferroni Nivel de masa corporal -
Glucosa
Com p,wación p Diferencia de medias (m2/dl) IC 9S% (111~/dl)
Imc omrnl - Sobrepeso 0.04 0 47 .2 1.6 - 92,9
Imc om1al - Obeso 0.002 67, l 20,4 - 11 3,9
Sobrepe o - Obeso 0.490 19,9 l -t .6 - 54.4
Prueba de Tukey
Prueba de Scheffé
Es aplicable tanto si el número de elementos por grupo es igual o diferente , por lo que se puede
utilizar en caso de tamaños de grupos diferentes . Es robusta , tanto si no se cumple la igualdad
de varianzas en todos los grupos como si no se cumple la normalidad , por lo que se puede utilizar
en caso de vulneración de los supuestos de normalidad o igualdad de varianzas .
Prueba de Dunnett
• Correlación.
• Reg resión lineal simple.
GoBIR 83
Pas eo de la Habana 9- 11, Madrid. 911610039
1
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
Diagrama de dispersión
Se realiza con la variable respuesta en ordenadas y la variable exposición en abscisas. La forma
alargada y ascendente de la nube de puntos sugiere una asociación lineal positiva entre ambas
variables. En el ejemplo propuesto en la figura, se observa que al aumentar el índice de masa
corporal, se obtienen valores mayores de glucosa. Se puede ajustar la recta de regresión por el
método de mínimos cuadrados, obteniendo la recta que minimiza la suma de residuales al
cuadrado . Examinando la desviación de la recta de regresión respecto a la horizontal se puede
analizar la relación lineal entre dos variables cuantitativas .
• Una recta horizontal o vertical indicaría que las variables no están relacionadas
linealmente.
• Por el contrario, una recta inclinada indicaría asociación lineal.
.
•• • •
••
• '.• .
. . • ••. .•
•
•
. . .
->
1 20 .. . . .
.,
fll
..!:!
15
• •
••
• •
.. . • •
111
111
. .
a.
111
111 ... . . . . ,.
a
o
u
::, ••
•
.. • •• • - ••• •• •
, ••
•
••••
' ' -
15,0 20,0 25,0 30,0 35,0 40.0 45,0
GoBIR 84
Paseo de la Habana 9-11, Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
Correlación
Los índices más empleados para describir conjuntamente y valorar el grado de asociación
lineal entre dos variables cuantitativas son:
rxy=sxy/sxsy=SPxy/ f SSxSSy
Es un indicador del grado de asociación lineal (BIR-2004) (FIR-2004; 2006; 2009; 2011; 2015)
entre las dos variables cuyo valor oscila entre -1 (asociación lineal negativa perfecta,
pendiente negativa) (QI R-2013) y +1 (asociación lineal positiva perfecta) (QI R-2013)
pasando por O (ausencia total de asociación lineal).
85
Paseo de la Habana 9-11, Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
malo, entre 0,4 y 0,7 es aceptable y mayor de 0,7 es bueno. Pero en investigación en
poblaciones humanas y en biología o sociología, en general la variabilidad es mucho
mayor por la mayor complejidad y un coeficiente de correlación de 0,4 es bastante
aceptable.
• No detecta relaciones curvilíneas que son crecientes en un intervalo y decrecientes en
otro .
• Se puede emplear con variables ordinales y puede valorar una asociación entre las
variables más general que la lineal.
Para poder ser aplicado se requiere que la nube de puntos tenga una forma más o menos elíptica
y que las dos variables cuantitativas sigan leyes normales .
Ejemplo: Sir= 0.90 y R 2 = 0.81. Esto indica que el grado de asociación lineal entre las
variables es alto, y concretamente el 81% de la variación total de los valores de la
compresión pueden ser explicados mediante la recta de regresión ajustada.
Se utiliza en vez del r de Pearson cuando las variables cuantitativas no cumplen las
condiciones de aplicación o para variables ordinales. Al igual que otras pruebas no
paramétricas se basa en ordenaciones y no se ve afectado por los valores anómalos. Es más
robusto que el de Pearson y al no precisar condiciones de aplicación se puede emplear siempre .
• Coeficiente de correlación r de
Pearson
• Coeficiente de correlación ordinal Rho de
Spearman (p)
86
Paseo de la Habana 9- 11, Madrid. 911 610 039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
La covarianza entre Glucosa-lMC es 78,2 Kg/m 2 x mg/dl y entre Peso-Talla es 85,7 Kg x cm.
Estos valores indicarían un grado de asociación lineal similar, pero están influidos por las
unidades de med ida.
87
Paseo de la Habana 9- 11, Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
,i/
b,.
Cuando consideramos el valor ajustado mediante el modelo de regresión lineal para un valor
fijo x:
y= a+ bx
tenemos, en realidad , un estadístico . La varianza de este estadístico es conocida como varianza
residual, la cual resulta igual a:
La varianza residual coincide también con la suma de cuadrados de las diferencias entre los
valores de la variable dependiente observados y estimados por la recta, dividiendo el resultado
final por el tamaño de la muestra . Esta varianza residual es clave para estimar intervalos de
confianza en este modelo (QIR-2005)
b) Sin embargo si son significativas, sí que puede considerarse que los datos de la muestra no
se ajustan al valor teórico.
88
Paseo de la Habana 9- 11, Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
La Tabla 5.20 ofrece los valores observados y esperados de Sexo en cada categoría y la
diferencia entre ellos. En la muestra hay 44 mujeres y 68 hombres. En una población con un
50 % de hombres y mujeres deberíamos esperar 56 hombres y 56 mujeres, es decir hay 12
hombres de más y 12 mujeres de menos.
La cuestión es: ¿cual es la probabilidad de obtener por el error aleatorio de muestreo una muestra
de 44 mujeres y 68 hombres de una población con igual número de hombres y mujeres?
En ocasiones es necesario verificar la hipótesis de que la muestra procede de una población con
una determinada media en una variable cuantitativa.
Por ejemplo, si se parte de una muestra, con una media de IMC de 29,3 kg/m 2 y ésta procede de
una población con una media de IMC de 25 kg/m 2 , el análisis de esta comparación se puede
GoBIR 89
Paseo de la Habana 9- 11, ivladrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
realizar con la prueba t de Student para una muestra o con la prueba no paramétrica T de
Wilcoxon según se cumpla o no la normalidad, respectivamente, como se muestra en Tabla 5.21
Prueba t de Student-Fisher.
La circunstancia diferenciadora más frecuente suele ser el tiempo, como analizar una variable
(p. ej . glucemia) antes y después de administrar un tratamiento (p. ej. un nuevo antidiabético).
Son los diseños pre-post. Además del tiempo pueden darse con otras circunstancias
diferenciadoras como aplicar un colirio a un ojo y el placebo al otro, o bien un tratamiento tópico
en un brazo y otro distinto o placebo en el otro brazo, etc.
90
Paseo de la Habana 9-11 . Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
Ejemplo:
A todos los sujetos del estudio se les ha sometido a un tratamiento dietético y farmacológico
durante 6 meses con el fin de reducir su peso . Se obtiene el peso al finalizar el tratamiento, que
llamaremos Peso final, y supuesta estable la talla, un IMC al final del tratamiento que
llamaremos IMC final. Se trata de un diseño de grupos apareados pre-post con un solo grupo.
El análisis se realiza con pruebas estadísticas que permiten estudiar el cambio que se produce
en la respuesta al pasar de un estado inicial a una respuesta final. Tienen la gran ventaja de
eliminar la variabilidad entre sujetos, pero al no existir un grupo control disminuye la certeza de
atribuir el cambio observado en la respuesta a la intervención, ya que entre ambos momentos
pueden haber ocurrido otras circunstancias, además de la exposición, que sean las responsables
del cambio observado.
La eficacia del tratamiento contra la obesidad se puede analizar con el estudio de la relación
entre las variables inicial y final con las pruebas estadísticas para grupos apareados que
dependen de la escala de medida de las variables utilizadas.
VARIABLE
BINARIA POLITÓMICA CUANTITATIVA
respuesta
BINARIA Prueba de
McNemar
POLITÓMICA
Prueba de McNemar-Broker
91
Paseo de la Habana 9-11, Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
..• .
40,0-
i 35,0- .. • •.•• . .
. •••• . . •• ....
a, • ••
~ lo
• • .:, •
¡¡¡
e: JO.v
:;:
1 ••• .
.
¡¡¡
o
...c.o
........: ...·:-... •"' • •
25,0-
.
·' ." ....
u •••
, •.
fll
u,
~ •
•
4> 20,0- •
"C •••
4>
l) • •
. ••
"C •
..E
15,0-
• •
.
10,0-
1 1 1 1
Estas líneas horizontal y vertical dividen a los casos en dos grupos según sean obesos al final
(puntos por encima de la horizontal) o al inicio (puntos a la derecha de la vertical) o no sean
obesos al final (puntos por debajo de la línea horizontal) o al inicio (puntos a la izquierda de la
vertical). Estas dos líneas dividen el gráfico de dispersión en cuatro cuadrantes que aportan una
información similar a la tabla de contingencia de Obesidad inicial y Obesidad final) que se
muestra a continuación:
Obesidad final
Obesidad
NO SÍ Total
inicial
SÍ 15 28 43
NO 63 6 69
Total 78 34 112
El cuadrante superior izquierdo contiene 6 puntos correspondientes a los no obesos antes del
tratamiento y obesos después del tratamiento . En estos sujetos el tratamiento ha sido perjudicial.
Contiene 15 puntos, que son los 15 obesos antes del tratamiento que dejan de serlo después del
tratamiento . En estos casos el tratamiento es beneficioso. Los datos de estos 21 casos sugieren
un efecto beneficioso del tratamiento : 15 pacientes mejoran y 6 empeoran.
92
Pas eo de la Habana 9- 11, Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
Contiene 28 obesos antes del tratamiento que continúan siéndolo después de él. El tratamiento
tiene efecto neutro sobre ellos.
Contiene 63 no obesos antes y después del tratamiento . El tratamiento tiene efecto neutro sobre
ellos .
Ojo: El grado de asociación entre las variables Obesidad inicial y Obesidad final se mide
mediante la prueba de independencia de chi-cuadrado . Es importante no confundirla con la
prueba de simetría exacta de McNemar que es la prueba de homogeneidad para datos
apareados . En nuestra hipótesis esta prueba de independencia de x2
carece de interés porque
lo que nos interesa es valorar el efecto del tratamiento sobre la obesidad independientemente de
que exista asociación entre la Obesidad inicial y final.
Ojo: Otra prueba no paramétrica que se utilizar para comparar variables cualitativas apareadas
es la Q de Cochran (3 o más muestras) (QIR-2005).
En la Tabla 5.27 se observa que la media de IMC final es menor que la inicial. De la misma
forma que el diagrama de caja muestra que el IMC final es menor que el inicial lo que también
sugiere eficacia del tratamiento .
GoBIR 93
Paseo de la Habana 9-11, Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
Tabla 5.27. Comparación de medias y diagrama de caja IMC inicial - IMC final.
T
•
La Figura 5.16 representa el diagrama de dispersión de IMC inicial y final. La línea diagonal
media se corresponde con la función y= x; en este caso IMC final= IMC inicial. Muestra de forma
clara la lógica de la prueba t de Student para grupos relacionados para valorar la eficacia del
tratamiento contra la obesidad y el cambio en el /MC final respecto al inicial.
La lineal diagonal media representa la ausencia de efecto: el /MC inicial es igual al final. La
distancia vertical entre cada punto a la diagonal es el cambio de IMC en kg/m 2 en cada sujeto a
consecuencia del tratamiento . Es la variable Diferencia de IMC. La nube de puntos sugiere un
efecto beneficioso del tratamiento , porque la mayor parte de los puntos están por debajo de la
diagonal: el IMC final es predominantemente menor que el inicial, es decir, el tratamiento
antiobesidad disminuye el IMC.
..
4(),
i ..
J5,
: .. ..
~ 30,
..... ·, . ..
. ::- - .
1 • • • :,. •
-¡:;
o
a. .. : ::· .
;
~
u
"'
25,
...
:• ...... .
g
_g 20,
.,u I ••
:¡;
e:
·- 15,
10,0
GoBIR 94
Paseo de la Habana 9-11, Madrid. 911610039
1
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
• Si IMC inicial e IMC final son iguales (HO: IMC final - IMC = O) la diferencia será nula
(Diferencia de IMC = O) , el estadístico de contraste de la t de Student valdrá cero y la
prueba será no significativa .
• A medida que los valores de IMC inicial e IMC final se van haciendo más diferentes, el
valor de la diferencia aumentará, al igual que el valor del estadístico de la t de Student y
la prueba se hará más significativa.
Esta prueba sirve para evaluar el efecto de una exposIcIon, en este caso el tratamiento
antiobesidad, sobre una respuesta, en este caso el cambio de IMC. Pero para valorar el grado
de asociación lineal entre el IMC inicial y final se utiliza el coeficiente de correlación de
Pearson entre ambas variables . En nuestra hipótesis esta prueba carece de interés porque lo
que nos interesa es valorar el efecto del tratamiento sobre el IMC independientemente de que
exista asociación entre ambas variables .
En la Tabla 5.29 se ofrece el resultado de la prueba t de Student para grupos apareados (p <
0,001 ). Se puede concluir que el tratamiento contra la obesidad disminuye estadísticamente
el IMC. Además informa de la magnitud del efecto: la media de las diferencias de IMC es 2,2
(IC95%: 1,7 - 2,8) kg/m 2 . El IMC final es, en promedio, 2,2 kg/m 2 y al menos 1,7 kg/m 2 (extremo
más desfavorable del IC95%) menor que el inicial.
La significación estadística también se puede deducir del IC95% : al no incluir la hipótesis nula
(el cero) la diferencia es estadísticamente significativa al menos al 5% (p < 0,05).
95
Paseo de la Habana 9-11, i\,·fadríd. 911 610 039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
También llamada prueba de los rangos con signo de Wilcoxon, es la prueba no paramétrica para
comparar dos variables cuantitativas apareadas utilizada cuando no se cumple el supuesto de
normalidad. En esta caso también es significativa, p < 0,001.
96
Paseo de la Habana 9-11, 1\tladrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
GoBIR - - - - - - - 97
Paseo de la Habana 9- 11, 1'vladrid. 91161 0039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
Las pruebas utilizadas para analizar la Fiabilidad dependen de la escala de medida de la prueba
diagnóstica. El índice Kappa se utiliza para variables categóricas nominales, el índice kappa
ponderado para variables categóricas ordinales y Coeficiente de Correlación lntraclase (CCI)
para variables cuantitativas (Figura 6.2).
GoBIR 98
Pas eo de la Habana 9-11 . 1\,fadrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
Radiólogo A
Rad.B Neumonía No Neumonía Total
Neumonía 50 5 55
No Neumonía 10 35 45
Total 60 40 100
• Acuerdo observado
El Acuerdo observado (Ao) también llamado Acuerdo específico global o Acuerdo porcentual es
la medida de acuerdo más sencilla. Se valora la coincidencia o acuerdo en los resultados
positivos (acuerdo específico positivo) y negativos (acuerdo específico negativo) .
Se puede obtener sumando los efectivos observados en las casillas concordantes y dividirlo por
el número total de sujetos (en negrita) :
(50+35)/100=0,85.
Es decir, el cociente entre la suma de pares concordantes y el total de sujetos. Su valor oscila
entre O (discordancia total) y 1 (Acuerdo máximo o total). Tiene el inconveniente de no tener
en cuenta los acuerdos que se producen simplemente por azar.
• Acuerdo esperado
El Acuerdo esperado (Ae) por azar, en el caso de independencia perfecta entre las mediciones,
se vería cuando la tabla de contingencia mostrara los valores esperados bajo el supuesto de que
no existe relación entre las variables A y B.
• Acuerdo real
El acuerdo real es el observado menos el esperado por azar. En este caso sería: Ao - Ae.
• Acuerdo potencial
El acuerdo potencial sería el acuerdo máximo menos el debido al azar. Sería: 1 - Ae. Es la
máxima concordancia real que se puede obtener cuando hay acuerdo perfecto. Es el acuerdo
que queda por explicar después de quitar la influencia del azar.
Índice kappa
El índice kappa de Cohen es el cociente entre el acuerdo real y el acuerdo potencial. Es la
proporción de acuerdo real respecto al potencial. Soluciona el inconveniente del acuerdo
esperado teniendo en cuenta la coincidencia esperable por azar. Incluye sólo los acuerdos que
supuestamente no se deben al azar.
Landis y Koch propusieron la siguiente escala de valoración del índice kappa y desde entonces
ha sido ampliamente utilizada .
99
Paseo de la Habana 9- 11, Madrid. 911 610 039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
El cálculo del CCI se basa en el modelo de análisis de la varianza con medidas repetidas o
intrasujeto o de dos vías: la correspondiente a los sujetos y la correspondiente a los observadores .
Si se somete a varios sujetos a varios evaluadores, la variación total obtenida puede
descomponerse en tres componentes:
Los valores del CCI oscilan entre O (ausencia total de concordancia) y 1 (concordancia
absoluta). Su interpretación es similar a la del kappa, que aunque algo arbitraria, se tiende a
aceptar las categorías propuestas por Fleiss (Figura 6.4) :
Hay dos tipos de CCI, de Consistencia y de Acuerdo. La diferencia entre ambos y con el
coeficiente de correlación de Pearson se observa analizando la relación entre las variables X e
Y en los 4 ejemplos de la Figura 6.5 que se muestra a continuación. Cuando las valoraciones de
X e Y son idénticas, los tres coeficientes valen 1.
100
Paseo de la Habana 9-11. Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
;:
)O
X
. . ,o
X
,. . .
...,.
10 ,.
X
)O . 10
X
.
C) Disconlancia ¡u-oporcio na l D) Disconlancia proporcional \" constante
Y=X Y=X
YJ =X / 2 Y-l=X / 2 - 5
orrelación r de Pearson .. .. . . LO Correlación r de Pearson . .. ... 1.0
CCI de Consiste ncia . . . . . . . . . 0.80 CCI de Consistencia . . ...... . . O. O
CCI dt: Acuerdo bsoluto . . . 0 ,50 CCI de b · luto ... 0.36
GoBIR 101
Paseo de la Habana 9-11, ,\tfadnd. 911 61 0 039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
Las pruebas se considerarán válidas, siempre y cuando se realice esta clasificación con pocos
errores comparados con la prueba de referencia a la que se denomina "gold standar''.
,o
Estado
GoBIR 102
Paseo de la Habana 9-11 . Madrid. 911 610 039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
1 S = VP/(FN+VP) 1
Especificidad (E) (BIR-2001; 2006; 2014) (FIR-2001; 2016 ; 2017) (OIR-2013 ; 2015)
Proporción de diagnósticos negativos obtenidos al aplicar la prueba en una población de sujetos
con la enfermedad . Es la proporción de sanos correctamente identificados. Es la capacidad
del test para detectar a los sanos.
1 E = VN/(VN+FP) 1
1 VG = (VP+VN)/(VP+FN+VN+FP)
Estado
Solución: S = 54/54 =1
E = 2/80 =0,02
Interpretación: Es una prueba extraordinariamente sensible (en todos los enfermos da positivo),
pero muy inespecífica .
A tener en cuenta:
Cuando la prueba proporciona un resultado cuantitativo, estos índices dependerán del punto de
corte seleccionado, es decir, el valor de la prueba a partir del cual vamos a considerar que un
sujeto presenta o no la enfermedad.
GoBIR 103
Paseo de la Habana 9-11, Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
Valores
Negativos Positivos
B) Prevalencia.
Estos índices son independientes de la prevalencia de la enfermedad, puesto que sólo se tienen
en cuenta para su cálculo sujetos enfermos (sensibilidad) o sujetos sanos (especificidad). Sin
embargo, las características de los pacientes de la muestra a los que se les aplicará la prueba,
pueden guardar relación con la prevalencia de la enfermedad y con la sensibilidad y especificidad
de una muestra concreta. Por ejemplo:
La sensibilidad de un marcador tumoral medido en pacientes con fases avanzadas del cáncer es
superior a la medida en una muestra con cáncer de escasa evolución.
Los valores aceptables de estos índices dependen del tipo de patología que se estudia y
de los objetivos de la prueba diagnóstica. Una prueba tiene una exactitud aceptable si su
sensibilidad y especificidad alcanzan el umbral de 0,8 (80%).
GoBIR 104
Pas eo de la Habana 9- 11, 1\tfadrid. 9116 10039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
RAZONES DE VEROSIMILITUD
Las Razones de Verosimilitud (Likelihood Ratios, LR) para positivos (RVP) y para negativos
(RVN) también valoran la validez o exactitud diagnóstica de una prueba, pero con la ventaja de
relacionar en una sola medida la sensibilidad y la especificidad .
1 RVP = S/(1-E) 1
Curva ROC.
La Sensibilidad y la Especificidad dan una medida de la exactitud de una prueba diagnóstica para
un determinado punto de corte cuyo valor depende del contexto en el que se aplique la prueba.
Una medida más global para evaluar la validez diagnóstica de una prueba para el conjunto de
todos los posibles puntos de corte se obtiene mediante la curva COR (Características Operativas
para el Receptor) o curva ROC (Receiver Operating Characterístic). Una curva ROC se construye
calculando la Sensibilidad y la Especificidad para todos los posibles puntos de corte y
representando la Sensibilidad en el eje de ordenadas Y, y el complementario de la Especificidad
(1-E) en el de abscisas X . La estimación no paramétrica de la curva ROC se dibuja uniendo los
pares de puntos (S;1 - E) correspondientes a cada punto de corte con una función escalonada.
El gráfico de la curva ROC ofrece una imagen visual de la validez diagnóstica de la prueba, que
oscila entre estos dos extremos:
Discriminación perfecta
Discriminación nula
Prueba sin validez diagnóstica (S = 0,5 ; E = 0,5). Tiene una probabilidad de 0,5 de identificar
correctamente a un enfermo y a un sano , que es la probabilidad que le corresponde simplemente
por azar. La curva ROC ocupa la diagonal principal del gráfico .
GoBIR 105
Paseo de la Habana 9-11, J\,·ladrid. 911 610 039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
Área bajo la curva ROC: En inglés AUC (Area Under Curve), es una media de la validez o
exactitud global de la prueba. Su valor oscila entre 0,5 (nulo valor diagnóstico) y 1 (máximo valor
diagnóstico).
Es posible comparar dos pruebas diagnósticas dibujando sus curvas ROC en el mismo gráfico y
calculando sus AUC. La mejor prueba será aquella que se acerque más a los lados izquierdo y
superior del gráfico y cuya AUC sea mayor.
La curva ROC proporciona una imagen gráfica que ayuda a escoger el punto de corte óptimo,
pero su selección no es fácil porque supone asignar el coste de los falsos positivos (CFP) y el
coste de los falsos negativos (CFN) y es necesario conocer la prevalencia de la enfermedad en
el ámbito de aplicación de la prueba.
1 VPP = VP/(VP+FP)
Indica la probabilidad de que una persona con un resultado positivo tenga en realidad la
enfermedad.
1 VPN = VN/(VN+FN)
Indica la probabilidad de que una persona con un resultado negativo no tenga en realidad
la enfermedad.
Go51R 106
Paseo de la Habana 9- 11, M adrid 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
Estado
Negativo 48 5 53
Positivo 2 45 47
En el ejemplo, VPP = 45/47 = 0,957, el 95,7% de los casos con una prueba positiva son realmente
diabéticos.
En el ejemplo, VPN =48/53 = 0,906. El 90,6% de los casos con una prueba negativa realmente
no son diabéticos .
1 P = (VP+FN)/(VP+FN+VN+FP).
Los valores predictivos son una buena medida de la utilidad clínica global de la prueba porque
incorpora información tanto de la prueba (Sensibilidad y Especificidad) como de la población a la
que se aplica la prueba (Prevalencia). Los obtenidos en una muestra concreta son los valores
predictivos de la prueba cuando se aplica a una población con una determinada prevalencia P
de la enfermedad. El comportamiento de la prueba cambia al hacerlo la prevalencia de la
enfermedad en la población en la que se aplica la prueba.
Teorema de Bayes
Permite determinar los valores predictivos (que serían probabilidades a posteriori) de una prueba
a partir de la S y la E de la prueba y la P ó probabilidad previa de la enfermedad de la probabilidad
a la que se aplica. Las fórmulas de cálculo son:
VPP = PxS/(PxE+(1-P)x(1-S)]
GoBIR 107
Pas eo de la Habana 9- 11, iWadrid. 9 11 610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
VPN = (1-P)xS/[Px(1-S)+(1-P)xS]
PROBABILIDADES
P(A) 1
P(A) = p (A + B) = 2 = 0,5 = 50%
La probabilidad de sacar cara al tirar una moneda será del 50%.
Ej.: si se tira un dado, la probabilidad de obtener el número "2" es 1/6. Pero si se sabe que al tirar
el dado ha salido un número par sin saber de qué número se trata, la probabilidad de que sea un
"2" ya no es la anterior sino que será de 1/3.
GoBIR 108
Paseo de la Habana 9- 11 . 1\tfadrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA
Teorema de Bayes
B
P(Al). P(Al)
p(AljB) = B B
P(Al) . P (Al)+ P(A2). P(Az) _J
. 1
\ _)
1_· '
( )
GoBIR 109
Paseo de la Habana 9-11, M adrid. 911610039
GoBIR
PREGUNTAS ESTADÍSTICA
OFICIALES
PROPIAS
ESTADÍSTICA
BIR 00 RC:5
86. ¿Qué estadístico utilizaría para comparar la
variabilidad de dos métodos de medición de glucosa que 92. Los índices descriptivos que resumen la información de
utilizan unidades de medida diferentes?: una población se denominan:
87. ¿Cuál de los siguientes tests estadísticos permite 93. La capacidad de un test de hipótesis para detectar
comprobar si los datos de una muestra siguen una diferencias significativas cuando realmente existen se
distribución normal?: denomina:
88. NO es una medida de asociación: 94. Cuando a todos los datos de una muestra se les
multiplica por 10, la:
l. Coeficiente de correlación.
2. Riesgo relativo. l. Media aumenta en 100.
3. Coeficiente de correlación de 5pearman. 2. Media no varía.
4. Odss ratio 3. Varianza aumenta en 10.
S. Coeficiente de variación. 4. Desviación típica no varía.
S. Desviación típica aumenta en 10.
BIR00 RC:5
BIR 00 RC: Anulada
89. Los test de hipótesis no paramétricos se utilizan
cuando: 95. En un grupo de pacientes diabéticos se mide el nivel de
glucosa antes y después de un tratamiento. ¿Qué test
l. La variable se distribuye normalmente. estadístico permitiría comprobar la eficacia del
2. La variable se mide en escala de intervalo. tratamiento suponiendo que la variable no se distribuye
3. El tamaño muestra! es grande. normalmente?:
4. La variable no se distribuye normalmente.
5. La variable sigue una distribución f de Fisher-Snedecor. l. Wilcoxon de muestras apareadas.
2. U de Mann-Whitney de muestras apareadas.
BIR 00 RC:4 3. Kolmogorov-Smirnov de muestras independientes.
4. U de Mann-Whitney de muestras independientes.
90. Si en una muestra la medida aritmética es menor que 5. Wilcoxon de muestras independientes.
la mediana:
BIR 00 RC:l
l. La muestra es asimétrica negativa.
2. La muestra es simétrica. 96. El test estadístico más adecuado para medir la
3. El SO% de los valores son menores que la media. intensidad de asociación entre el peso (Kg) y el nivel de
4. La muestra es asimétrica positiva. colesterol (mg/l00ml) en un grupo de 100 individuos es:
5. Más del SO% de los valores son menores que la mediana.
1. T de student de muestras independientes.
BIR 00 RC: Anulada 2. Chi-cuadrado.
3. T de student de muestras apareadas.
91. ¿Cuál de los siguientes estadísticos es de forma?: 4. Correlación r de Pearson.
5. U de Mann-Whitney.
l. Mediana.
2. Moda. BIR 00 RC:4
3. Cuartil.
4. Percentil.
S. Coeficiente de curtosis.
BIR Oficiales Asignatura: Estadística
97. En una muestra de 30 individuos se ha medido la los pacientes, la interacción (fármaco x sexo) presenta una
presión arterial (mm Hg) y la presencia de antecedentes p=0,015. Se interpreta que el:
familiares de infarto (SI/NO). Estas variables son,
respectivamente: l. Efecto del fármaco es mejor en hombres.
2. Efecto del fármaco depende del sexo de los pacientes.
l. Cuantitativa discreta y cualitativa nominal. 3. Efecto del fármaco no depende del sexo de los pacientes.
2. Cuantitativa continua y cualitativa ordinal. 4. Fármaco es solo efectivo en mujeres.
3. Cuantitativa continua y cualitativa discreta. 5. Fármaco no es efectivo.
4. Cuantitativa discreta y cualitativa nominal.
5. Cuantitativa continua y cualitativa nominal. BIR 01 RC:2
254. En la ecuación de regresión (y=2,95+0,8x), el l. Por cada año de edad, la presión arterial Disminuye en
coeficiente 2,95 significa: 1,8 mm Hg.
2. La edad es la variable dependiente.
l. Por cada unidad de cambio de las variables X, la variable 3. 104 corresponde a la pendiente de la recta.
Y aumenta 2,95. 4. La presión arterial es la variable independiente.
2. Es el punto de intersección de la recta de regresión con el 5. Por cada año de edad, la presión arterial aumenta en 1,8
eje de ordenadas. mmHg.
3. Si X=0 la variable Y será 0,8.
4. Es el valor de la variable Y cuando la variable X vale 0,8. BIR 01 RC:5
5. Es la pendiente de la recta de regresión.
91. Para comprobar si un fármaco disminuye el nivel de
BIR 00 RC:2 glucosa en un grupo de 40 pacientes diabéticos, el test
estadístico más adecuado es:
86. Al comprobar mediante una Anova de dos vías si el
efecto de un determinado fármaco depende del sexo de l. T de student de 2 muestras apareadas.
2. McNemar.
2
BIR Oficiales Asignatura: Estadística
3. U de Mann-Whitney.
4. T de student de dos muestras independientes. l. Varianza entre la media.
5. Test exacto de Fisher. 2. Media entre la Varianza.
3. Media entre la desviación estándar.
BIR 01 RC:1 4. Desviación estándar entre el número de individuos.
5. Desviación estándar entre la media.
92. ¿Cuál de los siguientes test estadísticos es de
comparaciones multiples?: BIR 01 RC:5
96. En un test de hipótesis un nivel de significación del 5% 146. Al punto medio de un intervalo en una tabla de
indica que: distribución de frecuencias se le denomina:
3
BIR Oficiales Asignatura: Estadística
BIR 02 RC:5
l. Desviación estándar.
2. Error estándar. 153. Para comparar el nivel de sérico de una proteína en
3. Coeficiente de variación. cinco grupos de individuos de distinta edad, el test
4. Rango intercuartílico. estadístico más adecuado es:
5. Varianza.
l. Friedman.
BIR 02 RC:4 2. U de Mann-Whitney.
3. T de student de muestras independientes.
148. El percentil 95 de la talla de recién nacidos de una 4. Análisis de la varianza.
población es 48cm. En esa población: 5. Wilcoxon.
l. T de student de 2 muestras independientes. 156. Si en una muestra la media aritmética es menor que
2. T de student de 10 muestras independientes. la mediana:
3. T de student de 10 muestras apareadas.
4. T de student de 2 muestras apareadas. l. La muestra es asimétrica negativa.
5. Chi-cuadrado. 2. La muestra es simétrica.
3. El 50% de los valores son menores que la media.
BIR02 RC:4 4. La muestra es asimétrica positiva.
5. Más del 50% de los valores son menores que la mediana.
151. El intervalo de confianza al 95% para estimar la media
poblacional es la media muestra! ±: BIR 02 RC:1
4
BIR Oficiales Asignatura: Estadística
BIR 03 RC:4
l. Wilcoxon de muestras apareadas.
2. U de Mann-Whitney de muestras apareadas. 78. Los coeficientes de asimetría y de curtosis son
3. Kolmogorov-Smirnov de muestras independientes. estadísticos de:
4. U de Mann-Whitney de muestras independientes.
S. Wilcoxon de muestras independientes. l. Posición.
2. Forma.
BIR 02 RC:1 3. Dispersión.
4. Centralización.
159. Para comparar la presión arterial entre un grupo de S. Tendencia.
no fumadores, uno de ex-fumadores y otro de fumadores,
el test estadístico más adecuado, suponiendo que la BIR 03 RC:2
variable no se distribuye normalmente, es:
79. NO es necesario para realizar un test de t de Student
l. Anova de dos vías. de dos muestras independientes con {nl + n2)-2 grados de
2. Kruskal-Wallis. libertad que:
3. Wilcoxon.
4. Anova de 1 vía. l. Las varianzas de ambas muestras sean del mismo orden.
S. U de Mann-Whitney. 2. Las dos muestras deban tener igual tamaño.
3. Las dos muestras deban estar constituidas por individuos
BIR02 RC:2 distintos.
4. La variable deba distribuirse normalmente.
160. Cuando el 30% de un grupo de pacientes sobrevive 3 S. La variable en estudio deba ser cuantitativa.
años o menos tras un tratamiento, el percentil:
BIR 03 RC:2
l. 3 es 30.
2. 30 es 3. 80. La distribución de probabilidad utilizada en el test de
3. 30 es mayor que 3. Levene es:
4. 3 es mayor que 30.
S. 3 es menor que 30. l. Chi-cuadrado.
2. F de Fisher-Snedecor.
BIR 02 RC:2 3. t de Student.
4. z.
256. En un grupo de 50 individuos se ha medido la talla S. Binomial.
(cm) y el peso {Kg). Para comparar la dispersión relativa de
ambas variables se utiliza: BIR 03 RC:2
5
BIR Oficiales Asignatura: Estadística
86. Cuando el error de tipo I o error alfa se expresa en 116. El coeficiente de correlación r de Pearson puede
porcentaje se denomina: utilizarse cuando:
1. Potencia del test. l. La relación entre las dos variables continuas no sea lineal.
2. Error típico. 2. La relación entre las dos variables continuas sea lineal.
3. Error crítico. 3. Una de las dos variables no sea continua.
4. Nivel de significación. 4. Se desconozca la distribución de las variables.
S. Nivel de confianza. 5. El número de datos sea muy pequeño.
87. Para comparar correctamente, desde un punto de vista 117. NO se expresa en las mismas unidades que la variable
descriptivo, la dispersión de 2 o más variables distintas en estudio:
debe utilizarse:
l. Media.
l. La desviación estándar. 2. Mediana.
2. La amplitud. 3. Desviación típica.
3. El coeficiente de variación. 4. Rango.
4. La covarianza. S. Varianza.
5. La desviación media.
BIR 04 RC:S
BIR 03 RC:3
118. Si a cada uno de los datos de una muestra se le
88. Son conceptos que se refieren a la misma probabilidad multiplica por una constante:
el nivel de:
l. La media se multiplica por la misma constante al
l. Confianza y error tipo II. cuadrado.
2. Significación y error tipo l. 2. La media y la varianza se multiplican por la misma
3. Significación y especificidad. constante.
4. Confianza y sensibilidad. 3. La media y la varianza no cambian.
S. Significación y error tipo II. 4. El coeficiente de variación no cambia.
S. La media cambia y la varianza no.
BIR 03 RC:2
BIR 04 RC:4
89. Es una variable cualitativa nominal policotómica:
119. Respecto al test de Kruskal-Wallis NO es correcto:
l. Edad.
6
BIR Oficiales Asignatura: Estadística
7
BIR Oficiales Asignatura: Estadística
l. El número de filas y de columnas no puede ser mayor de 152. Algebraicamente, la varianza muestral se diferencia
3x2. de la poblacional en que:
2. Debe haber por lo menos un 20% de esperados menor de
5. l. Su numerador es n-1 y el de la poblacional es n.
3. Es válido para cualquier teste de contingencia 2x2. 2. Su numerador es n y el de la poblacional es n-1.
4. Es preferible utilizar el test de Chi-cuadrado de Pearson. 3. Su denominador es n-1 y el de la poblacional es n.
5. Casi nunca se puede utilizar. 4. Su denominador es n y el de la poblacional es n-1.
5. No hay diferencias algebraicas.
BIR 05 RC:3
BIR 05 RC: 3
147. El cálculo de la mediana de una muestra necesita:
153. En un test de hipótesis con un error alfa de 0,01:
l. Tipificar los datos.
2. Ordenar los datos de menor a mayor. l. Un 1% de veces se rechazaría la hipótesis nula siendo
3. Calcular previamente la moda. cierta.
4. Calcular previamente la amplitud de la muestra. 2. Un 1% de veces se rechazaría la hipótesis nula siendo
5. Conocer el valor del coeficiente de curtosis. falsa.
3. Un 99% de veces se rechazaría la hipótesis nula siendo
BIR 05 RC:2 cierta.
4. La potencia del test es de 1 %.
148. Para comparar correctamente, desde un punto de 5. Un 99% de veces se rechazaría la hipótesis nula y la
vista descriptivo, la dispersión de 2 o más variables alternativa.
distintas debe utilizarse:
BIR 05 RC:1
l. La desviación estándar.
2. La amplitud. 154. A 25 personas con sobrepeso se mide el peso en Kg
3. El coeficiente de variación. antes y después de un programa de adelgazamiento. ¿Qué
4. La covarianza. test estadístico permitirá comprobar la eficacia del
5. La desviación media. programa suponiendo que la variable no se distribuye
normalmente?:
BIR 05 RC:3
l. Wilcoxon de muestras apareadas.
149. El percentil 50 (P 50 ) coincide con: 2. U de Mann-Whitney de muestras apareadas.
3. Kolmogorov-Smirnov de muestras independientes.
l. Mediana y cuartil 3. 4. U de Mann-Whitney de muestras independientes.
2. Mediana y cuartil l. 5. Wilcoxon de muestras independientes.
3. Moda.
4. Media geométrica. BIR 05 RC:1
5. Mediana y cuartil 2.
155. Para comparar el efecto de dos fármacos (A y B), se
BIR 05 RC:5 realizará un test de dos muestras independientes bilateral
cuando el interés sea comprobar si:
150. Es una variable cualitativa nominal policotómica:
l. A es mejor que B.
l. La edad. 2. A y B tienen distinto efecto.
2. El grupo sanguíneo. 3. A y B no tienen ningún efecto.
4. A es peor que B.
8
BIR Oficiales Asignatura: Estadística
l. Las varianzas de ambas muestras deben ser del mismo BIR 05 RC:2
orden
2. Las dos muestras deben tener el mismo tamaño. 146. El riesgo relativo (RR) puede oscilar entre:
3. Las dos muestras deben estar constituidas por individuos
distintos. l. O y l.
4. La variable debe distribuirse normalmente. 2. O e infinito.
5. La variable en estudio debe ser cuantitativa. 3.-lyl.
4. -1 y O.
BIR 05 RC:2 5. 1 e infinito.
9
BIR Oficiales Asignatura: Estadística
10
BIR Oficiales Asignatura: Estadística
BIR 07 RC:2
l. 95% mide más de 55 cm.
2. 5% mide más de 55 cm. 156. El test estadístico más adecuado para comparar dos
3. 95% mide 55cm. proporciones con muestras apareadas es:
4. 5% mide 55cm o más cm.
5. 95% mide 55 o más cm. l. Chi cuadrado.
2. T de student de muestras apareadas.
BIR 06 RC:2 3. Test de U de Mann-Whitney.
4. Test de McNemar.
151. De las siguientes afirmaciones, NO se refiere al 5. Correlación de Pearson.
coeficiente de variación (CV):
BIR 07 RC:4
l. Se calcula dividiendo la media por la desviación típica.
2. Generalmente su valor se expresa en porcentaje. 157. Deben utilizarse los test estadísticos no paramétricos
3. Se calcula dividiendo la desviación típica por la media. cuando:
4. Mide la dispersión relativa.
5. Es un índice de dispersión adimensional. l. La distribución de la variable es Normal.
2. El tamaño muestra! es >30.
BIR 07 RC: 1 3. La distribución de la variable no es normal o el tamaño
muestra! es pequeño.
152. Son conceptos que se refieren a la misma 4. La variable se mide en una escala de intervalo.
probabilidad el nivel de: 5. La variable se mide en una escala nominal.
l. No es nunca necesario antes de hacer un ANOVA. 160. El error estándar o error típico muestra! es:
2. Se hace siempre después de comprobar la normalidad.
3. Compara medias de las distintas muestras. l. Un parámetro e dispersión.
4. Se realiza para comprobar la homocedasticidad de 2 o 2. Una medida de dispersión de un estadístico.
más muestras. 3. La diferencia entre estimador y estimación.
5. Compara las medianas de las distintas muestras. 4. Un estadístico de dispersión de una muestra.
5. Una medida de asociación.
BIR 07 RC: 4
BIR 07 RC:2
155. ¿Qué medida de asociación se utiliza en un diseño de
cohortes?: 161. En relación con la varianza de una muestra, NO es
cierto que:
l. La Odds ratio.
2. El riesgo relativo. l. Es siempre positiva.
3. El coeficiente de correlación de Pearson. 2. Se mide en unidades al cuadrado.
4. El coeficiente de correlación de Spearman. 3. No tiene en cuenta todas las observaciones.
5. El coeficiente de variación. 4. Su raíz cuadrada es la desviación típica.
5. Es un estadístico de dispersión.
11
BIR Oficiales Asignatura: Estadística
12
BIR Oficiales Asignatura: Estadística
l. Menor sea el nivel de confianza. 146. Si un test estadístico ofrece un valor p<0,05. ¿Cómo
2. Mayor sea la dispersión de la muestra se interpreta?:
3. Menor sea el tamaño de la muestra.
4. Mayor sea el error típico muestra l. l. Se acepta la hipótesis nula.
5. Mayor sea el nivel de confianza. 2. Se rechaza la hipótesis alternativa.
3. Se rechaza la hipótesis nula.
BIR 08 RC: 1 4. No se puede rechazar la hipótesis nula.
S. No existen evidencias a favor de la hipótesis alternativa.
152. Es una característica del error aleatorio:
BIR 09 RC:3
l. Ser predecible.
2. Ser asimétrico. 147. Al realizar un test de hipótesis:
3. Equivaler a la falta de validez.
4. Equivaler a la falta de precisión. l. Se pueden cometer 3 tipos de errores.
5. Ser totalmente corregible. 2. A mayor tamaño muestra!, el test tiene menor potencia.
3. A menor error beta, el test tiene mayor potencia.
BIR 08 RC:4 4. Si aumenta la potencia del test, aumenta el error beta.
5. A menor error alfa, el test tiene menor especificidad.
153. Si se trabaja con una muestra asimétrica positiva se
utiliza la distribución de probabilidad: BIR 09 RC:3
13
BIR Oficiales Asignatura: Estadística
147. Si una muestra presenta un coeficiente de variación 146. El intervalo comprendido entre aproximadamente
(CV) de 0,25 significa que la: dos errores estándar alrededor de la media se conoce
como intervalo de:
l. Desviación típica supone el 25% de la media.
2. Varianza supone el 25% de la media. l. Confianza de 1%.
3. Media supone el 25% de la desviación típica. 2. Probabilidad del 95%.
4. Media supone el 75% de la varianza. 3. Confianza del 95%.
S. Desviación típica supone el 75% de la media. 4. Confianza del 99%.
5. Confianza del 5%.
BIR 10 RC: 1
BIR 11 RC:3
148. El test estadístico que permite comparar
proporciones de dos muestras independientes es el: 147. La media y la desviación típica de la función normal
tipificada son, respectivamente:
l. De McNemar.
2. De Snedecor. l. O; infinito.
3. De la mediana. 2. 1; o.
4. Exacto de Fisher. 3. O; 1.
S. De U de Mann-Whitney. 4.1; 1.96.
5.0; 1.96.
BIR 10 RC:4
BIR 11 RC:3
149. Se utiliza para comparar dos tratamientos
administrados al mismo individuo, midiendo como efecto 148. El test estadístico más adecuado para comparar dos
(respuesta/no respuesta) el test: proporciones con muestras apareadas es:
150. Una distribución normal se caracteriza, entre otras 149. El coeficiente b de una recta de regresión representa:
propiedades, por:
l. La pendiente de la recta.
l. Ser asimétrica. 2. La ordenada ene el origen.
2. Tener aproximadamente el 99% de sus valores dentro del 3. El grado de correlación lineal que hay entre ambas
intervalo µ±2cr. variables.
3. Tener aproximadamente al 95% de sus valores dentro del 4. El grado de significación de la relación.
intervalo µ±3cr. S. La probabilidad de cometer el error tipo l.
4. Tener aproximadamente al 95% de sus valores dentro del
intervalo µ±2cr. BIR 11 RC: Anulada
5. Tener aproximadamente al 95% de sus valores fuera del
intervalo µ±2cr. 150. La potencia de un test estadístico es la capacidad de
detectar una:
BIR 10 RC:4
1. Igualdad cuando ésta existe realmente.
256. Para comparar dos medias de muestras 2. Diferencia cuando ésta no existe realmente.
independientes cuando la variable se distribuye 3. Igualdad cuando ésta no existe realmente.
normalmente y las muestras tienen varianzas distintas se 4. Diferencia cuyo valor se ha fijado previamente.
utiliza el test de: S. Diferencia cuando ésta existe realmente.
14
BIR Oficiales Asignatura: Estadística
15
BIR Oficiales Asignatura: Estadística
80. Son conceptos que se refieren a la misma probabilidad 155. El análisis de la varianza (Anova) de una vía:
el nivel de:
l. Compara medias de 3 o más muestras independientes.
l. Confianza y el error tipo 11. 2. Compara varianzas de 3 o más muestras independientes.
2. Significación y el error tipo l. 3. Es un test de hipótesis no paramétrico.
3. Significación y la especificidad. 4. Utiliza la distribución t de Student
4. Confianza y la sensibilidad.
5. Significación y el error tipo 11. BIR 15 RC: 1
152. Si una muestra presenta un coeficiente de variación 175. Un intervalo de confianza para estimar la media
(CV) de 0,15 significa que: poblacional será tanto más preciso cuanto:
16
GoBIR BIR Oficiales Asignatura: Estadística
176. Para evaluar la posible asociación entre la presIon l. t de Student de dos muestras independientes con nl+n2
arterial y el peso en un grupo de 100 individuos, cuando grados de libertad.
ambas variables siguen una distribución normal se utiliza 2. t de Student de dos muestras independientes con
el test de: (nl+n2) -2 grados de libertad.
3. t de Student de dos muestras independientes con
l. t de Student. (nl+n2) -1 grados de libertad.
2. Correlación de Pearson. 4. U de Mann-Whitney.
3. Correlación de Spearman.
4. Regresión. BIR 17 RC: 4
BIR 16 RC: 2 150. ¿Qué test estadístico se aplicaría para comparar dos
colirios administrando uno distinto en cada ojo de un
177. ¿Qué test estadístico es el más adecuado para mismo paciente?:
evaluar la posible asociación entre la presión sanguínea y
el nivel de colesterol en un grupo de 20 individuos, cuando l. t de Student de muestras independientes.
ambas variables se miden cuantitativamente pero no 2. Exacto de Fisher.
siguen una distribución normal?: 3. McNemar.
4. Welch.
l. t de Student.
2. Correlación de Pearson. BIR 17 RC: 3
3. Correlación de Spearman.
4. U de Mann - Whitney. 226. Existe la hipótesis de que el 40% de los adultos realiza
ejercicio al menos una vez a la semana ¿Qué test se
BIR 16 RC: 3 utilizaría para comprobar dicha hipótesis a partir de una
muestra?:
146. Se comprueba mediante un Anova de dos vías si el
efecto de un determinado fármaco depende del sexo de l. Wilcoxon.
los pacientes. Si dicha interacción presenta una p=0,28 2. Bondad de ajuste.
¿Cómo se interpreta?: 3. Me Nemar.
4. Contingencia 2x2.
l. El efecto del fármaco es mejor en hombres.
2. El efecto del fármaco depende del sexo de los pacientes. BIR 17 RC: 2
3. El efecto del fármaco no depende del sexo de los
pacientes. 227. Al realizar un test de hipótesis:
4. El fármaco no es efectivo.
l. A mayor tamaño muestra!, mayor potencia.
BIR 17 RC: 3 2. A menos error beta, mayor potencia.
3. Si aumenta la potencia del test, aumenta el error beta.
147. ¿Qué test estadístico permite comparar proporciones 4. A menor error alfa, menor especificidad.
de dos muestras independientes?:
BIR 17 RC: 2
l. Test McNemar.
2. Test de la Mediana. 228. Si un test de normalidad ofrece un valor p > 0,05,
3. Test exacto de Fisher. ¿cómo se interpreta?:
4. Test U de Mann-Whitney.
l. Se puede asumir que la variable no sigue una distribución
BIR 17 RC: 3 normal.
2. No se puede asumir que la variable siga una distribución
148. ¿Qué test estadístico utilizaría para comprobar el normal.
efecto del ejercicio físico en un grupo de pacientes con 3. Se puede asumir que la variable sigue una distribución
enfermedad coronaria en los que se mide el máximo de normal.
oxígeno consumido para cada uno antes y después de 1 4. El test ha resultado ser significativo.
año de un programa de rehabilitación?:
BIR 17 RC: 3
l. t de Student de muestras relacionadas.
2. Wilcoxon de muestran relacionadas. 229. Si una muestra presenta un coeficiente de variación
3. U de Mann-Whitney. de 0,12 significa que la:
4. Chi cuadrado.
l. Desviación típica supone el 12% de la media.
BIR 17 RC: Anulada 2. Varianza supone el 12% de la media.
3. Media supone el 12% de la desviación típica.
149. El test que permite comparar dos medias de muestras 4. Desviación típica supone el 88% de la media.
independientes cuando la variable no se distribuye
normalmente es:
BIR 17 RC: 1
17
GoBIR BIR Oficiales Asignatura: Estadística
230. La mediana:
BIR 17 RC: 3
18
Preguntas propias 1 Asignatura: Estadística
l. En un ensayo clínico que evalúa la eficacia de un nuevo 5. La proporción de pacientes hipertensos correctamente
agonista dopaminérgico para el tratamiento de la identificados por una nueva prueba es del 85%. Este valor
enfermedad de Parkinson los investigadores concluyen representa:
que el nuevo fármaco es eficaz cuando en realidad no es
mejor que el placebo. Han cometido: l. La especificidad.
2. El valor predictivo positivo.
l. Un error tipo l. 3. La sensibilidad.
2. Un sesgo del observador. 4. Los falsos negativos.
3. Un sesgo de confusión. 5. El valor predictivo negativo.
4. Un error tipo 11.
5. Un sesgo de clasificación. RC:3
19
Preguntas propias 1 Asignatura: Estadística
l. 40% RC:3
2. 50%
3. 60% 18. La prueba kappa o test de Cohen:
4. 70%
5. 80% l. Mide la validez interna de una prueba diagnóstica.
2. Mide la validez externa de una prueba diagnóstica.
RC:2
20
Preguntas propias 1 Asignatura: Estadística
l. 50. RC:1
2.100.
3. 20. 26. Con objeto de comprobar la eficacia de un tratamiento
4. 25. para dejar de fumar se compara un grupo control (con
5. 5. placebo) con un grupo tratado. Para que los grupos sean
comparables es importante que no difieran mucho en la
RC:3 edad de los participantes. Nos informan que la media de
edad en el grupo control es 52 años y que en el grupo
22. Si aplicamos una prueba de laboratorio para el tratado también es 52 años. A partir de dicha información
diagnóstico de una determinada enfermedad que es dos podemos decir que:
veces más frecuente en hombres que en mujeres, ¿cuál de
los siguientes parámetros será más elevado en la l. Los grupos no difieren respecto a la distribución de la
población femenina que en la masculina? variable edad.
2. Si el estudio está bien diseñado, no nos puede dar la
l. La prevalencia de la enfermedad. misma media de edad en ambos grupos.
21
Preguntas propias 1 Asignatura: Estadística
3. Para comparar la distribución de la variable edad en 3. La prueba B porque detectará más falsos positivos.
ambos grupos sería conveniente conocer una medida de 4. La prueba A porque detectará más falsos negativos.
dispersión como la desviación típica además de la media. 5. La prueba B porque tiene una mayor especificidad.
4. Para la conclusión final no importa la distribución de la
edad en ambos grupos, sólo si el tratamiento es efectivo o RC:5
no.
5. Si además de la media, coinciden la mediana y la moda 31. La prec1s1on de un conjunto de medidas repetidas
podemos afirmar que los grupos no difieren respecto a la puede expresarse mediante la:
distribución de la variable edad.
l. Media aritmética
RC:3 2. Raíz cuadrada de la media aritmética.
3. Varianza.
27. Un Pediatra desea estudiar el sobrepeso en los niños 4. Media geométrica.
de 14 años, según los valores del IMC (índice de masa S. Raíz cuadrada de la media geométrica.
corporal). Para estimar el tamaño muestra! necesario
propone un nivel de confianza del 95% y una precisión de RC:3
1 unidad de IMC. ¿Qué más parámetros necesita conocer
para determinar el tamaño muestra!? 32. Si disponemos de una población normalmente
distribuida de valor medio µ y desviación estándar a, el
l. La media del IMC en la población. intervalo de confianza para un 95% de probabilidad, de un
2. La varianza del IMC. valor aislado (Xi), se calcula mediante la expresión:
3. La media y la desviación típica del IMC.
4. El tamaño de la población y la media del IMC. l. Xi =µ ± 0.50 o.
5. La desviación típica del IMC y el tamaño de población. 2. Xi =µ ± 1.00 o.
3. Xi =µ ± 1.50 o.
RC:2 4. Xi =µ ± 2.00 o.
S. Xi =µ ± 1.96 o.
28. El coeficiente de correlación de Pearson indica que
existe asociación estadística entre dos variables cuando: RC:5
RC:2 RC:3
30. Disponemos de dos tests para diagnosticar una 35. Se realiza una estimación poblacional de los niveles de
enfermedad de pronóstico grave. La prueba A tiene una creatinina en sangre, en un grupo de mujeres
sensibilidad del 95% y una especificidad del 60% y la embarazadas, obteniéndose los siguientes resultados:
prueba B tiene una sensibilidad del 70% y una media (x) 0,8 mg/dl; desviación típica (s) 0,62 mg/dl;
especificidad del 99%. Disponemos de un tratamiento tamaño muestra! (n) 85 mujeres. Según los datos
eficaz pero que produce efectos adversos importantes y anteriores el intervalo de confianza para la media
además tiene un coste muy elevado. ¿Qué prueba poblacional (µ) con un nivel de confianza de 95% (Z=l,96),
elegiríamos para hacer el diagnóstico? es:
22
Preguntas propias 1 Asignatura: Estadística
RC:2 ._/$
l. Sm:::;..;._
N
36. Algunos trabajos muestran indicios de que existe
relación entre la calidad del sueño de las personas y la
tendencia a la depresión. Para obtener los anteriores
resultados, los investigadores usaron dos cuestionarios
distintos, uno sobre la calidad del sueño y otro 32 sobre
los síntomas de depresión que asignaban una puntuación
a cada paciente en cada uno de ellos. ¿Qué prueba
estadística cree usted que utilizaron para contrastar su
hipótesis?
l. En el grupo tratado con el anticoagulante 50 personas 42. Tomamos muestra de cinco individuos a los que les
presentaron una hemorragia grave. medimos el valor de colesterol LDL (mg/ml) obteniendo:
2. En el grupo tratado con anticoagulante hubo 50 casos de 180, 203, 104, 90 y 165. ¿Cuál es la mediana de esta
hemorragia grave más que en el grupo no tratado. muestra?:
3. El riesgo de presentar una hemorragia grave en los
tratados con el anticoagulante fue 50 veces mayor que en 1.180.
los no tratados. 2. 203.
4. Fue necesario tratar a 50 personas con el anticoagulante 3.104.
para producir 1 caso de hemorragia grave atribuible al 4. 90.
fármaco. 5. 165.
5. De cada 100 pacientes tratados con el anticoagulante 50
presentaron una hemorragia grave. RC:5
23
Preguntas propias 1 Asignatura: Estadística
IR
3. Nº de unidades formadoras de colonias.
4. Temperatura corporal. RC:5
5. Raza (blanca, negra, amarilla).
50. El Diagrama de sectores se utiliza para representar
RC:2 variables:
RC:3 RC:3
47. Es una Variable Cualitativa: 53. Una distribución de datos se puede describir con:
RC:5 RC:5
48. El histograma se utiliza para representar variables: 54. Es una medida de centralización:
l. Cualitativas. 1. Rango.
2. Cuantitativas Discretas. 2. Varianza.
3. Cuantitativas Continuas. 3. Mediana.
4. Cualquiera. 4. Desviación Estándar.
5. La opción 1 y 2 son verdaderas. 5. Coeficiente de Variación.
RC:3 RC:3
49. El Diagrama de Barras se utiliza para representar 55. Es una medida de tendencia central:
variables:
l. Amplitud.
l. Cualitativas. 2. Varianza.
2. Cuantitativas Discretas. 3. Moda.
3. Cuantitativas Continuas. 4. Desviación Típica.
4. Cualquiera. 5. Coeficiente de Variación.
5. Ciertas 1 y 2.
24
Preguntas propias 1 Asignatura: Estadística
RC:3
62. Es un Estadístico de Dispersión:
56. Es un índice de dispersión:
l. Moda.
1. Media Aritmética. 2. Rango.
2. Moda. 3. Mediana.
3. Mediana. 4. Media Armónica.
4. Desviación Estándar. S. Media Geométrica.
S. Cuartiles.
RC:2
RC:4
63. El Coeficiente de Variación es:
57. Es un estadístico de dispersión:
l. Un estadístico de Centralización adimensional.
l. Amplitud. 2. Un estadístico de Dispersión Adimensional.
2. Desviación estándar. 3. Una medida de Variación conjunta entre dos variables.
3. Rango intercuartílico. 4. Un índice de simetría.
4. Coeficiente de Variación. S. 3 y 4 correctas.
S. Todas Ciertas.
RC:2
RC:S
64. La Varianza Muestra! es:
58. Es un índice de dispersión adimensional:
l. El cuadrado de la Desviación Típica.
l. Desviación Media. 2. La raíz cuadrada de la Desviación Típica.
2. Varianza. 3. Un estadístico de dispersión.
3. Desviación Estándar. 4. El cociente entre la Media y los Grados de Libertad.
4. Coeficiente de Variación. S. 1 y 3 correctas.
S. Amplitud o Rango.
RC:S
RC:4
65. El Coeficiente de Variación se calcula:
59. ¿Cuál de los siguientes es un estadístico descriptivo de
posición? l. Multiplicando la Varianza por la Media.
2. Dividiendo la Desviación Típica por la Media.
1. Media Geométrica. 3. Dividiendo la Media por la Desviación Típica.
2. Media Ponderada. 4. Dividiendo la Media por la Varianza.
3. Varianza. S. Multiplicando la Desviación Típica por la Media.
4. Percentil.
S. Covarianza. RC:2
RC:3 RC:3
25
Preguntas propias 1 Asignatura: Estadística
73. Si multiplicas por 6 todos los valores de una l. La Media coincide con la Moda y con la Mediana.
distribución: 2. El máximo es la Media.
3. Es una Distribución de probabilidad de variables
l. La Media no varía. continuas.
2. La Desviación Estándar se multiplica por 36. 4. Se define por m y s.
3. Varianza se multiplica por 6. S. Todas son ciertas.
4. Coeficiente de Variación no varía.
S. Todas son falsas. RC:5
26
Preguntas propias 1 Asignatura: Estadística
1. 1, O. 1. Normal.
2. O, 1. 2. Chi-Cuadrado
3. 1, 1. 3. F. de Snedecor.
4. o, 1,96. 4. T. de Student.
5. 1, 1,96. 5. Hipergeométrica.
RC:2 RC: 5
RC:4 RC:2
27
Preguntas propias 1 Asignatura: Estadística
RC:5 RC:2
RC: 4 RC:5
97. Se dice que una distribución es Mesocúrtica cuando: 103. Señale un estimador insesgado de la Media
poblacional, si la Distribución es asimétrica:
l. Es simétrica.
28
Preguntas propias 1 Asignatura: Estadística
29
Preguntas propias 1 Asignatura: Estadística
RC:5 l. Es a.
2. Es el nivel de significación.
120. Leemos en un artículo que la glucemia media es de 3. Lo fija el investigador.
110 mg/dl ±10 mg/dl. p <0,01. 4. Como máximo se usa un nivel de 0,05.
5. Son todas ciertas.
l. El resultado muestra! es 110±10.
30
Preguntas propias 1 Asignatura: Estadística
RC:5
RC:4
126. El valor predictivo positivo de una prueba diagnóstica
se define como: 132. La potencia o poder de un test de Hipótesis:
RC:4 RC:4
31
Preguntas propias 1 Asignatura: Estadística
32
GoBIR Preguntas propias 1 Asignatura: Estadística
RC:1 RC:4
148. Planteado un diseño experimental, y fijada una 154. ¿Qué significa que un coeficiente de correlación de
prueba de hipótesis, si se aumenta el tamaño de las Pearson es de "-0,9" :
muestras:
l. Que hay una mala correlación entre las dos variables.
l. Aumenta la probabilidad de error a y b. 2. Que la relación es inversa o negativa.
2. Disminuye la probabilidad de error a y b. 3. Que la relación es lineal.
3. Aumenta la probabilidad de error a. 4. Que la relación es muy buena.
4. Disminuye la probabilidad de error b. 5. Ciertas 2, 3 y 4.
5. Aumenta la probabilidad de error a y disminuye la de b.
RC:5
RC:4
149. Si se desea realizar un contraste de hipótesis, ¿Cuál 155. ¿Qué significa un Coeficiente de Correlación de
de las siguientes situaciones es mejor?: Pearson de +0,95?
RC:5 RC:2
33
Preguntas propias 1 Asignatura: Estadística
34
Preguntas propias 1 Asignatura: Estadística
170. Los grados de libertad de una tabla de contingencia 176. Si en una Tabla de Contingencia de 2x2, hay algún
5x8 son: valor menor de 5:
l. 40. l. Se le suma 5.
2. 38. 2. Se agrupan filas o columnas.
3. 28. 3. Se hace una Regresión.
4.14. 4. Se divide por la Media.
5. 2. 5. Se usa la Corrección de Yates.
RC:3 RC:5
171. Los grados de libertad de la Ji-Cuadrado de Pearson, 177. El Coeficiente de Contingencia (de Pearson):
en una tabla de contingencia (independencia) 3x2 son:
l. Mide la correlación entre dos Var. Cuantitativas.
l. O 2. Mide el grado de asociación entre dos Var. Cualitativas.
2. 3. 3. Es lo mismo que el Coeficiente de Correlación de
3. 6. Pearson.
4. 2. 4. Va desde O a +l.
5. l. 5. Ciertas 2 y 4.
RC:4 RC:5
172. El Coeficiente de Contingencia (de Pearson): 178. La Distribución Chi-Cuadrado se emplea para el test
de:
l. Mide la Correlación entre dos Var. Cuantitativas.
2. Mide la asociación entre dos Var. Cualitativas. l. Dos Medias paramétrico.
3. Mide la Variación entre medias apareadas. 2. Bondad de ajuste.
4. Es un índice de centralización. 3. Independencia (contingencia).
5. Todas son falsas. 4. Tres Medias paramétrico.
5. Ciertas 2 y 3.
RC:2
RC:5
173. El Coeficiente de Contingencia es un índice de:
179. La Distribución de probabilidad usada para comparar
l. Asimetría. 2 varianzas es:
2. Curtosis.
3. Asociación. l. Ji-Cuadrado.
4. Normalidad. 2. F de Fisher-Snedecor.
5. Ninguna es correcta. 3. Poisson.
4. T de Student.
RC:3 5. Binomial.
l. No hay que hacer nada. 181. Los requisitos previos que deben cumplir las
2. Hay que transformar la tabla, agrupando filas o muestras para hacer el ANOVA:
columnas.
3. Hay que hacer como si no lo hubiéramos visto. l. Han de ser Aleatorias.
4. Hay que hacer la corrección de Yates. 2. Han de ser independientes.
5. Hay que hacer un Análisis de la Varianza. 3. Las variables deben ser Normales en la población.
4. Las Varianzas de las muestras han de ser Homogéneas.
RC:2 5. Todas son ciertas.
35
Preguntas propias 1 Asignatura: Estadística
l. Se acaba el estudio.
RC:5 2. Se realiza un test a posteriori de Comparaciones
Múltiples.
182. La Hipótesis de normalidad de la Variable se 3. Se realiza un test no paramétrico.
comprueba con el Test: 4. Se realiza un test de homogeneidad de la Varianzas.
S. Se realiza un test de bondad de ajuste.
l. De Wilcoxon.
2. De Friedmann. RC:2
3. De Barlet.
4. De Kruskal-Wallis. 188. Uno de los siguientes test estadísticos, es un test de
S. De Agostino. Normalidad:
RC:5 l. Barlet.
2. Agostino.
183. El Análisis de la Varianza (ANOVA) se usa para: 3. Kruskal-Wallis.
4. Levene.
l. Comprobar la asociación entre una variable Cuantitativa S. Neyman-Pearson.
y una Cualitativa de más de dos categorías.
2. Comprobar la homogeneidad de varias muestras RC:2
apareadas.
3. Comparar entre sí tres o más medias. 189. La posible asociación entre dos variables cualitativas
4. Comprobar la asociación entre dos variables Cualitativas. seve:
S. Ciertas 1, 2 y 3.
l. Test de la
RC:5 Ji-Cuadrado.
2. Ji-Cuadrado con corrección de Yates.
184. Qué test estadístico permite comparar dos o más 3. Test exacto de FISHER.
muestras independientes en condiciones de normalidad. 4.ANOVA.
S. Ciertas 1, 2 y 3.
l. Friedmann.
2. Wilcoxon. RC:5
3. Barlet.
4. Kolmorogoff-Smirnow. 190. La posible asociación entre dos variables
S. Análisis de la Varianza. cuantitativas se estudia con:
RC:4 l. Ji-Cuadrado.
2. Test de McNemar.
186. La Hipótesis de Homogeneidad de las Varianzas se 3. ANOVA.
verifica mediante el test de: 4. "T" de Student.
S. Hipergeométrica.
l. Wilcoxon.
2. Levene. RC:3
3. Los signos.
4. Barlet. 192. La asociación entre una Var. Cuantitativa, y otra
S. 2 y 4 son ciertas. Cualitativa de 2 categorías se estudia con:
RC:5 l. Ji-Cuadrado.
2. T de Student.
187. Si la F entre grupos resulta ser significativa en un 3. ANOVA.
Análisis de la Varianza, del criterio de clasificación 4. "U" de Mann-Whitney.
(modelo fijo) realizado para comparar el efecto de cuatro S. Ciertas 2 y 4.
fármacos, qué debe hacerse a continuación:
RC:5
36
Preguntas propias 1 Asignatura: Estadística
RC: 4 RC:5
195. Es test no paramétrico, para estudiar la relación entre 201. Como se pueden comparar dos Medias:
dos Var. Cuantitativas es:
l. Test de Ji-Cuadrado.
1. Coeficiente de Correlación de Spearman. 2. Test de McNemar.
2. Coeficiente de Correlación de Pearson. 3. Test de Cohcran.
3. Coeficiente de Correlación de Barlet. 4. "T" de Student.
4. Test de Wilcoxon. 5. Correlación.
5. Ciertas 1 y 2.
RC: 1 RC:4
196. Cual de los siguientes es un dato apareado: 202. ¿Cuál es un método NO PARAMÉTRICO, de comparar
dos medias?:
1. Talla entre hombres y mujeres.
2. Relación talla-peso. 1. "T" de Student.
3. Glucemia en diabéticos y en no diabético. 2. Test de la Ji-Cuadrado.
4. Glucemia antes y después de comer. 3. Test de Wilcoxon.
5. Agudeza visual en reptiles. 4. Test de Friedmann.
5.ANOVA.
RC:4
RC:3
197. La asociación entre dos Var. Cualitativas, apareadas,
se verifica con: 203. ¿Cómo se pueden comparar varias Medias?:
l. ANOVA. l. ANOVA.
2. Ji-Cuadrado. 2. Test de Kruskall-Wallis.
3. Test de McNemar. 3. Test de Friedmann.
4. ''T'' de Student. 4. Test de McNemar.
5. Test de Friedmann. 5. Ciertas 1, 2 y 3.
RC:3 RC:5
198. La asociación de dos Medias de tipo apareado, se 204. ¿Con cuál se pueden comparar dos proporciones?:
hace con:
l. Test de la Ji-Cuadrado.
1. El test de McNemar. 2. Test de McNemar.
2. Correlación de Spearman. 3. Test de Barlet.
3. Ji-Cuadrado. 4. Test de Wilcoxon.
4. "T" de Student apareada. 5. Ciertas 1 y 2.
5. ANOVA.
RC:5
37
Preguntas propias 1 Asignatura: Estadística
205. ¿Cómo se pueden comparar dos proporciones?: 211. Para convertir una distribución Exponencial en un
Distribución Normal se usa la transformación:
l. Test de la Ji-Cuadrado.
2. Test de McNemar. l. Recíproca.
3. Test de Cohcran. 2. Angular.
4. Test de Wilcoxon. 3. Logarítmica.
S. Ciertas 1 y 2. 4. Cuadrada.
S. Ordinal.
RC:5
RC:3
206. Para comparar varias proporciones, con datos
independientes, se aplica el test de: 212. Si se pretende convertir una Distribución de Poisson
en una Distribución Normal, se aconseja usar la
l. La Ji-Cuadrado. transformación:
2. Cohcran.
3. McNemar. l. De la raíz cuadrada.
4. Wilcoxon. 2. Recíproca.
5.ANOVA. 3. Angular.
4. Logarítmica.
RC:1 S. Ninguna es correen.
l. Agostino. RC:4
2. Pearson.
3. Barlet. 216. Señale lo falso en relación con la media aritmética:
4. Wilcoxon.
5. McNemar. l. Es una medida de posición.
2. Sus unidades de medida son las mismas que las de la
RC:3 variable que se describe.
3B
Preguntas propias 1 Asignatura: Estadística
RC:1 RC:3
217. Hablando del coeficiente de variación, señale lo que 222. Se desea comparar la prevalencia de hipertensión
es cierto: entre hombres y mujeres. Al aplicar la prueba de la Chi-
cuadrado, los grados de libertad serán:
l. Es el cociente entre la desviación estándar y la media.
2. No tiene dimensiones. l. l.
3. Es independiente de las unidades de medida. 2. 2.
4. Es una medida de dispersión relativa que permite 3. 4.
comparar la dispersión de dos distribuciones diferentes. 4. 6.
5. Todo lo anterior es cierto. 5. 3.
RC:5 RC: 1
218. En relación con la distribución normal, ¿Cuál de las 223. Hablando de regresión y correlación, señala lo
siguientes afirmaciones es falsa?: verdadero:
l. Es una distribución de probabilidad teórica discreta. l. En la regresión interviene una variable dependiente y
2. La distancia entre el eje vertical trazado en la media y el una o más independientes.
punto de inflexión de la curva es la desviación estándar. 2. En la correlación las dos variables juegan un papel
3. Es simétrica y unimodal. simétrico.
4. Cualquier valor entre - infinito y + infinito es 3. Estudian la relación entre dos variables cualitativas.
teóricamente posible. 4. Una y dos son ciertas.
5. Tiene forma de campana. 5. Todas son ciertas.
RC:1 RC:4
219. Respecto a las pruebas de significación señala lo 224. El error estándar es:
falso:
l. Un índice de dispersión.
l. Es un procedimiento por el cual nos decidimos por la 2. Un índice de centralización.
hipótesis nula (Ho) o por la alternativa {Hl). 3. La desviación típica de la curva de Gauss tipificada.
2. La Ho es la hipótesis de la no diferencia. 4. Otro nombre de la desviación típica.
3. La Hl es la que se pone a prueba al realizar una prueba 5. Todas son ciertas.
estadística de significación.
4. La Hl es al que se aceptará si el resultado de la prueba RC:1
permite rechazar la Ho.
5. La significación estadística es la condición resultante del 225. Hablando de índices de validez de una prueba
rechazo de la Ho mediante las pruebas de significación. diagnóstica, señala lo verdadero:
39
Preguntas propias 1 Asignatura: Estadística
2. Será negativo en el 95% de los individuos sin 232. En relación a la varianza señale lo verdadero:
enfermedad.
3. Entre los individuos con test positivo, el 95% tendrán la 1. Es una medida de dispersión.
enfermedad. 2. La varianza se define como la media de la suma de
4. Entre los individuos con test negativo, el 95% no tendrán cuadrados de las diferencia entre cada valor de la variable y
la enfermedad. la media aritmética de la distribución.
5. Ninguna de las anteriores. 3. Las unidades de medida de la varianza son las de la
variable que describe al cuadrado.
RC:2 4. Junto con la media, define una distribución normal.
5. Todas son ciertas.
227. El test no paramétrico que determina la asociación
entre dos variables cuantitativas es el de: RC:5
231. La medida de posición que corresponde al valor de la 236. El rango intercuartílico es:
variable más frecuente en la distribución se llama:
1. Un índice de dispersión.
1. Pe rce nti l. 2. Un índice de centralización.
2. Mediana. 3. La desviación típica de la curva de Gauss tipificada.
3. Media aritmética. 4. Otro nombre de la desviación típica.
4. Moda. 5. Todas son correctas.
5. Ninguna de las anteriores.
RC:1
RC:4
40
Preguntas propias 1 Asignatura: Estadística
237. Los resultados de un estudio sobre la relación de dos 242. Para comprobar la homogeneidad de dos varianzas
variables señalan la siguiente ecuación de Regresión para datos apareados se usa el test de:
Lineal: Y=3+0.8x. Señala lo verdadero con relación a ella:
l. Bartlett.
l. La variable dependiente (y) aumenta en 0.8 por cada 2. Levene.
unidad de aumento de la variable independiente (X). 3. t de Student.
2. El valor de la variable dependiente cuando la 4. F de Snedecor.
independiente vale O es igual a 3. 5. ANOVA.
3. La pendiente de la recta vale 0.8.
4. La ordenada en el origen de la recta vale 3. RC: 1
5. Todas son correctas.
243. ¿Que test se usa para comparar medidas repetidas?:
RC:5
l. Wilcoxon.
238. ¿Cuál de las siguientes afirmaciones es verdadera? 2. Friedmann.
3. T-Student para datos apareados.
l. La sensibilidad de una prueba diagnostica mide su 4. 1, 2 y 3 son correctas.
capacidad para detectar la enfermedad que se estudia S. 1, 2 y 3 son falsas.
cuando dicha enfermedad está presente.
2. La especificación de un test diagnóstico mide su RC:4
capacidad para descartar la enfermedad que se estudia
cuando dicha enfermedad está ausente. 244. En una muestra de pacientes, el número de varones
3. Cuanto mayor sea la sensibilidad de una prueba dividido entre el total de pacientes es:
diagnóstica menor será la proporción de falsos negativos.
4. 1 y 3 son ciertas. l. Una frecuencia relativa.
5. Todas son ciertas. 2. Una frecuencia absoluta.
3. Una variable cuantitativa.
RC:5 4. Una variable cualitativa.
5. Un valor de la variable.
239. Señale lo cierto sobre le coeficiente de correlación:
RC:1
l. Es una medida de asociación lineal entre dos variables.
2. Su valor va de -1 a +l. 245. Cuál de las siguientes medidas define mejor la
3. No tiene unidades. tendencia central de los datos: 5 , 4, 42, 4, 6
4. Cuando su valor es O decimos que las dos variables no
tienen relación lineal. l. La mediana.
5. Todas son ciertas. 2. La media.
3. El sesgo
RC:5 4. El rango.
S. La proporción.
240. Hablando de regresión y correlación, señale lo falso:
RC:1
l. Estudia la relación entre dos variables cualitativas.
2. En la regresión interviene una variable dependiente y 246. Para comparar la variabilidad relativa de la tensión
una o más independientes. arterial diastólica y el nivel de colesterol en sangre de una
3. En la correlación las dos variables juegan un papel serie de individuos, utilizamos
simétrico.
4. La pendiente de la recta de regresión lineal indica lo que l. Las desviaciones típicas.
aumenta la variable dependiente por cada unidad de 2. Los rangos.
aumento de la variable independiente. 3. Los coeficientes de variación.
5. La ordenada en el origen indica el valor de la variable 4. La diferencia de las medias.
dependiente cuando la independiente vale O. S. La diferencia de las varianzas.
RC: 1 RC: 3
241. ¿Que test mide la relación entre dos variables
cualitativas? 247. Si al calcular el coeficiente de correlación de dos
variables X e Y, se tiene r=-0.20 ocurre que
l. Wilcoxon.
2. ANOVA. l. La pendiente de la recta de regresión es pequeña.
3. Chi-cuadrado. 2. La pendiente de la recta de regresión es grande.
4. t de Student. 3. X e Y están poco relacionadas, aunque cuando X
5. Friedmann. decrece, Y tiene tendencia a crecer.
4. El modelo lineal de regresión explica el 20% de la
RC:3 varianza de una variable cualquiera en función de la otra.
41
Preguntas propias 1 Asignatura: Estadística
RC: 5 RC:2
249. Las siguientes medidas son todas de centralización, 254. Se realiza un estudio con objeto de determinar el
excepto: tiempo de supervivencia en pacientes con cáncer. Para
ello de los dos hospitales existentes en una ciudad, se
l. La media. selecciona aleatoriamente uno de ellos, y se elige una
2. La moda. muestra aleatoria de pacientes, atendiendo al tipo de
3. La mediana. cáncer: El muestreo realizado es:
4. Rango intercuartílico.
5. El percentil 50. l. Sistemático.
2. Aleatorio.
RC:4 3. Por conglomerados.
4. Estratificado.
250. Al analizar una serie estadística de datos, ¿puede 5. Por conglomerados y estratificado.
ocurrir que la desviación sea mayor que la media?
RC:5
l. Teóricamente no es posible, pero puede ocurrir por los
errores de redondeo. 255. Para conocer los índices predictivos en un test
2. Siempre ha de ser la media mayor que la desviación diagnóstico para una enfermedad que tiene un 1% de
típica. afectados en la población, será necesario conocer:
3. A lo sumo puede ser igual a la media.
4. La desviación típica a de ser como máximo igual a la l. Sensibilidad y verdaderos positivos
media para que la suma de cuadrados no sea negativa. 2. Prevalencia.
5. En general no hay relación entre la varianza y la media. 3. Verdaderos positivos y prevalencia.
4. Especificidad y verdaderos negativos
RC:5 5. Falsos positivos y verdaderos positivos.
42
Preguntas propias 1 Asignatura: Estadística
258. Qué propiedad o propiedades caracterizan a una 263. La edad de los individuos de una población sigue una
distribución normal tipificada frente a una distribución distribución normal. Se extrae aleatoriamente una
normal cualquiera: muestra de 300 pacientes cuya media es de 50 años, y la
desviación típica es 10 años. Entonces:
l. El área bajo su función de densidad es igual a l.
2. Su media es 1 y su desviación típica es O. l. Aproximadamente el 95% de los pacientes tienen
3. Su rango de valores oscila entre O y 3. edades entre 30 y 70 años.
4. Su media es O y su desviación típica es l. 2. Existe una probabilidad del 95% de que la verdadera
5. Son ciertas (c) y (d) media de la población esté entre 30 y 70 años.
3. Aproximadamente el 95% de los pacientes tienen
RC:4 edades entre 40 y 60 años.
4. Existe una probabilidad del 95% de que la verdadera
259. Cierto tests diagnóstico acierta sobre el 100% de los media de la población esté entre 40 y 60 años.
individuos enfermos y el 50% de los sanos. Cierta persona 5. Existe una probabilidad del 95% de que la verdadera
pasa el test con resultado negativo. Entonces: media de la población esté entre 45 y 55 años.
43
Preguntas propias 1 Asignatura: Estadística
2. Una muestra aleatoria no es coherente con la hipótesis la mejor estimación del número de pacientes que tienen
nula. un nivel de glucemia entre 90 y 105
3. La hipótesis alternativa es más probable que la nula.
4. Todo lo anterior es cierto. l. 15.
5. Son ciertas {b) y (c). 2. 17
3. 20
RC:2 4. 25
5. 34
268. Se desea estimar confidencialmente el número medio
de veces que asiste a un servicio de salud los individuos de RC:2
una población. Para ello se toman muestras aleatorias
entre los individuos que asisten regularmente a los 273. Señale cual de las siguientes afirmaciones es
mismos. Esta técnica de muestreo es: verdadera:
l. Una muestra aleatoria es coherente con la hipótesis 274. En una población, hay tantos hombres como mujeres,
nula. el 20% son varones y fumadores y el 20% de las mujeres
2. Una muestra aleatoria no es coherente con la hipótesis fuman. Entonces:
nula.
3. La hipótesis nula es más probable que la alternativa. l. Fuman tantos hombres como mujeres.
4. Todo lo anterior es cierto. 2. Por cada mujer fumadora hay dos hombres fumadores.
5. Son ciertas(a) y (c). 3. Por cada hombre fumador hay dos mujeres fumadoras.
4. Hay un 40% de fumadores en la población.
RC:l 5. Nada de lo anterior es cierto.
l. La aparición o no de bacterias en un cultivo es una 275. En una población, el peso tiene medía 60 kg y
variable dicotómica desviación típica 6Kg. La altura tiene de media 170cm y
2. La estatura de un individuo es una variable cuantitativa desviación 6cm. Cierto individuo tiene un peso de 70 Kg y
discreta. altura 180cm.
3. El lugar que ocupa una persona entre sus hermanos {de
menor a mayor edad) es una variable ordinal. l. La altura tiene un valor más extremo que el peso.
4. El estado civil es una variable cualitativa. 2. El peso es menos extremo que la altura.
5. La glucemia es continua. 3. Peso y altura son valores igualmente extremos.
4. El peso es más extremo que la altura.
RC:2 5. La altura es menos extrema que el peso.
l. Es el centro de gravedad de la distribución. 276. Señale cuál de las siguientes afirmaciones es falsa:
2. No se ve afectada por los valores extremos.
3. Deja por debajo el mismo número de datos que por l. La media aritmética es siempre el centro de gravedad de
encima. la distribución.
4. Es el segundo cuartil. 2. En una distribución continua simétrica, media y mediana
S. Todo lo anterior se corresponde con la mediana. coinciden.
3. La media aritmética cambia cuando cambia algún dato.
RC:l 4. La mediana no siempre cambia cuando lo hace algún
dato.
272. En un grupo de 50 pacientes se ha obtenido un valor 5. En las distribuciones continuas simétricas todas las
de glucemia medio de 90mg/dl, con una desviación típica medidas de centralización coinciden.
de 15. Suponiendo la normalidad de los datos, ¿cuál será
44
Preguntas propias 1 Asignatura: Estadística
l. Permite comparar la dispersión de dos poblaciones. l. Todos los individuos con un valor de colesterol 100,
2. Es menor que la media. presentan glucemia 45.
3. Es menor que la desviación típica. 2. Existe tendencia a que a mayor nivel de glucemia, mayor
4. No depende de la media ni la desviación típica. nivel de colesterol.
S. Depende de la escala que se use al medir la variable. 3. Hay más individuos con colesterol alto que con glucemia
baja.
RC:1 4. Las observaciones se muestran como una nube de
puntos creciente.
278. Los diagramas de sectores son muy útiles para S. Sólo dos de las afirmaciones anteriores son correctas.
comparar:
RC:5
l. Dos variables cualitativas en una población.
2. Dos variables cuantitativas en una población. 283. Dos variables numéricas son incorreladas. Entonces:
3. Una variable cualitativa en dos poblaciones.
4. Una variable cuantitativa en dos poblaciones. l. r=O
S. Una variable cuantitativa con otra cualitativa. 2. El modelo lineal de regresión sólo propone un valor
como predicción de Y.
RC: 1 3. La nube de puntos no presenta aspecto creciente.
4. La varianza residual en el modelo de regresión de Y
279. Entre las siguientes afirmaciones, indica cual es sobre X es igual a la varianza de Y.
incorrecta: S. Todo lo anterior es cierto.
l. La suma de las frecuencias absolutas. 285. Al aplicar un tratamiento a un paciente, puede que
2. La frecuencia absoluta acumulada de la categoría más este empeore, no le haga efecto, o mejore. Si dicho
frecuente. tratamiento se aplica a una población de 100 pacientes,
3. La suma de las frecuencias relativas. ¿qué medidas cree que resumen mejor los datos?
4. La frecuencia relativa acumulada en la última categoría.
S. La (a) y la (d) son ciertas. l. Media, mediana, moda, desviación típica y asimetría.
2. Mediana y coeficiente de variación.
RC: 1 3. Media y coeficiente de variación.
4. Percentil 25, percentil 50 y percentil 75.
281. La recta de regresión de Y sobre X se muestra como S. Ninguna de las anteriores.
un buen modelo para explicar la relación entre dos
variables numéricas. Entonces: RC:5
l. Y se puede calcular exactamente como una función 286. En cierta población se observa la distribución de los
matemática de X. grupos sanguíneos. Si queremos resumir la información
2. Y es independiente de X. obtenida podemos utilizar:
3. La covarianza de X e Y no es nula.
4. La media de X coincide con la media de Y. l. Moda.
S. Sólo dos de las afirmaciones anteriores son correctas. 2. Mediana.
3. Frecuencias acumuladas absolutas.
RC:3 4. Frecuencias relativas.
5. Nada de lo anterior.
45
Preguntas propias 1 Asignatura: Estadística
288. La pregunta: ¿qué nivel de colesterol sólo es l. Los tratamientos ofrecen tiempos de supervivencia muy
superado por el 5% de los individuos?, tiene por diferentes.
respuesta: 2. El nivel de significación es demasiado alto.
3. Las muestras son demasiado numerosas.
l. El percentil 95. 4. Las muestras son demasiado pequeñas.
2. El percentil 5. 5. Nada de lo anterior.
3. Los percentiles 2,5 y 97,5
4. 95%. RC:4
5. Nada de lo anterior.
294. De las siguientes, cuál se corresponde con un error de
RC:1 tipo 11:
289. Qué peso no llega a alcanzar el 40% de los individuos l. Aceptar que un tratamiento ineficaz produce efectos
de una población: útiles.
2. Rechazar que un tratamiento ineficaz produce efectos
l. El 40%. útiles.
2. El 60%. 3. Aceptar que un tratamiento eficaz produce efectos
3. El percentil 60. útiles.
4. El percentil 40. 4. Rechazar que un tratamiento eficaz produce efectos
5. Los percentiles 20 y 60. útiles.
5. Nada de lo anterior es cierto.
RC:4
RC:4
290. Si al realizar un análisis de regresión la covarianza
coincide con el producto de las desviaciones típicas de las 295. Para estudiar la efectividad de un test diagnóstico
variables, puedo asegurar que: ante una enfermedad se toma un grupo de 200 personas
enfermas y 200 que no la padecen, y se observan los
l. La ordenada en el origen de la recta no es cero resultados. ¿Qué podemos estimar directamente de ellos?
2. La recta pasa por las medias de las variables
3. Existe una correlación lineal perfecta entre las variables. l. La sensibilidad y especificidad del test.
4. Todas las anteriores son ciertas. 2. La incidencia de la enfermedad en la población.
5. Son correctas (b) y (c). 3. El índice predictivo de verdaderos positivos.
4. Son correctas (a) y (c).
RC:5 5. Todo lo anterior.
RC: 1
291. Una distribución presenta asimetría negativa siempre
que: 296. La estadística en Ciencias de la Salud se utiliza para
obtener información sobre situaciones de carácter:
l. Hay más valores negativos que positivos.
2. Hay menos valores negativos que positivos. l. Determinista.
3. No es simétrica. 2. Sistemático.
4. La media es menor que la varianza. 3. Exhaustivo.
5. Nada de lo anterior es cierto. 4. Aleatorio.
5. Excluyente.
RC: 5
RC:4
292. En un intervalo de confianza para una media,
buscamos disminuir el margen de error. Cuál de las 297. Elija la afirmación que pueda considerarse admisible
siguientes posibilidades nos permite realizarlo: al leer un estudio estadístico:
46
Preguntas propias 1 Asignatura: Estadística
RC:3 RC:2
299. En cuanto a la presentación ordenada del estudio de 304. En una población, el 70% de las alturas consideradas
una variable aislada: "más normales" se encuentran:
l. Lo más informativo es mostrar las medidas de tendencia l. Por encima del percentil 70.
central. 2. Por debajo del cuantil 0,30
2. Lo más informativo es mostrar las medidas de 3. Entre el percentil 30 y el 70
dispersión. 4. Entre el percentil 15 y el 85.
3. Se deben presentar todos los valores observados de la 5. Entre la media y la mediana.
variable, uno a uno, de menor a mayor.
4. Las representaciones gráficas dan más información que RC:4
las tablas de frecuencia.
5. A veces no tiene sentido usar frecuencias acumuladas. 305. Las medidas de centralización, en cuanto a la
información que ofrecen sobre una variable numérica,
RC:5 preferimos (por orden, de peor a mejor):
47
GoBIR Preguntas propias 1 Asignatura: Estadística
48
Preguntas propias 1 Asignatura: Estadística
49
Preguntas propias 1 Asignatura: Estadística
50
Preguntas propias 1 Asignatura: Estadística
4. 5%
5. 2,5% RC:2
51
Preguntas propias 1 Asignatura: Estadística
4. 20 2. Diagrama de barras
5. 25 3. Diagrama diferencial acumulado
4. Histograma
RC:1 5. No existe gráfica posible
52
Preguntas propias 1 Asignatura: Estadística
l. La probabilidad de que si el test da positivo el sujeto l. El riesgo beta es la probabilidad de cometer un error
esté enfermo. tipo 11.
2. La probabilidad de que si el sujeto está enfermo el test 2. El riesgo alfa (p) indica la probabilidad de cometer un
de positivo. error tipo l.
3. La probabilidad de que si el test da negativo el sujeto 3. Un error de tipo I indica conclusiones falsamente
esté sano. negativas.
4. La probabilidad de que si el sujeto está sano el test de d. La probabilidad de obtener resultados verdaderos se
negativo. denomina poder estadístico.
5. Ninguna de las anteriores. 4. Un error de tipo I indica conclusiones falsamente
positivas.
RC:2
RC:3
360. En una población el 30% son hombres de los cuales
son deportistas el 20%, frente al 25% de las mujeres. 365. La probabilidad de tener hipertensión arterial y ser
Escogida una persona al azar es deportista. La mujer es del:
probabilidad de que sea mujer es (aproximadamente):
l. 50%
l. 0,235 2. 5%
2. 0,60 3. Se desconoce sino sabemos la población de referencia.
3. 0,74 4.30%
4. 0,25 5. 20%
5. No puede calcularse con esos datos.
RC:3
RC:3
366. Si un suceso está incluido en otro, su probabilidad:
53
Preguntas propias 1 Asignatura: Estadística
RC:3
378. Si al calcular el coeficiente de correlación de dos
373. En una muestra de pacientes, el número de varones variables X e Y, se tiene r=-0.20 ocurre que
dividido entre el total de pacientes es:
l. La pendiente de la recta de regresión es pequeña.
l. Una frecuencia relativa. 2. La pendiente de la recta de regresión es grande.
2. Una frecuencia absoluta. 3. X e Y están poco relacionadas, aunque cuando X decrece,
3. Una variable cuantitativa. Y tiene tendencia a crecer.
4. Una variable cualitativa. 4. El modelo lineal de regresión explica el 20% de la
5. Un valor de la variable. varianza de una variable cualquiera en función de la otra.
54
Preguntas propias 1
GoBIR Asignatura: Estadística
S. El modelo lineal de regresión explica el 80% de la 2. Existe tendencia a que a mayor nivel de glucemia, mayor
varianza de una variable cualquiera en función de la otra. nivel de colesterol.
3. Hay más individuos con colesterol alto que con glucemia
RC:3 baja.
4. Las observaciones se muestran como una nube de
379. Si el cociente entre la varianza residual y la explicada puntos creciente.
por la regresión en un ajuste lineal es grande: S. Sólo dos de las afirmaciones anteriores son correctas.
55
Preguntas propias 1 Asignatura: Estadística
390. En un estudio de regresión lineal, donde el peso se 395. Qué afirmación sobre la covarianza es falsa:
estudie conjuntamente con otras variables, en qué casos
lo usarías como variable dependiente: l. La covarianza es una medida de la variabilidad conjunta
de dos variables numéricas.
l. Al estudiarlo con la altura. 2. Si la covarianza es positiva implica una relación creciente
2. Al estudiarlo con el nivel del colesterol. entre las variables.
3. Al estudiarlo con la presión sanguínea. 3. A partir de ella se obtiene el coeficiente de correlación
4. Al estudiarlo con el grupo sanguíneo. lineal de Pearson.
5. Nada de lo anterior. 4. Posee dimensiones.
5. Si es O podemos afirmar que no existe relación posible
RC:1 entre las variables.
56
Preguntas propias 1 Asignatura: Estadística
de 47.909 hombres que no lo tenían al inicio del estudio. l. La sensibilidad de la prueba es 0.97, luego es muy buena
De todos ellos se había obtenido información sobre el para hacer diagnóstico precoz.
consumo de líquidos y se comparó la frecuencia de 2. La especificidad de la prueba es 0.95, luego es muy mala
enfermedad según el volumen de líquidos consumidos para confirmar diagnósticos de sospecha.
agrupado por quintiles. Entre los resultados destacaba que 3. Al no conocer la prevalencia de "E" en este medio, no se
la ingesta total de líquidos se asoció con el cáncer de puede saber ni la sensibilidad ni la especificidad.
vejiga, de forma que para el quintil superior 4. El valor predictivo positivo de la prueba para diagnosticar
(ingestión>2.531 mL de líquidos por día) se calculó un "E" está entre 0.95 y 0.97, luego es muy buena para
riesgo relativo de 0.51 (intervalos de confianza al 95%: confirmar diagnósticos de sospecha.
0.32 a0.80) al comparar con el quintil inferior ( <1.290 mL 5. La sensibilidad de la prueba es de 0.95 y su especificidad
por día). Señale la respuesta correcta: es de 0.97. Hay que comparar estas cifras con las de otras
pruebas antes de introducir la nueva
l. Los autores han realizado un estudio de casos y
controles. RC:5
2. El valor de "p" obtenido a partir del estadístico de la
comparación de las medidas de frecuencia de cáncer de 402. La probabilidad de padecer estenosis coronaria en
vejiga entre los dos grupos de ingesta citados, debe ser hombres de más de 65 años, con angina de pecho de
mayor de O.OS esfuerzo típica, es mayor del 90%. A un paciente de estas
3. Se ha detectado un menor riesgo de padecer cáncer de características se le practica un ECG de esfuerzo que se
vejiga en las personas que consumían mayor volumen de informa como negativo. La sensibilidad es del 80% y su
líquidos por día. especificidad del 90%. ¿Cuál de las siguientes afirmaciones
4. El intervalo de confianza nos da una idea del grado de es correcta?.
precisión estadística del estudio, de forma que cuanto más
amplio, menos error aleatorio. l. Se puede descartar por completo estenosis coronaria
S. Los autores han realizado un estudio de correlación porque la prueba es negativa.
ecológica 2. No se puede excluir la estenosis coronaria porque el
valor predictivo positivo de la prueba es alto.
RC:3 3. No se puede excluir la estenosis coronaria porque el
valor predictivo negativo de la prueba es bajo.
399. Cuando en un contraste de hipótesis NO se rechaza la 4. Se podría descartar el diagnóstico de estenosis coronaria
hipótesis nula, ¿cuál de las siguientes afirmaciones es sí la especificidad de la prueba fuera del 100%.
correcta?: S. Los valores predictivos no son aplicables a esta situación
clínica.
l. Se ha demostrado que la hipótesis nula es verdadera.
2. Se ha demostrado que la hipótesis nula es falsa. RC:3
3. Se ha demostrado que la hipótesis alternativa es
verdadera. 403. El valor predictivo positivo de una prueba diagnóstica
4. Se ha demostrado que la hipótesis alternativa es falsa. para una enfermedad se estima por:
S. No se ha demostrado nada
RC:5 l. La proporción de individuos que al aplicarles la prueba
dan positivo.
400. En un ensayo clínico se comparan 3 tratamientos 2. La proporción de enfermos que al aplicarles la prueba
(p.e.placebo, tratamiento establecido y un tratamiento dan positivo.
nuevo). La variable respuesta es continua (p.e. nivel de 3. La proporción de positivos entre los enfermos.
glucosa en sangre). Aceptando que la variable tiene una 4. La proporción de enfermos entre los positivos.
distribución normal, la prueba correcta para comparar la 5. El número de enfermos que la prueba detecta.
respuesta es: RC:4
57
Preguntas propias 1 Asignatura: Estadística
RC:3
l.La X2 de Pearson.
2. La t de Student.
3. La F de Snedecor.
4. La U de Mann-Whitney.
5. Hazard Ratio.
58
Preguntas propias 2 Asignatura: Estadística
l. Con respecto a un análisis de regresión lineal simple, l. t de Student para datos pareados.
señalar la hipótesis que es falsa: 2. t de Student para datos independientes.
3. Prueba de Chi-cuadrado.
l. La variable explicativa se mide sin error. 4. Análisis multivariante.
2. La varianza de Y para cada valor de X es independiente S. F de Snedecor.
de X.
3. Mediante la regresión lineal simple se estima la ordenada RC:1
en el origen de la recta de regresión.
4. Mediante la regresión lineal simple no se puede estimar 6. ¿Qué test estadístico se utiliza para comparar las
la pendiente de la recta de regresión. varianzas de dos muestras?:
S. En el modelo de regresión lineal, los errores son variables
normales de media de error. l. Coeficiente de correlación.
2. t de Student.
RC:4 3. Chi-cuadrado.
4. Regresión lineal.
2. Para contrastar la igualdad de media de dos poblaciones S. F de Snedecor.
utilizando un estadístico que se distribuya
aproximadamente como una t student, ¿cuál de las RC:5
siguientes afirmaciones es falsa?:
7. Indique cuál de las siguientes afirmaciones acerca de la
l. Las dos poblaciones son normales. varianza de una muestra es cierta:
2. No es necesario que la varianza de las dos poblaciones
sean iguales. l. La varianza se mide en las mismas unidades que los
3. En algunos casos los grados de libertad de la t student se datos.
calculan por fórmulas de aproximación. 2. La varianza es el momento central de tercer orden.
4. Si las varianzas son estadísticamente iguales, se utiliza la 3. La varianza es una medida de dispersión de los datos.
cuasivariar\za ponderada. 4. El coeficiente de variación es la raíz cuadrada positive de
S. Para contrastar la igualdad de medias de dos la varianza.
poblaciones, en ningún caso se utiliza la t de student. S. El 5% de los datos son menores que la varianza.
RC:5 RC:3
3. El número de colonias de bacterias en una placa de 8. ¿Cúal de las siguientes afirmaciones sobre la
cultivo es una variable de tipo: distribución t de Student es falsa?:
59
Preguntas propias 2 Asignatura: Estadística
RC:1 RC: 1
11. Para un determinado lote de comprimidos existe una 16. ¿Cúal de las siguientes afirmaciones es cierta?:
asociación inversa entre las variables "presión del
proceso" y "porosidad del comprimido". ¿Qué valor del l. La correlación mide la fuerza y la dirección de la relación
coeficiente de correlación de Pearson sería más adecuado lineal entre dos variables cuantitativas.
para expresar la asociación?: 2. La correlación mide la fuerza y la dirección de la relación
lineal entre dos variables cualitativas.
l. r= - 0,98. 3. La correlación entre dos variables cuantitativas toma
2. r= - 0,10. siempre valores positivos.
3. r= 0,10. 4. La correlación entre dos variables no siempre es un
4. r= 0,75. parámetro adimensional.
5. r= 0,98. 5. El coeficiente de correlación solo toma valores entre O y -
l.
RC:1
RC:1
12. Si A y B son sucesos independientes, ¿Cuál de las
siguientes afirmaciones es cierta?: 17. ¿cúal de las siguientes afirmaciones es FALSA?:
l. La probabilidad de A es igual que la probabilidad de B. l. La mediana de una curva de densidad es el punto del eje
2. La probabilidad de que se produzca simultáneamente los de abscisas que divide la curva en dos áreas iguales.
sucesos A y B, es la suma de la probabilidad de A más la 2. La media y la mediana de una curva de densidad
probabilidad de B. simétrica son iguales.
3. La probabilidad de que se produzca simultáneamente los 3. La media y la mediana describen el centro de una
sucesos A y B, es el producto de la probabilidad de A por la distribución de maneras distintas.
probabilidad de B. 4. La distribución de una variable nos dice que valores toma
4. La probabilidad de que se produzca simultáneamente los y con qué frecuencia los toma.
sucesos A y B, es una probabilidad condicionada. 5. El primer cuartil es la mediana de las observaciones
5. La probabilidad de A más la probabilidad de B es la situadas a la derecha de la mediana global.
unidad.
RC:5
RC:3
18. El intervalo de confianza al 95% para la concentración
13. El número de semillas de una determinada planta es media de principio activo de un medicamento estimado
una variable: con una muestra de tamaño n= 25 fue de 0,82 a 0,86. Se
acepta que la variable aleatoria sigue una distribución de
l. Cualitativa. probabilidad normal (Z= 1,96). ¿Cuál es el tamaño de
2. Ordinal. muestra necesario para que el error de estimación sea la
3. Cuantitativa discreta. décima parte del actual?:
4. Cuantitativa continúa.
5. Dicotómica l. n= 50.
2. n=2500.
RC:3 3. n= 1000.
4. n= 100.
14. Para caracterizar la relación lineal de dos variables 5. n= 5000.
cuantitativas, ¿Cuál es la técnica estadística adecuada?:
RC:2
l. Regresión.
2. ANOVA. 19. Si al realizar una serie de medidas repetidas (n=20) de
3. Correlación. colesterol, en un mismo material de control, obtenemos
4. Test de Student. unos resultados con una media de 200 mg/dl y un
5. Chi-cuadrado. coeficiente de variación del 5%, ¿Cuál sería el límite
inferior del intervalo de confianza del 95% de nuestros
RC:1 resultados?:
60
Preguntas propias 2 Asignatura: Estadística
20. ¿cuál de las siguientes afirmaciones sobre conceptos 2. La media del nivel de azúcar en sangre de la población
generales del test de hipótesis es FALSA?: está entre 112 y 128 mg/dl con un 95% de probabilidad.
3. La media del nivel de azúcar en sangre de la población no
l. El error tipo I es controlable y fijado a priori. está entre 112 y 128 mg/dl con un 95% de probabilidad.
2. El error tipo II no es controlable a priori y puede ser 4. La probabilidad de que un individuo de la población
grande. tenga un nivel de azúcar superior a 128 mg/dl es del 5%.
3. El error a es un único número, pero el erro B depende de 5. La probabilidad de que un individuo de la población
la alternativa que se considere. tenga un nivel de azúcar inferior a 128 mg/dl es del 5%.
4. Si el erro tipo I disminuye, el erro tipo 11 aumenta, si todo
los demás permanece fijo. RC:2
5. Las decisiones por H1 no son siempre fiables.
25. La probabilidad de que un medicamento sea eficaz en
RC:5 un individuo de una población con cierta enfermedad es
del 80%. Para obtener la probabilidad de que al
21. La correcc1on por continuidad que se aplica a una administrar el medicamento a 10 personas tomadas de
variable aleatoria debe hacerse siempre que: dicha población, exactamente 3 tuviesen efecto positivo
utilizaremos la distribución de probabilidad de variable
1. El tamaño de muestra! es muy pequeño. aletoria de tipo:
2. Una variable discreta se aproxima a una variable
continua. l. Normal.
3. Una variable continua se aproxime a una variable 2. Poisson.
discreta. 3. Binomial.
4. Una variable categórica se aproxime a una variable 4. T de Student.
discreta. 5. Uniforme discreta.
5. Se hace un test de hipótesis.
RC: 3
RC:2
26. Al analizar los datos de una muestra obtenemos que
22. El número de suspensos en una asignatura tiene una 160 cm es el percentil 25 (también llamado primer cuartil)
media anual de 20. El último curso suspendieron 16 para la altura de los individuos de la muestra. Esto quiere
alumnos. ¿Cuál es el test más adecuado para poner de decir que:
manifiesto un posible cambio en la media anual?:
l. El 25% de los individuos de la muestra! tiene una altura
l. Test de hipótesis para el parámetro 'A de una distribución igual a 160 cm.
de Poisson. 2. El 25% de los individuos de la muestra! tiene una altura
2. Test de hipótesis para proporciones. mayor o igual a 160 cm.
3. Test de normalidad de D 'Agostino. 3. 25 individuos de la muestra! miden 160 cm.
4. Test de hipótesis para la media de una variable normal. 4. El 25% de los individuos de la muestra! tiene una altura
5. Test de hipótesis para el coeficiente de variación. menor o igual a 160 cm.
5. El 75% de los individuos de la muestra! tiene una altura
RC: 1 menor o igual a 160 cm.
61
Preguntas propias 2 Asignatura: Estadística
RC:4 RC: 4
31. La varianza de una variable aleatoria Binomial con 36. A partir de una muestra de 1000 niños obtenemos que
parámetros "n" y "p" es: 35 kg es el primer cuartil para el peso de niños de cierta
edad. ¿Cuál de las siguientes afirmaciones es cierta?:
l. np.
2. np {1-p). l. Los cuatro individuos de la muestra que menos pesan, no
3. p (1-p). llegan a 35kg, y los demás pesan más de 35kg.
4. n {1-p). 2. Los cuatro individuos de la muestra que más pesan,
5. Necesito más datos para poder calcular esta varianza. superan los 35kg, y los demás pesan menos.
3. La cuarta parte de los individuos de la muestra pesan
RC: 2 exactamente 35kg.
4. La cuarta parte de los individuos de la muestra tienen un
32. En una nube de puntos obtenida a partir de ciertos peso mayor o igual a 35kg.
datos, todos los puntos están perfectamente alineados, 5. La cuarta parte de los individuos de la muestra tienen un
cayendo sobre una recta de pendiente 0,7. El coeficiente peso menor de 35kg.
de correlación de Pearson estimado para estos datos será:
RC:5
l. -1.
2. -0, 7. 37. Durante una epidemia, el 10% de la población ha
3. o. contraído una enfermedad. Para obtener la probabilidad
4. O, 7. de que en un grupo de 15 personas, exactamente 7
5. 1 estuvieran enfermos utilizaremos la distribución de
RC:5 probabilidad:
62
Preguntas propias 2 Asignatura: Estadística
63
Preguntas propias 2 Asignatura: Estadística
64
Preguntas propias 2 Asignatura: Estadística
S. Se deduce directamente del mínimo valor 3. La distribución de la población según las variables de
detectable de esta magnitud. edad y sexo.
4. La esperanza de vida a cada edad y según el sexo de
RC: 3 las personas.
S. La frecuencia de una determinada causa especifica
57. ¿Qué es la capacidad discriminante de una de muerte en los grupos de edad de la población
magnitud bioquímica en la teoría del valor distribuida en grupos, generalmente de cinco años.
semiológico ?:
RC:3
l. Es la propiedad de una magnitud bioquímica de
producir resultados similares tanto en individuos 61. La mayor ventaja de la aleatorización individual en
afectados de una enfermedad como en individuos el diseño de un ensayo de gran tamaño es que:
sanos.
2. Es la propiedad de una magnitud bioquímica de l. Permite valorar la interacción entre los factores
producir resultados similares en individuos aleatorizados.
afectados de diferentes enfermedades. 2. Evita el sesgo del observador cuando éste valora las
3. Es la propiedad de una magnitud bioquímica de variables finales (end---points).
producir resultados distintos entre individuos 3. Aumenta la potencia estadística.
afectados de una enfermedad como en individuos 4. Permite una comparación verdaderamente causal
sanos. entre casos y controles porque se aproxima al modelo
4. Es la propiedad de una magnitud bioquímica de contrafáctico.
producir resultados distintos en individuos S. Permite controlar los factores de confusión
afectados de las mismas enfermedades. conocidos y desconocidos.
S. Es la propiedad de una magnitud bioquímica de
producir resultados similares en individuos RC: 5
afectados de las mismas enfermedades.
62. La probabilidad de existencia de enfermedad
RC: 3 cuando el resultado de una prueba está fuera del
intervalo de referencia se denomina:
58. Al evaluar una prueba diagnóstica, la probabilidad
de encontrar un falso positivo es 0,2 y la
probabilidad de encontrar un falso negativo es 0,1. l. Valor predictivo positivo de la prueba.
¿Cuál es la especificidad de la prueba?: 2. Especificidad de la prueba.
3. Sensibilidad de la prueba.
l. 0,1. 4. Eficiencia de la prueba.
2. 0,2. S. Valor predictivo negativo de la prueba.
3. 0,6.
4. 0,8. RC:1
s. 0,9.
63 La sensibilidad diagnóstica de una magnitud
RC:4 analítica para una determinada enfermedad es:
RC:4
RC:1
65
GoBIR Preguntas propias 2 Asignatura: Estadística
70. ¿Cuál de los siguiente NO corresponde al error a o tipo 75. Un estimador se dice que es consistente:
I?:
l. Cuando se aproxima al parámetro poblacional a medida
l. Es controlable. que aumenta el tamaño de la muestra.
2. Está fijado de antemano. 2. Cuando se aproxima al parámetro poblacional a medida
3. Es un único número. que disminuye el tamaño de la muestra.
3. Cuando su varianza es máxima.
66
Preguntas propias 2 Asignatura: Estadística
RC:5 RC:2
67
Preguntas propias 2 Asignatura: Estadística
1. Regresión lineal múltiple. 92. ¿Qué diferencia hay entre el intervalo que estima la
2. Regresión logística. media poblacional y el intervalo que estima la mediana
3. Análisis de la varianza. poblacional?:
4. Regresión de Poison.
5. Regresión de Cox. 1. El intervalo que estima la medía es mayor que el que
estima la mediana, incluso 2 veces cuando se estudian
RC:2 muestras pequeñas.
2. No existen diferencias entre ambos intervalos.
87. La medida estadística calculada con base en todos los 3. El intervalo que estima la mediana es menor que el que
datos de la población de referencia se llama: estima la media.
4. 1 y 3 ciertas.
1. Parámetro. 5. El intervalo que estima la mediana es mayor que el que
2. Estimador. estima la media.
3. Estimación.
4. Medida descriptiva. RC:5
5. Atributo.
93. Una variable que puede tomar un conjunto infinito de
RC: 1 valores y cualesquiera de sus valores intermedios, pero en
los que el cero no tiene un significado de ausencia total de
88. En una prueba estadística, la probabilidad de rechazar característica reflejada con dicha variable, se llama
una hipótesis nula que es falsa, se llama: variable:
RC:4 RC:2
89. Si queremos evaluar la intensidad de la asociación 94. El test de Wilcoxon de los rangos asignados sólo se
entre dos variables cuantitativas que no siguen una puede aplicar para hacer contrastes de hipótesis respecto
distribución normal, usaremos: a:
RC:3 RC: 1
90. Dados los sucesos A y B con probabilidad no nula e 95. ¿Cuál de los siguientes tests se utiliza para hacer
incompatibles, la probabilidad de A condicionada a Bes: contrastes no paramétricos de independencia?:
1. 1. 1. De los signos.
2. p (B) xp (A). 2. Mann-Whitney-Wilcoxon.
3. o. 3. Kruskal-Wallis.
4. p (B). 4. Kendal.
68
Preguntas propias 2 Asignatura: Estadística
69
Preguntas propias 2 Asignatura: Estadística
RC:2 RC:3
107. A unos enfermos se les pide que valoren su grado de 112. Si disponemos de una población normalmente
mejoría después de un tratamiento de una escala de 1 a 6. distribuida de valor medio µ y desviación estándar a, el
De las siguientes posibilidades ¿cuál resume mejor los intervalo de confianza para un 95% de probabilidad, de un
mismos?: valor aislado (Xi), se calcula mediante la expresión:
RC:3 RC:5
108. En una población, el 80% de las alturas consideradas 113. La precisión de un conjunto de medidas repetidas
"más normales" están: puede expresarse mediante la:
RC:5 RC:3
109. El límite de confianza de un valor predicho por la 114. Los errores sistemáticos:
recta de regresión es menor si la señal analítica medida (y)
está situada en: l.Se originan por efectos incontrolables.
2.No pueden ser eliminados.
l. El centro del calibrado. 3.No son reproducibles.
2. Dos veces el límite de detección. 4.No dependen del funcionamiento de los equipos.
3. Tres veces el límite de cuantificación. S. Pueden aparecer por un fallo en el diseño del
4. Dos veces el rango lineal. experimento.
S. Tres veces el límite de detección.
RC:5
RC: 1
115. Una serie de medidas proporcionan los siguientes
110. El análisis de un agua proporciona una concentración datos: 10, 2, 8, 4, 10, 5, 5, 2, 6, 6. Si el resultado verdadero
media de Ca 2+ de 70 mg/ml, con un límite de confianza de era igual a 5.7, ¿qué se puede decir del conjunto de
± 3 mg/ml, para n = 10, y t de Student al 95%. Este datos?:
resultado significa que:
l. Que es exacto y preciso.
l. Hay un 5% de probabilidad de que el valor verdadero se 2. Que es preciso pero no exacto.
encuentre entre 67 y 73 mg/ml. 3. Que no es exacto ni preciso.
2. Hay un 95% de probabilidad de que el valor verdadero 4. Que es exacto pero no preciso.
sea igual a 70 mg/ml. S. Que tiene sesgo.
3. Hay un 95% de probabilidad de que el valor medio sea
menos exacto que cualquiera de los resultados. RC:4
4. Hay un 5% de probabilidad de que haya que rechazar
algún dato. 116. Si realizamos un número elevado de medidas de una
S. Hay un 95% de probabilidad de que el valor verdadero se muestra, la distribución de resultados se aproxima a una
encuentre entre 67 y 73 mg/ml. curva de Gauss y podemos esperar que cuando realizamos
nuevas medidas, entre µ±Za se encuentran el:
RC:S
l. 50% de las medidas.
111. En un conjunto de medidas repetidas, la precisión 2. 68.3% de las medidas.
hace referencia: 3. 95.4% de las medidas.
70
Preguntas propias 2 Asignatura: Estadística
121. Toda medida experimental viene acompañada del 126. ¿En cuál de los siguientes casos se comete un error
correspondiente error experimental. Los errores tipo II en una prueba de hipótesis?:
experimentales se clasifican en sistemáticos y aleatorios.
Sobre éstos últimos se puede afirmar que:
71
Preguntas propias 2 Asignatura: Estadística
l. Especificidad. RC:3
2. Exactitud.
3. Precisión. 133. ¿Además del número de verdaderos negativos {VN),
4. Robustez. cuál de las opciones es necesaria para calcular fa
especificidad?:
RC:4
l. Verdaderos positivos.
128. Tras la evaluación de una prueba diagnóstica se 2. Prevalencia.
comprueba que ésta no tiene ningún resultado falso 3. Falsos negativos.
positivo. ¿Qué se puede concluir de este estudio?: 4. Falsos positivos.
72
Preguntas propias 2 Asignatura: Estadística
l. Media aritmética.
2. Media geométrica.
3. Moda.
4. Rango intercuartil.
RC:4
RC: 1
RC:3
RC:1
RC:4
73