Está en la página 1de 186

GoBR

Estadística

CURSO PARA LA PREPARACIÓN D EL BIR


@AcademiaGoBIR www.ocode mio
. b·ir.com www.academiabir.com
Derechos de Propiedad Intelectual.

ACADEMIA GO FORMACIÓN OPOSICIONES es el


titular de todos los derechos de autor del contenido de
este libro protegido por la ley de la Propiedad Intelectual y
demás leyes relativas al registro de la Propiedad Industrial
e Intelectual amparadas por la Consejería de Empleo,
Turismo y Cultura. Cualquier uso ilícito de parte o la
totalidad del material será perseguido según lo
establecido por la ley.

@AcademiaGoBIR www.academiabir.com
GoBR
ÍNDICE ESTADÍSTICA

BLOQUE 1: ESTADÍSTICA DESCRIPTIVA....................................................... 2

BLOQUE 2: MEDIDAS DE FRECUENCIA, IMPACTO Y ASOCIACIÓN ......... 25

BLOQUE 3: VARIABLES ALEATORIAS ......................................................... 34

BLOQUE 4: ESTIMACIÓN DE PARÁMETROS Y CONTRASTE DE


HIPÓTESIS ...................................................................................................... 43

BLOQUE 5: PRUEBAS ESTADÍSTICAS ......................................................... 57

BLOQUE 6: PRUEBAS DIAGNÓSTICAS ........................................................ 98

PREGUNTAS ESTADÍSTICA
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

BLOQUE 1: ESTADÍSTICA DESCRIPTIVA


ÍNDICE

1. INVESTIGACIÓN CIENTÍFICA: GENERALIDADES .... ................ .................. 2

2. VARIABLES Y TIPOS DE VARIABLES ......................................................... 5

DEFINICIÓN ....... .... ......................................................................................... 5

CLASIFICACIÓN DE LAS VARIABLES SEGÚN LA ESCALA DE MEDIDA ... 5

2.1 VARIABLES CATEGÓRICAS ... .......... ..... ... ...... .. ............ ... .................... 6

2.2 VARIABLES CUANTITATIVAS ... .. .... .. ...... .. .. .............. .. .... ........ .. .......... . 6

3. DESCRIPCIÓN DATOS CUANTITATIVOS .................................................... 8

3.1 ÍNDICES BASADOS EN MOMENTOS .................................................. 9

3.2 ÍNDICES BASADOS EN ORDENACIONES ........................................ 14

4. REPRESENTACIÓN GRÁFICA DE VARIABLES .. ...................................... 16

4.1 REPRESENTACIÓN GRÁFICA DE VARIABLES CATEGÓRICAS ..... 16

4.2 REPRESENTACIÓN GRÁFICA DE VARIABLES CUANTITATIVAS


DISCRETAS ................. ............... ....... .. ....... ........... ........ ................. ........... 18

4.3 REPRESENTACIÓN GRÁFICA DE VARIABLES CUANTITATIVAS


CONTINUAS .............................................................................................. 19

GoBIR - - - - - - - 1
Paseo de la Habana 9-1 1, Madrid. 911 610 039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

1. INVESTIGACIÓN CIENTÍFICA: GENERALIDADES


INTRODUCCIÓN

La Estadística se divide en dos partes (Tabla 1.1):


• Estadística descriptiva: Es la parte que se encarga de recoger, organizar y mostrar
gráficamente los datos que se han recogido.
• Estadística inferencia! o inferencia estadística: Es la parte que estudia los datos
recogidos para elaborar conclusiones futuras, permitiendo una toma de decisiones más
efectiva . Se pretende estudiar si se puede generalizar el estudio realizado sobre unos
datos de una muestra determinada, a toda la población.

La investigación científica es un proceso de aprendizaje dirigido, en el que a partir de


conocimientos teóricos previos, se formula una hipótesis inicial/pregunta de
investigación, de la que se deducen consecuencias que deben ser contrastadas con los
datos empíricos de un estudio/investigación.

Tabla 1.1. Tipos de estadística.

ESTADÍSTICA

DESCRIPTIVA


li1

fil
• •
li1
• • • 28%
li1

li1 50% Estadística

• 1111111M
10 %
inferencia!
li1 •

li1 li1

li1 li1 12%
1

li1 Estadística
~OBLACIÓN • descriptiva
li1 li1 ri1

Go51R 2
Paseo de la Habana 9- 11, M adrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

DEFINICIONES

POBLACIÓN: Se define población como el conjunto completo de individuos a los que


se pretende aplicar las conclusiones del estudio.
Como es lógico, cada vez que queremos realizar un estudio es prácticamente imposible
abarcar a todos los individuos que forman la población. Es por eso, por lo que se
trabaja con una muestra (Tabla 1.2). Una población puede ser:
• Infinita: Se denomina infinita cuando la cantidad es casi imposible
de medir. Ejemplos: La cantidad de estrellas en el universo, cantidad
de granos de arena en una playa.
•Finita: Algo posible de medir. Ejemplos: Población de una ciudad o
niños escolarizados en una población .
Los índices descriptivos que resumen la información de una población se denominan
parámetros (BIR-2000) (QIR-2004) .

• MUESTRA: Se denomina muestra al grupo reducido de individuos donde se llevará


a cabo el estudio. Lo ideal es trabajar con una muestra representativa de la población,
para que los resultados obtenidos en la investigación puedan ser aplicables a la
población de referencia. Trabajar con una muestra de tamaño adecuado reduce el coste
y aumenta la calidad de los datos .
En muestras con variables cuantitativas continuas, se considera muestra grande
cuando el número de observaciones "n" es de 30 valores o más; la muestra se
considerará pequeña cuando n es < 30.

Tabla 1.2. Representación gráfica de población y muestra.

MUESTRA 1
• • •
rm rm íi1
• •
rm rm
••• 1 rm

rm rm • •

rm rm fil

rm

rm
••
rm rm 1

rm
• •
rm
• rm•
rm

,ril
ROBL 1 CIO • •
rm rm
• •
rm rm

GoBIR 3
Paseo de la Habana 9- 11, ivfadrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

ANÁLISIS DE DATOS

Los datos obtenidos, se someten a análisis estadístico para obtener unos resultados . Pueden
darse dos escenarios diferentes:
• No contradicen la hipótesis inicial: Si estos resultados no contradicen la hipótesis
inicial, ésta se acepta provisionalmente.
• Contradicen la hipótesis inicial: Si la contradicen, la hipótesis inicial se rechazará
provisionalmente . Se activará un proceso inductivo donde, se revisarán los
conocimientos teóricos y se formularán nuevas hipótesis y preguntas de investigación.

En la Tabla 1.3, se puede ver el esquema general del proceso de investigación de la salud y
cómo se va modificando el conocimiento teórico a medida que analizamos las diferentes hipótesis
o preguntas de investigación.

Tabla 1.3. Proceso de investigación en ciencias de la salud.

POIBLAC IÓN 1---1 Conocimiento teórico

...
1
- H ipótes is inicial/
Pregunt a de investigación

1Muestra representativa

1
Estud io de investiQación

1
1 Recogida de datos empíricos
Revisión teoría
1

1 Anál isis estad íst ico

Resultados

¿Contradíc.en hipótesis inicia l?

Se acepta
hipótesis

GoBIR 4
Paseo de la Habana 9-11 . Madrid 911 610 039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

VARIABILIDAD BIOLÓGICA

Conceptos básicos:

• Variabilidad biológica: para cualquier magnitud biológica los valores observados en


individuos distintos suelen ser diferentes, asimismo tampoco se suelen observar los mismos
resultados en un individuo a lo largo del tiempo.

lntraindividual: La variabilidad responsable de que un individuo no observe el mismo valor


de una magnitud a lo largo del tiempo. Ésta no es la misma en todos los individuos de la
población (QIR-2003).
lnterindividual: La variabilidad responsable de que los valores de una misma magnitud
sean diferentes entre los individuos de una población .

2. VARIABLES Y TIPOS DE VARIABLES


DEFINICIÓN

Se entiende por variable cada una de las características o aspectos que se registran en los
individuos de una muestra.

,o CLASIFICACIÓN DE LAS VARIABLES SEGÚN LA ESCALA DE MEDIDA


(Tabla 1.4.)

Tabla 1.4. Clasificación de las variables.

Escala de medida Tipo de variables CLASIFICACIÓN

NOMINAL: Igualdad/Desigualdad
VARIABLES
CATEGÓRICAS
• Nominales :
A. Dicotómicas/Binarias
ORDINAL: Igualdad/Desigualdad/Orden (Cualitativas, datos no B. Politómicas .
métricos)
• Ordinales
DE INTERVALO:
Igualdad/Desigualdad/Orden/Distancia entre • Discretas
cada valor. Carecen de un cero absoluto.
Ejemplo: Escala de temperatura (ºC).
DE PROPORCIÓN O RAZÓN (BIR-2006):
VARIABLES
Igualdad/Desigualdad/Orden/Distancia y CUANTITATIVAS
tienen un cero absoluto; El valor cero
representa la ausencia total de medida, por lo
(Datos métricos)
• Continuas
que se puede realizar cualquier operación
Aritmética (Suma, Resta, Multiplicación y
División) y Lógica (Comparación y
ordenamiento).

Saber clasificar el tipo de variable es el primer paso para seleccionar la prueba


estadística.

GoBIR 5
Paseo de la Habana 9-11 . Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

2.1 VARIABLES CATEGÓRICAS.

• Variable categórica nominal (BIR-2000; 2001; 2003; 2005) : Las únicas operaciones que
pueden realizarse son relaciones de igualdad y desigualdad entre las categorías de la
variable. Si tienen dos categorías se denominan variables dicotómicas o binarias, como
por ejemplo, el sexo (Masculino/Femenino) (FIR-2015) . Si tienen más de dos categorías
se denominan politómicas, como por ejemplo, el grupo sanguíneo (BIR-2001; 2003; 2005)
(FIR-2017) . Las variables binarias siempre tienen escala de medida nominal, nunca pueden
ser ordinales.

Masculino= Masculino f:. Femenino

• Variable categórica ordinal: Además de relaciones de igualdad-desigualdad, también se


pueden establecer relaciones de orden (QIR-2002) entre las categorías de la variable .
Permite ordenar la posición de cada sujeto . Ejemplo: Estadificación GOLD de severidad de
EPOC:
• GOLD 1: Leve .
• GOLD 11: Moderada .
• GOLD 111: Grave.
• GOLD IV: Muy grave.

GOLD 1 = GOLD 1 -::f:. GOLD 11


GOLD 1 < GOLD 11 < GOLD 111 < GOLD IV

2.2 VARIABLES CUANTITATIVAS.


Las variables cuantitativas contienen datos métricos, medibles o contables . Diferenciamos dos
tipos:

• Variables cuantitativas discretas (BIR-2000) (FIR-2001; 2005) : Las variables discretas son
el resultado de recuentos. No tiene sentido calcular valores intermedios. El número de
variaciones entre valores es finito . Ejemplos de variables cuantitativas discretas son: El nº
de ingresos, nº de embarazos, número de hijos, nº colonias en una placa de cultivo.
• Variables cuantitativas continuas: El número de variaciones entre valores es infinito. Su
valor estará limitado a la exactitud del instrumento de medida utilizado. Ejemplos de variables
cuantitativas continuas son: Glucemia, colesterol LDL, talla, peso.

Dentro de las variables cuantitativas la escala de medición más utilizada es la de razón, que
es una clasificación de orden numérico donde la representación númerica es real. Por tanto
el cero significa ausencia de característica (QIR-2004 , ojo , pregunta con errata!)

Las variables cuantitativas continuas, a veces, pueden tener apariencia de variables


discretas debido fundamentalmente a dos motivos:

.,
l.
Redondeo: Muchas veces las variables cuantitativas se presentan redondeadas:
Como por ejemplo el peso: 51 Kg, 60 Kg, 65 kg . Pero éstas, tienen valores
intermedios infinitos, condicionados a la exactitud del instrumento de medida: 51, 1
Kg ; 51,12 kg; 51,128 kg ...

Variables tiempo transcurrido: Estas variables suelen expresarse en tiempo


cumplido, esto es que se expresa truncado, no redondeado.

6
Paseo de la Habana 9-11, Madrid. 911 610 039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

Ejemplo: Edad. Cuando te preguntan: ¿cuántos años tienes? Tienes la misma edad hasta
1 día antes de tu cumpleaños, no se redondea hacia arriba cuando se está a la mitad del
año y sucesivos meses.

Ejemplo: Clasificación de variables:

Variable Valores que puede tomar Clasificación variable


• Edad 1, 2, 20 .. .

• Edad>65 años Sí/No

• Sexo (Mujer/Varón) Mujer/Varón

• Raza (Blanca/Negra/Asiática/ (Blanca/Negra/Asiática/ Otra)


Otra)

• Región (América , Europa, resto (América, Europa, resto del


del mundo) mundo)

• Peso (Kg) 60Kg; 60,4 Kg; 65,53 Kg .. .

• Talla (cm) 155 cm , 165 cm , 170 cm ...

• Índice de masa corporal 20,5 ; 23,5; 22 ,3 ...

• PAS (mmHg) 130, 140, 159 .. .

• Hipertensión (Sí/No) Sí/No

• Nº de cigarrillos día O, 2, 24, 15 ...

• Fumador (Nulo/ Leve/ Medio/Alto) (Nulo/ Leve/ Medio/Alto)

• Fumador (Sí/No) Sí/No

• Colesterol total 170, 189, 200 .. .

• Hipercolesterolemia (Sí/No) Sí/No

• Duración de la enfermedad (años) 1; 2,5; 3; 20,2 ...

• Recuento articulaciones O, 3, 5, 20 .. .
inflamadas

• Nº de ingresos hospitalarios O, 2, 4, 3 ...

• Comunidad Autónoma a la que Andalucía, Extremadura , C. de


pertenece Madrid ...

Dependiendo de su escala de medida, la asignación de valores en una


variable consiste en clasificar (nominal), ordenar (ordinal), contar
(cuantitativa discreta) o medir (cuantitativa continua).

Ejemplo: Registro de información:

7
Paseo de la Habana 9-11, Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

Imagina que tienes que realizar un estudio y recoger datos sobre hábito tabáquico y obesidad .
¿Qué sería preferible registrar? ¿Qué te aporta más información?

Hábito tabáquico Obesidad


a) Fumador/No fumador. a) Peso y talla .
b) No Fumador/Medio/Alto . b) Obeso SÍ/No.
c) Nº de cigarrillos día. c) IMC.

Deben recogerse los datos tratando de obtener siempre la máxima información. En el ejemplo ,
si registramos el número de cigarrillos/día podemos calcular si el sujeto es o no fumador, sin
embargo , si inicialmente clasificamos a los individuos como Fumador/No fumador, no podríamos
calcular a posteriori el número de cigarrillos/día que el sujeto fuma . Lo mismo ocurre al registrar
la variable obesidad.

La transformación de una variable continua en una variable categórica se


denomina CATEGORIZACIÓN. En este proceso se pierde información. Por
el contrario, una variable categórica NO podremos transformarla en una
variable cuantitativa.

3. DESCRIPCIÓN DATOS CUANTITATIVOS (FIR-006) (QIR-2004)

Tabla 1.5. Clasificación de las medidas en función de índices.

,o Tipo de variables cuantitativas


ÍNDICES BASADOS EN
MOMENTOS
ÍNDICES BASADOS EN
ORDENACIONES

MEDIDAS TENDENCIA CENTRAL • Media


• Mediana
• Moda

Medidas de dispersión:

Absoluta: • Amplitud
intercuartil
• Varianza
• Rango
MEDIDAS DE DISPERSIÓN

Desviación
Estándar
Medidas de posición:
Relativa:
• Coeficiente de • Cuantiles:
variación Percentiles,
cuartiles, deciles

MEDIDAS DE FORMA:
• Índice de asimetría • Índice de
ASIMETRÍA asimetría

• CURTOSIS/APUNTAMIENTO • Índice de curtosis • Índice de curtosis

Una vez que hemos recogido todas las variables individuales de los sujetos de nuestra muestra
o población de estudio, el siguiente paso será organizar esta información.

8
Paseo de la Habana 9- 11, Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

Para la descripción de datos cuantitativos se dispone de dos tipos de índices que nos van a
permitir resumir la distribución (Tabla 1.5):

1. Índices basados en momentos.


2. Índices basados en ordenaciones.

Dentro de cada uno de estos índices, tenemos medidas de tendencia central, de dispersión y
de forma.

Ejemplo: Para el cálculo de las diferentes medidas emplearemos como ejemplo en los
siguientes apartados la siguiente distribución de valores de peso (kg) de una muestra
seleccionada de 10 adolescentes: 54, 50, 47, 47, 48, 43, 41, 40, 40, 25.

.,
l.
Los índices basados en momentos se calculan con TODOS los valores que
toma la variable . Son los más utilizados y muchas veces erróneamente
pues, la media y la desviación estándar se ven afectados por la presencia de
valores extremos, por lo que sólo deberían usarse en distribuciones
simétricas que no presenten anomalías, es decir cuando la distribución
sigue la ley Normal.

3.1 ÍNDICES BASADOS EN MOMENTOS.


Los índices basados en momentos son:

1) Momento de orden 1: Media .


2) Momento de orden 2: Varianza.
3) Momento de orden 3: Asimetría .
4) Momento de orden 4: Apuntamiento.

• MEDIDAS DE TENDENCIA CENTRAL/DE CENTRALIZACIÓN BASADA EN MOMENTOS

• Media aritmética (M) (BIR-2004; 2014) (FIR-2008) (QIR-2003; 2011 ). Momento de


orden 1.
Si tenemos X 1, X 2 . .. Xn datos , la media aritmética se calculará de la siguiente forma:
sumatorio de los valores X1, X2 , . . . , Xn, dividido por el número de casos (n). Tiene las
mismas unidades de medida que la variable.
Es el centro de gravedad de la distribución .

La media de la distribución del ejemplo es:

M= (54+50+47+47+48+43+41 +40+40+25)/10 = 43,50 Kg

• Media geométrica (G)

Es la raíz de índice N del producto de todas las observaciones .

9
Pas eo de la Habana 9-11, ¡\,fadrid. 911610039
, ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

Solo se puede calcular si no hay observaciones negativas. Es una medida estadística


poco utilizada, aunque resulta útil cuando los datos son múltiplos unos de otros y la
variable crece exponencialmente (QIR-2002).

• MEDIDAS DE DISPERSIÓN ABSOLUTA (QIR-2002)

• Varianza (V; s2 ) (BIR-2007) (FIR-2003) (QIR-2010). Momento de orden 2.


Es la medida de dispersión basada en momentos más importante, aunque no es la
más empleada. La varianza, también denominada media cuadrática , nos proporciona
información de la distancia de cada valor a su media. Es el resultado de dividir la Suma
de Cuadrados (SS= L(M-xi)2) de la variable centrada, entre los grados de libertad (gl=n -
1 ).

Varianza muestra!: Varianza poblacional:

I:;_ (xi -
1 x )2 I:;~ (xi - J-1,x )2
1
n -1 J.V

Algebraicamente, la varianza muestra! se diferencia de la varianza poblacional en


el denominador (BIR-2005):

Varianza muestra!: n-1; Varianza poblacional: N

Vayamos por partes :

Numerador:
El resultado de restar a cada valor (x;,) el valor medio (M) se denomina variable
centrada . Si sumáramos todas estas diferencias, los valores se anularían , ya que
habría diferencias positivas y negativas.
(54-43,5)+(50-43,5)+( 4 7-43,5)+( 4 7-43,5 )+( 48-43,5)+( 43-43 ,5)+( 41-43,5)+( 40-43,5)+( 40-43,5)+(25-43,5)=

(10,5) + (6,5) + (3,5) + (3,5) + (4,5) + (-0,5) + (-2.5) + (-3.5) + (-3,5) + (-18,5) =O

Es por esto, por lo que trabajamos elevando al cuadrado dichas diferencias . De esta
forma, obtenemos lo que se denomina la suma de cuadrados de la variable centrada o
suma de cuadrados.

Suma de cuadrados de la variable centrada: I:(x ;· M)2

SS= (10,5) 2 + (6 ,5) 2 + (3,5) 2 + (3,5) 2 + (4,5) 2 + (-0,5) 2 + (-2.5) 2 + (-3.5) 2 + (-3,5) 2 + (-18,5) 2

Denominador:
Para el cálculo del denominador debemos introducir el concepto de grados de
libertad (gl) o degrees of freedom (df) de un parámetro.
Grados de libertad: Se define como el número total de observaciones "n", menos el
número de parámetros estimados con estas mismas observaciones que intervienen en
su cálculo.

En este caso concreto, el denominador, es n-1, ya que con los mismos datos sólo se ha
estimado la media . Todos los valores son "libres" de tomar cualquier valor excepto uno.

10
Paseo de la Habana 9- 11, Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

Su unidad de medida, es la medida de la variable elevada al cuadrado (BIR-2003;


2004) (FIR-2000). Este hecho complica su interpretación .

V. muestra!= [(10,5) 2 + (6 ,5) 2 +(3,5) 2 +(3,5) 2 + (4,5) 2 +(-0 ,5) 2 +(-2.5) 2 +(-3 .5) 2 +(-3,5)2+(-18,5)2 ]/ 9 = 63, 389 kg 2

• Desviación estándar (DE) o desviación típica (FIR-2009) (QIR-2015 ; 2016) :

Es la medida de dispersión basada en momentos más utilizada. Es la raíz cuadrada


positiva de la varianza (BIR-2001) (QIR-2017 ; 2015) .

DE=+ ✓ v

Tiene las mismas unidades de medida que la variable, lo que facilita su interpretación.

DE=+ ✓ V=+ ✓ 63, 389 Kg 2 = 7,96171 Kg

Mide la variabilidad de los datos alrededor de la media y sólo tiene interpretación


práctica cuando la distribución sigue la ley Normal, en cuyo caso se cumple:

.l., •


El intervalo M ± 1 xDE contiene el 68% central de las
observaciones, aproximadamente (BIR-2009) .
El intervalo M ± 2xDE contiene el 95% central de las
observaciones, aproximadamente (BIR-201 O) (QIR-2011 ).
• El intervalo M ± JxDE contiene el 99, 7% central de las
observaciones, aproximadamente.
• No confundir desviación típica con error típico.

Cuando todos los datos de la distribución son iguales, la varianza y la


desviación típica son iguales a O.

Al aumentar el tamaño de la muestra, disminuye la varianza y la desviación


'T típica. Para reducir a la mitad la desviación típica, la muestra se tiene que
multiplicar por 4.

Propiedades de la media, varianza y desviación típica:

• Si a todos los valores de una variable les sumamos (restamos) , multiplicamos o dividimos
una constante k, la media aritmética queda aumentada (disminuida), multiplicada o
disminuida también en esa constante .

Los parámetros poblacionales son únicos, sin embargo, las medidas muestrales pueden
ser infinitivas, en función del número de muestras que seleccionemos de la población.

Representación más común de parámetros poblacionales y estadísticos de la muestra:

Parámetros Estadísticos
poblacionales muestra
Tamaño muestra! N n
Media aritmética M, µ X

Varianza 2 s2
Ci

Desviación
Ci DE, SO
estándar

11
Paseo de la Habana 9-11, Madr1d. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

• MEDIDAS DE DISPERSIÓN RELATIVA (QIR-2002)

• Coeficiente de variac,on (CV): La varianza, la desviación estándar, la amplitud


intercuartil y el rango son índices de dispersión absolutos. Sin embargo, estas medidas
no sirven para comparar la dispersión de dos variables distintas ya que cada índice tiene
las unidades de medida de cada variable.
El coeficiente de variación (BIR-2000; 2000; 2001; 2002; 2003; 2003; 2004; 2005;
2007; 2017) (FIR-2007) (QIR-2006) es uno de los índices de dispersión relativa más
utilizados .
Se calcula como el cociente entre la desviación estándar y la media multiplicado por 100
(BIR-2001; 2007).
CV = DE/ M * 100

Carece de unidades de medida y representa el valor de la desviación estándar en


unidades de la "media" . En general, unos datos con un CV > 30% se consideran datos
dispersos.

Si una muestra presenta un coeficiente de variación (CV) de 0,25, significa que la


desviación supone un 25% de la media (BIR-2008; 2010; 2012; 2015).

Si a cada uno de los datos de una muestra se le multiplica por una constante •
El coeficiente de variación no cambia (BIR-2004 ).

Si a todos los datos de la muestra se les suma una constante, la media y el coeficiente
de variación se modifican, la desviación estándar no (BIR-2006) .

• MEDIDAS DE FORMA

Son el índice de asimetría (BIR-2003; 2005) y el índice de apuntamiento o curtosis (BIR-2000;


2003; 2004; 2005) (FIR-2011 ). Estos índices presentan formas de cálculo más complejas que las
anteriores, y en la práctica se calculan con programas de ordenador.
En relación a estas medidas, debemos conocer los siguientes conceptos.

• ASIMETRÍA frü.:.
Informa de la magnitud y del sentido de la desviación respecto a la simetría . Puede ser:

• Asimetría nula (í 1=0): El valor í 1=0 se correspondería con una


distribución simétrica.
• Asimetría positiva (í 1 >0): La cola se aleja por la derecha . La
media es mayor que la mediana. Es frecuente en las variables
utilizadas en biomedicina, porque los valores patológicos suelen ser
más altos. Ejemplo: Creatinina, Bilirrubina ...

Si se trabaja con una muestra asimétrica positiva, se utiliza como función de


distribución de probabilidad Log Normal (BIR-2008) .

• Asimetría negativa (í 1 <0): La cola se aleja por la izquierda .


La media es menor que la mediana .

12
Paseo de la Habana 9- 11, Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

Ejemplos de distribuciones según su asimetría:

1A) Distribución con asimetría positiva:

Mediana

1B) Distribución con asimetría negativa (BIR-2002) :

Mediana

• APUNTAMIENTO (r 2 ) O CURTOSIS.

Informa de la magnitud y del sentido de la desviación respecto a la ley Normal. Una


distribución, en función de su apuntamiento, la podemos clasificar según:

A) El coeficiente de curtosis:

• Mesocúrtica (í 2 =0): Con apuntamiento nulo, como la ley Normal.


• Leptocúrtica (í 2 >0): Con apuntamiento positivo. Más apuntada que las
distribuciones que siguen una ley Normal. Los valores se acumulan en la parte
central. Menos valores en las colas de lo esperable en una distribución Normal.
• Platicúrtica (í2 <0): Con apuntamiento negativo, más aplanada que la
distribución Normal, los valores se acumulan en las colas.

B) Medida de Fisher:

• Si a< 3 ----> la distribución es platicúrtica.


I (x. -x) " • Si a = 3 ----> la distribución es Normal o mesocúrtica .
a = .
n a" • Si a> 3----> la distribución es leptocúrtica .

13
Paseo de la Habana 9-11 . M adrid. 911 610 039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

Ejemplos de distribuciones con diferente curtosis:

----------

1A) Curva Platicúrtica 1B) Curva Mesocúrtica 1C) Curva Leptocúrtica

3.2 ÍNDICES BASADOS EN ORDENACIONES.

Los índices basados en ordenaciones, se calculan con el orden que ocupan los valores cuando
se ordenan de menor a mayor. Son índices generales que permiten describir correctamente
variables cuantitativas . Utilizan las mismas unidades de medida que la variable. Para variables
cuantitativas que no cumplen la normalidad, situación muy habitual en ciencias de la salud,
y para variables ordinales, es necesario utilizar índices basados en ordenaciones, y no se
deben utilizar índices basados en momentos.

• MEDIDAS DE TENDENCIA CENTRAL/CENTRALIZACIÓN BASADAS EN


ORDENACIONES

• Mediana (Md) (BIR-2007 ; 2007) (FIR-2000; 2014) (QIR-2004 ; 2006) .


Corresponde al valor central de los valores ordenados . Es el valor que divide la
distribución en dos partes iguales: el 50% de las observaciones presentan valores iguales
o inferiores a la mediana y el otro 50% presenta valores iguales o superiores. Si la
distribución es simétrica, la mediana coincide con la media y la moda.

Cálculo mediana:

1) En primer lugar se ordenan los valores de menor a mayor (BIR-2005) :

25,40,40,41,43 , 47,47,48 , 50, 54

2) Calcular la posición donde estará situada la mediana a partir de la fórmula:

Posición nº = (n+1 )/2

2a) Si la distribución es par como en el ejemplo, obtendremos una posición


que no nos da un valor exacto:

Posición : (10+1 )/2 = 11 /2=5 ,5 En este caso, la mediana está entre el valor que
ocupe a posición 5ª y 6ª. Se seleccionarán los dos valores que ocupan estas
posiciones (43 y 47) y se calcula la media de estos . En este caso , la mediana
será: 45.
(43+ 47)/2 = 45

2b) Si por el contrario la distribución es impar, la mediana se corresponderá


numéricamente con el valor intermedio que deje a cada lado el 50% de los
valores de la distribución.

GoBIR 14
Paseo de la Habana 9-11, Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

Ejemplo distribución impar: 25, 40, 40, 41, 43, 47, 47, 48, 50, 54, 54.

Posición : (11 +1 )/2=6; La posición 6ª la ocupa el valor 4 7; En este caso , la mediana será:
47.

OJO: Si en una muestra se eliminan posiciones simétricas a la mediana (ejemplo


el primero y el último), la media puede cambiar, pero la mediana no cambia (BIR-
2004; 2006) .

• Moda (Mo).

Se corresponde con el valor que ocurre más frecuentemente. Una distribución puede
tener varias modas , en caso de haber varios valores de la variable que tengan la misma
frecuencia máxima (bimodal, trimodal) . Sin embargo, sólo tendrá una media y una
mediana. La moda siempre coincide con un valor de la distribución.

Ejemplo: Calcular la moda en la siguiente distribución :

25, 40, 40, 41, 43, 47, 47, 48, 50, 54 • Esta distribución tendrá dos modas : 40 y 47 . Es
por tanto, una distribución bimodal.

• MEDIDAS DE POSICIÓN Y MEDIDAS DE DISPERSIÓN BASADAS EN ORDENACIONES

• MEDIDAS DE POSICIÓN

• Cuantiles .

Los Cuanti/es o n-tiles son medidas de posición . Se corresponden con cada uno de los
n-1 valores de la variable que dividen los datos ordenados en n partes del mismo tamaño .

• Percentiles (P) (BIR-2001; 2002; 2002; 2004; 2006; 2012; 2015) (FIR-2008; 2011) (OIR-
2006; 2006) : Si n=100, los cuantiles son percentiles, cada uno de los 99 valores de la
variable que dividen los datos ordenados en 100 partes de igual tamaño. Así, por ejemplo,
el percentil 70 es el valor de la variable que es igual o deja por debajo de sí al 70%
del total de las puntuaciones.
P10: 32,5; P20:40; P50:45.

Ejemplo: Al analizar los datos de una muestra obtenemos que 160cm es el


percentil 25 para la altura de los individuos de la muestra. Esto quiere decir que
el 25% de los individuos de la muestra tienen una altura menor o igual a 160cm.

• Deciles (D): Si n=1 O, los cuantiles son deciles. 03: 40,5; 05: 45.

• Cuartiles (Q) (FIR-2010; 2013) : En caso de n=4, los cuantiles son cuartiles . Los cuartiles
son los valores de la variable que dejan por debajo de sí el 25%, 50% y el 75% del total
de las puntuaciones y así tenemos por tanto el primer cuartil (01 ), el segundo (02) y el
tercer cuartil (03).

Q1=40; Q2: 45; Q3: 48,5.

G:o51R 15
Paseo de la Habana 9-11 . Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

• MEDIDAS DE DISPERSIÓN BASADAS EN ORDENACIONES (FIR-2017)

• Rango intercuartílico, intervalo o amplitud intercuartil (AIC) (BIR-2002) (FIR-2014;


2017) : Es la diferencia entre el tercer y el primer cuartil, AIC=Q3-Q1 . Contiene el 50%
central de los valores de la distribución.

AIC= 48,5-40= 8,5

La Mediana, coincide con el segundo cuartil (Q2), el decil 5 (D5) y el percentil 50 (P50)
(BIR-2003 ; 2005).

• Amplitud, Rango o Recorrido (R) (BIR-2000 ; 2001 ; 2003 ; 2004) (QIR-2003) .

Se define como la diferencia entre los valores máximo y mínimo.

• Mínimo= 25 ; Máximo= 54; Rango= 54 - 25 = 29

4. REPRESENTACIÓN GRÁFICA DE VARIABLES


Tabla 1.6. Resumen representación gráfica según el tipo de variable.

Tipo de
MEJOR OPCIÓN
variables

• NOMINALES • Diagrama de sectores

VARIABLES CATEGÓRICAS • Diagrama de barras


(Datos no métricos)
• Diagrama de líneas
• ORDINALES
• Diagrama de barras

• Diagrama de barras y
líneas
• DISCRETAS
• Diagrama de tallo y hoja

VARIABLES CUANTITATIVAS • BoxPlot


(Datos métricos)
• Histograma

• Polígono de frecuencias
• CONTINUAS
• Diagrama de tallo y hoja

• BoxPlot

4.1 REPRESENTACIÓN GRÁFICA DE VARIABLES


CATEGÓRICAS
La estadística descriptiva de variables categóricas, consiste en clasificar a los sujetos según la
categoría a la que pertenecen en una tabla, con la distribución de frecuencias absolutas
(recuentos) y relativas (proporciones o porcentajes).
La representación gráfica de las variables categóricas se hace mediante el diagrama de
barras o con el diagrama de sectores .

GoBIR 16
Paseo de la Habana 9-11, Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

• DIAGRAMA DE BARRAS

En el eje de abscisas, se colocan las categorías de la distribución a representar y sobre


cada categoría, en el eje de ordenadas se proyectará la barra perpendicular, de
tal forma que su altura indique su frecuencia absoluta o relativa . El ancho es
arbitrario pero constante.
En el diagrama de barras, es recomendable ordenar las categorías de las variables
nominales por frecuencias o recuentos descendentes (de mayor a menor frecuencia), y
en las variables ordinales por valores o códigos ascendentes (del valor o código
menor al valor o código mayor).

• DIAGRAMA DE SECTORES (FIR-2011)

El ángulo de cada sector es proporcional a la frecuencia de la categoría .

Ejemplo: Se dispone del número de


envases prescritos en un mes de los
siguientes antidiabéticos orales .

Principio activo Nº de Envases


prescrito prescritos
EXENATIDA 13

LINAGLIPTINA 47
LIRAGLUTIDA 55
LIXISENA TIDA 11
REPAGLINIDA 24 EXENA TIOA LINAGLI PTINA LI RAGLUTIDA LIX ISENA TI OA REPAGLINIOA
nº envases prescritos

Representación en diagrama de
Ejemplo: Se dispone de los siguientes
sectores .
valores de individuos de una muestra
respecto a su hábito tabáquico:
nº envases
prescritos
• EXE NATIDA
LINAGLIPT INA
0 LIRAGL UTIDA Nº de
• LI XISENATIDA Hábito tabáquico
0 REPAGLI NIDA individuos
No fumador 13
Medio (O a 10
47
ciqarros/d ía)
Alto (11 ó más
55
ciqarros/día)

Representación en diagrama de
sectores.
Representación en diagrama de barras
(frecuencias absolutas).

17
Paseo de la Habana 9- 11, Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

Hábito
tabáquico
• Nulo
Medio (0-10
50,0%

cig/dis)
D Aiio (más de
11 cig/dia) 40,0%

Í J0,0%

~
o
a.
20.0%

10.0%

Representación en diagrama de barras Nulo Med10(0-10cigldis) Alto(más de 11 cigldía)


Hábito tabáquico
(frecuencias relativas).

4.2 REPRESENTACIÓN GRÁFICA DE VARIABLES


CUANTITATIVAS DISCRETAS

• DIAGRAMA DE BARRAS
En el eje de abscisas, se colocan los valores de la variable (datos discretos) y en el eje
de ordenadas, las frecuencias absolutas o relativas. Sobre cada valor de la
variable se proyectará la barra perpendicular de tal forma que su altura indique
su frecuencia.

• DIAGRAMA DE LÍNEAS
Es el gráfico que se obtiene al unir los centros de la parte superior de las barras .

Ejemplo: A continuación, se representa el diagrama de barras y de líneas


correspondientes a la distribución de número de hijos de una muestra aleatoria de familias
españolas.

Número de hijos : 1,1, 1, 1, 1, 1, 1,2,2,2,2,2,2,2,2,2,3,3,3,3,3,3,4,4,4,4,0,0,0,0.

Representación en diagrama de barras:

10

-~ 6
u
e:
Q)
::,
u
e
u.

nº de hijos

18
Paseo de la Habana 9- 11, Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

La forma correcta de representar las barras debe ser que éstas estén separadas porque no es
una variable continua.

Representación en diagrama de líneas:

10

o 6
e:
Q)
:l
(.)
Q)
e::
4 El G

o~~------------------------~~
o 2 3 4

Nº de hijos

4.3 REPRESENTACIÓN GRÁFICA DE VARIABLES


CUANTITATIVAS CONTINUAS

• HISTOGRAMA
Es la representación gráfica de una variable cuantitativa basada en momentos.
De forma general, en el histograma se agrupan los datos en clases y se cuenta cuántas
observaciones (frecuencia absoluta) hay en cada una de ellas. En las variables
cuantitativas, las clases hay que definirlas explícitamente (intervalos de clase). Los
intervalos de clase deben ser mutuamente excluyentes. El valor central se denomina
marca de clase (BIR-2002) .
Aunque pueden representarse intervalos de clase de diferente amplitud, está más
difundida su utilización con intervalos de igual amplitud.
Las características más relevantes de esta representación son:

• Cada intervalo se representa por un rectángulo cuya base que se sitúa en el


eje de abscisas y su amplitud se corresponde con la amplitud del intervalo.
• Su superficie o área de la barra es proporcional a la frecuencia de los
valores representados.
• La frecuencia sólo será proporcional a la altura cuando los intervalos de
clase tengan la misma amplitud .
• Generalmente se recomiendan entre 5 y 20 clases de igual tamaño. Otros
criterios son usar la raíz cuadrada del número de datos o la ley de Sturges.

Sus principales inconvenientes son: la distorsión que produce la presencia de valores


alejados y la diferente morfología que adopta al cambiar la amplitud de los intervalos.

19
Paseo de la Habana 9-11. AJ/adrid 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

Ejemplo de histograma:

80

60

"'
·;:;
e:
Cll
:,
U 40
Cll
-
u:

20 -

60,00 80,00 100,00 120,00 140,00


Glucosa en sangre mg/dl

• POLÍGONO DE FRECUENCIAS (BIR-2004)

Es el gráfico que se obtiene al unir los centros de la parte superior de cada rectángulo del
histograma .

80

60

"'
·¡::;
e:
CI>
::J
U 40
~
u..

20

o~ - + - - - - - - + - - - - - - + - - - - - - - + - - - - - - - + - ~
60,00 80,00 100,00 120,00 140,00
Glucosa en sangre mg/dl

• DIAGRAMA DE TALLO Y HOJAS (STEM AND LEAF PLOT) DE TUKEY

Es una representación gráfica de una variable cuantitativa basada a la vez en


ordenaciones y en momentos.
Los datos aparecen ordenados en sentido ascendente (BIR-2009) .

20
Paseo de la Habana 9- 11, M adrid. 911 610 039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

Para construirlo, dividiremos cada valor en dos partes que se llamarán:

• Hoja: Es el último dígito de la derecha.


• Tallo: Las cifras restantes de la izquierda.

Ejemplo: Descomponer los siguientes números en hoja y tallo:

Número Tallo (stem) Hoja (Leaf)


24 2 4
55 5 5
46 4 6
60 6 o

Ejemplo: Dibujar el diagrama de hoja y tallo a partir de la siguiente distribución de edades:

54, 50,47,47,48,43,41,40,43,25,48,46,50, 52,44,45,44,45,43,56,52,46,45,45, 34, 58,


65, 58, 39, 57,42, 46, O, 40, 99, 27, 5, 6, 39, 52, 8,48, 20,48, 25, 50,25, 27, 18, 70 , 48, 96, 95,
60,59,43,43,43,44, 32, 32, 32, 32,38,61, 70 .

En primer lugar les ordenaríamos:

O, 5, 6, 8, 18, 20, 25, 25 , 25, 27, 27, 32, 32, 32, 32, 34, 38, 39, 39, 40,40, 41,42, 43, 43,43,43,
43,43,44,44,44,45,45,45,45,46,46,46,47,47,48,48,48,48,48, 50,50,50,52, 52, 52, 54,
56, 57, 58, 58, 59, 60, 61, 65, 70, 70, 95, 96, 99 .

Los diferentes tallos estarán formados por las decenas de cada número y las hojas son las cifras
de las unidades de cada edad .

Diagrama de hoja y tallo de la variable de distribución edad.

Frecuencia

4,00 Extremos (=<8)


1,00 1. 8
6,00 2 . 055577
8,00 3 . 22224899
27,00 4 . 001233333344455556667788888
12,00 5 . 000222467889
3,00 6. 015
2,00 7. 00
3,00 Extremos (>=95)

Amplitud tallo: 10,00.


Cada hoja: 1 caso.

• DIAGRAMA DE CAJA O "BOXPLOT" (FIR-2010)

Es la representación gráfica de una variable cuantitativa basada en ordenaciones. Sintetiza


muy bien la distribución de los valores y muestra claramente la tendencia central, dispersión,
asimetría y va lores alejados. Es muy útil para comparar varias variables o una misma variable
entre diferentes grupos o a través del tiempo.

21
Paseo de la Habana 9- 11. M adrid. 911610039
1
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

En la representación podemos identificar las siguientes medidas:

• Mediana: Se corresponde con el trazo grueso horizontal central.


• Primer y tercer cuartil: Son las bases de la caja.
• Amplitud intercuartil (AIC) (FIR-2012) (QIR-2002) : Representada por la caja. Permite
evaluar la asimetría central de la distribución . Incluye el 50% central de las
observaciones .
• Valores máximo y mínimo de la distribución que no se consideran valores extremos:
Representados por los dos trazos horizontales más delgados. Se denominan patillas, o
"whiskers". El superior es la cabeza y el inferior el pie. Permite evaluar la asimetría de
las colas de la distribución.

Debemos diferenciar también los valores extremos, que son aquellos que se alejan
del cuartil más próximo más de 1,5 veces la AIC. Asimismo, podemos diferenciar dos
tipos de valores extremos:

• Valores exteriores: Son los que se alejan del cuartil más próximo entre 1,5 y 3 veces
la AIC. Representados con un punto -o-.
• Valores alejados: Son los que se alejan más de 3 veces la AIC. Representados con
asterisco-*- .

100,00
*t

80 ,00

60 ,00

40 ,00

20,00

o
8
0,00 o

Edad

GoBIR 22
Paseo de la Habana 9-11 . Madrid 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

• Mediana(Q2): 45
• Mínimo: O
• Máximo: 99
• Q1: 37
• Q3: 52
• Amplitud intercuartil: 15
• Mínimo no alejado: 18
• Máximo no alejado: 70
• Valores exteriores: O, 5, 6, 8
• Valores alejados: 95, 96, 99
• Rango:99

• GRÁFICO DE DISPERSIÓN o NUBE DE PUNTOS

Se utiliza para estudiar la relación entre dos variables cuantitativas (FIR-2005). Es un


gráfico donde se muestran dos variables cuantitativas, una en el eje "x" y otro en el "y",
mostrando los valores mediante puntos o símbolos .

Nube de puntos
y recra de regres1on 11 eal

O 5 10 15 20 25 JO
Re cir culac ión (%)
mé todo de BTM

23
Paseo de la Habana 9-11, 1\Jladrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

BLOQUE 2: MEDIDAS DE FRECUENCIA, IMPACTO Y


ASOCIACIÓN.
ÍNDICE

1. MEDIDAS DE FRECUENCIA, IMPACTO Y ASOCIACIÓN ........................ 25

2. MEDIDAS DE FRECUENCIA ....................................................................... 25

Proporción ..................................................................................................... 25

PREVALENCIA .......................................................................................... 26

INCIDENCIA ACUMULADA (IA) O RIESGO (R) (RISK) ............................ 26

Odds .............................................................. ................................................ 26

Tasa ............................................................................................................... 27

TASA (MEDIA) DE INCIDENCIA (TI) ......................................................... 27

3. MEDIDAS DE ASOCIACIÓN E IMPACTO ................................................... 29

RAZÓN DE INCIDENCIAS ACUMULADAS (RI) O RIESGO RELATIVO


(RR) ............................................................................................................ 29

RAZÓN DE ODDS U ODDS RATIO (OR) .................................................. 29

RAZÓN DE TASAS DE INCIDENCIAS O HAZARD RATIO (HR ............... 30

REDUCCIÓN ABSOLUTA DE RIESGO .................................................... 31

REDUCCIÓN RELATIVA DE RIESGO (RRR) ........................................... 31

NÚMERO DE SUJETOS QUE ES NECESARIO TRATAR O NNT


(NUMBER NEEDED TO TREAT) ............................................................... 31

24
Paseo de la Ha bana 9- 11. 1vfadríd 911 61 0 039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

1. MEDIDAS DE FRECUENCIA, IMPACTO Y ASOCIACIÓN.


La descripción de los eventos se puede realizar desde dos perspectivas, en función de si se tiene
en cuenta o no el tiempo:
• Óptica transversal: Se refleja la información como si de una foto se tratara. Se
calcularán por lo tanto índices estáticos referidos a un momento puntual.
• Óptica de seguimiento: Los datos no se corresponden con un momento concreto, sino
que se van registrando durante un periodo de tiempo. Se puede incluir el momento en el
que se produce el evento. Se calcularán índices dinámicos, ya que se incorpora la
variable tiempo.

Podemos diferenciar varios tipos de medidas:

Tabla 2.1. Resumen medidas de frecuencia, asociación e impacto.

TIPO DE ESTUDIO
ESTUDIOS
ESTUDIOS DE COHORTES CASO CONTROL
TRANSVERSALES
MEDIDAS DE Prevalencia de
Prevalencia Riesgo Tasa
FRECUENCIA exposición

MEDIDAS DE ASOCIACIÓN (COMPARACIÓN) E IMPACTO


Incremento
Diferencia de Reducción absoluta Reducción absoluto de la
ABSOLUTA
Prevalencias de riesgo (RAR) absoluta de tasa prevalencia de
exposición
- Razón de - Riesgo Relativo (RR) Odds
Prevalencias - Reducción absoluta Ratio
RELATIVA Hazard Ratio (HR) OJO: Sólo equivale a
de riesgo (RRR)
RR sí la frecuencia de
- Odds Ratio -NNT enfermedad es baja

2. MEDIDAS DE FRECUENCIA
Recuerda:
• Razón: cociente en el que el numerador no está incluido en el denominador. Ejemplo:
razón hombres/mujeres .
• Proporción: cociente en el que el numerador está incluido en el denominador. Ejemplo:
proporción de hombres en una clase.
• Tasa: proporción en la que el denominador incluye la variable tiempo.

Proporción
Es una razón en la que el numerador está incluido en el denominador. Expresa la frecuencia
relativa de un evento en tantos por uno y va desde O (frecuencia nula) hasta 1 (frecuencia
máxima). Una proporción puede expresarse en porcentajes si se multiplica por 1OO.

p= a/ a+b

GoBIR 25
Paseo de la Habana 9-11. Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

Ejemplo: Calcular la proporción/frecuencia relativa de fumadores en una muestra donde


hay 55 fumadores y 45 no fumadores:

La proporción de fumadores es: PF=55/(55+45) = 0,55


El porcentaje de fumadores es: o/ofumadores=0,55 X 100 = 55%

Según el diseño del estudio esta proporción será :


Estudios transversales • Prevalencia.
Estudios de cohortes • Incidencia acumulada.

• PREVALENCIA

Es la proporción de individuos de una población que presentan el evento en un


momento, o periodo de tiempo, determinado. Indica la frecuencia del evento en
la población.

Prevalencia = nº de casos existentes en un momento dado/ población total en ese momento

Características

• Es un índice estático. No incluyen tiempo en su cálculo .


• Es una proporción.
• Su valor oscila entre Oy 1, aunque a veces se expresa como porcentaje.
• Útil en: Estudios de planificación de servicios sanitarios, estudios transversales .
• Poco útil en: Investigación causal y de medidas terapéuticas ya que la prevalencia
está influida por la velocidad de aparición del evento y su duración .

• INCIDENCIA ACUMULADA (IA) O RIESGO (R) (RISK)

Representa la proporción de nuevos casos que presentan el evento durante el estudio,


respecto al total de individuos en riesgo al inicio del estudio (se excluyen los casos
prevalentes ya que no son sujetos en riesgo).

Riesgo/Incidencia acumulada= nº de casos nuevos en un momento dado/ Población en riesgo en


ese momento

Características
• Es un índice estático. No incluyen tiempo en su cálculo .
• Es una proporción , OJO, NO ES UNA TASA.
• Su valor oscila entre O y 1, aunque también se suele expresar como porcentaje.
• Depende del tiempo de seguimiento.
• Se calcula sobre una cohorte fija, es decir no se permiten entradas de nuevos
individuos durante el seguimiento .
• Limitación : a lo largo del seguimiento generalmente se pierden individuos.

Odds (FIR-2016)
Es una razón entre la probabilidad de ocurrencia de un suceso en el numerador y su probabilidad
complementaria (no ocurrencia del suceso) en el denominador. No existe la traducción de este
término en castellano.

1 O= p/(1-p) =[a/ a+b]/ [b / a+b] = a/b 1

GoBIR 26
Paseo de la Habana 9- 11, 1'v1adrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

Ejemplo: Calcular la odds de fumadores y la proporción de fumadores en una muestra de


donde hay 70 fumadores y 30 no fumadores:

La odds de fumadores es: OF=70/30 = 2,33 • Por cada no fumador hay 2,33 fumadores. La
probabilidad de ser fumador es 2,33 veces superior a la de ser no fumador.

La proporción de fumadores en este ejemplo sería:

pF=70/(70+30) = 0,70 (70%) • Hay 70 fumadores de cada 100 individuos . Estima la probabilidad
de que un individuo sea fumador.

Características

• Es un índice estático . No se tiene en cuenta el tiempo de seguimiento hasta la


ocurrencia del evento.
• Es una razón, OJO, NO ES UNA TASA.
• Su valor oscila entre:
Cero: evento que nunca ocurre.
Infinito: evento que siempre ocurre.
• Si la frecuencia del evento es baja, la odds será muy similar a la proporción.

Tasa
Una Tasa es la razón de cambio entre dos magnitudes.

Magnitud 1: Suele ser una situación clínica.


Magnitud 2: Habitualmente el tiempo.

Podemos interpretarla como: Cambio de una situación clínica por unidad de tiempo o velocidad
a la que se producen los cambios.
Hay diferentes tipos de tasas, pero en epidemiología clínica, el término tasa hace referencia a la
tasa media relativa.

• TASA (MEDIA) DE INCIDENCIA (TI) también se denomina Hazard Rate. Es una medida
del ritmo/velocidad de ocurrencia de un evento. Podemos interpretarla como número
de casos nuevos en un período dividido entre la suma de unidades de tiempo que la
población ha estado en riesgo en ese período.
Es un índice dinámico. Requiere un diseño de estudio de cohortes con tiempo de
seguimiento (estudio de supervivencia).

TI= nº de nuevos casos durante un periodo/suma de unidades de tiempo que los sujetos han estado en riesgo

Ejemplo. Para ilustrar los conceptos explicados en el apartado anterior, vamos a


considerar un estudio de cohortes de una población de 100 individuos.
• El objetivo del estudio es estudiar el desarrollo de un evento, por ejemplo , aparición de una
enfermedad .
• El estudio se inicio el 1/1/2014 y finaliza el 31/12/2014. El tiempo de seguimiento ha sido un
total de 1 año.
• Durante este periodo, un total de 91 individuos no han presentado la enfermedad .

GoBIR - - - - - - - - 21
Paseo de la Habana 9- 11, Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

• Los individuos 1, 3 y 5, presentaban la patología de estudio.


• El 2 y el 4 han presentado la patología al mes 4°.
• Los sujetos 6, 7, 8, 9 han presentado la patología al mes 10°.

01/06/2014 31/12/2014
Caso 1
Caso 2
Caso 3
Caso 4
Caso 5
Caso 6
Caso 7
Caso 8
Caso 9
Caso 10 a 100

01/01/2014 01/03/2014 01/05/2014 01/07/2014 01/09/2014 01/11/2014

- Calcular la prevalencia de la enfermedad el 1/06/2014 y el 31/12/2014

Prevalencia = nº de casos existentes en un momento dado/ población total en ese momento

Prevalencia110512014 = ; Prevalencia3111212014 =

- Calcular el riesgo/incidencia acumulada de contraer la enfermedad durante 2014:

Riesgo/Incidencia acumulada= Número de casos nuevos en un momento dado/ Población en


riesgo en ese momento

Diferencia entre Riesgo/incidencia acumulada y Tasa media de incidencia .

Como hemos visto anteriormente, existe un índice estático para medir la incidencia, que era el
riesgo/incidencia acumulada y otro dinámico que es la tasa media de incidencia.
Veremos en el ejemplo la diferencia entre estos dos índices:

Ejemplo: Calcular la eficacia de un fármaco A para el tratamiento de una determinada


patología. Para ello, partimos de una población de 200 pacientes diagnosticados de esa
enfermedad a los que se les administró el fármaco A. Al cabo de 4 meses, 25 pacientes se
habían curado.

1. Calcular el riesgo de curarse a los 4 meses:

Riesgo-Incidencia acumulada= Número de casos nuevos en un momento dado/ Población en


riesgo en ese momento

R=25/200=0 ,125 • 12,5% • El porcentaje de curaciones acumuladas a los 4 meses es de 12,5%.

2. Calcular la tasa media relativa de curaciones a los 4 meses.

TI= (N0-N1) / [(N0-N1) x tit/2 + N1 x 11t]

28
Pas eo de la Habana 9-11, M adrid. 9 11610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

TI= (200-175) / [(200-175)x2 + 175x4] = 25/(50+700) = 0,033 curaciones por sujeto y mes->
Las curaciones se han producido a un ritmo de 3,3 casos por 100 sujetos expuestos y
mes.

3. MEDIDAS DE ASOCIACIÓN E IMPACTO (BIR-2000)

Las medidas de asociación e impacto se usan para evaluar la asociación y cuantificar las posibles
consecuencias entre un evento y la exposición a un determinado factor de estudio (fármaco,
hábito , intervención quirúrgico, factor de riesgo .. . ). En el ámbito de los ensayos clínico es muy
frecuente estudiar la asociación entre un tratamiento (factor) y curación/respuesta (evento) .

Para relacionar dos medidas de frecuencia podemos utilizar: se puede hacer con su cociente (si
son iguales, se obtiene: 1) o con la diferencia (si son iguales, se obtiene: O) .

MEDIDAS DE EFECTO:

Basadas en el cociente. Si son iguales y no existe diferencia entre ambas el resultado será 1.

• Riesgo Relativo.
• Odds Ratio.
• Razón de tasas de incidencia.

MEDIDAS DE IMPACTO:

Basadas en la diferencia. Si son iguales y no existe diferencia, el resultado será O.

• Reducción absoluta de riesgo.


• Reducción relativa de riesgo.
• Número necesario a tratar.

MEDIDAS DE EFECTO:

• RAZÓN DE INCIDENCIAS ACUMULADAS (RI) O RIESGO RELATIVO (RR) (BIR-2007).


El cociente entre dos incidencias acumuladas. La interpretación es : El riesgo de
desarrollar el evento es X veces mayor en el grupo A que en el B.

Características
No tiene dimensiones.
• Rango de O a infinito (BIR-2006) .
• RR=1 • No hay asociación entre la presencia del factor y el evento.
• RR >1 • Si la asociación es positiva , es decir si la presencia del factor se
asocia a mayor ocurrencia del evento.
• RR<1 si la asociación es negativa.
• Muy útil en estudios de cohortes.

• RAZÓN DE ODDS U ODDS RATIO (OR). Es el cociente entre la Odds del evento en
expuestos y la Odds en no expuestos.

29
Paseo de la Habana 9- 11, Madrid. 911610 039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

Características

• No tiene dimensiones.
• Rango de O a infinito.
• OR=1 si no hay asociación entre la presencia del factor y el evento.
• OR>1 si la asociación es positiva, es decir si la presencia del factor se
asocia a mayor ocurrencia del evento.
• OR<1 si la asociación es negativa .
• A menor prevalencia, más se aproxima a la razón de proporciones, por lo
que en caso de baja prevalencia de la respuesta, la Razón de Odds es
muy similar a la razón de proporciones.
• Muy útil en: Estudios de casos y controles donde no es posible calcular la
Razón de incidencia o Riesgo Relativo.

Relaciones entre el OR y el RR

• RR es más intuitivo.
• OR se puede estimar siempre y de la misma forma; el RR no se puede calcular
en los diseños casos control.
• El OR está siempre más alejado de 1 que el RR: si la razón de proporciones
es > 1, la OR es aún mayor, y si la razón de proporciones es < 1, la OR es aún
menor.
• Si el riesgo es bajo, son muy parecidos.

• RAZÓN DE TASAS DE INCIDENCIAS O HAZARD RATIO (HR) . Se calcula como el cociente


entre la tasa de incidencia en expuestos, dividido entre la tasa de incidencia en no expuestos.
Sólo se puede obtener en estudios de cohortes con seguimiento. Se utiliza en estudios de
supervivencia con Regresión de Cox.

MEDIDAS DE IMPACTO

Las medidas de impacto cuantifican la fuerza de la asociación, es decir, cuántos casos se evitan
si se elimina el factor de riesgo o si se introduce el factor de protección.
1. RR > 1• Factor de riesgo :

• RIESGO ATRIBUIBLE (RA) : informa del exceso de riesgo de enfermar entre los
expuestos, es decir, la cantidad de incidencia atribuible al factor de estudio
(cuánto disminuye la incidencia en el grupo de los expuestos (le) si se elimina el
factor de riesgo) . Es una medida de la magnitud del riesgo imputable el FR.

RA = le - 10
• FRACCIÓN ETIOLÓGICA DE RIESGO o FRACCIÓN ATRIBUIBLE A LA
EXPOSICIÓN (FAE): informa acerca de la proporción o porcentaje de casos
expuestos que se deben exclusivamente al factor de riesgo. Indica el porcentaje
de casos en expuestos que se evitarían al eliminar la exposición Es una medida
del porcentaje del riesgo que se debe al FR en el grupo de expuestos.

l - l
FAE = _e __ o
le
• NÚMERO DE PACIENTES QUE ES NECESARIO DAÑAR (NNH) : representa
el número de pacientes que deben estar expuestos al factor de riesgo para que
se desarrolle un caso.

GoBIR 30
Paseo de la Habana 9--11 . Madrid. 911 610 039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

1
NNH=--
fe - lo
Ejemplo:
ENFERMOS NO ENFERMOS
EXPUESTOS 10 40
NO EXPUESTOS 15 100

RA = fe - fo = G~) - (/1 55) = 0,2 - 0,13 = 0,07

Si se eliminase el factor de riesgo , la incidencia en los expuestos {1 8 ), se reduciría en un 7%.


l l ( -10) - ( - 15)
FAE =~= SO llS = O 35
fe G~) ,
El 35% de los casos en expuestos se debe exclusivamente al factor de riesgo (el 65% restante
se debe a otras causas) . Si se eliminase dicho factor, se evitarían el 35% de los casos en
expuestos.
2. RR < 1• Factor de protección:

• REDUCCIÓN ABSOLUTA DE RIESGO (RAR) : informa del porcentaje de


pacientes que no desarrolla la enfermedad gracias al factor de protección . Es
una medida de la magnitud de la reducción del riesgo imputable al FP.
RAR =! 0 - fe

• REDUCCIÓN RELATIVA DE RIESGO (RRR): informa del porcentaje de casos


que se evitan gracias exclusivamente al factor de protección . Es una medida del
porcentaje de reducción del riesgo debido al FP en el grupo de expuestos .

n _¡
RRR =~-f.
fo
• NÚMERO DE PACIENTES QUE ES NECESARIO TRATAR (NNT) : representa
el número de pacientes que deben exponerse al factor de protección para evitar
un caso.
1
NNH=--
fo - fe
Ejemplo:
ENFERMOS NO ENFERMOS
EXPUESTOS 16 84
NO EXPUESTOS 28 72

RAR =l 0
- l
e
= (~)
100'
- (~)
100'
= O' 28 -
O 16 = O 12
12 de cada 100 pacientes no desarrollan la enfermedad debido a la exposición al factor de
protección .

RRR = 1º - fe = ( ~ ) - (-iJo) = O 429


lo -
28 '
100
La exposición al factor de protección evita la aparición de la enfermedad en el 42,9% de los
expuestos .
1 1
NNH=--=-----=833
10 - fe (~) _
100 100
(_!_§_) '
Es necesario exponer a 8 sujetos al factor de protección para evitar un caso de la enfermedad .

31
Paseo de la Habana 9- 11. i'vfadrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

Resumen de medidas de impacto:

FR: le> lo FP: le< lo Cálculo


Absoluto
RA (*RAP) RAR Mayor - menor

Relativo FAE, RA¾, FE Mayor - menor


RRR
(*RA¾P) mayor
1
NN H NNT
Mayor - menor
*Referidas a la población.

32
Paseo de la Habana 9-11. Madrid. 911 610 039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

BLOQUE 3: VARIABLES ALEATORIAS

ÍNDICE
1. VARIABLES ALEATORIAS ......................................................................... 34

DEFINICIÓN .................................... ..................... ......................................... 34

2. FUNCIÓN DE DISTRIBUCIÓN, DE PROBABILIDAD Y DE DENSIDAD .... 34

3. DISTRIBUCIÓN DE PROBABILIDAD DE VARIABLES DISCRETAS: ....... 35

3.1 DISTRIBUCIÓN BINOMIAL (n,p) ............................................................. 35

3.2 DISTRIBUCIÓN DE BERNOULLI ...... ...................................................... 37

3.3 DISTRIBUCIÓN POISSON (LAMBDA) .................................................... 37

3.4 DISTRIBUCIÓN HIPERGEOMÉTRICA (N,R,n) ... ... ............. ................... 38

4. DISTRIBUCIÓN DE PROBABILIDAD DE VARIABLES CONTINUAS: ....... 39

4.1 DISTRIBUCIÓN NORMAL (MU, SIGMA) ................................................ 39

4.2 APROXIMACIÓN DE LA BINOMIAL A LA NORMAL .............................. 40

4.3 DISTRIBUCIONES ASOCIADAS A LA NORMAL ................................... 41

GoBIR - - - - - - - 33
Paseo de la Habana 9-1 1, M adrid. 911610 039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

1. VARIABLES ALEATORIAS
DEFINICIÓN

Uno de los conceptos más importantes de la teoría de probabilidades es el de variable aleatoria


que, intuitivamente, puede definirse como cualquier característica medible que toma diferentes
valores con probabilidades determinadas .

2. FUNCIÓN DE DISTRIBUCIÓN DE PROBABILIDAD Y DE


DENSIDAD
FUNCIÓN DE DISTRIBUCIÓN DE PROBABILIDAD

Toda variable aleatoria sigue en la población una determinada ley de probabilidad que describe
su comportamiento.
Una de las preocupaciones de los científicos, ha sido construir modelos de distribuciones de
probabilidad que pudieran representar el comportamiento teórico de diferentes fenómenos
aleatorios que aparecían en el mundo real. La pretensión de modelar lo observable, ha
constituido siempre una necesidad básica para el científico empírico, dado que a través de esas
construcciones teóricas (modelos), podía experimentar sobre aquello que la realidad no le
permitía. Por otra parte, un modelo resulta extremadamente útil, siempre que se corresponda
con la realidad que se pretende representar o predecir, de manera que ponga de relieve las
propiedades más importantes del mundo que nos rodea, aunque sea a costa de la simplificación
que implica todo modelo.

La función de distribución de probabilidad:


• Es la función que asocia a cada valor de una variable, la probabilidad acumulada de los
valores inferiores o iguales . Piénsalo como la generalización de las frecuencias
acumuladas .
• A los valores extremadamente bajos, les corresponden valores de la función de
distribución cercanos a cero.
• A los valores extremadamente altos, les corresponden valores de la función de
distribución cercanos a uno.

La distribución de probabilidad pude resumirse con la media, que en este caso se llamará
esperanza matemática o valor esperado y la varianza .

• Valor esperado: Se representa mediante E[X] ó µ. Es el equivalente a la media, pero en


este caso se emplean las probabilidades de cada valor, en lugar del número de veces
que aparece el valor.
• Varianza: Se representa mediante VAR[X] o a 2 . Es el equivalente a la varianza . Se llama
desviación típica a a.

En las variables continuas, existen distribuciones que sirven de modelo para representar las
distribuciones empíricas más frecuentes:

• Variables discretas: Si la variable es discreta, es decir, si toma valores aislados dentro


de un intervalo, su distribución de probabilidad especifica todos los valores posibles de
la variable junto con la probabilidad de que cada uno ocurra. Ejemplos de distribuciones
de probabilidad de variables discretas son: Ley Binomial, ley de Poisson e
hipergeométrica.

Función de probabilidad:
Asigna a cada posible valor de una variable discreta su probabilidad.

GoBIR 34
Paseo de la Habana 9- 11, Madrid. 911 610 039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

Se asemeja a los conceptos de frecuencia relativa y diagrama de barras.


Ejemplo: Número de cruces al lanzar 2 monedas.
• Variables continuas: En el caso de variables continuas, es decir, cuando la variable
puede tomar cualquier valor de un intervalo, la distribución de probabilidad permite
determinar las probabilidades correspondientes a subintervalos de valores (densidad de
probabilidad). Dentro de la distribución de probabilidad de variables continuas la Ley
Normal es la más destacada . Así, por ejemplo, la variable "talla de un recién nacido"
puede tener valores entre 47 cm y 53 cm, pero no todos los valores tienen la misma
probabilidad, porque las más frecuentes son las tallas próximas a los 50 cm. En este
caso, la ley Normal se adapta satisfactoriamente a la distribución de probabilidad
empírica, que se obtendría con una muestra grande de casos.

Función de densidad:
En una distribución continua, las alturas no son probabilidades sino, densidades de
probabilidad. Esto significa que la probabilidad de encontrar a un individuo con una talla
exactamente igual a 49 cm es prácticamente nula . Lo que se define es la probabilidad
asociada a un determinado intervalo de tallas (ejemplo 48,5 a 50,5 cm).
Debemos imaginarnos la función densidad como la generalización del histograma con
frecuencias relativas para variables continuas . Es decir, identificamos la probabilidad de
un intervalo con el área bajo la función de densidad.

Tabla 3.1: Ejemplo de distribuciones de probabilidad.

VARIABLES DISCRETAS: Contar éxitos en experimentos repetidos

• Binomial (con reposición) .

• Bernoulli: Experimentos dicotómicos .


• Poisson (sucesos raros) .
• Hipergeométrica (Sin reposición) .

VARIABLES CONTINUAS

• Distribución Normal (gaussiana, campana, ... ).

3. DISTRIBUCIÓN DE PROBABILIDAD DE VARIABLES


DISCRETAS
3.1 DISTRIBUCIÓN BINOMIAL (n,p) (FIR-2008; 2011 ; 2013)

• La distribución binomial es una distribución discreta muy importante que surge en muchas
aplicaciones bioestadísticas.
• Esta distribución aparece de forma natural al realizar repeticiones independientes de un
experimento que tenga respuesta binaria , generalmente clasificada como "éxito" o "fracaso".
• Este modelo se aplica a poblaciones finitas de las que se toma elementos al azar con
reemplazo, y también a poblaciones conceptualmente infinitas, como por ejemplo las piezas
que produce una máquina, siempre que el proceso de producción sea estable (la proporción
de piezas defectuosas se mantiene constante a largo plazo) y sin memoria (el resultado de
cada pieza no depende de las anteriores) . Por ejemplo, esa respuesta puede ser el hábito de
fumar (sí/no), si un paciente hospitalizado desarrolla o no una infección, o si un artículo de un
lote es o no defectuoso.
Al ser variables discretas los valores que puede tomar el número de éxitos "k", la distribución
constituye siempre un diagrama de barras discontinuo .
• La variable discreta que cuenta el número de éxitos en "n" pruebas independientes de
ese experimento, cada una de ellas con la misma probabilidad de "éxito" igual a p,
sigue una distribución binomial de parámetros n y p.

35
Paseo de la Habana 9- 11, 1\,-ladrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

Función de probabilidad:
- Valores: x: O, 1, 2, ... , n
- Parámetros: n: número de pruebas, n > O entero
- p: probabilidad de éxito, O < p < 1
- k: número de éxitos .
- E[X] = nxp
- VAR[X]= nxp (1-p) (FIR-2009) (QIR-2006)

Ejemplos de distribución binomial:

• Un ejemplo de variable aleatoria con distribución binomial puede ser el número de


pacientes ingresados en una unidad hospitalaria que desarrollan una infección
nosocomial.
• Lanzar una moneda 1O veces y contar las caras :
Bin(n=10, p=1/2)
• Lanzar una moneda 100 veces y contar las caras. (Ver Figura 3.2)
Bin(n=100, p=1/2)
• El número de personas que enfermará (en una población de 300 .000 personas) de una
enfermedad que desarrolla una de cada 3000 personas.
Bin(n=300 .000, p=1/3000)

Figura 3.2. Ejemplo de distribución binomial de lanzar una moneda 100 veces y contar
las caras.
1 1

Eln(1oo;o ,s¡ -
1 to/Q'lprip.J - -
i
O1 ~
1
i
O.OB 1
i
0.06 1
j
i J
1

0.04 ~
1
i
1

0.02 ~
1

o u...,_ _ _ ___Jl'----=-<"1.u..i"f1.L.U,;..U..U.J..U...U..J..U..LJLI.U..L,lLJ..L°l1..u.'t·-=--~-....L.'-----'-'
o ~ ~ m ~ 100

Ejemplos:
La probabilidad de que un medicamento sea eficaz en un individuo de una población con cierta
enfermedad es del 80%. Para obtener la probabilidad de que al administrar el medicamento a 1O
personas tomadas de dicha población, exactamente 3 tuviesen efecto positivo utilizaremos la
distribución de probabilidad de variable aleatoria de tipo binomial

Durante una epidemia, el 10% de la población ha contraído una enfermedad. Para obtener la
probabilidad de que en un grupo de 15 personas, exactamente 7 estuvieran enfermos
utilizaremos la distribución de probabilidad binomial.

36
Paseo de la Habana 9- 11 . Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

3.2 DISTRIBUCIÓN DE BERNOULLI


• Un caso particular de la distribución binomial se tiene cuando el número de pruebas
realizadas "n" es igual a 1, que da lugar a la distribución de Bernoulli.
• Un experimento de Bernoulli se caracteriza si al realizar un experimento sólo son posibles
dos resultados:

X=1 (éxito, con probabilidad p)


X=O (fracaso, con probabilidad p 1=1-p)

Ejemplos de distribución de Bernoulli:


• Lanzar una moneda 1 vez y que salga cruz : p=1/2
• Elegir una persona de la población y que esté enfermo: p=1/10.000 = prevalencia de la
enfermedad
• Aplicar un tratamiento a un paciente y que éste responda : p=75%, probabilidad de que
el individuo responda.

El resultado en estos experimentos es dicotómico . Sólo es necesario conocer el parámetro de p


para que la variable quede perfectamente determinada.

3.3 DISTRIBUCIÓN POISSON (LAMBDA) (FIR-2007)

• La distribución de Poisson, que debe su nombre al matemático francés Simeón Denis


Poisson (1781-1840), ya había sido introducida en 1718 por Abraham De Moivre como una
forma límite de la distribución binomial que surge cuando se observa un evento raro
después de un número grande de repeticiones.
• En general, la distribución de Poisson se puede utilizar como una aproximación de la binomial,
Bin(n, p), si el número de pruebas n es grande, pero la probabilidad de éxito pes pequeña.
• La Regla es que la aproximación Poisson-binomial:
• "Buena" si n~20 y p:50,05
• "Muy buena" si n~100 y p:50,01.

• La distribución de Poisson también surge cuando un evento o suceso "raro" ocurre


aleatoriamente en el espacio o el tiempo . La variable asociada es el número de ocurrencias
del evento en un intervalo o espacio continuo, por tanto, es una variable aleatoria discreta
que toma valores enteros de O en adelante (O, 1, 2, .. ).
• El concepto de evento "raro" o poco frecuente debe ser entendido en el sentido de que la
probabilidad de observar "k" eventos decrece rápidamente a medida que "k" aumenta .
• El parámetro de la distribución, lambda (A) , representa el número promedio de eventos
esperados por unidad de tiempo o de espacio , por lo que también se suele hablar de lambda
como "la tasa de ocurrencia" del fenómeno que se observa.
• En la distribución de Poisson, la media y la varianza tienen igual valor. Si la variación de los
casos observados en una población, excede a la variación esperada por la distribución de
Poisson , se está ante la presencia de un problema conocido como sobredispersión y, en tal
caso , la distribución binomial negativa es más adecuada .

Función de probabilidad:
- Valores: x: O, 1, 2, .. ., n
- Parámetros: lambda >-.: media de la distribución; A> O
- Parámetros: n: número de pruebas, n > O entero
- p: probabilidad de éxito , O < p < 1
- Queda caracterizada por un único parámetro A (que es a su vez su media y
varianza.)- > E[X] = VAR[X]= A= nxp

37
Paseo de la Habana 9-11, 1Wadríd. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

Ejemplos de distribución de Poisson:

• Número de reacciones adversas tras la administración de un fármaco : Sigue una


distribución de Poisson de media A=2.
Si se administra este fármaco a 1.000 individuos:
- La probabilidad de que se produzca una reacción adversa (k=1) es 0,27;
- Los valores de dicha probabilidad para k=2, 3, 4, 5, 6 reacciones, respectivamente,
son : 0,27; O, 18; 0,09; 0,03 y 0,01.
- Para k=10 ó mayor, la probabilidad es virtualmente "O".

Ejemplos de aproximación de Binomial a distribución de Poisson:

• El número de individuos que será atendido un día cualquiera en el servicio de urgencias


de un hospital que atiende a una población de 300.000 habitantes (n grande porque es
mayor de 100, por lo tanto la aproximación es muy buena) .
La probabilidad de que cualquier persona tenga un accidente es pequeña, pero no nula.
Supongamos que es 1/10.000 (p=0 ,00001; p:50 ,01 ).

Aproximación binomial a Poisson : Bin(n=300 .000,p=1/10 .000)::::: Poisson(A =np=30)

3.4 DISTRIBUCIÓN HIPERGEOMÉTRICA (N,R,n)


• La distribución hipergeométrica suele aparecer en procesos muestrales sin reemplazo, en
los que se investiga la presencia o ausencia de cierta característica.
• Esta distribución es la equivalente a la binomial, pero cuando el muestreo se hace sin
reemplazo .
• Esta distribución se puede determinar de la siguiente forma:
Se tiene una población finita con N elementos, de los cuales R tienen una determinada
característica que se llama "éxito" (diabetes, obesidad, hábito de fumar, etc.).
El número de "éxitos" en una muestra aleatoria de tamaño n, extraída sin reemplazo de
la población, es una variable aleatoria con distribución hipergeométrica de parámetros
N, R y n. Cuando el tamaño de la población es grande, los muestreos con y sin
reemplazo son equivalentes, por lo que la distribución hipergeométrica se aproxima en
tal caso a la binomial.

Función de probabilidad:
- Valores: x: max{O,n-(N-R)} , .. . , min{R,n} :
- max{O,n-(N-R)} indica el valor máximo entre O y n- (N-R).
- min{R ,n} indica el valor mínimo entre R y n.
Parámetros :
N: tamaño de la población, N>O entero
R: número de éxitos en la población . Re::O entero
n: número de pruebas ; n>O entero.

Ejemplos de distribución hipergeométrica:


En el control de calidad de un laboratorio farmacéutico, se extraen muestras de un lote
de las cápsulas fabricadas y se someten a análisis para determinar su calidad,
composición ... Las cápsulas analizadas son destruidas y no son devueltas al lote del que
provienen . En esta situación, la variable que cuenta el número de cápsulas que no
cumplen los criterios de calidad establecidos , sigue una distribución hipergeométrica.

38
Paseo de la Habana 9- 11, Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

4. DISTRIBUCIÓN DE PROBABILIDAD DE VARIABLES


CONTINUAS
4.1 DISTRIBUCIÓN NORMAL (MU, SIGMA).
La distribución Normal es, sin duda , la distribución de probabilidad más importante del cálculo de
probabilidades y de la estadística . En particular, muchas medidas de datos continuos en medicina
y en biología (talla , presión arterial , etc.) se aproximan a la distribución Normal. Junto a lo anterior,
no es menos importante el interés que supone la simplicidad de sus características y de que de
ella derivan, entre otras, tres distribuciones (Ji-cuadrado , t-Student y F de Snedecor) que se
mencionarán más adelante , de importancia clave en el campo de la contrastación de hipótesis
estadísticas.
La distribución Normal queda totalmente definida mediante dos parámetros: la media (Mu) y la
desviación estándar (Sigma).

Función de densidad:
- Su función de densidad es : N(µ , o):
- Parámetros :
• Mu(µ): media de la distribución, - 00 < µ < 00 (FIR-2003)
• Sigma(o): desviación estándar de la distribución ; a> O

Características de la distribución Normal (intervalos de normalidad):

• El intervalo µ ± 1 xDE contiene el 68% central de las


observaciones, aproximadamente (BIR-2009 ).
• El intervalo µ ± 2xDE contiene el 95% central de las
observaciones , aproximadamente (BIR-201 O) (OIR-2011 ).
• El intervalo µ ± 3xDE contiene el 99,7% central de las
observaciones, aproximadamente.

• La función de densidad es simétrica , mesocúrtica y unimodal.


• La media , mediana y moda coinciden .
• Los puntos de inflexión de la función de densidad están a distancia a de µ.
• Todas las distribuciones normales N(µ, o), pueden convertirse mediante una traslación
µ, y un cambio de escala a, como N(0 ,1). Esta distribución especial se llama Normal
tipificada .

Figura 3.3. Ejemplo de distribución Normal.

(Y)
C)

,.......¡
C)

O . l%
C) 1
C)

µ-3o µ-2o µ-o µ µ+o µ+2o µ+3o

GoBIR 39
Paseo de la Habana 9-11, i\tfadrid. 911 610 039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

Tipificación de una distribución Normal ->N (media=O; desviación estándar=1) (BIR-2011 ).


• Dada una variable de media µ y desviación típica a, se denomina valor tipificado, z, de
una observación x, a la distancia (con signo) con respecto a la media, medido en
desviaciones típicas.
• En el caso de variable X normal, la interpretación es clara: Asigna a todo valor de N (µ,
a), un valor de N(0, 1) que deja exactamente la misma probabilidad por debajo.
• Nos permite así comparar entre dos valores de dos distribuciones normales diferentes,
para saber cuál de los dos es más extremo.

4.2 APROXIMACIÓN DE LA BINOMIAL A LA NORMAL.

• Una distribución binomial B(n,p) se puede aproximar por una distribución normal,
siempre que "n" sea grande y "p" no esté muy próxima a cero o a uno. La aproximación
consiste en utilizar una distribución Normal con la misma media y desviación típica que
la distribución binomial.
• Corrección de continuidad o de Yates (FIR-2007): cuando aproximamos una
distribución binomial mediante una Normal, estamos convirtiendo una variable X discreta
(toma un número determinado de valores) en una continua X' (toma valores en un
intervalo). Los valores de la probabilidad para valores fijos de la variable continua son
cero (ya que sería el área de un punto), y necesitamos definir un intervalo . Para evitar
este problema en la aproximación de los valores fijos estos se corrigen (corrección de
continuidad o de Yates) sustituyéndolos por un intervalo centrado en el punto y de valor
unidad.
• En la práctica se utiliza la aproximación cuando :

1 n>30 ; np2!5 ; nq2!5

En cuyo caso: X = E (n, p) :::: }l(.u = np, ,J = .Jnpq)

• Y tipificando se obtiene la normal estándar correspondiente:

.)í...,. -nJ}
t = - - - : : : ll(ll 11
r--- - ~
1
I
..,/n¡.1q

Figura 3.4. Distribución binomial, tamaño de muestra y su aproximación a la Normal.

0 .1 5 p = . 3

. ::.2 5
n 30

o . l.

n 120
O . OS
n = 2 70
. (12 5

·J
o ~.O
11111." .. ....... ,, 1111 ,11111
60
ll11111111 " ............. .
lO C, .120

40
Paseo de la Habana 9- 11, Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

4.3 DISTRIBUCIONES ASOCIADAS A LA NORMAL


• Cuando se desea hacer inferencia estadística, hemos visto que la distribución Normal
aparece de forma casi inevitable.
Dependiendo del problema, podemos encontrar otras (asociadas):
• X2 (chi cuadrado): La distribución x2 tiene muchas aplicaciones en inferencia
estadística. La más conocida es la de la denominada prueba x2 utilizada como prueba
de independencia y como prueba de bondad de ajuste y en la estimación de varianzas.
Los grados de libertad se calculan como: (filas - 1)(columnas - 1).

• t- Student: Prueba T de Student (BIR-2000 ; 2008) (FIR-2000 ; 2003; 2009): Se usa


habitualmente en estadística inferencia! para el contraste de hipótesis de variables
cuantitativas con distribución normal. Es simétrica con respecto a la media. Su media es
igual cero (QIR-2006). Viene definida por sus grados de libertad "n-1" que se calculan
por fórmulas de aproximación . Converge a la distribución normal, al aumentar el tamaño
de la muestra se aproxima a una normal de media O y varianza 1 (normal estándar).

Grados de libertad t- Student:


A) Muestra única: n-1
B) Muestras independientes:
• Mismo tamaño, misma varianza: 2n - 2
• Diferente tamaño, misma varianza: n 1 + n2 - 2 (BIR-2015) (FIR-2014)
• Diferente varianza : Cálculo mediante fórmulas de aproximación .
C) Muestras apareadas: n-1 (BIR-2013) .
• F-Snedecor (comparación de varianzas) : ANOVA (BIR-2014) (FIR-2002) (QIR-2002)

Fuente de Suma de Grados de Suma de


variación cuadrados libertad cuadrados
medianos
Inter grupos SCE K-1 M SE
Intra gru pos SRC N-k MSR
Total STC N-1 M ST

Donde:
* k es el número de grupos que comparamos.
* N es el número de observaciones

Estas distribuciones resultan directamente de operar con distribuciones Normales. Típicamente,


aparecen como distribuciones de ciertos estadísticos.

En este tema hemos visto conceptos similares a los ya estudiados en temas


anteriores:
Función de probabilidad Frecuencia relativa
Función de densidad Histograma
Valor esperado Media
VARIABLES DISCRETAS: Contar éxitos en experimentos dicotómicos repetidos

• Binomial.

• Bernoulli: Experimentos dicotómicos .


• Poisson (sucesos raros) .
•Hiperqeométrica (Sin reposición) .
VARIABLES CONTINUAS

• Distribución normal (gaussiana, campana, ... )

• Distribuciones asociadas a la normal:


- T-student; X2 ; F de Snedecor.

GoBIR 41
Paseo de la Habana 9-11 . iWadrid. 9116-/0039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

BLOQUE 4: ESTIMACIÓN DE PARÁMETROS Y


CONTRASTE DE HIPÓTESIS
ÍNDICE

1. PROBABILIDAD Y ESTADÍSTICA .......................... ..................................... 43

INTRODUCCIÓN ........................................................... .. .............................. 43

CONCEPTOS BÁSICOS ..................... .......................................................... 43

2. ESTIMACIÓN DE PARÁMETROS .................................... ........................... 44

DISTRIBUCIÓN MUESTRAL. ....................................... ..... .. ..... ....... ... ...... .. ... 44

ERROR DE MUESTREO .............................................................. ................. 45

CONDICIÓN DE MUESTRA GRANDE ......................................................... 46

3. ESTIMACIÓN DE MEDIAS ........................................................................... 47

4. ESTIMACIÓN DE PROPORCIONES ............................................................ 48

5. CONTRASTE DE HIPÓTESIS ....... .. ............................................................. 49

DEFINICIÓN HIPÓTESIS ........... ... ..... ........................................................... 49

RELACIONES "FALSAS": TIPOS DE ERRORES ................. ... ................... .. 52

RELACIONES "VERDADERAS" ... ... ........ ................. ..................................... 52

6. CÁLCULO DEL TAMAÑO MUESTRAL ... .................................................... 53

7. PRUEBAS ESTADÍSTICAS PARA COMPROBAR HIPÓTESIS ................. 54

42
Paseo de la Habana 9- 11, Madrid. 911 610 039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

1. PROBABILIDAD Y ESTADÍSTICA
INTRODUCCIÓN
En el bloque anterior, hemos estudiado, que la teoría de la probabilidad es la ciencia que
establece las leyes que siguen los fenómenos aleatorios .
Esto es, por ejemplo, conocer la probabilidad de encontrar un número "k" de diabéticos en una
muestra concreta.
Sin embargo, en ciencias de la salud, nos suele interesar la operación contraria : a partir de "k"
diabéticos encontrados en la muestra, estimar la proporción de diabéticos de la población.

La estadística inferencia! es la parte de la estadística que estudia los datos recogidos para
elaborar conclusiones futuras, permitiendo una toma de decisiones más efectiva. Pretende
estudiar si se puede generalizar el estudio realizado sobre los datos de una muestra determinada
a toda la población.

Sus dos pilares básicos son :


• Estimación de parámetros.
• Pruebas de significación y contraste de hipótesis .

Ejemplo: Imagine que se desea conocer la proporción de individuos con hipercolesterolemia en


un área sanitaria. Tenemos dos estrategias :
• Estrategia 1: Realizar una analítica a todos los individuos pertenecientes al área
sanitaria de estudio, lo cual supondría una tarea larga y costosa.
• Estrategia 2: Seleccionar una muestra aleatoria y representativa de la población de
estudio y extrapolar los resultados a la población. De esta forma, podremos estimar con
un alto grado de precisión la prevalencia de hipercolesterolemia.

PRINCIPIOS DE REDUCCIÓN DE DA TOS

En la estadística inferencia! si el tamaño de la muestra es grande, los valores observados en la


muestra X1, X2, X3 .. .... ... Xn pueden ser difíciles de interpretar de forma individual. Por ello
resulta útil resumir la información. Existen varios principios que enuncian la forma de reducir o
resumir estos datos (QIR-2005):

• Principio de Verosimilitud.
• Principio de Suficiencia .
• Principio de Condicionalidad.
• Principio de Birnbaun.

COCEPTOS BÁSICOS
POBLACIÓN: Se define población como el conjunto completo de individuos a
los que se pretende aplicar las conclusiones del estudio.

• MUESTRA: Se denomina muestra al grupo reducido de individuos donde se


llevará a cabo el estudio .

l. Parámetro (BIR-2000) (QIR-2004) : Índice calculado de una población, por


ejemplo la media, la varianza o una proporción.
Estadístico: Valores observados en la muestra .

43
Paseo de la Habana 9-"11, Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

2. ESTIMACIÓN DE PARÁMETROS
DISTRIBUCIÓN MUESTRAL

La distribución muestra! de un estadístico, es la distribución de frecuencias de los valores


obtenidos al aplicar el estadístico a todas las posibles muestras, del mismo tamaño y extraídas
aleatoriamente. Tendremos por lo tanto, distribuciones muestrales de la media (Figura 4.1), de
una proporción (Figura 4.2) .. .

Distribución muestra! de la media.

En la Figura 4.1 podemos observar que :


• La media o proporción de una población (parámetros) son únicos.
• En cada muestra seleccionada , la media tendrá un valor diferente.
• La distribución muestra! contiene todas las posibles medias.
• La media de la distribución muestra! coincide con la media de la población de origen.

Figura 4. 1. Distribución muestra/ de la media.

~~
.
/ - - - -.. ,___ ;f (\...__
X11

\
Muestra 2

Muestra 3
\._~ _/
1/ Muestra)-/~ ~ /::....-X \
l

7
(

(
.,,

x";",
) La distr i bución muestra! de
media es normal


/
J~ \

\~
X=N (µ . cr)

\\...Muestra¡:: ~~
'- /---...... / -
...._____,.,.. - ' X"

Distribución muestra! de una proporción:

Una población binomial está estrechamente relacionada con la distribución muestra! de


proporciones; una población binomial es una colección de éxitos y fracasos, mientras que una
distribución muestra! de proporciones contiene las posibilidades o proporciones de todos los
números posibles de éxitos en un experimento binomial, y como consecuencia de esta relación,
las afirmaciones probabilísticas referentes a la proporción muestra! pueden evaluarse usando la
aproximación normal a la binomial, siempre que nxp::: 5 y nx(1-p)::: 5. Cualquier evento se puede
convertir en una proporción si se divide el número obtenido entre el número de intentos.

GoBIR 44
Paseo de la Habana 9- 11, 1\11adád. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

Figura 4.2. Distribución muestra/ de una proporción.

.,,,.-----------~ 0
(
/~
/' )< /.,...-.,'\
, / MLiestra ·1 _,,,/ '\, \ p;¡ ) ~;
( M1Jestra 2 ~_______\.,...} -__ _/ ( p3
1 ~
~\ Muestra 3 1 • ( p3 )
\ Pk
~
Muestra K
"--..
___
-y__
.....______________,,,.
/

------....
~-------/
Distribución muestra! de Proporciones
POBLACION

Al aumentar el tamaño de las muestras, el valor de las medias se aproximará más a la media
de la población . Si el tamaño de la muestra fuera toda la población, la media estimada coincidiría
con el de la población (no existiría error de muestreo) .

Ejemplo: En la Figura 4.3 se puede observar el efecto del tamaño de muestra en la


distribución muestra! de medias extraídas aleatoriamente de una población de edad entre
O a 100 años con una distribución uniforme y diferente tamaño de muestra.

La estimación de parámetros puede ser una estimación puntual o por intervalo .


Dentro de la estimación puntual un método utilizado es el Método de la Máxima
Verosimilitud (elegir los valores de los paramétros que hacen máxima la
probabilidad de la muestra observada). (QIR-2005)
Un estimador será tanto más consistente cuanto más se aproxime al valor
real del parámetro poblacional (QIR-2003) .

Figura 4.3. Efecto del tamaño de muestra.

140 140 •
N- 30 IW N-JOO i!O N-250
100 100
11 illt •
,10 r,(l

40 40
20
o ri l.. 20

ERROR DE MUESTREO (BIR-2008)

Como hemos podido apreciar, al realizar un estudio , si seleccionamos muestras distintas de igual
tamaño, la estimación puntual de la media sería un valor distinto en cada una de las muestras.
Por lo tanto, la estimación puntual de un parámetro, debe ir acompañada de su precisión que
denominamos error de muestreo.

45
Paseo de la Habana 9- 11, Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

IMPORTANTE: El error de muestreo depende principalmente del tamaño de


la muestra: A mayor tamaño de muestra, mayor precisión y menor error de
muestreo.
Es importante tener claros los conceptos de Desviación Estándar, Error
Estándar, Intervalo de Normalidad del 95% e Intervalo de Confianza del 95%:

• Desviación Estándar (DE): Es una medida de la variabilidad de los valores de la


variable aleatoria.
• Intervalo de normalidad del 95% (IN95%). Indica variabilidad de los sujetos y contiene
el 95% central de sujetos. Recuerda: Si la variable sigue una ley Normal:
• El intervalo M ± 1xDE contiene el 68% central de las observaciones,
aproximadamente (BIR-2009).
• El intervalo M ± 2xDE contiene el 95% central de las observaciones,
aproximadamente (BIR-201 O) (QIR-2011 ).
• El intervalo M ± 3xDE contiene el 99,7% central de las
observaciones, aproximadamente.
• No confundir desviación estándar con error estándar.

,o • Error Estándar (EE) (BIR-2001; 2006; 2007; 2007; 2013) (FIR-2006; 2014) (QIR-2003 ;
2006) . Es una medida de la variabilidad de los valores de la media de la distribución
muestra! de medias.

jEE = SD/✓n 1

• Intervalo de Confianza del 95% (IC95%) (BIR-2004; 2007 ; 2008) (FIR-2008) (QIR-
2007) . Es el intervalo que tiene un 95% de probabilidades de éxito de contener la
verdadera media de la población. Es más reducido que el IN95% . Es una medida de la
variabilidad de los errores de muestreo de las med ias, que valora la precisión con que la
media de la muestra estima la media de la población . Al aumentar la amplitud de un
intervalo de confianza, disminuye la precisión de la estimación (BIR-2001; 2002; 2013 ;
2016 ), y viceversa.

La DE y el EE son medidas matemáticas de variabilidad de difícil


interpretación práctica. Es más fácil interpretar estas variabilidades
expresándolas en forma de rangos de valores:
• El Intervalo de normalidad indica la variabilidad de los valores de los
sujetos (DE);
• El Intervalo de confianza indica la variabilidad de los errores de muestreo
de la media (EE) acotando la zona donde se sitúa la media de la población .

CONDICIÓN DE DE MUESTRA GRANDE

• Variables Cuantitativas:

1) Si la distribución de la variable aleatoria presenta en la población una


distribución Normal, las distribuciones muestrales siempre siguen una ley Normal.

2) Si la distribución de la variable aleatoria NO sigue una distribución normal, el


tamaño de muestra a considerar tiende a ser mayor a medida que la distribución
de la población se aleja de la Normal. Con carácter general, en estas variables , una
aproximación a la ley Normal suele ser correcta siempre que "n" sea mayor o igual

46
Paseo de la Habana 9-11, 1\tladrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

que 30. No obstante, como se ha comentado, a medida que se aumenta la


asimetría , el tamaño requerido es mayor.

• Variables categóricas:

La distribución muestra! de proporciones se aproxima satisfactoriamente a la ley


Normal si se cumple la condición:

nxp ~ 5 y nx(1-p) ~ 5 1

n = número de sujetos; p = proporción.

Ejemplo:

Para una población simétrica (p=0,50), solamente serán necesarios 10 sujetos para poder
aproximar a una distribución muestra! a la Normal. (1 O x 0,5 = 5 ; 1O x (1- 0,5)=5 )

Según se va incrementando la asimetría, el tamaño requerido será también mayor:

p= O, 15 • las muestras deben tener al menos 34 sujetos (33,3 x O,15 = 5) .

p= 0,08 • las muestras deben tener al menos 63 sujetos (62 ,5 x 0,08 = 5).

Cuando el tamaño "n" de las muestras es pequeño , el efecto central del límite no tiene potencia
suficiente para aproximar a la ley Normal. En este caso, la distribución muestra! depende de la
distribución de probabilidad de la población .

3. ESTIMACIÓN DE MEDIAS
Si partimos de una muestra aleatoria de una población que sigue una distribución normal , N(M ,
DE), se sabe que la distribución muestra! de la media seguirá también una distribución normal.
Esto es exacto para poblaciones normales y aproximado (buena aproximación con muestras con
n~30 sujetos) para poblaciones cualesquiera . El error estándar será igual a: EE= SD/✓n .

¿Cómo podemos estimar la media poblacional con esta muestra?

~{ir±Zn.,/;t
"·~
cr
n

Llamando Za al valor de una variable normal tipificada que deja a su derecha un área bajo la
curva de a, es decir, que la probabilidad que la variable sea mayor que ese valor es a (estos son
los valores que ofrece la tabla de la normal).

47
Paseo de la Habana 9- 11, Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

Podremos construir intervalos de la forma para los que la probabilidad es 1 - a.

También se puede escribir:

p± Zn¡;;
)i'.
(T
Oi, ...
f7

o, haciendo énfasis en que a-/ J;z es el error


estándar de la media :

A un intervalo de este tipo se le denomina intervalo de confianza (BIR-2011) (FIR-2006) (QIR-


2010). El nivel de confianza habitual es el 95% , en cuyo caso a.=0,05 y za. 12 =1,96 (BIR-2002) . Al

valor X se le denomina estimación puntual y se dice que X es un estimador de M .

Ejemplo: De una población normal con desviación estándar igual a 2 se extrae una
muestra aleatoria de tamaño 20 en la que se calcula que su media es igual a 5,3. Se puede
decir que la media de la población tiene una probabilidad de 0,95 de estar comprendida en
el intervalo 4,42 a 6,18 que sería el intervalo de confianza del 95% para la media .
....
5,3±1,96 ~ =(4,42 - 6,18)
-..;20 , .

4. ESTIMACIÓN DE PROPORCIONES
Sea X una variable binomial de parámetros n y p (RECUERDA: una variable binomial es el
número de éxitos en n ensayos ; en cada ensayo la probabilidad de éxito (p) es la misma) .
Si n es grande y p no está próximo a O ó 1 X es aproximadamente normal con media np y

..... :.\;:
varianza npq (siendo q = 1 - p) y se puede el estadístico proporción muestra! ( p =-;;)seguirá
también una distribución normal, con una varianza (FIR-2015) dada por pqln o lo que es lo

mismo, p(1-p)ln, y un error típico dado por


será :
~ , en consecuencia , el IC para p al 100( 1 - o)%

GoBIR 48
Paseo de la Habana 9- 11 . Madrid 911 610 039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

Ejemplo: En una muestra de 100 pacientes sometidos a un cierto tratamiento se obtienen


80 curaciones. Calcular el intervalo de confianza al 95% de la eficacia del tratamiento.

ji= 0,80 é/= 0,20 n=100 2vp 2s = 1, 96


O, 80x O, 20 _ ,... , _ ± O 0, 84
IC O, 95'1/"ó : 0,80±1,96 - - - - - - l ) , ,3Ü , /
100

¿Qué significa este intervalo? La verdadera proporción de curaciones está comprendida entre,
aproximadamente, 72% y 88% con un 95% de probabilidad. ¿Es suficientemente preciso? Habrá
que juzgarlo con criterios clínicos .

Ejemplo: Para evaluar una vacuna para la gripe se selecciona un grupo de 200 individuos de
riesgo . Se eligen aleatoriamente a 100 de ellos y se les suministra la vacuna; de ellos 1O pasan
la gripe. Construir un IC al 95% para la probabilidad de pasar la gripe si se está vacunado. En
los otros 100 pacientes sin vacunar la pasan 20. ¿Hay evidencia de que la vacuna es eficaz?

La fórmula para calcular IC para proporciones es:

.-.
p ±z"n
(!)(/
.:........=....
n

y aproximando p y q por sus estimaciones

IC95% O, 1± 1,96 O, 1x 0, 9 = O, 1 ±0,06=(0,04 O, 16)


100 ~

es decir, hay una probabilidad del 95% de que la probabilidad de pasar la gripe si se está
vacunado esté comprendida entre el 4% y el 16%.

Para los no vacunados:

n ·')··o 0
IC95'}·ó: 0,2 ± 1,96\ ,. ,"" i<. ' 0 = O, 2 ± 0,08=( O, 12 0,28)
100 ,

Existe solapamiento, aunque pequeño, entre ambos intervalos ; por tanto no podemos asegurar
que la vacuna sea eficaz.

Al aumentar la amplitud de un intervalo de confianza para estimar un parámetro,


disminuye la precisión de la estimación (BIR-2001 ).

5. CONTRASTE DE HIPÓTESIS (FIR-2007)

DEFINICIÓN HIPÓTESIS

La hipótesis de trabajo puede definirse como una conjetura plausible. Se formulan como una
declaración . No se formulan como una pregunta.

GoBIR 49
Paseo de la Habana 9-11. 1\rfadrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

• Formulación adecuada:
"El fármaco A no tiene efecto para el tratamiento de la patología de estudio".
• Formulación errónea:
"¿El fármaco A tiene efecto para el tratamiento de la patología de estudio?".

El contraste de hipótesis es el fundamento básico de todas las pruebas de significación


estadísticas . A continuación se explicarán los pasos a seguir para llevar a cabo un contraste de
hipótesis :

PASOS A SEGUIR

1°) FORMULAR LA HIPÓTESIS NULA.

• Hipótesis nula: Es la hipótesis que se pone a prueba con intención de rechazarla. Se


formula en términos de igualdad.
Se suele representar como Ha. La hipótesis nula puede interpretarse como aquella que
normalmente sería aceptada mientras los datos no indiquen otra cosa.

1 Ha: Mo-MN = O

2°) FORMULAR LA HIPÓTESIS ALTERNATIVA.


• Hipótesis alternativa (QIR-2003) : En todo contraste de hipótesis, hipótesis nula se enfrenta
a la hipótesis alternativa, que la rechaza. Es la que se deduce de rechazar la hipótesis nula.
Suele representarse como H 1 .

Puede formularse de diferentes maneras, en función de cómo se formule, tendremos pruebas


estadísticas de significación unilateral o bilateral:

• Pruebas estadística de significación bilaterales (BIR-2001; 2005; 2007) : Las


diferencias encontradas pueden producirse en ambos lados de la igualdad.

• Hipótesis nula: Ha: Mo-MN = O;


• Hipótesis alternativa: H1: Mo- MN '#.

• Pruebas estadísticas de significación unilateral: Las diferencias encontradas


sólo pueden darse en un sentido. Presentan la ventaja de tener valores
de p menores (BIR-2015) (habitualmente la mitad de los empleados en pruebas
bilaterales, por lo tanto , dan valores "p" menores).
• Hipótesis nula Mo-MN = O;
• Hipótesis alternativa H1 :M0 -MN > O ó H1:Mo-MN < O

Para poder emplear pruebas de significación unilateral, se debe tener un conocimiento teórico
del tema de investigación muy sólido y poder establecer argumentos de peso que justifiquen que
el resultado sólo puede en un sentido.

Por norma general, en los estudios van a utilizarse pruebas estadísticas de significación
bilaterales .

3°) SELECCIONAR UN NIVEL DE SIGNIFICACIÓN.

• Nivel de significación (BIR-2001; 2003; 2003; 2007; 2014) : Podemos definir el nivel de
significación de un contraste, a la probabilidad de cometer un error de tipo l. Esto es,

GoBIR 50
Paseo de la Habana 9-11, Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

como veremos más adelante, el rechazar la hipótesis nula, cuando esta es cierta . Este valor,
se fija de antemano, antes incluso de comenzar el estudio. Por lo general, se suele
seleccionar un nivel de significación de 5% ó 1%.

4°) SELECCIONAR UN ESTADÍSTICO DE CONTRASTE Y OBTENER SU SIGNIFICACIÓN.


La elección de un estadístico u otro dependerá de varios factores como estudiaremos más
adelante.
• Significación. Es un indicador de la discrepancia entre una hipótesis nula y los datos
obtenidos de la muestra . Se suele representar con la letra p.
El valor de significación "p" indica la probabilidad de que las diferencias encontradas en la
muestra sean debidas al azar, y si la relación que se ha encontrado entre las variables de la
muestra se puede asumir en la población de referencia.
Cuanto más cercano sea a cero, más evidencia tenemos en contra de la hipótesis nula;
De forma arbitraria, se establece el valor p=0,05 como límite entre probabilidad debida azar
grande o pequeña.
Los valores de significación "p", actualmente se obtienen con programas estadísticos
informáticos que nos proporcionan los valores exactos.
Dado que el valor p=0,05 es arbitrario, es recomendable dar el valor de p exacto (p. ej., 0,02,
0,017, 0,22) para dar una idea más precisa de lo que puede ocurrir debido al azar.
No obstante, cuando existen valores p muy reducidos, suelen expresarse como p < 0,001. De
esta forma, se indica que la diferencia obtenida, es muy poco probable que sea explicada por el
azar.

5°) INTERPRETAR LOS RESULTADOS EN FUNCIÓN DEL VALOR "p" OBTENIDO.


Una vez obtenido el valor de significación "p" (BIR-2001 ), hay dos opciones de interpretación en
base a los resultados obtenidos de contraste de hipótesis:

• Existen diferencias estadísticamente significativas (FIR-2012) • Se rechaza la hipótesis


nula.

Podemos definir que un contraste es estadísticamente significativo, cuando a partir de los


resultados de la muestra concluimos que se rechaza la hipótesis nula.
Si el valor de significación p :5ó 0,05 (BIR-2009 ; 2010 ; 2012 ; 2013 ; 2016) , existen diferencias
estadísticamente significativas. La probabilidad de que la diferencia encontrada, se pueda
explicar por el azar es baja. En este caso, se rechazará la hipótesis nula y se asume la hipótesis
alternativa H 1 como verdadera.

• No existen diferencias estadísticamente significativas • Se acepta la hipótesis nula


(BIR-2006).
Si el valor de significación p > 0,05, no existen diferencias estadísticamente significativas. La
diferencia encontrada es explicable por el azar. En este caso, se acepta la hipótesis nula.

Las pruebas de significación estadística funcionan en base a la probabilidad de un resultado .


Pero en la realidad, al realizar un contraste de hipótesis, puede haber 4 resultados posibles:

Dos situaciones donde existe una relación verdadera y otras dos conducen a conclusiones
equivocadas (Tabla 4.1) .

,o Tabla 4.1. Tipos de errores y relaciones verdaderas.


Prueba estadística
p > 0,05
Se acepta Ho
p:;;; 0,05
Se rechaza H0
Error aleatorio tipo 11 Potencia
H1 es verdadera
Riesqo í3 1 - í3
RELACIÓN REAL Confianza Error aleatorio tipo 1
H0 es verdadera 1-a Riesgo a,
Significación

GoBIR 51
Paseo de la Habana 9-11, Madrid. 911 610 039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

RELACIONES "FALSAS": TIPOS DE ERRORES


• Error tipo 1 (BIR-2003; 2005; 2007; 2007) (FIR-2001; 2004; 2015) (QIR-2002) . El error
tipo I consiste en rechazar la hipótesis nula, cuando esta es cierta. Cometer un error tipo
1 supone ver diferencias que no existe. Su probabilidad de ocurrencia es el riesgo alfa
(a).
- Alfa: Por lo tanto, definiremos alfa como la probabilidad de dar por verdadera
una relación que no existe en la realidad. Suele tomar el valor del 5% (BIR-2006)
al adoptar el límite arbitrario de significación en el 0,05.

• Error tipo 11 (BIR-2003; 2006; 2009; 2014; 2017) (FIR-2016) (QIR-2004) : El error tipo 11
consiste en no rechazar la hipótesis nula, cuando esta es falsa. Cometer un error tipo 11
supone no ver diferencias que si existen. La probabilidad de que ocurra se la denomina
riesgo beta (13.).
- Beta: Por lo tanto, definiremos beta como la probabilidad de no detectar una
relación que en realidad existe. Se suele cuantificar en 0,20 (20%).
Este riesgo es especialmente alto en el caso de muestras pequeñas (estudios
con poca potencia). Esta limitación no se da si se ha realizado el correspondiente
cálculo del tamaño muestra!.

RELACIONES "VERDADERAS"
• Confianza. El contraste de hipótesis nos da un resultado no significativo y la hipótesis
nula es verdadera. Su probabilidad de ocurrencia es 1-alfa, habitualmente el 95%, para
un riesgo alfa de 0,05.

• Potencia (BIR-2000; 2009; 2017) (QIR-2003 ; 2004 ). El contraste de hipótesis nos da un


resultado significativo y la hipótesis alternativa es verdadera. Es la capacidad de detectar
una diferencia cuando ésta existe realmente (BIR-2009; 2011; 2012) . Su probabilidad de
ocurrencia de 1-beta, habitualmente toma el valor de 80%, para un riesgo beta de 0,20 .

.,
l.
El riesgo alfa y beta están inversamente relacionados.
Sólo pueden disminuirse las dos, aumentando el tamaño
muestra! (Figura 4.4).

Figura 4.4. Relación error tipo a y [3.

A B

52
Paseo de la Habana 9-11, J'viadrid. 911 610 039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

Ejemplo:

Hipótesis nula: El tratamiento con el fármaco A tiene el mismo efecto que el tratamiento con
placebo o dicho de otra forma, el efecto medio obtenido con el fármaco A es igual al efecto medio
obtenido con placebo .

Hipótesis alternativa: El tratamiento con el fármaco A tiene efecto diferente que el tratamiento
con placebo .

Para ver si el tratamiento con el fármaco A se asocia con mejores resultados de respuesta, se
analizan los datos obtenidos en la muestra.

Placebo Fármaco A Diferencia Significación


(N= 159) (N= 162) contraste
% de pacientes
que alcanzan 8,8 %(14) 11 ,7% (19) 2,9% p =0 .08(p> 0,05)
respuesta

En el grupo de placebo, responden el 8,8% de los individuos, mientras que con el tratamiento A,
el porcentaje de sujetos que alcanzan respuesta terapéutica es de 11 ,7% . La diferencia entre los
grupos es de 2,9% . Si realizamos el mismo estudio con varias muestras distintas extraídas de la
misma población , el resultado sería diferente en cada muestra debido al error aleatorio de
muestreo.

La pregunta es : Esta diferencia encontrada, ¿es una diferencia explicable por el azar?, o si por
el contrario, ¿existe una diferencia entre los dos grupos?

Tenemos dos soluciones :

• Las medias de la población son iguales con lo que su diferencia es nula. Se


acepta hipótesis nula
• Las medias de la población son diferentes con lo que su diferencia es distinta de
cero. Se rechaza hipótesis nula.

Interpretación:

En el ejemplo , el valor de significación p > 0,05 , esto es una probabilidad grande de que la
diferencia encontrada sea explicable por el azar. No existen diferencias estadísticamente
significativas. En este caso, se acepta la hipótesis nula .

Se acepta que con una confianza del 95% , el tratamiento con el fármaco A tiene el mismo efecto
que el tratamiento con placebo .

Si el valor de significación hubiera sido por ejemplo p=0,001 , la probabilidad de que las
diferencias entre ambas ramas fueran debidas al azar es muy pequeña , por lo que se rechazaría
la hipótesis nula .

6. CÁLCULO DEL TAMAÑO MUESTRAL


El tamaño de muestra, actualmente se obtiene con fórmulas matemáticas, o directamente de
programas de ordenador.
Consiste en calcular cuántos sujetos son necesarios para conseguir que los resultados sean lo
más válidos posibles con una probabilidad baja y predeterminada de ser explicados por el azar.
El tamaño de muestra de un estudio depende de cinco factores .

53
Paseo de la Habana 9-11, J\iladríd. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

• Magnitud del efecto. Cuanto menor sea la diferencia entre los grupos que quiera detectarse,
mayor será el tamaño de muestra requerido. Esta diferencia es el menor efecto con
importancia clínica o práctica. Es una estimación realizada por el investigador en base a
conocimientos teóricos o estudios previos publicados.
• Riesgo alfa (BIR-2008). Cuanto menor sea el riesgo alfa, mayor será el tamaño de muestra.
Habitualmente se sitúa en 0,05 o 0,01. Se da gran valor a estar seguros de que un efecto
está presente cuando realmente lo está.
• Riesgo beta . En general se admite un riesgo beta < 20% y una potencia > 80%. Suele ser
mayor que el alfa, por lo que se da mas valor a decir que un efecto existe cuando realmente
está presente (riesgo alfa menor) y menos valor a decir que no existe cuando realmente no
está presente (riesgo beta mayor).
• Características de los datos. Para datos binarios depende de las proporciones relativas:
con 50%-50% se requieren menos casos que a medida que esas proporciones se alejan .
Con datos cuantitativos dependen directamente de la dispersión de los datos : a mayor
dispersión mayor muestra y viceversa . Se puede obtener de estudios previos similares o de
un estudio piloto con pocos pacientes . Si los grupos son de tamaño distinto y las varianzas
diferentes, se obtiene la media ponderada por los grados de libertad de las varianzas o
desviación estándar de ambos grupos.
• Prueba estadística unilateral o bilateral. Definir si la hipótesis va a ser unilateral o bilateral.
Las pruebas bilaterales necesitan mayor muestra que las unilaterales.

La predeterminación del tamaño muestra! debe hacerse antes de iniciar el trabajo. En muchas
ocasiones son necesarios demasiados sujetos para los medios de los que se dispone para
realizar la investigación , en cuyo caso se debe abandonar el proyecto inicial o adaptarlo a la
disponibilidad de medios.

Tamaño muestra! ajustado a las pérdidas:


En todos los estudios es preciso estimar las posibles perdidas de pacientes por razones diversas
(pérdida de información, abandono, no respuesta .... ) por lo que se debe incrementar el tamaño
muestra! respecto a dichas pérdidas.
El tamaño muestra! ajustado a las pérdidas se puede calcular:
Muestra ajustada a las pérdidas= n (1 / 1-R)
n = número de sujetos sin pérdidas
R = proporción esperada de pérdidas
Así por ejemplo si en el estudio anterior esperamos tener un 15% de pérdidas el tamaño muestra!
necesario seria : 48 (1 / 1-0, 15) = 56 pacientes en cada grupo.

7. PRUEBAS ESTADÍSTICAS PARA COMPROBAR


HIPÓTESIS
Pruebas de Bondad de ajuste. Verifican una hipótesis sobre la forma de distribución de la
población. Analizan la bondad del ajuste de un conjunto de datos a distribuciones teóricas. Tienen
en cuenta si los valores observados difieren significativamente de los datos esperados en el
supuesto de que la variable siga una determinada distribución estadística (BIR-2017) . Ejemplos:
las Pruebas de Normalidad de Kolmogorov-Smirnov (BIR-2000; 2008) y de Shapiro-Wilks,
para comprobar si el IMC sigue una ley Normal. Si la p ~ 0,05 los datos difieren significativamente
de una distribución Normal teórica (no cumplen la normalidad). Si la p > 0,05 los datos no difieren
significativamente de una distribución normal teórica (cumplen la normalidad) (BIR-2017) .

Pruebas de Conform idad. Verifican una hipótesis sobre un determinado valor de un parámetro
de la población . Ejemplo : la prueba de comparación de una media observada a una teórica
(comprobar si la muestra procede de una población con IMC =25 kg/m 2 ) o la prueba de
comparación de una proporción observada a una teórica (ver si la muestra procede de una
población con igual proporción de hombres y mujeres).

54
Paseo de la Habana 9-11, Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

Pruebas de Independencia. Verificar la asociación entre dos variables que juegan un papel
simétrico , la hipótesis no contempla una variable independiente y otra dependiente. Son el
objetivo principal en los estudios de asociación, caso frecuente en estudios transversales.

Pruebas de Homogeneidad. Verificar la relación de igualdad o desigualdad entre una variable


exposición y otra respuesta, en la que las variables juegan un papel asimétrico . Son el objetivo
principal de los estudio de comparación .

Pruebas de Tendencia. Verificar la ausencia o presencia de tendencia creciente o decreciente


en un estudio comparativo cuando la variable exposición tiene categorías ordenadas .

Pruebas de Aleatoriedad. Verificar la aleatoriedad de una muestra. Test de Rachas o test de


independencia de las observaciones de una muestra (QIR-2003 ; 2005) . Test de Haldane-Hart.

GoBIR 55
Paseo de fa Habana 9-11 .. Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

BLOQUE 5. PRUEBAS ESTADÍSTICAS

ÍNDICE

1. INTRODUCCIÓN ........................................................................................... 57

2. RELACIÓN ENTRE DOS VARIABLES CATEGÓRICAS ............................ 59

COMPARACIÓN DE DOS PROPORCIONES ............................................... 60

COMPARACIÓN DE VARIAS PROPORCIONES ......................................... 63

COMPARACIONES MÚLTIPLES DE PROPORCIONES .............................. 65

PROCEDIMIENTO DE BONFERRONI Y DE HOLM ..... ................................ 68

3. RELACIÓN ENTRE RESPUESTA CUANTITATIVA Y PREDICTORA


BINARIA: COMPARACIÓN DE DOS MEDIAS ................................................ 68

SUPUESTO DE NORMALIDAD .................................................................... 69

PRUEBA T DE STUDENT-FISHER PARA GRUPOS INDEPENDIENTES ... 74


PRUEBA NO PARAMÉT.: U DE MANN-WHITNEY, W DE WILCOXON ...... 75

SIGNIFICACIÓN ESTADÍSTICA, MAGNITUD DEL EFECTO Y RELACIÓN


CAUSAL ............. .......... ................................................................................. 75

4. RELACIÓN ENTRE RESPUESTA CUANTITATIVA Y PREDICTORA


POLITÓMICA: COMPARACION DE VARIAS MEDIAS ................................... 77

CORRECCIÓN DEL RIESGO ALFA ............................................................. 81

TIPOS DE PRUEBAS DE COMPARACIONES MÚLTIPLES DE MEDIAS ... 81

5. RELACIÓN ENTRE DOS VARIABLES CUANTITATIVAS .......................... 83

6. PRUEBAS ESTADÍSTICAS DE CONFORMIDAD ....................................... 88

7. PRUEBAS ESTADÍSTICAS PARA GRUPOS APAREADOS ........................... 90

56
Paseo de la Habana 9- 11, Madrid. 9 11 61 0 039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

1. INTRODUCCIÓN
La respuesta a la pregunta de investigación de un estudio se alcanza analizando la relación entre
las variables exposición y respuesta observadas en una muestra . Se dice que las dos variables
están relacionadas, si la variable respuesta se va modificando a medida que la variable
exposición cambia sus valores .

Si la respuesta no se modifica cuando cambia la exposición, se dice que las variables no están
relacionadas. El análisis de esta relación se realiza mediante la utilización de las pruebas
estadísticas para estimar la probabilidad de riesgo alfa.

El tipo concreto de prueba estadística a utilizar depende de la escala de medida de las variables
exposición y respuesta y de que los datos cumplan algunas asunciones que se detallarán en el
desarrollo de cada prueba.

En la Tabla 5.1 se resumen los principales tipos de pruebas estadísticas en función de las
variables de exposición y respuesta.

Tabla 5.1. Clasificación de las principales pruebas estadísticas en función del tipo de
variable.

,o !VARIABLES EXPOSICIÓN

CATEGÓRICA
VARIABLE BINARIA (Obesidad MODELO
CUANTITATIVA (IMC)
RESPUESTA (Obesidad) (No/Leve/Modera GENERAL
da)
Comparación de
dos proporciones :
Regresión
Regresión logística
BINARIA (Diabetes) Prueba de X 2 logística binaria
binaria simple
múltiple
Prueba exacta de
Fisher
CATEGÓRICA DE
Comparación de varias
MÁS DE DOS Regresión
proporciones: Regresión logística
CATEGORÍAS logística
multinomial
(Diabetes multinomial
Nulo/Leve/Grave) Prueba de X 2
Comparación de
Comparación de Comparación
dos variables
dos medias: varias medias:
cuantitativas:
Regresión lineal
CUANTITATIVA
T-Student Análisis de múltiple : tres o
CONTINUA Correlación: R de
Fischer varianza más variables
(Glucemia) Pearson y r de
cuantitativas.
Spearman
U de Mann- Kruskal-
Whitney Wallis
Regresión lineal
Comparación de
SUPERVIVIVENCIA
supervivencia:
Regresión de Cox Regresión de Cox
(Diabetes + tiempo
Método Kaplan-
de diabetes)
Meier

GoBIR 57
Paseo de la Habana 9- 11 . i\rfadrid 911 610 039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

VARIABLE RESPUESTA BINARIA

• Variable Exposición Binaria. Es el resultado de comparar 2 proporciones . Ejemplo: la


proporción de diabéticos en obesos frente a proporción de diabéticos en no obesos. Se
realiza con la significación estadística de la prueba de chi-cuadrado (x2) entre dos
variables binarias. Si no se cumplen sus condiciones de aplicación se utiliza la prueba
exacta de Fisher. La valoración práctica y clínica se realiza mediante las medidas de
asociación: Riesgo Relativo (RR) y Razón de Odds (RO) u Odds Ratio (OR).
• Variable Exposición Categórica con más de dos categorías. Es la comparación de
varias proporciones: proporción de diabéticos con obesidad moderada, proporción de
diabéticos con obesidad leve y proporción de diabéticos en sin obesidad . Se realiza con
la prueba de chi-cuadrado (x2) entre una variable binaria y una categórica con más
de dos categorías. Es una generalización de la prueba anterior.
• Variable Exposición Cuantitativa (IMC). La comparación se realiza con la Regresión
Logística Binaria, y estaríamos ante un problema de clasificación consistente en
estimar un modelo que clasifique a los pacientes en diabéticos o no diabéticos a partir
de su índice de masa corporal. La magnitud del efecto se valora con la Razón de Odds
(RO) de la variable respuesta (Diabetes), por cada unidad de aumento de la variable
exposición (por cada kg/m 2 de aumento de IMC). La Regresión Logística Binaria es el
modelo general cuando la variable respuesta es binaria, independientemente de como
sean las variables exposición (binarias, categóricas con más de dos categorías o
cuantitativas).

VARIABLE RESPUESTA CATEGÓRICA CON MÁS DE DOS CATEGORÍAS

• Variable Exposición Binaria (Obesidad). Es la comparación de varias proporciones


que se realiza con la significación estadística de la Prueba de chi-cuadrado (x2) entre
una variable respuesta categórica con más de dos categorías (DiabetesOr) y otra
exposición binaria (Obesidad).
• Variable Exposición Categórica con más de dos categorías (ObesidadOr). Es la
comparación de varias proporciones que se realiza con la Prueba de x2 entre dos
variables categóricas con más de dos categorías, en este caso la variable respuesta
categórica DiabetesOr y la variable exposición categórica ObesidadOr.
• Variable Exposición Cuantitativa (IMC) . La comparación se realiza con la Regresión
Logística Multinominal (si la respuesta es nominal) o con la Regresión Logística Ordinal
(si la respuesta es ordinal como en este caso) y estaríamos ante un problema de
clasificación consistente en estimar un modelo que clasifique a los pacientes en una de
las tres categorías de la variable diabetes ordinal a partir de su índice de masa corporal.
La Regresión Logística Multinominal u Ordinal es el modelo general cuando la variable
respuesta es categórica con más de dos categorías , independientemente de como sean
las variables exposición (binarias, categóricas con más de dos categorías o cuantitativas).

VARIABLE RESPUESTA CUANTITATIVA

• Variable Exposición Binaria (Obesidad). Es la comparación de dos medias: la media


de glucosa en obesos y la media de glucosa en no obesos. Se realiza con la prueba t
de Student-Fisher. En caso de no cumplirse sus condiciones de aplicación se utiliza la
prueba no paramétrica U de Mann-Whitney. La valoración de la magnitud del efecto o
importancia práctica se realiza a través del IC95% de la diferencia entre las medias.
• Variable Exposición Categórica con más de dos categorías (ObesidadOr). Es la
comparación de varias medias, las medias de glucosa correspondientes a las tres
categorías de ObesidadOr: IMC Normal , Sobrepeso y Obesos. Se realiza con el Análisis
de la Varianza (ANOVA) (BIR-2015). En una generalización de la t de Student para la
comparación de varias medias. En caso de no cumplirse sus condiciones de aplicación
se utiliza la prueba no paramétrica H de Kruskal-Wallis.

58
Paseo de la Habana 9-11, ivfadrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

• Variable Exposición Cuantitativa (IMC). Es la comparación de dos variables


cuantitativas, que se realiza con la Regresión Lineal Simple . La interpretación práctica
se valora con el coeficiente de regresión í3 que representa la pendiente de la recta de
regresión ajustada, e indica la magnitud de cambio de la variable respuesta por cada
unidad de aumento de la variable exposición. En este caso representa el cambio
(aumento o disminución) de glucosa por cada unidad (kg/m 2 ) de aumento de IMC . La
regresión lineal simple es el modelo general cuando la variable respuesta es cuantitativa :
también se puede emplear con variables exposición binarias, dando resultados idénticos
a la prueba t de Student y con variables exposición categóricas con más de dos
categorías , dando resultados idénticos al análisis de la varianza . Cuando se emplean
dos o más variables exposición que pueden ser binarias, categóricas o cuantitativas
estamos ante la generalización de esta técnica denominada Regresión Lineal Múltiple
(BIR-2006) . La Correlación estudia la relación lineal entre dos variables cuantitativas que
juegan un papel simétrico (no hay variable exposición y respuesta) , utilizando el
coeficiente de correlación r de Pearson o el coeficiente de correlación rho de Spearman
no paramétrico.

VARIABLE RESPUESTA DE SUPERVIVENCIA O TIEMPO A UN EVENTO

• Variable Exposición Binaria (Obesidad). Es la comparación de dos curvas de


supervivencia : curva de supervivencia de los obesos frente a curva de supervivencia de
los no obesos . Se realiza con la prueba de log rank del método de Kaplan-Meier (BIR-
2006) del análisis de supervivencia.
• Variable Exposición Categórica con más de dos categorías (ObesidadOr). Es la
comparación de varias curvas de supervivencia: curvas de supervivencia de IMC normal ,
de Sobrepeso y de Obesidad. Se realiza con la prueba de log rank del método de
Kaplan-Meier (BIR-2006) del análisis de supervivencia.
• Variable Exposición Cuantitativa (IMC). La valoración del efecto de una variable
cuantitativa sobre una variable de supervivencia se realiza mediante la Regresión de
riesgos proporcionales de Cox simple. La magnitud del efecto se valora con la Razón de
tasas de incidencia o Hazard Ratio (HR) de la variable respuesta (Diabetes) por cada
unidad de aumento de la variable exposición (por cada kg/m 2 de aumento de IMC). La
regresión de Cox es el modelo general cuando la variable respuesta es de supervivencia :
también se puede emplear con variables de exposición binarias y categóricas con más
de dos categorías, dando resultados similares, no idénticos, a las pruebas de log rank
del método de Kaplan-Meier (BIR-2006) . Cuando se emplean dos o más variables
exposición que pueden ser binarias, categóricas con más de dos categorías
adecuadamente codificadas o cuantitativas estamos ante la generalización de esta
técnica denominada Regresión de Cox Múltiple.

El uso de modelos generales de regresión lineal, logística y de Cox, es fundamental para


valorar simultáneamente varias variables exposición sobre la respuesta. En investigación no
experimental permite valorar variables de confusión e introducir variables de interacción,
también llamadas modificadoras del efecto .

2. RELACIÓN ENTRE DOS VARIABLES CATEGÓRICAS


FORMATO DE LAS TABLAS DE CONTINGENCIA (OIR-2002)

La descripción y comparación de la distribución de frecuencias de una variable categórica para


cada una de las categorías de otra variable categórica, se realiza mediante una tabla de doble
entrada, llamada Tabla de contingencia (FIR-2010 ; 2013) , en cuyas casillas se muestra su
distribución conjunta . Las variables exposición y respuesta se pueden asignar tanto a filas como
a columnas y colocar la situada en filas en orden ascendente o descendente . También se pueden
pedir porcentajes de filas, columnas o totales . El resultado mantiene su validez siempre y cuando
la tabla se lea e interprete de forma correcta. La variable exposición se colocará en filas y en
orden descendente . La variable respuesta se sitúa en columnas . Para continuar con la misma

59
Paseo de la Habana 9- 11, J\tladrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

"lógica" se debe especificar porcentajes observados de fila, excepto en diseños caso-control, en


el que los porcentajes por fila no tienen sentido y sí los porcentajes por columna (nos darían
los% de exposición y no exposición en los casos y en los controles). Los valores totales de fila
y de columna se denominan marginales.

Tabla 5.2. Formato de una tabla de contingencia.

Respuesta [\Jo Respuesta Sí Total


EXPOSICIÓN SÍ b a a+b
EXPOSICIÓN NO d e c+d
Total b+d a+c a+b+c+d

RELACIÓN ENTRE EXPOSICIÓN BINARIA - RESPUESTA BINARIA:


COMPARACION DE DOS PROPORCIONES

El análisis de la relación entre una variable respuesta binaria como Infarto Sí/No con una
exposición binaria como Fumador Sí/No consiste en la comparación de dos proporciones: la
proporción de infartos en los fumadores frente a la proporción de infartos en los no fumadores .
Si la proporción de infartos en los fumadores es distinta que en los no fumadores, las dos
variables están relacionadas o son estadísticamente dependientes . Por el contrario, si la
proporción de infartos es similar en fumadores y en no fumadores, las dos variables no están
relacionadas o son estadísticamente independientes.

Según se aprecia en la Tabla 5.3, en los fumadores hay mayor proporción de infartos (30,2%)
que en los no fumadores (14, 1%), lo que sugiere existencia de asociación.

Tabla 5.3. Tabla de contingencia de infarto y hábito de fumar.

Tabla de contingencia Fumador* Infarto

Infarto
No Sí Total
Fumador No Recuento 243 40 283
% de Fumador 85,9% 14,1% 100,0%
Sí Recuento 81 35 116
% de Fumador 69,8% 30 ,2% 100,0%
Total Recuento 324 75 399
% de Fumador 81,2% 18,8% 100,0%

Esta relación se puede representar gráficamente con un Diagrama de barras agrupado (Figura
5.1 ), con la distribución de la variable respuesta (Infarto) en cada categoría de la variable
exposición (Fumar) . Se puede apreciar que la proporción de infartos en fumadores es mayor que
en no fumadores, aunque por los recuentos absolutos puede dar la impresión de lo contrario.

GoBIR 60
Paseo de la Habana 9- 11, M adrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

Figura 5. 1. Diagrama de barras agrupadas Infarto-Hábito de fumar.

Gráfico de barras

250 Infarto
•Osí No

200

.S 150
e:
Q)
::,
(.)
Q)
a::
100

50

o
No Sí

Fumador

Las pruebas estadísticas utilizadas en el análisis de esta relación y sus condiciones de aplicación ,
se muestran en la Tabla 5.4 .

Tabla 5.4. Análisis de la relación entre dos variables binarias.

Comparación de dos proporciones


Respuesta BINARIA - Exposición BINARIA
Número de casilla con frecuencia esperada menor de 5
Más del 20% (alguna casilla en una tabla dos por
Menos del 20% (Ninguna)
dos)

• Prueba de chi-cuadrado

• Razón de verosimilitud
• Prueba exacta de Fisher bilateral
• Corrección
Yates
de continuidad de

Se debe evaluar cuantas casillas tienen una frecuencia esperada menor de 5.

61
Paseo de la Habana 9- 11, 1\;ladríd. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

La frecuencia esperada es la que tendría la tabla en caso de no haber diferencias (50% de


infartos en fumadores y en no fumadores). La frecuencia esperada "e" se calcula así:

e= p X Ototal

p = proporción muestra!

Otota1 = frecuencia total observada

Para calcular la frecuencia esperada, multiplicar los valores que corresponden a los subtotales
de la fila y la columna de la casilla de interés y dividir por el total de la tabla

Si el número de casillas con frecuencia esperada menor de 5 es menor del 20% (ninguna casilla
en el caso de una tabla de 2x2) se pueden utilizar tres pruebas:

• Prueba de chi-cuadrado
• Razón de verosimilitud
• Corrección de continuidad de Yates

Frecuencias esperadas

1nfarto
o 1 Total
Fuma o Recuento 243 40 283
% de Fuma 85,9% 14 ,1% 100,0%
Frecuencia esperada 229,8 53 ,2 283,0
1 Recuento 81 35 116
% de Fuma 69,8% 30,2% 100,0%
Frecuencia esperada 94,2 21,8 116,0
Total Recuento 324 75 399
% de Fuma 81 ,2% 18 ,8% 100,0%
Frecuencia esperada 324,0 75,0 399,0

En el ejemplo, caso la frecuencia mínima esperada es de 21,8. Por tanto se puede utilizar estas
tres pruebas.

Pruebas de chi-cuadrado

Sig. asintótica Sig. exacta Sig. exacta


Valor gl (bilateral) (bilateral) (unilateral)
Chi-cuadrado de Pearson 13 ,865b 1 ,000196
Corrección por continuidadª 12,834 1 ,000340
Razón de verosimilitudes 13,004 1 ,000311
Estadístico exacto de Fisher ,000365 ,000250
N de casos válidos 399
a. Calculado sólo para una tabla de 2x2 .
b. O casillas (,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mínima esperada es
21,80.

• Prueba de chi-cuadrado (x2) de Pearson (BIR-2002) . El resultado de la prueba de chi-


cuadrado en esta muestra concreta es significativo : Chi-cuadrado=13,865; gl=1; p <0,05.
La probabilidad de obtener una diferencia de proporciones igual o mayor a la obtenida

GoBIR - - - - - - - - 62
Paseo de la Habana 9- 11, Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

en esta muestra (33,2 - 14,1 = 19,1%) en la población origen es menor del 0,01%. Por
tanto hay diferencias estadísticamente significativas en la proporción de infartos en
fumadores y en no fumadores. Los grados de libertad se calculan : (filas - 1)(columnas-
1)
• Razón de verosimilitudes. También se puede emplear esta prueba clásica en el análisis
de datos categóricos utilizada en la regresión logística. Su resultado es muy similar al de
la chi-cuadrado, siendo casi idéntico en muestras grandes. En este caso la prueba de la
razón de verosimilitudes es p <0,05.
• Corrección de continuidad de Yates. Consiste en una modificación conservadora en
la prueba de chi-cuadrado que actualmente no tiene aplicación, aunque todavía se puede
encontrar algún revisor que la solicite, sobre todo en tamaños de muestra menor de 200
que es donde pudiera tener alguna aplicación.

Prueba exacta de Fisher bilateral (BIR-2005; 201 O; 2014) (QIR-2002) . En caso de que más
del 20% de las casillas (alguna de las casillas en una tabla de 2x2) tengan una frecuencia
esperada menor de 5 no se pueden aplicar ninguna de las pruebas anteriores y se debe
emplear la prueba exacta de Fisher bilateral, cuyo resultado en este caso es p <0,05.

Las pruebas estadísticas nos informan del grado en que la relación puede ser debida al azar,
pero no informa sobre la magnitud del efecto o la importancia clínica o práctica. La magnitud del
efecto de la relación entre dos variables binarias se valora con las medidas de frecuencia
(proporción , odds), de asociación (riesgo relativo, odds ratio) e impacto (diferencia de riesgos ,
NNT).

RELACIÓN ENTRE EXPOSICIÓN POLITÓMICA - RESPUESTA BINARIA:


COMPARACION DE VARIAS PROPORCIONES

El análisis de la relación entre una variable respuesta binaria como Infarto Sí/No con una
predictora categórica con más de dos categorías (politómica) como hábito tabáquico "FumaOr"
(Hábito tabáquico: Nulo/Leve/Moderado consiste en la comparación de varias proporciones: la
proporción de infartos que han sufrido en los sujetos no fumadores , en los que fuman entre 1-15
cigarros al día (Leve) y los que fuman más de 15 cigarrillos al día (moderado) .

Figura 5.2. Tabla de contingencia Hábito tabáquico - Infarto

Tabla de contingencia Hábito tabáquico * Infarto

Infarto
No Sí Total
FumaOr Nulo Recuento 243 40 283
% de FumaOr 85,9% 14,1% 100,0%
Leve (1-15 cigarros/día) Recuento 58 29 87
% de FumaOr 66,7% 33,3% 100,0%
Moderado (más de 15 Recuento 23 6 29
cigarros día) % de FumaOr 79 ,3% 20,7% 100,0%
Total Recuento 324 75 399
% de FumaOr 81 ,2% 18 ,8% 100,0%

Las proporciones de infartos en los sujetos no fumadores es 14, 1%, en fumadores leves 33,3%
y en fumadores moderados 20,7 %.

GoBIR 63
Paseo de la Habana 9- 11 .. Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

Figura 5.3. Gráfico de barras Hábito tabáquico - Infarto

Gráfico de barras

250 Infarto
•Osí
No

200

,S 150
e:
CI)
::::i
(.)
CI)
o:::
100

50

o
Nulo Leve (1-15 cigarros/día) Moderado (más de 15
cigarros día)
FumaOr

Los datos mostrados en la tabla de contingencia 3x2 (Figura 5.2) y el gráfico de barras agrupadas
de la Figura 5.3 sugieren la existencia de asociación .

Las pruebas estadísticas utilizadas en el análisis de esta relación y sus condiciones de aplicación
se muestran en la Tabla 5.5 . Al igual que en el caso anterior, se debe evaluar cuantas casillas
tienen una frecuencia esperada menor de 5. La frecuencia esperada es la que tendría la tabla en
caso de no haber diferencias (igual proporción de infartos en las tres categorías de Fumaür). Si
el número de casillas con frecuencia esperada menor de 5 es menor del 20% (una o ninguna
casilla en el caso de una tabla de 3x2) se pueden uti lizar la prueba de chi-cuadrado y la razón
de verosimilitud . En este caso la frecuencia mínima esperada es de 5,45. Por tanto se puede
utilizar estas dos pruebas.

Tabla 5.5. Tabla resumen de la comparación de dos proporciones.

Comparación de varias proporciones


Respuesta BINARIA - Exposición POLITÓMICA
Número de casilla con frecuencia esperada menor de 5
Más del 20% (más de una casilla en una tabla tres
Menos del 20% (Una máximo)
por dos)

• Prueba de chi-cuadrado

• Razón de verosimilitud • Prueba exacta de Fisher bilateral

• Asociación lineal (si ordinal) (o agrupación de categorías)

Comparaciones múltiples

GoBIR 64
Paseo de la Habana 9- 11, Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

Tabla 5.6. Resultados pruebas chi-cuadrado ejemplo.

Sig. asintótica
Valor cil (bilateral)
Chi-cuadrado de Pearson 16,143(a) 2 ,000
Razón de verosimilitudes 14,739 2 ,001
Asociación lineal por
8,213 1 ,004
lineal
N de casos válidos
399

a. O casillas (,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mínima esperada es 5,45.

En este caso el resultado de la generalización de la prueba de chi-cuadrado a una tabla de


contingencia de 3x2 es Chi-cuadrado=16 , 143; gl=2; p<0 ,05. Indica que hay diferencias
estadísticamente significativas en la proporción de infartos en las tres categorías de hábito
tabáquico .

El resultado de la prueba de Razón de verosimilitudes es muy parecido a la chi-cuadrado .


Ambas requieren que existan menos del 20% de casillas con frecuencias esperadas < 5 (en la
tabla de 3x2 se permite una de las seis casillas con frecuencia esperada < 5). En este caso se
cumple este requisito . Aquí no es aplicable la corrección de continuidad que es propia de una
tabla de 2x2.

Por tratarse de una variable ordinal, se puede aplicar la prueba de tendencia de Asociación
lineal. A diferencia de las pruebas anteriores que valoran la igualdad de las proporciones, esta
prueba valora si hay una tendencia lineal creciente o decreciente de la proporción de infartos
entre las categorías ordenadas de FumaOr. Requiere como condición de aplicación que todas
las frecuencias esperadas sean ~ 2, siempre que las frecuencias cercanas a 2 no se presenten
en casillas contiguas. En este caso la prueba de tendencia de asociación lineal es p=0,004 . Indica
que existe una tendencia lineal estadísticamente significativa de las proporciones de infartos en
los tres niveles de hábito tabáquico . Esta prueba sólo es aplicable en el caso de variables
exposición con escala de medida ordinal. No tiene sentido en variables exposición con escala de
medida nominal.

Cuando la frecuencia esperada es < 5 en más del 20% de las casillas no se puede utilizar la
prueba de chi-cuadrado. En estos casos se pueden utilizar pruebas exactas (como la prueba
exacta de Fisher o la regresión logística exacta), no siempre disponibles en los programas
estadísticos habituales , o bien agrupar categorías con frecuencias esperadas bajas hasta que
sean superiores a 5 y se puedan aplicar las pruebas de chi-cuadrado. La agrupación de
categorías se puede hacer por criterio clínico (la que tenga más sentido) o estadístico (la que
agrupe las categorías de muestra más pequeña).

En caso de ser significativa , la conclusión de la comparación de estas tres proporciones es


demasiado general : simplemente indica que algunas de las tres proporciones son
estadísticamente diferentes.

COMPARACIONES MÚLTIPLES DE PROPORCIONES


La comparación de las tres proporciones de infarto en hábito ta báquico Nulo (14, 1%), leve
(33,3%) y moderado (20 ,7%) es significativa (p <0,05). La conclusión es que hay diferencias
estadísticamente significativas en las tres proporciones. Es una conclusión demasiado genérica.
Sería interesante desmenuzar más esta conclusión conociendo entre que pares de proporciones
existe diferencia y entre cuales no. Esto se realiza con las comparaciones múltiples entre
pares de proporciones para averiguar qué niveles de hábito tabáquico difieren en la proporción
de infartos, es decir, cuáles son las categorías responsables de la significación . Ya que hay c =

GoBIR 65
Paseo de la Habana 9-11, Madrid 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

3 niveles de hábito tabáquico, se pueden realizar un total de c(c-1 )/2 comparaciones . En este
caso 3(3-1 )/2 = 3 comparaciones.

A continuación se muestra la comparación de las proporciones de infartos en las categorías de


No Fumador- Fumador leve; No Fumador- Fumador moderado; Fumador moderado-Fumador
leve (Tabla 5. 7) .

Tabla 5. 7. Tablas de contingencia de las comparaciones múltiples.

Tabla de contingencia No fumador-Fumador leve

Infarto
No Sí Total
Fumaür Nulo Recuento 243 40 283
% de Fumaür 85,9% 14,1% 100,0%
Leve (1-15 cigarros/día) Recuento 58 29 87
% de Fumaür 66,7% 33,3% 100,0%
Total Recuento 301 69 370
% de FumaOr 81,4% 18,6% 100,0%

Tabla de contingencia No fumador - Moderado. Infarto.

Infarto
No Sí Total
FumaOr Nulo Recuento 243 40 283
% de Fumaür 85,9% 14,1% 100,0%
Moderado (más de Recuento 23 6 29
15 cigarros día) % de FumaOr
79 ,3% 20,7% 100,0%

Total Recuento 266 46 312


% de Fumaür 85,3% 14,7% 100,0%

66
Pas eo de la Habana 9- 11, Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

Tabla de contingencia Fumador Leve- Moderado * Infarto

Infarto
No Sí Total
FumaOr Leve (1-15 cigarros/día) Recuento 58 29 87
% de FumaOr 66,7% 33,3% 100,0%
Moderado (más de 15 Recuento 23 6 29
cigarros día) % de FumaOr
79 ,3% 20,7% 100,0%

Total Recuento 81 35 116


% de FumaOr 69,8% 30 ,2% 100,0%

1 casillas (25,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mínima esperada es 4,28.

En todas estas comparaciones no hay ninguna casilla con frecuencia esperada menor de 5 salvo
en la última tabla. En la Tabla 5.8 se muestra la significación estadística por la prueba de chi-
cuadrado de estas tres comparaciones mú ltiples.

Asumiendo un riesgo a de 0,05 se concluye que la única comparación significativa es No fumador


- Leve: la proporción de infartos es mayor en los fumadores leves que en los no fumadores (p <
0,001 ).

Tabla 5.8. Tablas de contingencia de las comparaciones múltiples.

No fumador - Leve 16,16782703 p < 0,001


No fumador - Moderado 0,899280639 0,3430
Leve - Moderado 1,650323339 0,1989

Pero esta conclusión no es del todo correcta , porque a medida que se incrementa el número de
comparaciones aumenta el riesgo a de la hipótesis nula inicial. Es decir, el riesgo a global del
conjunto de comparaciones es superior al fijado a priori . Si se fija un riesgo a de 0,05 para cada
una de estas pruebas, la probabilidad de que una prueba tome la decisión correcta es 1 - 0,05
= 0,95 . Si se efectúan tres pruebas , como en este caso , la probabilidad de obtener una decisión
correcta se obtiene aplicando la ley multiplicativa de las probabilidades : 0,95 x 0,95 x 0,95 =
0,95 3 = 0,857 . La probabilidad de equivocarse en alguna de estas 3 pruebas , que equivale al
riesgo a del total de las 3 comparaciones, es a 3 = 1 - 0,95 3 = O, 143 (14 .3%). Por tanto, el riesgo
alfa global no es 0,05, sino 0,143 como puede verse en la Tabla 5.9, en la que se muestra :

Tabla 5.9. Riesgo alfa según el número de comparaciones múltiples.

Número de ruesgo global a Riesgo o. ele rnda com parnción


comparaciones (a= 0,05 de cada comparación) (a= 0,05 global)
k 1 - 0.95k u.:::: 0.05 k
1 0,050 0,0500
2 0,098 0,025"'
3 0,1-B 0,0170
... 0,185 0,0127
0.226 O.Ol 02
6 0.265 0,0085
7 0,"' 02 o,oor
8 0.3" 0.0064
9 0,3 O 0,0057
10 O, 01 0,00~ 1

67
Paseo de la Habana 9- 11, Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

• En la primera columna el número de comparaciones k.


• En la segunda columna, el riesgo global a de varias comparaciones si cada una de ellas
se realiza con un riesgo de 0,05. Observe que al efectuar 10 comparaciones (cada una
con riesgo alfa de 0,05) el riesgo global alfa es de 0,401.
• En la tercera columna el riesgo a que debe tener cada comparación para que el conjunto
de comparaciones de k pruebas tenga un riesgo a global de 0,05. Si se desea que el
conjunto de 3 comparaciones tenga un riesgo a de 0,05, cada una de las comparaciones
deberá realizarse con un riesgo alfa menor. Una aproximación válida cuando el riesgo
global alfa es pequeño, es dividir el riesgo alfa de cada comparación por el número de
comparaciones.

En resumen , aunque una de las 3 comparaciones resulta significativa, debido a que se


han realizado varias comparaciones, es conveniente corregir el valor de p para asegurar que el
conjunto de comparaciones tenga un riesgo alfa máximo del 5%. Para esta corrección se pueden
utilizar varios procedimientos, siendo el de Bonferroni el de mayor interés didáctico y el de Holm
el más adecuado para utilizar.

PROCEDIMIENTO DE BONFERRONI
Los valores de p corregidos por Bonferroni se obtienen a partir de PBONFERRONI = P x k. En
este caso k=3. Cuando se quieren realizar 3 comparaciones con riesgo global a de 0,05, el
procedimiento de Bonferroni consiste en reemplazar la p de cada comparación por el valor p x 3.
Es un procedimiento excesivamente conservador.

Si la corrección da como resultado un valor superior a la unidad, se le asigna valor de p=1 que
es el valor máxima de una probabilidad .

PROCEDIMIENTO DE HOLM
Es una mejora del procedimiento de Bonferroni para aumentar la potencia del conjunto de
comparaciones y hacerle menos conservador. Consiste en ordenar de menor a mayor los valores
p obtenidos en las comparaciones múltiples y aplicar Bonferroni paso a paso.

3. RELACIÓN ENTRE RESPUESTA CUANTITATIVA Y


PREDICTORA BINARIA: COMPARACIÓN DE DOS
MEDIAS
Se pretende averiguar si la glucosa plasmática de los obesos es diferente de la de los no obesos
en la población origen de la muestra. El análisis de la relación entre una variable respuesta
cuantitativa como Glucosa y una exposición binaria como Obesidad Sí/No (relación entre dos
grupos cuantitativos independientes) consiste en la comparación de dos medias : la media
de Glucosa en Obesos frente a la media de Glucosa en No Obesos:
• Si las medias son similares, las variables no están relacionadas o son estadísticamente
independientes: la Glucosa no depende de si se es obeso o no .
• Si las medias son diferentes, las variables están relacionadas o son estadísticamente
dependientes : la Glucosa depende de si se es obeso o no.

La comparación de ambas medias (Tabla 5.10) y la inspección de los dos diagramas de caja
mostrados en la Figura 5.4 sugieren que sí son diferentes . Pero para obtener una conclusión se
debe aplicar una prueba estadística.
Tabla 5.10. Comparación de medias Obesidad- Glucosa.

ted ia <le Glu cosa en Obeso - l 7-L8 mg ld l


Med ia de Glucosa n o Obesos 142.6 m1l·d
~l- -

GoBIR 68
Pas e o de la Habana 9- 11, i\tladrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

Figura 5.4. Box Plot de Glucosa No Obesos y Obesos. Comparación de medias Obesidad
- Glucosa.

300

50

o
No Si
Obesidad

Para realizar esta comparación y ver que prueba estadística se debe utilizar se sigue el
organigrama mostrado en la Figura 5.5.

Figura 5.5. Esquema comparación de dos variables cuantitativas independientes

Normalidad
(de Glucosa en cada grupo de Obesidad Si!No )
Pruebas: Ko lmogoroY- Smirnov y Shapi ro-Wilks
Gráficos: de om1ali<lad, de Caja. Hi stograma
Si !\o
Pmeba t de St udent-F isher
para grupos independi entes
Homogene idad de varianws
Pmeba de igualdad de varianzas de Levene Prueba no paramétrica
Varian7as ho mogéneas Va ri anzas no ho mogéneas lT de Mann-\Yhitnc~·
Prueba t de Student-Fisher para Prueb.1 t de Student-Fisher para
grnpos independ ientes y grupos indepcndiN1l es y
varia11z.1s homooé11e,1s v.ll'ianzas 110 homogéneas

SUPUESTO DE NORMALIDAD

Primero se debe evaluar si la variable cuantitativa en cada uno de los grupos de la variable
categórica , (en este caso la Glucosa en Obesos y en No Obesos) , sigue una ley Normal. La
normalidad se evalúa mediante los gráficos y las pruebas estad ísticas de normalidad, tal y como
se detalla a continuación .

GoBIR 69
Paseo de la Habana 9-11, Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

Numerosas pruebas estadísticas exigen que las variables cuantitativas se distribuyan según una
ley normal. El estudio de la normalidad por sí solo puede ser el objetivo de un estudio. Hay
diferentes métodos para comprobar este supuesto. De menor a mayor valor global son:

• Tamaño de muestra. En general se dice que muestras mayores de 30 son grandes y por
lo tanto automáticamente normales . Esto no es cierto, depende de su asimetría y de la
presencia de valores anómalos. El tamaño de muestra es de utilidad para elegir la prueba
estadística de normalidad y para interpretar su resultado . En muestras muy pequeñas
las pruebas estadísticas de normalidad son poco potentes para descartar la normalidad,
y aunque sean no significativas, no se debería asumir la normalidad y directamente se
pasaría a la estadística no paramétrica. En la Tabla 5.11 se muestra el tamaño de
muestra de Glucosa en obesos y no obesos.

Tabla 5.11. Tamaño de muestra de glucosa

Grupo Tamaño de muestra


Glucosa en Obesos 43
Glucosa en o Obesos 69

• Índices de asimetría y apuntamiento . Las distribuciones que siguen una ley normal
tienen coeficientes de Asimetría (AS) y de Apuntamiento (AP) nulos. El supuesto de
normalidad se rechaza cuando el valor absoluto de alguno de estos coeficientes es
mayor o igual a dos veces su error estándar: !AS! ~ 2 x EEAS y/o IAPI ~ 2 x EEAP . Es
un método muy poco potente . Se utilizaba antes de aparecer las pruebas de normalidad .
En la Tabla 5.12 se muestran los índices de asimetría y apuntamiento con sus EE de
Glucosa en obesos y no obesos . El valor absoluto de los cuatro índices es menor que el
doble de su EE , aunque algunos (AP en obesos y AS en no obesos) están en el límite .
Por tanto, por este criterio, no se puede rechazar que la Glucosa en obesos y en no
obesos sigan la normalidad.

Tabla 5.12. Asimetría y apuntamiento de Glucosa en pacientes Obesos y No obesos.

Grupo Estadístico EITor Estándar


Asimetría en Obesos 0,222 0,361
Apuntamiento en Obesos - 1,410 0,709
Asimetría en _'o Obesos 0,545 0,289
Apuntamiento en _-o Obesos -0, 54 0,570

• Valoración de gráficos. La valoración de la normalidad por métodos gráficos es un


método subjetivo. Son útiles en casos muy extremos para descartar la normalidad. Se
pueden emplear:

Histograma . Son visualmente los más intuitivos, pero pueden cambiar totalmente su
apariencia al modificar el número de clases. Lo más adecuado es hacerlo con un número de
clases que sea ✓ n. En la Figura 5.6 se muestran los histogramas de Glucosa en obesos y no
obesos . Se puede ver que ambas distribuciones son asimétricas y que no se ajustan a la
normalidad , pero más la de obesos.

70
Paseo de la Habana 9- 11, 1\rfadrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

Figura 5.6. Histograma glucosa en Obesos y No obesos.

Obosid~d : Si

.
ue
.
ue
e,
:, :,
u u
o
.:: e
u..

s.

50
Glucosa plasmática (mg/dl) Glucosa plasmática (mg/dl)

Diagramas de caja . Permiten ver si existen valores alejados y además valorar la


asimetría y su sentido tanto de la parte central de los valores (la caja) como de la parte
externa de los valores (las patillas). En la Figura 5.6 se muestra el diagrama de caja de
Glucosa en obesos y en no obesos. Se puede ver que ambas distribuciones son asimétricas,
pero más la de obesos .

Figura 5.6. Histograma glucosa en Obesos y No obesos.

o
No Si
Obesidad

71
Paseo de la Habana 9- 11, Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

Gráficos de normalidad (Normal y Normal sin tendencias). Son los más adecuados,
aunque los más complejos de entender.

Gráfico Normal (Normal Plot).

Se representa cada valor observado con el esperado en caso de seguir una ley Normal. Cuando
la variable sigue una ley normal perfecta la nube de puntos se sitúa sobre la línea inclinada
dibujada en el gráfico. En la Figura 5.7 se muestran los de la Glucosa tanto para obesos como
para no obesos. En ellos la nube se puntos se ajusta más o menos bien a la línea inclinada,
parece que más en los obesos que en los no obesos , lo cual es indicativo de normalidad .

Figura 5. 7. Gráfico normal glucosa en Obesos y No obesos.

OlMWtUd • Nr9

o
~
i 1

i
• i

lo 1o
z z ,1

·o •o•
'°' YalCW' obsc rvado
21ll
Vao, OOHrvado
lOO

Gráfico Normal sin tendencias

Se representan cada valor observado con la desviación de cada valor respecto al valor esperado
en caso de seguir una normal perfecta . En este caso la línea horizontal indica la normalidad .
Además permite diferenciar los casos con anomalías en la asimetría como en el apuntamiento.
Por ejemplo el gráfico normal sin tendencias de la Glucosa de los no obesos de la Figura 5.8
presenta desviación negativa de los valores centrales y desviación positiva en los valores de
ambos extremos . Esto es propio de las distribuciones platicúrticas .

Figura 5.8. Gráfico normal sin tendencias glucosa en Obesos y No obesos.

OIM11~4 ~ $1 OIMtld.MI: 1M

.,. ,.,.
. .
. . .
o, ..

..,. . .... ...


~

1 .... ··: .. . . l ....


¡ O IS . ..
. . .. .. ..
~
~
~
-.
. .. -11
~
~ ..
"
...,,.

.
. ... -.. ...
''°
.' ,.,
VIMll~urv.tdo
,., ,..
.
...
·-
.,_,..

o .
...
• ·\' '"'". .
""
'"
,,.
~ obs.erv~do
... ,,.
.
,..

72
Paseo de la Habana 9-11, Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

Pruebas estadísticas de Normalidad.

Son pruebas de bondad de ajuste, que comparan la distribución de los datos con una distribución
normal teórica. Las más utilizadas son :

Prueba de Kolmogorov-Smirnov con la corrección de significación de Lilliefors.

Consiste en aplicar la prueba de Kolmogorov-Smirnov (BIR-2000; 2008) pero con la media y


desviación estándar estimada con la misma muestra, lo que la hace más potente. Es más
adecuada para muestras grandes , en general mayor de 30.

Prueba de Shapiro-Wilks (BIR-2004) .

Se utiliza para muestras pequeñas, estando el límite de tamaño de muestra entre 30-50 casos,
habitualmente menor o igual que 30 casos. Se puede emplear una prueba de normalidad en uno
de los grupos y la otra prueba de normalidad en el otro grupo dependiendo del tamaño de muestra
de cada uno de ellos.

Si la prueba resulta significativa (p :5 0,05) la distribución de los datos difieren significativamente


de la distribución normal teórica y no se puede asumir la normalidad . Si la prueba es no
significativa (p > 0,05) la distribución de los datos no difieren significativamente de la distribución
normal teórica, no pudiéndose rechazar el supuesto de normalidad por lo que se puede aceptar
la condición de normalidad, lo cual no equivale a demostrar que la muestra proceda de una
población normal. Esto es lo que interesa al investigador, p no significativas, lo contrario de lo
que se busca con las pruebas estadísticas de homogeneidad habituales .

Las pruebas de normalidad son muy sensibles al tamaño de la muestra . Para muestras muy
grandes, cualquier pequeña desviación de normalidad nos dará unos resultados significativos (p
:5 0,05) rechazando la normalidad. Por el contrario, cuando las muestras sean muy pequeñas,
grandes desviaciones de la normalidad serán estadísticamente no significativas por lo que casi
nunca podremos rechazar la normalidad. En general para tamaño de muestras de 10-11 casos
se pasa directamente a la estadística no paramétrica independientemente de cómo sean las
pruebas de normalidad . Por tanto, el tamaño de muestra es de utilidad para interpretar el
resultado de las pruebas estadísticas.

Glucosa en obesos y no obesos . En ambos casos se emplea la prueba de Kolmogorov-Smirnov


con la corrección de Lilliefors por ser ambas muestras mayores de 30. En el caso de
la Glucosa de los no obesos la máxima diferencia entre las frecuencias acumulativas observadas
y esperadas bajo la hipótesis de normalidad es 0,093 que según la tabla de Lilliefors corresponde
a una significación de 0,200. En la Glucosa de los obesos sale significativa (0,031 ). Se debe
concluir que no se cumple la normalidad ya que la prueba de Kolmogorov-Smirnov con la
corrección de Lilliefors es significativa para el subgrupo de obesos .

Tabla 5.13. Pruebas de normalidad en pacientes Obesos y No obesos.

Prueba Estadístico gl p
Kolmogorov -Smirnov con la corrección de Lilliefors en Obesos 0,141 43 0,031
Shapiro-\Vilks en Obesos 0, 915 43 0,00•
Kolmogorov-Smirnov con la corrección de Lilliefors en o Obesos 0,093 69 0)00
Shapiro -\Vilks en o Obesos 0,924 69 <0,001

GoBIR 73
Paseo de la Habana 9- 11, Madrid. 9 11 610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

PRUEBA T DE STUDENT-FISHER PARA GRUPOS INDEPENDIENTES

Se utiliza si la normalidad se cumple en ambos grupos, obesos y no obesos. Si la Glucosa en un


grupo es normal y en otro no, no se cumple la normalidad. Hay dos variantes de la prueba t de
Student-Fisher para grupos independientes (BIR-2003; 2003; 2003; 2005; 2005; 2008; 2017) ,
en función de que las varianzas de Glucosa en obesos y en no obesos sean iguales u
homogéneas (homocedasticidad: homogeneidad de varianzas, requiere que los residuos se
ditribuyan aleatoriamente) (QIR-2006). Este supuesto de igualdad de varianzas se evalúa con la
prueba de Levene (BIR-2007) (QIR-2002) (Tabla 5.13) que, como todas las pruebas que
comparan varianzas, utiliza la distribución de probabilidad F de Snedecor.

En este caso la prueba de igualdad de varianzas de Levene es no significativa (p = 0,697;


Tabla 5.13). Al ser mayor de 0,05 indica que no hay diferencias estadísticamente significativas
en las varianzas, por lo se puede asumir la igualdad de varianzas y utilizar la prueba t de Student
para varianzas homogéneas, que en este caso es significativa (p = 0,020; Tabla 5.13bis).

Si la prueba de igualdad de varianzas de Levene hubiera resultado significativa (p ~ 0,05;


se encuentran diferencias estadísticamente significativas en las varianzas), se hubiera utilizado
la prueba t de Student para varianzas no homogéneas, que se calcula con una pequeña
corrección a la t de Student (Prueba T de Student-Welch) (BIR-201 O) . En este caso es muy
similar a la anterior (p = 0,019; Tabla 5.13bis).

PRUEBAS NO PARAMÉTRICAS (QIR-2015)

Trabajan ordenando los casos de menor a mayor según su valor de Glucosa, asignando a cada
caso el rango correspondiente a su orden o el rango promedio en caso de producirse empates y
realizando el análisis a partir de los números de orden obtenidos. Si no hay diferencias entre las
variables, los rangos estarán uniformemente repartidos en los dos grupos. Si por el contrario hay
diferencias, habrá predominio de rangos menores en uno de los grupos y rangos mayores en el
otro. A diferencia de las pruebas paramétricas en las que se comparan parámetros (la t de
Student se basa en la comparación del parámetro media), la pruebas no paramétricas reciben
este nombre porque no comparan parámetros, comparan la distribución de la variable en general,
contrastando si los grupos son equivalentes en su posición . Se utilizan para variables ordinales
(BIR-2003) o con categorías ordenadas y para variables cuantitativas que no cumplen las
condiciones de aplicación de la prueba paramétrica, tales como no seguir la normalidad (BIR-
2000 ; 2007) o tener asimetrías marcadas. Tienen las siguientes características:

• Se pueden utilizar siempre. A diferencia de las paramétricas, no precisan condiciones de


aplicación por lo que se pueden emplear en todos los casos.

• Tienen menos potencia. En general se estima que la potencia de una prueba no paramétrica
es el 95% de la potencia de su correspondiente prueba paramétrica. Pero a medida que aumenta
el tamaño de muestra aumentan su potencia estadística en relación a las no paramétricas. En
muestras menores de 11 casos la potencia de ambas pruebas es equivalente . Por este motivo
es aconsejable utilizar pruebas no paramétricas cuando la muestra es pequeña (BIR-2007) .
Pero si la variable difiere de forma muy manifiesta de la normalidad las pruebas no paramétricas
pueden tener más potencia que las paramétricas .

• Tienen menos plasticidad. Sólo dan el valor de significación p, pero no el intervalo de


confianza de la diferencia. Por ejemplo en el caso de la diferencia de medias lo correcto sería
indicar el grado de significación p de la prueba no paramétrica, en este caso la indicada por la
prueba U de Mann-Whitney y la diferencia entre las medias (la proporciona la prueba t de
Student) pero sin el IC95% ya que para su cálculo se requiere la normalidad.

74
Pas eo de la Habana 9- 11 . 1\1/adrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

• Son más entendibles. Se requieren menos conocimientos de estadística para comprender la


lógica de las pruebas no paramétricas que para comprender la de las paramétricas .

.,
l.
En los test paramétricos, las hipótesis se construyen a partir de la media o
la varianza, mientras que en los test no paramétricos se hace a partir de la
mediana (QIR-2005) (BIR-2017) .

• Prueba no paramétrica U de Mann-Whitney y W de Wilcoxon

Se debe utilizar si no se cumple la normalidad , como en este caso . Es significativa (p = 0,026;


Tabla 5.13). La prueba no paramétrica W de Wilcoxon es equivalente a la prueba U de Mann-
Whitney (BIR-2006) (QIR-2003 ; 2005 ; 2006) y su nivel de significación exactamente igual (Tabla
5.13) . Esta prueba no paramétrica W de Wilcoxon se utiliza para comparar dos variables
cuantitativas de grupos independientes y es distinta de la prueba no paramétrica T de Wilcoxon
que se utiliza para comparar dos variables cuantitativas para grupos relacionados que se verá
más adelante .

Tabla 5.13bis. Pruebas estadísticas utilizadas en la comparación.

Prueb,l Estadístico ~l Diferencin de .l \ledias (IC9~%)


Igualdad de varianzas de Le eue f =0.152 0.697
t Student arianzas homogéneas t = 2,365 11 O 0.020 32.2 mg tdl (1C95° o: .2 - 59.2)
t tudent varianzas no homogéneas t = 2,383 91,39 0,019 32 ,~ mgldl (IC95°o: .-l - 59J)
de ann- \Vhitney = 1112,5 0,026
\V <le\: ilcoxon W = 3 ~27.5 0,026

SIGNIFICACIÓN ESTADÍSTICA, MAGNITUD DEL EFECTO Y RELACIÓN


CAUSAL

Al analizar la relación entre la exposIcIon binaria Obesidad Sí/No y la respuesta


cuantitativa Glucosa plasmática en mg/dl, podemos referirnos a tres niveles de evidencia (Tabla
5.14).

Tabla 5.14. Niveles de evidencia de la relación Obesidad - Glucosa en plasma.

1
Cuantifica el grado en que la
Significación est.1dístirn p = 0.02 relació1~ pueda ser debida al azar
1
Di fer ncia de medias (IC9 _0 o): Cuantifica la importancia clínica o
l\fagnitud del efecto
_ "2 (: - 59) mg , dl práctica del efecto
-- - ¿,La obesidad es la causa del Depende del diseüo d 1 estudio y
-
Relación caus.,I
aumento de la ~lucosa'? de que esté dcspro\·isto de sesgos

• Significación estadística. La diferencia de medias de Glucosa entre obesos y no obesos es


significativa (p = 0,020) . Únicamente indica la probabilidad de que la relación obtenida sea debida
al azar. En este caso el 2% de las veces que realicemos este estudio con muestras de 112 casos

GoBIR 75
Paseo de la Habana 9-11, Madrid. 911610039
obtenidas de la misma población en la que no hay diferencias en la Glucosa en obesos y no
obesos, encontraremos una diferencia como la que nos ha salido o mayor.

• La magnitud del efecto. La importancia clínica o práctica del efecto se cuantifica con la
diferencia de medias (32 mg/dl) y sobre todo su IC95%, que en este caso es de 5 a 59 mg/dl
(Figura 5.9). Tomando el extremo más desfavorable del intervalo, se puede concluir que en los
obesos aumenta la glucemia al menos 5 mg/dl respecto a los no obesos. El investigador experto
en el campo de la diabetes es el que debe interpretar si la magnitud de esa diferencia es
clínicamente importante o tiene relevancia pronóstica (p. ej., si aumenta las complicaciones
metabólicas o la mortalidad). La estimación del efecto con la diferencia de medias y su IC95%
tiene las siguientes ventajas:

a. Lleva implícita la significación estadística. Si el valor correspondiente a la


ausencia del efecto (diferencia de medias de O) se encuentra fuera del IC95%
estimado, los resultados serán estadísticamente significativos al 5% (p < 0,05).
Por el contrario si se encuentra incluido en el IC95%, los resultados serán no
significativos al 5% (p > 0,05).

b. Informa de la magnitud del efecto y de la importancia clínica. Indica no solo


que es diferente, además ofrece una cuantificación. Al valorar los límites de los
valores posibles permite evaluar si la magnitud del efecto clínicamente importante
está incluida o excluida en el IC95%.

c. Informa de la potencia del estudio. Si el IC95% es muy amplio e incluye por


poco en un extremo la ausencia de efecto, indica que el estudio tiene poca
potencia y que con mayor muestra se puede estrechar el IC95% y poner de
manifiesto el efecto.

Las pruebas t de Student para varianzas homogéneas y no homogéneas indican el intervalo de


confianza del 95% de la diferencia de medias que informa de la magnitud del efecto (importancia
clínica de la diferencia), lleva implícito el nivel de significación (al no incluir la hipótesis nula, el
cero, son significativas) e informa sobre la potencia . En la Figura 5.9 se representa el IC95% de
la diferencia de medias de la prueba t de Student para varianzas homogéneas.

Figura 5.9. Intervalo de confianza del 95%.

. --
1 .
lO o
1
1
1
;o
·~
1 1
,,; óO

RELACIÓN CAUSAL. Con la información obtenida de esta relación se puede concluir que la
glucosa plasmática es mayor en los obesos que en los no obesos, pero la evaluación de si la
obesidad es la causa del aumento de glucosa (relación causal) no depende del análisis
estadístico. La obesidad sería la causa del aumento del glucosa si los dos grupos fueran
comparables en todos los factores determinantes del aumento de glucosa (los conocidos y los
desconocidos) excepto en la obesidad. Esto depende del diseño del estudio y de que esté
desprovisto de errores sistemáticos o sesgos. El diseño experimental basado en la aleatorización
de la exposición es el que proporciona mayor evidencia causal. En los diseños observacionales
el análisis estratificado y el análisis multivariante con modelos de regresión permiten aproximarse
a la relación causal.

76
Paseo de la Habana 9-11, Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

4. RELACIÓN ENTRE RESPUESTA CUANTITATIVA Y


PREDICTORA POLITÓMICA: COMPARACION DE
VARIAS MEDIAS
El análisis de la relación entre una variable respuesta cuantitativa como Glucosa y una predictora
categórica con más de dos categorías (pol itómica) como Nivel de masa corporal
Normal/Sobrepeso/Obesidad (relación entre varios -tres en este caso- grupos cuantitativos
independientes), consiste en la comparación de tres medias: las medias de Glucosa en los que
tienen IMC Normal (107,7 mg/dl), Sobrepeso (154,2 mg/dl) y Obesidad (174 ,8 mg/dl).

Si las medias son similares, las variables no están relacionadas o son estadísticamente
independientes: la Glucosa no depende del nivel de masa corporal.

Si las medias son diferentes, las variables están relacionadas o son estad ísticamente
dependientes: la Glucosa depende del nivel de masa corporal.

La comparación de las tres medias y la inspección de los diagramas de caja mostrados en la


Figura 5.1O sugieren que sí son diferentes. Pero para obtener una conclusión más o menos fiable
se debe aplicar una prueba estadística .

Figura 5.10. Comparación de medias.

]O] . 7 LLL~-•<lh
l 5 ,f .2 mg,•tU
) Obes "dod 174 ..., m,!'!.-dl

1
lm o '-iJ ~mal ,:illf p~ w ,

Ni>.,• I d · ñ'.ii8a C:<.itp,:,ral

La comparación estadística se realiza como se muestra en la Figu ra 5.11 . El resultado de las


pruebas estadísticas necesarias para este análisis se muestra en Tabla 5.15 y 5.16.

GoBIR 77
Paseo de la Habana 9-11, Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

Figura 5.11. Esquema comparación respuesta cuantitativa y predictora politómica.

~igun1 l 1.~ -2..: Co..!_11JJ~l'!l~iQn d~ res u~ ta rll~1it~1i,•a )_'.l!_rt>dictora p9litón1ic-.a: G/!!_1Y1íj_tí --.: Q ~.s;dadOr. _
Norn.mli,hut
(ck Gl w: o.rt;J e-1 1 ad.a .-.-ntpú d e- Ol,r..údadOr)
Pmeba ~: Kalmo~rov-Smi ~av , , hupiro-\Vilks
Gráficos : de Nm,nalicb-:d, de C:ija._, Histo~rama.
lguahl:.11il di!' Y.-riaurz;.is
Pnrnba d . L .\·en.?

Au-;.-iUsis •di.' 1-.i \":ni,llll:l rrueb.1110 p:ll\llbttrh.-a


t.:\.NO\"AJ U de (~rusk.ll-W,lllb

• Supuesto de Normalidad.

Primero se debe evaluar si la variable cuantitativa en cada uno de los grupos de la variable categórica,
(en este caso Glucosa en IMC Normal, Sobrepeso y Obesidad), sigue una ley normal. La normalidad
se evalúa mediante los gráficos y las pruebas estadísticas de normalidad . Las pruebas de normalidad
(Tabla 5.15) de este ejemplo indican que no se cumple la normalidad , porque la prueba de
Kolmogorov-Smirnov con la corrección de Lilliefors en Obesidad (n = 43) es significativa (p = 0,031)
aunque sean no significativas las prueba de Shapiro-Wilks en IMC Normal (n = 18; p = 0,068) y la de
Kolmogorov-Smirnov con la corrección de Lilliefors en Sobrepeso (n = 51 ; p = 0,200).

Los gráficos de normalidad de Glucosa , también sugieren que no se cumple la normalidad. En los
gráficos Normal los puntos serpentean la diagonal y en los gráficos Normal sin tendencias se alejan
de la recta horizontal de manera asimétrica en los lados (Figura 5.12).

GoBIR 78
Paseo de la Habana 9- 11, At/adrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

Figura 5.12. Esquema comparación respuesta cuantitativa y predictora po/itómica.

Orifico n ormal de Glucou p l,nm/a1ic.a (mg.'dl) Gnaflco normal sin tondonclu de Glucosa pl.asm.átic a (mgldll
lmc H.otm•I IMC NotYn•I

3- 1,$

/'
i-
/ • '·º

..
1
.
i ✓/ e
1
.,.
1 .i .- 1
.., u -
D

1 1zo o- .1/·
• 1
0
.
~ •

'
:,.-,7 o,.




·• • •
,,✓'•
1
• • •• •
• •
~ .0,5

o 50 100 ,so 200 250 100 o 50 100 ,so 200 250


V.,o, Qb.. rvf,do V lor ObHrv&do

G4'áflco normal de Grucoa.a p la-am · ·llca (mgldl) Griflco normal Sin tend•nclH d• GIIJCOH pl.a&m.ltl~ (mg/dll

3
--- ~ obropHO
-- --· ----- 0,6
-- $<)~114~ -
---- -
2
.,~-
.,,, o.•
• ••
••• •
o / .
-¡ _.,,
·' 1 •
/ ....
i
1
✓{ ,. 0
0.2
• •
e •

g ,,,,.. ,1/ ..,•
~ • .• •
.,,, .. .. .
0--
o.o -
~
%
1
o • • :• \. •
J,'"7 •

,,,:.
,.,,,.,, •• •• • • • • ••
•I -<J ,2

• •
-1' • .o,.-
o 100 too )00 50 100 150 ,w 250 )00

V~rQb.. rvo)(lo V1lor obto rv do

Gt.ifico n ormal de Ghlcou plaam:llica (mgldl) Gráfico Q.Q nom,al sin tendencia-a de Gtucoa.a pl.umátlc.i Cmgtdl)
Ob4tliftd p.tr• Ob.lllld.ldOr• ~ t o

• 0,75'·

1 •
• .-
2

_..- , . -~---- o.so-


0
~
! .-----,. -- r lo
C 0,2S--


... ••••••

~
o ~
tlllf!. - ·
-- ~
• • •
e
o
%
.. /'!!~
--•. E
0
0,00
-
• . •

~

.o.2s-


••• -
. ... •


• '
1

-
~

so 100 no 200 250 lOO no 50 100 150 2:-) )00

Vmor observildo V~IOf obsorv11do

79
Paseo de la Habana 9- 11, Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

Tabla 5.15. Pruebas de normalidad.

Prueba Estadístico }

Kolmogorov-Smimov con la corrección de Lilliefors en lmc Nonnal 0,135 º'


18 0,200
Shapiro-Wilks en lmc KonnaJ 0,90-1 18 0,068
Ko lmogorov-Smimov con la corrección de Lilliefors en Sobrepeso 0,098 51 0,200
Shapiro-Wi lk en Sobrepeso 0,933 1 0.006
Ko lmogorov-Smimov con la corrección de Lilliefors en Obesidad 0,1 -~1 .u 0,031
Shap iro-\\ ilks en Obesidad 0,9 1 - 4~ 0,004

• Supuesto de igualdad de varianzas.


Se evalúa con la prueba de igualdad de varianzas de Levene (Tabla 5.16) que, como todas las
pruebas que comparan varianzas, utiliza la distribución de probabilidad F de Snedecor (BIR-
2003 ; 2004 ; 2005; 2005). Aquí es no significativa (p = 0,063), por lo que las varianzas no son
estadísticamente diferentes y se puede asumir el supuesto de igualdad de varianzas. El test de
Barlett permite comparar varianzas (BIR-2005) .
• Prueba del Análisis de la Varianza (ANOVA) (BIR-2001 ; 2002 ; 2006).
Si se cumplen los supuestos de normalidad e igualdad de varianzas (QIR-2003) , la
comparación estadística se realiza con prueba del Análisis de la varianza o ANOVA (ANalysis Of
VAriance), cuyo resultado es una p = 0,003 (Tabla 5.16). En una generalización de la t de Student
para la comparación de dos a varias medias. El ANOVA es una prueba robusta que soporta bien
la no igualdad de varianzas .

Tabla 5.16. Pruebas estadísticas utilizadas

Prueba Estadístico gJ ))
Igu aldad de varianzas de Le\'enc F = 2,838 2: 109 0,063
A ·ovA F = 6,100 _:109 0.003
H de Kmskal-Wallis X2 = 10.99 2 0,004
de tendencia lineal del OV F = 11. 184 0.001
de Jonckheere-Te stra JT = 2.98 0,003

• Prueba H de Kruskal-Wallis. (BIR-2002 ; 2004)

Si no se cumple la normalidad o la igualdad de varianzas se debe utilizar la prueba no paramétrica


H de Kruskal-Wallis, que aquí también es significativa (p = 0,004) (Tabla 5.16) y es una
generalización de la prueba U de Mann-Whitney de dos a varios grupos independientes . SE
distribuye según una chi-cuadrado .

Pruebas de tendencia

Cuando la variable exposición tiene categorías ordenadas, como sucede en este caso con la
variable ordinal Nivel de masa corporal Normal/Sobrepeso/Obesidad, puede ser interesante
evaluar si el cambio en las categorías de Nivel de masa corporal está asociado a un cambio
de Glucosa, es decir si hay tendencia creciente (al aumentar el Nivel de masa corporal, aumenta
la glucosa) o decreciente (al aumentar el Nivel de masa corporal disminuye la Glucosa) . Es decir
comprobar la siguiente hipótesis: MIMC NORMAL< MSOBREPESO < MOBESIDAD. Viendo las
tres medias, los tres diagramas de caja, parece que a medida que crece el Nivel de masa
corporal hay una tendencia creciente en los valores de Glucosa. Esta tendencia creciente puede
tener varios componentes: lineal, cuadrático, cúbico, etc.

GoBIR 80
Pas eo de la Habana 9- 11, J\l/adríd. 911 6 10039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

Prueba de tendencia lineal para métrica del ANOVA.

Valora la tendencia lineal. Aquí resulta estadísticamente significativo (F=11, 184; p=0,001) (Tabla
5.16) . Esto significa que existe relación lineal positiva entre el Nivel de masa corporal y la Glucosa.
También se puede comprobar si hay tendencia cuadrática, cúbica, etc. con las correspondientes
pruebas de tendencia cuadrática, cúbica, etc. del ANOVA.

COMPARACIONES MÚLTIPLES DE MEDIAS


La comparación de las tres medias de Glucosa, en IMC Normal (107,7 mg/dl), Sobrepeso (154,2
mg/dl) y Obesidad (174,8 mg/dl) analizada resulta significativa (p < 0,001 ; Tabla 5.16). La
conclusión de este análisis es demasiado general: algunas de las tres medias son
significativamente diferentes entre sí.
Se puede precisar más la conclusión de este análisis realizando comparaciones múltiples dos a
dos entre los grupos para averiguar qué niveles de masa corporal difieren en la media
de Glucosa y cuáles son las comparaciones concretas responsables de la significación . Las
comparaciones múltiples pueden ser:
Todas las comparaciones múltiples posibles . El número total de posibles comparaciones
múltiples dos a dos de k grupos es k(k-1 )/2. En nuestro ejemplo k = 3 niveles de masa corporal,
por lo que se pueden realizar un total de 3(3-1 )/2 = 3 comparaciones .
Comparaciones múltiples respecto a una categoría de referencia. En general se elige la categoría
que representa la ausencia del carácter, la nula, basal o de referencia. El número de
comparaciones es k-1, siendo k el número de grupos, que es mucho menor que k(k-1 )/2 . En
este ejemplo serían k-1 = 2 comparaciones.
En función de los conocimientos teóricos sobre el tema concreto de investigación, el momento
en que se formulan y la actitud con que se analizan, las comparaciones múltiples se pueden
plantear de dos formas:
Comparaciones múltiples "a priori" mediante una actitud confirmatoria de las hipótesis
establecidas previamente en base a conocimientos teóricos sobre el asunto de la investigación.
En ocasiones se desea contrastar diversas hipótesis específicas acerca del efecto de la
exposición sobre la respuesta. Estas hipótesis se deben plantear en la fase de diseño del estudio,
antes de obtener los datos, "a priori". Una vez finalizado el estudio se realiza su análisis mediante
una actitud confirmatoria de las hipótesis previamente planteadas por parte del investigador. En
el ejemplo, se puede plantear "a priori" valorar el efecto sobre la Glucosa de tener Sobrepeso u
Obesidad respecto a IMC normal.
Comparaciones múltiples "a posteriori" o "post hoc" mediante una actitud exploratoria de todas
las posibles comparaciones. En general no hay suficiente conocimiento sobre el tema de
investigación como para plantear hipótesis "a priori" y se realizan todas las posibles
comparaciones múltiples "a posteriori" con fin de generar nuevas hipótesis.

CORRECCIÓN DEL RIESGO ALFA


Con las comparaciones múltiples de medias sucede lo mismo que con las comparaciones
múltiples de proporciones . El riesgo alfa global aumenta a medida que aumenta el número de
comparaciones y debe corregirse en cada comparación por algún procedimiento.

TIPOS DE PRUEBAS DE COMPARACIONES MÚLTIPLES DE MEDIAS


Existen numerosas pruebas que permiten realizar comparaciones múltiples de medias de
manera que el riesgo alfa del conjunto de comparaciones no supere un valor fijado previamente,
habitualmente 0,05 . De todas ellas se comentaran las pruebas t de Student o DM y la de
Bonferroni. Ambas pruebas son los extremos en cuanto a corrección del riesgo alfa: DMS no le
corrige nada y Bonferroni le corrige en exceso. Son de interés histórico y académico pero no se
utilizan en la práctica habitual. Recomendamos utilizar las pruebas de Scheffé, Tukey (BIR-
2001) o Dunnett según se muestra en la Figura 5.13. La prueba a utilizar debe estar
predeterminada antes de analizar los datos y sólo se debe emplear una. No es correcto realizar
varias pruebas y utilizar la que más interese.

81
Paseo de la Habana 9-11, i\lladrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

Figura 5.13. Pruebas estadísticas para comparaciones múltiples de medias.

Tipo de
com ,lmciones múlti les
Todas las posibles Respecto a una
comparaciones múlt iples categoría de referencia
Tammio d~ grupos simil.u,
Normalidad e loual,fa<l Je , ·,lrianz.as
Prueba de
No 1
Dunnett
Prueba de Prueba de
Scheffé Tukey

Prueba t de Student o DMS

En la Tabla 5.17 se muestran la significación de la prueba t de Student de las tres comparaciones


múltiples de glucosa en los niveles de obesidad. Esta prueba también se llama DMS (Diferencia
Mínima Significativa) o LSD (Least Significant Difference). Compara dos a dos las medias de los
grupos utilizando la t de Student para grupos independientes y varianzas homogéneas . No
corrige el riesgo alfa, por lo que aumenta la probabilidad de cometer error aleatorio tipo l. Apenas
utilizada actualmente pero interesante desde el punto de vista histórico y didáctico . Asumiendo
un riesgo a de 0,05 para cada comparación se concluye que las comparaciones significativas
son IMC Normal - Obeso (p = 0,001) e IMC Normal - Sobrepeso (p = 0,013) .

Tabla 5.17. Comparaciones múltiples t-Student Nivel de masa corporal - Glucosa

Diferencia de medhl.s (mo/d)) IC 9~% (mo/dl)


,, 7,_ 10,0 - -1 ,4
67.1 _9_0 - 10:.2
19.9 - ,2 - 48.0

Prueba de Bonferron i

En la Tabla 5.18 se muestran la significación de la prueba de Bonferroni, también llamada prueba


de Student-Fisher para comparaciones múltiples con la corrección de Bonferroni. Mantiene el
riesgo alfa global en 0,05 por lo que el riesgo alfa de cada comparación se obtiene dividiendo
0,05 entre el número de comparaciones . Es similar a la prueba DSM pero multiplicando la p por
el número de comparaciones con lo que se aumenta la probabilidad de cometer error aleatorio
tipo 11. Siguen siendo significativas las dos comparaciones anteriores. Es poco potente, muy
conservadora y poco utilizada .

Al igual que la anterior tiene valor histórico y didáctico. Ambas pruebas son los dos extremos:
DSM no corrige nada el riesgo alfa (aumenta el error aleatorio tipo 1) y Bonferroni lo corrige
demasiado siendo poco potente (aumenta el error aleatorio tipo 11). Se aconseja utilizar las
pruebas de comparaciones múltiples de potencia intermedia que se describen a continuación .

GoBIR 82
Paseo de la Habana 9-11, Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

Tabla 5.18. Comparaciones múltiples t-Student con Bonferroni Nivel de masa corporal -
Glucosa
Com p,wación p Diferencia de medias (m2/dl) IC 9S% (111~/dl)
Imc omrnl - Sobrepeso 0.04 0 47 .2 1.6 - 92,9
Imc om1al - Obeso 0.002 67, l 20,4 - 11 3,9
Sobrepe o - Obeso 0.490 19,9 l -t .6 - 54.4

Otras pruebas empleadas son:

Prueba de Tukey

Se prefiere si se cumple la normalidad, la igualdad de varianzas y el tamaño de los grupos es


similar. Corrige el riesgo alfa teniendo en cuenta todas las posibles comparaciones que se
pueden realizar.

Prueba de Scheffé

Es aplicable tanto si el número de elementos por grupo es igual o diferente , por lo que se puede
utilizar en caso de tamaños de grupos diferentes . Es robusta , tanto si no se cumple la igualdad
de varianzas en todos los grupos como si no se cumple la normalidad , por lo que se puede utilizar
en caso de vulneración de los supuestos de normalidad o igualdad de varianzas .

Prueba de Dunnett

Está diseñada para realizar un número determinado de comparaciones. Se utiliza si solo se


pretende analizar las comparaciones respecto a una categoría de referencia , habitualmente la
categoría basal o de referencia , por ejemplo varios tratamientos respecto al grupo tratado con
placebo.

PRUEBAS NO PARAMÉTRICAS DE COMPARACIONES MÚLTIPLES DE MEDIAS


En teoría en caso de no cumplirse el supuesto de normalidad las comparaciones múltiples de
medias se deberían realizar con pruebas no paramétricas pero en general no están incluidas en
la mayoría de programas estadísticos. Son similares a las pruebas de comparaciones múltiples
de medias paramétricas, por ejemplo la de Scheffé si son de tamaño diferente, Tukey si los
grupos son de igual tamaño o Dunnett para comparaciones respecto a una categoría de
referencia , pero comparando rangos medios en vez de valores medios en la fórmula del
estadístico .
Una manera práctica de hacerlo sería hacer las comparaciones múltiples dos a dos con la prueba
no paramétrica U de Mann Whitney y posteriormente corregir las p por los procedimientos de
Bonferroni o de Holm de manera similar a como se hace con las comparaciones múltiples de
proporciones.
Pero en la práctica dado que la prueba de Scheffé es bastante robusta , es la que se emplea en
caso de vulneraciones de los supuestos de normalidad e igualdad de varianzas .

5. RELACIÓN ENTRE DOS VARIABLES CUANTITATIVAS


Las pruebas estadísticas para analizar la relación entre dos variables cuantitativas son :

• Correlación.
• Reg resión lineal simple.

Esta relación se explica y entiende mejor comenzando con la valoración de su representación


gráfica conjunta mediante el Diagrama de dispersión o de puntos.

GoBIR 83
Pas eo de la Habana 9- 11, Madrid. 911610039
1
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

Diagrama de dispersión
Se realiza con la variable respuesta en ordenadas y la variable exposición en abscisas. La forma
alargada y ascendente de la nube de puntos sugiere una asociación lineal positiva entre ambas
variables. En el ejemplo propuesto en la figura, se observa que al aumentar el índice de masa
corporal, se obtienen valores mayores de glucosa. Se puede ajustar la recta de regresión por el
método de mínimos cuadrados, obteniendo la recta que minimiza la suma de residuales al
cuadrado . Examinando la desviación de la recta de regresión respecto a la horizontal se puede
analizar la relación lineal entre dos variables cuantitativas .

• Una recta horizontal o vertical indicaría que las variables no están relacionadas
linealmente.
• Por el contrario, una recta inclinada indicaría asociación lineal.

Figura 5.14. Diagrama de dispersión entre dos variables cuantitativas .

.
•• • •
••
• '.• .
. . • ••. .•

. . .
->

1 20 .. . . .
.,
fll
..!:!
15
• •
••
• •
.. . • •
111
111
. .
a.
111
111 ... . . . . ,.
a
o
u
::, ••

.. • •• • - ••• •• •
, ••

••••
' ' -
15,0 20,0 25,0 30,0 35,0 40.0 45,0

Ín dice de masa corporal (kg/m2)

Regresión Lineal (OIR-2003)

Es una prueba estadística de homogeneidad en la que las variables juegan un papel


asimétrico. Existe una variable respuesta y otra u otras (permite introducir varias) variables
exposición que pueden ser cuantitativas o binarias. Es un modelo más general y que permite
más aplicaciones que la Correlación.

GoBIR 84
Paseo de la Habana 9-11, Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

Correlación

Las variables juegan un papel simétrico. No existe una variable exposIcIon o


independiente y otra respuesta o dependiente. Se trata por tanto de una prueba
estadística de independencia. Sólo permite estudiar la posible asociación lineal entre las
variables.

Índices asociación lineal

Los índices más empleados para describir conjuntamente y valorar el grado de asociación
lineal entre dos variables cuantitativas son:

• La covarianza, es el índice básico del que deriva el coeficiente de correlación.


• El coeficiente de correlación de Pearson, basado en valores.
• El coeficientes de correlación ordinal de Spearman, basado en ordenaciones.

Covarianza (sxy) (BIR-2003)

Es la medida básica de variabilidad conjunta de dos variables (BIR-2004) . La covarianza entre


dos variables cuantitativas X e Y (sxy) es igual a la Suma de Productos cruzados entre ambas
variables [SPxy=(xi-Mx)*(yi-My)] dividida por los grados de libertad (n-1 ), es decir:

1sxy = SPxy / n-1 I

La propiedad básica de la suma de productos cruzados es tomar valores positivos cuando la


asociación lineal entre las dos variables es creciente y valores negativos cuando es decreciente.
Su valor depende de las unidades de medida lo que dificulta la valoración del grado de asociación
lineal y la comparación de la asociación lineal entre dos parejas de variables.

El valor de la covarianza depende de las unidades de medida de ambas variables, por lo


que no sirve para comparar el grado de asociación lineal de varias parejas de variables.

La covarianza puede tomar valores negativos (BIR-2002) .

Coeficiente de correlación r de Pearson (BIR-2000; 2002; 2006; 2012; 2016)

Es la covarianza estandarizada, desprovista de unidades de medida que se obtiene dividiendo


la covarianza entre las desviaciones estándar de ambas variables:

rxy=sxy/sxsy=SPxy/ f SSxSSy

Es un indicador del grado de asociación lineal (BIR-2004) (FIR-2004; 2006; 2009; 2011; 2015)
entre las dos variables cuyo valor oscila entre -1 (asociación lineal negativa perfecta,
pendiente negativa) (QI R-2013) y +1 (asociación lineal positiva perfecta) (QI R-2013)
pasando por O (ausencia total de asociación lineal).

• La magnitud aceptable de un coeficiente de correlación depende del tipo de estudio. En


el ámbito de las matemáticas o la física, un coeficiente de correlación menor de 0,4 es

85
Paseo de la Habana 9-11, Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

malo, entre 0,4 y 0,7 es aceptable y mayor de 0,7 es bueno. Pero en investigación en
poblaciones humanas y en biología o sociología, en general la variabilidad es mucho
mayor por la mayor complejidad y un coeficiente de correlación de 0,4 es bastante
aceptable.
• No detecta relaciones curvilíneas que son crecientes en un intervalo y decrecientes en
otro .
• Se puede emplear con variables ordinales y puede valorar una asociación entre las
variables más general que la lineal.

Para poder ser aplicado se requiere que la nube de puntos tenga una forma más o menos elíptica
y que las dos variables cuantitativas sigan leyes normales .

El r de Pearson es la estandarización de la covarianza haciéndola independiente de las


unidades de medida, por lo que permite comparar el grado de asociación lineal de varias
parejas de variables.

Coeficiente de determinación (FIR-2012; 2013) : En el modelo de regresión lineal se


corresponde con el cuadrado de coeficiente de correlación de Pearson . Indica el porcentaje de
la variable resultado que depende únicamente de la variable exposición .

El coeficiente de determinación toma valores entre O y 1, y cuanto más se aproxime a 1 mejor


será el ajuste y por lo tanto mayor la fiabilidad de las predicciones que con él realicemos. Nótese
que si el coeficiente de correlación lineal res igual a 1 o -1 entonces R2 = 1 y por lo tanto el ajuste
lineal es perfecto .

Ejemplo: Sir= 0.90 y R 2 = 0.81. Esto indica que el grado de asociación lineal entre las
variables es alto, y concretamente el 81% de la variación total de los valores de la
compresión pueden ser explicados mediante la recta de regresión ajustada.

Coeficiente de correlación ordinal Rho de Spearman (p) (BIR-2 01 6) (OIR-


2004)

Se utiliza en vez del r de Pearson cuando las variables cuantitativas no cumplen las
condiciones de aplicación o para variables ordinales. Al igual que otras pruebas no
paramétricas se basa en ordenaciones y no se ve afectado por los valores anómalos. Es más
robusto que el de Pearson y al no precisar condiciones de aplicación se puede emplear siempre .

Otro coeficiente utilizado en el estudio de la correlación para pruebas no paramétricas es el


coeficiente de correlación Tau de Kendall (QIR-2005)

Tabla 5.19. Análisis de la relación entre dos variables binarias.

Correlación entre dos variables cuantitativas


CUANTITTATIVA- CUANTITATIVA
Normalidad de las dos variables:

Pruebas: Kolmogorov-Smirnov y Shapiro Wilks.


SÍ NO

• Coeficiente de correlación r de
Pearson
• Coeficiente de correlación ordinal Rho de
Spearman (p)

86
Paseo de la Habana 9- 11, Madrid. 911 610 039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

Ejemplo: A continuación, se muestra un ejemplo entre dos parejas de dos variables


cuantitativas.

Variables Covarianza R de Pearson


Glucosa - IMC 78,2 Kg/m 2 X mg/dl 0,251
Peso - Talla 85,7 Kg x cm 0,590

La covarianza entre Glucosa-lMC es 78,2 Kg/m 2 x mg/dl y entre Peso-Talla es 85,7 Kg x cm.
Estos valores indicarían un grado de asociación lineal similar, pero están influidos por las
unidades de med ida.

Sin embargo, si observamos la otra columna , el r de Pearson de Glucosa-lMC es 0,251 y el de


Peso - Talla es 0,590 . Al no estar influido por las unidades de medida se pone de manifiesto que
la asociación lineal es mayor del doble que la indicada por las covarianzas .

Usos incorrectos del coeficiente de correlación


En diversas ocasiones el coeficiente de correlación no refleja la asociación entre las variables y
su uso es incorrecto:

• Correlación en la que está implicado el tiempo.


Hay variables que cambian a lo largo del tiempo y presentan una relación espuria.
Ejemplo : relación entre precio de gasolina y tasa de divorcios en España en los últimos
años .

• Relación entre una parte y el todo.


Cambio relacionado con el valor inicial. Con el peso inicial PO y al mes de tratamiento
P1, siempre se encontrará relación entre PO y la variación de peso P0-P1 ya que en esta
última interviene el peso inicial. Si PO y P1 son independientes la correlación entre PO y
P0-P1 es de aproximadamente 0,7. Otro ejemplo : Correlación entre Peso e IMC .

• Utilizarlo como medida de concordancia.


Si se mide una variable con dos procedimientos diferentes podemos encontrar un r muy
alto pero la concordancia o acuerdo puede ser muy baja . La concordancia se mide con
el coeficiente de correlación intrac/ase (CCI) para variables cuantitativas y con el
índice kappa (BIR-2008) para categóricas . Estos índices se estudiarán más adelante .

• Utilizar muestras muy sesgadas.


El coeficiente de correlación se puede modificar mucho, e incluso invertir su sentido ,
eliminando de la muestra casos muy influyentes o con mucho peso e inversamente
introduciendo casos diferentes a los de la muestra .

REGRESIÓN LINEAL SIMPLE (BIR-2001; 2004) (FIR-2000 ; 2005) (QIR-2003)


Se utiliza para caracterizar la relación lineal de dos variables cuantitativas.
Existe una variable dependiente (respuesta o efecto) representada en el eje "Y" y una variable
independientes (predictiva o causa) representada en el eje "X".
Se deben cumplir condiciones de normalidad en ambas variables .
Se representa como : Y= a + bx; donde "a" representa la ordenada en el origen (BIR-2000 ; 2002)
y "b" la pendiente de la recta .

87
Paseo de la Habana 9- 11, Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

,i/

b,.

Cuando consideramos el valor ajustado mediante el modelo de regresión lineal para un valor
fijo x:

y= a+ bx
tenemos, en realidad , un estadístico . La varianza de este estadístico es conocida como varianza
residual, la cual resulta igual a:

La raíz cuadrada de la varianza residual es conocida como el error típico.

La varianza residual coincide también con la suma de cuadrados de las diferencias entre los
valores de la variable dependiente observados y estimados por la recta, dividiendo el resultado
final por el tamaño de la muestra . Esta varianza residual es clave para estimar intervalos de
confianza en este modelo (QIR-2005)

6. PRUEBAS ESTADÍSTICAS DE CONFORMIDAD


Las pruebas de conformidad verifican una hipótesis sobre un determinado valor de un
parámetro de la población :

• Comparación de una proporción observada a una teórica:


Comprobar si la muestra procede de una población con una determinada proporción de
un carácter, por ejemplo igual proporción de hombres y mujeres (50%).

• Comparación de una media observada a una teórica:


Comprobar si la muestra procede de una población con una media determinada .

El problema de estos contrastes es que son poco potentes :

a) Si no son significativos , no puede considerarse demostrado que los datos de la muestra se


ajusten al valor teórico. Es un aspecto muy importante para no cometer este error en las
conclusiones de un artículo .

b) Sin embargo si son significativas, sí que puede considerarse que los datos de la muestra no
se ajustan al valor teórico.

88
Paseo de la Habana 9- 11, Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

Comparación de una proporción observada a una teórica:


En ocasiones es necesario comprobar la hipótesis sobre una determinada proporción sobre una
característica de una población . Por ejemplo si se desea comprobar si la distribución del sexo de
la muestra procede de una población con un 50% de hombres y un 50% de mujeres, se debe
realizar una prueba estadística de conformidad para valorar la discrepancia entre las
proporciones observadas en la muestra y las esperadas bajo el supuesto de equiprobabilidad
(50% de hombres y mujeres) .

La Tabla 5.20 ofrece los valores observados y esperados de Sexo en cada categoría y la
diferencia entre ellos. En la muestra hay 44 mujeres y 68 hombres. En una población con un
50 % de hombres y mujeres deberíamos esperar 56 hombres y 56 mujeres, es decir hay 12
hombres de más y 12 mujeres de menos.

La cuestión es: ¿cual es la probabilidad de obtener por el error aleatorio de muestreo una muestra
de 44 mujeres y 68 hombres de una población con igual número de hombres y mujeres?

Tabla 5.20. Comparación de una proporción observada a una teórica del 50 %.

l\lu "cr \".,rón P rucb:1 cbi-cu.ulraclo


Observado 44 68 X:.= 5.14
Espe!'ado :6 56 21 = 1
Di ferenc ia - 12 }_ p =0,023

Esta probabilidad la ofrece la ley de x2.


Aparece el valor del estadístico de contraste 5, 14, los
grados de libertad (gl = 1) y la significación estadística que en este caso es de 0,023, que al ser
significativo (p< 0,05) permite rechazar la hipótesis nula y concluir que la muestra no procede de
una población con igual proporción de hombres y mujeres.

Recuerda: Las condiciones de aplicación de la prueba x2


son que todas las proporciones
esperadas sean mayores que 5 y en este caso se cumple (ambas son 56).

Comparación de una media observada a una teórica:

En ocasiones es necesario verificar la hipótesis de que la muestra procede de una población con
una determinada media en una variable cuantitativa.

Tabla 5.21. Comparación de una media observada a una teórica.

Comparación de una media observada a una teórica


Normalidad de las dos variables:

Pruebas: Kolmogorov-Smirnov y Shapiro Wilks.


SÍ NO

• Prueba t de Student para una


muestra • prueba no paramétrica T de Wilcoxon

Por ejemplo, si se parte de una muestra, con una media de IMC de 29,3 kg/m 2 y ésta procede de
una población con una media de IMC de 25 kg/m 2 , el análisis de esta comparación se puede

GoBIR 89
Paseo de la Habana 9- 11, ivladrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

realizar con la prueba t de Student para una muestra o con la prueba no paramétrica T de
Wilcoxon según se cumpla o no la normalidad, respectivamente, como se muestra en Tabla 5.21

Tabla 5.22. Ejemplo de comparación de una media observada a una teórica.

Media de lm Ob ervada en la muestra 29.3 kg/m 2


fedia de Imc teórica 25,0 kgl m2

Tabla 5.23. Pruebas estadísticas de una media observada a una teórica .

Prueba Est,1dístico ~l Difere11cia de Medias (IC95%)


t Student para una muestra 1= 10.193 111 <O00 l 4J (35 - 5,1) kg/m·
T de Wilcoxon Z =-7, 21 <0,00 l

Prueba t de Student-Fisher.

Se utiliza cuando se cumple el supuesto de normalidad.


Si en el ejemplo, se cumple este supuesto, al aplicar esta prueba obtendríamos un resultado
significativo (p < 0,001 ). Además, ofrece una estimación de la magnitud de la diferencia respecto
a la media teórica: 4,3 (IC95% 3,5 - 5, 1) kg/m 2 . Se concluye que nuestra muestra no procede de
una población con una media de IMC de 25 kg/m 2 .

Prueba no paramétrica T de Wilcoxon

Es la prueba no paramétrica para comparar variables cuantitativas apareadas en un diseño de


medidas repetidas, que puede emplearse para comparar una media observada a una teórica en
el caso de no cumplirse la normalidad. El resultado es significativo (p < 0,001) por lo ~ue no se
puede asumir que la muestra proceda de una población con media de IMC de 25 kg/m .

7. PRUEBAS ESTADÍSTICAS PARA GRUPOS


APAREADOS
En los estudios de grupos apareados , también llamados diseños de muestras, medidas o
datos intrasujetos, relacionados, agrupados o dependientes, a diferencia de los estudios de
grupos independientes, los elementos de los dos grupos son los mismos, aunque en
circunstancias distintas.

La circunstancia diferenciadora más frecuente suele ser el tiempo, como analizar una variable
(p. ej . glucemia) antes y después de administrar un tratamiento (p. ej. un nuevo antidiabético).
Son los diseños pre-post. Además del tiempo pueden darse con otras circunstancias
diferenciadoras como aplicar un colirio a un ojo y el placebo al otro, o bien un tratamiento tópico
en un brazo y otro distinto o placebo en el otro brazo, etc.

90
Paseo de la Habana 9-11 . Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

Tabla 5.24. Estudios de grupos independientes y de grupos apareados

Estudios de grupos independientes y de grupos apareados


Estudios/Diseños de grupos, muestras, datos o medidas
DEPENDIENTES O INTRASUJETO,
INDEPENDIENTES O ENTRESUJETO
APAREADOS O RELACIONADOS
Obesidad Presión arterial Presión arterial sistólica Presión arterial sistólica
(Sí/NO) sistólica (mmHg) inicial (mmHg) final (mmHg)
Sí 153 153 140
Sí 145 145 135
-- ... ... ...
No 125 125 123
No 122 122 128
.. ... -- - ...

Ejemplo:

A todos los sujetos del estudio se les ha sometido a un tratamiento dietético y farmacológico
durante 6 meses con el fin de reducir su peso . Se obtiene el peso al finalizar el tratamiento, que
llamaremos Peso final, y supuesta estable la talla, un IMC al final del tratamiento que
llamaremos IMC final. Se trata de un diseño de grupos apareados pre-post con un solo grupo.

El análisis se realiza con pruebas estadísticas que permiten estudiar el cambio que se produce
en la respuesta al pasar de un estado inicial a una respuesta final. Tienen la gran ventaja de
eliminar la variabilidad entre sujetos, pero al no existir un grupo control disminuye la certeza de
atribuir el cambio observado en la respuesta a la intervención, ya que entre ambos momentos
pueden haber ocurrido otras circunstancias, además de la exposición, que sean las responsables
del cambio observado.

La eficacia del tratamiento contra la obesidad se puede analizar con el estudio de la relación
entre las variables inicial y final con las pruebas estadísticas para grupos apareados que
dependen de la escala de medida de las variables utilizadas.

Tabla 5.25. Pruebas estadísticas para datos apareados.

VARIABLE
BINARIA POLITÓMICA CUANTITATIVA
respuesta
BINARIA Prueba de
McNemar
POLITÓMICA
Prueba de McNemar-Broker

•Prueba t de Student para grupos apareados


CUANTITATIVA
•Prueba no paramétrica T de Wilcoxon

Relación entre dos variables binarias apareadas: obesidad sí/no


inicial y final
La Figura 5.15 representa el diagrama de dispersión de IMC inicial y final, con las líneas
horizontal y vertical referenciadas a IMC = 30 kg/m 2 . Muestra de forma clara la lógica de la prueba
estadística de McNemar para grupos apareados, dirigida a valorar la relación entre el tratamiento
contra la obesidad y el cambio en el estado de Obesidad Sí/No.

91
Paseo de la Habana 9-11, Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

Figura 5.15. Diagrama de dispersión entre IMC inicial y final.

..• .
40,0-

i 35,0- .. • •.•• . .
. •••• . . •• ....
a, • ••
~ lo

• • .:, •
¡¡¡
e: JO.v
:;:
1 ••• .
.
¡¡¡
o
...c.o
........: ...·:-... •"' • •
25,0-
.
·' ." ....
u •••
, •.
fll
u,

~ •

4> 20,0- •
"C •••
4>
l) • •
. ••
"C •
..E
15,0-
• •
.
10,0-
1 1 1 1

15,0 20,0 25,0 30,0 35,0 40,0 45,0


indice de masa corporal inicial (kg/m2)

Estas líneas horizontal y vertical dividen a los casos en dos grupos según sean obesos al final
(puntos por encima de la horizontal) o al inicio (puntos a la derecha de la vertical) o no sean
obesos al final (puntos por debajo de la línea horizontal) o al inicio (puntos a la izquierda de la
vertical). Estas dos líneas dividen el gráfico de dispersión en cuatro cuadrantes que aportan una
información similar a la tabla de contingencia de Obesidad inicial y Obesidad final) que se
muestra a continuación:

Tabla 5.26. Tabla de contingencia de variables binaria apareadas.

Obesidad final
Obesidad
NO SÍ Total
inicial
SÍ 15 28 43
NO 63 6 69
Total 78 34 112

Cuadrante superior izquierdo:

El cuadrante superior izquierdo contiene 6 puntos correspondientes a los no obesos antes del
tratamiento y obesos después del tratamiento . En estos sujetos el tratamiento ha sido perjudicial.

Cuadrante inferior derecho :

Contiene 15 puntos, que son los 15 obesos antes del tratamiento que dejan de serlo después del
tratamiento . En estos casos el tratamiento es beneficioso. Los datos de estos 21 casos sugieren
un efecto beneficioso del tratamiento : 15 pacientes mejoran y 6 empeoran.

92
Pas eo de la Habana 9- 11, Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

Cuadrante superior derecho:

Contiene 28 obesos antes del tratamiento que continúan siéndolo después de él. El tratamiento
tiene efecto neutro sobre ellos.

Cuadrante inferior izquierdo:

Contiene 63 no obesos antes y después del tratamiento . El tratamiento tiene efecto neutro sobre
ellos .

Prueba de simetría exacta de McNemar (BIR-2001 ; 2008 ; 2010 ; 2011 ; 2017)

Es la prueba utilizada para la comparación de dos variables binarias de grupos apareados. La


lógica del análisis de esta prueba consiste en comparar las casillas de la Tabla 5.26 que indican
cambios de respuesta en ambos sentidos: los 6 que pasan de no obesos a obesos y los 15 que
pasan de obesos a no obesos. Los 91 casos restantes no intervienen en el análisis estadístico,
y ésta es la mayor debilidad de esta prueba.

El nivel de significación exacto obtenido según la distribución binomial de la prueba de McNemar


es p = 0,078 . Se puede concluir que el tratamiento no es eficaz: no se puede descartar la
hipótesis de que ha habido el mismo número de cambios de obesos a no obesos que de no
obesos a obesos al aplicar el tratamiento (p = 0,078) .

Ojo: El grado de asociación entre las variables Obesidad inicial y Obesidad final se mide
mediante la prueba de independencia de chi-cuadrado . Es importante no confundirla con la
prueba de simetría exacta de McNemar que es la prueba de homogeneidad para datos
apareados . En nuestra hipótesis esta prueba de independencia de x2
carece de interés porque
lo que nos interesa es valorar el efecto del tratamiento sobre la obesidad independientemente de
que exista asociación entre la Obesidad inicial y final.

Relación entre dos variables politómicas apareadas: nivel de masa


corporal inicial y final
Cuando se trata de comparar dos variables politómicas apareadas , Nivel de masa corporal
(Normal, sobrepeso, Obesidad) inicial (antes del tratamiento) y final (tras finalizar el tratamiento),
tendríamos una tabla de contingencia de 3x3 . La lógica del análisis consiste en comparar las
casillas que indican cambios de respuesta en ambos sentidos mediante una variante de la prueba
de McNemar llamada prueba de McNemar-Broker.

Ojo: Otra prueba no paramétrica que se utilizar para comparar variables cualitativas apareadas
es la Q de Cochran (3 o más muestras) (QIR-2005).

Relación entre dos variables cuantitativas apareadas: IMC inicial y


final

En la Tabla 5.27 se observa que la media de IMC final es menor que la inicial. De la misma
forma que el diagrama de caja muestra que el IMC final es menor que el inicial lo que también
sugiere eficacia del tratamiento .

GoBIR 93
Paseo de la Habana 9-11, Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

Tabla 5.27. Comparación de medias y diagrama de caja IMC inicial - IMC final.

Media de Jm c inicial 29,3 kg/ m~


Media de lmc final 27, 1 kg/ m;

T

l mc inicia l (kg/m2) l mc final (kg/m2)

La Figura 5.16 representa el diagrama de dispersión de IMC inicial y final. La línea diagonal
media se corresponde con la función y= x; en este caso IMC final= IMC inicial. Muestra de forma
clara la lógica de la prueba t de Student para grupos relacionados para valorar la eficacia del
tratamiento contra la obesidad y el cambio en el /MC final respecto al inicial.

La lineal diagonal media representa la ausencia de efecto: el /MC inicial es igual al final. La
distancia vertical entre cada punto a la diagonal es el cambio de IMC en kg/m 2 en cada sujeto a
consecuencia del tratamiento . Es la variable Diferencia de IMC. La nube de puntos sugiere un
efecto beneficioso del tratamiento , porque la mayor parte de los puntos están por debajo de la
diagonal: el IMC final es predominantemente menor que el inicial, es decir, el tratamiento
antiobesidad disminuye el IMC.

Figura 5.16. Diagrama de dispersión entre /MC inicial y final.

..
4(),

i ..
J5,
: .. ..
~ 30,
..... ·, . ..
. ::- - .
1 • • • :,. •
-¡:;
o
a. .. : ::· .
;
~
u
"'
25,
...
:• ...... .
g
_g 20,
.,u I ••
:¡;
e:
·- 15,

10,0

15,0 20,0 25,0 JO.O J5, 0 40,0

indice de masa corpo ral Inicia ! (kg/m2)

GoBIR 94
Paseo de la Habana 9-11, Madrid. 911610039
1
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

Tabla 5.28. Comparación de dos variables cuantitativas apareadas

Comparación de dos variables cuantitativas apareadas


Normalidad de la variable DIFERENCIA

Pruebas: Kolmogorov-Smirnov y Shapiro Wilks.

Gráficos de normalidad, caja histograma-


SÍ NO

• Prueba t de Student-Fischer para


grupos apareados. • prueba no paramétrica T de Wilcoxon

Prueba t de Student-Fisher para muestras relacionadas


Es la prueba para analizar la relación estadística entre dos variables cuantitativas apareadas
(BIR-2001 ; 2002) (FIR-2002) , que es distinta de la prueba t de Student para grupos
independientes descrita anteriormente. Comprueba si IMC final es menor que IMC inicial a partir
de la variable Diferencia de IMC y valora cuanto se aleja de cero su media .

• Si IMC inicial e IMC final son iguales (HO: IMC final - IMC = O) la diferencia será nula
(Diferencia de IMC = O) , el estadístico de contraste de la t de Student valdrá cero y la
prueba será no significativa .
• A medida que los valores de IMC inicial e IMC final se van haciendo más diferentes, el
valor de la diferencia aumentará, al igual que el valor del estadístico de la t de Student y
la prueba se hará más significativa.

Esta prueba sirve para evaluar el efecto de una exposIcIon, en este caso el tratamiento
antiobesidad, sobre una respuesta, en este caso el cambio de IMC. Pero para valorar el grado
de asociación lineal entre el IMC inicial y final se utiliza el coeficiente de correlación de
Pearson entre ambas variables . En nuestra hipótesis esta prueba carece de interés porque lo
que nos interesa es valorar el efecto del tratamiento sobre el IMC independientemente de que
exista asociación entre ambas variables .

Tabla 5.29. Ejemplo pruebas estadísticas utilizadas en la comparación de dos variables


cuantitativas.

Prucb,, Eshu.lístico o) ~Icdia de la s difcrcnd.1s (1("9::;%)


_ onnalidadde Ko lmogoroY- nu-_rn_ o_v___ 0.071 --
112 0,200
. onnal idad de 'hapiro-Wilk 0.982 112 0Y24
t Student para grupos ap~lnados t = .3 37 lll <0,(}{H 2,2 (1,7 - 2,8) ~ /mi
o par . nétrica T de Wi lcoxon Z = - 6. 9 :::O, 0 1

En la Tabla 5.29 se ofrece el resultado de la prueba t de Student para grupos apareados (p <
0,001 ). Se puede concluir que el tratamiento contra la obesidad disminuye estadísticamente
el IMC. Además informa de la magnitud del efecto: la media de las diferencias de IMC es 2,2
(IC95%: 1,7 - 2,8) kg/m 2 . El IMC final es, en promedio, 2,2 kg/m 2 y al menos 1,7 kg/m 2 (extremo
más desfavorable del IC95%) menor que el inicial.

La significación estadística también se puede deducir del IC95% : al no incluir la hipótesis nula
(el cero) la diferencia es estadísticamente significativa al menos al 5% (p < 0,05).

95
Paseo de la Habana 9-11, i\,·fadríd. 911 610 039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

Prueba no paramétrica T de Wilcoxon (BIR-2000 ; 2002; 200s ; 200?) (OIR-2002)

También llamada prueba de los rangos con signo de Wilcoxon, es la prueba no paramétrica para
comparar dos variables cuantitativas apareadas utilizada cuando no se cumple el supuesto de
normalidad. En esta caso también es significativa, p < 0,001.

96
Paseo de la Habana 9-11, 1\tladrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

BLOQUE 6. PRUEBAS DIAGNÓSTICAS.


ÍNDICE

1. ESTUDIOS SOBRE PRUEBAS DIAGNÓSTICAS ....................................... 98

2. FIABILIDAD O ACUERDO DE PRUEBAS DIAGNÓSTICAS ...................... 98

A) FIABILIDAD DE VARIABLES NOMINALES ......................... .................... 99

B) FIABILIDAD DE VARIABLES CUANTITATIVAS: COEFICIENTE


CORRELACIÓN INTRACLASE ................................................................... 100

3. VALIDEZ DE UNA PRUEBA DIAGNÓSTICA ............................................ 102

SENSIBILIDAD (S) ...................................................................................... 103

ESPECIFICIDAD (E) .................................................................................... 103

EL VALOR GLOBAL (VG) .......... ................................................................. 103

RAZONES DE VEROSIMILITUD .................................................. ............... 105

CURVA ROC ....... ........................................................................................ 105

4. VALOR PREDICTIVO DE UNA PRUEBA .................................................. 106

EL VALOR PREDICTIVO POSITIVO (VPP) ................................................ 106

EL VALOR PREDICTIVO NEGATIVO (VPN) .............................................. 106

VALORES PREDICTIVOS Y PREVALENCIA .................. .............. ......... .... 107

TEOREMA DE BAYES ................................................................................ 107

GoBIR - - - - - - - 97
Paseo de la Habana 9- 11, 1'vladrid. 91161 0039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

1. ESTUDIOS SOBRE PRUEBAS DIAGNÓSTICAS


La investigación clínica implica en ocasiones la evaluación de pruebas diagnósticas. Aunque
habitualmente se utilizan diseños transversales y menos frecuentemente de cohortes, los
objetivos y análisis de los estudios sobre pruebas diagnósticas son distintos a los habituales en
estos diseños. El estudio de la variabilidad de cualquier medición, y una prueba diagnóstica no
es más que una medición, consta de dos aspectos: la Fiabilidad o Acuerdo y la Validez o
Exactitud que se verá más adelante (Figura 6.1).

Figura 6.1. Estudio de pruebas diagnósticas.

Fb,bilidnd (re/iabilitr) \"alidcz (1·aliditr)


Grado de coincidencia de do · o más Grado de coincidencia con la venfo d.
Concepto mediciones. realizadas sobre la mi ma representada por una pmeba de refe rencia.
mue tra por uno o más obscrva<lorc Capacidad d1: di st inguir entre e tados de salud

Otras Acuerdo o concordancia (agreement), Exactitud e p1eeisié1t (accu racy). eficacia


de11omi11aciones reproducibilidad(reprod11cibility), (eff,cac_r). rendimiento diagnóstico
en la literaturn consistencia (con istenc_r). (diagno ticaccuracy)
Índice kappa Sens ibilidad y Especificidad
Pruebas
Índice kappa ponderndo V.ilor Predicti vo Positivo y egativo
utiliz,ldas
Cocfi cientl: de correlación intraclasc (C 1) Curva ROC

2. FIABILIDAD o ACUERDO DE PRUEBAS


DIAGNÓSTICAS
La Fiabilidad de una prueba diagnóstica es el grado de coincidencia de dos o más mediciones,
realizadas sobre la misma muestra por uno o más observadores . Es el paso inicial y previo en la
valoración de una prueba diagnóstica . Es lo primero que se debe hacer cuando no existe un
grado de coincidencia adecuado, y es lo único que se puede valorar cuando no existe una prueba
de referencia que permita estudiar la validez.

Las pruebas utilizadas para analizar la Fiabilidad dependen de la escala de medida de la prueba
diagnóstica. El índice Kappa se utiliza para variables categóricas nominales, el índice kappa
ponderado para variables categóricas ordinales y Coeficiente de Correlación lntraclase (CCI)
para variables cuantitativas (Figura 6.2).

Figura 6.2. Pruebas utilizadas para fiabilidad de pruebas diagnósticas.

VARIABLES NOMINAL ORDINAL CUANTITATIVA

NOMINAL Índice Kappa

ORDINAL Índice Kappa ponderado

CUANTITATIVA Coeficiente correlación intraclase (CCI)

GoBIR 98
Pas eo de la Habana 9-11 . 1\,fadrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

A) Fiabilidad de variables nominales.


Se pretende evaluar el grado acuerdo o concordancia entre dos clínicos (A y B).

Ejemplo de dos observadores y variable dicotómica: Dos radiólogos independientes informan


como neumonía sí/no 100 radiografías . Los resultados son :

Radiólogo A
Rad.B Neumonía No Neumonía Total
Neumonía 50 5 55
No Neumonía 10 35 45
Total 60 40 100

• Acuerdo observado
El Acuerdo observado (Ao) también llamado Acuerdo específico global o Acuerdo porcentual es
la medida de acuerdo más sencilla. Se valora la coincidencia o acuerdo en los resultados
positivos (acuerdo específico positivo) y negativos (acuerdo específico negativo) .
Se puede obtener sumando los efectivos observados en las casillas concordantes y dividirlo por
el número total de sujetos (en negrita) :

(50+35)/100=0,85.

Es decir, el cociente entre la suma de pares concordantes y el total de sujetos. Su valor oscila
entre O (discordancia total) y 1 (Acuerdo máximo o total). Tiene el inconveniente de no tener
en cuenta los acuerdos que se producen simplemente por azar.

• Acuerdo esperado
El Acuerdo esperado (Ae) por azar, en el caso de independencia perfecta entre las mediciones,
se vería cuando la tabla de contingencia mostrara los valores esperados bajo el supuesto de que
no existe relación entre las variables A y B.

• Acuerdo real
El acuerdo real es el observado menos el esperado por azar. En este caso sería: Ao - Ae.

• Acuerdo potencial
El acuerdo potencial sería el acuerdo máximo menos el debido al azar. Sería: 1 - Ae. Es la
máxima concordancia real que se puede obtener cuando hay acuerdo perfecto. Es el acuerdo
que queda por explicar después de quitar la influencia del azar.

Índice kappa
El índice kappa de Cohen es el cociente entre el acuerdo real y el acuerdo potencial. Es la
proporción de acuerdo real respecto al potencial. Soluciona el inconveniente del acuerdo
esperado teniendo en cuenta la coincidencia esperable por azar. Incluye sólo los acuerdos que
supuestamente no se deben al azar.

Landis y Koch propusieron la siguiente escala de valoración del índice kappa y desde entonces
ha sido ampliamente utilizada .

Figura 6.3 Valoración del índice Kappa.

Kappa Grado de acuerdo


<0 ,20 Muy bajo
0,21 - 0,40 Bajo
>0,41 - 0,60 Moderado
0,61 - 0,80 Bueno
0,81 -1,00 Casi perfecto , Excelente

99
Paseo de la Habana 9- 11, Madrid. 911 610 039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

Limitaciones del índice kappa:

• Influencia de las asimetrías en las concordancias.


• Está influido por el desequilibrio entre los resultados positivos y negativos, por lo que
varía con la prevalencia de la enfermedad.
• Una manera de disminuir esta limitación es comunicarlo junto con los acuerdos
específicos positivos y negativos.
• Esta influencia de la asimetría de los resultados positivos y negativos es tanto mayor
cuanto mayor es el acuerdo global.
• Influencia de las asimetrías en las discordancias. También está influido por la asimetría
de partes discordantes o sesgo y además esta influencia es tanto mayor cuanto menor
sea el índice kappa.

Índice kappa ponderado


Cuando el índice kappa se aplica a variables ordinales, se asigna el mismo nivel de desacuerdo
a la diferencia en un nivel que en dos. Se debe utilizar el índice kappa ponderado que diferencia
si el nivel de desacuerdo es en un nivel o en más de un nivel. En general el índice kappa
ponderado es mayor que el no ponderado.

B) Fiabilidad de variables cuantitativas: Coeficiente de Correlación


lntraclase .

La fiabilidad o concordancia entre dos variables cuantitativas, resultado de aplicar distintos


instrumentos de medida o diferentes evaluadores a un mismo proceso, no debe evaluarse
mediante el coeficiente de correlación r de Pearson, sino mediante el Coeficiente de
Correlación lntraclase, CCI (lntraclass Correlation Coeficient, ICC). El coeficiente de correlación
valora la intensidad de la asociación lineal entre dos mediciones cuantitativas, que es un
concepto distinto del grado de acuerdo entre ambas mediciones. La existencia de correlación no
implica la presencia de concordancia o acuerdo.

El cálculo del CCI se basa en el modelo de análisis de la varianza con medidas repetidas o
intrasujeto o de dos vías: la correspondiente a los sujetos y la correspondiente a los observadores .
Si se somete a varios sujetos a varios evaluadores, la variación total obtenida puede
descomponerse en tres componentes:

• La variación debida a los sujetos .


• La variación debida a los evaluadores.
• La variación residual.

Los valores del CCI oscilan entre O (ausencia total de concordancia) y 1 (concordancia
absoluta). Su interpretación es similar a la del kappa, que aunque algo arbitraria, se tiende a
aceptar las categorías propuestas por Fleiss (Figura 6.4) :

Figura 6.4. Valoración del CCI.

<0.40 • bajo o malo.


0.41 - 0.75 • regular/bueno o aceptable.
>0.75 • muy buena o excelente.

Hay dos tipos de CCI, de Consistencia y de Acuerdo. La diferencia entre ambos y con el
coeficiente de correlación de Pearson se observa analizando la relación entre las variables X e
Y en los 4 ejemplos de la Figura 6.5 que se muestra a continuación. Cuando las valoraciones de
X e Y son idénticas, los tres coeficientes valen 1.

100
Paseo de la Habana 9-11. Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

CCI de Consistencia, CCIC.


Valora consistencia o coherencia (consistency). No considera discrepancias las diferencias de
tipo aditivo . Los ejemplos A y B de la Figura presentan el mismo CCIC. En este caso el ejemplo
B da un valor máximo de 1, teniendo en cuenta que los valores de Y difieren en 5 unidades de
los de X . Lo mismo sucede en los ejemplos C y D. Se comporta como un índice de aditividad que
valora si es aplicable la transformación Y = Constante + X. Al igual que el r de Pearson no detecta
una diferencia constante entre dos series de observaciones . Pero a diferencia del r de Pearson
sí es sensible a diferencias de tipo proporcional. El r de Pearson se comporta como un índice de
linealidad que valora si es aplicable la transformación Y = Constante + Pendiente X

CCI de Acuerdo, CCIA.


Valora acuerdo absoluto (absolute agreement). Contempla como discrepante cualquier tipo de
diferencia entre las valoraciones , ya sea constante , proporcional o de otro tipo . Cuantas más
fuentes de discrepancia haya y mayor sea, mas bajo será el valor del CCIA. Valora si es aplicable
la transformación Y = X.

Figura 6.5 Coeficientes de correlación: Pearson (r), CClc, CCIA

--\) Conc ordn nci .1 tota l B) Discordancia cons tante


Y=X y= ..
Yl =X Y2 = X- 5
Correlación r de Pearson . . .. . 1.0 Correlación r de Pearson ... . . 1.0
CI de onsistencia .. .. .... . 1,0 CI de n istencia . . . . . . . .. 1,0
CCI de Acuerdo Absoluto ... 1.0 CCI de cuerdo Ab oluto .. 0.94

;:

)O

X
. . ,o
X
,. . .

...,.

10 ,.
X
)O . 10

X
.
C) Disconlancia ¡u-oporcio na l D) Disconlancia proporcional \" constante
Y=X Y=X
YJ =X / 2 Y-l=X / 2 - 5
orrelación r de Pearson .. .. . . LO Correlación r de Pearson . .. ... 1.0
CCI de Consiste ncia . . . . . . . . . 0.80 CCI de Consistencia . . ...... . . O. O
CCI dt: Acuerdo bsoluto . . . 0 ,50 CCI de b · luto ... 0.36

GoBIR 101
Paseo de la Habana 9-11, ,\tfadnd. 911 61 0 039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

3. VALIDEZ DE UNA PRUEBA DIAGNÓSTICA


En todo estudio es importante la correcta identificación de los casos que presentan la enfermedad
o evento de interés. Una prueba diagnóstica clasifica a los sujetos en dos grupos:

Pruebas positivas • enfermos


Pruebas negativas • no enfermos (sanos)

Las pruebas se considerarán válidas, siempre y cuando se realice esta clasificación con pocos
errores comparados con la prueba de referencia a la que se denomina "gold standar''.

La validez, exactitud o capacidad diagnóstica de una prueba para un determinado punto de


corte se evalúan mediante la sensibilidad y la especificidad, que son probabilidades
condicionadas .

,o
Estado

Prueba No enfermo Enfermo


Negativo VN FN
Positivo FP VP
Total VN+FP FN+VP

• Verdadero positivo (VP)


Sujetos enfermos diagnosticados como enfermos.

• Verdadero negativo (VN)


Sujetos sanos diagnosticados como sanos.

• Falso positivo (FP)


Sujetos sanos diagnosticados como enfermos . Es la proporción de sanos con prueba positiva .
La probabilidad de cometer este error se denomina a.

• Falso negativo (FN)


Sujetos enfermos diagnosticados como sanos. Es la proporción de enfermos con prueba
negativa . La probabilidad de cometer este error se denomina ~-

La precisión hace referencia a la ausencia de error aleatorio. Es el grado de


proximidad entre valores obtenidos en una serie de medidas analizadas bajo las
mismas condiciones (QIR-2009). La precisión intermedia o interdía hace
referencia a variaciones obtenidas en un mismo laboratorio bajo condiciones
distintas (distintos días , equipos, analistas) (OIR-2004).

La exactitud hace referencia a la ausencia de error sistemático. Mide la


concordancia entre el valor del resultado obtenido y el valor real (QIR-2004) .

GoBIR 102
Paseo de la Habana 9-11 . Madrid. 911 610 039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

Sensibilidad (S) (FIR-2001; 2002; 2013) (O IR-2013)


Proporción de diagnósticos positivos obtenidos al aplicar la prueba en una población de sujetos
con la enfermedad. Es la proporción de enfermos correctamente identificados por la prueba.
Es la capacidad del test para detectar a los enfermos .

1 S = VP/(FN+VP) 1

Especificidad (E) (BIR-2001; 2006; 2014) (FIR-2001; 2016 ; 2017) (OIR-2013 ; 2015)
Proporción de diagnósticos negativos obtenidos al aplicar la prueba en una población de sujetos
con la enfermedad . Es la proporción de sanos correctamente identificados. Es la capacidad
del test para detectar a los sanos.

1 E = VN/(VN+FP) 1

El Valor Global (VG)


Es la proporción de sujetos diagnosticados correctamente, es decir, el cociente de VP y VN
entre el total de sujetos:

1 VG = (VP+VN)/(VP+FN+VN+FP)

Ejemplo: Calcular la sensibilidad y especificidad en el siguiente ejemplo:

Estado

Prueba No enfermo Enfermo


Negativo 2 o
Positivo 78 54
Total 80 54

Solución: S = 54/54 =1

E = 2/80 =0,02

Interpretación: Es una prueba extraordinariamente sensible (en todos los enfermos da positivo),
pero muy inespecífica .

A tener en cuenta:

A) Punto de corte seleccionado:

Cuando la prueba proporciona un resultado cuantitativo, estos índices dependerán del punto de
corte seleccionado, es decir, el valor de la prueba a partir del cual vamos a considerar que un
sujeto presenta o no la enfermedad.

GoBIR 103
Paseo de la Habana 9-11, Madrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

Figura 6.6 Relación índices de validez y punto de corte.

< + sensibilidad 1 + especificidad >


Punto de corte

Valores
Negativos Positivos

Falsos negativos Falsos positivos

• En las pruebas muy sensibles, se elige un punto de corte bajo . Aumentan la


sensibilidad y los FP, pero disminuyen la especificidad (FIR-2000) y los FN, como
puede apreciarse en el dibujo . La mayoría de individuos son correctamente
diagnosticados, pero a costa de una mayor proporción de no enfermos que serán
diagnosticados como enfermos. Se elige una prueba muy sensible cuando se quiere
evitar un resultado FN: la enfermedad es grave pero curable, tiene tratamiento o un FP
no supone ningún traumatismo psicológico ni económico . El prototipo sería una
enfermedad infecciosa grave que tenga tratamiento eficaz.
• En las pruebas muy específicas se elige un punto de corte alto. Aumentan la
especificidad y los FN pero disminuyen la sensibilidad y los FP. La mayoría de sanos son
identificados como tales por la prueba, pero a costa de aumentar la proporción de
enfermos no detectados por la misma. Se elige una prueba muy específica cuando se
quiere evitar un resultado FP: la enfermedad es grave e incurable , es importante sanitaria
y psicológicamente saber que no se padece la enfermedad y un FP supone un trauma
psicológico o económico (por ejemplo el diagnóstico de la infección por el VIH) o el
resultado indicará una cirugía arriesgada (por ejemplo, cáncer de pulmón que requiera
lobectomía).

B) Prevalencia.
Estos índices son independientes de la prevalencia de la enfermedad, puesto que sólo se tienen
en cuenta para su cálculo sujetos enfermos (sensibilidad) o sujetos sanos (especificidad). Sin
embargo, las características de los pacientes de la muestra a los que se les aplicará la prueba,
pueden guardar relación con la prevalencia de la enfermedad y con la sensibilidad y especificidad
de una muestra concreta. Por ejemplo:
La sensibilidad de un marcador tumoral medido en pacientes con fases avanzadas del cáncer es
superior a la medida en una muestra con cáncer de escasa evolución.

Los valores aceptables de estos índices dependen del tipo de patología que se estudia y
de los objetivos de la prueba diagnóstica. Una prueba tiene una exactitud aceptable si su
sensibilidad y especificidad alcanzan el umbral de 0,8 (80%).

GoBIR 104
Pas eo de la Habana 9- 11, 1\tfadrid. 9116 10039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

RAZONES DE VEROSIMILITUD

Las Razones de Verosimilitud (Likelihood Ratios, LR) para positivos (RVP) y para negativos
(RVN) también valoran la validez o exactitud diagnóstica de una prueba, pero con la ventaja de
relacionar en una sola medida la sensibilidad y la especificidad .

• Razón de verosimilitud para positivos (RVP) o de un resultado positivo.


Es el cociente entre la proporción de resultado positivo entre enfermos (S) y la proporción de
resultado positivo entre los no enfermos (1-E) . Es la razón de proporciones de prueba positiva
entre los enfermos y los no enfermos. Es la más utilizada en la práctica clínica, por lo que en el
ámbito de la Medicina Basada en la Evidencia (MBE) se la llama genéricamente "razón de
verosimilitud".

1 RVP = S/(1-E) 1

• Razón de verosimilitud para negativos (RVN) o de un resultado negativo .


Es el cociente entre la proporción de resultado negativo en los enfermos (1-S) y la proporción
de resultado negativo en los no enfermos (E). Es la razón de proporciones de prueba negativa
entre los enfermos y los no enfermos Interesa que esté lo más próximo posible a O. La RVN es
poco informativa, por lo que se define su inverso RVN* = E/(1-S)

Curva ROC.

La Sensibilidad y la Especificidad dan una medida de la exactitud de una prueba diagnóstica para
un determinado punto de corte cuyo valor depende del contexto en el que se aplique la prueba.
Una medida más global para evaluar la validez diagnóstica de una prueba para el conjunto de
todos los posibles puntos de corte se obtiene mediante la curva COR (Características Operativas
para el Receptor) o curva ROC (Receiver Operating Characterístic). Una curva ROC se construye
calculando la Sensibilidad y la Especificidad para todos los posibles puntos de corte y
representando la Sensibilidad en el eje de ordenadas Y, y el complementario de la Especificidad
(1-E) en el de abscisas X . La estimación no paramétrica de la curva ROC se dibuja uniendo los
pares de puntos (S;1 - E) correspondientes a cada punto de corte con una función escalonada.
El gráfico de la curva ROC ofrece una imagen visual de la validez diagnóstica de la prueba, que
oscila entre estos dos extremos:

Discriminación perfecta

Prueba con validez diagnóstica perfecta (S = 1; E = 1). Tiene probabilidad 1 de diagnosticar


correctamente a un enfermo y a un sano. La curva ROC ocupa los lados izquierdo y superior del
gráfico .

Discriminación nula

Prueba sin validez diagnóstica (S = 0,5 ; E = 0,5). Tiene una probabilidad de 0,5 de identificar
correctamente a un enfermo y a un sano , que es la probabilidad que le corresponde simplemente
por azar. La curva ROC ocupa la diagonal principal del gráfico .

GoBIR 105
Paseo de la Habana 9-11, J\,·ladrid. 911 610 039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

Figura 6. 7 Curva ROC.

0, 0 0,2 0,4 0,6 0,8 1, 0


1 • Espe cificidad

Área bajo la curva ROC: En inglés AUC (Area Under Curve), es una media de la validez o
exactitud global de la prueba. Su valor oscila entre 0,5 (nulo valor diagnóstico) y 1 (máximo valor
diagnóstico).
Es posible comparar dos pruebas diagnósticas dibujando sus curvas ROC en el mismo gráfico y
calculando sus AUC. La mejor prueba será aquella que se acerque más a los lados izquierdo y
superior del gráfico y cuya AUC sea mayor.

La curva ROC proporciona una imagen gráfica que ayuda a escoger el punto de corte óptimo,
pero su selección no es fácil porque supone asignar el coste de los falsos positivos (CFP) y el
coste de los falsos negativos (CFN) y es necesario conocer la prevalencia de la enfermedad en
el ámbito de aplicación de la prueba.

4. VALOR PREDICTIVO DE UNA PRUEBA.


Cuando una prueba diagnóstica se usa en diferentes contextos clínicos, se conoce el resultado
de la prueba (positiva o negativa) y a partir de esa información se quiere conocer las posibilidades
que tiene el sujeto de presentar o no la enfermedad. Para ello es necesario conocer los Valores
Predictivos de una prueba diagnóstica, que evalúan su comportamiento al utilizarse en
diferentes contextos clínicos.

El Valor Predictivo Positivo (VPP) (F IR-2001)


Es la proporción de enfermos en el total de resultados positivos:

1 VPP = VP/(VP+FP)

Indica la probabilidad de que una persona con un resultado positivo tenga en realidad la
enfermedad.

El Valor Predictivo Negativo (VPN)


Es la proporción de no enfermos en el total de resultados negativos:

1 VPN = VN/(VN+FN)

Indica la probabilidad de que una persona con un resultado negativo no tenga en realidad
la enfermedad.

Go51R 106
Paseo de la Habana 9- 11, M adrid 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

Estado

Prueba No enfermo Enfermo Total

Negativo 48 5 53

Positivo 2 45 47

En el ejemplo, VPP = 45/47 = 0,957, el 95,7% de los casos con una prueba positiva son realmente
diabéticos.

En el ejemplo, VPN =48/53 = 0,906. El 90,6% de los casos con una prueba negativa realmente
no son diabéticos .

La Prevalencia (P) es la proporción de enfermos respecto al total. También se define como la


probabilidad pre-test de estar enfermo .

1 P = (VP+FN)/(VP+FN+VN+FP).

Es la probabilidad previa o a priori de enfermedad. En el ejemplo, P =(45+5)/100 =0,50. El 50%


presenta la enfermedad .

Valores Predictivos y Prevalencia

Los valores predictivos son una buena medida de la utilidad clínica global de la prueba porque
incorpora información tanto de la prueba (Sensibilidad y Especificidad) como de la población a la
que se aplica la prueba (Prevalencia). Los obtenidos en una muestra concreta son los valores
predictivos de la prueba cuando se aplica a una población con una determinada prevalencia P
de la enfermedad. El comportamiento de la prueba cambia al hacerlo la prevalencia de la
enfermedad en la población en la que se aplica la prueba.

• El VPP aumenta cuando:


o Aumenta la prevalencia (si hay un mayor número de enfermos, la probabilidad
de que el positivo sea real es mayor) .
o Aumenta la especificidad (si somos más "exigentes" para el diagnóstico de la
enfermedad, disminuyen los falsos positivos y por tanto, los resultados positivos
serán principalmente verdaderos positivos).
• El VPN aumenta cuando :
o Disminuye la prevalencia (si hay un menor número de enfermos , la probabilidad
de que el negativo sea real es mayor).
o Aumenta la sensibilidad (si somos menos "exigentes" para el diagnóstico de la
enfermedad, disminuyen los falsos negativos y por tanto, los resultados
negativos serán principalmente verdaderos negativos).

Teorema de Bayes
Permite determinar los valores predictivos (que serían probabilidades a posteriori) de una prueba
a partir de la S y la E de la prueba y la P ó probabilidad previa de la enfermedad de la probabilidad
a la que se aplica. Las fórmulas de cálculo son:

VPP = PxS/(PxE+(1-P)x(1-S)]

GoBIR 107
Pas eo de la Habana 9- 11, iWadrid. 9 11 610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

VPN = (1-P)xS/[Px(1-S)+(1-P)xS]

Su aplicación es imprescindible si conocidas la S y la E de una prueba se quiere ver su


comportamiento al aplicarla a poblaciones con diferente prevalencia.

PROBABILIDADES

Definimos el espacio muestra( como el conjunto de todos los resultados posibles de un


experimento. Cada elemento del espacio muestra! se llama suceso elemental (es decir,cada
uno de los resultados que puede haber). Al subconjunto del espacio muestra! se le denomina
suceso aleatorio (QIR-2002) . El resultado obtenido tras llevar a cabo el experimento es la
observación.

La probabilidad es una medida de incertidumbre. Es el cociente entre el número de casos


favorables (A) y todos los casos posibles si todos son igualmente verosímiles. Toma valores de
O y 1.
Nº de resultados favorables
P de un evento = ------------
Nº de resultados posibles

Ej . Probabilidad de sacar "cara" al tirar una moneda:


Los casos posibles son "cara" (A) y "cruz" (B).
El caso favorable es "cara"(A)

P(A) 1
P(A) = p (A + B) = 2 = 0,5 = 50%
La probabilidad de sacar cara al tirar una moneda será del 50%.

Probabilidad de dos sucesos mutuamente excluyentes (QIR-2004) : cuando ocurre un suceso


A , se impide la ocurrencia del proceso B.
P(A n B) = P(AB) = O
La probabilidad de que ocurra un suceso es igual a la suma de las probabilidades por separado.
P(A u B) = P(A) + P (B)
Probabilidad de dos sucesos no mutuamente excluyentes: cuando ocurre un suceso A, no
se impide que ocurra el suceso B.
P(A u B) = P(A) + P (B) - P(A n B)

Probabilidad de dos sucesos aleatorios independientes (FIR-2004) : La probabilidad de cada


uno de ellos no está influenciada porque el otro suceso ocurra o no.
P(A n B) = P(A). P(B)

Probabilidad condicionada (QIR-2006) : P( Aj8 ) = P~c~:) Siempre que P (B)>O


Es la probabilidad de que ocurra un evento A, sabiendo que también sucede otro evento B o
dicho de otra forma como ocurriendo un suceso B se modifica la probabilidad de que ocurra un
suceso A.

Ej.: si se tira un dado, la probabilidad de obtener el número "2" es 1/6. Pero si se sabe que al tirar
el dado ha salido un número par sin saber de qué número se trata, la probabilidad de que sea un
"2" ya no es la anterior sino que será de 1/3.

P("2" n nº par) P("2") 1/6


P( 2/nºpar) = P (par) = P ("2,4,6") = 3/6 = l/ 3

GoBIR 108
Paseo de la Habana 9- 11 . 1\tfadrid. 911610039
ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA ESTADÍSTICA

Teorema de Bayes

Expresa la probabilidad condicional de un evento aleatorio A dado B con la probabilidad


condicional del evento B dado A, es decir vincula la probabilidad de A dado B con la probabilidad
de B dado A. Ej .: sabiendo la probabilidad de tener un dolor de cabeza dado que se tiene gripe,
se podría saber (si se tiene algún dato más), la probabilidad de tener gripe si se tiene un dolor
de cabeza.

B
P(Al). P(Al)
p(AljB) = B B
P(Al) . P (Al)+ P(A2). P(Az) _J
. 1
\ _)

1_· '
( )

GoBIR 109
Paseo de la Habana 9-11, M adrid. 911610039
GoBIR
PREGUNTAS ESTADÍSTICA

OFICIALES

Página 1: Preguntas oficiales BIR desglosadas

PROPIAS

Página 19: Preguntas propias 1

Página 59: Preguntas propias 2


BIR Oficiales Asignatura: Estadística

ESTADÍSTICA
BIR 00 RC:5
86. ¿Qué estadístico utilizaría para comparar la
variabilidad de dos métodos de medición de glucosa que 92. Los índices descriptivos que resumen la información de
utilizan unidades de medida diferentes?: una población se denominan:

l. Desviación estándar. l. Estimadores.


2. Error estándar. 2. Parámetros.
3. Varianza. 3. Estadísticos.
4. Coeficiente de variación. 4. Variables.
5. Rango de amplitud. S. Índices muestrales.

BIR00 RC:4 BIR 00 RC:2

87. ¿Cuál de los siguientes tests estadísticos permite 93. La capacidad de un test de hipótesis para detectar
comprobar si los datos de una muestra siguen una diferencias significativas cuando realmente existen se
distribución normal?: denomina:

l. T de student. l. Error alfa.


2. Welch. 2. Error alfa más error beta.
3. Kolmogorov-5mirnov. 3. Error beta.
4. Levene. 4. Potencia o sensibilidad.
S. Bartlett. S. Especificidad.

BIR 00 RC:3 BIR 00 RC:4

88. NO es una medida de asociación: 94. Cuando a todos los datos de una muestra se les
multiplica por 10, la:
l. Coeficiente de correlación.
2. Riesgo relativo. l. Media aumenta en 100.
3. Coeficiente de correlación de 5pearman. 2. Media no varía.
4. Odss ratio 3. Varianza aumenta en 10.
S. Coeficiente de variación. 4. Desviación típica no varía.
S. Desviación típica aumenta en 10.
BIR00 RC:5
BIR 00 RC: Anulada
89. Los test de hipótesis no paramétricos se utilizan
cuando: 95. En un grupo de pacientes diabéticos se mide el nivel de
glucosa antes y después de un tratamiento. ¿Qué test
l. La variable se distribuye normalmente. estadístico permitiría comprobar la eficacia del
2. La variable se mide en escala de intervalo. tratamiento suponiendo que la variable no se distribuye
3. El tamaño muestra! es grande. normalmente?:
4. La variable no se distribuye normalmente.
5. La variable sigue una distribución f de Fisher-Snedecor. l. Wilcoxon de muestras apareadas.
2. U de Mann-Whitney de muestras apareadas.
BIR 00 RC:4 3. Kolmogorov-Smirnov de muestras independientes.
4. U de Mann-Whitney de muestras independientes.
90. Si en una muestra la medida aritmética es menor que 5. Wilcoxon de muestras independientes.
la mediana:
BIR 00 RC:l
l. La muestra es asimétrica negativa.
2. La muestra es simétrica. 96. El test estadístico más adecuado para medir la
3. El SO% de los valores son menores que la media. intensidad de asociación entre el peso (Kg) y el nivel de
4. La muestra es asimétrica positiva. colesterol (mg/l00ml) en un grupo de 100 individuos es:
5. Más del SO% de los valores son menores que la mediana.
1. T de student de muestras independientes.
BIR 00 RC: Anulada 2. Chi-cuadrado.
3. T de student de muestras apareadas.
91. ¿Cuál de los siguientes estadísticos es de forma?: 4. Correlación r de Pearson.
5. U de Mann-Whitney.
l. Mediana.
2. Moda. BIR 00 RC:4
3. Cuartil.
4. Percentil.
S. Coeficiente de curtosis.
BIR Oficiales Asignatura: Estadística

97. En una muestra de 30 individuos se ha medido la los pacientes, la interacción (fármaco x sexo) presenta una
presión arterial (mm Hg) y la presencia de antecedentes p=0,015. Se interpreta que el:
familiares de infarto (SI/NO). Estas variables son,
respectivamente: l. Efecto del fármaco es mejor en hombres.
2. Efecto del fármaco depende del sexo de los pacientes.
l. Cuantitativa discreta y cualitativa nominal. 3. Efecto del fármaco no depende del sexo de los pacientes.
2. Cuantitativa continua y cualitativa ordinal. 4. Fármaco es solo efectivo en mujeres.
3. Cuantitativa continua y cualitativa discreta. 5. Fármaco no es efectivo.
4. Cuantitativa discreta y cualitativa nominal.
5. Cuantitativa continua y cualitativa nominal. BIR 01 RC:2

BIR 00 RC:5 87 .¿Cuál de las siguientes variables es cualitativa


nominal?:
98. En un grupo de 20 individuos se ha medido la tension
arterial (mm Hg) y la edad (años). ¿Qué estadístico se l. Edad.
utiliza para comparar la dispersion relativa de ambas 2. Grupo sanguíneo.
variables?: 3. Evolución de una enfermedad {buena, intermedia, mala).
4. Presión arterial.
l. Error estándar. 5. Escala de ansiedad {de O a 6).
2. Varianza.
3. Desviación estándar. BIR 01 RC:2
4. Coeficiente de curtosis.
5. Coeficiente de variación. 88. A la desviación estándar de una distribución de medias
se denomina:
BIR 00 RC:5
l. Error estándar de la desviación.
99. El test estadístico más adecuado para comprobar si 2. Desviación media.
existen diferencias en el nivel sérico de una proteína entre 3. Error aleatorio.
hombres y mujeres, suponiendo que la variable se 4. Varianza.
distribuye normalmente es: 5. Error estándar de la media.

l. T de student de muestras apareadas. BIR 01 RC:5


2. Wilcoxon.
3. Kruskal-Wallis. 89. Para comparar la variabilidad relativa de la pres1on
4. T de student de 2 muestras independientes. arterial {mmHg) y el nivel de colesterol (mg/lOOml) en un
5. U de Mann-Whitney. grupo de 70 individuos se utiliza:

BIR 00 RC:4 l. El coeficiente de correlación r de Pearson.


2. La desviación estándar.
100. El rango o amplitud es un estadístico de: 3. El coeficiente de variación.
4. La Varianza.
l. Posición. 5. El coeficiente de asociación.
2. Tendencia central.
3. Centralización. BIR 01 RC:3
4. Dispersión.
5. Forma. 90. En la ecuación de regresión lineal (PA=104 + 1,8 x
edad) que permite predecir la presión arterial (PA) en
BIR 00 RC:4 función de la edad:

254. En la ecuación de regresión (y=2,95+0,8x), el l. Por cada año de edad, la presión arterial Disminuye en
coeficiente 2,95 significa: 1,8 mm Hg.
2. La edad es la variable dependiente.
l. Por cada unidad de cambio de las variables X, la variable 3. 104 corresponde a la pendiente de la recta.
Y aumenta 2,95. 4. La presión arterial es la variable independiente.
2. Es el punto de intersección de la recta de regresión con el 5. Por cada año de edad, la presión arterial aumenta en 1,8
eje de ordenadas. mmHg.
3. Si X=0 la variable Y será 0,8.
4. Es el valor de la variable Y cuando la variable X vale 0,8. BIR 01 RC:5
5. Es la pendiente de la recta de regresión.
91. Para comprobar si un fármaco disminuye el nivel de
BIR 00 RC:2 glucosa en un grupo de 40 pacientes diabéticos, el test
estadístico más adecuado es:
86. Al comprobar mediante una Anova de dos vías si el
efecto de un determinado fármaco depende del sexo de l. T de student de 2 muestras apareadas.
2. McNemar.

2
BIR Oficiales Asignatura: Estadística

3. U de Mann-Whitney.
4. T de student de dos muestras independientes. l. Varianza entre la media.
5. Test exacto de Fisher. 2. Media entre la Varianza.
3. Media entre la desviación estándar.
BIR 01 RC:1 4. Desviación estándar entre el número de individuos.
5. Desviación estándar entre la media.
92. ¿Cuál de los siguientes test estadísticos es de
comparaciones multiples?: BIR 01 RC:5

l. Tukey-HSD. 98. La varianza muestra!:


2. Kolmogorov-Smirnov.
3. Shapiro-Francia. l. Es un estadístico adimensional.
4. Bartlett. 2. Su cuadrado es la desviación típica.
5. Shapiro-Wilk. 3. Puede tomar valores negativos.
4. No tiene en cuenta a todos los datos de la muestra.
BIR 01 RC: 1 5. Su raíz cuadrada es la desviación estándar.

93. Se realizará un test de dos muestras independientes BIR 01 RC:5


bilateral o de dos colas, para comprobar si de dos
tratamientos (A y B): 99. Al aumentar la amplitud de un intervalo de confianza
para estimar un parámetro:
l. A es mejor que B.
2. A y B tienen distinto efecto. l. Aumenta la precision de la estimación.
3. A y B no tienen ningún efecto. 2. Disminuye el parámetro estimado.
4. A es peor que B. 3. Aumenta el parámetro estimado.
5. A no tiene ningún efecto. 4. Disminuye la precision de la estimación.
5. Disminuye el tamaño muestra!.
BIR 01 RC:2
BIR0l RC:4
94. Para comparar el nivel de colesterol sérico, en cuatro
grupos de individuos de distinta edad, el test estadístico 100. La capacidad d una prueba diagnóstica para detectar
más adecuado es: como sano un individuo que realmente está sano, se
denomina:
l. Test exacto de Fisher.
2. U de Mann-Whitney. l. Especificidad.
3. T de student de muestras independientes. 2. Valor predictivo positivo.
4. Análisis de la Varianza. 3. Sensibilidad.
5. Wilcoxon. 4. Valor predictivo negativo.
5. Falso positivo.
BIR 01 RC:4
BIR0l RC: 1
95. Si tras un tratamiento, el 60% de un grupo de
pacientes sobreviven 4 años o menos: 254. El rango o amplitud es un estadístico de:

l. El percentil 4 es 60. l. Posición.


2. El percentil 60 es 4. 2. Tendencia central.
3. El percentil 60 es mayor que 4. 3. Centralización.
4. El percentil 4 es mayor que 60. 4. Dispersión.
5. El percentil 4 es menor que 60. 5. Forma.

BIR 01 RC:2 BIR 01 RC:4

96. En un test de hipótesis un nivel de significación del 5% 146. Al punto medio de un intervalo en una tabla de
indica que: distribución de frecuencias se le denomina:

l. El error beta es del 5%. l. Límites de intervalo.


2. La potencia del test es del 5%. 2. Marcas de clase.
3. La potencia del test es del 95%. 3. Amplitud de intervalo.
4. Sólo un 5% de veces se rechazará la hipótesis nula siendo 4. Recorrido de intervalo.
cierta. 5. Rango de clase.
5. Un 5% de veces no se rechazará la hipótesis nula.
BIR 02 RC:2
BIR 01 RC: 4
147. El estadístico de dispersión que debe acompañar a la
97. El coeficiente de variación se calcula dividiendo la: mediana para describir muestras asimétricas es:

3
BIR Oficiales Asignatura: Estadística

BIR 02 RC:5
l. Desviación estándar.
2. Error estándar. 153. Para comparar el nivel de sérico de una proteína en
3. Coeficiente de variación. cinco grupos de individuos de distinta edad, el test
4. Rango intercuartílico. estadístico más adecuado es:
5. Varianza.
l. Friedman.
BIR 02 RC:4 2. U de Mann-Whitney.
3. T de student de muestras independientes.
148. El percentil 95 de la talla de recién nacidos de una 4. Análisis de la varianza.
población es 48cm. En esa población: 5. Wilcoxon.

l. El 1% de los recién nacidos mide 48 cm. BIR 02 RC: 4


2. El 5% de los recién nacidos mide 48 cm.
3. El 1% de los recién nacidos mide más de 48 cm. 154. ¿Cuál de los siguientes estadísticos puede ser
4. El 5% de los recién nacidos mide más de 48 cm. NEGATIVO:
5. El 5% de los recién nacidos mide menos de 48 cm.
l. Desviación típica.
BIR02 RC:4 2. Covarianza.
3. Varianza.
149. Al disminuir la amplitud de un intervalo de confianza 4. Coeficiente de variación.
para estimar un parámetro: 5. Error típico.

l. Aumenta la precision de la estimación. BIR 02 RC: 2


2. Disminuye el parámetro estimado.
3. Aumenta el parámetro estimado. 155. Para medir la asociación entre dos variables
4. Disminuye la precision de la estimación. cualitativas se utiliza el test de:
5. Disminuye el tamaño muestra!.
l. Regresión lineal simple.
BIR 02 RC: 1 2. Regresión lineal multiple.
3. Wilcoxon.
150. Para comprobar si el ejercicio físico produce un 4. Contingencia de chi-cuadrado.
descenso de la presión arterial (mmHg), se mide ésta en 5. Correlación de Pearson.
cada uno de 10 individuos antes y después de un
entrenamiento. ¿Qué test estadístico utilizaría?: BIR02 RC: 4

l. T de student de 2 muestras independientes. 156. Si en una muestra la media aritmética es menor que
2. T de student de 10 muestras independientes. la mediana:
3. T de student de 10 muestras apareadas.
4. T de student de 2 muestras apareadas. l. La muestra es asimétrica negativa.
5. Chi-cuadrado. 2. La muestra es simétrica.
3. El 50% de los valores son menores que la media.
BIR02 RC:4 4. La muestra es asimétrica positiva.
5. Más del 50% de los valores son menores que la mediana.
151. El intervalo de confianza al 95% para estimar la media
poblacional es la media muestra! ±: BIR 02 RC:1

l. 1 error estándar. 157. En la ecuación de regresión (y = 1,92 + 0,2x), el


2. 1,96 errores estándar. coeficiente 1,92 significa:
3. 1,96 desviaciones estándar.
4. 2,58 errores estándar. l. Por cada unidad de cambio de la variable X, la variable Y
5. 2,58 desviaciones estándar. aumenta 1,92.
2. Es el punto de intersección de la recta de regresión con el
BIR 02 RC:2 eje de ordenadas.
3. Si X=O la variable Y será 0,2.
152. El coeficiente de correlación r de Pearson: 4. Es el valor de la variable Y cuando la variable X vale 0,2.
5. Es la pendiente de la recta de regresión.
l. Permite medir la asociación entre dos variables
ordinales. BIR 02 RC:2
2. Oscila entre O y l.
3. Oscila entre O e infinito. 158. En un grupo de 15 pacientes se mide el nivel de
4. Permite medir la asociación entre 2 variables nominales. colesterol antes y después de un tratamiento. ¿Qué test
5. Permite medir la asociación entre dos variables estadístico permitirá comprobar la eficacia del
cuantitativas. tratamiento suponiendo que la variable no se distribuye
normalmente?:

4
BIR Oficiales Asignatura: Estadística

BIR 03 RC:4
l. Wilcoxon de muestras apareadas.
2. U de Mann-Whitney de muestras apareadas. 78. Los coeficientes de asimetría y de curtosis son
3. Kolmogorov-Smirnov de muestras independientes. estadísticos de:
4. U de Mann-Whitney de muestras independientes.
S. Wilcoxon de muestras independientes. l. Posición.
2. Forma.
BIR 02 RC:1 3. Dispersión.
4. Centralización.
159. Para comparar la presión arterial entre un grupo de S. Tendencia.
no fumadores, uno de ex-fumadores y otro de fumadores,
el test estadístico más adecuado, suponiendo que la BIR 03 RC:2
variable no se distribuye normalmente, es:
79. NO es necesario para realizar un test de t de Student
l. Anova de dos vías. de dos muestras independientes con {nl + n2)-2 grados de
2. Kruskal-Wallis. libertad que:
3. Wilcoxon.
4. Anova de 1 vía. l. Las varianzas de ambas muestras sean del mismo orden.
S. U de Mann-Whitney. 2. Las dos muestras deban tener igual tamaño.
3. Las dos muestras deban estar constituidas por individuos
BIR02 RC:2 distintos.
4. La variable deba distribuirse normalmente.
160. Cuando el 30% de un grupo de pacientes sobrevive 3 S. La variable en estudio deba ser cuantitativa.
años o menos tras un tratamiento, el percentil:
BIR 03 RC:2
l. 3 es 30.
2. 30 es 3. 80. La distribución de probabilidad utilizada en el test de
3. 30 es mayor que 3. Levene es:
4. 3 es mayor que 30.
S. 3 es menor que 30. l. Chi-cuadrado.
2. F de Fisher-Snedecor.
BIR 02 RC:2 3. t de Student.
4. z.
256. En un grupo de 50 individuos se ha medido la talla S. Binomial.
(cm) y el peso {Kg). Para comparar la dispersión relativa de
ambas variables se utiliza: BIR 03 RC:2

l. El error estándar de la media. 81. Suponiendo que la variable se distribuye


2. El coeficiente de variación. normalmente, el test estadístico más adecuado para
3. El rango o amplitud. comprobar si existen diferencias en el nivel sérico de un
4. La varianza. metabolito entre hombres y mujeres es:
S. La desviación estándar.
l. t de Student de muestras apareadas.
BIR 02 RC:2 2. Wilcoxon.
3. Kruskal-Wallis.
76. NO se expresa en las mismas unidades que la variable 4. t de Student de 2 muestras independientes.
en estudio: S. U de Mann-Whitney.

l. Media. BIR 03 RC:4


2. Mediana.
3. Desviación típica. 82. Al realizar un test de hipótesis:
4. Rango.
S. Varianza. l. Se pueden cometer 3 tipos de errores.
2. A mayor tamaño muestra!, el test tiene menor potencia.
BIR 03 RC:5 3. A menor error beta, el test tiene mayor potencia.
4. Si aumenta la potencia del test, aumenta el error beta.
77. Al comparar dos medias de muestras independientes, S. A menor error alfa, el test tiene menor especificidad.
el valor de t de Student será O cuando:
BIR 03 RC:3
l. Al menos una muestra sea normal.
2. Las dos muestras sean normales. 83. Si en un experimento se mide una variable en escala
3. Se acepte la hipótesis nula. ordinal, deberá utilizarse un test:
4. Las dos medias muestrales tengan el mismo valor.
S. Se acepte la hipótesis alternativa. l. Seriado.
2. No paramétrico.

5
BIR Oficiales Asignatura: Estadística

3. Bivariante. 2. Grupo sanguíneo.


4. Multivariante. 3. Evolución de una enfermedad.
S. Paramétrico. 4. Sexo.
S. Escala de ansiedad (de O a 4).
BIR 03 RC:2
BIR 03 RC:2
84. NO se refiere a la covarianza:
90. El percentil 50 (P 50 ) coincide con:
l. Es un estadístico de dispersión.
2. Su valor depende de las unidades de medida. l. Mediana y cuartil 3.
3. No puede tomar valores negativos. 2. Mediana y cuartil l.
4. Su valor tipificado es el coeficiente de correlación r de 3. Moda.
Pearson. 4. Media geométrica.
S. Mide la variación conjunta de dos variables cuantitativas S. Mediana y cuartil 2.
continuas.
BIR 03 RC:S
BIR 03 RC:3
258. El rango o amplitud de una muestra se define como:
85. NO se refiere al coeficiente de variación (CV):
l. La semisuma de los datos mayor y menor.
1. Se calcula dividiendo la media por la desviación típica. 2. La diferencia entre los datos mayor y menor aumentada
2. Generalmente su valor se expresa en porcentaje. en una unidad.
3. Se calcula dividiendo la desviación típica por la media. 3. La diferencia entre los datos mayor y central.
4. Mide la dispersión relativa. 4. La diferencia entre los datos central y menor.
S. Es un índice de dispersión adimensional. S. Ninguna es correcta.

BIR 03 RC:1 BIR 03 RC:S

86. Cuando el error de tipo I o error alfa se expresa en 116. El coeficiente de correlación r de Pearson puede
porcentaje se denomina: utilizarse cuando:

1. Potencia del test. l. La relación entre las dos variables continuas no sea lineal.
2. Error típico. 2. La relación entre las dos variables continuas sea lineal.
3. Error crítico. 3. Una de las dos variables no sea continua.
4. Nivel de significación. 4. Se desconozca la distribución de las variables.
S. Nivel de confianza. 5. El número de datos sea muy pequeño.

BIR 03 RC:4 BIR 04 RC:2

87. Para comparar correctamente, desde un punto de vista 117. NO se expresa en las mismas unidades que la variable
descriptivo, la dispersión de 2 o más variables distintas en estudio:
debe utilizarse:
l. Media.
l. La desviación estándar. 2. Mediana.
2. La amplitud. 3. Desviación típica.
3. El coeficiente de variación. 4. Rango.
4. La covarianza. S. Varianza.
5. La desviación media.
BIR 04 RC:S
BIR 03 RC:3
118. Si a cada uno de los datos de una muestra se le
88. Son conceptos que se refieren a la misma probabilidad multiplica por una constante:
el nivel de:
l. La media se multiplica por la misma constante al
l. Confianza y error tipo II. cuadrado.
2. Significación y error tipo l. 2. La media y la varianza se multiplican por la misma
3. Significación y especificidad. constante.
4. Confianza y sensibilidad. 3. La media y la varianza no cambian.
S. Significación y error tipo II. 4. El coeficiente de variación no cambia.
S. La media cambia y la varianza no.
BIR 03 RC:2
BIR 04 RC:4
89. Es una variable cualitativa nominal policotómica:
119. Respecto al test de Kruskal-Wallis NO es correcto:
l. Edad.

6
BIR Oficiales Asignatura: Estadística

l. Es un test no paramétrico. 3. Media.


2. Se utiliza para comparar tres o más distribuciones de 4. Moda.
datos independientes. 5. Mediana.
3. Utiliza la distribución t de Student.
4. Se aplica cuando las muestras son independientes. BIR 04 RC:1
5. Utiliza la distribución chi-cuadrado.
12S. La curtosis es una medida de:
BIR04 RC:3
l. Forma.
120. En la estimación de parámetros, ¿cuál de los 2. Dispersión.
siguientes factores NO influye en la amplitud del intervalo 3. Posición.
de confianza?: 4. Tendencia central.
5. Nada de lo anterior.
l. El error estándar de la media.
2. El nivel de confianza. BIR 04 RC:1
3. El tamaño muestra l.
4. La distribución de probabilidad del estadístico. 126. Shapiro-Wilks es un test de:
5. El parámetro que se pretende estimar.
l. Normalidad.
BIR 04 RC:5 2. Comparaciones múltiples.
3. Contingencia.
121. Si en una muestra de tamaño 40 se eliminan el valor 4. Homogeneidad de varianzas.
máximo y el mínimo, ¿Qué ocurre con la media y la 5. Simetría.
mediana?:
BIR 04 RC:1
l. La media es la misma y la mediana puede cambiar.
2. Ninguna cambia 127. ¿Cuál de los siguientes estadísticos es de posición?:
3. La media puede cambiar pero no la mediana.
4. Las dos pueden cambiar. l. Media geométrica.
5. Si la media cambia también cambia la mediana. 2. Coeficiente de curtosis.
3. Varianza.
BIR 04 RC:3 4. Percentiles.
S. Covarianza.
122. ¿Cuál de las siguientes afirmaciones sobre la media
aritmética NO es cierta?: BIR 04 RC:4

l. Es un estadístico de centralización. 128. El estadístico que permite conocer el grado de


2. Divide siempre a la muestra en dos partes iguales. variación conjunta entre dos variables cuantitativas es:
3. Su valor se ve afectado por los valores extremos de la
distribución. l. La varianza.
4. Es el centro de gravedad de la distribución. 2. La desviación típica.
5. Se calcula sumando todos los valores y dividiendo por el 3. El rango o amplitud.
tamaño de la muestra. 4. La covarianza.
S. El coeficiente de variación.
BIR 04 RC:2
BIR 04 RC:4
123. Se realiza un análisis de regresión lineal simple de la
relación entre la presión arterial (dependiente) y el peso 129. El análisis de la varianza utiliza en sus cálculos la
(independiente) y se obtiene un coeficiente de regresión distribución:
cuyas unidades se expresan en mmHg/Kg. ¿Cómo se llama
también este coeficiente?: l. De Poisson.
2. T de Student.
l. Suma de cuadrados explicados por la regresión. 3. Chi cuadrado de Pearson.
2. Coeficiente de determinación. 4. F de Fisher-Snedecor.
3. Pendiente de la recta. 5. Binomial.
4. Coeficiente de correlación.
5. Nada de lo anterior. BIR 04 RC:4

BIR 04 RC:3 130. Una de las representaciones gráficas utilizadas para


variables cuantitativas continuas es el:
124. ¿ Cuál de los siguientes estadísticos NO es de posición
ni de tendencia central?: l. Sector circular.
2. Pictograma.
l. Rango. 3. Dendrograma.
2. Percentiles. 4. Diagrama de barras.

7
BIR Oficiales Asignatura: Estadística

5. Polígono de frecuencias. 3. La evolución de una enfermedad (buena, intermedia,


mala).
BIR 04 RC:5 4. El sexo.
5. La escala de ansiedad (de O a 4).
256. En una muestra de 20 individuos se ha medido el
peso y la presión arterial. Para comparar la dispersión BIR 05 RC:2
relativa de ambas variables se utiliza:
151. En una Anova de dos criterios con repetición se
l. El error estándar de la media. calculan:
2. El coeficiente de variación.
3. El rango o amplitud. l. Tantas F como número de criterios.
4. La varianza. 2. Tantas F como número de fuentes de variación.
5. La desviación estándar. 3. Una F más que el número de criterios.
4. Una F más que el número de fuentes de variación.
BIR 04 RC:2 5. Dos F.

146. En el test exacto de Fisher: BIR 05 RC:3

l. El número de filas y de columnas no puede ser mayor de 152. Algebraicamente, la varianza muestral se diferencia
3x2. de la poblacional en que:
2. Debe haber por lo menos un 20% de esperados menor de
5. l. Su numerador es n-1 y el de la poblacional es n.
3. Es válido para cualquier teste de contingencia 2x2. 2. Su numerador es n y el de la poblacional es n-1.
4. Es preferible utilizar el test de Chi-cuadrado de Pearson. 3. Su denominador es n-1 y el de la poblacional es n.
5. Casi nunca se puede utilizar. 4. Su denominador es n y el de la poblacional es n-1.
5. No hay diferencias algebraicas.
BIR 05 RC:3
BIR 05 RC: 3
147. El cálculo de la mediana de una muestra necesita:
153. En un test de hipótesis con un error alfa de 0,01:
l. Tipificar los datos.
2. Ordenar los datos de menor a mayor. l. Un 1% de veces se rechazaría la hipótesis nula siendo
3. Calcular previamente la moda. cierta.
4. Calcular previamente la amplitud de la muestra. 2. Un 1% de veces se rechazaría la hipótesis nula siendo
5. Conocer el valor del coeficiente de curtosis. falsa.
3. Un 99% de veces se rechazaría la hipótesis nula siendo
BIR 05 RC:2 cierta.
4. La potencia del test es de 1 %.
148. Para comparar correctamente, desde un punto de 5. Un 99% de veces se rechazaría la hipótesis nula y la
vista descriptivo, la dispersión de 2 o más variables alternativa.
distintas debe utilizarse:
BIR 05 RC:1
l. La desviación estándar.
2. La amplitud. 154. A 25 personas con sobrepeso se mide el peso en Kg
3. El coeficiente de variación. antes y después de un programa de adelgazamiento. ¿Qué
4. La covarianza. test estadístico permitirá comprobar la eficacia del
5. La desviación media. programa suponiendo que la variable no se distribuye
normalmente?:
BIR 05 RC:3
l. Wilcoxon de muestras apareadas.
149. El percentil 50 (P 50 ) coincide con: 2. U de Mann-Whitney de muestras apareadas.
3. Kolmogorov-Smirnov de muestras independientes.
l. Mediana y cuartil 3. 4. U de Mann-Whitney de muestras independientes.
2. Mediana y cuartil l. 5. Wilcoxon de muestras independientes.
3. Moda.
4. Media geométrica. BIR 05 RC:1
5. Mediana y cuartil 2.
155. Para comparar el efecto de dos fármacos (A y B), se
BIR 05 RC:5 realizará un test de dos muestras independientes bilateral
cuando el interés sea comprobar si:
150. Es una variable cualitativa nominal policotómica:
l. A es mejor que B.
l. La edad. 2. A y B tienen distinto efecto.
2. El grupo sanguíneo. 3. A y B no tienen ningún efecto.
4. A es peor que B.

8
BIR Oficiales Asignatura: Estadística

5. A no tiene ningún efecto. 256. El test de Bartlett permite:

BIR 05 RC:2 l. Comparar medias de muestras.


2. Comparar varianzas.
156. Para realizar un test de t de student de dos muestras 3. Analizar la relación entre dos variables continuas.
independientes con (nl+n2)-2 grados de libertad NO es 4. Analizar la relación entre dos variables discretas.
necesario que: 5. Comparar medianas.

l. Las varianzas de ambas muestras deben ser del mismo BIR 05 RC:2
orden
2. Las dos muestras deben tener el mismo tamaño. 146. El riesgo relativo (RR) puede oscilar entre:
3. Las dos muestras deben estar constituidas por individuos
distintos. l. O y l.
4. La variable debe distribuirse normalmente. 2. O e infinito.
5. La variable en estudio debe ser cuantitativa. 3.-lyl.
4. -1 y O.
BIR 05 RC:2 5. 1 e infinito.

157. Los coeficientes de asimetría y de curtosis son BIR 06 RC:2


estadísticos de:
147. En un ensayo clínico, el propósito de un estudio con
l. Posición. enmascaramiento a doble ciego es:
2. Forma.
3. Dispersión. l. Obtener comparabilidad de casos y controles.
4. Centralización. 2. Evitar los efectos del placebo.
5. Tendencia. 3. Evitar los sesgos del observador y del individuo en
estudio.
BIR 05 RC:2 4. Reducir los efectos de la pérdida de seguimiento.
5. Reducir los efectos de la variación de la muestra.
158. Siempre que la variable en estudio siga una
distribución normal, el cociente entre dos variables BIR 06 RC:3
observadas S12 / S22 sigue una distribución:
148. En los métodos de análisis estadístico. ¿Cuál de las
l. Chi cuadrado de Pearson. siguientes escalas de medida proporciona una mayor
2. T de student. cantidad de información?:
3. Uniforme.
4. F de Fisher-Snedecor. l. Nominal.
5. Ninguna es correcta. 2. Ordinal.
3. De intervalo.
BIR 05 RC:4 4. Discreta.
5. De razón.
159. La distribución de probabilidad utilizada en el test de
Levene es: BIR 06 RC: 5

l. Chi-cuadrado. 149. ¿Cómo se denomina a la desviación típica de una


2. F de Fisher-Snedecor. distribución de medias muestrales?:
3. T de Student.
4. z. l. Amplitud.
5. Binomial. 2. Error estándar.
3. Varianza.
BIR 05 RC:2 4. Coeficiente de variación.
5. Moda.
160. El test estadístico más adecuado para determinar si
existen diferencias a nivel sérico de un metabolito entre BIR06 RC:2
hombres y mujeres, suponiendo que la variable se
distribuye normalmente es: 150. Si en una muestra de tamaño par se eliminan el valor
máximo y el mínimo. ¿Qué ocurre con la media y la
l. T de student de muestras apareadas. mediana?:
2. Wilcoxon.
3. Kruskal-Wallis. l. La media es la misma y la mediana puede cambiar.
4. T de student de 2 muestras independientes. 2. Ninguna cambia.
5. U de Mann-Whitney. 3. La media puede cambiar, pero no la mediana.
4. Las dos pueden cambiar.
BIR 05 RC:4 5. Si la media cambia, también cambia la mediana.

9
BIR Oficiales Asignatura: Estadística

156. ¿Qué análisis estadístico permite analizar la


BIR 06 RC:3 influencia simultánea de 3 variables cuantitativas
continuas sobre una variable cuantitativa continua?:
151. ¿Cuál es el efecto sobre la media, desviación típica y
coeficiente de variación si a todos los datos de una l. Correlación de Pearson.
muestra se les suma una constante?: 2. Regresión lineal simple.
3. Regresión lineal múltiple.
l. Ninguno de los estadísticos varía. 4. Test de independencia.
2. La media y el coeficiente de variación se modifican, la 5. Ninguna es correcta.
desviación típica no.
3. La media varía, el resto no. BIR 06 RC:3
4. La media no varía, el resto sí.
5. Los tres estadísticos varían. 157. ¿Cuál de los siguientes métodos estadísticos permite
describir una curva de supervivencia?:
BIR 06 RC:2
l. Kaplan-Meier.
152. Si se comparan dos tratamientos, la hipótesis nula 2. Regresión lineal múltiple.
plantea que: 3. Test de log-rank.
4. U de Mann-Whitney
l. Ambos son efectivos. 5. ANOVA factorial.
2. Ninguno es efectivo.
3. No hay diferencias en la efectividad de ambos. BIR 06 RC: 1
4. Uno es más eficaz que el otro.
5. Hay diferencias en la efectividad de ambos. 158. ¿Qué test estadístico es el más adecuado para
comparar la medias de 3 grupos de individuos cuando la
BIR 06 RC:3 variable en estudio sigue una distribución normal?:

153. El nivel máximo de error alfa admitido habitualmente l. Test de t de Student.


para el establecimiento de diferencias mediante tests de 2. Test de Wilcoxon.
hipótesis es: 3. Test de Kruskall-Wallis.
4. Análisis de la varianza.
l. 68%. 5. Test de U de Mann-Whitney.
2.5%.
3.1%. BIR 06 RC:4
4. 0,01%.
5. 2%. 159. ¿Qué test estadístico es el más adecuado para
evaluar la asociación entre el peso y la presión arterial en
BIR 06 RC:2 un grupo de 100 individuos, cuando ambas variables se
miden cuantitativamente y siguen una distribución
154. Si en una prueba diagnóstica se observan un 5% de normal?:
falsos positivos. ¿Cuál de las siguientes afirmaciones es
cierta?: l. Test de t de Student.
2. Análisis de Correlación de Pearson.
l. La sensibilidad es del 95%. 3. Análisis de la varianza.
2. La especificidad es del 95%. 4. Análisis de Correlación de Spearman.
3. El valor predictivo positivo es del 95%. 5. Test de U de Mann-Whitney.
4. La especificidad es del 5%.
5. La sensibilidad es del 5%. BIR 06 RC:2

BIR 06 RC:2 160. ¿Qué test estadístico es el más adecuado para


comparar el valor de colesterol en mmol/L de un grupo de
155. Se realiza un test de hipótesis para comparar dos personas diabéticas con el de un grupo de personas no
tratamientos en el que se fija un riesgo alfa del 5% y un diabéticas, cuando la variable del estudio no sigue una
riesgo beta del 4%. Si la hipótesis nula fuese cierta. ¿Cuál distribución normal?:
es la probabilidad de cometer un error al aceptar la
hipótesis alternativa?: l. Test de U de Mann-Whitney.
2. Correlación de Pearson.
l. 1- alfa. 3. Test de t de Student de dos muestras independientes.
2. 0,02. 4. Test de t de Student de dos muestras apareadas.
3. 0,99. 5. Análisis de la varianza.
4. 0,05.
5. 1-beta. BIR 06 RC:1

BIR 06 RC:4 256. Si el percentil 95 de la talla de los recién nacidos de


una determinada población es 55 cm, el:

10
BIR Oficiales Asignatura: Estadística

BIR 07 RC:2
l. 95% mide más de 55 cm.
2. 5% mide más de 55 cm. 156. El test estadístico más adecuado para comparar dos
3. 95% mide 55cm. proporciones con muestras apareadas es:
4. 5% mide 55cm o más cm.
5. 95% mide 55 o más cm. l. Chi cuadrado.
2. T de student de muestras apareadas.
BIR 06 RC:2 3. Test de U de Mann-Whitney.
4. Test de McNemar.
151. De las siguientes afirmaciones, NO se refiere al 5. Correlación de Pearson.
coeficiente de variación (CV):
BIR 07 RC:4
l. Se calcula dividiendo la media por la desviación típica.
2. Generalmente su valor se expresa en porcentaje. 157. Deben utilizarse los test estadísticos no paramétricos
3. Se calcula dividiendo la desviación típica por la media. cuando:
4. Mide la dispersión relativa.
5. Es un índice de dispersión adimensional. l. La distribución de la variable es Normal.
2. El tamaño muestra! es >30.
BIR 07 RC: 1 3. La distribución de la variable no es normal o el tamaño
muestra! es pequeño.
152. Son conceptos que se refieren a la misma 4. La variable se mide en una escala de intervalo.
probabilidad el nivel de: 5. La variable se mide en una escala nominal.

l. Confianza y error tipo II. BIR 07 RC:3


2. Significación y error tipo l.
3. Significación y especificidad. 158. Respecto al error alfa NO se puede afirmar que:
4. Confianza y sensibilidad.
5. Significación y error tipo II. l. Es la probabilidad de rechazar la hipótesis nula siendo
verdadera.
BIR 07 RC:2 2. Es la probabilidad de que la hipótesis nula sea verdadera.
3. Es el nivel de significación del test.
153. Para comprobar el efecto del ejercicio físico en un 4. Su valor lo fija el investigador.
grupo de 7 pacientes con enfermedad coronaria en los que 5. Es la probabilidad de cometer un error tipo l.
se mide el máximo de oxígeno consumido por cada uno
antes y después de 10 meses de un programa de BIR 07 RC:2
rehabilitación, utilizaría el test estadístico de:
159. NO influye en la amplitud de un intervalo de
l. Análisis de la varianza. confianza y, por tanto, en la precisión de la estimación:
2. T de Student de muestras apareadas.
3. Wilcoxon de muestras apareadas. l. El nivel de confianza.
4. U de Mann-Whitney. 2. El tamaño muestra!.
5. Chi cuadrado. 3. La dispersión de la muestra.
4. La distribución de probabilidad del estadístico.
BIR07 RC:3 5. El valor del parámetro.

154. El test de Levene: BIR 07 RC:5

l. No es nunca necesario antes de hacer un ANOVA. 160. El error estándar o error típico muestra! es:
2. Se hace siempre después de comprobar la normalidad.
3. Compara medias de las distintas muestras. l. Un parámetro e dispersión.
4. Se realiza para comprobar la homocedasticidad de 2 o 2. Una medida de dispersión de un estadístico.
más muestras. 3. La diferencia entre estimador y estimación.
5. Compara las medianas de las distintas muestras. 4. Un estadístico de dispersión de una muestra.
5. Una medida de asociación.
BIR 07 RC: 4
BIR 07 RC:2
155. ¿Qué medida de asociación se utiliza en un diseño de
cohortes?: 161. En relación con la varianza de una muestra, NO es
cierto que:
l. La Odds ratio.
2. El riesgo relativo. l. Es siempre positiva.
3. El coeficiente de correlación de Pearson. 2. Se mide en unidades al cuadrado.
4. El coeficiente de correlación de Spearman. 3. No tiene en cuenta todas las observaciones.
5. El coeficiente de variación. 4. Su raíz cuadrada es la desviación típica.
5. Es un estadístico de dispersión.

11
BIR Oficiales Asignatura: Estadística

BIR 07 RC:3 146. Para evaluar la concordancia entre dos observadores


distintos que utilizan el mismo instrumento se utiliza:
162. Si en una muestra el valor de la media aritmética es
mayor que el de la mediana: l. El índice Kappa.
2. El coeficiente de correlación de Pearson.
l. La distribución es unimodal. 3. Regresión lineal simple.
2. La distribución no es unimodal. 4. Test de asociación.
3. La moda no coincide con la mediana. 5. Test de rachas.
4. Más del 50% de los valores son mayores que la media.
5. Más del 50% de los valores son menores que la media. BIR 08 RC:1

BIR 07 RC:5 147. El test que valora la significación de la correlación


entre dos variables continuas que se distribuyen
163. Una muestra de 100 individuos hipertensos, tiene normalmente es:
una tensión arterial diastólica (TAD) mediana de
l00mmHg. Esto significa que: l. T de student con n-1 grados de libertad.
2. T de student con n-2 grados de libertad.
l. La media aritmética de las cifras de TAD de los 100 3. F de Fisher con n-1 grados de libertad.
sujetos es de 100 mmHg. 4. F de Fisher con n-2 grados de libertad.
2. La mitad de los individuos de la muestra tienen cifras 5. T de student con (nl+n2)-2 grados de libertad.
iguales o inferiores a 100 mm Hg.
3. Todos los individuos de la muestra tienen cifras de TAD BIR 08 RC:2
iguales o superiores a 100 mmHg.
4. La cifra de TAD que se ha observado en un mayor 148. ¿Cuántos grados de libertad tiene la F de interacción
número de sujetos es 100 mm Hg. en un Anova de dos vías 4x3?:
5. El 95% de los sujetos de la muestra tienen cifras de TAD
superiores a 100 mmHg. l. 12.
2. 3.
BIR07 RC:2 3. 2.
4. 6.
164. El coeficiente de variación en una muestra de 100 5. 7.
individuos con un valor medio de glucemia de 5mmol/l y
una desviación estándar de 0,5 es: BIR 08 RC:4

l. 5%. 149. Calcular el tamaño muestra! antes de llevar a cabo un


2. 25%. experimento supone asumir, entre otros supuestos:
3. 12,5%.
4.10%. 1. La diferencia máxima que se desea detectar.
5. 2,5%. 2. La probabilidad de cometer un error alfa.
3. La probabilidad de no cometer un error alfa.
BIR07 RC:4 4. Un valor máximo de potencia.
5. Un valor de dispersión constante.
165. A la desviación típica de una distribución de medias
muestrales se denomina: BIR 08 RC:2

l. Amplitud. 150. Para comparar dos medias de muestras


2. Error estándar. independientes, cuando la variable se distribuye
3. Varianza. normalmente y las muestras son homocedásticas se utiliza
4. Coeficiente de variación. el test de:
5. Moda.
l. t de student de dos muestras independientes con nl + n2
BIR 07 RC:2 grados de libertad.
2. t de student de dos muestras independientes con (nl +
256. Se dice que es un test de hipótesis bilateral cuando: n2}-2 grados de libertad.
3. t de student de dos muestras independientes con (nl +
l. Se pretende detectar diferencias en cualquier dirección. n2}-1 grados de libertad.
2. La hipótesis alternativa representa la desviación de la 4. Welch.
hipótesis nula en un único sentido. 5. U de Mann-Whitney.
3. La hipótesis alternativa expresa la asociación entre dos
variables. BIR 08 RC:2
4. Se pretende hacer cualquier tipo de comparación.
5. Se pretende detectar diferencias en una única dirección. 151. Un intervalo de confianza para estimar la media
poblacional será más preciso cuanto:
BIR 07 RC:1

12
BIR Oficiales Asignatura: Estadística

l. Menor sea el nivel de confianza. 146. Si un test estadístico ofrece un valor p<0,05. ¿Cómo
2. Mayor sea la dispersión de la muestra se interpreta?:
3. Menor sea el tamaño de la muestra.
4. Mayor sea el error típico muestra l. l. Se acepta la hipótesis nula.
5. Mayor sea el nivel de confianza. 2. Se rechaza la hipótesis alternativa.
3. Se rechaza la hipótesis nula.
BIR 08 RC: 1 4. No se puede rechazar la hipótesis nula.
S. No existen evidencias a favor de la hipótesis alternativa.
152. Es una característica del error aleatorio:
BIR 09 RC:3
l. Ser predecible.
2. Ser asimétrico. 147. Al realizar un test de hipótesis:
3. Equivaler a la falta de validez.
4. Equivaler a la falta de precisión. l. Se pueden cometer 3 tipos de errores.
5. Ser totalmente corregible. 2. A mayor tamaño muestra!, el test tiene menor potencia.
3. A menor error beta, el test tiene mayor potencia.
BIR 08 RC:4 4. Si aumenta la potencia del test, aumenta el error beta.
5. A menor error alfa, el test tiene menor especificidad.
153. Si se trabaja con una muestra asimétrica positiva se
utiliza la distribución de probabilidad: BIR 09 RC:3

l. Normal. 148. En un diagrama de tallo y hojas "stem and leaf":


2. Uniforme.
3. Poisson. l. Los datos aparecen ordenados en sentido descendente.
4. Log normal. 2. Los datos aparecen ordenados en sentido ascendente.
5. Binomial. 3. Se observa la misma información que en un polígono de
frecuencias.
BIR 08 RC:4 4. Se observa la misma información que en un diagrama de
barras.
154. Si los resultados de un test de normalidad (Test de 5. No se puede detectar la presencia de valores periféricos
Kolmogorov-Smirnov) ofrecen un valor de p>0,05: (outliers).

l. Se puede asumir que la variable no sigue una distribución BIR 09 RC:2


normal.
2. No se puede asumir que la variable sigue una distribución 149. ¿Qué porcentaje aproximado de individuos de una
normal. población de distribución normal, con media 30 y
3. Se puede asumir que la variable sigue una distribución desviación típica 10, se encuentran entre los valores 30 y
normal. 40?:
4. El test ha resultado ser significativo.
5. El test ha resultado ser muy significativo. l. 34%.
2. 5%.
BIR 08 RC:3 3. 25%.
4. 50%.
155. Si una muestra presenta un coeficiente de variación 5. 68%.
(CV) de 0,28 significa que la:
BIR 09 RC: 1
l. Desviación típica supone el 28% de la media.
2. Varianza supone el 56% de la media. 150. La potencia de un test estadístico es la capacidad de
3. Media supone el 25% de la deviación típica. detectar:
4. Media supone el 56% de la varianza.
S. Desviación típica supone el 72% de la media. l. Una igualdad cuando ésta existe realmente.
2. Una diferencia cuando ésta no existe realmente.
BIR 08 RC:1 3. Una igualdad cuando ésta no existe realmente.
4. Una diferencia cuyo valor se ha fijado previamente.
256. Para comparar los tratamientos administrados al 5. Una diferencia cuando ésta existe realmente.
mismo individuo, midiendo el efecto (respuesta/no
respuesta) se utiliza el test estadístico: BIR 09 RC: 5

l. De Friedman. 146. Si un test estadístico ofrece un valor p<0,05, ¿cómo


2. De t de Student de dos muestras relacionadas. se interpreta?:
3. Exacto de Fisher.
4. De McNemar. l. Se acepta la hipótesis nula.
5. De Cochran. 2. Se rechaza la hipótesis alternativa.
3. Se rechaza la hipótesis nula.
BIR 08 RC:4 4. No se puede rechazar la hipótesis nula.

13
BIR Oficiales Asignatura: Estadística

S. No existen evidencias a favor de la hipótesis alternativa. S. U de Mann-Whitney.

BIR 10 RC:3 BIR 10 RC:4

147. Si una muestra presenta un coeficiente de variación 146. El intervalo comprendido entre aproximadamente
(CV) de 0,25 significa que la: dos errores estándar alrededor de la media se conoce
como intervalo de:
l. Desviación típica supone el 25% de la media.
2. Varianza supone el 25% de la media. l. Confianza de 1%.
3. Media supone el 25% de la desviación típica. 2. Probabilidad del 95%.
4. Media supone el 75% de la varianza. 3. Confianza del 95%.
S. Desviación típica supone el 75% de la media. 4. Confianza del 99%.
5. Confianza del 5%.
BIR 10 RC: 1
BIR 11 RC:3
148. El test estadístico que permite comparar
proporciones de dos muestras independientes es el: 147. La media y la desviación típica de la función normal
tipificada son, respectivamente:
l. De McNemar.
2. De Snedecor. l. O; infinito.
3. De la mediana. 2. 1; o.
4. Exacto de Fisher. 3. O; 1.
S. De U de Mann-Whitney. 4.1; 1.96.
5.0; 1.96.
BIR 10 RC:4
BIR 11 RC:3
149. Se utiliza para comparar dos tratamientos
administrados al mismo individuo, midiendo como efecto 148. El test estadístico más adecuado para comparar dos
(respuesta/no respuesta) el test: proporciones con muestras apareadas es:

l. De Friedman. l. Chi cuadrado.


2. De t de Student de dos muestras relacionadas. 2. T de student de muestras apareadas.
3. Exacto de Fisher. 3. Test de U de Mann-Whitney.
4. De McNemar. 4. Test de MacNemar.
S. De Cochran. S. Correlación de Pearson.

BIR 10 RC:4 BIR 11 RC:4

150. Una distribución normal se caracteriza, entre otras 149. El coeficiente b de una recta de regresión representa:
propiedades, por:
l. La pendiente de la recta.
l. Ser asimétrica. 2. La ordenada ene el origen.
2. Tener aproximadamente el 99% de sus valores dentro del 3. El grado de correlación lineal que hay entre ambas
intervalo µ±2cr. variables.
3. Tener aproximadamente al 95% de sus valores dentro del 4. El grado de significación de la relación.
intervalo µ±3cr. S. La probabilidad de cometer el error tipo l.
4. Tener aproximadamente al 95% de sus valores dentro del
intervalo µ±2cr. BIR 11 RC: Anulada
5. Tener aproximadamente al 95% de sus valores fuera del
intervalo µ±2cr. 150. La potencia de un test estadístico es la capacidad de
detectar una:
BIR 10 RC:4
1. Igualdad cuando ésta existe realmente.
256. Para comparar dos medias de muestras 2. Diferencia cuando ésta no existe realmente.
independientes cuando la variable se distribuye 3. Igualdad cuando ésta no existe realmente.
normalmente y las muestras tienen varianzas distintas se 4. Diferencia cuyo valor se ha fijado previamente.
utiliza el test de: S. Diferencia cuando ésta existe realmente.

l. t de student de dos muestras independientes con nl + n2 BIR 11 RC:5


grados de libertad.
2. t de student de dos muestras independientes con (nl + 146. Si una muestra presenta un coeficiente de variación
n2)-2 grados de libertad. (CV) de 0,25 significa que la:
3. t de student de dos muestras independientes con (nl +
n2)-1 grados de libertad. l. Desviación típica supone el 25% de la media.
4. Welch. 2. Varianza supone el 50% de la media.

14
BIR Oficiales Asignatura: Estadística

3. Media supone el 25% de la desviación típica. l. Menor sea el nivel de confianza.


4. Media supone el 50% de la varianza. 2. Mayor sea la dispersión de la muestra.
S. Desviación típica supone el 75% de la media. 3. Menor sea el tamaño de la muestra.
4. Mayor sea el error típico muestra l.
BIR 12 RC:1 S. Mayor sea el nivel de confianza.

147. Si el percentil 99 de la talla de los recién nacidos de BIR 13 RC:1


una determinada población es 50 cm, el:
78. Si los resultados de un test de normalidad ofrecen un
l. 99% miden más de 50 cm. valor p<0,005:
2. 1% miden más de 50 cm.
3. 99% miden 50 cm. l. Se puede asumir que la variable no sigue una distribución
4. 1% miden más de 55 cm. normal.
S. 99% miden más de 55cm. 2. No se puede asumir que la variable no sigue una
distribución normal.
BIR 12 RC:2 3. Se puede asumir que la variable sigue una distribución
normal.
148. Si un test estadístico ofrece un valor p<0,05: 4. El test ha resultado ser significativo.
S. El test ha resultado ser muy significativo.
l. Se acepta la hipótesis nula.
2. Se rechaza la hipótesis alternativa. BIR 13 RC: Anulada
3. Se rechaza la hipótesis nula.
4. No se puede rechazar la hipótesis nula. 79. Si una muestra de tamaño 100 tiene una desviación
S. No existen evidencias a favor de la hipótesis alternativa. típica de 10, su error típico es:

BIR 12 RC:3 l. 10.


2.100.
149. La potencia de un test estadístico es la probabilidad 3. 0,1.
de: 4.1.
S. No hay datos suficientes para calcularlo.
l. Rechazar la hipótesis nula siendo cierta.
2. Rechazar la hipótesis nula siendo falsa. BIR 13 RC:4
3. Aceptar la hipótesis alternativa.
4. Que la hipótesis alternativa sea verdadera. 80. ¿Cuántos grados de libertad tiene un test de t de
S. Que la hipótesis nula sea falsa. Student aplicado a dos muestras relacionadas con un total
de 25 individuos?:
BIR 12 RC:2
l. 26.
150. El test estadístico más adecuado para evaluar la 2. 24.
posible asociación entre el peso y el nivel de colesterol en 3. 23.
un grupo de 50 individuos cuando ambas variables se 4. 48.
miden cuantitativamente y siguen una distribución normal S. 47.
es:
BIR 13 RC:2
l. Test de t de Student.
2. Análisis de la Correlación de Pearson. 76. Permite comparar proporciones de dos muestras
3. Análisis de la varianza. independientes el test estadístico:
4. Análisis de la Correlación de Spearman.
S. Test de U de Mann-Whitney. l. De McNemar
2. De Snedecor.
BIR 12 RC:2 3. De la mediana.
4. Exacto de Fisher.
76. Si un test estadístico ofrece un valor p<0,05: S. De U de Mann-Whitney.

l. Se acepta la hipótesis nula. BIR 14 RC: 4


2. Se rechaza la hipótesis alternativa.
3. Se rechaza la hipótesis nula. 77. Si en una prueba diagnóstica se observan un 3% de
4. No se puede rechazar la hipótesis nula. falsos positivos, se puede afirmar que:
S. No existe evidencia a favor de la hipótesis alternativa.
l. La sensibilidad es del 97%.
BIR 13 RC:3 2. La especificidad es del 97%.
3. El valor predictivo positivo es del 97%.
77. Un intervalo de confianza para estimar la media 4. La especificidad es del 3%.
poblacional será tanto más preciso cuanto: S. La sensibilidad es del 3%.

15
BIR Oficiales Asignatura: Estadística

BIR 14 RC: 2 153. Comparando los test de hipótesis unilaterales (1


cola) y bilaterales (2 colas):
78. La media aritmética y no la mediana:
l. Los tests bilaterales siempre dan valores de p superiores.
l. Es una medida de localización. 2. Los tests bilaterales siempre dan valores de p menores.
2. En su cálculo intervienen todos los valores de la muestra. 3. Si un test unilateral es significativo, también lo será el
3. Es adimensional. bilateral.
4. No está influenciada por los valores extremos. 4. Un test bilateral es más sensible que un unilateral.
5. Ninguna es correcta.
BIR 15 RC: 1
BIR 14 RC: 2
154. Un test que permite comparar dos muestras
79. En un test de hipótesis se denomina error beta a la independientes cuando la variable se distribuye
probabilidad de: normalmente y las muestras tienen homogeneidad
de varianza es:
l. Aceptar una hipótesis nula siendo cierta.
2. Rechazar una hipótesis nula siendo falsa. l. t de Student con nl+n2 grados de libertad.
3. Aceptar una hipótesis alternativa siendo cierta. 2. t de Student con (nl+n2)-1 grados de libertad.
4. Rechazar una hipótesis alternativa siendo falsa. 3. t de Student con (nl+n2)-2 grados de libertad.
5. Aceptar una hipótesis nula siendo falsa. 4. Welch.

BIR 14 RC:5 BIR 15 RC: 3

80. Son conceptos que se refieren a la misma probabilidad 155. El análisis de la varianza (Anova) de una vía:
el nivel de:
l. Compara medias de 3 o más muestras independientes.
l. Confianza y el error tipo 11. 2. Compara varianzas de 3 o más muestras independientes.
2. Significación y el error tipo l. 3. Es un test de hipótesis no paramétrico.
3. Significación y la especificidad. 4. Utiliza la distribución t de Student
4. Confianza y la sensibilidad.
5. Significación y el error tipo 11. BIR 15 RC: 1

BIR 14 RC: 2 231. En una Anova de dos vías, la "p" de la interacción


(fármaco x edad) es 0,82. ¿Cómo se interpreta?:
235. Los grados de libertad de la varianza intragrupos en
un Anova de 1 vía en el que se comparan 4 grupos de 10 l. El efecto del fármaco despende de la edad de los
individuos cada uno son: pacientes.
2. El fármaco no es efectivo.
l. 38. 3. El fármaco es más efectivo en jóvenes.
2. 39. 4. El efecto del fármaco no depende de la edad de los
3. 3. pacientes.
4.40.
5. 36. BIR 15 RC: 4

BIR 14 RC: 5 174. Si los resultados de un test de normalidad ofrecen un


valor p=0,03, ¿cómo se interpreta el test?:
151. Si el percentil 95 de la talla de los recién nacidos de
una determinada población es 45 cm, el: l. No se puede asumir que la variable sigue una distribución
normal.
l. 95% de los recién nacidos mide más de 45 cm. 2. Se puede asumir que la variable sigue una distribución
2. 5% de los recién nacidos mide más de 45 cm. normal.
3. 95% de los recién nacidos mide 45 cm. 3. El test no es informativo.
4. 5% de los recién nacidos mide menos de 45 cm. 4. El resultado no es significativo.

BIR 15 RC: 2 BIR 16 RC: 1

152. Si una muestra presenta un coeficiente de variación 175. Un intervalo de confianza para estimar la media
(CV) de 0,15 significa que: poblacional será tanto más preciso cuanto:

l. La desviación típica supone el 15% de la media. l. Menor sea el nivel de confianza.


2. La media supone el 25% de la desviación típica. 2. Mayor sea la dispersión de la muestra.
3. La media supone el 30% de la varianza. 3. Menor sea el tamaño de la muestra.
4. La desviación típica supone el 85% de la media. 4. Mayor sea el nivel de confianza.

BIR 15 RC: 1 BIR 16 RC: 1

16
GoBIR BIR Oficiales Asignatura: Estadística

176. Para evaluar la posible asociación entre la presIon l. t de Student de dos muestras independientes con nl+n2
arterial y el peso en un grupo de 100 individuos, cuando grados de libertad.
ambas variables siguen una distribución normal se utiliza 2. t de Student de dos muestras independientes con
el test de: (nl+n2) -2 grados de libertad.
3. t de Student de dos muestras independientes con
l. t de Student. (nl+n2) -1 grados de libertad.
2. Correlación de Pearson. 4. U de Mann-Whitney.
3. Correlación de Spearman.
4. Regresión. BIR 17 RC: 4

BIR 16 RC: 2 150. ¿Qué test estadístico se aplicaría para comparar dos
colirios administrando uno distinto en cada ojo de un
177. ¿Qué test estadístico es el más adecuado para mismo paciente?:
evaluar la posible asociación entre la presión sanguínea y
el nivel de colesterol en un grupo de 20 individuos, cuando l. t de Student de muestras independientes.
ambas variables se miden cuantitativamente pero no 2. Exacto de Fisher.
siguen una distribución normal?: 3. McNemar.
4. Welch.
l. t de Student.
2. Correlación de Pearson. BIR 17 RC: 3
3. Correlación de Spearman.
4. U de Mann - Whitney. 226. Existe la hipótesis de que el 40% de los adultos realiza
ejercicio al menos una vez a la semana ¿Qué test se
BIR 16 RC: 3 utilizaría para comprobar dicha hipótesis a partir de una
muestra?:
146. Se comprueba mediante un Anova de dos vías si el
efecto de un determinado fármaco depende del sexo de l. Wilcoxon.
los pacientes. Si dicha interacción presenta una p=0,28 2. Bondad de ajuste.
¿Cómo se interpreta?: 3. Me Nemar.
4. Contingencia 2x2.
l. El efecto del fármaco es mejor en hombres.
2. El efecto del fármaco depende del sexo de los pacientes. BIR 17 RC: 2
3. El efecto del fármaco no depende del sexo de los
pacientes. 227. Al realizar un test de hipótesis:
4. El fármaco no es efectivo.
l. A mayor tamaño muestra!, mayor potencia.
BIR 17 RC: 3 2. A menos error beta, mayor potencia.
3. Si aumenta la potencia del test, aumenta el error beta.
147. ¿Qué test estadístico permite comparar proporciones 4. A menor error alfa, menor especificidad.
de dos muestras independientes?:
BIR 17 RC: 2
l. Test McNemar.
2. Test de la Mediana. 228. Si un test de normalidad ofrece un valor p > 0,05,
3. Test exacto de Fisher. ¿cómo se interpreta?:
4. Test U de Mann-Whitney.
l. Se puede asumir que la variable no sigue una distribución
BIR 17 RC: 3 normal.
2. No se puede asumir que la variable siga una distribución
148. ¿Qué test estadístico utilizaría para comprobar el normal.
efecto del ejercicio físico en un grupo de pacientes con 3. Se puede asumir que la variable sigue una distribución
enfermedad coronaria en los que se mide el máximo de normal.
oxígeno consumido para cada uno antes y después de 1 4. El test ha resultado ser significativo.
año de un programa de rehabilitación?:
BIR 17 RC: 3
l. t de Student de muestras relacionadas.
2. Wilcoxon de muestran relacionadas. 229. Si una muestra presenta un coeficiente de variación
3. U de Mann-Whitney. de 0,12 significa que la:
4. Chi cuadrado.
l. Desviación típica supone el 12% de la media.
BIR 17 RC: Anulada 2. Varianza supone el 12% de la media.
3. Media supone el 12% de la desviación típica.
149. El test que permite comparar dos medias de muestras 4. Desviación típica supone el 88% de la media.
independientes cuando la variable no se distribuye
normalmente es:
BIR 17 RC: 1

17
GoBIR BIR Oficiales Asignatura: Estadística

230. La mediana:

1. Es un estadístico de posición y forma.


2. Siempre coincide con la media.
3. Es más estable que la media en distribuciones
asimétricas.
4. Es más fiable que la media en distribuciones simétricas.

BIR 17 RC: 3

18
Preguntas propias 1 Asignatura: Estadística

l. En un ensayo clínico que evalúa la eficacia de un nuevo 5. La proporción de pacientes hipertensos correctamente
agonista dopaminérgico para el tratamiento de la identificados por una nueva prueba es del 85%. Este valor
enfermedad de Parkinson los investigadores concluyen representa:
que el nuevo fármaco es eficaz cuando en realidad no es
mejor que el placebo. Han cometido: l. La especificidad.
2. El valor predictivo positivo.
l. Un error tipo l. 3. La sensibilidad.
2. Un sesgo del observador. 4. Los falsos negativos.
3. Un sesgo de confusión. 5. El valor predictivo negativo.
4. Un error tipo 11.
5. Un sesgo de clasificación. RC:3

RC: 1 6 .Un paciente se somete a una prueba de cribado para el


diagnóstico precoz de una enfermedad neoplásica. En
2. Un estudio informa que la mediana de supervivencia de nuestra población dicha prueba tiene una sensibilidad del
los pacientes después del diagnóstico de cierto tipo de 98,2%, una especificidad del 94,7%, un valor predictivo
cáncer es de 6 años. ¿Esto quiere decir que? positivo del 35 66,2% y un valor predictivo negativo del
99,8%. Si la prueba arroja un resultado alterado, ¿qué
l. No hay ningún paciente que sobreviva menos de 6 años. probabilidad tiene de NO padecer la enfermedad?
2. La mitad de los pacientes sobreviven aproximadamente 6
años. l. 98,2%.
3. El valor esperado del tiempo de supervivencia es 6 años. 2. 33,8%.
4. No hay ningún paciente que sobreviva más de 6 años. 3. 99,8%.
5. La mitad de los pacientes sobreviven más de 6 años. 4. 66,2%.
5. 5,3%.
RC:5
RC: 2
3 .Un artículo de una revista científica, en el que se
estudian factores pronósticos del fracaso de una 7. La prevalencia de cáncer de cérvix en Inglaterra es tres
intervención terapéutica para la lumbalgia, informa que veces superior a la de España. Si usamos el mismo test
uno de estos factores es que la duración del episodio sea serológico de detección del virus del papiloma humano
superior a un año con un "odds ratio" de 2,0 y un intervalo (VPH):
de confianza al 95% de 1,3 a 2,3. ¿Cuál de las siguientes
afirmaciones es FALSA? l. El valor predictivo positivo del test en Inglaterra será
mayor que en España.
l. La probabilidad de que el verdadero "odds ratio" esté 2. El valor predictivo positivo del test en Inglaterra será
comprendido 1.3 y 2.3 es 0,95. igual que en España.
2. Si se repitiera el estudio muchas veces, en un 95% de 3. El valor predictivo positivo del test en Inglaterra será
ellas se obtendría un "odds ratio" 1.3 y 2.3. menor que en España.
3. El intervalo de confianza está mal calculado, puesto que 4. La validez interna de la prueba en Inglaterra será mayor
no está centrado en el "odds ratio". que en España.
4. La probabilidad de que fracase el tratamiento en un 5. La validez interna de la prueba en Inglaterra será menor
individuo cuyo episodio ha durado más de un año, es que en España.
aproximadamente el doble que si la duración hubiera sido
menor. RC:1
5. Como el intervalo de confianza no incluye el 1, la
asociación entre duración del episodio y fracaso del 8. Si desea conocer la imprecisión esperada al estimar la
tratamiento es estadísticamente significativa. media de una variable recurrirá a:

RC:3 l. el error estándar (típico).


2. la desviación estándar (típica).
4. La técnica estadística que debe aplicarse para analizar la 3. la varianza de la variable.
concordancia de dos observadores en la medición del 4. el rango intercuartílico.
volumen espiratorio forzado en el primer segundo (FEVl) 5. el coeficiente de variación.
es:
RC: 1
l. El coeficiente de correlación de Spearman.
2. El coeficiente de correlación intraclase. 9. En un contraste de hipótesis estadístico si la hipótesis
3. La prueba de Kappa. nula fuera cierta y se rechazara ¿Cuál de las respuestas es
4. La prueba de Kappa ponderada. CORRECTA?
5. El test de Cohen.
l. Se comete un error de tipo 11.
RC:2 2. Se toma una decisión correcta.
3. La potencia aumenta.

19
Preguntas propias 1 Asignatura: Estadística

4. Se comete un error de tipo l. 14. Si consideramos una cifra de 24 mmHg de tensión


5. Indica un tamaño muestra! excesivo intraocular medida por tonometría ocular como criterio
diagnóstico de glaucoma en lugar de 20 mmHg:
RC: 4
l. Aumenta el número de verdaderos negativos.
10. Las curvas de Kaplan-Meier constituyen un método 2. Disminuye el número de falsos negativos.
estadístico en: 3. Aumenta el número de verdaderos positivos.
4. Aumenta el número de falsos positivos.
l. El análisis de supervivencia. 5. Aumenta la sensibilidad y disminuye la especificidad.
2. La regresión de Poisson.
3. La regresión lineal. RC:3
4. La regresión logística.
5. La determinación de las odds ratios. 15. La sensibilidad de una prueba diagnóstica mide:

RC: 1 l. La proporción de casos de pacientes sin la enfermedad


que presentan un resultado negativo de la prueba
11. Se ha realizado un ensayo controlado y aleatorizado en diagnóstica.
pacientes con hipercolesterolemia para valorar la 2. La proporción de casos de pacientes sin la enfermedad
efectividad de un nuevo fármaco. La variable final que presentan un resultado positivo de la prueba
valorada es la presencia de infarto de miocardio. El Riesgo diagnóstica.
Relativo (RR) de infarto de miocardio en relación con el 3. La proporción de pacientes que se someten a la prueba
fármaco habitual es de 0,39 con un IC al 9S% de 0,21 a que tienen la enfermedad.
1,18. Ante este resultado usted concluiría que: 4. La proporción de casos de enfermos con resultado
positivo de la prueba diagnóstica.
l. Debería recomendarse la utilización del nuevo fármaco. 5. La proporción de casos con resultado positivo de la
2. El nuevo fármaco reduce el riesgo relativo en más de un prueba que son verdaderamente enfermos.
60%.
3. El tamaño muestra! es muy elevado. RC:4
4. Existen diferencias estadísticamente significativas entre
el efecto de los fármacos estudiados. 16. En un contraste de hipótesis estadístico, la qué
5. Los resultados revelan una precisión pobre. definición corresponde con más exactitud el valor "p"?

RC: 5 l. La probabilidad de observar los resultados del estudio, u


otros más alejados de la hipótesis nula, si la hipótesis nula
12. El objetivo de una investigación es determinar la fuera cierta.
probabilidad de sufrir cirrosis hepática en función de la 2. La probabilidad de que la hipótesis nula sea ciertl.
presencia o no de cinco variables: sexo, edad, consumo de 3. La probabilidad de observar los resultados del estudio si
alcohol, consumo de drogas y nivel de actividad físicl. La la hipótesis nula fuera cierta.
técnica estadística más adecuada para evaluar el objetivo 4. La probabilidad de que los resultados observados sean
propuesto es: debidos al azar.
5. La probabilidad de observar los resultados del estudio, u
l. El cálculo de la matriz de correlación entre los factores. otros más alejados de la hipótesis nula, si la hipótesis
2. El cálculo de la regresión lineal. alternativa fuera cierta.
3. El análisis de componentes principales.
4. El cálculo de la regresión logística. RC:1
5. La prueba de "ji" cuadrado.
17. En una población, el valor medio del colesterol total es
RC:4 de 216 mg/dL, con una desviación típica de 5 mg/dl. El
porcentaje de personas cuyo nivel de colesterol es mayor
13. Una prueba de laboratorio aparece alterada en 8 de de 226 mg/dL es, aproximadamente:
cada 10 individuos que padecen una determinada
enfermedad crónica mientras se obtienen valores l. El 0,025%.
normales en 8 de cada 10 individuos que no sufren dicha 2. El 0,5%.
enfermedad. Si se aplica la prueba a una población de 100 3. El 2,5%.
individuos de los cuales 20 sufren la enfermedad ¿cuál 4. El 5%.
será el valor predictivo positivo de la prueba? 5. El 10%.

l. 40% RC:3
2. 50%
3. 60% 18. La prueba kappa o test de Cohen:
4. 70%
5. 80% l. Mide la validez interna de una prueba diagnóstica.
2. Mide la validez externa de una prueba diagnóstica.
RC:2

20
Preguntas propias 1 Asignatura: Estadística

3. Se mantiene estable para una misma prueba diagnóstica 2. La sensibilidad de la prueba.


al modificar la frecuencia de la enfermedad. 3. La especificidad de la prueba.
4. Se mantiene estable para una misma prueba diagnóstica 4. El valor predictivo positivo de la prueba.
tanto si se utiliza como cribado o prueba clínica. 5. El valor predictivo negativo de la prueba.
5. Tiende a disminuir su valor al aumentar el número de
categorías de la prueba diagnóstica. RC:5

RC:5 23. En la evaluación de una prueba diagnóstica de una


enfermedad hemos encontrado una razón de
19. ¿Cuál de los siguientes parámetros mide el verosimilitud positiva {RVP) de 7. ¿Qué indica este
apuntamiento de una distribución? resultado?:

l. El coeficiente de Fisher. l. Que el resultado negativo es proporcionalmente 7 veces


2. Los cuartiles. más frecuente en los enfermos que en los no enfermos.
3. La varianza. 2. Que el resultado positivo es proporcionalmente 7 veces
4. La curtosis. más frecuente en los enfermos que en los no enfermos.
5. La amplitud. 3. Que el resultado positivo es proporcionalmente 7 veces
más frecuente en los no enfermos que en los enfermos.
RC:4 4. Que la sensibilidad y la especificidad son < 0,5.
S. Que la contribución del resultado positivo de la prueba
20. En un estudio prospectivo en que compara un nuevo es pobre en el diagnóstico de la enfermedad.
antiagregante (grupo experimental) frente al tratamiento
habitual con ácido acetilsalicílico (grupo control) se han RC:2
obtenido los siguientes resultados en la prevención de
infartos de miocardio {1AM) a los 2 años de tratamiento: 24. La prueba diagnóstica que se aplica para el cribado de
nuevo tratamiento, 25 1AM sobre 500 pacientes; una enfermedad requiere las siguientes características,
tratamiento habitual, 50 1AM sobre 500 pacientes. ¿Cuál EXCEPTO:
es el riego relativo de padecer un 1AM con el nuevo
tratamiento respecto al tratamiento habitual? l. Alta prevalencia de la enfermedad.
2. Alta especificidad de la prueba.
l. 0,75. 3. Alta sensibilidad de la prueba.
2. 0,5. 4. Existencia de recursos de diagnóstico y tratamiento de
3. 60%. los sujetos positivos en la prueba. 5. Aceptable para la
4. 5%. población.
5. 2.
RC:2
RC:2
25. Una prueba diagnóstica tiene una sensibilidad del 95%,
21. En un estudio en el que compara un nuevo ¿qué nos indica este resultado?
antiagregante (grupo experimental) frente al tratamiento
habitual con ácido acetil-salicílico (grupo control) se han l. La prueba dará, como máximo, un 5% de falsos
obtenido los siguientes resultados en la prevención de negativos.
infartos de miocardio {1AM) a los 2 años de tratamiento: 2. La prueba dará, como máximo, un 5% de falsos positivos.
nuevo tratamiento, 25 1AM sobre 500 pacientes; 3. La probabilidad que un resultado positivo corresponda
tratamiento habitual, 50 1AM sobre 500 pacientes. ¿Cuál realmente a un enfermo será alta.
es el número de pacientes necesario a tratar (NNT) que 4. La probabilidad que un resultado negativo corresponda
obtenemos para evitar un 1AM si usamos el nuevo realmente a un sano será alta.
fármaco en lugar del ácido acetil-salicílico? 5. La prueba será muy específica.

l. 50. RC:1
2.100.
3. 20. 26. Con objeto de comprobar la eficacia de un tratamiento
4. 25. para dejar de fumar se compara un grupo control (con
5. 5. placebo) con un grupo tratado. Para que los grupos sean
comparables es importante que no difieran mucho en la
RC:3 edad de los participantes. Nos informan que la media de
edad en el grupo control es 52 años y que en el grupo
22. Si aplicamos una prueba de laboratorio para el tratado también es 52 años. A partir de dicha información
diagnóstico de una determinada enfermedad que es dos podemos decir que:
veces más frecuente en hombres que en mujeres, ¿cuál de
los siguientes parámetros será más elevado en la l. Los grupos no difieren respecto a la distribución de la
población femenina que en la masculina? variable edad.
2. Si el estudio está bien diseñado, no nos puede dar la
l. La prevalencia de la enfermedad. misma media de edad en ambos grupos.

21
Preguntas propias 1 Asignatura: Estadística

3. Para comparar la distribución de la variable edad en 3. La prueba B porque detectará más falsos positivos.
ambos grupos sería conveniente conocer una medida de 4. La prueba A porque detectará más falsos negativos.
dispersión como la desviación típica además de la media. 5. La prueba B porque tiene una mayor especificidad.
4. Para la conclusión final no importa la distribución de la
edad en ambos grupos, sólo si el tratamiento es efectivo o RC:5
no.
5. Si además de la media, coinciden la mediana y la moda 31. La prec1s1on de un conjunto de medidas repetidas
podemos afirmar que los grupos no difieren respecto a la puede expresarse mediante la:
distribución de la variable edad.
l. Media aritmética
RC:3 2. Raíz cuadrada de la media aritmética.
3. Varianza.
27. Un Pediatra desea estudiar el sobrepeso en los niños 4. Media geométrica.
de 14 años, según los valores del IMC (índice de masa S. Raíz cuadrada de la media geométrica.
corporal). Para estimar el tamaño muestra! necesario
propone un nivel de confianza del 95% y una precisión de RC:3
1 unidad de IMC. ¿Qué más parámetros necesita conocer
para determinar el tamaño muestra!? 32. Si disponemos de una población normalmente
distribuida de valor medio µ y desviación estándar a, el
l. La media del IMC en la población. intervalo de confianza para un 95% de probabilidad, de un
2. La varianza del IMC. valor aislado (Xi), se calcula mediante la expresión:
3. La media y la desviación típica del IMC.
4. El tamaño de la población y la media del IMC. l. Xi =µ ± 0.50 o.
5. La desviación típica del IMC y el tamaño de población. 2. Xi =µ ± 1.00 o.
3. Xi =µ ± 1.50 o.
RC:2 4. Xi =µ ± 2.00 o.
S. Xi =µ ± 1.96 o.
28. El coeficiente de correlación de Pearson indica que
existe asociación estadística entre dos variables cuando: RC:5

l. Su valor es positivo. 33. La media de dos o más mediciones es:


2. Su valor está entre -1 (menos uno) y 1 (uno)
3. Su valor se aproxima a cero. l. Su valor promedio.
4. Su valor es igual o muy similar al tamaño muestra! 2. El valor central de una serie ordenada de datos.
utilizado para su cálculo. 3. La semisuma de los datos.
5. Su valor se acerca a sus valores extremos posibles, -1 4. El valor promedio del par central en una serie ordenada
(menos uno) o 1 (uno). de datos.
S. La suma de los N datos dividida por N-1.
RC:5
RC:1
29. Si definimos el punto de corte para diagnosticar
insuficiencia renal a través del Índice de Filtrado 34. Se ha determinado en un grupo de sujetos la presencia
Glomerular (IFG) como 15 ml/min en vez de 60 ml/min (x=l) o ausencia (x=0) de bacteriuria. ¿De qué tipo de
está aumentando: variable se trata?

l. La sensibilidad del IFG. l. Ordinal.


2. La especificidad del IFG. 2. Numérica.
3. El Valor Predictivo Positivo del IFG. 3. Categórica.
4. El Valor Predictivo Negativo del IFG. 4. Cuantitativa continua.
S. La Validez interna y externa del IFG. 5. Cuantitativa discreta.

RC:2 RC:3

30. Disponemos de dos tests para diagnosticar una 35. Se realiza una estimación poblacional de los niveles de
enfermedad de pronóstico grave. La prueba A tiene una creatinina en sangre, en un grupo de mujeres
sensibilidad del 95% y una especificidad del 60% y la embarazadas, obteniéndose los siguientes resultados:
prueba B tiene una sensibilidad del 70% y una media (x) 0,8 mg/dl; desviación típica (s) 0,62 mg/dl;
especificidad del 99%. Disponemos de un tratamiento tamaño muestra! (n) 85 mujeres. Según los datos
eficaz pero que produce efectos adversos importantes y anteriores el intervalo de confianza para la media
además tiene un coste muy elevado. ¿Qué prueba poblacional (µ) con un nivel de confianza de 95% (Z=l,96),
elegiríamos para hacer el diagnóstico? es:

l. La prueba A porque detectará menos falsos positivos. l. 0,8 ± 0,04.


2. La prueba A porque tiene una sensibilidad mayor. 2. 0,8 ± 0,13.

22
Preguntas propias 1 Asignatura: Estadística

3. 0,8 ± 0,62. 39. Siendo s la desviación estándar y N el número de


4. 0,8 ± 1,96. datos, el error estándar de la media, Sm, de un conjunto
5. 0,8 ± 0,07. de datos es:

RC:2 ._/$
l. Sm:::;..;._
N
36. Algunos trabajos muestran indicios de que existe
relación entre la calidad del sueño de las personas y la
tendencia a la depresión. Para obtener los anteriores
resultados, los investigadores usaron dos cuestionarios
distintos, uno sobre la calidad del sueño y otro 32 sobre
los síntomas de depresión que asignaban una puntuación
a cada paciente en cada uno de ellos. ¿Qué prueba
estadística cree usted que utilizaron para contrastar su
hipótesis?

l. Prueba "t de Student".


2. Análisis de regresión logística.
3. Análisis de la varianza. RC:5
4. Prueba de "Chi cuadrado".
5. Coeficiente de correlación. 40. Queremos comparar las medias de dos poblaciones
que siguen distribuciones normales y tienen la misma
RC:5 varianza. Tomamos dos muestras de tamaño nl y n2. Al
construir un intervalo de confianza tendremos que
37. Se realiza un estudio para investigar la asociación calcular un valor t para una distribución T de Student con:
existente entre el factor X y la enfermedad Z. Para ello se
seleccionan 120 sujetos con la enfermedad y 420 controles l. 2 grados de libertad.
(sin la enfermedad) emparejados por edad y sexo. En 2. nl + n2- 2 grados de libertad.
ambos grupos se encuentra que 20 sujetos estaban 3. (nl + n2) -1 grados de libertad.
expuestos al factor X. ¿Cuál es la razón de ventaja ("Odds 4. (nl x n2)/2 grados de libertad.
Ratio", OR) entre el factor X y la enfermedad Z? 5. Grados de libertad calculados con la fórmula de Welch o
Sm ith-Satterwh ite.
l. OR = 1 (no hay asociación).
2. OR = 2. RC:2
3. OR = 4.
4. OR = 6. 41. ¿Cuáles de los siguientes estadísticos NO es afectado
5. OR = 8. por datos atípicos (outliers) en una muestra?:

RC:3 l. Media muestra!.


2. Desviación estándar.
38. En un estudio de cohorte la población tratada con un 3. Varianza.
fármaco anticoagulante tuvo una incidencia de 4. Rango intercuartílico.
hemorragia grave del 3%, mientras que en la población no 5. Rango.
tratada la incidencia de hemorragia grave fue del 1%,
siendo el NNH ("Number Needed to Harm") de 50. ¿Cuál RC:4
es la interpretación correcta de este 34 dato?

l. En el grupo tratado con el anticoagulante 50 personas 42. Tomamos muestra de cinco individuos a los que les
presentaron una hemorragia grave. medimos el valor de colesterol LDL (mg/ml) obteniendo:
2. En el grupo tratado con anticoagulante hubo 50 casos de 180, 203, 104, 90 y 165. ¿Cuál es la mediana de esta
hemorragia grave más que en el grupo no tratado. muestra?:
3. El riesgo de presentar una hemorragia grave en los
tratados con el anticoagulante fue 50 veces mayor que en 1.180.
los no tratados. 2. 203.
4. Fue necesario tratar a 50 personas con el anticoagulante 3.104.
para producir 1 caso de hemorragia grave atribuible al 4. 90.
fármaco. 5. 165.
5. De cada 100 pacientes tratados con el anticoagulante 50
presentaron una hemorragia grave. RC:5

RC:4 43. Es una Variable Cualitativa Ordinal:

l. Sexo (M, F).


2. Bebe (no bebedor, moderado, mucho).

23
Preguntas propias 1 Asignatura: Estadística
IR
3. Nº de unidades formadoras de colonias.
4. Temperatura corporal. RC:5
5. Raza (blanca, negra, amarilla).
50. El Diagrama de sectores se utiliza para representar
RC:2 variables:

44. Es una Variable Cuantitativa Continua: 1. Cualitativas.


2. Cuantitativas Discretas.
l. Sexo {M, F). 3. Cuantitativas Continuas.
2. Bebe (no bebedor, moderado, mucho). 4. Cualquiera.
3. Nº de unidades formadoras de colonias. 5. Ninguna de las opciones es cierta.
4. Temperatura corporal.
5. Raza (blanca, negra, amarilla). RC: 1

RC:4 51. El Polígono de Frecuencias se usa para representar


variables:
45. Es una Variable Cualitativa Dicotómica:
1. Cualitativas.
l. Sexo (M, F). 2. Cuantitativas Discretas.
2. Bebe (no bebedor, moderado, mucho). 3. Cuantitativas Continuas.
3. Nº de unidades formadoras de colonias. 4. Cualquiera.
4. Temperatura corporal. 5. Ciertas 1 y 2.
5. Raza (blanca, negra, amarilla).
RC:3
RC:1
52. El polígono de frecuencias acumuladas se usa para
46. Es una Variable Cuantitativa Discreta: representar variables:

1. Sexo (M, F). l. Cualitativas.


2. Bebe (no bebedor, moderado, mucho). 2. Cuantitativas Discretas.
3. Nº de unidades formadoras de colonias. 3. Cuantitativas Continuas.
4. Temperatura corporal. 4. De cualquier tipo.
5. Raza {blanca, negra, amarilla). 5. Ciertas 1 y 2.

RC:3 RC:3

47. Es una Variable Cualitativa: 53. Una distribución de datos se puede describir con:

l. Sexo (M, F). l. Una medida de centralización y otra de dispersión.


2. Bebe (no bebedor, moderado, mucho). 2. Una distribución de frecuencias absolutas.
3. Nº de unidades formadoras de colonias. 3. Una distribución de frecuencias relativas.
4. Raza (blanca, negra, amarilla). 4. Un gráfico.
5. Ciertas 1, 2, 4. 5. Todas son ciertas.

RC:5 RC:5

48. El histograma se utiliza para representar variables: 54. Es una medida de centralización:

l. Cualitativas. 1. Rango.
2. Cuantitativas Discretas. 2. Varianza.
3. Cuantitativas Continuas. 3. Mediana.
4. Cualquiera. 4. Desviación Estándar.
5. La opción 1 y 2 son verdaderas. 5. Coeficiente de Variación.

RC:3 RC:3

49. El Diagrama de Barras se utiliza para representar 55. Es una medida de tendencia central:
variables:
l. Amplitud.
l. Cualitativas. 2. Varianza.
2. Cuantitativas Discretas. 3. Moda.
3. Cuantitativas Continuas. 4. Desviación Típica.
4. Cualquiera. 5. Coeficiente de Variación.
5. Ciertas 1 y 2.

24
Preguntas propias 1 Asignatura: Estadística

RC:3
62. Es un Estadístico de Dispersión:
56. Es un índice de dispersión:
l. Moda.
1. Media Aritmética. 2. Rango.
2. Moda. 3. Mediana.
3. Mediana. 4. Media Armónica.
4. Desviación Estándar. S. Media Geométrica.
S. Cuartiles.
RC:2
RC:4
63. El Coeficiente de Variación es:
57. Es un estadístico de dispersión:
l. Un estadístico de Centralización adimensional.
l. Amplitud. 2. Un estadístico de Dispersión Adimensional.
2. Desviación estándar. 3. Una medida de Variación conjunta entre dos variables.
3. Rango intercuartílico. 4. Un índice de simetría.
4. Coeficiente de Variación. S. 3 y 4 correctas.
S. Todas Ciertas.
RC:2
RC:S
64. La Varianza Muestra! es:
58. Es un índice de dispersión adimensional:
l. El cuadrado de la Desviación Típica.
l. Desviación Media. 2. La raíz cuadrada de la Desviación Típica.
2. Varianza. 3. Un estadístico de dispersión.
3. Desviación Estándar. 4. El cociente entre la Media y los Grados de Libertad.
4. Coeficiente de Variación. S. 1 y 3 correctas.
S. Amplitud o Rango.
RC:S
RC:4
65. El Coeficiente de Variación se calcula:
59. ¿Cuál de los siguientes es un estadístico descriptivo de
posición? l. Multiplicando la Varianza por la Media.
2. Dividiendo la Desviación Típica por la Media.
1. Media Geométrica. 3. Dividiendo la Media por la Desviación Típica.
2. Media Ponderada. 4. Dividiendo la Media por la Varianza.
3. Varianza. S. Multiplicando la Desviación Típica por la Media.
4. Percentil.
S. Covarianza. RC:2

RC:4 66. Cuando la muestra es asimétrica, el mejor estadístico


de centralización que puede usarse es:
60. La mediana es una medida de tendencia central que se
usa cuando: 1. Media Aritmética.
2. Moda.
l. Los datos son impares. 3. Mediana.
2. La muestra es asimétrica. 4. Media Geométrica.
3. La muestra es heterogénea. S. Media Armónica.
4. La muestra es simétrica.
S. La muestra es homogénea. RC:3

RC:2 67. La media aritmética no debe emplearse como


estadístico de Centralización, cuando:
61. Para comparar correctamente, desde un punto de vista
descriptivo, dos o más variables debe usarse: 1. Las muestras son simétricas.
2. Se desea conocer el centro de gravedad de la
l. Desviación Estándar. distribución.
2. Amplitud. 3. Las muestras son asimétricas.
3. El Coeficiente de Variación. 4. Se desea calcular otros estadísticos relacionados, como el
4. La Covarianza. Coeficiente de Variación.
S. La Desviación Media. S. Se desea un estadístico de gran estabilidad.

RC:3 RC:3

25
Preguntas propias 1 Asignatura: Estadística

68. ¿Con cuál de los siguientes estadísticos, puede


compararse el grado de dispersión (variabilidad) de RC:4
distintas muestras, en las que se utilizan unidades de
medida distintas?: 74. Cuando a todos los datos de una muestra se les
multiplica una constante:
l. Desviación Típica.
2. Varianza. l. La Media queda multiplicada por esa constante, la
3. Coeficiente de Variación. Desviación Típica no varía.
4. Rango o Amplitud. 2. El Coeficiente de Variación se multiplica por esa
S. Error Típico. constante.
3. Tanto la Media como la Desviación Típica se multiplican
RC:3 por esa constante.
4. El Coeficiente de Variación no varía.
69. Si a todos los valores de una distribución, les sumas 9: S. Correctas 3 y 4.

l. La Media aumenta 9. RC:5


2. La Media no varía.
3. La Varianza aumenta en 81. 75. Cuando a todos los datos de una muestra se les suma
4. La Varianza aumenta en 9. una constante:
S. La Desviación Estándar aumenta en 3.
l. La Media no varía.
RC: 1 2. La Media queda incrementada en esa constante.
3. La Desviación Típica no varía.
70. Si a todos los valores de una distribución de datos, les 4. La Desviación Típica queda aumentada en esa constante.
restas 4: S. Ciertas 2 y 3.

l. La Media no varia, la Varianza sí. RC:5


2. La Media disminuye 4, la Varianza 16.
3. La Media y Varianza no varían. 76. Los datos originales a menudo necesitan ser
4. La Media disminuye 4, la Varianza no varía. transformados, codificados para facilitar el cálculo. ¿Qué
S. Ninguna es cierta. consecuencias tiene en el cálculo de la Media, la
Desviación Típica y el Coeficiente de Variación el hecho de
RC:4 que a todos los elementos de una muestra se les reste una
constante?
71. Si a todos los valores de una distribución, los
multiplicas por 4: l. Ninguno de estos estadísticos varían.
2. La Media varía, el resto no.
1. Su Media no varía. 3. La Media no varía, el resto sí.
2. A su Media se le suma 4. 4. Los tres estadísticos varían.
3. Su media se multiplica por 4. S. La Media y el Coeficiente de Variación varían, la Desv.
4. Su Varianza se multiplica por 4. Típica no.
S. Su Desviación Estándar se multiplica por 16.
RC:5
RC:3
77. La Distribución Normal:
72. Si a todos los valores de una distribución de datos, les
multiplicas por 6: l. Es asimétrica.
2. Es una distribución de probabilidad de variable discreta.
1. La Media se multiplica por 6. 3. Es asintótica.
2. La Media y la Varianza se multiplican por 36. 4. La Mediana no coincide con la Moda.
3. La Media no varía, la Varianza se multiplica por 36. S. Es bimodal.
4. La Media se multiplica por 6, la Varianza por 36.
S. La media se multiplica por 6, la Varianza no varía. RC:3

RC:4 78. La Distribución Normal:

73. Si multiplicas por 6 todos los valores de una l. La Media coincide con la Moda y con la Mediana.
distribución: 2. El máximo es la Media.
3. Es una Distribución de probabilidad de variables
l. La Media no varía. continuas.
2. La Desviación Estándar se multiplica por 36. 4. Se define por m y s.
3. Varianza se multiplica por 6. S. Todas son ciertas.
4. Coeficiente de Variación no varía.
S. Todas son falsas. RC:5

26
Preguntas propias 1 Asignatura: Estadística

79. En la Distribución Normal: 85. Los parámetros Media y Desviación Típica,


respectivamente, de una Binomial se calculan:
l. El intervalo m±s abarca el 68% del área total.
2. El intervalo m±l.96s abarca el 95% del área. l. np, npq.
3. El intervalo m±2.6s abarca el 99% del área. 2. n/p, npq.
4. El intervalo m±2.6s NO abarca el 5% del área. 3. np, (npq)"l/2.
5. Todas son ciertas. 4. n/p, pq.
5. n/p, n/pq.
RC:5
RC:3
80. Una de las siguientes afirmaciones no se refiere a la
Normal. 86. Una de las siguientes distribuciones de probabilidad
corresponde a una Variable aleatoria continua:
1. Asintótica.
2. Es una Distribución de probabilidad de Variable Discreta. 1. Poisson.
3. Es simétrica respecto a su media. 2. Normal.
4. Queda definida por la media y la desviación típica 3. Binomial.
5. La Media, Moda y Mediana coinciden. 4. Geométrica.
5. Hipergeométrica.
RC:2
RC:2
81. Los parámetros m y s respectivamente de la
Distribución Normal unitaria o tipificada son: 87. Cuál de las siguientes Distribuciones de probabilidad
no corresponde a una Variable Aleatoria Discreta.
1. O, O.
2. 1, 1. 1. Poisson.
3. o, 1. 2. T. de Student.
4.1, o. 3. Binomial.
5. -1, 1. 4. Geométrica.
5. Hipergeométrica.
RC:3
RC:2
82. Los Parámetros Media y Desviación Típica
respectivamente de la Distribución normal tipificada (z) 88. Una de las siguientes distribuciones de probabilidad
son: corresponde a una Variable Discreta.

1. 1, O. 1. Normal.
2. O, 1. 2. Chi-Cuadrado
3. 1, 1. 3. F. de Snedecor.
4. o, 1,96. 4. T. de Student.
5. 1, 1,96. 5. Hipergeométrica.

RC:2 RC: 5

83. En la Normal, el intervalo: 89. La Distribución T. de Student deriva de la distribución.

1. m±s abarca el 95%. 1. Binomial.


2. m±l.96s abarca el 68%. 2. Normal.
3. m±2.56s abarca el 95%. 3. Poisson.
4. Ninguna es cierta. 4. Experimental.
5. Son todas ciertas. 5. Uniforme.

RC:4 RC:2

84. Una distribución Binomial: 90. Una distribución es bimodal:

1. Es Distribución de Probabilidad de Variable Discreta. 1. Si se puede representar en dos formas.


2. Se define por N (número de pruebas) y "p"(probabilidad 2. Si tiene dos Medias.
de suceso). 3. Si la Media y la Mediana coinciden.
3. La Media de la Binomial es np. 4. Si la curva tiene dos máximos.
4. La desviación Típica es (npq)"l/2. 5. Ciertas 2 y 4.
5. Todas son correctas.
RC:4
RC:5

27
Preguntas propias 1 Asignatura: Estadística

91. Una Distribución Bimodal (Señala lo falso):


2. El Coeficiente de Variación es =O.
l. Nunca es una distribución Normal. 3. El Coeficiente de Curtosis es =O.
2. Nunca es una distribución "T" de Student. 4. El Coeficiente de Asimetría es =O.
3. Nunca es simétrica. 5. Ciertas 3 y 4.
4. Nunca es de variables Normales.
5. Tiene dos máximos. RC:3

RC:3 98. Una distribución Normal es:

92. En una distribución simétrica: l. Simétrica.


2. Unimodal.
l. La Media coincide con la Mediana. 3. Mesocúrtica.
2. El Coeficiente de Simetría es O. 4. Distribución de Variables Continuas.
3. La mitad derecha es igual que la izquierda. 5. Son todas ciertas.
4. La Moda deja a su izquierda el 50% de la curva.
5. Son todas ciertas. RC:5

RC:5 99. El Coeficiente de Asimetría de una Distribución de


Frecuencias simétrica tiene un valor:
93. En una distribución asimétrica (Señale lo falso):
l. O.
l. Puede haber dos Modas. 2. -1.
2. El Coeficiente de Asimetría puede ser mayor de O. 3. 1,96.
3. No hay sesgo. 4. l.
4. La Mediana es el mejor índice de centralización. 5. -1,96.
5. Puede ser platicúrtica.
RC: 1
RC:3
100. El Coeficiente de Curtosis de una Distribución de
94. Un índice de Asimetría de -0,3, nos dice que: Frecuencias platicúrtica tiene un valor:

l. La curva no es simétrica. l. >O.


2. Tiene un sesgo negativo. 2. <O.
3. La Media es un índice de centralización sesgado. 3. >l.
4. La Mediana es un índice centrado. 4. =l.
5. Son todas correctas. 5. =3.

RC:5 RC:2

95. El índice de Curtosis: 101. Un estimador es insesgado:

l. Mide la simetría de la curva. l. Si es de mínima varianza.


2. Mide la modalidad de la curva. 2. Si es de varianza máxima.
3. Es la Desviación Estándar dividida entre la Media y 3. Si es centrado sobre el valor muestra!.
multiplicada por 100. 4. Si es centrado sobre el parámetro poblacional.
4. Mide el grado de apuntamiento. 5. Ciertas 1 y 4.
5. Mide si la Media coincide con la Mediana.
RC:4
RC: 4
102. En una distribución Simétrica, ¿Cuál es un estimador
96. En la distribución Normal: centrado de la Media Poblacional?:

l. El Coeficiente de Asimetría es >O. l. Media.


2. El Coeficiente de Curtosis es <O. 2. Moda.
3. Es bimodal. 3. Mediana.
4. Es Mesocúrtica. 4. Rango.
5. Es asimétrica. 5. Ciertas 1, 2 y 3.

RC: 4 RC:5

97. Se dice que una distribución es Mesocúrtica cuando: 103. Señale un estimador insesgado de la Media
poblacional, si la Distribución es asimétrica:
l. Es simétrica.

28
Preguntas propias 1 Asignatura: Estadística

l. Media. 109. El Error Estándar del Porcentaje es:


2. Moda.
3. Mediana. l. Un estadístico de dispersión.
4. Varianza. 2. Es la Desviación Típica de una distribución muestra! de
5. Ciertas 1, 2 y 3. porcentajes.
3. Es la distancia del porcentaje poblacional al punto de
RC:3 inflexión de la curva.
4. Sirve para estimar porcentajes.
104. ¿Cuál es el estimador de mínima varianza de la Media 5. Son todas ciertas.
poblacional?:
RC:5
l. Media.
2. Moda. 110. La Desviación Típica de una distribución muestra! de
3. Mediana. un estadístico se llama:
4. Rango.
5. Desviación Media. 1. Coeficiente de Variación.
2. Error Sistemático.
RC:1 3. Error Estándar.
4. Varianza.
105. En distribución Simétricas, es un estimador centrado 5. Desviación Estándar o Típica.
de la Varianza poblacional:
RC:3
l. Varianza muestra!.
2. Desviación Típica. 111. El intervalo Media Muestra! ± 1,96 EEM{Error
3. Cuasivarianza. Estándar de la Media):
4. Error estándar de la Media.
5. Mediana. 1. No dice gran cosa.
2. Comprende un 95% de las veces a la Media poblacional.
RC:3 3. Comprende un 99% de las veces a la Media poblacional.
4. Da una seguridad del 68%.
106. En distribución Asimétricas, el estimador insesgado 5. Da una seguridad del 5%.
de la Variación poblacional es:
RC:2
l. Varianza muestra!.
2. Desviación Estándar. 112. El intervalo Media Muestra! ± EEM(Error Estándar de
3. Cuasivarianza. la Media)
4. Rango intercuartílico.
5. Mediana. l. No se usa nunca.
2. Comprende un 99% de las veces a la Media poblacional.
RC:4 3. Comprende un 95% de las veces a la Media poblacional.
4. Da una seguridad del 99%.
107. A La Desviación Típica de una distribución muestra! 5. Todas son falsas.
de Medias se llama:
RC:5
l. Rango de la media.
2. Error Típico de la media. 113. El intervalo Media Muestra! ± EEM (Error Estándar de
3. Varianza muestra!. la Media):
4. Coeficiente de Variación.
5. Ninguna es cierta. l. Abarca a la Media poblacional un 68% de las veces.
2. No abarca a la Media poblacional algo menos del 32%.
RC:2 3. La seguridad de que la Media poblacional esté en dicho
intervalo es del 68%.
108. El Error Estándar de la Media es: 4. No se usa porque las probabilidades de fallar son muy
altas.
l. Un estadístico de dispersión. 5. Todas son ciertas.
2. Es la Desviación Típica de una distribución muestra! de
medias. RC: 5
3. Es la distancia de la Media poblacional al punto de
inflexión de la curva. 114. La seguridad mínima exigida a cualquier estimación
4. Sirve para estimar Medias. de Medias es:
5. Son todas ciertas.
l. Del 68%
RC:5 2. Del 95%
3. Del 99%

29
Preguntas propias 1 Asignatura: Estadística

4. Del 5% 2. La seguridad es de más del 99%


5. Del 1% 3. La glucemia poblacional estará entre 10 y 120, con toda
seguridad.
RC: 2 4. El Error Estándar de la Media es 10 mg/dl.
5. Ninguna es cierta.
115. La probabilidad de error máxima, permitida en la
estimación de parámetros es: RC:5

l. <68% 121. La media de la tensión arterial es 90±5. p<0,05:


2. <5%
3. <1% l. La Media de la muestra es 90.
4. <0,01. 2. La media de la población está entre 85 y 95, con una
5. Ciertas 3 y 4. seguridad del 95%
3. La Media de la población está entre 85 y 95, con una
RC:2 probabilidad de equivocarte menor del 5%
4. El EEM es 5/1,96.
116. La probabilidad de error mínima, permitida en la 5. Son todas ciertas.
estimación de parámetros es:
RC:5
l. <68%
2. 5% 122. La estimación de la Media poblacional:
3. <1%
4. <0,1% l. Se hace cuando se desconoce tal Media.
5. No hay. 2. Se realiza por un proceso de inferencia llamado
estimación.
RC:5 3. Se calcula el EEM basándose en la Desviación Muestra!.
4. Se dice entre qué valores puede estar la Media
117. La seguridad máxima exigida a cualquier estimación poblacional, con una probabilidad de equivocarse conocida.
de parámetros es: 5. Son todas ciertas.

l. Del 68% RC:5


2. Del 95%
3. Del 99% 123. El Test de Hipótesis:
4. Del 99,9%
5. No hay tal seguridad máxima. l. Es un tipo de estadística descriptiva.
2. La Hipótesis nula plantea la existencia de diferencias.
RC:5 3. La Hipótesis alternativa plantea la no diferencia.
4. La Hipótesis nula y la alternativa pueden no ser
118. Una seguridad del 95% en la estimación de excluyentes.
parámetros, lleva asociada una probabilidad de error: 5. Puedes saber la probabilidad de equivocarte en tu
afirmación.
l. Del 5%
2. De 0,05% RC:5
3. <5%
4. <1% 124. La probabilidad de acertar si aceptas la Hipótesis nula
5. Menor de 0,01. es:

RC: 3 l. El nivel de significación.


2. Es a.
119. Una seguridad del 99% en la estimación de 3. Lo fija el investigador.
parámetros, lleva asociada una probabilidad de error: 4. Es 1- a.
5. Ciertas 3 y 4.
l. Del 1%
2. De 0,01. RC:5
3. Menor del 1%
4. Menor de 0,01. 125. La probabilidad de equivocarte si rechazas la
5. Ciertas 3 y 4. Hipótesis nula:

RC:5 l. Es a.
2. Es el nivel de significación.
120. Leemos en un artículo que la glucemia media es de 3. Lo fija el investigador.
110 mg/dl ±10 mg/dl. p <0,01. 4. Como máximo se usa un nivel de 0,05.
5. Son todas ciertas.
l. El resultado muestra! es 110±10.

30
Preguntas propias 1 Asignatura: Estadística

RC:5
RC:4
126. El valor predictivo positivo de una prueba diagnóstica
se define como: 132. La potencia o poder de un test de Hipótesis:

l. Una cantidad igual a 1 menos la especificidad* l. Es 1- beta.


2. Una función que depende sólo de la sensibilidad y la 2. Es la capacidad del test de encontrar diferencias,
especificidad de un test habiéndolas.
3. La probabilidad de que un individuo enfermo tenga un 3. Aumenta al aumentar el tamaño de la muestra.
resultado positivo 4. Aumenta al aumentar la diferencia real.
4. La probabilidad de una enfermedad dado un resultado 5. Son todas ciertas.
positivo en el test
5. La proporción de verdaderos positivos. RC:5

RC:4 133. En un tipo de cáncer pulmonar, la Quimioterapia es


MEJOR que la cirugía: Las diferencias son estadísticamente
127. La probabilidad de equivocarte al aceptar la Hipótesis significativas p<0,01.
Alternativa:
l. Usamos un intervalo de confianza del 95%
l. Se la conoce como b. 2. Es fácil que las diferencias observadas sean debidas al
2. No la fija el investigador. azar.
3. Es el complementario del poder del test. 3. La Quimioterapia es 999 veces mejor que la cirugía.
4. Es el error tipo 11. 4. No se ha visto que uno sea mejor que la otra.
S. Son todas falsas. 5. La Quimioterapia es mejor que la cirugía, a ese nivel de
significación.
RC:5
RC:5
128. Si la Hipótesis nula es cierta y la aceptas:
134. En el tratamiento de una artritis con reposo, mejoran
l. Es el nivel a. el 60%; con aspirina mejoran el SS%. La diferencia es
2. Es el poder del test. significativa con p<0,05:
3. Es el error tipo l.
4. Es 1- a. l. Siempre que trates con aspirina a ese tipo de pacientes,
5. Es el complementario de 1- b. mejorarán un 55% de los pacientes.
2. El reposo es un 95% mejor que la aspirina.
RC:4 3. El nivel de significación es del 1%
4. Hay diferencias entre los dos tratamientos, a ese nivel de
129. Si la Hipótesis nula es cierta y la rechazas: significación.
S. No se puede concluir nada.
l. No sabes qué probabilidad hay de que ocurra.
2. No tiene importancia. RC:4
3. La probabilidad es 1- a.
4. Nunca ocurre. 135. En el tratamiento de una artritis con reposo, mejoran
5. Es el error tipo l. el 60%, con aspirina mejoran el 55%. La diferencia NO es
significativa con p<0,05:
RC:5
l. Si tratas con reposo a otros pacientes similares
130. La capacidad de encontrar diferencias, habiéndolas: mejorarán el 60% de ellos.
2. Se puede concluir que el reposo es un 5% mejor que AAS.
l. Es impredecible. 3. El nivel de significación es del 95%
2. Es el error tipo l. 4. No podemos concluir que haya diferencias entre los
3. Es el error tipo 11. tratamientos, a ese nivel de significación.
4. Es el poder o potencia del test. S. El reposo es mejor que la AAS, y otro estudio más
5. Usualmente es de 0,05. potente lo demostraría.

RC:4 RC:4

131. La potencia de un test de Hipótesis: 136. La Clonidina es efectiva en un 87%. El Diltiacem en un


80%. Diferencias no son estadísticamente significativas,
l. Depende inversamente del 1- beta. p<0,01:
2. Es el 1- alfa.
3. No depende de la magnitud real de la diferencia. l. La diferencia hallada en el estudio es debida al azar.
4. Depende directamente del tamaño de la muestra. 2. La diferencia hallada no es debida al azar.
5. Generalmente es de 0,01. 3. La Clonidina es mejor que el Diltiacem.

31
Preguntas propias 1 Asignatura: Estadística

4. La Clonidina y el Diltiacem son igualmente efectivas. RC:5


5. Son todas falsas.
141. La probabilidad de error a es:
RC:5
1. Rechazar Ho cuando es verdadero Ho.
137. La Clonidina es efectiva en un 87%. El Diltiacem en un 2. Equivocarse cuando se rechaza Ha.
80%. Diferencias no son estadísticamente significativas, 3. Equivocarse cuando se acepta Ho.
p<0,01: 4. Aceptar Ho cuando es verdadera Ha.
5. No rechazar Ho.
1. La diferencia hallada en el estudio puede ser debida al
azar. RC:1
2. No hay suficiente evidencia para decir quien es mejor.
3. La Clonidina y el Diltiacem pueden ser igualmente 142. A la capacidad que tiene un test estadístico para
efectivas, a pesar de los resultados observados. detectar diferencias significativas se denomina:
4. La Clonidina puede ser mejor que el Diltiacem, pero no
tenemos suficiente evidencia para afirmarlo. 1. Precisión.
5. Son todas ciertas. 2. Ajuste.
3.Sesgo.
RC:5 4. Potencia.
5. Significación.
138. La cirugía es efectiva en un 90%. La medicación en un
80%. Diferencias estadísticamente significativas con RC:4
p<0,05:
143. El error tipo I o alfa es la probabilidad de:
1. La Hipótesis nula plantea que los dos son igualmente
efectivos. 1. Aceptar una Ho siendo falsa.
2. La Hipótesis alternativa dice que los dos tipos de 2. Aceptar una Ho siendo cierta.
tratamiento no son igualmente efectivos. 3. Rechazar una Ho siendo falsa.
3. Si la Hipótesis nula fuese cierta, hay menos de un 5% de 4. Rechazar una Ho siendo cierta.
probabilidades de concluir que un tratamiento es mejor 5. Son correctas 2 y 3.
que el otro.
4. Al afirmar que los dos tratamientos no son iguales, hay RC:4
menos del 5% de probabilidades de equivocarnos.
5. Todas son ciertas. 144. El error tipo II o error beta es la probabilidad de:

RC:5 1. Rechazar una Ho siendo verdadera.


2. Aceptar una Ho siendo verdadera.
139. La cirugía es efectiva en un 90%. La medicación en un 3. Rechazar una Ho siendo falsa.
80%. Diferencias estadísticamente significativas con 4. Aceptar una Ho siendo falsa.
p<0,05. S. Son correctas 1 y 3.

1. Afirmamos que hay diferencias entre ambos RC:4


tratamientos, p<0,05.
2. Decimos que ambos tratamientos son distintos, con una 145. ¿Qué nivel de significación mínimo es utilizado en
probabilidad de error <0,05. cualquier test de Hipótesis?
3. Si ambos tratamientos fueran iguales, habría menos de
un 5% de posibilidades de encontrar entre ellos una 1. 0,1%
diferencia del 10% 2. 0,5%
4. El error tipo I es <5% 3.1%
5. Son todas ciertas. 4. 5%
5.10%
RC:5
RC:4
140 La Aspirina mejora al 60%. El paracetamol al 70%.
Diferencias NO son estadísticamente significativas, p<0,05. 146. Si al realizar un test de Hipótesis, el resultado es no
Potencia del test de Hipótesis del 40%: significativo, la probabilidad asociada es:

1. El error tipo II es del 60%. 1. pf0,01.


2. Afirmamos que pueden ser ambos tratamientos iguales. 2. pf0,05.
3. Hay menos del 50% de posibilidades de encontrar 3. p> 0,05.
diferencias si las hubiera. 4. p> 0,005.
4. El error tipo I es menor del 5%. S. p= 0,01.
5. Todas son ciertas.
RC:3

32
GoBIR Preguntas propias 1 Asignatura: Estadística

147. Para comprobar la homogeneidad de varias medias


independientes se usa el test no paramétrico de: 153. El error tipo II se define como la probabilidad de:

l. Kruskal-Wallis. l. Aceptar Ho cuando es cierta.


2. McNemar. 2. Rechazar Hoy Hl.
3. Cohcran. 3. Rechazar Ho cuando es falsa.
4. Wilcoxon. 4. Aceptar Ho cuando es falsa.
5. Friedmann. 5. Rechazar Ho cuando es cierta.

RC:1 RC:4

148. Planteado un diseño experimental, y fijada una 154. ¿Qué significa que un coeficiente de correlación de
prueba de hipótesis, si se aumenta el tamaño de las Pearson es de "-0,9" :
muestras:
l. Que hay una mala correlación entre las dos variables.
l. Aumenta la probabilidad de error a y b. 2. Que la relación es inversa o negativa.
2. Disminuye la probabilidad de error a y b. 3. Que la relación es lineal.
3. Aumenta la probabilidad de error a. 4. Que la relación es muy buena.
4. Disminuye la probabilidad de error b. 5. Ciertas 2, 3 y 4.
5. Aumenta la probabilidad de error a y disminuye la de b.
RC:5
RC:4

149. Si se desea realizar un contraste de hipótesis, ¿Cuál 155. ¿Qué significa un Coeficiente de Correlación de
de las siguientes situaciones es mejor?: Pearson de +0,95?

l. a= 0,05 y b = 0,05. l. Que no hay relación lineal.


2. a = 0,05 y b = 0,10. 2. Que la relación lineal es muy buena.
3. a = 0,01 y b = 0,05. 3. Que la relación es inversa.
4. a = 0,01 y b = 0,10. 4. Que cuando una variable aumenta, la otra disminuye.
5. a = 0,01 y b = 0,01. 5. Son todas falsas.

RC:5 RC:2

150. Si la Ho es cierta y la aceptas: 156. La existencia de relación entre dos variables


cuantitativas se verifica mediante el test de:
l. La probabilidad es 1- a.
2. La probabilidad la fija el investigador. l. Independencia (contingencia).
3. Se usa como mínimo un intervalo del 95% 2. De Mann-Whitney.
4. Es el tamaño del test de Hipótesis. 3. ANOVA (Análisis de la Varianza).
5. Son todas ciertas. 4. Correlación.
5. Chi-Cuadrado.
RC:5
RC:4
151. Un test de Hipótesis es tanto mejor cuanto mayor sea
su: 157. Para estudiar la relación entre dos variables
cuantitativas se puede usar:
l. Confianza.
2. Potencia. l. Coeficiente de Correlación de Pearson.
3. Facilidad de cálculo. 2. Coeficiente de Correlación de Spearman.
4. Nivel de significación. 3. Coeficiente de Contingencia de Pearson.
5. Error Tipo 11. 4. Regresión.
5. Ciertas 1, 2 y 4.
RC:2
RC:5
152. El error tipo I se define como la probabilidad de:
158. E Cuadrado de Coeficiente de Correlación r de
l. Aceptar Ho siendo cierta. Pearson {r2) se denomina:
2. Aceptar Hoy Hl.
3. Rechazar Ho siendo cierta. l. Coeficiente de Asimetría.
4. Rechazar Ho siendo falsa. 2. Coeficiente de Contingencia.
5. Aceptar Ho siendo falsa. 3. Coeficiente de Determinación.
4. Coeficiente de Indeterminación.
RC:3 5. Coeficiente kappl.

33
Preguntas propias 1 Asignatura: Estadística

2. Dos Var. Continuas.


RC:3 3. Dos Var. Cualitativas.
4. Una Cualitativa y otra Discreta.
159. ¿Cuál de las siguientes propiedades se refiere a la 5. Ninguna es correcta.
Covarianza?
RC:2
l. Es un estadístico de posición.
2. Es un estadístico adimensional. 165. Es Coeficiente de Correlación (r) de Pearson, puede
3. Es un coeficiente no paramétrico. tomar valores entre:
4. Puede tomar valores negativos.
5. Su valor oscila entre -1 y +l. 1.-1 yO.
2. O y l.
RC:4 3. -1 y l.
4. -0,5 y 1,5.
160. El coeficiente de Correlación de Pearson puede 5. -1,5 y 1,5.
usarse:
RC:3
l. Cuando la relación entre dos variables no sea lineal.
2. Cuando una de las dos variables no sea cuantitativa. 166. El Coeficiente de Correlación de Pearson sirve para
3. Cuando la relación entre las variables sea lineal. estudiar:
4. Cuando se desconozca la distribución de las variables.
5. Cuando el nº de datos sea pequeño. l. Relación entre dos variables Cuantitativas de tipo
logarítmico.
RC:3 2. Relación lineal entre dos variables. de cualquier tipo.
3. Relación exponencial entre dos variables Cuantitativas.
161. El estadístico de dispersión que permite conocer el 4. Relación lineal entre dos variables. Dicotómicas.
grado de variación conjunta entre dos variables 5. Relación lineal entre dos variables Cuantitativas.
cuantitativas es:
RC:5
l. Varianza.
2. Desviación Típica o estándar. 167. El Coeficiente de Correlación de Pearson (r):
3. Covarianza.
4. Rango o recorrido. l. Varía entre -1 y+ l.
5. Coeficiente de Variación. 2. Tiene el mismo signo que la Covarianza de la que
procede.
RC:3 3. Sirve para estudiar la relación lineal entre dos Var.
Cuantitativas.
162. Para comparar correctamente, desde un punto de 4. Si se eleva al cuadrado, es el Coeficiente de
vista descriptivo, la dispersión de dos o más variables Determinación.
debe usarse: 5. Son todas ciertas.

l. La desviación estándar. RC:5


2. La amplitud.
3. El Coeficiente de Variación. 168. La existencia de relación entre dos Var. Cualitativas
4. La covarianza. se verifica mediante el test de:
5. La desviación media.
l. U de Mann-Whitney.
RC:3 2. Independencia (Contingencia).
3. Correlación.
163. Siendo "a" la ordenada en origen y "b" la pendiente 4. Linealidad.
de la recta, la ecuación de regresión la recta de regresión 5. 2 y 3 son ciertas.
de y sobre x es:
RC:2
l. y'= b+ax.
2. y'= a+bx. 169. Los grados de libertad de una tabla de contingencia
3. x'= b+ay. (independencia) 2x2 son:
4. x'= a+by.
5. y'= a+b/x. l. l.
RC:2 2. 2.
3. 3.
164. El Coeficiente de Correlación de Pearson (r) es una 4. 4.
medida de relación lineal entre: 5. 5.

1. Dos Var. Discretas. RC: 1

34
Preguntas propias 1 Asignatura: Estadística

170. Los grados de libertad de una tabla de contingencia 176. Si en una Tabla de Contingencia de 2x2, hay algún
5x8 son: valor menor de 5:

l. 40. l. Se le suma 5.
2. 38. 2. Se agrupan filas o columnas.
3. 28. 3. Se hace una Regresión.
4.14. 4. Se divide por la Media.
5. 2. 5. Se usa la Corrección de Yates.

RC:3 RC:5

171. Los grados de libertad de la Ji-Cuadrado de Pearson, 177. El Coeficiente de Contingencia (de Pearson):
en una tabla de contingencia (independencia) 3x2 son:
l. Mide la correlación entre dos Var. Cuantitativas.
l. O 2. Mide el grado de asociación entre dos Var. Cualitativas.
2. 3. 3. Es lo mismo que el Coeficiente de Correlación de
3. 6. Pearson.
4. 2. 4. Va desde O a +l.
5. l. 5. Ciertas 2 y 4.

RC:4 RC:5

172. El Coeficiente de Contingencia (de Pearson): 178. La Distribución Chi-Cuadrado se emplea para el test
de:
l. Mide la Correlación entre dos Var. Cuantitativas.
2. Mide la asociación entre dos Var. Cualitativas. l. Dos Medias paramétrico.
3. Mide la Variación entre medias apareadas. 2. Bondad de ajuste.
4. Es un índice de centralización. 3. Independencia (contingencia).
5. Todas son falsas. 4. Tres Medias paramétrico.
5. Ciertas 2 y 3.
RC:2
RC:5
173. El Coeficiente de Contingencia es un índice de:
179. La Distribución de probabilidad usada para comparar
l. Asimetría. 2 varianzas es:
2. Curtosis.
3. Asociación. l. Ji-Cuadrado.
4. Normalidad. 2. F de Fisher-Snedecor.
5. Ninguna es correcta. 3. Poisson.
4. T de Student.
RC:3 5. Binomial.

174. La Distribución Chi-Cuadrado se usa: RC:2

l. Tablas de Contingencia. 180. El estudio de la relación entre una Var. Cuantitativa, y


2. Homogeneidad de varias muestras Cualitativas. una Cualitativa de más de dos categorías, se hace
3. Bondad de ajuste de una distribución. mediante:
4. Test de Homogeneidad de varios parámetros de Poisson.
5. Todas son ciertas. l. El Coeficiente de Correlación de Pearson.
2. El Coeficiente de Contingencia de Pearson.
RC:5 3. El Coeficiente de Paciencia de Buda.
4. El Test de Friedmann.
175. Si en una tabla de Contingencia, mayor que 2x2, hay 5. El Análisis de la Varianza.
más de un 20% de valores teóricos menores de 5, antes de
hacer el Test de la Ji-Cuadrado: RC:5

l. No hay que hacer nada. 181. Los requisitos previos que deben cumplir las
2. Hay que transformar la tabla, agrupando filas o muestras para hacer el ANOVA:
columnas.
3. Hay que hacer como si no lo hubiéramos visto. l. Han de ser Aleatorias.
4. Hay que hacer la corrección de Yates. 2. Han de ser independientes.
5. Hay que hacer un Análisis de la Varianza. 3. Las variables deben ser Normales en la población.
4. Las Varianzas de las muestras han de ser Homogéneas.
RC:2 5. Todas son ciertas.

35
Preguntas propias 1 Asignatura: Estadística

l. Se acaba el estudio.
RC:5 2. Se realiza un test a posteriori de Comparaciones
Múltiples.
182. La Hipótesis de normalidad de la Variable se 3. Se realiza un test no paramétrico.
comprueba con el Test: 4. Se realiza un test de homogeneidad de la Varianzas.
S. Se realiza un test de bondad de ajuste.
l. De Wilcoxon.
2. De Friedmann. RC:2
3. De Barlet.
4. De Kruskal-Wallis. 188. Uno de los siguientes test estadísticos, es un test de
S. De Agostino. Normalidad:

RC:5 l. Barlet.
2. Agostino.
183. El Análisis de la Varianza (ANOVA) se usa para: 3. Kruskal-Wallis.
4. Levene.
l. Comprobar la asociación entre una variable Cuantitativa S. Neyman-Pearson.
y una Cualitativa de más de dos categorías.
2. Comprobar la homogeneidad de varias muestras RC:2
apareadas.
3. Comparar entre sí tres o más medias. 189. La posible asociación entre dos variables cualitativas
4. Comprobar la asociación entre dos variables Cualitativas. seve:
S. Ciertas 1, 2 y 3.
l. Test de la
RC:5 Ji-Cuadrado.
2. Ji-Cuadrado con corrección de Yates.
184. Qué test estadístico permite comparar dos o más 3. Test exacto de FISHER.
muestras independientes en condiciones de normalidad. 4.ANOVA.
S. Ciertas 1, 2 y 3.
l. Friedmann.
2. Wilcoxon. RC:5
3. Barlet.
4. Kolmorogoff-Smirnow. 190. La posible asociación entre dos variables
S. Análisis de la Varianza. cuantitativas se estudia con:

RC:5 l. Coeficiente de Correlación de Pearson.


2. Coeficiente de Correlación de Spearman.
185. Cuál no es un test "a posteriori) en el Análisis de la 3. Regresión Lineal.
Varianza. 4. Regresión Logarítmica.
S. Son todas ciertas.
l. Tukey.
2. Dunnet. RC:5
3. Bonferrony.
4. Barlet. 191. La asociación entre una Var. Cuantitativa y una
S. Todos son test "a posteriori". Cualitativa de más de dos categorías se ve con:

RC:4 l. Ji-Cuadrado.
2. Test de McNemar.
186. La Hipótesis de Homogeneidad de las Varianzas se 3. ANOVA.
verifica mediante el test de: 4. "T" de Student.
S. Hipergeométrica.
l. Wilcoxon.
2. Levene. RC:3
3. Los signos.
4. Barlet. 192. La asociación entre una Var. Cuantitativa, y otra
S. 2 y 4 son ciertas. Cualitativa de 2 categorías se estudia con:

RC:5 l. Ji-Cuadrado.
2. T de Student.
187. Si la F entre grupos resulta ser significativa en un 3. ANOVA.
Análisis de la Varianza, del criterio de clasificación 4. "U" de Mann-Whitney.
(modelo fijo) realizado para comparar el efecto de cuatro S. Ciertas 2 y 4.
fármacos, qué debe hacerse a continuación:
RC:5

36
Preguntas propias 1 Asignatura: Estadística

193. La asociación entre una Cuantitativa y una Cualitativa RC:4


de dos categorías (método no paramétrico):
199. La asociación de varias Medias apareadas, se verifica
l. Test de la Ji-Cuadrado. mediante:
2. "U" de Mann-Whitney.
3. Coeficiente de Corr. de Spearman. 1. Test de McNemar.
4. Test de Kruskal-Wallis. 2. Test de Ji-Cuadrado.
5. T de Student. 3. ANOVA de medias repetidas.
4. Test de Friedmann.
RC:2 5. Ciertas 3 y 4.

194. El test no paramétrico, para estudiar la asociación RC:5


entre una Var. Cuantitativa, y una Cualitativa de más de
dos categorías: 200. Uno de los siguientes NO es un test NO
PARAMÉTRICO:
1. Test de Barlet.
2. Test de Tukey. 1. "U" de Mann-Whitney.
3. Test de Bonferroni. 2. Test de Kruskall-Wallis.
4. Test de Kruskall-Wallis. 3. Coeficiente de Correlación de Spearman.
5. Test de Friedmann. 4. Test de Wilcoxon.
5. ANOVA.

RC: 4 RC:5

195. Es test no paramétrico, para estudiar la relación entre 201. Como se pueden comparar dos Medias:
dos Var. Cuantitativas es:
l. Test de Ji-Cuadrado.
1. Coeficiente de Correlación de Spearman. 2. Test de McNemar.
2. Coeficiente de Correlación de Pearson. 3. Test de Cohcran.
3. Coeficiente de Correlación de Barlet. 4. "T" de Student.
4. Test de Wilcoxon. 5. Correlación.
5. Ciertas 1 y 2.
RC: 1 RC:4

196. Cual de los siguientes es un dato apareado: 202. ¿Cuál es un método NO PARAMÉTRICO, de comparar
dos medias?:
1. Talla entre hombres y mujeres.
2. Relación talla-peso. 1. "T" de Student.
3. Glucemia en diabéticos y en no diabético. 2. Test de la Ji-Cuadrado.
4. Glucemia antes y después de comer. 3. Test de Wilcoxon.
5. Agudeza visual en reptiles. 4. Test de Friedmann.
5.ANOVA.
RC:4
RC:3
197. La asociación entre dos Var. Cualitativas, apareadas,
se verifica con: 203. ¿Cómo se pueden comparar varias Medias?:

l. ANOVA. l. ANOVA.
2. Ji-Cuadrado. 2. Test de Kruskall-Wallis.
3. Test de McNemar. 3. Test de Friedmann.
4. ''T'' de Student. 4. Test de McNemar.
5. Test de Friedmann. 5. Ciertas 1, 2 y 3.

RC:3 RC:5

198. La asociación de dos Medias de tipo apareado, se 204. ¿Con cuál se pueden comparar dos proporciones?:
hace con:
l. Test de la Ji-Cuadrado.
1. El test de McNemar. 2. Test de McNemar.
2. Correlación de Spearman. 3. Test de Barlet.
3. Ji-Cuadrado. 4. Test de Wilcoxon.
4. "T" de Student apareada. 5. Ciertas 1 y 2.
5. ANOVA.
RC:5

37
Preguntas propias 1 Asignatura: Estadística

205. ¿Cómo se pueden comparar dos proporciones?: 211. Para convertir una distribución Exponencial en un
Distribución Normal se usa la transformación:
l. Test de la Ji-Cuadrado.
2. Test de McNemar. l. Recíproca.
3. Test de Cohcran. 2. Angular.
4. Test de Wilcoxon. 3. Logarítmica.
S. Ciertas 1 y 2. 4. Cuadrada.
S. Ordinal.
RC:5
RC:3
206. Para comparar varias proporciones, con datos
independientes, se aplica el test de: 212. Si se pretende convertir una Distribución de Poisson
en una Distribución Normal, se aconseja usar la
l. La Ji-Cuadrado. transformación:
2. Cohcran.
3. McNemar. l. De la raíz cuadrada.
4. Wilcoxon. 2. Recíproca.
5.ANOVA. 3. Angular.
4. Logarítmica.
RC:1 S. Ninguna es correen.

207. ¿Con cuál de los siguientes se pueden comparar dos RC: 1


Varianzas, con datos independientes?
213. La estimación de Medias se hace con:
l. "T" de Student.
2. "F" de Snedecor. l. La distribución Normal.
3. Test de Agostino. 2. El Error Estándar.
4. Distri. Binomial. 3. La distribución ''T" de Student.
S. Test de Cohcran. 4. La distribución Binomial.
S. Ciertas 1, 2 y 3.
RC:2
RC:5
208. ¿Con cuál de los siguientes se pueden comparar dos
Varianzas, con datos apareados? 214. La estimación de porcentajes se hace con: (señale lo
FALSO):
l. A ojo.
2. ''T'' de Student. l. La distribución Normal.
3. "F" de Snedecor. 2. La distribución "T" de Student.
4. Test de McNemar. 3. La distribución Binomial.
S. Test de Wilcoxon. 4. El porcentaje muestra!.
S. El Error Estándar del Porcentaje.
RC:3
RC:2
209. ¿Cuál de los siguientes permite comparar varias
Varianzas?: 215. Señale lo falso:

l. Friedmann. l. Si una variable cualitativa solo acepta dos posibilidades


2. Pearson. se llamara dicotómica.
3. Levene. 2. El número de hijos es una variable cuantitativa discreta.
4. Agostino. 3. El nivel de colesterol es una variable cuantitativa
S. Wilcoxon. continua.
4. Las variables cualitativas proporcionan más información
RC:3 que las cuantitativas.
S. Cuando una variable cuantitativa es susceptible de ser
210. ¿Cuál de los siguientes permite comparar varias ordenada de un modo lógico y ascendente o descendente
Varianzas?: se dice que es ordinal.

l. Agostino. RC:4
2. Pearson.
3. Barlet. 216. Señale lo falso en relación con la media aritmética:
4. Wilcoxon.
5. McNemar. l. Es una medida de posición.
2. Sus unidades de medida son las mismas que las de la
RC:3 variable que se describe.

3B
Preguntas propias 1 Asignatura: Estadística

3. Es un índice muy fiable porque en su cálculo intervienen 2. Chi-cuadrado.


todos los valores de la distribución. 3. t de Student.
4. Este índice solo tiene sentido con datos cuantitativos. 4. Coeficiente de correlación de Pearson.
5. Todas son falsas. 5. Ninguna de las anteriores.

RC:1 RC:3

217. Hablando del coeficiente de variación, señale lo que 222. Se desea comparar la prevalencia de hipertensión
es cierto: entre hombres y mujeres. Al aplicar la prueba de la Chi-
cuadrado, los grados de libertad serán:
l. Es el cociente entre la desviación estándar y la media.
2. No tiene dimensiones. l. l.
3. Es independiente de las unidades de medida. 2. 2.
4. Es una medida de dispersión relativa que permite 3. 4.
comparar la dispersión de dos distribuciones diferentes. 4. 6.
5. Todo lo anterior es cierto. 5. 3.

RC:5 RC: 1

218. En relación con la distribución normal, ¿Cuál de las 223. Hablando de regresión y correlación, señala lo
siguientes afirmaciones es falsa?: verdadero:

l. Es una distribución de probabilidad teórica discreta. l. En la regresión interviene una variable dependiente y
2. La distancia entre el eje vertical trazado en la media y el una o más independientes.
punto de inflexión de la curva es la desviación estándar. 2. En la correlación las dos variables juegan un papel
3. Es simétrica y unimodal. simétrico.
4. Cualquier valor entre - infinito y + infinito es 3. Estudian la relación entre dos variables cualitativas.
teóricamente posible. 4. Una y dos son ciertas.
5. Tiene forma de campana. 5. Todas son ciertas.

RC:1 RC:4

219. Respecto a las pruebas de significación señala lo 224. El error estándar es:
falso:
l. Un índice de dispersión.
l. Es un procedimiento por el cual nos decidimos por la 2. Un índice de centralización.
hipótesis nula (Ho) o por la alternativa {Hl). 3. La desviación típica de la curva de Gauss tipificada.
2. La Ho es la hipótesis de la no diferencia. 4. Otro nombre de la desviación típica.
3. La Hl es la que se pone a prueba al realizar una prueba 5. Todas son ciertas.
estadística de significación.
4. La Hl es al que se aceptará si el resultado de la prueba RC:1
permite rechazar la Ho.
5. La significación estadística es la condición resultante del 225. Hablando de índices de validez de una prueba
rechazo de la Ho mediante las pruebas de significación. diagnóstica, señala lo verdadero:

RC:3 l. La sensibilidad es el cociente entre verdaderos positivos y


el total de sanos.
220. Señale lo cierto sobre el grado de significación 2. La especificidad es el cociente entre verdaderos
estadística o valor "p": negativos y total de enfermos.
3. El valor predictivo positivo es el cociente entre
l. Es la probabilidad de que la Ho sea cierta. verdaderos positivos y total de individuos con resultado del
2. Es la probabilidad de que el resultado observado se deba test positivo.
al azar. 4. Son ciertas 1 y 3.
3. Su valor depende de la magnitud del efecto y del número 5. Son ciertas 2 y 3.
de sujetos estudiados, entre otros.
4. Una y dos son ciertas. RC:3
5. Todas son ciertas.
226. Si la especificidad de un test de screening para una
RC:5 determinada enfermedad es de 95%, podemos esperar
que:
221. Queremos comparar la talla media entre hombres y
mujeres, ¿Cuál será la prueba estadística más apropiada?: l. El test será positivo en el 95% de los individuos con
enfermedad.
l. F de Snedecor.

39
Preguntas propias 1 Asignatura: Estadística

2. Será negativo en el 95% de los individuos sin 232. En relación a la varianza señale lo verdadero:
enfermedad.
3. Entre los individuos con test positivo, el 95% tendrán la 1. Es una medida de dispersión.
enfermedad. 2. La varianza se define como la media de la suma de
4. Entre los individuos con test negativo, el 95% no tendrán cuadrados de las diferencia entre cada valor de la variable y
la enfermedad. la media aritmética de la distribución.
5. Ninguna de las anteriores. 3. Las unidades de medida de la varianza son las de la
variable que describe al cuadrado.
RC:2 4. Junto con la media, define una distribución normal.
5. Todas son ciertas.
227. El test no paramétrico que determina la asociación
entre dos variables cuantitativas es el de: RC:5

1. Student. 233. Se llama potencia o poder de una prueba estadística:


2. ANOVA.
3. Wilcoxon 1. Al riesgo que voluntariamente asume el investigador, de
4. Kruskal-Wallis. equivocarse al rechazar su Ho cuando en realidad es cierta.
5. Correlación de Spearman. 2. A la probabilidad de que el resultado observado se deba
al azar.
RC:5 3. A la probabilidad de rechazar Ho cuando es verdadera.
4. A la probabilidad de rechazar Ho cuando es falsa.
228. Para comprobar la homogeneidad de varias 5. A la probabilidad Ho si es cierta.
proporciones t con datos apareados se usa el test de:
RC:4
1. Chi-cuadrado.
2. ANOVA. 234. ¿Cuál de las siguientes pruebas debe utilizarse para
3. Friedmann. comparar tres medias observadas tres muestras
4. Cohcran. independientes?
5. Student
RC:4 1. Chi-cuadrado.
2. t de Student.
229. Es un test a posteriori: 3. ANOVA.
4. Coeficiente de correlación de Pearson.
1. Chi-cuadrado. 5. Ninguna de las anteriores.
2. Bartlett.
3. F de Snedecor. RC: 3
4. Tukey.
5. Ninguno de los anteriores. 235. Respecto a la prueba estadística de la Chi-cuadrado,
señala lo falso.
RC:4
1. Se emplea para estudiar la relación entre dos variables
230. Un estudio ha codificado el hábito tabáquico de los cuantitativas.
sujetos estudiados como: fumador importante, moderado 2. Se basa en las diferencias entre las frecuencias
y no fumador. ¿Qué escala de medida ha utilizado? observadas y las esperadas.
3. En ocasiones precisa una corrección por discontinuidad.
1. De intervalo. 4. Requiere que ninguna frecuencia esperada sea menor de
2. Ordinal. 1 y no más del 20% de ellas menor o igual que 5.
3. De razón. 5. Si el valor de X2 exp es mayor que de la X2 teórica,
4. Nominal. rechazamos la Ho.
5. Ninguna de las anteriores.
RC: 1
RC:2

231. La medida de posición que corresponde al valor de la 236. El rango intercuartílico es:
variable más frecuente en la distribución se llama:
1. Un índice de dispersión.
1. Pe rce nti l. 2. Un índice de centralización.
2. Mediana. 3. La desviación típica de la curva de Gauss tipificada.
3. Media aritmética. 4. Otro nombre de la desviación típica.
4. Moda. 5. Todas son correctas.
5. Ninguna de las anteriores.
RC:1
RC:4

40
Preguntas propias 1 Asignatura: Estadística

237. Los resultados de un estudio sobre la relación de dos 242. Para comprobar la homogeneidad de dos varianzas
variables señalan la siguiente ecuación de Regresión para datos apareados se usa el test de:
Lineal: Y=3+0.8x. Señala lo verdadero con relación a ella:
l. Bartlett.
l. La variable dependiente (y) aumenta en 0.8 por cada 2. Levene.
unidad de aumento de la variable independiente (X). 3. t de Student.
2. El valor de la variable dependiente cuando la 4. F de Snedecor.
independiente vale O es igual a 3. 5. ANOVA.
3. La pendiente de la recta vale 0.8.
4. La ordenada en el origen de la recta vale 3. RC: 1
5. Todas son correctas.
243. ¿Que test se usa para comparar medidas repetidas?:
RC:5
l. Wilcoxon.
238. ¿Cuál de las siguientes afirmaciones es verdadera? 2. Friedmann.
3. T-Student para datos apareados.
l. La sensibilidad de una prueba diagnostica mide su 4. 1, 2 y 3 son correctas.
capacidad para detectar la enfermedad que se estudia S. 1, 2 y 3 son falsas.
cuando dicha enfermedad está presente.
2. La especificación de un test diagnóstico mide su RC:4
capacidad para descartar la enfermedad que se estudia
cuando dicha enfermedad está ausente. 244. En una muestra de pacientes, el número de varones
3. Cuanto mayor sea la sensibilidad de una prueba dividido entre el total de pacientes es:
diagnóstica menor será la proporción de falsos negativos.
4. 1 y 3 son ciertas. l. Una frecuencia relativa.
5. Todas son ciertas. 2. Una frecuencia absoluta.
3. Una variable cuantitativa.
RC:5 4. Una variable cualitativa.
5. Un valor de la variable.
239. Señale lo cierto sobre le coeficiente de correlación:
RC:1
l. Es una medida de asociación lineal entre dos variables.
2. Su valor va de -1 a +l. 245. Cuál de las siguientes medidas define mejor la
3. No tiene unidades. tendencia central de los datos: 5 , 4, 42, 4, 6
4. Cuando su valor es O decimos que las dos variables no
tienen relación lineal. l. La mediana.
5. Todas son ciertas. 2. La media.
3. El sesgo
RC:5 4. El rango.
S. La proporción.
240. Hablando de regresión y correlación, señale lo falso:
RC:1
l. Estudia la relación entre dos variables cualitativas.
2. En la regresión interviene una variable dependiente y 246. Para comparar la variabilidad relativa de la tensión
una o más independientes. arterial diastólica y el nivel de colesterol en sangre de una
3. En la correlación las dos variables juegan un papel serie de individuos, utilizamos
simétrico.
4. La pendiente de la recta de regresión lineal indica lo que l. Las desviaciones típicas.
aumenta la variable dependiente por cada unidad de 2. Los rangos.
aumento de la variable independiente. 3. Los coeficientes de variación.
5. La ordenada en el origen indica el valor de la variable 4. La diferencia de las medias.
dependiente cuando la independiente vale O. S. La diferencia de las varianzas.

RC: 1 RC: 3
241. ¿Que test mide la relación entre dos variables
cualitativas? 247. Si al calcular el coeficiente de correlación de dos
variables X e Y, se tiene r=-0.20 ocurre que
l. Wilcoxon.
2. ANOVA. l. La pendiente de la recta de regresión es pequeña.
3. Chi-cuadrado. 2. La pendiente de la recta de regresión es grande.
4. t de Student. 3. X e Y están poco relacionadas, aunque cuando X
5. Friedmann. decrece, Y tiene tendencia a crecer.
4. El modelo lineal de regresión explica el 20% de la
RC:3 varianza de una variable cualquiera en función de la otra.

41
Preguntas propias 1 Asignatura: Estadística

5. El modelo lineal de regresión explica el 80% de la RC:3


varianza de una variable cualquiera en función de la otra.
253. Se realiza una auditoría de historias clínicas tomando
RC: 3 una primera historia al azar y después sucesivamente, la
que ocupa la vigésima posición detrás de la anterior. Este
248. La media aritmética de una variable cuantitativa: procedimiento de muestreo se denomina:

l. Es siempre un valor de la variable. l. Por conglomerados.


2. No tiene sentido calcularla para variables discretas. 2. Sistemático.
3. Es el valor más representativo de una modalidad. 3. Correlativo.
4. Si la variable es discreta, puede no ser única. 4. Consecutivo.
5. Existe siempre. 5. Equidistante.

RC: 5 RC:2

249. Las siguientes medidas son todas de centralización, 254. Se realiza un estudio con objeto de determinar el
excepto: tiempo de supervivencia en pacientes con cáncer. Para
ello de los dos hospitales existentes en una ciudad, se
l. La media. selecciona aleatoriamente uno de ellos, y se elige una
2. La moda. muestra aleatoria de pacientes, atendiendo al tipo de
3. La mediana. cáncer: El muestreo realizado es:
4. Rango intercuartílico.
5. El percentil 50. l. Sistemático.
2. Aleatorio.
RC:4 3. Por conglomerados.
4. Estratificado.
250. Al analizar una serie estadística de datos, ¿puede 5. Por conglomerados y estratificado.
ocurrir que la desviación sea mayor que la media?
RC:5
l. Teóricamente no es posible, pero puede ocurrir por los
errores de redondeo. 255. Para conocer los índices predictivos en un test
2. Siempre ha de ser la media mayor que la desviación diagnóstico para una enfermedad que tiene un 1% de
típica. afectados en la población, será necesario conocer:
3. A lo sumo puede ser igual a la media.
4. La desviación típica a de ser como máximo igual a la l. Sensibilidad y verdaderos positivos
media para que la suma de cuadrados no sea negativa. 2. Prevalencia.
5. En general no hay relación entre la varianza y la media. 3. Verdaderos positivos y prevalencia.
4. Especificidad y verdaderos negativos
RC:5 5. Falsos positivos y verdaderos positivos.

251. La función de densidad de una variable aleatoria RC: 5


continua:
256. La covarianza de dos variables:
l. Siempre es no negativa.
2. Es la derivada de la función de distribución. l. Es la raíz cuadrada del coeficiente de correlación.
3. El área encerrada por ella y el eje X vale uno. 2. Es la media de las varianzas.
4. Todo lo anterior es cierto. 3. Es una medida de la variabilidad común.
5. Sólo (a) y (c) son correctas. 4. Es siempre positiva.
5. Todas las anteriores afirmaciones son ciertas.
RC:4
RC:3
252. En un estudio descriptivo se obtiene una que el peso
tiene una media de 60 kg y una desviación típica de 20 kg., 257. Si la probabilidad de tener la enfermedad A es del
mientras que la media de las edades es 15 años, con una 5%, la de tener la enfermedad B es del 10% y la de tener al
desviación típica de 5 años. Entonces: menos una de las dos es del 13%, ¿cuál es la probabilidad
de tener las dos?
l. Hay más dispersión en pesos que en edades.
2. Hay más dispersión en edades que en pesos. l. Cero
3. Peso y edad están dispersos de modo equivalente. 2. 1%
4. No tiene sentido compararlos al no coincidir las 3. 2%
unidades de medida. 4. 5%
5. Para comparar ambas dispersiones debemos usar la 5. 8%
covarianza.
RC:3

42
Preguntas propias 1 Asignatura: Estadística

258. Qué propiedad o propiedades caracterizan a una 263. La edad de los individuos de una población sigue una
distribución normal tipificada frente a una distribución distribución normal. Se extrae aleatoriamente una
normal cualquiera: muestra de 300 pacientes cuya media es de 50 años, y la
desviación típica es 10 años. Entonces:
l. El área bajo su función de densidad es igual a l.
2. Su media es 1 y su desviación típica es O. l. Aproximadamente el 95% de los pacientes tienen
3. Su rango de valores oscila entre O y 3. edades entre 30 y 70 años.
4. Su media es O y su desviación típica es l. 2. Existe una probabilidad del 95% de que la verdadera
5. Son ciertas (c) y (d) media de la población esté entre 30 y 70 años.
3. Aproximadamente el 95% de los pacientes tienen
RC:4 edades entre 40 y 60 años.
4. Existe una probabilidad del 95% de que la verdadera
259. Cierto tests diagnóstico acierta sobre el 100% de los media de la población esté entre 40 y 60 años.
individuos enfermos y el 50% de los sanos. Cierta persona 5. Existe una probabilidad del 95% de que la verdadera
pasa el test con resultado negativo. Entonces: media de la población esté entre 45 y 55 años.

l. Esta sana. RC:1


2. Esta enferma.
3. Existe una probabilidad del 50% de que esté sana. 264. Un estudio sobre la efectividad de un fármaco llega a
4. Existe una probabilidad del 75% de que esté sana. la conclusión de que éste es mejor que el placebo con
5. Existe una probabilidad del 75% de que esté enferma. p<0,05 ¿Cuál es la interpretación correcta de este
resultado?
RC: 1
l. Con toda seguridad, el tratamiento es mejor que el
260. ¿Cómo se calcula la sensibilidad de un test placebo.
diagnóstico? 2. La probabilidad de que el nuevo tratamiento sea mejor
que el placebo es superior al 95%.
l. Contabilizando el número de tests positivos en una 3. El tratamiento es un 95% más efectivo que el placebo.
muestra aleatoria de individuos. 4. La probabilidad de que el placebo sea mejor que el
2. Contabilizando el número de tests negativos en una nuevo fármaco es menor de 5%.
muestra aleatoria de individuos. 5. Si el tratamiento no fuese efectivo, existe menos del 5%
3. Contabilizando el número de tests positivos en una de probabilidad de observar unas muestras tan contrarias a
muestra aleatoria de enfermos. dicha hipótesis como las obtenidas.
4. Contabilizando el número de tests negativos en una
muestra aleatoria de sanos. RC:5
5. Ninguna de las anteriores es cierta.
265. En un contraste de hipótesis la cantidad p es:
RC:3
l. Un número pequeño.
261. Cierto test diagnóstico acierta sobre el 100% de los 2. Fijada antes de realizar el contraste.
individuos sanos y el 0% de los individuos enfermos. 3. La probabilidad de rechazar la hipótesis nula.
Elegida una persona al azar: 4. La probabilidad de error al rechazar la hipótesis
alternativa.
l. Hay una probabilidad del 50% de que esté enferma. 5. Conocida al extraer la muestra y calcular el estadístico
2. Hay una probabilidad del 0% de que esté enferma. experimental.
3. Hay una probabilidad del 100% de que esté enferma.
4. El test será negativo. RC:5
5. Ninguna de las anteriores es cierta.
266. En todo contraste de hipótesis:
RC:4
l. Se acepta la hipótesis de mayor probabilidad.
262. El nivel de significación de un test de hipótesis: 2. Se rechaza la hipótesis de menor probabilidad.
3. La hipótesis nula se elige según el principio de
l. Suele ser pequeño y lo fija el investigador o un convenio simplicidad científica.
generalmente aceptado. 4. Todo lo anterior es cierto.
2. Da la probabilidad de declarar significativo el resultado 5. Es necesario contrastar la normalidad de los datos.
de un test, cuando esto es falso.
3. Al disminuir hace aumentar la probabilidad del error de RC:3
tipo 11.
4. Todo lo anterior es cierto. 267. Un contraste de hipótesis se considera significativo si:
5. Todo lo anterior es falso.
l. Una muestra aleatoria es coherente con la hipótesis
RC:4 nula.

43
Preguntas propias 1 Asignatura: Estadística

2. Una muestra aleatoria no es coherente con la hipótesis la mejor estimación del número de pacientes que tienen
nula. un nivel de glucemia entre 90 y 105
3. La hipótesis alternativa es más probable que la nula.
4. Todo lo anterior es cierto. l. 15.
5. Son ciertas {b) y (c). 2. 17
3. 20
RC:2 4. 25
5. 34
268. Se desea estimar confidencialmente el número medio
de veces que asiste a un servicio de salud los individuos de RC:2
una población. Para ello se toman muestras aleatorias
entre los individuos que asisten regularmente a los 273. Señale cual de las siguientes afirmaciones es
mismos. Esta técnica de muestreo es: verdadera:

l. Un muestreo aleatorio simple. l. La media, la mediana y el rango orientan sobre la


2. Un muestreo aleatorio estratificado. tendencia central de los datos.
3. Un muestreo aleatorio por conglomerados. 2. La desviación típica me orienta sobre la "validez" de la
4. Incorrecta. media.
5. Ninguna de las anteriores. 3. El rango me orienta sobre la simetría de la distribución.
4. Las marcas de clase de una variable cualitativa se
RC:4 calculan como los puntos medios de los intervalos.
5. La media, mediana y moda resumen todo tipo de
información de los datos.
269. Un contraste de hipótesis se considera no
significativo sí: RC: 2

l. Una muestra aleatoria es coherente con la hipótesis 274. En una población, hay tantos hombres como mujeres,
nula. el 20% son varones y fumadores y el 20% de las mujeres
2. Una muestra aleatoria no es coherente con la hipótesis fuman. Entonces:
nula.
3. La hipótesis nula es más probable que la alternativa. l. Fuman tantos hombres como mujeres.
4. Todo lo anterior es cierto. 2. Por cada mujer fumadora hay dos hombres fumadores.
5. Son ciertas(a) y (c). 3. Por cada hombre fumador hay dos mujeres fumadoras.
4. Hay un 40% de fumadores en la población.
RC:l 5. Nada de lo anterior es cierto.

270. Señale cuál de las siguientes afirmaciones es falsa: RC:2

l. La aparición o no de bacterias en un cultivo es una 275. En una población, el peso tiene medía 60 kg y
variable dicotómica desviación típica 6Kg. La altura tiene de media 170cm y
2. La estatura de un individuo es una variable cuantitativa desviación 6cm. Cierto individuo tiene un peso de 70 Kg y
discreta. altura 180cm.
3. El lugar que ocupa una persona entre sus hermanos {de
menor a mayor edad) es una variable ordinal. l. La altura tiene un valor más extremo que el peso.
4. El estado civil es una variable cualitativa. 2. El peso es menos extremo que la altura.
5. La glucemia es continua. 3. Peso y altura son valores igualmente extremos.
4. El peso es más extremo que la altura.
RC:2 5. La altura es menos extrema que el peso.

271. ¿Cuál de las siguientes características no se RC:3


corresponde con el concepto de mediana?

l. Es el centro de gravedad de la distribución. 276. Señale cuál de las siguientes afirmaciones es falsa:
2. No se ve afectada por los valores extremos.
3. Deja por debajo el mismo número de datos que por l. La media aritmética es siempre el centro de gravedad de
encima. la distribución.
4. Es el segundo cuartil. 2. En una distribución continua simétrica, media y mediana
S. Todo lo anterior se corresponde con la mediana. coinciden.
3. La media aritmética cambia cuando cambia algún dato.
RC:l 4. La mediana no siempre cambia cuando lo hace algún
dato.
272. En un grupo de 50 pacientes se ha obtenido un valor 5. En las distribuciones continuas simétricas todas las
de glucemia medio de 90mg/dl, con una desviación típica medidas de centralización coinciden.
de 15. Suponiendo la normalidad de los datos, ¿cuál será

44
Preguntas propias 1 Asignatura: Estadística

RC:5 282. En una población se obtiene con una bondad de


ajuste de 0,9 que la relación entre nivel de glucemia (Y) y
277. El coeficiente de variación: nivel de colesterol (X) es de Y=20 + X/4. Entonces:

l. Permite comparar la dispersión de dos poblaciones. l. Todos los individuos con un valor de colesterol 100,
2. Es menor que la media. presentan glucemia 45.
3. Es menor que la desviación típica. 2. Existe tendencia a que a mayor nivel de glucemia, mayor
4. No depende de la media ni la desviación típica. nivel de colesterol.
S. Depende de la escala que se use al medir la variable. 3. Hay más individuos con colesterol alto que con glucemia
baja.
RC:1 4. Las observaciones se muestran como una nube de
puntos creciente.
278. Los diagramas de sectores son muy útiles para S. Sólo dos de las afirmaciones anteriores son correctas.
comparar:
RC:5
l. Dos variables cualitativas en una población.
2. Dos variables cuantitativas en una población. 283. Dos variables numéricas son incorreladas. Entonces:
3. Una variable cualitativa en dos poblaciones.
4. Una variable cuantitativa en dos poblaciones. l. r=O
S. Una variable cuantitativa con otra cualitativa. 2. El modelo lineal de regresión sólo propone un valor
como predicción de Y.
RC: 1 3. La nube de puntos no presenta aspecto creciente.
4. La varianza residual en el modelo de regresión de Y
279. Entre las siguientes afirmaciones, indica cual es sobre X es igual a la varianza de Y.
incorrecta: S. Todo lo anterior es cierto.

l. Un estimador de la varianza es el cociente del sumatorio RC:5


de la diferencia entre cada observación y la media, elevado
al cuadrado, y el número de observaciones. 284. Se pide a unos enfermos que valoren su grado de
2. La mediana es el centro de gravedad de los datos. mejoría tras un tratamiento en una escala de 1 a S. De la
3. Un coeficiente de variación próximo a cero puede indicar siguiente colección de posibilidades, cuál cree que resume
una muestra homogénea. mejor los mismos:
4. El cociente entre la desviación típica y la media es una
medida relativa de variabilidad. l. Media, Mediana y Moda.
S. El coeficiente de variación se mide en porcentaje. 2. Percentil 25, Percentil 50, Percentil 75.
3. Media y desviación típica.
RC:2 4. Mediana y desviación típica.
S. Mínimo y máximo.
280. En el caso de una variable ordinal, el número n de
datos válidos es: RC:2

l. La suma de las frecuencias absolutas. 285. Al aplicar un tratamiento a un paciente, puede que
2. La frecuencia absoluta acumulada de la categoría más este empeore, no le haga efecto, o mejore. Si dicho
frecuente. tratamiento se aplica a una población de 100 pacientes,
3. La suma de las frecuencias relativas. ¿qué medidas cree que resumen mejor los datos?
4. La frecuencia relativa acumulada en la última categoría.
S. La (a) y la (d) son ciertas. l. Media, mediana, moda, desviación típica y asimetría.
2. Mediana y coeficiente de variación.
RC: 1 3. Media y coeficiente de variación.
4. Percentil 25, percentil 50 y percentil 75.
281. La recta de regresión de Y sobre X se muestra como S. Ninguna de las anteriores.
un buen modelo para explicar la relación entre dos
variables numéricas. Entonces: RC:5

l. Y se puede calcular exactamente como una función 286. En cierta población se observa la distribución de los
matemática de X. grupos sanguíneos. Si queremos resumir la información
2. Y es independiente de X. obtenida podemos utilizar:
3. La covarianza de X e Y no es nula.
4. La media de X coincide con la media de Y. l. Moda.
S. Sólo dos de las afirmaciones anteriores son correctas. 2. Mediana.
3. Frecuencias acumuladas absolutas.
RC:3 4. Frecuencias relativas.
5. Nada de lo anterior.

45
Preguntas propias 1 Asignatura: Estadística

RC:4 l. Aumentar el tamaño muestra! y la confianza.


2. Aumentar el tamaño muestra! y disminuir la confianza.
287. De las siguientes medidas, cuáles podría utilizar para 3. Aumentar la confianza.
argumentar en favor o en contra de la asimetría de la 4. Disminuir la varianza muestra l.
variable edad: 5. Aumentar la varianza muestra!.

l. Percentil 25 y percentil 75. RC:2


2. Media y Percentil 60.
3. Media y mediana 293. Se realiza un estudio para saber si dos tratamientos
4. Media y desviación típica. de quimioterapia presentan diferencias en cuanto a la
5. Ninguna de las anteriores. supervivencia de los pacientes. No se encontró diferencia
estadísticamente significativa. ¿Cuál de las siguientes
RC:3 razones podrían ser causantes del resultado?

288. La pregunta: ¿qué nivel de colesterol sólo es l. Los tratamientos ofrecen tiempos de supervivencia muy
superado por el 5% de los individuos?, tiene por diferentes.
respuesta: 2. El nivel de significación es demasiado alto.
3. Las muestras son demasiado numerosas.
l. El percentil 95. 4. Las muestras son demasiado pequeñas.
2. El percentil 5. 5. Nada de lo anterior.
3. Los percentiles 2,5 y 97,5
4. 95%. RC:4
5. Nada de lo anterior.
294. De las siguientes, cuál se corresponde con un error de
RC:1 tipo 11:

289. Qué peso no llega a alcanzar el 40% de los individuos l. Aceptar que un tratamiento ineficaz produce efectos
de una población: útiles.
2. Rechazar que un tratamiento ineficaz produce efectos
l. El 40%. útiles.
2. El 60%. 3. Aceptar que un tratamiento eficaz produce efectos
3. El percentil 60. útiles.
4. El percentil 40. 4. Rechazar que un tratamiento eficaz produce efectos
5. Los percentiles 20 y 60. útiles.
5. Nada de lo anterior es cierto.
RC:4
RC:4
290. Si al realizar un análisis de regresión la covarianza
coincide con el producto de las desviaciones típicas de las 295. Para estudiar la efectividad de un test diagnóstico
variables, puedo asegurar que: ante una enfermedad se toma un grupo de 200 personas
enfermas y 200 que no la padecen, y se observan los
l. La ordenada en el origen de la recta no es cero resultados. ¿Qué podemos estimar directamente de ellos?
2. La recta pasa por las medias de las variables
3. Existe una correlación lineal perfecta entre las variables. l. La sensibilidad y especificidad del test.
4. Todas las anteriores son ciertas. 2. La incidencia de la enfermedad en la población.
5. Son correctas (b) y (c). 3. El índice predictivo de verdaderos positivos.
4. Son correctas (a) y (c).
RC:5 5. Todo lo anterior.

RC: 1
291. Una distribución presenta asimetría negativa siempre
que: 296. La estadística en Ciencias de la Salud se utiliza para
obtener información sobre situaciones de carácter:
l. Hay más valores negativos que positivos.
2. Hay menos valores negativos que positivos. l. Determinista.
3. No es simétrica. 2. Sistemático.
4. La media es menor que la varianza. 3. Exhaustivo.
5. Nada de lo anterior es cierto. 4. Aleatorio.
5. Excluyente.
RC: 5
RC:4
292. En un intervalo de confianza para una media,
buscamos disminuir el margen de error. Cuál de las 297. Elija la afirmación que pueda considerarse admisible
siguientes posibilidades nos permite realizarlo: al leer un estudio estadístico:

46
Preguntas propias 1 Asignatura: Estadística

l. Se estudió a una muestra en vez de a la población, para RC: 5


mayor precisión.
2. Se estudió a la población para obtener información 302. Elija la opción correcta.
sobre la muestra.
3. Se estudió a una muestra representativa de la población. l. Un parámetro es algo calculado sobre cada individuo.
4. Se estudiaron todas las variables de la población. 2. Un parámetro es calculado sobre la muestra.
5. Se observó a un individuo de cada variable. 3. Una variable se calcula sobre los parámetros de una
población.
RC:3 4. Un estadístico se calcula sobre la población.
5. Nada de lo anterior es correcto.
298. Elija la afirmación correcta:
RC:5
l. Los valores de cualquier variable deben ser agrupados
en intervalos. 303. La calificación de selectividad que sólo es superada
2. Las variables deben ofrecer valores que no se repitan en por el 12% de los estudiantes se denomina:
los diferentes individuos.
3. Las modalidades de una variable deben poder ser l. Percentil 12.
observadas en todos los individuos. 2. Cuantil 0,88
4. Los individuos pueden poseer diferentes modalidades de 3. Cuantil 0,12
la misma variable. 4. Decil 88
5. Todo lo anterior es falso. 5. Nada de lo anterior es correcto.

RC:3 RC:2

299. En cuanto a la presentación ordenada del estudio de 304. En una población, el 70% de las alturas consideradas
una variable aislada: "más normales" se encuentran:

l. Lo más informativo es mostrar las medidas de tendencia l. Por encima del percentil 70.
central. 2. Por debajo del cuantil 0,30
2. Lo más informativo es mostrar las medidas de 3. Entre el percentil 30 y el 70
dispersión. 4. Entre el percentil 15 y el 85.
3. Se deben presentar todos los valores observados de la 5. Entre la media y la mediana.
variable, uno a uno, de menor a mayor.
4. Las representaciones gráficas dan más información que RC:4
las tablas de frecuencia.
5. A veces no tiene sentido usar frecuencias acumuladas. 305. Las medidas de centralización, en cuanto a la
información que ofrecen sobre una variable numérica,
RC:5 preferimos (por orden, de peor a mejor):

300. En las representaciones gráficas de variables l. Media, mediana, moda


cualitativas, la regla fundamental a tener en cuenta es: 2. Moda, media, mediana
3. Media, moda, mediana.
l. Las alturas en cada modalidad son proporcionales al 4. No se puede en general recomendar una como mejor
valor de la variable. que las otras.
2. Las áreas para cada modalidad son proporcionales al 5. Todo lo anterior es falso.
valor de la variable.
3. Las áreas para cada modalidad son proporcionales a las RC:4
frecuencias acumuladas.
4. Las áreas para cada modalidad son proporcionales a las 306. Si una muestra posee valores anómalos, de las
frecuencias absolutas o relativas. siguientes cuál usarías como medida de dispersión:
5. Las alturas para cada modalidad son proporcionales a las
frecuencias acumuladas. l. Varianza.
2. Desviación típica.
RC:4 3. Rango intercuartílico.
4. Rango.
301. Entre las representaciones gráficas para variables 5. Máximo y coeficiente de variación.
cualitativas tenemos:
RC:3
l. Histogramas.
2. Diagramas integrales. 307. Si queremos saber cómo de disperso está una
3. Diagramas diferenciales. variable relativamente con respecto a la magnitud de los
4. Diagramas de cajas y bigotes. valores centrales de la misma, usaremos:
5. Nada de lo anterior.
l. Varianza.

47
GoBIR Preguntas propias 1 Asignatura: Estadística

2. Desviación típica. 313. En una población formada por unidades familiares, la


3. Rango intercuartílico. altura media del padre en la familia se comporta como
4. Rango. una distribución normal de media 170 cm con desviación
5. Coeficiente de variación. típica 5 cm. La altura del primer hijo varón es otra variable
con distribución similar. Con estos datos podemos afirmar:
RC:5
1. No hay relación entre ambas variables.
308. Si el coeficiente de asimetría en una población 2. Hay relación inversa entre las variables.
presenta el valor 0,99 entonces: 3. No debemos intentar predecir la altura del hijo de un
padre que mide 140cm.
l. La distribución presenta una cola a la derecha. 4. Hay relación directa entre las variables.
2. La distribución presenta una cola a la izquierda. 5. Nada de lo anterior.
3. La distribución es más apuntada que la normal.
4. La distribución es menos apuntada que la normal. RC:3
5. La distribución es prácticamente simétrica.
314. El porcentaje de individuos fumadores o con
RC:1 bronquitis se puede interpretar como una probabilidad:

309. Si la media del peso en una población es 60 kg. y la l. De un suceso intersección


mediana 65kg., entonces afirmamos que la distribución 2. Condicionada.
del peso en la población es: 3. De un suceso unión.
4. A posteriori.
1. Platicúrtica. 5. De un suceso complementario.
2. Mesocúrtica.
3. Leptocúrtica. RC:3
4. Asimétrica.
5. Unimodal. 315. El porcentaje de individuos con bronquitis entre los
fumadores se puede interpretar como una probabilidad:
RC:4
1. De un suceso intersección
310. De las siguientes parejas de variables, en cuáles crees 2. Condicionada.
que puede ser útil un análisis de regresión lineal: 3. De un suceso unión.
4. A posteriori.
l. La presión sanguínea y el grupo sanguíneo. 5. De un suceso complementario.
2. El nivel de colesterol y la concentración de bilirrubina.
3. El grupo sanguíneo y el factor Rh. RC:2
4. El género y la edad.
5. Poseer ideología racista y el factor RH. 316. El porcentaje de individuos con bronquitis que
además son fumadores se puede interpretar como una
RC:2 probabilidad:

311. Si el coeficiente de correlación lineal de Pearson 1. De un suceso intersección


entre dos variables es -0,8 podemos decir: 2. Condicionada.
3. De un suceso unión.
l. La covarianza es negativa. 4. A posteriori.
2. La relación entre las variables es directa. 5. De un suceso complementario.
3. Hay poca relación lineal entre las variables.
4. Hay un error de cálculo. RC:1
5. El 80% de las predicciones son correctas.
317. El 12% de los individuos de una población padece
RC: 1 osteoporosis. EL 25% de ellos lo sabe. ¿Qué tasa de
individuos tiene osteoporosis y lo desconoce?
312. En un estudio de regresión lineal, donde el peso se
estudie conjuntamente con otras variables, en qué casos 1. 3%
lo usarías como variable dependiente: 2. 6%
3. 9%
l. Al estudiarlo con la altura. 4. 12%
2. Al estudiarlo con el nivel del colesterol. 5. 25%
3. Al estudiarlo con la presión sanguínea.
4. Al estudiarlo con el grupo sanguíneo. RC:3
5. Nada de lo anterior.
318. La osteoporosis afecta 4 veces más a mujeres que a
RC:1 hombres. El 8% de las mujeres padece osteoporosis en

48
Preguntas propias 1 Asignatura: Estadística

una población donde hay tantos hombres como mujeres. RC:2


¿Cuál es la prevalencia de la osteoporosis en la población?
323. Se quiere hacer un estudio sobre el tabaquismo en la
l. 2% provincia de Málaga. Queremos asegurarnos tener cierto
2. 5% número de individuos de la zona litoral, la capital y del
3. 8% interior, pues creemos que en cada una de esas zonas la
4. 10% incidencia es diferente. Haremos un muestreo:
5. 12%
l. Aleatorio simple.
RC:2 2. Estratificado.
3. Sistemático.
319. Elija la afirmación correcta relativa a pruebas 4. Por grupos.
diagnósticas: 5. No probabilístico.

l. La sensibilidad se obtiene usando la noción subjetiva de RC:2


probabilidad.
2. El índice predictivo positivo se obtiene directamente de 324. Una estimación confidencial para un nivel de
la noción frecuentista de probabilidad. confianza fijado, da por respuesta:
3. La tasa de verdaderos positivos se obtiene directamente
de la noción frecuentista de probabilidad. l. Una aproximación de la media.
4. La prevalencia de la enfermedad se obtiene a partir del 2. Una aproximación de una proporción.
teorema de Bayes. 3. Una probabilidad.
5. nada de lo anterior es cierto. 4. Un intervalo.
5. Un nivel de significación.
RC:3
RC:4
320. De los siguientes, qué me puede servir directamente
para saber si una observación de una variable aleatoria es 325. Se realiza un experimento donde nos basaremos en
anómala: un contraste de hipótesis para tomar una decisión con un
nivel de significación del 1%. De las siguientes cuál no es
l. El valor de la función de densidad. un resultado posible de un contraste de hipótesis:
2. El valor de la función de distribución.
3. El valor esperado de la variable. l. El experimento no es concluyente.
4. El valor de la varianza. 2. El experimento permite obtener conclusiones.
5. Nada de lo anterior. 3. Se rechaza la hipótesis nula.
4. Se rechaza la hipótesis alternativa.
RC:2 5. Se acepta la hipótesis alternativa.

321. El nivel medio de glucemia en una población tiene un RC:4


comportamiento gausiano co n media lSOmg/dl, y un
coeficiente de variación del 10%. Entre qué valores se 326. En un contraste de hipótesis, típicamente, la región
sitúa el 95% de los individuos de la población. crítica:

l. Entre 140 y 160. l. Tiene probabilidad pequeña, si la hipótesis nula fuese


2. Entre 130 y 170. cierta.
3. Entre 120 y 180. 2. Esta situada en la zona de mayor probabilidad, si la
4. Entre 110 y 190. hipótesis nula fuese cierta.
5. Entre 100 y 200. 3. Tiene probabilidad grande, si la hipótesis nula fuese
cierta.
RC:3 4. Tiene probabilidad pequeña, si la hipótesis alternativa
fuese cierta.
322. Deseamos conocer la opinión de los ciudadanos de 5. Nada de lo anterior.
Málaga sobre el sistema de salud pública. Para ello
elegimos una muestra aleatoria de entre los abonados a RC:1
telefónica. Entonces:
327. Elija la afirmación falsa:
l. La población de estudio es la de los ciudadanos de
Málaga. l. El nivel de significación es normalmente un valor
2. La población de estudio es la de los abonados a pequeño.
telefónica. 2. La significación de un contraste es conocida tras analizar
3. La población objetivo es la de los abonados a telefónica. los datos.
4. El conjunto de abonados a telefónica son la muestra. 3. El nivel de significación de un contraste debe ser fijado
5. Nada de lo anterior es cierto. antes de analizar los datos.

49
Preguntas propias 1 Asignatura: Estadística

4. Un contraste debe ser declarado significativo antes de S. De un suceso complementario.


recoger los datos.
S. Un contraste es declarado significativo si se obtiene una RC:2
muestra que discrepa mucho de la hipótesis nula.
333. Disponemos de la distribución de edades de los
RC:4 individuos de una población. El número de ellos que no es
mayor de edad, es:
328. Cuando la población objetivo y de estudio en un
muestreo difieren mucho, entonces: l. Una frecuencia relativa.
2. Una frecuencia absoluta.
l. Debe usarse el método de respuestas aleatorizadas. 3. Una frecuencia acumulada.
2. Pueden existir sesgos. 4. Una variable numérica.
3. No pueden seleccionarse unidades de muestreo. S. Una variable cualitativa.
4. Se debe usar un muestreo no probabilístico.
S. Nada de lo anterior es correcto. RC:3

RC:2 334. Medimos el número de glóbulos rojos y el de blancos


en cada individuo de una población. Se observa
329. Para estudiar el perímetro torácico en un grupo de determinada variabilidad en esas cantidades. Queremos
militares, se elige una muestra de 100 individuos, con 95 saber de qué tipo de célula se presenta mayor variabilidad
cm de media y 5 cm de desviación típica. Elija la
afirmación correcta: l. Compararemos las desviaciones típicas.
2. Compararemos los rangos.
l. La media de la población valdrá 95cm. 3. Estudiaremos la covarianza.
2. La media de la población sería un valor comprendido 4. Estudiaremos el coeficiente de correlación lineal de
entre 90 y 100 cm con confianza del 68%. Pearson.
3. La media de la población será un valor comprendido S. Compararemos los coeficientes de variación.
entre 95 y 100 cm con confianza del 95%.
4. La media de la población será un valor comprendido RC:S
entre 94 y 96 cm con confianza del 95%.
S. Todo lo anterior es falso. 335. En una población, el 5% son enfermos diagnosticados
de una enfermedad, la cual padece el 10% de la población.
RC:4 La probabilidad de estar diagnosticado para un individuo
enfermo es:
330. Si el coeficiente de asimetría en una población
presenta el valor -5,22 entonces: l. 2%
2. 5%
l. La distribución presenta una cola a la derecha. 3. 15%
2. La distribución presenta una cola a la izquierda. 4. 50%
3. La distribución es más apuntada que la normal. S. No puede calcularse con esos datos.
4. La distribución es menos apuntada que la normal.
S. Ese valor de asimetría es imposible. RC:4

RC:2 336. Una prueba diagnóstica de cierta enfermedad, tiene


una tasa de aciertos del 90% tanto sobre enfermos como
331. Si el coeficiente de correlación lineal de Pearson sanos. La incidencia de la enfermedad en la población es
entre dos variables es -0,1 podemos decir: del 50%. Si se pasa el test a una persona y sale positivo, la
probabilidad de que realmente esté enferma es:
l. La covarianza es pequeña.
2. Hay fuerte relación inversa entre las variables. l. 45%
3. Hay poca relación lineal entre las variables. 2. 50%
4. Hay un error de cálculo. 3. 75%
S. El 10% de las predicciones son correctas. 4. 90%
S. 100%
RC:3
RC:4
332. El 2% de la población padece diabetes. Si de ellos, el 337. La concentración de calcio se comporta en los
30% no está diagnosticado, esta cantidad puede mamíferos como una distribución normal de media 10 y
entenderse como una probabilidad ... desviación típica 2. ¿Con qué frecuencia se encuentran
mamíferos con una concentración superior a 14?
l. De un suceso intersección
2. Condicionada. 1. 95%
3. De un suceso unión. 2. 68%
4. A posteriori. 3. 50%

50
Preguntas propias 1 Asignatura: Estadística

4. 5%
5. 2,5% RC:2

RC:5 343. En un grupo de niños se tiene una altura media de


150cm con desviación típica de 10cm. La edad media es 12
338. En una muestra de 1000 mujeres se estudia su años, con desviación típica de 3 años. ¿Dónde se presenta
número de hijos. Si quiero tener el máximo de mayor dispersión?
información sobre la variable del estudio, preferimos:
l. En edades.
l. Media, Mediana y Moda. 2. En alturas.
2. Percentil 25, Percentil 50, Percentil 75. 3. Las dispersiones son similares.
3. Media y desviación típica. 4. No se puede decir con esos datos qué variable está más
4. Media, mediana, cuartiles, asimetría, curtosis y dispersa.
desviación típica. 5. Nada de lo anterior.
5. Distribución de frecuencias
RC:1
RC:5
344. De las siguientes representaciones gráficas, cual
339. Una variable continua presenta una fuerte asimetría muestra directamente las observaciones extremas:
positivl. De entre las siguientes posibilidades, cuál es
preferible para resumir la información que hay en la l. Diagrama de excesos
muestra. 2. Barras.
3. El diagrama de observaciones atípicas.
l. La mediana. 4. Pictograma
2. La media y la desviación típica. 5. Cajas de Tukey.
3. Los cuartiles.
4. El mínimo y el máximo. RC:5
5. El diagrama de cajas de Tukey.
345. El peso presenta una distribución con gran asimetría
RC:5 positiva en un grupo de individuos obesos. ¿Qué valor
divide a los mismos en dos grupos con la misma cantidad
340. El 3% de los individuos tiene una altura superior a de individuos?
190cm. El 5% mide menos de 150cm. Conocemos:
l. La moda
l. El percentil 3 2. El percentil 25.
2. El cuantil 0,06 3. El percentil 75
3. El percentil 95 4. La media.
4. El percentil 97 5. Ninguno de los anteriores.
5. Nada de lo anterior.
RC: 5
RC:4
346. Se observa que al disminuir el consumo de comida
341. Elija la afirmación correcta sobre teoría de muestreo: rápida, disminuye el nivel de colesterol en sangre. Se usa
un modelo de regresión entre ambas que ofrece una
l. La población de estudio es aquella de la que finalmente bondad de ajuste del 36%. Entonces:
extraeremos una muestra aleatoria.
2. El sesgo de selección es la diferencia existente entre la l. El 36% de las predicciones del modelo son correctas.
población de estudio y la muestra. 2. r= +0.60
3. Cuando se pueda, se prefieren los muestreos no 3. r= +0.36
probabilísticos. 4. r= -0.60
4. El muestreo aleatorio simple es normalmente el más 5. r= -0.36
económico en la práctica.
5. El mejor tipo de muestreo es el sistemático. RC:2

RC:1 347. Un modelo de regres1on lineal para calcular la


glucemia (sangre) a partir de la de la orina (glucosuria)
342. De los siguientes conceptos indique el que no tenga es"glucemia=20+ 0.5 glucosuria". Si dos personas se
sentido: diferencian en 10 unidades de glucosuria, cual es la mejor
estimación que puede hacer para la diferencia en
l. Diagrama de barras para la variable "Grupo sanguíneo" glucemia:
2. Pictograma para la variable "Altura"
3. Diagrama integral para la variable "Nivel de colesterol" l. 5
4. Diagrama de sectores para la variable "Sexo" 2. 10
5. Histograma para la variable "Peso" 3. 15

51
Preguntas propias 1 Asignatura: Estadística

4. 20 2. Diagrama de barras
5. 25 3. Diagrama diferencial acumulado
4. Histograma
RC:1 5. No existe gráfica posible

348. El IMC se distribuye en una población de forma RC:4


normal. El 95% central de los individuos tiene un IMC
comprendido entre 20 y 24. Entonces: 353. Respecto a las medidas de centralización:

l. La media es 22. l. La media no debe usarse en distribuciones muy


2. La desviación típica es l. asimétricas
3. La curtosis es cero. 2. La moda puede no sería única.
4. Todas las anteriores son correctas. 3. En distribuciones simétricas media, mediana y moda
5. Sólo dos de las anteriores son correctas. coinciden.
4. Las tres anteriores son correctas.
RC:4 5. La a) y la b) son correctas

349. Una enfermedad tiene una incidencia del 50% en la RC:5


población. Un test para detectarla posee una tasa de
verdaderos positivos del 80%, y de falsos positivos del 354. Para medir la variabilidad de una variable utilizamos:
20%. Si un individuo resulta ser positivo, la probabilidad
de que esté enfermo es: l. El coeficiente de variación
2. La desviación típica
l. 20% 3. El coeficiente de determinación.
2. 40% 4. Todas las anteriores.
3. 50% 5. Sólo la a) y la b).
4. 60%
5. 80% RC: 5

RC:5 355. Si queremos comparar la variabilidad de dos variables


diferentes utilizaremos:
350. El consumo diario de Calorías se distribuye en una
población de forma normal, con media 2500 y desviación l. Las desviaciones típicas.
típica 100. Si elijo una muestra de tamaño 100, entre qué 2. Las puntuaciones típicas.
valores espero encontrar su media (con una probabilidad 3. Los coeficientes de variación.
del 95% de acertar): 4. Las varianzas.
5. Ninguna de las anteriores.
l. Entre 2400 y 2600.
2. Entre 2300 y 2700. RC:3
3. Entre 2490 y 2510.
4. Entre 2480 y 2520. 356. Qué afirmación sobre la covarianza es falsa:
5. Entre 2498 y 2502.
l. La covarianza es una medida de la variabilidad conjunta
RC:4 de dos variables numéricas.
2. Si la covarianza es positiva implica una relación creciente
entre las variables.
351. Se llama parámetro a: 3. A partir de ella se obtiene el coeficiente de correlación
lineal de Pearson.
l. Una función de valor numérico definida sobre alguna 4. Posee dimensiones.
característica observable en los individuos de una 5. Si es O podemos afirmar que no existe relación posible
población. entre las variables.
2. Una función definida sobre los valores numéricos de una
muestra. RC:5
3. Cualquier variable observable de una población
4. Las variables numéricas de la muestra 357. La pendiente de una recta de una función de
5. Cualquier función sobre las variables observadas regresión lineal Y = b0 + bl X:

RC: 1 l. Representa el incremento de Y por cada unidad de


incremento de X.
352. Si queremos representar gráficamente los 2. Tiene el mismo signo que la covarianza.
porcentajes de una variable cuantitativa continua 3. Es el valor de la variable Y cuando X=0.
debemos usar: 4. Todas las anteriores son correctas.
5. Sólo la a) y la b) son correctas.
l. Pictogramas

52
Preguntas propias 1 Asignatura: Estadística

RC:5 4. La hipótesis nula es aquella para la que buscamos


evidencia a favor.
358. Señala cual de las siguientes afirmaciones sobre el 5. La hipótesis alternativa se opone a la nula.
coeficiente de determinación es falsa:
RC:4
l. Es el porcentaje de variabilidad de una variable
explicado por la variabilidad de la otra. 363. El error de tipo I consiste en:
2. Coincide con el valor del coeficiente de correlación r2
3. Cuanto mayor sea la varianza residual en comparación l. rechazar H0 cuando es falsa.
con la varianza total de la variable dependiente, el 2. rechazar H0 cuando es cierta.
coeficiente estará más cercano a O. 3. No rechazar H0 cuando es falsa.
4. Cuanto mayor sea la varianza residual en comparación 4. No rechazar H0 cuando es cierta.
con la varianza total de la variable dependiente, el 5. La probabilidad de rechazar H0 cuando es falsa.
coeficiente estará más cercano a l.
5. Se utiliza para medir la bondad del ajuste. RC:2

RC: 4 364. En relación al diseño estadístico de los ensayos


clínicos, indique cuál de as siguientes afirmaciones es
359. Se define la sensibilidad de un test como: falsa:

l. La probabilidad de que si el test da positivo el sujeto l. El riesgo beta es la probabilidad de cometer un error
esté enfermo. tipo 11.
2. La probabilidad de que si el sujeto está enfermo el test 2. El riesgo alfa (p) indica la probabilidad de cometer un
de positivo. error tipo l.
3. La probabilidad de que si el test da negativo el sujeto 3. Un error de tipo I indica conclusiones falsamente
esté sano. negativas.
4. La probabilidad de que si el sujeto está sano el test de d. La probabilidad de obtener resultados verdaderos se
negativo. denomina poder estadístico.
5. Ninguna de las anteriores. 4. Un error de tipo I indica conclusiones falsamente
positivas.
RC:2
RC:3
360. En una población el 30% son hombres de los cuales
son deportistas el 20%, frente al 25% de las mujeres. 365. La probabilidad de tener hipertensión arterial y ser
Escogida una persona al azar es deportista. La mujer es del:
probabilidad de que sea mujer es (aproximadamente):
l. 50%
l. 0,235 2. 5%
2. 0,60 3. Se desconoce sino sabemos la población de referencia.
3. 0,74 4.30%
4. 0,25 5. 20%
5. No puede calcularse con esos datos.
RC:3
RC:3
366. Si un suceso está incluido en otro, su probabilidad:

361. Un intervalo de confianza será más amplio cuando: l. es mayor a la de éste.


2. es menor o igual a la de éste.
l. La varianza sea mayor 3. siempre valen ambos lo mismo.
2. El nivel de confianza sea mayor. 4. se desconoce.
3. El tamaño de muestra sea mayor. S. Depende del caso.
4. Todas las anteriores son correctas
5. Sólo dos de las anteriores son ciertas. RC:2

RC:5 367. Al lanzar dos monedas al aire la probabilidad de que


salgan dos cruces es de:
362. Señale la respuesta falsa en lo que concierne a los
contrastes de hipótesis: l. 1/4
2.0
l. La hipótesis nula puede ser rechazada. 3. 1
2. La hipótesis alternativa puede ser aceptada. 4. 1/2
3. Si no se rechaza la hipótesis nula, los resultados no son 5.2
concluyentes. RC:1

53
Preguntas propias 1 Asignatura: Estadística

368. Qué NO es cierto de la probabilidad de una variable RC:1


discreta X:
374. Cuál de las siguientes medidas define mejor la
l. O~ P(x) ~1 tendencia central de los datos: 5, 4, 42, 4, 6
2. P(x) ~ O.
3. Sumatoria de P(x) =1 l. La mediana.
4. Los valores que toma varían entre O y 1 (ambos 2. La media.
inclusive). 3. El sesgo
5. Todas son ciertas. 4. El rango.
5. La proporción.
RC:2
RC:1
369. Dos sucesos son compatibles cuando:
375. Señale cuál de las siguientes afirmaciones es falsa:
l. No tienen ningún suceso en común
2. Son a la vez sucesos compuestos. l. La aparición o no de bacterias en un cultivo es una
3. Tienen algún suceso elemental común. variable dicotómica
4. Porque incluye el suceso imposible. 2. La estatura de un individuo es una variable cuantitativa
5. La 3 y la 4 son ciertas. discreta.
3. El lugar que ocupa una persona entre sus hermanos (de
RC:3 menor a mayor edad) es una variable ordinal.
4. El estado civil es una variable cualitativa.
370. Los valores son exclusivos cuando: 5. La glucemia es continua.

l. Proporcionan exclusividad a las variables. RC:2


2. Dos de ellos no pueden ser ciertos en distintos tiempos.
3. Es sinónimo de exhaustivos. 376. Los diagramas de sectores son muy útiles para
4. Dos de ellos no pueden ser ciertos al mismo tiempo comparar:
5. Ninguna es cierta.
l. Dos variables cualitativas en una población.
RC:4 2. Dos variables cuantitativas en una población.
3. Una variable cualitativa en dos poblaciones.
371. En relación a los estudios de casos y controles, 4. Una variable cuantitativa en dos poblaciones.
indique cuál de las siguientes afirmaciones es falsa: 5. Una variable cuantitativa con otra cualitativa.

l. Permiten analizar varios factores de riesgo para una RC:1


misma enfermedad.
2. Menos costosos que los estudios de seguimiento. 377. Sobre el tipo de estadísticos utilizados para resumir o
3. Aplicables a enfermedades raras o con periodo de describir los datos, indique la afirmación incorrecta:
latencia largo.
4. Permiten estimar la incidencia. l. Para variables discretas puede ser suficiente reseñar la
5. Ninguna es cierta. proporción de sujetos que se incluyen en cada categoría.
2. En variables continuas se usan medidas de tendencia
RC:4 central.
3. Las medidas de tendencia central pueden dar idea de la
372. En relación a los estudios de cohortes indique cuál de magnitud de los datos.
las siguientes afirmaciones es falsa: 4. Las medidas de dispersión ayudan a interpretar entre
l. Facilitan el análisis de múltiples efectos qué márgenes se mueven los datos.
2. Permiten estimar incidencia 5. En variables cualitativas podemos utilizar proporciones y
3. Son útiles para enfermedades raras medidas de tendencia central.
4. Tienen un coste elevado
5. Todas son falsas. RC:5

RC:3
378. Si al calcular el coeficiente de correlación de dos
373. En una muestra de pacientes, el número de varones variables X e Y, se tiene r=-0.20 ocurre que
dividido entre el total de pacientes es:
l. La pendiente de la recta de regresión es pequeña.
l. Una frecuencia relativa. 2. La pendiente de la recta de regresión es grande.
2. Una frecuencia absoluta. 3. X e Y están poco relacionadas, aunque cuando X decrece,
3. Una variable cuantitativa. Y tiene tendencia a crecer.
4. Una variable cualitativa. 4. El modelo lineal de regresión explica el 20% de la
5. Un valor de la variable. varianza de una variable cualquiera en función de la otra.

54
Preguntas propias 1
GoBIR Asignatura: Estadística

S. El modelo lineal de regresión explica el 80% de la 2. Existe tendencia a que a mayor nivel de glucemia, mayor
varianza de una variable cualquiera en función de la otra. nivel de colesterol.
3. Hay más individuos con colesterol alto que con glucemia
RC:3 baja.
4. Las observaciones se muestran como una nube de
379. Si el cociente entre la varianza residual y la explicada puntos creciente.
por la regresión en un ajuste lineal es grande: S. Sólo dos de las afirmaciones anteriores son correctas.

l. El ajuste es bueno. RC:5


2. El ajuste es malo.
3. No puede usarse dicha información como medida de 384. En el modelo de regresión lineal de Y sobre X, se
bondad de un ajuste. obtiene una varianza residual de 10 y una varianza
4. El coeficiente de correlación lineal tiende a -1. explicada por el modelo lineal de regresión de 90. además
S. El coeficiente de correlación lineal es próximo a l. se observa que la nube de puntos tiene forma decreciente.
Entonces:
RC:2
1. La varianza de Y es 100.
380. La covarianza de dos variables: 2. r=0,9
3. r=-0,9
1. Es la raíz cuadrada del coeficiente de correlación. 4. La covarianza es de 1/9.
2. Es la media de las varianzas. S. Sólo dos de las afirmaciones anteriores son ciertas.
3. Es una medida de la variabilidad común.
4. Es siempre positiva. RC: 1
S. Todas las anteriores afirmaciones son ciertas.
385. Dos variables numéricas son incorreladas. Entonces:
RC:3
1. r=0
381. Se utiliza un modelo lineal de regresión para estimar 2. El modelo lineal de regresión sólo propone un valor
el tiempo de supervivencia de un enfermo terminal a como predicción de Y.
partir de un conteo de linfocitos. Se obtiene una varianza 3. La nube de puntos no presenta aspecto creciente.
explicada por el modelo de 40.000, y una varianza residual 4. La varianza residual en el modelo de regresión de Y sobre
de 2.000. ¿Qué se puede deducir directamente de estos X es igual a la varianza de Y.
datos? S. Todo lo anterior es cierto.

l. mayor número de linfocitos, probablemente será mayor RC: 5


el tiempo de supervivencia.
2. mayor número de linfocitos, con toda seguridad será 386. Si al realizar un análisis de regresión la covarianza
mayor el tiempo se supervivencia. coincide con el producto de las desviaciones típicas de las
3. Hay una buena relación lineal entre ambas variables. variables, puedo asegurar que:
4. El ajuste lineal es malo porque la varianza residual es
muy alta. 1. La ordenada en el origen de la recta no es cero
S. Las repuestas (a) y (c) son correctas. 2. La recta pasa por las medias de las variables
3. Existe una correlación lineal perfecta entre las variables.
RC:3 4. Todas las anteriores son ciertas.
S. Son correctas (b) y (c).
382. La recta de regresión de Y sobre X se muestra como
una buen modelo para explicar la relación entre dos RC:5
variables numéricas. Entonces:
387. Tenemos dos variables numéricas X e Y medidas
l. Y se puede calcular exactamente como una función sobre la misma población, y disponemos de media y
matemática de X. desviación típica de cada una de ellas. Cuanto mayor es el
2. Y es independiente de X. coeficiente de determinación en una regresión lineal:
3. La covarianza de X e Y no es nula.
4. La media de X coincide con la media de Y. 1. Mayor es la covarianza.
S. Sólo dos de las afirmaciones anteriores son correctas. 2. Mayor es r.
3. Menor es la varianza residual.
RC:3 4. Mayor es la relación lineal entre las dos variables
S. Sólo dos de las afirmaciones anteriores son correctas.
383. En una población se obtiene con una bondad de
ajuste de 0,9 que la relación entre nivel de glucemia (Y) y RC:5
nivel de colesterol (X) es de Y=20 + X/4. Entonces:
388. De las siguientes parejas de variables, en cuáles crees
1. Todos los individuos con un valor de colesterol 100, que puede ser útil un análisis de regresión lineal:
presentan glucemia 45.

55
Preguntas propias 1 Asignatura: Estadística

l. La presión sanguínea y el grupo sanguíneo. 3. r= +0.36


2. El nivel de colesterol y la concentración de bilirrubina. 4. r= -0.60
3. El grupos sanguíneo y el factor Rh. 5. r= -0.36
4. El género y la edad. RC:2
5. Poseer ideología racista y el factor RH.
394. Un modelo de regres,on lineal para calcular la
RC:2 glucemia (sangre) a partir de la de la orina (glucosuria)
es"glucemia=20+ 0.5 glucosuria". Si dos personas se
389. Si el coeficiente de correlación lineal de Pearson diferencian en 10 unidades de glucosuria, cual es la mejor
entre dos variables es -0,8 podemos decir: estimación que puede hacer para la diferencia en
glucemia:
l. La covarianza es negativa.
2. La relación entre las variables es directa. l. 5
3. Hay poca relación lineal entre las variables. 2.10
4. Hay un error de cálculo. 3. 15
5. El 80% de las predicciones son correctas. 4.20
5. 25
RC:1 RC:1

390. En un estudio de regresión lineal, donde el peso se 395. Qué afirmación sobre la covarianza es falsa:
estudie conjuntamente con otras variables, en qué casos
lo usarías como variable dependiente: l. La covarianza es una medida de la variabilidad conjunta
de dos variables numéricas.
l. Al estudiarlo con la altura. 2. Si la covarianza es positiva implica una relación creciente
2. Al estudiarlo con el nivel del colesterol. entre las variables.
3. Al estudiarlo con la presión sanguínea. 3. A partir de ella se obtiene el coeficiente de correlación
4. Al estudiarlo con el grupo sanguíneo. lineal de Pearson.
5. Nada de lo anterior. 4. Posee dimensiones.
5. Si es O podemos afirmar que no existe relación posible
RC:1 entre las variables.

391. En una población formada por unidades familiares, la RC:5


altura media del padre en la familia se comporta como
una distribución normal de media 170cm con desviación 396. La pendiente de una recta de una función de
típica 5 cm. La altura del primer hijo varón es otra variable regresión lineal Y= b0 + bl X:
con distribución similar. Con estos datos podemos afirmar:
l. Representa el incremento de Y por cada unidad de
l. No hay relación entre ambas variables. incremento de X.
2. Hay relación inversa entre las variables. 2. Tiene el mismo signo que la covarianza.
3. No debemos intentar predecir la altura del hijo de un 3. Es el valor de la variable Y cuando X=O.
padre que mide 140cm. 4. Todas las anteriores son correctas.
4. Hay relación directa entre las variables. 5. Sólo la a) y la b) son correctas.
5. Nada de lo anterior.
RC:5
RC:3
392. Si el coeficiente de correlación lineal de Pearson 397. Señala cual de las siguientes afirmaciones sobre el
entre dos variables es -0,1 podemos decir: coeficiente de determinación es falsa:

l. La covarianza es pequeña. l. Es el porcentaje de variabilidad de una variable explicado


2. Hay fuerte relación inversa entre las variables. por la variabilidad de la otra.
3. Hay poca relación lineal entre las variables. 2. Coincide con el valor del coeficiente de correlación r2
4. Hay un error de cálculo. 3. Cuanto mayor sea la varianza residual en comparación
5. El 10% de las predicciones son correctas. con la varianza total de la variable dependiente, el
coeficiente estará más cercano a O.
RC:3 4. Cuanto mayor sea la varianza residual en comparación
con la varianza total de la variable dependiente, el
coeficiente estará más cercano a l.
393. Se observa que al disminuir el consumo de comida 5. Se utiliza para medir la bondad del ajuste.
rápida, disminuye el nivel de colesterol en sangre. Se usa
un modelo de regresión entre ambas que ofrece una RC:4
bondad de ajuste del 36%. Entonces:
398. Para determinar si la ingesta total de líquidos reduce
l. El 36% de las predicciones del modelo son correctas. el riesgo de padecer cáncer de vejiga urinaria, se estudió
2. r= +0.60 durante 10 años la frecuencia de este cáncer en un grupo

56
Preguntas propias 1 Asignatura: Estadística

de 47.909 hombres que no lo tenían al inicio del estudio. l. La sensibilidad de la prueba es 0.97, luego es muy buena
De todos ellos se había obtenido información sobre el para hacer diagnóstico precoz.
consumo de líquidos y se comparó la frecuencia de 2. La especificidad de la prueba es 0.95, luego es muy mala
enfermedad según el volumen de líquidos consumidos para confirmar diagnósticos de sospecha.
agrupado por quintiles. Entre los resultados destacaba que 3. Al no conocer la prevalencia de "E" en este medio, no se
la ingesta total de líquidos se asoció con el cáncer de puede saber ni la sensibilidad ni la especificidad.
vejiga, de forma que para el quintil superior 4. El valor predictivo positivo de la prueba para diagnosticar
(ingestión>2.531 mL de líquidos por día) se calculó un "E" está entre 0.95 y 0.97, luego es muy buena para
riesgo relativo de 0.51 (intervalos de confianza al 95%: confirmar diagnósticos de sospecha.
0.32 a0.80) al comparar con el quintil inferior ( <1.290 mL 5. La sensibilidad de la prueba es de 0.95 y su especificidad
por día). Señale la respuesta correcta: es de 0.97. Hay que comparar estas cifras con las de otras
pruebas antes de introducir la nueva
l. Los autores han realizado un estudio de casos y
controles. RC:5
2. El valor de "p" obtenido a partir del estadístico de la
comparación de las medidas de frecuencia de cáncer de 402. La probabilidad de padecer estenosis coronaria en
vejiga entre los dos grupos de ingesta citados, debe ser hombres de más de 65 años, con angina de pecho de
mayor de O.OS esfuerzo típica, es mayor del 90%. A un paciente de estas
3. Se ha detectado un menor riesgo de padecer cáncer de características se le practica un ECG de esfuerzo que se
vejiga en las personas que consumían mayor volumen de informa como negativo. La sensibilidad es del 80% y su
líquidos por día. especificidad del 90%. ¿Cuál de las siguientes afirmaciones
4. El intervalo de confianza nos da una idea del grado de es correcta?.
precisión estadística del estudio, de forma que cuanto más
amplio, menos error aleatorio. l. Se puede descartar por completo estenosis coronaria
S. Los autores han realizado un estudio de correlación porque la prueba es negativa.
ecológica 2. No se puede excluir la estenosis coronaria porque el
valor predictivo positivo de la prueba es alto.
RC:3 3. No se puede excluir la estenosis coronaria porque el
valor predictivo negativo de la prueba es bajo.
399. Cuando en un contraste de hipótesis NO se rechaza la 4. Se podría descartar el diagnóstico de estenosis coronaria
hipótesis nula, ¿cuál de las siguientes afirmaciones es sí la especificidad de la prueba fuera del 100%.
correcta?: S. Los valores predictivos no son aplicables a esta situación
clínica.
l. Se ha demostrado que la hipótesis nula es verdadera.
2. Se ha demostrado que la hipótesis nula es falsa. RC:3
3. Se ha demostrado que la hipótesis alternativa es
verdadera. 403. El valor predictivo positivo de una prueba diagnóstica
4. Se ha demostrado que la hipótesis alternativa es falsa. para una enfermedad se estima por:
S. No se ha demostrado nada
RC:5 l. La proporción de individuos que al aplicarles la prueba
dan positivo.
400. En un ensayo clínico se comparan 3 tratamientos 2. La proporción de enfermos que al aplicarles la prueba
(p.e.placebo, tratamiento establecido y un tratamiento dan positivo.
nuevo). La variable respuesta es continua (p.e. nivel de 3. La proporción de positivos entre los enfermos.
glucosa en sangre). Aceptando que la variable tiene una 4. La proporción de enfermos entre los positivos.
distribución normal, la prueba correcta para comparar la 5. El número de enfermos que la prueba detecta.
respuesta es: RC:4

l. La "t" de Student. 404. En un estudio clínico, a una serie de pacientes se les


2. La de Wilcoxon. trata con un nuevo fármaco para estudiar, si, en un
3. El análisis de la varianza. periodo de tiempo después de la administración de dicho
4. La de Kruskal-Wallis. fármaco, el nivel de bilirrubina ha disminuido. Se acepta
5. La de la chi cuadrado que la distribución de la bilirrubina es normal, para este
diseño. ¿Cuál es la prueba estadística de elección?:
RC:3
l. T de Student para datos apareados.
401. Para estudiar la utilidad de una nueva prueba 2. T de Student para datos independientes.
diagnóstica para la enfermedad "E", se aplica a 100 3. Ji-cuadrado.
enfermos con "E" y resulta positiva en 95 y negativa en 5 4. Mann-Whitney.
y, luego, a l00sujetos sanos, sin "E", y resulta positiva en 3 5. Prueba exacta de Fisher
y negativa en 97. ¿Qué afirmación, de las siguientes, es
correcta?: RC: 1

57
Preguntas propias 1 Asignatura: Estadística

405. Supongamos un modelo de regresión lineal simple


que relaciona los niveles medios de Proteína C Reactiva RC:2
(PCR) medida en mmol/L como variable dependiente con
el número de articulaciones dolorosas o hipersensibles de 409. Para el cálculo del tamaño muestra! en un estudio
un paciente con artritis idiopática (variable descriptivo en el que la variable de interés es dicotómica
independiente). El modelo ajustado en una muestra de se precisa conocer los siguientes ingredientes, EXCEPTO
100 pacientes es el siguiente: fjy= 0,47 + 0,0&* En el uno:
modelo.¿Cómo se interpreta el coeficiente de 0,08?:
l. Proporción esperada de la variable de interés en la
l. Dado que es superior a 0,05, quiere decir que no existe población.
asociación entre las variables dependiente e independiente. 2. Precisión deseada del intervalo de confianza.
2. Es el cambio obtenido en la media de PCR como 3. El error beta asumible por el investigador.
consecuencia de pasar a tener una articulación adicional 4. Nivel de confianza del intervalo.
inflamada. 5. Fórmula para calcular el tamaño muestra! para un
3. Es el valor medio de la PCR para los sujetos con una sola estudio descriptivo con una variable dicotómica
articulación afecta.
4. Su cuadrado se interpreta como el porcentaje de RC:3
varianza de la variable dependiente explicado por el
modelo lineal. 410. Se ha realizado un ensayo clínico encaminado
5. Es el valor medio basal de PCR para los individuos sanos avalorar el descenso de la presión portal obtenido
{sin articulaciones afectas) después de la administración aguda de tres alternativas de
tratamiento (carvedilol, propranolol y placebo) en
RC:2 pacientes cirróticos con varices esofágicas. La variable de
respuesta es el gradiente de presión venosa hepática que
406. En un contraste de hipótesis estadístico, si la es continua y de distribución normal. ¿Cuál de las
hipótesis nula fuera cierta y se rechazara: siguientes pruebas estadísticas es la correcta para
comparar la respuesta?:
l. Se comete un error de tipo 11
2. Se toma una decisión correcta. 1. Una prueba de la t de Student.
3. La potencia aumenta. 2. Una prueba de Wilcoxon,
4. Se comete un error de tipo l. 3. Una prueba de Fisher.
5. Se toma la decisión más conservadora. 4. Un análisis de la varianza.
5. Una prueba U de Mann-Whitney
RC:4
RC:4
407. En un ensayo clínico para comparar dos fármacos, se
incluyen 75 pacientes en cada rama, la variable de interés 411. Para realizar un cribado en su primer momento o
es tiempo hasta que desaparecen los síntomas y el fase, ¿qué característica interna del test se suele
período de seguimiento es de 30 días. Al final de ese priorizar?:
período hay pacientes a los que no les han desaparecido
los síntomas. El análisis de los datos: l. Que sea muy sensible.
2. Que sea muy específico,
l. Se puede hacer con la prueba t de Student. 3. Que sea aplicable a muchas personas.
2. Se debe hacer con la prueba ji-cuadrado. 4. Que sea barato.
3. Se debe hacer con las técnicas de análisis de 5. Alto valor informativo.
supervivencia.
4. Se debe hacer con la prueba de Mann-Withney. RC: 1
5. Se puede hacer con la prueba de Mann-Withney, o con
las técnicas de análisis de su-pervivencia.

RC:3

408. Un ensayo clínico sobre 3.000 pacientes compara un


nuevo fármaco antihipertensivo con placebo (1.500
pacientes por rama de tratamiento), Para cada grupo, se
obtiene un valor medio de tensión arterial. Para
comprobar si existen diferencias estadísticamente
significativas, se debe realizar la siguiente prueba:

l.La X2 de Pearson.
2. La t de Student.
3. La F de Snedecor.
4. La U de Mann-Whitney.
5. Hazard Ratio.

58
Preguntas propias 2 Asignatura: Estadística

l. Con respecto a un análisis de regresión lineal simple, l. t de Student para datos pareados.
señalar la hipótesis que es falsa: 2. t de Student para datos independientes.
3. Prueba de Chi-cuadrado.
l. La variable explicativa se mide sin error. 4. Análisis multivariante.
2. La varianza de Y para cada valor de X es independiente S. F de Snedecor.
de X.
3. Mediante la regresión lineal simple se estima la ordenada RC:1
en el origen de la recta de regresión.
4. Mediante la regresión lineal simple no se puede estimar 6. ¿Qué test estadístico se utiliza para comparar las
la pendiente de la recta de regresión. varianzas de dos muestras?:
S. En el modelo de regresión lineal, los errores son variables
normales de media de error. l. Coeficiente de correlación.
2. t de Student.
RC:4 3. Chi-cuadrado.
4. Regresión lineal.
2. Para contrastar la igualdad de media de dos poblaciones S. F de Snedecor.
utilizando un estadístico que se distribuya
aproximadamente como una t student, ¿cuál de las RC:5
siguientes afirmaciones es falsa?:
7. Indique cuál de las siguientes afirmaciones acerca de la
l. Las dos poblaciones son normales. varianza de una muestra es cierta:
2. No es necesario que la varianza de las dos poblaciones
sean iguales. l. La varianza se mide en las mismas unidades que los
3. En algunos casos los grados de libertad de la t student se datos.
calculan por fórmulas de aproximación. 2. La varianza es el momento central de tercer orden.
4. Si las varianzas son estadísticamente iguales, se utiliza la 3. La varianza es una medida de dispersión de los datos.
cuasivariar\za ponderada. 4. El coeficiente de variación es la raíz cuadrada positive de
S. Para contrastar la igualdad de medias de dos la varianza.
poblaciones, en ningún caso se utiliza la t de student. S. El 5% de los datos son menores que la varianza.

RC:5 RC:3

3. El número de colonias de bacterias en una placa de 8. ¿Cúal de las siguientes afirmaciones sobre la
cultivo es una variable de tipo: distribución t de Student es falsa?:

l. Cualitativa. l. Se utiliza en inferencia estadística.


2. Ordinal. 2. Es simétrica con respecto a la media.
3. Cuantitativa discreta. 3. Converge a la distribución normal al aumentar el tamaño
4. Cuantitativa continúa. muestra l.
S. Dicotómica. 4. Su media es igual cero.
S. Su representación gráfica es idéntica a la de una variable
RC:3 normal con media cero y desviación típica l.

4. El riesgo "alfa" de una prueba de hipótesis indica la RC:5


probabilidad de:
9. Una variable aleatoria con distribución de "probabilidad
l. Aceptar la hipótesis nula cuando la hipótesis alternativa normal" toma valores:
es falsa.
2. Aceptar la hipótesis nula cuando la hipótesis alternativa l. Cualitativos.
es verdadera. 2. Ordinales.
3. Aceptar la hipótesis alternativa cuando la hipótesis nula 3. Cuantitativos discretos.
es falsa. 4. Cuantitativos continuos, sólo positivos.
4. Aceptar la hipótesis alternativa cuando la hipótesis nula S. Cualquier valor en el intervalo(+ 00 , - 00 ).
es verdadera.
5. El riesgo "alfa" no indica probabilidad. RC:5

RC:4 10. La posibilidad de rechazar la hipótesis nula cuando es


cierta, se denomina:
S. Para evaluar la eficiencia de un fármaco se elige una
muestra adecuada de pacientes a los que se mide la l. Error de tipo l.
variable respuesta a las 2 y 14 horas de tratamiento. ¿Qué 2. Error de tipo 11.
procedimiento estadístico se utilizara para evaluar los 3. Error estándar de la media.
resultados? : 4. Potencia del Test.
S. Falso positivo.

59
Preguntas propias 2 Asignatura: Estadística

RC:1 RC: 1

11. Para un determinado lote de comprimidos existe una 16. ¿Cúal de las siguientes afirmaciones es cierta?:
asociación inversa entre las variables "presión del
proceso" y "porosidad del comprimido". ¿Qué valor del l. La correlación mide la fuerza y la dirección de la relación
coeficiente de correlación de Pearson sería más adecuado lineal entre dos variables cuantitativas.
para expresar la asociación?: 2. La correlación mide la fuerza y la dirección de la relación
lineal entre dos variables cualitativas.
l. r= - 0,98. 3. La correlación entre dos variables cuantitativas toma
2. r= - 0,10. siempre valores positivos.
3. r= 0,10. 4. La correlación entre dos variables no siempre es un
4. r= 0,75. parámetro adimensional.
5. r= 0,98. 5. El coeficiente de correlación solo toma valores entre O y -
l.
RC:1
RC:1
12. Si A y B son sucesos independientes, ¿Cuál de las
siguientes afirmaciones es cierta?: 17. ¿cúal de las siguientes afirmaciones es FALSA?:

l. La probabilidad de A es igual que la probabilidad de B. l. La mediana de una curva de densidad es el punto del eje
2. La probabilidad de que se produzca simultáneamente los de abscisas que divide la curva en dos áreas iguales.
sucesos A y B, es la suma de la probabilidad de A más la 2. La media y la mediana de una curva de densidad
probabilidad de B. simétrica son iguales.
3. La probabilidad de que se produzca simultáneamente los 3. La media y la mediana describen el centro de una
sucesos A y B, es el producto de la probabilidad de A por la distribución de maneras distintas.
probabilidad de B. 4. La distribución de una variable nos dice que valores toma
4. La probabilidad de que se produzca simultáneamente los y con qué frecuencia los toma.
sucesos A y B, es una probabilidad condicionada. 5. El primer cuartil es la mediana de las observaciones
5. La probabilidad de A más la probabilidad de B es la situadas a la derecha de la mediana global.
unidad.
RC:5
RC:3
18. El intervalo de confianza al 95% para la concentración
13. El número de semillas de una determinada planta es media de principio activo de un medicamento estimado
una variable: con una muestra de tamaño n= 25 fue de 0,82 a 0,86. Se
acepta que la variable aleatoria sigue una distribución de
l. Cualitativa. probabilidad normal (Z= 1,96). ¿Cuál es el tamaño de
2. Ordinal. muestra necesario para que el error de estimación sea la
3. Cuantitativa discreta. décima parte del actual?:
4. Cuantitativa continúa.
5. Dicotómica l. n= 50.
2. n=2500.
RC:3 3. n= 1000.
4. n= 100.
14. Para caracterizar la relación lineal de dos variables 5. n= 5000.
cuantitativas, ¿Cuál es la técnica estadística adecuada?:
RC:2
l. Regresión.
2. ANOVA. 19. Si al realizar una serie de medidas repetidas (n=20) de
3. Correlación. colesterol, en un mismo material de control, obtenemos
4. Test de Student. unos resultados con una media de 200 mg/dl y un
5. Chi-cuadrado. coeficiente de variación del 5%, ¿Cuál sería el límite
inferior del intervalo de confianza del 95% de nuestros
RC:1 resultados?:

15. ¿Qué representación gráfica es la más adecuada para l. 185 mg/dl.


representar la relación entre dos variables cuantitativas?: 2. 190 mg/dl.
3.180 mg/dl.
l. Nube de puntos. 4. 210 mg/dl.
2. Gráfico de cajas. 5. No se puede calcular.
3. Diagrama de sectores.
4. Polígono de frecuencias. RC:3
5. Pictograma.

60
Preguntas propias 2 Asignatura: Estadística

20. ¿cuál de las siguientes afirmaciones sobre conceptos 2. La media del nivel de azúcar en sangre de la población
generales del test de hipótesis es FALSA?: está entre 112 y 128 mg/dl con un 95% de probabilidad.
3. La media del nivel de azúcar en sangre de la población no
l. El error tipo I es controlable y fijado a priori. está entre 112 y 128 mg/dl con un 95% de probabilidad.
2. El error tipo II no es controlable a priori y puede ser 4. La probabilidad de que un individuo de la población
grande. tenga un nivel de azúcar superior a 128 mg/dl es del 5%.
3. El error a es un único número, pero el erro B depende de 5. La probabilidad de que un individuo de la población
la alternativa que se considere. tenga un nivel de azúcar inferior a 128 mg/dl es del 5%.
4. Si el erro tipo I disminuye, el erro tipo 11 aumenta, si todo
los demás permanece fijo. RC:2
5. Las decisiones por H1 no son siempre fiables.
25. La probabilidad de que un medicamento sea eficaz en
RC:5 un individuo de una población con cierta enfermedad es
del 80%. Para obtener la probabilidad de que al
21. La correcc1on por continuidad que se aplica a una administrar el medicamento a 10 personas tomadas de
variable aleatoria debe hacerse siempre que: dicha población, exactamente 3 tuviesen efecto positivo
utilizaremos la distribución de probabilidad de variable
1. El tamaño de muestra! es muy pequeño. aletoria de tipo:
2. Una variable discreta se aproxima a una variable
continua. l. Normal.
3. Una variable continua se aproxime a una variable 2. Poisson.
discreta. 3. Binomial.
4. Una variable categórica se aproxime a una variable 4. T de Student.
discreta. 5. Uniforme discreta.
5. Se hace un test de hipótesis.
RC: 3
RC:2
26. Al analizar los datos de una muestra obtenemos que
22. El número de suspensos en una asignatura tiene una 160 cm es el percentil 25 (también llamado primer cuartil)
media anual de 20. El último curso suspendieron 16 para la altura de los individuos de la muestra. Esto quiere
alumnos. ¿Cuál es el test más adecuado para poner de decir que:
manifiesto un posible cambio en la media anual?:
l. El 25% de los individuos de la muestra! tiene una altura
l. Test de hipótesis para el parámetro 'A de una distribución igual a 160 cm.
de Poisson. 2. El 25% de los individuos de la muestra! tiene una altura
2. Test de hipótesis para proporciones. mayor o igual a 160 cm.
3. Test de normalidad de D 'Agostino. 3. 25 individuos de la muestra! miden 160 cm.
4. Test de hipótesis para la media de una variable normal. 4. El 25% de los individuos de la muestra! tiene una altura
5. Test de hipótesis para el coeficiente de variación. menor o igual a 160 cm.
5. El 75% de los individuos de la muestra! tiene una altura
RC: 1 menor o igual a 160 cm.

23. Si al realizar una serie de medidas repetidas (n= 20) de RC:4


triglicéridos, en un mismo material de control, obtenemos
unos resultados con una media de 200 mg/dl y un 27. ¿Cúal de los siguientes estadísticos descriptivos es una
coeficiente de variación del 5%. ¿Cuál será el error medida de tendencia central?:
aleatorio del método?:
l. La media muestra!.
l. 5 mg/dl. 2. El rango.
2. 7,5 mg/dl. 3. El rango intercuartílico.
3. 10 mg/dl. 4. La desviación estándar muestra!.
4. 20 mg/dl. 5. La varianza muestra!.
5. No se puede calcular.
RC:1
RC:3
28. Queremos realizar un test de hipótesis que concierne a
24. Estudiamos la variable aleatoria "nivel de azúcar en la media de cierta variable de una población que sigue una
sangre de un individuo (en mg/dl) "en cierta población. A distribución normal. La varianza de la población es
partir de una muestra, obtenemos [112,128) como desconocida y el tamaño de la muestra que tenemos es
intervalo de confianza para la media del 95% de nivel de pequeño. El estadístico de contraste que utilizaremos para
confianza. Podemos afirmar que: el test de hipótesis sigue una distribución de la familia:

l. El 95% de los individuos tiene un nivel de azúcar en 1. Binomial.


sangre entre 112 y 128 mg/dl con un 95% de probabilidad. 2. Normal.

61
Preguntas propias 2 Asignatura: Estadística

3. T {de Student). RC:4


4. Chi-cuadrado.
5. F {de Fisher). 34. Se realiza una investigación para estudiar el efecto de
la vacuna de la gripe del año pasado. Para ello se tomó
RC:3 una muestra aleatoria de 500 personas a las cuales se les
preguntó si se vacunaron o no. ¿Cuál de los siguientes
29. ¿Cuál de los siguientes estadísticos es una medida de procedimientos estadísticos es apropiado para este tipo
la dispersión o variabilidad de una muestra?: de datos?:

l. La media muestra!. l. Coeficiente de correlación de Pearson.


2. El coeficiente de asimetría. 2. Matriz de covarianzas.
3. La desviación típica muestra!. 3. Recta de regresión con intervalo de confianza para
4. La mediana muestra!. coeficientes de la recta verdadera.
5. El tamaño de la muestra!. 4. Tabla de contingencia con una prueba de independencia.
5. Intervalo de confianza para la diferencia de medias
RC:3 basado en la t de Student.

30. ¿Cúal de las siguientes afirmaciones acerca de la RC:4


mediana es falsa?:
35. ¿Cuál de los siguientes estadísticos aparece
l. La mediana toma un valor intermedio a los valores explícitamente en un diagrama de cajas y bigotes
muéstrales. (también llamado "box-plot" o" box and whiskers plot"):
2. La mediana es una medida de centralización.
3. La mediana coincide con el percentil ½. l. Coeficiente de variación.
4. La mediana teoríaca no se puede calcular a partir de la 2. Curtosis.
función de distribución (curva de Gauss). 3. Desviación estandar.
5. La mediana asigna probabilidad de al menos ½ tanto a 4. Rango intercuartilico.
valores superiores como a inferiores. 5. Varianza.

RC:4 RC: 4

31. La varianza de una variable aleatoria Binomial con 36. A partir de una muestra de 1000 niños obtenemos que
parámetros "n" y "p" es: 35 kg es el primer cuartil para el peso de niños de cierta
edad. ¿Cuál de las siguientes afirmaciones es cierta?:
l. np.
2. np {1-p). l. Los cuatro individuos de la muestra que menos pesan, no
3. p (1-p). llegan a 35kg, y los demás pesan más de 35kg.
4. n {1-p). 2. Los cuatro individuos de la muestra que más pesan,
5. Necesito más datos para poder calcular esta varianza. superan los 35kg, y los demás pesan menos.
3. La cuarta parte de los individuos de la muestra pesan
RC: 2 exactamente 35kg.
4. La cuarta parte de los individuos de la muestra tienen un
32. En una nube de puntos obtenida a partir de ciertos peso mayor o igual a 35kg.
datos, todos los puntos están perfectamente alineados, 5. La cuarta parte de los individuos de la muestra tienen un
cayendo sobre una recta de pendiente 0,7. El coeficiente peso menor de 35kg.
de correlación de Pearson estimado para estos datos será:
RC:5
l. -1.
2. -0, 7. 37. Durante una epidemia, el 10% de la población ha
3. o. contraído una enfermedad. Para obtener la probabilidad
4. O, 7. de que en un grupo de 15 personas, exactamente 7
5. 1 estuvieran enfermos utilizaremos la distribución de
RC:5 probabilidad:

33. El contraste de los rangos de signos de Wilcoxon es un l. Binomial.


test no paramétricos para variables que no son normales. 2. Chi cuadrado.
¿A partir de cuál de las siguientes medidas de tendencia 3. Normal.
central de la población se construye la hipótesis? : 4. Poisson.
5. T de Student.
l. La media aritmética.
2. La media geométrica. RC:1
3. La media armónica.
4. La mediana. 38. El percentil 90 del índice de masa corporal para
5. La moda hombres de 18 años es de 27. Entonces:

62
Preguntas propias 2 Asignatura: Estadística

l. El 90% de los hombres de 18 años tienen un índice de


masa corporal igual a 27. RC: 1
2. El 90% de los hombres de 18 años tienen un índice de
masa corporal mayor que 27. 43. En un diagrama de caja y bigotes ("box and whiskers")
3. El 90% de los hombres de 18 años tienen un índice de el extremo superior de la caja (por debajo del bigote
masa corporal menor que 27. superior) corresponde:
4. El 10% de los hombres de 18 años tienen un índice de
masa corporal igual a 27. l. Al primer cuartil.
5. El 10% de los hombres de 18 años tienen un índice de 2. Al primer cuartil menos 1,5 veces el rango
masa corporal menor que 27. intercuartílico.
3. A la mediana.
RC:3 4. Al tercer cuartil.
5. Al tercer cuartil más 1,5 veces el rango intercuartílico.
39. ¿Cuál de los siguientes estadísticos descriptivos es una
medida de forma?: RC:4

l. Curtosis. 44. Tenemos un conjunto de pares de datos altura de


2. Deviación estándar. padre X, altura de hijo Y. El coeficiente de correlación de
3. Moda. Pearson entre las variables X e Y es de r= -0,9; podemos
4. Rango. concluir que:
5. Varianza.
l. No hay asociación lineal entre X e Y.
RC:1 2. El 10% de la variación Y es atribuible a su asociación
lineal con X.
40. En un estudio estadístico tenemos una variable que es 3. El 81% de la variación de Y es atribuible a su asociación
el grupo sanguínea de los pacientes. ¿Qué representación lineal con X.
gráfica entre las siguientes será adecuada para describir la 4. El 90% de la variación de Y es atribuible a su asociación
variable?: lineal con X.
5. El dato obtenido es imposible, res siempre positivo.
l. Caja y bigotes (box and wiskers).
2. Histograma. RC:3
3. Nube de puntos.
4. Sectores (pie-chart). 45. Una manera de comprobar si una variable sigue una
5. Tallo y hojas. distribución normal es:

RC:4 l. Calcular su rango y compararlo con el rango de la


distribución normal.
41. Si el coeficiente de correlación de Pearson entre dos 2. Dibujar una recta de regresión.
variables es de 0,95 puedo asegurar que: 3. Calcular su media y varianza.
4. Usar un diagrama cuantil - cuantil normal (QQ normal-
l. Hay una débil asociación lineal creciente entre las plot).
variables. 5. Usar un diagrama de quesitos (pie-chart).
2. Hay una débil asociación lineal decreciente entre las
variables. RC:4
3. Hay una débil asociación lineal entre las variables pero
no sabemos si es creciente o decreciente. 46. Señale la opción correcta respecto a la calidad de vida
4. Hay una fuerte asociación lineal creciente entre las de un paciente que pasa por tres estados de salud
variables. consecutivos con valores de utilidad de 0,45 el primero,
5. Hay una fuerte asociación lineal decreciente entre las 0,68 el segundo y 0,95 el tercero:
variables.
l. La mejor calidad de vida corresponde al tercer estado de
RC:4 salud por el que pasa.
2. La mejor calidad de vida corresponde al primer estado de
42. El valor p de un test de hipótesis se puede definir salud por el que pasa.
como la probabilidad de: 3. La calidad de vida depende del tiempo en que esté en
cada estado de salud.
l. Observar diferencias mayores o iguales a las observadas 4. La utilidad no sirve para valorar la calidad de vida.
en la muestra si la hipótesis nula fuese cierta. 5. En los tres estados la calidad de vida es muy mala porque
2. Observar diferencias mayores o iguales a las observadas son valores menores de l.
en la muestra si la hipótesis alternativa fuese cierta.
3. Observar diferencias exactamente iguales a las RC:1
observadas en la muestra.
4. Que la hipótesis nula sea cierta.
5. Que la hipótesis alternativa sea cierta.

63
Preguntas propias 2 Asignatura: Estadística

47. El cuadrado de coeficiente de correlación de Pearson l. Sm =vs N


es: 2.Sm=s N
3.Sm=Nvs
l. El coeficiente de variación. 4.Sm=vsvN
2. El coeficiente de determinación. 5.Sm=s-.JN
3. La pendiente de la recta de regresión.
4. El coeficiente de regresión. RC:5
5. La covarianza.
53. Tomamos muestra de cinco individuos a los que les
RC:2 medimos el valor de colesterol LDL (mg/ml) obteniendo:
180, 203, 104, 90 y 165. ¿Cuál es la mediana de esta
48. En una población el 60% de los habitantes son muestra?:
hombres. La variable aleatoria "número de hombres en un
grupo de 10 personas" sigue una distribución de tipo: l. 180.
2. 203.
l. Binomial. 3.104.
2. Chi-cuadrado. 4. 90.
3. Poisson. 5. 165.
4. Normal.
5. t de Student. RC:5

RC:1 54. Queremos comparar las medias de dos poblaciones


que siguen distribuciones normales y tienen la misma
49. Tomamos una muestra aleatoria simple de 1000 varianza. Tomamos dos muestras de tamaño nl y n2. Al
personas, y para cada una comprobamos si enfermó o no construir un intervalo de confianza tendremos que
de gripe el año 2012 y si se vacunó o no de la gripe el año calcular un valor t para una distribución T de Student con:
2012. Obtuvimos así dos respuestas para cada una de las
1.000 personas. Para evaluar si hay asociación entre estas l. 2 grados de libertad.
dos variables cualitativas (tener gripe o no) y (haberse 2. nl + n2 - 2 grados de libertad.
vacunado o no) a partir de los datos de nuestra muestra: 3. (nl + n2)-1 grados de libertad.
4. (nl x n2)/2 grados de libertad.
l. Dibujamos un gráfico cuantil-cuantil. 5. Grados de libertad calculados con la fórmula de Welch o
2. Realizamos una prueba t para diferencia de medias. Smith-Satterwhite.
3. Calculamos el coeficiente de correlación de Pearson.
4. Realizamos un contraste de los signos para la diferencia RC:2
de medianas.
5. Realizamos una tabla de contingencia y una prueba de 55. Dada una prueba diagnóstica para una
independencia. enfermedad, ¿Cuál de las siguientes afirmaciones es
cierta?:
RC:5
l. Si la sensibilidad aumenta, la especificidad aumenta.
50. El segundo cuartil es lo mismo que la: 2. Si la sensibilidad aumenta, la especificidad disminuye.
3. Si la proporción de enfermos que al aplicarle la
l. Media aritmética. prueba dan positivo aumenta, la especificidad
2. Media geométrica. aumenta.
3. Media armónica. 4. La proporción de enfermos que al aplicarles la
4. Moda.
prueba dan negativo, es la especificidad.
5. Mediana.
5. La proporción de individuos que al aplicarles la
RC:5
prueba dan negativa, es la prevalencia de la
enfermedad.
51. ¿Cuáles de los siguientes estadísticos NO es afectado
por datos atípicos (outliers) en una muestra?:
RC:2
l. Media muestra!.
2. Desviación estándar. 56. La sensibilidad diagnostica de una magnitud
3. Varianza. analítica para una determinada enfermedad es:
4. Rango intercuartílico.
5. Rango. l. El coeficiente 1/ especificidad.
RC:4 2. Depende de la prevalencia de la enfermedad.
3. El coeficiente entre el número de enfermos que
52. Siendo s la desviación estándar y N el número de dan resultado positivo para esta magnitud y el
datos, el error estándar de la media, Sm, de un conjunto número total de enfermos considerados.
de datos es: 4. El número de enfermos que dan resultado
positivo entre todos los individuos posibles.

64
Preguntas propias 2 Asignatura: Estadística

S. Se deduce directamente del mínimo valor 3. La distribución de la población según las variables de
detectable de esta magnitud. edad y sexo.
4. La esperanza de vida a cada edad y según el sexo de
RC: 3 las personas.
S. La frecuencia de una determinada causa especifica
57. ¿Qué es la capacidad discriminante de una de muerte en los grupos de edad de la población
magnitud bioquímica en la teoría del valor distribuida en grupos, generalmente de cinco años.
semiológico ?:
RC:3
l. Es la propiedad de una magnitud bioquímica de
producir resultados similares tanto en individuos 61. La mayor ventaja de la aleatorización individual en
afectados de una enfermedad como en individuos el diseño de un ensayo de gran tamaño es que:
sanos.
2. Es la propiedad de una magnitud bioquímica de l. Permite valorar la interacción entre los factores
producir resultados similares en individuos aleatorizados.
afectados de diferentes enfermedades. 2. Evita el sesgo del observador cuando éste valora las
3. Es la propiedad de una magnitud bioquímica de variables finales (end---points).
producir resultados distintos entre individuos 3. Aumenta la potencia estadística.
afectados de una enfermedad como en individuos 4. Permite una comparación verdaderamente causal
sanos. entre casos y controles porque se aproxima al modelo
4. Es la propiedad de una magnitud bioquímica de contrafáctico.
producir resultados distintos en individuos S. Permite controlar los factores de confusión
afectados de las mismas enfermedades. conocidos y desconocidos.
S. Es la propiedad de una magnitud bioquímica de
producir resultados similares en individuos RC: 5
afectados de las mismas enfermedades.
62. La probabilidad de existencia de enfermedad
RC: 3 cuando el resultado de una prueba está fuera del
intervalo de referencia se denomina:
58. Al evaluar una prueba diagnóstica, la probabilidad
de encontrar un falso positivo es 0,2 y la
probabilidad de encontrar un falso negativo es 0,1. l. Valor predictivo positivo de la prueba.
¿Cuál es la especificidad de la prueba?: 2. Especificidad de la prueba.
3. Sensibilidad de la prueba.
l. 0,1. 4. Eficiencia de la prueba.
2. 0,2. S. Valor predictivo negativo de la prueba.
3. 0,6.
4. 0,8. RC:1
s. 0,9.
63 La sensibilidad diagnóstica de una magnitud
RC:4 analítica para una determinada enfermedad es:

59. Si la sensibilidad de una prueba diagnóstica es del l. 1/especificidad.


97%, ¿Cuál de las siguientes afirmaciones es cierta?: 2. Depende de la prevalencia de la enfermedad.
3. Es el número de enfermos que dan resultado
l. La probabilidad de falso negativo es del 3%. positivo entre todos los individuos posibles.
2. La probabilidad de falso positivo es del 3%. 4. Es el cociente entre el número de enfermos
3. Que la probabilidad de no padecer la enfermedad es que dan resultado positivo para esta magnitud y el
del 3%. número total de enfermos considerados.
4. Que la probabilidad de padecer la enfermedad es del s. Se deduce directamente del mínimo valor
97%.
detectable de esta magnitud.
S. La especificidad de la prueba es del 3%.

RC:4
RC:1

60. ¿Qué representan gráficamente las pirámides de


población?: 64. Una variable cualitativa ordinal sirve para:

l. Los datos demográficos sobre natalidad y mortalidad l. Medir.


obtenidos en los censos y padrones. 2. Jerarquizar.
2. La vida media de los individuos de la población de 3. Clasificar.
4. Contar.
un determinado territorio respecto al sexo.
s. Medir y clasificar.

65
GoBIR Preguntas propias 2 Asignatura: Estadística

RC:2 4. Si todo lo demás permanece fijo, aumenta si disminuye el


error~ o tipo 11.
65. En los gráficos de cajas (Box plot) la altura del S. Disminuye conforme la hipótesis alternativa se aleja de la
rectángulo o caja corresponde a: nula y conforme aumenta el tamaño de la muestra (si todo
lo demás permanece fijo).
l. Recorrido intercuartílico.
2. Recorrido semi-intercuratílico. RC:5
3. Primer cuartil.
4. Mediana. 71. ¿Cuál de los siguientes tests se debe aplicar para
S. Tercer cuartil. comparar dos proporciones de muestras independientes?:

RC:1 l. Test de Wilcoxon.


2. Test de Mann-Wihtney.
66. ¿Cuál de las siguientes NO es una medida de 3. Test de Welch.
dispersión?: 4. Test exacto de Fisher.
5. Test de McNemar.
l. Varianza.
2. Desviación estándar. RC:4
3. Coeficiente de variación.
4. Error estándar de la media. 72. En una muestra de las notas obtenidas por alumnos en
5. Quintil. el examen parcial de diciembre y en el examen de febrero
se desea conocer si existen diferencias estadísticamente
RC:5 significativas (Las notas no siguen una distribución
normal). ¿Cuál de los siguientes tests se debe aplicar?:
67. ¿Cuál de las siguientes pruebas NO es aplicable cuando
tanto la variable independiente o predictora como la l. U de Mann-Whitney.
dependiente o de respuesta son categóricas?: 2. t de Student para datos pareados.
3. t de Student para datos independientes.
l. Regresión múltiple. 4. Wilcoxon para datos pareados.
2. Regresión logística. 5. Welch.
3. Ji cuadrado.
4. Test de McNemar. RC:4
S. Prueba exacta de Fischer.
73. El test F que se lleva a cabo en el ANOVA de una
RC:1 regresión y que compara la varianza debida a la regresión
con la varianza residual, es indicativo de:
68. ¿Cuál de los siguientes NO es un test que sirva para
comprobar la normalidad?: l. La homogeneidad de las varianzas.
2. La bondad del ajuste.
l. Test de Shapiro-Wilk. 3. La normalidad de los residuales.
2. Test de Levene. 4. La normalidad de las variables estudiadas.
3. Test de D' Agostino. 5. La significación estadística de la pendiente.
4. Test de Kolmogorv-Smirnov.
S. Test de Lilliefors. RC:2

RC:2 74. ¿Cuál de los siguientes índices de tendencia central


resulta útil cuando la variable crece exponencialmente?:
69. Un subconjunto del espacio muestra! se llama:
l. Mediana.
l. Suceso elemental. 2. Moda.
2. Suceso seg u ro. 3. Media armónica.
3. Suceso imposible. 4. Media aritmética.
4. Suceso aleatorio. 5. Media geométrica.
5. Suceso incompatible.
RC:5
RC:4

70. ¿Cuál de los siguiente NO corresponde al error a o tipo 75. Un estimador se dice que es consistente:
I?:
l. Cuando se aproxima al parámetro poblacional a medida
l. Es controlable. que aumenta el tamaño de la muestra.
2. Está fijado de antemano. 2. Cuando se aproxima al parámetro poblacional a medida
3. Es un único número. que disminuye el tamaño de la muestra.
3. Cuando su varianza es máxima.

66
Preguntas propias 2 Asignatura: Estadística

4. Cuando su varianza es mínima. 80. Si queremos predecir el peso de un nmo usando


5. Cuando no tiene sesgo. exclusivamente su edad, ¿cuál de los siguientes
procedimientos se debe utilizar?:
RC: 1
l. ANOVA de un factor.
76. La probabilidad de rechazar una hipótesis nula que es 2. Regresión lineal simple.
falsa se llama: 3. Regresión múltiple.
4. Regresión logística.
l. Eficiencia. 5. Regresión de Cox.
2. Especificidad.
3. Sensibilidad. RC:2
4. Potencia.
5. Exactitud.
81. ¿Cuál de las siguientes NO es una medida estadística
RC: 4 de posición ni de tendencia central?:

77. ¿Con qué conjunto de supuestos de los siguientes se l. Media.


puede aplicar el modelo estocástico básico de regresión 2. Percentil.
lineal?: 3. Rango.
4. Mediana.
l. Normalidad, homocedasticidad, existencia de 5. Moda.
autoco rre la ció n.
2. Normalidad, homocedasticidad, no existencia de RC:3
autocorre la ció n.
3. Normalidad, heterocedasticidad, existencia de 82. Si la media aritmética de edad de una base de datos es
autocorrelación. de 35 años ¿cuál sería la media aritmética si todos los
4. Normalidad, heterocedasticidad, no existencia de datos se copiaran íntegramente a continuación de los
autocorrelación. originales y se duplicase artificialmente el tamaño de la
5. No normalidad, homocedasticidad, existencia de base de datos?:
autocorrelación.
l. 70.
RC:2 2. 35.
3. 17.5.
78. ¿Con cuál de los siguientes supuestos o condiciones 4. Es impredecible.
NO se puede aplicar un análisis de varianza como prueba 5.105.
paramétrica?:
RC:2
l. Que las variables tengan un nivel de medida por lo
menos igual a la escala de intervalos. 83. Se pretende comparar la concentración de leucocitos
2. Que las muestras o grupos analizados sean en individuos con SIDA tratados con Filgrastin frente a los
independientes y hayan sido obtenidas de poblaciones de un grupo de control asignados a placebo. La
distribuidas normalmente. concentración de leucocitos no se ajusta a una
3. Que estas poblaciones tengan la misma varianza. distribución normal. ¿Cuál de los siguientes test se debe
4. Que no exista interacción. emplear?:
5. Que no exista homocedasticidad.
l. t de Student para muestras independientes.
RC:5 2. U de Mann-Whitney.
3. t de Student para muestras apareadas.
79. ¿Cuál de lo siguiente referido al error estándar es 4. Wilcoxon para datos apareados.
FALSO?: 5. Test de Welch.

l. El error estándar es una medida de la precisión de la RC:2


estimación de un parámetro poblacional.
2. El error estándar está siempre ligado a un parámetro. 84. La elección de una hipótesis alternativa dependerá en
3. Si pretendemos describir los resultados de un estudio, primer lugar de:
como la altura media de un grupo debemos usar el error
estándar. l. Los datos obtenidos del estudio.
4. El error estándar de una estimación disminuye al 2. Lo que el investigador esté interesado en determinar.
aumentar el tamaño de la muestra. 3. La región crítica.
5. El error estándar de una estimación aumenta conforme 4. El nivel de significación.
se incrementa el tamaño de la muestra. 5. La potencia del test.

RC:5 RC:2

67
Preguntas propias 2 Asignatura: Estadística

85. ¿Cuál de los siguientes estadísticos básicos NO 5. p (A).


corresponde a una variable cuantitativa?:
RC:3
1. Frecuencia relativa.
2. Media aritmética. 91. Una vez que hemos rechazado la hipótesis nula, ¿cuál
3. Mediana. es la probabilidad de cometer un error tipo 11?:
4. Mínimo.
5. Amplitud. 1. 1.
2. Dependerá de la potencia.
RC:1 3. Dependerá del tamaño de la muestra.
4. o.
86. ¿Cuál de los siguientes métodos se debe utilizar en el 5. 2 y 3 ciertas.
análisis de un estudio observacional en el que el tipo de
exposición es categórico y el tipo de resultado es binario?: RC:3

1. Regresión lineal múltiple. 92. ¿Qué diferencia hay entre el intervalo que estima la
2. Regresión logística. media poblacional y el intervalo que estima la mediana
3. Análisis de la varianza. poblacional?:
4. Regresión de Poison.
5. Regresión de Cox. 1. El intervalo que estima la medía es mayor que el que
estima la mediana, incluso 2 veces cuando se estudian
RC:2 muestras pequeñas.
2. No existen diferencias entre ambos intervalos.
87. La medida estadística calculada con base en todos los 3. El intervalo que estima la mediana es menor que el que
datos de la población de referencia se llama: estima la media.
4. 1 y 3 ciertas.
1. Parámetro. 5. El intervalo que estima la mediana es mayor que el que
2. Estimador. estima la media.
3. Estimación.
4. Medida descriptiva. RC:5
5. Atributo.
93. Una variable que puede tomar un conjunto infinito de
RC: 1 valores y cualesquiera de sus valores intermedios, pero en
los que el cero no tiene un significado de ausencia total de
88. En una prueba estadística, la probabilidad de rechazar característica reflejada con dicha variable, se llama
una hipótesis nula que es falsa, se llama: variable:

1. Eficiencia. 1. Discreta de intervalo.


2. Error tipo l. 2. Continua de intervalo.
3. Error tipo 11. 3. Continua de razón.
4. Potencia. 4. Ordinal.
5. Especificidad. 5. Nominal.

RC:4 RC:2

89. Si queremos evaluar la intensidad de la asociación 94. El test de Wilcoxon de los rangos asignados sólo se
entre dos variables cuantitativas que no siguen una puede aplicar para hacer contrastes de hipótesis respecto
distribución normal, usaremos: a:

1. Regresión lineal simple. 1. La mediana.


2. Coeficiente de correlación de Pearson. 2. La moda.
3. Coeficiencia de correlación de Spearman. 3. La media.
4. Regresión logística. 4. El percentil 25.
5. Coeficiente de determinación. 5. El percentil 75.

RC:3 RC: 1

90. Dados los sucesos A y B con probabilidad no nula e 95. ¿Cuál de los siguientes tests se utiliza para hacer
incompatibles, la probabilidad de A condicionada a Bes: contrastes no paramétricos de independencia?:

1. 1. 1. De los signos.
2. p (B) xp (A). 2. Mann-Whitney-Wilcoxon.
3. o. 3. Kruskal-Wallis.
4. p (B). 4. Kendal.

68
Preguntas propias 2 Asignatura: Estadística

5. Kolmogorow-Smirnow. 101. Si la distribución de la variable se ajusta a la


distribución de Student, su media es:
RC:4
l. p.
96. ¿Cuál de los siguientes tests se debe aplicar cuando se 2. np.
quiere comparar varias proporciones apareadas?: 3. n.
4. O.
l. Cochran. 5. 2n.
2. Kruskal-Wallis.
3. Friedman. RC:4
4. Newman y Keuls.
5. Levene. 102. ¿Cuál de los siguientes es un test de igualdad de dos
distribuciones?:
RC: 1
l. Wilcoxon de rangos signados.
97. ¿Qué condiciones tiene que cumplir una variable para 2. Mann - Whitney.
poder aplicar la U de Mann-Whitney?: 3. Student para muestras apareadas.
4. Student para muestras independientes.
l. Datos pareados. 5. De simetría.
2. Que los datos sean las medias de los distintos estudios.
3. Que los datos sigan una distribución normal. RC:2
4. Homogeneidad de varianzas.
5. Ninguna de las anteriores. 103. ¿Cuál de lo siguiente es FALSO?:

RC:5 l. La desviación estándar mide la variabilidad de la


población.
98. El tamaño mínimo de muestra necesario 2. El error estándar de la media cuantifica la incertidumbre
estadísticamente significativo para comparar dos medias en el cálculo de media.
aumenta cuando: 3. El error estándar de la media no depende del tamaño de
la muestra.
l. Aumenta la media poblacional. 4. La desviación estándar y el error estándar de la media
2. Disminuye el error estándar de la media a nivel miden elementos distintos.
poblacional. 5. Cuando la población no tiene una distribución normal se
3. Aumenta el error alfa. utiliza la mediana y no la media como medida de tendencia
4. Aumenta el error beta. central.
5. Disminuye la diferencia entre las medias.
RC:3
RC:5
104. De las siguientes medidas, ¿cuál define mejor la
99. ¿Qué condición debe cumplir un método para que se tendencia central de los datos: 3, 4, 6, 44, 3, 20, 12?:
pueda considerar homocedástico?:
l. La media.
l. Que la varianza de los residuos sea dependiente de la 2. La proporción.
concentración. 3. La mediana.
2. Que los residuos estén distribuidos aleatoriamente. 4. El sesgo.
3. Que el número de residuos positivos y negativos no sea 5. El rango.
el mismo.
4. Que los residuos no estén distribuidos aleatoriamente. RC:3
5. Que el valor numérico de los residuos no sea el mismo.
105. El porcentaje de individuos con bronquitis entre los
RC:2 fumadores se puede interpretar como una probabilidad:

100. ¿Cuál de las siguientes expresiones para el cálculo de l. Condicionada.


la varianza corresponde a una distribución de la variable 2. De un suceso de unión.
según la ley binomial?: 3. A posteriori.
4. De un suceso complementario.
l. p(l-p). 5. De un suceso de intersección.
2. np(l-p).
3. 3n. RC:1
4. 2n.
5. n/(n-2). 106. Si queremos comparar la variabilidad relativa del
peso y la concentración de colesterol en sangre de una
RC:2 serie de individuos, utilizaremos:

69
Preguntas propias 2 Asignatura: Estadística

l. Los rangos. l. Al tamaño de la muestra.


2. Los coeficientes de variación. 2. Al valor medio del conjunto de medidas.
3. Las desviaciones estándards. 3. A la mayor o menor cercanía de las medidas.
4. Las diferencias de las medianas. 4. A la mediana del conjunto de medidas.
S. Las diferencias de las medias. S. A la cercanía al valor aceptado o "verdadero".

RC:2 RC:3

107. A unos enfermos se les pide que valoren su grado de 112. Si disponemos de una población normalmente
mejoría después de un tratamiento de una escala de 1 a 6. distribuida de valor medio µ y desviación estándar a, el
De las siguientes posibilidades ¿cuál resume mejor los intervalo de confianza para un 95% de probabilidad, de un
mismos?: valor aislado (Xi), se calcula mediante la expresión:

l. Mínimo y máximo. l. Xi = µ±O.SO o.


2. Media y desviación estándar. 2. Xi = µ ± 1.00 o.
3. Percentil 25, percentil 50 y percentil 75. 3. Xi = µ ± 1.50 a.
4. Media, mediana y desviación estándar. 4. Xi= µ ± 2.00 o.
S. Mediana y desviación estándar. S. Xi = µ ± 1.96 a.

RC:3 RC:5

108. En una población, el 80% de las alturas consideradas 113. La precisión de un conjunto de medidas repetidas
"más normales" están: puede expresarse mediante la:

l. Por debajo del cuantil 0.20. l. Media aritmética


2. Por encima del percentil 80. 2. Raíz cuadrada de la media aritmética.
3. Entre la media y la mediana. 3. Varianza.
4. Entre el percentil 20 y el 80. 4. Media geométrica.
S. Entre el percentil 10 y el 90. S. Raíz cuadrada de la media geométrica.

RC:5 RC:3

109. El límite de confianza de un valor predicho por la 114. Los errores sistemáticos:
recta de regresión es menor si la señal analítica medida (y)
está situada en: l.Se originan por efectos incontrolables.
2.No pueden ser eliminados.
l. El centro del calibrado. 3.No son reproducibles.
2. Dos veces el límite de detección. 4.No dependen del funcionamiento de los equipos.
3. Tres veces el límite de cuantificación. S. Pueden aparecer por un fallo en el diseño del
4. Dos veces el rango lineal. experimento.
S. Tres veces el límite de detección.
RC:5
RC: 1
115. Una serie de medidas proporcionan los siguientes
110. El análisis de un agua proporciona una concentración datos: 10, 2, 8, 4, 10, 5, 5, 2, 6, 6. Si el resultado verdadero
media de Ca 2+ de 70 mg/ml, con un límite de confianza de era igual a 5.7, ¿qué se puede decir del conjunto de
± 3 mg/ml, para n = 10, y t de Student al 95%. Este datos?:
resultado significa que:
l. Que es exacto y preciso.
l. Hay un 5% de probabilidad de que el valor verdadero se 2. Que es preciso pero no exacto.
encuentre entre 67 y 73 mg/ml. 3. Que no es exacto ni preciso.
2. Hay un 95% de probabilidad de que el valor verdadero 4. Que es exacto pero no preciso.
sea igual a 70 mg/ml. S. Que tiene sesgo.
3. Hay un 95% de probabilidad de que el valor medio sea
menos exacto que cualquiera de los resultados. RC:4
4. Hay un 5% de probabilidad de que haya que rechazar
algún dato. 116. Si realizamos un número elevado de medidas de una
S. Hay un 95% de probabilidad de que el valor verdadero se muestra, la distribución de resultados se aproxima a una
encuentre entre 67 y 73 mg/ml. curva de Gauss y podemos esperar que cuando realizamos
nuevas medidas, entre µ±Za se encuentran el:
RC:S
l. 50% de las medidas.
111. En un conjunto de medidas repetidas, la precisión 2. 68.3% de las medidas.
hace referencia: 3. 95.4% de las medidas.

70
Preguntas propias 2 Asignatura: Estadística

4. 99.2% de las medidas. l. Se deben a un fallo del experimento o del equipo.


S. 99.7% de las medidas. 2. Generalmente originan una desviación positiva de la
medida.
RC:3 3. Tienen igual probabilidad de ser positivos o negativos.
4. No afectan al resultado final por ser aleatorios.
117. La media de dos o más mediciones es: 5. Afectan exclusivamente a la exactitud de los resultados
que se obtienen.
l. Su valor promedio.
2. El valor central de una serie ordenada de datos. RC:3
3. La semisuma de los datos.
4. El valor promedio del par central en una serie ordenada 122. Para muestras de tamaño n grande, la proporc1on
de datos. muestra! p" sigue aproximadamente una distribución
S. La suma de los N datos dividida por N-1. normal con esperanza p (la proporción poblacional) y ¿qué
varianza?:
RC:1
1. p.
118. El coeficiente de correlación de Pearson: 2. p/n.
3. p(l-p).
1. Siempre es mayor que l. 4. p(l-p)/n.
2. Siempre es menor que l.
3. Esta comprendido entre O y l. RC:4
4. Esta comprendido entre -1 y O.
5. Esta comprendido entre -1 y 1. 123. ¿Qué tipo de variable es "Sexo de una persona
(hombre, mujer)"?:
RC:5
1. Cuantitativa continua.
119. La sensibilidad clínica de un parámetro (test) analítico 2. Cuantitativa discreta.
se define como: 3. Cualitativa nominal.
4. Cualitativa ordinal.
l. La media de concentraciones de dicho test en pacientes
sanos. RC:3
2. Una concentración patológica del test en presencia de la
enfermedad. 124. En una nube de puntos observamos que los datos
3. Una concentración patológica del test en ausencia de la están alineados en una recta decreciente. Cuál de los
enfermedad. siguientes valores del coeficiente de correlación de
4. Una concentración normal del test en ausencia de la Pearson es el más aprnpiado para una situación de ese
enfermedad. tipo:
5. Una concentración normal del test en presencia de la
enfermedad. 1. r = -2.
2.r=-1.
RC:2 3. r = O.
4. r = l.
120. La especificidad clínica de un parámetro (test)
analítico, con respecto a una determinada patología, se RC:2
define como:
125. La probabilidad de cometer un error de tipo I en un
l. La media de concentraciones de dicho test en pacientes test de hipótesis se puede controlar prefijando un valor
sanos. alfa. ¿Qué probabilidad es la que fija alfa?:
2. Una concentración patológica del test en presencia de la
enfermedad. 1. La probabilidad de no rechazar la hipótesis nula siendo
3. Una concentración patológica del test en ausencia de la que esta es cierta.
enfermedad. 2. La probabilidad de no rechazar la hipótesis nula siendo
4. Una concentración normal del test en ausencia de la que esta es falsa.
enfermedad. 3. La probabilidad de rechazar la hipótesis nula siendo que
S. Una concentración normal del test en presencia de la esta es cierta.
enfermedad. 4. La probabilidad de rechazar la hipótesis nula siendo que
esta es falsa.
RC:4
RC: 3

121. Toda medida experimental viene acompañada del 126. ¿En cuál de los siguientes casos se comete un error
correspondiente error experimental. Los errores tipo II en una prueba de hipótesis?:
experimentales se clasifican en sistemáticos y aleatorios.
Sobre éstos últimos se puede afirmar que:

71
Preguntas propias 2 Asignatura: Estadística

l. Cuando se acepta la hipótesis nula siendo verdadera la l. 0,0.


hipótesis alternativa. 2. 0,5.
2. Cuando se acepta la hipótesis nula siendo falsa la 3. 1,0.
hipótesis alternativa. 4. -0,5.
3. Cuando se acepta la hipótesis alternativa siendo
verdadera la hipótesis nula. RC: 1
4. Cuando se acepta la hipótesis alternativa siendo falsa la
hipótesis nula. 132. La varianza de un conjunto de n resultados
experimentales repetidos se define cómo:
RC:1
l. La desviación estándar elevada al cuadrado y dividida por
n.
127. Cuando se realiza la validación de un método 2. La desviación estándar elevada al cuadrado y dividida por
analítico, ¿cuál de las siguientes características de calidad n-1.
se relaciona con su capacidad de no verse afectado por 3. La desviación estándar elevada al cuadrado.
pequeños cambios deliberados de parámetros 4. La desviación estándar elevada al cuadrado y dividida por
operativos?: n-2.

l. Especificidad. RC:3
2. Exactitud.
3. Precisión. 133. ¿Además del número de verdaderos negativos {VN),
4. Robustez. cuál de las opciones es necesaria para calcular fa
especificidad?:
RC:4
l. Verdaderos positivos.
128. Tras la evaluación de una prueba diagnóstica se 2. Prevalencia.
comprueba que ésta no tiene ningún resultado falso 3. Falsos negativos.
positivo. ¿Qué se puede concluir de este estudio?: 4. Falsos positivos.

l. Que la sensibilidad es del 100%. RC:4


2. Que la especificidad es del 100%.
3. Que el valor predictivo negativo es del 100%. 134. La desviación estándar se define como:
4. Que el valor preditivo positivo es del 0%.
l. La varianza dividida por dos.
RC:2 2. La raíz cuadrada de la varianza.
3. La suma de las diferencias entre valores individuales y la
129. ¿Qué tipo de razón es el cociente entre la media, elevadas al cuadrado.
probabilidad de ocurrencia de un suceso y la probabilidad 4. La media de las diferencias entre cualquier valor y la
de no ocurrencia de dicho suceso?: media.

l. Una Odds. RC:2


2. Una proporción.
3. Una tasa absoluta. 135. Los métodos estadísticos no-paramétricos:
4. Una tasa relativa.
l. No requieren ningún dato.
RC:1 2. No hacen suposiciones sobre la distribución de datos.
3. Solamente se aplican a tipos de resultados muy
130. El incremento del riesgo de padecer un cáncer específicos.
colorrectal se ha relacionado con la infección por 4. Generalmente asumen una distribución de chi-cuadrado.
Streptococcus gal/olyticus. ¿Qué tipo de estudio diseñaría
para demostrar una relación causal?: RC:2

l. Estudio descriptivo transversal tipo estudio de


prevalencia.
2. Estudio descriptivo transversal tipo estudio de 136. La desviación estándar se define como:
concordancia.
3. Estudio descriptivo longitudinal. l. El promedio de la diferencia entre cualquier valor y la
4. Estudio analítico observacional tipo estudio de cohortes. media.
2. La varianza dividida por dos.
RC:4 3. La raíz cuadrada de la varianza.
4. La suma de los cuadrados de las diferencias entre
131. La suma de las desviaciones de n medidas respecto al cualquier valor y la media.
valor medio siempre es igual a:
RC:3

72
Preguntas propias 2 Asignatura: Estadística

137 ¿Cuál de estos índices estadísticos es una medida de


dispersión?:

l. Media aritmética.
2. Media geométrica.
3. Moda.
4. Rango intercuartil.

RC:4

138. La variable "grupo sanguíneo" es:

l. Una variable categórica nominal.


2. Una variable categórica ordinal.
3. Una variable cuantitativa discreta.
4. Una variable cuantitativa continúa.

RC: 1

139. Un estudio experimental cruzado sobre el efecto de


dos tratamientos distintos:

l. Establece aleatoriamente parejas de sujetos para ser


tratados.
2. Elige aleatoriamente al grupo experimental de la
población.
3. Establece aleatoriamente el orden de aplicación de los
tratamientos.
4. No utiliza ningún tipo de aleatorización.

RC:3

140. En un estudio experimental realizado a simple ciego:

l. El paciente desconoce a qué grupo experimental ha sido


asignado.
2. El investigador desconoce a qué grupo experimental se
ha asignado al paciente.
3. Tanto el paciente como el investigador desconocen a qué
grupo experimental ha sido asignado el paciente.
4. Nadie conoce el grupo de asignación.

RC:1

141. La especificidad de una prueba diagnóstica de una


determinada enfermedad representa:

l. La probabilidad condicionada de un resultado positivo en


la prueba si el sujeto presenta la enfermedad.
2. La probabilidad condicionada de un resultado negativo
en la prueba si el sujeto presenta la enfermedad.
3. La probabilidad condicionada de un resultado positivo en
la prueba si el sujeto NO presenta la enfermedad.
4. La probabilidad condicionada de un resultado negativo
en la prueba si el sujeto NO presenta la enfermedad.

RC:4

73

También podría gustarte