Está en la página 1de 57

TEMA 5: TIPOS DE ERROR EN EL CONTRASTE Y POTENCIA

1. ERROR DE TIPO I Y TIPO II:

Un test de antígenos es equivalente a un contraste de hipótesis. Lo que se asume es que la PCR es


muchísimo más fiable que el test de antígenos (Ag+BSS).

Sensibilidad (97,5%): capacidad de detectar casos positivos.

Especifidad (100%): capacidad de clasificar correctamente a las personas que no tienen COVID.

Fiabilidad= precisión (99,7%): tasa global de clasificaciones correctas.

Sensibilidad= punto crítico = potencia.

Declarar que una persona no tiene el COVID cuando en realidad no lo tiene -> nivel de confianza =1-
ALFA.
Declarar que una persona tiene el COVID, pero en la realidad no lo tiene -> nivel de significación/ falso
positivo/error tipo I. = ALFA

Potencia de contraste: capacidad de detectar lo que estás buscando. = 1- ((BETA (error tipo II)).

Declarar que una persona no tiene COVID, pero en realidad si lo tenía-> error tipo II/falso negativo. =
BETA

DEFINICIONES:

Error tipo I/ nivel de significación: rechazar H0, cuando H0 es cierta. -> nivel de significación = alfa.

Error tipo II: no rechazar H0, cuando se cumple H1. -> beta.

Nivel de confianza= 1- alfa/error tipo 1. La probabilidad de no rechazar H0, cuando no es cierta.

Potencia de contraste: 1- beta/error tipo II. La probabilidad de rechazar H0, cuando se cumple.
EJEMPLO TEST DE EMBARAZO:

Punto de corte= 10, según el artículo a partir de esta unidad se está embarazada.

Se ha estudiado a los 10 días de embarazo, por eso se estudia por encima del 10.

En la primera gráfica:

-ALFA=0,05 ->Solo el 5% ha sido detectada como embarazo, aunque no lo están. Error tipo I/falso
positivo.

-Nivel de confianza= 1-0,05= 0.95 -> El 95% han sido detectadas como embarazadas cuando sí lo
estaban.

La media de la hormona en esta población = 5 mg, es decir, las mujeres con 5 o menos mg de esta
hormona -> NO ESTÁN EMBARAZADAS = HIPÓTESIS NULA:

En la segunda gráfica:

-BETA=0.25 -> El 25% han sido detectadas como no embarazadas, aunque sí lo estaban. Error tipo
II/falso negativo.

-Potencia= 1- 0.25= 0.75 -> El 75% han sido correctamente detectadas como embarazadas.

HIPÓTESIS ALTERNATIVA =SÍ ESTÁN EMBARAZADAS. Por lo tanto, la media de la hormona en está
población tiene que estar por encima de 5:
2. POTENCIA DEL CONTRASTE:

Potencia: Capacidad o sensibilidad del contraste para detectar que H0 es falsa (cuando realmente lo es).

El nivel de confianza se fija arbitrariamente, pero la potencia no. La potencia depende de varios factores:

1. El valor de a (alfa):
• Si a es alto, el contraste es más liberal. Se rechaza H0 con mayor probabilidad, tanto si es
verdadera como si es falsa.
• Si a es bajo, el contraste es más conservador. Se rechaza H0 con menor probabilidad.
• A mayor a, mayor error de tipo I y potencia. (Se ve claramente en la gráfica).

2. La diferencia entre H0 y el valor verdadero del parámetro.

• Cuanto más se aleje H0 del valor real, mayor potencia.

En el ejemplo del embarazo: el valor real de la hipótesis nula es = 5. Si dejamos pasar los días y nuestra
media aumenta (por ejemplo 12, o con más días 20), nos estamos alejando del valor real. Esto genera
que la potencia aumente (el número de mujeres detectadas como embarazadas cuando lo están):

3. El tamaño muestral:
• A mayor n mayor potencia. Gráficamente encontramos distribuciones más estrechas a lo que
encontramos en la gráfica 2.
La gráfica roja sería la segunda gráfica, pero la negra sería con
un tamaño muestral mayor (+ n).

EJEMPLO 1. En un contraste sobre una proporción, contrastamos H0: p  0,3 frente a H1: p  0,3. Para
ello hemos tomado una m.a.s. de seis observaciones y se encuentra el resultado X = 4. A continuación
puede ver la distribución de X bajo H0 y con p = 0,6. El nivel de significación del contraste es a = 0,05.

1. Obtenga el nivel crítico= 0.07


La primera fila = alfa. -> H0.

La segunda fila= potencia. -> H1.

A partir del nivel de significación (0.05), miramos en la primera función donde se deja el 0.05 a un lado =
a la derecha del 4. El punto crítico= 5, a partir de donde rechazas.

2. Indique los valores de X que forman la zona crítica: Con X=5 y X=6, el nivel crítico sería 0.01 0 0.00
que son menores que alfa (0.05). Por lo tanto, rechazaríamos H0 en esta zona = zona crítica.

3. ¿Cuál sería la decisión sobre el contraste?: Mantenemos H0, ya que el nivel crítico es mayor que el
alfa. (0.07 > 0.05).

4. ¿Cuánto vale la potencia del contraste?:

La probabilidad de encontrar un dato en zona de rechazo cuando la H0 es


falsa. Por lo tanto, tengo que ver cual es la probabilidad de encontrar un 5 o un 6 cuando la hipótesis
nula es falsa. Esto significa que tengo que mirar en la fila de la hipótesis alternativa (H1).

TEMA 6: TABLAS DE CONTINGENCIA

Ejemplo:

Clasificación de los pacientes en función de si tienen neurosis o esquizofrenia Tabla de frecuencias


observadas en la muestra de 50 pacientes:

Hipótesis en tablas de contingencia:

- Independencia o igualdad de distribuciones (relación entre variables): ¿La esquizofrenia y la neurosis


están relacionadas? ¿Tener un trastorno aumenta (o disminuye) la frecuencia del otro? -> Contraste de
independencia.

- Homogeneidad marginal (comparar variables): ¿La esquizofrenia y la neurosis tienen distinta tasa de
incidencia? ¿Se dan ambas con la misma frecuencia?

1. CONTRASTE DE INDEPENDENCIA

La hipótesis nula es la hipótesis de independencia (relación nula-> variables independientes) entre dos
variables nominales Se comparan las frecuencias observadas con las predichas por la hipótesis.
2. ÍNDICE DE RIESGO RELATIVO.

Estamos investigando cuales son los factores que predisponen para la aparición del asma infantil, entre
los cuales podría encontrarse el hecho de que la madre sea fumadora. En una muestra de 100 niños que
acuden a urgencias por problemas respiratorios, se ha encontrado el siguiente resultado. Averigüe si
existe relación significativa entre las variables utilizando  = 0,05 y obtenga el riesgo relativo de asma
infantil asociado al tabaquismo de la madre.
4. RAZÓN DE VENTAJAS (ODDS= VENTAJA Y ODDS RATIO)

Se aplica en tablas 22.

Indica la fuerza de la asociación entre las variables. No existe una distinción entre variable
independiente y dependiente.

Odds 1 = ventaja/posibilidad del primer grupo.

Odds 2= ventaja/posibilidad del segundo grupo.

OR= razón de ventajas.


Si el estadístico es menor que 1, encontramos una correlación negativa (relación inversa) -> si se da una
variable, la otra tiende a no darse (no es que no se dé nunca pero es más infrecuente).

Si el estadístico es mayor que 1, encontramos correlación positiva (relación directa) -> si se da una
variable, la otra tiende a darse.

En el caso de que el estadístico=1, encontramos independencia entre ambas variables.


La razón de ventajas (OR) es el cociente entre ambas ventajas (odds 1 y odds2). Es decir, la razón de
ventajas son las posibilidades de encontrar una variable si está presente la otra variable, comparándolo
con cuando no está presente la segunda variable.

Para saber si la relación es directa o inversa:

Relación directa: si se consume droga, mayor tendencia a tener alucinaciones. En este caso, el índice de
ventaja es mayor que 1.
Relación inversa: si se desarrolla una actividad intelectual, menor tendencia de desarrollar deterioro
cognitivo. En este caso el índice de ventaja es menor que 1.

5. MEDIDAS DE ASOCIACIÓN

-Son el equivalente al coeficiente de correlación cuando las variables son nominales.


-Permiten estudiar el grado de asociación entre variables.
- A diferencia del RR y el OR, tienen un máximo definido.
6. DOS PROPORCIONES RELACIONADAS. PRUEBA DE MCNEMAR -> SEGUNDO TIPO DE
CONTRASTE DEL TEMA JUNTO AL DE INDEPENDENCIA

Sirve para estudiar si la frecuencia de una variable es distinta la otra.


Homogeneidad marginal: comparar la proporción de éxitos en cada variable.

MCNEMAR descubrió que para hacer el contraste los datos importantes son los de la diagonal, es
decir, esas personas que solo padecen una de las dos variables (o son esquizofrénicos, o son
neuróticos) = valor 18 y valor 4. Son los datos clave para realizar el contraste.

En este contraste, siempre hay solo un grado de libertad al calcular el estadístico de contraste.

En los márgenes de la tabla, están las proporciones de ambas variables.


La proporción de tener neurosis = 0.20
La proporción de tener esquizofrenia = 0.48
En bilateral, el punto crítico se busca utilizando 1 – alfa.
En unilateral, el punto crítico se busca utilizando 1 -2 x alfa.
TEMA 7: INFERENCIA CON UNA VARIABLE CATEGÓRICA (CUALITATIVA) Y UNA
CUANTITATIVA

1. OBJETIVOS Y DISEÑO DE INVESTIGACIÓN

-Propósito: comparar dos medias poblacionales en un diseño intersujetos.


- Ejemplos:
 Varones y mujeres difieren en su nivel de sociabilidad.
 Los pacientes que reciben tratamiento tienen menor nivel de depresión que los que
no están tratados.
 Las calificaciones medias en AD-II son distintas en el grupo de mañana y el de tarde.
 El rendimiento en la escala PISA es distinto para españoles y franceses.
Aspectos de diseño de investigación:

- Estudiar si existe efecto de una variable independiente categórica (forma dos grupos) sobre una
variable dependiente cuantitativa (puntuaciones).

- Dos muestras independientes (Tema 7): Diseño intersujetos: grupos formados por diferentes sujetos

- Dos muestras relacionadas (Tema 8):

 Diseño intrasujetos o de medidas repetidas: grupos formados por los mismos sujetos.
 Diseño de sujetos equiparados: diferentes sujetos, igualados en una variable de control.
2. PRUEBA T PARA DOS MEDIAS INDEPENDIENTES CON VARIANZAS POBLACIONALES
IGUALES:
3. MEDIDAS DE TAMAÑO DEL EFECTO:
TEMA 8: DOS VARIABLES CUANTITATIVAS

1. DISEÑO INTRASUJETOS
Línea roja = regresión lineal con correlación positiva, es decir, r > 0 (por la forma de la nube de puntos).
Si la nube de puntos se encontrase en el centro = correlación nula, si la nube fuese diagonal, pero de
arriba abajo = correlación negativa, es decir, r < 0.

2. PRUEBA T PARA DOS MEDIAS RELACIONADAS

Para cada sujeto (o par de observaciones) se recoge X1 y X2.

Calculamos la diferencia D = X1 − X2

El contrate de la hipótesis H0: mu1 = mu2 es equivalente a un contraste sobre una media (Prueba T,
tema 2) con H0: MuD = 0
Como quiere reducir el nivel de hipocondría -> mu1<mu2 CONTRASTE UNILATERAL DERECHO
3. CONTRASTE SOBRE CORRELACIONES:

La primera es una relación lineal perfecta, por eso la correlación lineal = 1.

En la primera de abajo vemos una relación cuadrática perfecta, por eso la correlación de Pearson es muy
próxima a 0 = -0.07
CONTRASTE SOBRE CORRELACIÓN:
TEMA 9: ANÁLISIS DE VARIANZA DE UN FACTOR - ANOVA

1. ANOVA DE UN FACTOR COMPLETAMENTE ALEATORIZADO (A-CA)

Objetivo: comparar entre sí dos o más medias (la prueba T es sólo para dos medias, si tenemos dos
medias podemos usar T o ANOVA=F, si tenemos más de dos medias solo podemos usar F). Ejemplo:
media en psicología, media en derecho, media en biología y media en ciencias.

- Se forman J grupos con diferentes sujetos (diseño intersujeto).

- Se contrasta si las medias poblacionales son iguales en los J grupos

H0: media1 = media2 = media3 (todas las medias son iguales)

H1: mediaj  mediaj' (alguna media es distinta a las otras). Mediaj= media jota prima.

Si la hipótesis nula se rechaza no quiere decir que las 4 medias sean distintas. Alguna diferencia hay
entre ellas, es decir, alguna media es distinta a otra.

Variable independiente (factor): Cualitativa, forma los grupos. Ej: facultad.

Variable dependiente: Cuantitativa, para calcular las medias. Ej: las notas en cada carrera.

Diseños

- Intersujetos. ANOVA de un factor, completamente aleatorizado (A-CA)

- Intrasujetos. ANOVA de medidas repetidas (A-MR)


2. DESCOMPOSICIÓN DE LA VARIANZA

SCT = Suma de cuadrados total

SCI = Suma de cuadrados intergrupo = Variabilidad intergrupos (cuanto difieren los grupos entre ellos)

SCE= Suma de cuadrados error = Variabilidad error (las personas dentro de un grupo difieren también
entre sí, no todos los estudiantes de la misma carrera tienen las mismas notas)

Los grados de libertad son parecidos al tamaño muestral (N).


3. PROCEDIMIENTO Y TABLA DE ANOVA

1. Hipótesis:

H0: m1 = m2 =...= mJ (todas las mj son iguales)

H1: mj  mj' (alguna mj es distinta a las otras)

2. Supuestos:

-Independencia (m.a.s)

-Normalidad

-Homocedasticidad (Igualdad de varianzas poblacionales)

3. Estadístico de contraste:

J: número de grupos

n: número de sujetos en cada grupo

N: número total de sujetos (N = nJ)

4. Punto crítico: FJ-1, N-J:

F = F de Snedecor con dos grados de libertad.

5.Decisión y conclusión:

Mantener H0 = no podemos concluir que las medias difieran.

Rechazar H0 = no todas las medias poblacionales son iguales (aunque no sabemos dónde están
las diferencias, no se concluye que m1 ≠ m2 ≠ ... ≠ mJ)
1. Hipótesis:

H0: m1 = m2 = m3

H1: mj  mj'

2. Supuestos:

-Independencia

-Normalidad

-Homocedasticidad

3. Estadístico de contraste: J = 3 n = 3 N = 9
4. MEDIDAS DE TAMAÑO DEL EFECTO:

En el ejemplo anterior:

42= 24 + 18 (en el caso de la tabla anterior).


En el ejemplo anterior: N2= 24/42.
43% de varianza explicada.

Las fórmulas solo se pueden aplicar si hemos rechazo H0.

2. El estadístico de contraste vale: 7, se saca a partir del nivel crítico = 0.04.


3.La zona crítica está formada por los valores: F >= 8. Del 8 a la derecha = zona crítica.

4. La decisión ha sido SE MANTIENE H0 y la conclusión NO HEMOS ENCONTRADO DIFERENCIAS


SIGNIFICATICAS ENTRE LAS MEDIAS.

5. La potencia toma el valor 0,02 y el error de tipo II es: 0.98

1. Hipótesis:

H0: mu1 = mu2

H1: mu1 desigual mu2

2. El valor del estadístico de contraste es F= 5 , nivel crítico es 0.16.

3. Zona de rechazo F>= 6.

4. Potencia 0.14.

5. Error tipo II: 0.86

6. La decisión es mantener H0 y la conclusión no se han encontrado diferencias significativas en la


imagen de marca.

TEMA 10: COMPARACIONES NO PLANEADAS O A-POSTERIORI

1. Objetivos

2. Prueba de Tukey

3. Prueba de Scheffé

1. OBJETIVOS DE LAS COMPARACIONES PLANEADAS O A-POSTERIORI

- Investigar qué medias difieren de cuales otras


- Las comparaciones no planeadas o a posteriori:

• Se realizan después del ANOVA, en caso de haber rechazado H0.

• No hay una idea previa de qué diferencias se están buscando.

• Tukey: Comparar todas las medias por pares para buscar las diferencias.
C2j= total de coeficientes sumados al cuadrado
TEMA 11: COMPARACIONES PLANEADAS O A-PRIORI

1. Comparaciones de tendencia

2. Prueba de Dunn-Bonferroni

1. COMPARACIONES DE TENDENCIA

-Son procedimientos confirmatorios.

-Parten de una idea o hipótesis previa acerca de qué tipo de diferencias podrían encontrarse en los
datos.

La de 4º grado no se va a ver en la práctica, llegaremos en práctica solo hasta la cúbica.


TEMA 12: ANÁLISIS DE VARIANZA, MEDIDAS REPETIDAS Y DISEÑOS DE DOS
FACTORES

1. ANOVA de medidas repetidas

2. ANOVA de dos factores, completamente aleatorizado

- Efectos principales y de interacción

- Hipótesis y tabla de ANOVA

3. Diseño mixto o split-plot

También podría gustarte