Documentos de Académico
Documentos de Profesional
Documentos de Cultura
• Como se les divide por una constante (que es la desviación estándar) toman como escala:
número de desviaciones estándar de la media.
• Tiene media 0 (ya que los valores son distancias de la media y se anulan) y una desviación
estándar de 1.
• Esto nos permite hacer que esta sea una buena distribución para comparar valores que vienen
en escalas muy distintas. Comparamos magnitudes transformándolas en una misma escala.
• Dado que tiene propiedades conocidas (como la regla del 68%, 95% y 99,7%), si nuestros datos
siguen esta distribución podemos hacer inferencia estadística.
Regla del 68%, 95% y 99,7%.
Nos da una medida de cuan probable es algo por azar. Por lo mismo,
podemos conocer los valores improbables bajo este supuesto.
Ejemplo tiempo de respuesta visual:
50 50
Tipo de Observado Observado
tratamiento (Ansiedad) (Depresión)
50 50
Cognitivo 20 80
conductual 100
Total = 200
Psicodinámico 80 20 100
100 100
2. Diferencias cuadráticas: Evitar que
se anulen.
• Si se fijan, algunas diferencias son negativas, y esto podría hacer que
se cancelen entre sí. Para volverlas positivas todas se saca su
diferencia cuadrática. Que no es otra cosa que:
18 18
= 18 + 18 + 18 + 18 = 72
18 18
3. Determinar las características de la
distribución comparativa.
• Tenemos un número, pero no sabemos si ese número efectivamente
es mayor a lo que esperaríamos por casualidad (o lo que es esperable
según la distribución).
• Para esto vamos a utilizar una distribución que se llama “chi-
cuadrado”.
• La distribuciín chi-cuadrado, es lo que ocurre si tomas datos de una
distribución normal estándar, los llevas al cuadrado, y los sumas (por
eso es ).
+ + + +
3. Distribución Chi-Cuadrado:
• Distribución asimétrica positiva (con cola hacia la derecha siempre).
• Esto se debe a que es la suma de valores cuadráticos (por ende siempre
positivos).
• Cuenta con un parámetro central: K grados de libertad.
Cognitivo 20 80
Tipo de tratamiento = 2 𝐷𝐹 = ( 2 − 1 ) 𝑥 (2 −
categorías.
conductual Tipo de problema = 2 categorías.
𝐷𝐹 = ( 1 ) 𝑥
Psicodinámico 80 20
𝐷𝐹 =
3. Nota aparte: Grados de libertad x2.
• Si se fijan una tabla de 2x2 nos da solo un grado de libertad. Esto es
dado lo siguiente:
• Si conozco los totales por filas y columnas (o los calculo), puedo conocer los
valores esperados, y con ello puedo calcular las diferencias.
¡al conocer un
valor, el resto
Tipo de Observado Observado
tratamiento (Ansiedad) (Depresión) queda fijado! Por
eso no son “libres”.
100 100
3. ¿Para qué hicimos todo esto?
• Recuerden que la inferencia estadística se trata de saber cuán
probable es que nuestro resultado sea por casualidad, si es que viene
de una distribución en la que la hipótesis nula es verdad (no hay
efecto o relación).
• En nuestro ejemplo, el mundo en el que la hipótesis nula es verdad
sigue una distribución chi-cuadrado con 1 grado de libertad.
• Eso quiere decir que vamos a comparar nuestro valor (que
recuerden, representa las desviaciones de lo esperado), con lo que
pasaría si es que el tipo de psicoterapia fuera independiente del tipo
de problema.
4. Definir el valor de probabilidad para
rechazar la hipótesis nula.
• En ciencia, usualmente el valor para rechazar la hipótesis nula (o valor
crítico, o α) está fijado a un 5% (o 0.05).
• Este valor significa que casos con una probabilidad de 0.05 o menos,
serían considerados como improbables si la hipótesis nula fuera
verdad.
• En nuestro caso, serían diferencias improbables en un universo
donde el tipo de problema es independiente de la psicoterapia.
• Recuerden que este es el mundo de la hipótesis nula.
• Vamos a ir viendo que a veces α puede ser aún más pequeño.
5. Determinemos el valor de probabilidad en la
distribución comparativa ¡Vamos a R!
• Antiguamente se usaban tablas para calcular si un valor es
estadísticamente significativo o no.
• Hoy en día se puede calcular la probabilidad de observar un valor
igual o más alto que el calculado (nuestro valor x2) dado que la
hipótesis nula es verdadera, a través del computador.
• Esto es lo mismo que el p–value.
5.
p = 0.00000000000000022
5.
En realidad con un grado
de libertad se ve asi, la
otra es con tres.
Estadístico
Valor del Valor de
utilizado
Grados de estadístico probabilidad
libertad
Resumen del cálculo de chi cuadrado:
Resumido en la fórmula.
• Extraemos las frecuencias observadas de cada categoría o celda.
• Determinamos las frecuencias esperadas para cada categoría.
Donde:
• = estadístico chi-cuadrado.
• n = número total de la muestra.
• Min(c-1,r-1) = el mínimo entre los grados de libertad de las columnas o las filas.
• Va de 0 a 1, siendo 0 independencia total, y 1 asociación total.
• 0.1 = pequeño.
• 0.3 = mediano.
• 0.5 = grande.
Resumen de la clase:
• La prueba ”chi-cuadrado” se utiliza para comparar proporciones y ver
si estas son dependientes de sus categorías o no.
• Compara los valores observados con los esperados si es que fueran
independientes.
• Si es que se rechaza la hipótesis nula, se asume que no son
independientes y por ende están asociados.
Cómo se calcula en R y qué significa:
• En R es bastante simple de calcular:
• a) Creamos una tabla de contingencia.
• b) Sobre la table usamos la función chisq.test(tabla).
• c) Interpretamos: Si el valor p es menor a 0.05 (o nuestro umbral crítico)
rechazamos la hipótesis nula. Esto quiere decir que asumimos que el tipo de
problema con el tipo de tratamiento están relacionados.
Cognitivo 20 80
conductual
Psicodinámico 80 20
Próxima clase:
• Haremos una prueba x2 con datos reales.
• Veremos cómo se comparan promedios a través de una preba t.
• Para eso conoceremos la prueba t