Está en la página 1de 5

bfMétodos cuantitativos de investigación

Guía de trabajo – valores p e introducción a la diferencia de medias


Objetivos
1. Recordar y fortalecer elementos trabajados anteriormente para consolidar conocimientos.
2. Fortalecer las competencias de análisis descriptivo e inferencial.

Contexto
En el modelo que llamamos “frecuentista” o de NHST (significancia de la hipótesis nula) en métodos
cuantitativos, usamos el valor de p para expresar el nivel de “sorpresa” que nos generan unos datos. Todas las
pruebas de hipótesis devuelven una p(D⃒ h0), es decir una probabilidad de unos datos obtenidos (“evidencia”)
suponiendo que la hipótesis nula es verdad. Para no escribir toda esa expresión, simplemente decimos “valor p”
o “p-value”. Hoy haremos algunos ejercicios para consolidar nuestro conocimiento sobre el tema.

Ejercicio 1. El partido
El próximo 10 de marzo se jugará el partido de vuelta de 16avos de la Liga de Campeones entre Barcelona y
PSG. El ganador se decide en dos partidos – uno de ida y otro de vuelta (este), y la suma de goles en los dos
partidos es el marcador final para cada equipo. En la ida, el PSG le ganó al Barcelona 4-1 – es decir, Barcelona
tiene que hacer cuatro goles si quiere ganar (hay algunas reglas adicionales pero vámonos por lo simple – si
Barcelona hace 4 goles y el PSG ninguno, el marcador acumulado es PSG 4 – 5 Barcelona).

Barcelona
El Barcelona fue hace algunos años el equipo más dominante del mundo. En la cúspide de su rendimiento
contó con jugadores extraordinarios como Lionel Messi en su mejor época, Andrés Iniesta, Zlatan Ibrahimovic,
Dani Alves y otros. En 2009 fue el primer equipo de la historia en ganar, en un año calendario, su liga, su copa
de la liga, su supercopa, la supercopa de Europa, el mundial de clubes de FIFA y la Liga de Campeones de
Europa – a esto se le llama “el sextete” y es ganar todo lo que disputa un club en una temporada.

Hoy en día, después de una presidencia desastrosa y de muchos malos manejos financieros, es un equipo que
va de capa caída. En este momento es segundo en su liga, pero el Real Madrid y el Sevilla le siguen los pasos.
En la Copa del Rey logró remontar un resultado adverso y se clasificó para la siguiente ronda, pero ha tenido
que jugar cinco prórrogas seguidas (es decir, 5 partidos de más de 90 minutos, lo cual suma al cansancio).
Muchos de sus jugadores están en la última parte de sus carreras, incluido Messi, y otros apenas están
consolidándose como buenos jugadores.

Paris Saint-Germain
El equipo insignia de París es el más exitoso de Francia. La Ligue 1 (que es como se llama la copa principal de
Francia) es normal para ellos – la han ganado 9 veces, y ni hablar de la copa de la liga (“Coupe de France”) que
han ganado 13 veces. En este momento su plantilla es formidable – tienen a quienes muchos consideramos
uno de los dos mejores jugadores del mundo en Kylian Mbappé, un jovencito de 22 de años que lleva 144 goles
con sus clubes, 16 con Francia y ya es campeón del mundo con su selección en 2018. En el partido de ida,
Mbappé marcó tres goles y dejó en ridículo a la defensa del Barcelona varias veces.

Pero además de Mbappé, el PSG tiene entre sus filas a la estrella brasilera Neymar, a los argentinos Icardi, Di
María y Paredes, al ex arquero del Real Madrid Keylor Navas y al guerrerísimo Marco Verrati, entre otros – un
plantel de lujo. Sin embargo, la Liga de Campeones, la competencia de la cual estamos hablando, le ha sido
esquiva. El año pasado logró llegar a la final por primera vez en su historia, pero cayó ante la aplanadora del
Bayern de Munich. Ahora huelen sangre y quieren venganza.
Las chances
Como les conté, el PSG ganó en la ida 4-1. Quedan 90 minutos y todo puede pasar, pero cualquiera puede
entender que en términos de plantilla y de resultado el PSG lleva una ventaja muy difícil de remontar. Por eso,
es justo pensar que lo normal, lo esperable, es que gane el PSG en el marcador total. A esta idea la vamos a
llamar, solo por hoy, hipótesis gala (hG).

Sabiendo ahora lo que saben, estimen por favor valores de p para todas las siguientes observaciones y decidan
qué tan sorprendente les parecería que sucediera (aquí no hay respuestas correctas o incorrectas, son
solamente estimaciones, pero háganlas entre 0 y 1 y con algún sustento):

Resultado o evento Valor de p estimado (o ¿Qué tanto me sorprendería que


sea p(resultado | hG)) sucediera eso?
Gana PSG en total 5-1
Barcelona remonta y gana 6-4
PSG hace otros 4 y el total queda 8-1
El total queda 8-2 a favor del PSG
Gana PSG 3-0 porque el Barcelona no
quiere jugar y el total queda 7-1
Se declara una nueva pandemia el
martes y el partido se suspende

Excelente. Por ahora, y hasta el miércoles, solamente tenemos una hG. Cuando se juegue el partido tendremos
una respuesta y podremos tener un mejor panorama de nuestras predicciones – lo discutiremos en clase. Por
ahora, vamos al ejercicio 2.

Ejercicio 2. Una terapia


El Inventario de Depresión de Beck (BDI por sus siglas en inglés) es una de las pruebas de tamizaje más
utilizadas para determinar si la situación de una persona es objeto de atención clínica por depresión. Los
puntajes del BDI pueden ir entre 0 y 63 y los puntos de corte suelen ser:

Puntajes entre Sugieren


0-13 Sin depresión o mínima
14-19 Depresión leve
20-28 Depresión moderada
29 y más Depresión grave

Supongan ahora que ustedes tienen 30 pacientes con depresión, y dos meses para darles un tratamiento.
Como 30 son muchos, deciden dividirlos en dos:

- A los participantes de un grupo (n = 15) les dan un libro de autoayuda y les piden que lo lean.
- A los otros 15, los ven dos veces a la semana, una hora cada vez, y les hacen ejercicios conductuales y
cognitivos.

Los grupos inician hoy. A los 30 participantes les aplican ustedes un BDI, y en dos meses vuelven a aplicarles
otro BDI. Así las cosas, dentro de dos meses ustedes tendrán cuatro cifras:

- BDI para el grupo de autoayuda ANTES de leer el libro


- BDI para el grupo de autoayuda DESPUÉS del leer el libro
- BDI para el grupo de terapia ANTES de la terapia
- BDI para el grupo de terapia DESPUES de la terapia
Se que su hipótesis de investigación es que en el grupo de terapia los puntajes del BDI antes de la terapia
deben ser mayores que los de BDI después de la terapia, así:

H1: Mantes > Mdespués

Formulen entonces la h0 aquí: _____________________________________________

Ahora, aunque ustedes no tienen todavía datos, llenen esta tabla haciendo una predicción de la p (D | h0) de los
siguientes resultados y si el resultado sería sorprendente para ustedes y qué tanto (recuerden, es una
predicción sin datos, es como una adivinanza):

Resultado (D) ¿Me sorprendería? ¿p-value?


Mantes = Mdespués, en el grupo de terapia
Mantes = 13, Mdespués = 15, en el grupo de terapia
Mantes = 12, Mdespués = 3, en el grupo de terapia
Mantes = Mdespués, en el grupo de autoayuda
Mantes = 16, Mdespués = 181, en el grupo de terapia

Perfecto. Si tienen dudas hasta aquí pregúntenme. Si no, sigamos con las pruebas estadísticas.

Ejercicio 3. Con pruebas


Vamos a hacer un ejercicio primero con las notas del primer parcial de sus compañeros de hace un año, que
están en un archivo CSV (notas.csv) – por lo tanto, necesitarán JASP/Jamovi/Stascloud para el proceso. Para
seguir consolidando lo que hemos venido aprendiendo por favor completen lo siguiente.

• Hay una única variable en los datos, representada en la columna que está diligenciada (tiene notas).
¿Qué representan las líneas?

• ¿Esta es una base tidy? ¿Por qué?

• ¿En qué nivel de medición está la variable? ¿Por qué?

• ¿Cuáles son los valores mínimo, máximo, promedio y de desviación estándar de las notas?

• Pidan los gráficos de distribución (Distribution plots). ¿Aparentemente la distribución de los datos es
normal?

Paso 1. Preparación
Vamos a usar una vieja conocida - la familia de pruebas t, que busca determinar si existen diferencias
estadísticamente significativas entre dos promedios. La prueba t normalmente compara un promedio (el de notas
en este caso), con un valor determinado. Pero primero contesten, poniendo V o F (verdadero o falso), según lo
que vean en los datos:

• ¿El promedio de las notas es igual a cero?


• ¿El promedio de las notas es igual a la media de las notas?
• ¿El promedio de las notas es menor que 3.0?

Vamos a tratar de ver primero la hipótesis de que el promedio de estas notas es distinto (significativamente) de
cero. Estadísticamente, ¿cómo quedaría la nula en este caso? (reemplacen el espacio por el signo correcto)

h0 = μ ___ 0
La primera pregunta importante es que ustedes ya saben el promedio, porque lo pusieron arriba, así que… ¿les
parece que el promedio de las notas es significativamente distinto de cero? ______

Paso 2. Ejecutar la prueba


La opción que deben usar es T-Tests->One-sample T-test. En JASP, la opción deja una caja (por ahora vacía)
así:

Para llenarla, por favor envíen la variable “notas” a la caja de la derecha. Pidan por favor Descriptives y Location
parameter. Examinen la tabla y contesten:

- El valor de p es _____.
- La columna “Mean Difference” les muestra la diferencia que existe entre el promedio y cero. Obviamente,
esa diferencia es _____________ (la misma / diferente) del promedio de notas.

Ahora, intenten por favor cambiar el valor en la caja que dice Test value por cada uno de los valores que aparece
en la primera columna de la siguiente tabla. Para cada valor, escriban también en la tabla la diferencia entre el
promedio de las notas y el valor de prueba, es decir, resten al promedio el valor de prueba correspondiente (en
la primera línea, por ejemplo, es el promedio de las notas menos cero, que es el valor de prueba para esa línea).
Miren cómo cambia el valor de p en la tabla de JASP cuando cambian el valor de prueba y escríbanlo también.
Terminen de diligenciar así la tabla:
Valor de prueba (pongan Promedio de las notas MENOS el Valor de p que resulta en el t-test
este en test value) test value que pusieron
1
2
3,3
3,4
3,5
3,52

Creo que ya pueden examinar la tabla y decir la relación entre valor de prueba (es decir, aquello con lo que vamos
a comparar el promedio), diferencia y el valor de p. Por favor expresen esa relación con sus palabras aquí:

Completen ahora el siguiente párrafo:

En este estudio evaluamos las notas del primer parcial de la asignatura, las cuales estuvieron
entre _______ y _____ (media _______, desviación estándar _______). Se comparó el
promedio usando una prueba t para una muestra con 3.0 como valor de prueba y se encontró
que ____________ (había / no había) una diferencia estadísticamente significativa entre los
dos valores (p _______ (< / >) que 0.05).

Si hasta ahora tienen dudas sobre el asunto por favor consulten los recursos o a mí en clase. Envíen este
documento diligenciado a la plataforma.

También podría gustarte