Está en la página 1de 45

Metodología de Clase 7:

Ni siempre ni nunca:
investigación en azar y modelos
probabilísticos en

psicología psicología

Material adaptado del material de clase del profesor David Torres


¿Podemos en Psicología hacer afirmaciones
como las siguientes?:

“Todas las personas que en su infancia hayan tenido un


apego inseguro desorganizado con sus cuidadores tendrá
algun tipo de trastorno de personalidad o psicopatología
en su edad adulta”
Determinismo

A diferencia de las ciencias naturales, donde sí se puede afirmar que F = ma (masa por
aceleración), o dado la velocidad inicial de un satélite, saber si al lanzarlo quedará
orbitando la tierra

Es difícil demostrar “el orden de las cosas naturales” en ciencias sociales


Determinismo
“el orden del universo implica determinismo”.
Procesos cuyos resultados están determinados.
La causalidad emerge de manera lógica de esta idea,
donde se asume que tiene que existir un estado
previo de las cosas que cause el estado actual

Observación de Los objetos se caen


“La ciencia descubre una regularidad
regularidades en la
naturaleza, formula -Caída acelerada
descripciones y proporciona Formulación de -Si se lanza hacia arriba,
explicaciones, es decir, descripciones forma una parábola
descubre causas”
Ley gravitación universal (Newton,
Explicaciones mecánica clásica)
Y en psicología…
Siguiendo esta lógica determinista, surge el conductismo

“La psicología desde la perspectiva conductista es


una rama experimental puramente objetiva de la
ciencia natural. Su objetivo teórico es la predicción y
el control del comportamiento”
Watson, 1913
Mientras tanto en física… “los reyes” de la
causalidad

Electrones se mueven entre órbitas de forma predecible solo


probabilísticamente, es decir, con incertidumbre (Bohr)

Le cuesta, pero abraza la idea de una causalidad


probabilística y no estricta, considerando que los
instrumentos de medición están interfiriendo en nuestra
visión completamente determinística (Einstein)

Desarrolla el principio de incertidumbre, donde se afirma


que no es posible determinar simultáneamente la posición
y momentum lineal sin que uno de estos componentes tenga
una determinación estadística (Heisenberg)
Podemos pensar en términos ideales que existen Podemos pensar en términos ideales que existen ciertos
procesos cuyos resultados están absolutamente procesos cuyos resultados son indeterminados.
determinados.
Al pensar de esta forma un proceso asumimos tener Al pensar de esta forma un proceso asumimos tener
absoluta certeza respecto a cada parte del proceso y sus incertidumbre respecto a sus partes y sus resultados.
resultados Estamos conscientes que pueden haber múltiples
resultados y queremos saber cuál será el que va a
ocurrir.
En física se piensa respecto a ciertos fenómenos de esta En múltiples áreas no pensamos los fenómenos de
forma forma determinista
Densidad = Masa/volumen ¿El paciente vivirá o morirá?
¿Me ganaré la lotería?
¿Los alumnos aprenderán a leer o no?
¿Cuánto se demorará el trayecto de la universidad a la casa?
Los fenómenos a los que no les adscribimos Los fenómenos a los que les adscribimos incertidumbre
incertidumbre (no hay variabilidad, siempre el mismo son pensados en términos de modelos probabilísticos FOCO
resultado) son pensados en términos de modelos o aleatorios. Son modelos (herramientas) que buscan DE
determinísticos lidiar con la incertidumbre. ESTE
Todo proceso aleatorio requiere que haya variabilidad CURSO
en los posibles resultados.
Variabilidad como elemento clave
•Cuando tratamos de describir sistemas complejos (seres vivos, sociedades,
patologías), la variabilidad es un aspecto inherente de los datos.

•Todo fenómeno o proceso aleatorio descansa sobre la presencia (o potencial


presencia) de variabilidad. Si no hubiera variabilidad en los posibles resultados no
podría haber incertidumbre. Por ejemplo, si el resultado de un proceso es siempre el
mismo no lo consideraríamos incierto.
Incertidumbre
Consideren la pregunta:
¿Cuántos alumnos en el sistema escolar chileno responderán correctamente el
problema de matemática: 15 = 2x + 6?
Podemos dicotomizar las respuestas: correctas e incorrectas.

Consideramos que esta es una pregunta involucra incertidumbre, ya que no estamos


en condiciones de conocer el resultado de forma certera.
¿Entonces no podemos saber nada sobre el resultado? ¿No podemos responder esta
pregunta?

Que exista algo de incertidumbre no significa que todo sea inci erto.
Una base del razonamiento estadístico es entender que
si bien eventos únicos puede ser inciertos (por ejemplo:
¿responderá Amanda J. correctamente?), es posible
Incertidumbre y identificar patrones en el comportamiento de grandes
números de eventos aleatorios.
patrones
Entonces…
Lo que buscamos en psicología es buscar regularidades o patrones

“..la variabilidad y la incertidumbre en las observaciones en


las ciencias naturales y sociales requieren un enfoque
estadístico para revelar regularidades amplias (…) Si se
rechaza la idea misma de regularidad, entonces los enfoques
sistemáticos para el estudio de la condición humana son
irrelevantes”

Cowles, 2001
Fuentes de incertidumbre
Hay muchas posibles fuentes de incertidumbre que pueden afectar la forma en la que
tratamos de responder una pregunta que nos interesa.
Supongamos que quiero saber el porcentaje estudiantes de 6º básico en Chile presentan problemas
graves de lectura.
1. Incertidumbre asociada a la definición de lo que se quiere saber: ¿Qué entenderé por problema
grave de lectura? ¿dificultad de decodificación? ¿de comprensión? ¿ambas?

2. Incertidumbre asociada al error de medición: identificar quienes caben en esa categoría y


quienes no conlleva el uso de algún tipo de instrumento de medición. Este tendrá cierto error de
medición.

3. Incertidumbre asociada a la muestra: medir A TODOS los estudiantes en Chile es difícil. Recolectar
datos implicaría el obtener una muestra de estudiantes, pero no todas las muestras arrojarán los
mismos resultados.
¿Cómo enfrentar la incertidumbre?
El objetivo de la estadística inferencial es conocer aspectos de la población con un nivel de
error cuantificado.

Si no podemos medir a la población completa, nunca podremos saber con seguridad el valor
de distintos parámetros (el promedio de empatía, la cantidad de personas de 6to básico con
graves problemas de lectura, etc.) Pero si obtenemos una muestra al azar, podemos estimar
estos parámetros, con un nivel de confianza cuantificado (ej. 95%).

Gracias a la inferencia estadística podemos generar conclusiones estadísticas a partir de


resultados específicos, aplicando el conocimiento de las probabilidades. Esto requiere:
1)Estadística descriptiva: Reunir, mostrar y resumir datos; 2) Probabilidad: leyes del azar.

Pero vamos por partes… Primero, ¿qué es la estadística?


Estadística
No aspect of mordern life is untouched by it [statistics]. Modern medicine is built on statistics: for
example, the randomized controlled trial has been described as ‘one of the simples, most powerful,
and revolucionary tools of research’
Hand 2008

No hay aspecto de la vida moderna que no se vea


afectado por ella [la estadística]. La medicina moderna
se basa en la estadística: por ejemplo, el ensayo
controlado aleatorio ha sido descrito como "una de las
herramientas más simples, poderosas y revolucionarias
de la investigación".
¿Cómo definimos estadística?
No existe una única definición de la estadística como disciplina, ciencia o
como parte de la matemática. Existen múltiples definiciones que aluden a
la recolección y uso de datos, la toma de deciciones en situaciones de
incertidumbre, el resumen de información, etc.

Algunas definiciones:
La estadística es la ciencia que se ocupa de la recolección, análisis, presentación e interpretación de
datos. (Enciclopedia Británica, 2007)
La estadística es una colección de procedimientos y principios para adquirir y analizar información para
orientar a las personas y ayudarlas a tomar mejores decisiones cuando enfrentan incertidumbre —
Utts, 2015
¿Cómo definimos estadística?
Para efectos de esta clase entenderemos la estadística como una herramienta o
tecnología que nos permitirá usar ciertos tipos de datos para responder preguntas en
psicología.

Es una de las herramientas que tenemos para responder preguntas (no la única)

Podemos usar modelos cuantitativos para responder preguntas en psicología que


involucran incertidumbre
¿Cómo definimos estadística?
Según el texto de Hand (2008):
Una tecnología es la aplicación de la ciencia y sus descubrimientos, y eso es lo que es la estadística:
la aplicación de nuestra comprensión de cómo extraer información de los datos, y nuestra
comprensión de la incertidumbre

¿Nos ayuda a responder


¿Cualquier tipo de dato?
cualquier tipo de pregunta
en psicología?
No
No
Si recordamos la clase pasada…
La estadística como cualquier
los datos poder ser medidos en
herramienta, tiene
algún tipo de escala limitaciones y ventajas
¿Qué tipo de preguntas?
Selección de personas: Estudiantes, Trabajadores, Pacientes

Autorización de fármacos y/o tratamientos

Diseño y evaluación de intervenciones y/o políticas públicas

Decisiones organizacionales y/o comerciales

Investigación sobre funcionamiento psicológico


Modelo elaborado por David Torres
Algunas aclaraciones de los datos…
Nos referimos a datos empíricos que pueden ser analizados cuantitativamente
Estos datos son traducidos a números (medidos en algún tipo de escala), pero….
DEBEN ESTAR ASOCIADOS A UN SIGNIFICADO

Luego estos datos asociados a un significado, se pueden


modelar o describir, lo que dará como resultado una
inferencia
La estadística como herramienta
Podemos usarla de muchas formas y en múltiples oportunidades durante la
investigación:
Ejemplo:
Pregunta:
"¿Cuál es el efecto de la incorporación de la tecnología educativa en el
rendimiento académico de los estudiantes de secundaria en comparación con
métodos de enseñanza tradicionales?"

Diseño y medición:
¿?
Ejemplo:
Promedio grupo con tecnología: 6,5
Promedio grupo tradicional: 5,9

¿Podemos atribuir la diferencia de notas al tratamiento o es solo producto del azar?


Hipótesis nula: Los dos grupos son equivalentes
Hipótesis alternativa: Los dos grupos son distintos

- Prueba de hipótesis estadística


Estadística descriptiva
El primer paso para entender lo que se viene en
metodologías cuantitativas
Describiendo un conjunto de datos
Hay múltiples formas de describir un conjunto de datos , pero las dos formas
características principales son:

1) La tendencia central

2) La variabilidad o dispersión
Estadísticos descriptivos

Variabilidad
Medidas de tendencia ¿Qué tan dispersos están los datos
central respecto a un punto central?
¿Dónde se agrupan o están
concentrados los datos?
Rango
Media aritmética o promedio Varianza
Mediana Desviación estándar Asimetría
Moda ¿Hacia donde
se desvían?
Un ejemplo
El gráfico muestra la distribución de ingresos de los ocupados (con empleo) del país (busca caracterizar
los ingresos laborales de las personas que son clasificadas como ocupadas en la ENE, encuesta nacional
de empleo, y los ingresos de otras fuentes de los Hogares).

¿Qué medida cree más


apropiada para describir
la tendencia central de
los ingresos de los
ocupados?

A) Promedio (verde)
B) Mediana (morado)
Medidas de tendencia central
MEDIA ARITMÉTICA O PROMEDIO

Puntaje que equilibra las diferencias de los datos observados. La suma de los puntajes
sobre la media es igual a la suma de los puntajes bajo ella

Se calcula sumando todos los valores, y luego dividiendo por el número de datos
Es sensible a los datos extremos
Resume la información a un solo número, por lo que “perdemos” información
Medidas de tendencia central
MEDIANA
Puntaje que se encuentra en la mitad de los datos observados si los ordenamos, es
decir, la mitad de los valores serán iguales mayores y la otra mitad iguales o menores

Image autor: Cmglee

Se calcula ordenando todos los valores, y luego buscando el valor central (o promedio
de los valores centrales si nuestro número de datos es par
No es sensible a los datos extremos como la media, pero entrega otra información
Medidas de tendencia central
MODA
Puntaje o valor más frecuente dentro de los datos observados

En general se calcula realizando una tabla de frecuencias

Cuando la variable es continua (con muchos niveles) podemos calcular un intervalo


modal. El rango donde se concentran la mayoría de los puntajes.

Una distribución de puntajes puede ser bimodal, esto es, tener dos modas.
Seguramente es la combinación de dos distribuciones unimodales; ie. dos grupos de
personas distintas.
Medidas de Variabilidad

Tan importante como el


lugar en el que se
concentran los datos es
conocer que tanto varían
los datos en relación con
ese punto central. Existen
múltiples indicadores de
dispersión o variabilidad.
VARIABILIDAD
RANGO
Es la diferencia (o resta) entre el puntaje de mayor valor, y el de menor valor de nuestra
muestra

Puede no ser informativo si no se tiene en cuenta el contexto o escala de los puntajes


En nuestro ejemplo el rango sería: con valores que van entre [ - ]
VARIABILIDAD
VARIANZA Y DESVIACIÓN ESTANDAR

La varianza se define como la suma de las diferencias entre cada punto y la media,
elevado al cuadrado (para que sea positiva y no se anulen los valores). Luego se divide
por el número de casos

Como la varianza está en unidades cuadráticas (no nos sirve saber la varianza en
metros cuadrados cuando nos interesa la distancia en metros), se saca la raíz cuadrada
a la varianza y se obtiene la desviación estándar
LO IMPORTANTE es que ambas medidas son un indicador de cuán dispersos están los
datos respecto al valor de la media, y mientras mayor sea el valor, más dispersión
encontraremos
Asimetría (skew)
Estás analizando los salarios mensuales de un grupo de empleados en una empresa. La
mayoría de los empleados ganan salarios moderados, pero algunos empleados de alto nivel
ganan salarios extremadamente altos.
¿Cómo sería la asimetría o skew en esta distribución?

Estás analizando las calificaciones finales de un curso universitario. En este curso, la mayoría
de los estudiantes han obtenido calificaciones entre 5,8 y 7,0 puntos. Sin embargo, hay un
pequeño grupo de estudiantes que ha obtenido calificaciones muy bajas, por debajo de 4,5
puntos, debido a problemas diversos que afectaron su desempeño en el curso.
¿Cómo sería la asimetría o skew en esta distribución?
Asimetría (skew)
Medida de posición: Cuantil
Se divide un conjunto de datos ordenados (de menor a mayor) en partes iguales. Se utilizan para
comprender la distribución de los datos y obtener información sobre la posición relativa de un valor
dentro de un conjunto de datos.
Podemos estar interesados en sólo partes de una distribución: por ejemplo, sólo en los valores más
grandes o más pequeños- el 10% más grande o el 10% más pequeño– de un conjunto de datos.
El término general, incluyendo a los cuartiles, deciles, percentiles, etc., como casos especiales, es
cuantil.
Para producir deciles, se divide el conjunto de datos en diez partes iguales, desde el 10% de los datos
más bajo hasta el 10% más alto.
Decil de ingreso autónomo per cápita del hogar: Corresponde a la décima parte o el 10% de los hogares del país
ordenados en forma ascendente de acuerdo con el ingreso autónomo per cápita del hogar, donde el primer decil
(I) representa el intervalo o 10% más pobre de los hogares del país y el décimo decil (X), el intervalo o 10% más
rico de estos hogares.
Probabilidad y azar
Cuantificando la incertidumbre
Probabilidad
La probabilidad es una forma de cuantificar que tan a menudo esperamos que el
experimento produzca ciertos resultados particulares.

Cuando modelamos un experimento aleatorio le asignamos una probabilidad de


ocurrir a cada posible resultados del experimento

Existe una rama de las matemáticas que se llama Teoría de la probabilidad, y estudia
los experimentos o fenómenos aleatorios (dependen del azar).

Como seres humanos que somos, queremos conocer con cierto grado de certeza
los eventos futuros, en base a los eventos o supuestos previos
Es un
experimento
aleatorio
Lanzo una moneda
MODELAMIENTO DEL FENÓMENO
Definiremos cada opción posible de
observar (cara y sello), y
asignaremos una probabilidad de
ocurrencia a cada opción posible

Algunas pistas:
Pr(!"#") =? 𝑃#($%&&') = ?
No puede ser negativo, ya que el 0
significa que es imposible

No puede ser mayor que 1, ya que


el P=1 es certeza absoluta
¿Qué valores creen ustedes que debieran tener 𝑃!"#" y 𝑃$%&&' ?
0≤𝑃≤1
Adaptación de material David Torres
Ahora supongamos que yo estoy en un juego en el cual gano si obtengo el valor 5

Lanzo un dado
¿Ganaré?

SI NO
𝑃$* = 0.5 𝑃+, = 0.5

Esto no es razonable
Parece que nos falló el
modelamiento…
¿Cómo modelamos las probabilidades?
Hay dos corrientes, que se aplican en distintas situaciones:

Teórica Empírica

• La probabilidad depende de la estructura del • La probabilidad es la proporción observada de


experimento aleatorio y (el número de) sus los eventos cuando se repite un evento
posibles resultados. En general este análisis múltiples veces
supone que todos los resultados son • La probabilidad de observar cara o sello
igualmente probables. depende de la proporción observada después
• La probabilidad de obtener cara es siempre 0.5 de repetir el experimento múltiples veces.
• Si lanzamos la moneda 1000 veces, y sale cara
508 veces, entonces Pr(c) = 0.508 y Pr(s) = 0.492

También podría gustarte