Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Clase 7 - 2023
Clase 7 - 2023
Ni siempre ni nunca:
investigación en azar y modelos
probabilísticos en
psicología psicología
A diferencia de las ciencias naturales, donde sí se puede afirmar que F = ma (masa por
aceleración), o dado la velocidad inicial de un satélite, saber si al lanzarlo quedará
orbitando la tierra
Que exista algo de incertidumbre no significa que todo sea inci erto.
Una base del razonamiento estadístico es entender que
si bien eventos únicos puede ser inciertos (por ejemplo:
¿responderá Amanda J. correctamente?), es posible
Incertidumbre y identificar patrones en el comportamiento de grandes
números de eventos aleatorios.
patrones
Entonces…
Lo que buscamos en psicología es buscar regularidades o patrones
Cowles, 2001
Fuentes de incertidumbre
Hay muchas posibles fuentes de incertidumbre que pueden afectar la forma en la que
tratamos de responder una pregunta que nos interesa.
Supongamos que quiero saber el porcentaje estudiantes de 6º básico en Chile presentan problemas
graves de lectura.
1. Incertidumbre asociada a la definición de lo que se quiere saber: ¿Qué entenderé por problema
grave de lectura? ¿dificultad de decodificación? ¿de comprensión? ¿ambas?
3. Incertidumbre asociada a la muestra: medir A TODOS los estudiantes en Chile es difícil. Recolectar
datos implicaría el obtener una muestra de estudiantes, pero no todas las muestras arrojarán los
mismos resultados.
¿Cómo enfrentar la incertidumbre?
El objetivo de la estadística inferencial es conocer aspectos de la población con un nivel de
error cuantificado.
Si no podemos medir a la población completa, nunca podremos saber con seguridad el valor
de distintos parámetros (el promedio de empatía, la cantidad de personas de 6to básico con
graves problemas de lectura, etc.) Pero si obtenemos una muestra al azar, podemos estimar
estos parámetros, con un nivel de confianza cuantificado (ej. 95%).
Algunas definiciones:
La estadística es la ciencia que se ocupa de la recolección, análisis, presentación e interpretación de
datos. (Enciclopedia Británica, 2007)
La estadística es una colección de procedimientos y principios para adquirir y analizar información para
orientar a las personas y ayudarlas a tomar mejores decisiones cuando enfrentan incertidumbre —
Utts, 2015
¿Cómo definimos estadística?
Para efectos de esta clase entenderemos la estadística como una herramienta o
tecnología que nos permitirá usar ciertos tipos de datos para responder preguntas en
psicología.
Es una de las herramientas que tenemos para responder preguntas (no la única)
Diseño y medición:
¿?
Ejemplo:
Promedio grupo con tecnología: 6,5
Promedio grupo tradicional: 5,9
1) La tendencia central
2) La variabilidad o dispersión
Estadísticos descriptivos
Variabilidad
Medidas de tendencia ¿Qué tan dispersos están los datos
central respecto a un punto central?
¿Dónde se agrupan o están
concentrados los datos?
Rango
Media aritmética o promedio Varianza
Mediana Desviación estándar Asimetría
Moda ¿Hacia donde
se desvían?
Un ejemplo
El gráfico muestra la distribución de ingresos de los ocupados (con empleo) del país (busca caracterizar
los ingresos laborales de las personas que son clasificadas como ocupadas en la ENE, encuesta nacional
de empleo, y los ingresos de otras fuentes de los Hogares).
A) Promedio (verde)
B) Mediana (morado)
Medidas de tendencia central
MEDIA ARITMÉTICA O PROMEDIO
Puntaje que equilibra las diferencias de los datos observados. La suma de los puntajes
sobre la media es igual a la suma de los puntajes bajo ella
Se calcula sumando todos los valores, y luego dividiendo por el número de datos
Es sensible a los datos extremos
Resume la información a un solo número, por lo que “perdemos” información
Medidas de tendencia central
MEDIANA
Puntaje que se encuentra en la mitad de los datos observados si los ordenamos, es
decir, la mitad de los valores serán iguales mayores y la otra mitad iguales o menores
Se calcula ordenando todos los valores, y luego buscando el valor central (o promedio
de los valores centrales si nuestro número de datos es par
No es sensible a los datos extremos como la media, pero entrega otra información
Medidas de tendencia central
MODA
Puntaje o valor más frecuente dentro de los datos observados
Una distribución de puntajes puede ser bimodal, esto es, tener dos modas.
Seguramente es la combinación de dos distribuciones unimodales; ie. dos grupos de
personas distintas.
Medidas de Variabilidad
La varianza se define como la suma de las diferencias entre cada punto y la media,
elevado al cuadrado (para que sea positiva y no se anulen los valores). Luego se divide
por el número de casos
Como la varianza está en unidades cuadráticas (no nos sirve saber la varianza en
metros cuadrados cuando nos interesa la distancia en metros), se saca la raíz cuadrada
a la varianza y se obtiene la desviación estándar
LO IMPORTANTE es que ambas medidas son un indicador de cuán dispersos están los
datos respecto al valor de la media, y mientras mayor sea el valor, más dispersión
encontraremos
Asimetría (skew)
Estás analizando los salarios mensuales de un grupo de empleados en una empresa. La
mayoría de los empleados ganan salarios moderados, pero algunos empleados de alto nivel
ganan salarios extremadamente altos.
¿Cómo sería la asimetría o skew en esta distribución?
Estás analizando las calificaciones finales de un curso universitario. En este curso, la mayoría
de los estudiantes han obtenido calificaciones entre 5,8 y 7,0 puntos. Sin embargo, hay un
pequeño grupo de estudiantes que ha obtenido calificaciones muy bajas, por debajo de 4,5
puntos, debido a problemas diversos que afectaron su desempeño en el curso.
¿Cómo sería la asimetría o skew en esta distribución?
Asimetría (skew)
Medida de posición: Cuantil
Se divide un conjunto de datos ordenados (de menor a mayor) en partes iguales. Se utilizan para
comprender la distribución de los datos y obtener información sobre la posición relativa de un valor
dentro de un conjunto de datos.
Podemos estar interesados en sólo partes de una distribución: por ejemplo, sólo en los valores más
grandes o más pequeños- el 10% más grande o el 10% más pequeño– de un conjunto de datos.
El término general, incluyendo a los cuartiles, deciles, percentiles, etc., como casos especiales, es
cuantil.
Para producir deciles, se divide el conjunto de datos en diez partes iguales, desde el 10% de los datos
más bajo hasta el 10% más alto.
Decil de ingreso autónomo per cápita del hogar: Corresponde a la décima parte o el 10% de los hogares del país
ordenados en forma ascendente de acuerdo con el ingreso autónomo per cápita del hogar, donde el primer decil
(I) representa el intervalo o 10% más pobre de los hogares del país y el décimo decil (X), el intervalo o 10% más
rico de estos hogares.
Probabilidad y azar
Cuantificando la incertidumbre
Probabilidad
La probabilidad es una forma de cuantificar que tan a menudo esperamos que el
experimento produzca ciertos resultados particulares.
Existe una rama de las matemáticas que se llama Teoría de la probabilidad, y estudia
los experimentos o fenómenos aleatorios (dependen del azar).
Como seres humanos que somos, queremos conocer con cierto grado de certeza
los eventos futuros, en base a los eventos o supuestos previos
Es un
experimento
aleatorio
Lanzo una moneda
MODELAMIENTO DEL FENÓMENO
Definiremos cada opción posible de
observar (cara y sello), y
asignaremos una probabilidad de
ocurrencia a cada opción posible
Algunas pistas:
Pr(!"#") =? 𝑃#($%&&') = ?
No puede ser negativo, ya que el 0
significa que es imposible
Lanzo un dado
¿Ganaré?
SI NO
𝑃$* = 0.5 𝑃+, = 0.5
Esto no es razonable
Parece que nos falló el
modelamiento…
¿Cómo modelamos las probabilidades?
Hay dos corrientes, que se aplican en distintas situaciones:
Teórica Empírica