Está en la página 1de 35

Métodos de investigación

cuantitativos II.
Dr. Cristóbal Hernández C. PhD.
Escuela de Psicología.
Universidad Adolfo Ibáñez.
Presentación equipo docente:
• Profesor: Cristóbal Hernández Contreras, PhD.
• Ayudante: José Antonio Garcés, MsC.
Presentación del curso:
• Curso de Estadísticas inferenciales: Vamos a crear modelos para intentar
entender mejor el mundo y explicar lo que vemos.
• Modelo: Una simplificación útil del mundo, los usamos para (Page, 2021):
• Razonar: Identificar condiciones y deducir implicancias lógicas.
• Explicar: Contar con explicaciones testeables de fenómenos empíricos.
• Diseñar: Diseñar características de políticas e instituciones.
• Comunicar: Conocimiento y entendimiento.
• Actuar: Tomar decisiones estratégicas.
• Predecir: Hacer predicciones numéricas y categóricas del futuro y fenómenos
desconocidos.
• Exporar: Investigar las posibilidades e hipotéticos.
De los datos hacia la sabiduría:
• Data: Datos brutos.
• Información:
Información organizada
y particionada.
• Conocimiento: Modelos
con estructura
correlativa, causal o
lógica.
• Sabiduría: Aplicación de
los modelos para la
toma de decisiones.
Entender el
mundo:
DATOS
Hacer cosas en el mundo:
Transforma la salida del La estadística se unió a la ciencia
modelo a muchas
probabilidades, y computacional, facilitando
selecciona la palabra con desarrollos tecnológicos notables
mayor score. y muy útiles.
• Para convivir con ellos hay que
entenderlos.
Modela relaciones más
complejas y sutiles del
texto a través de varios
modelos.

Transforma palabras a
vectores numéricos que
representan relaciones y
contextos.
El presente curso:
• Para su tranquilidad: Veremos las estadísticas inferenciales básicas
que les capacitaran para entender la literatura científica, y comenzar
su viaje de entendimiento del mundo natural y psicológico.
• Comparar proporciones: Prueba Chi-Cuadrado.
• Comparar promedios entre grupos: Pruebas T.
• Medidas de asociación: Correlaciones.
• Predicción: Regresión lineal y modelo lineal.
• Comparar promedios entre varios grupos: ANOVA.
Lo que necesitan para aprobar el
curso:
• Saber sumar.
• Saber restar.
• Saber dividir.
• Saber multiplicar.
• Hacer todas esas juntas.
• Trabajar en R y R studio.
• Paciencia y mentalidad de crecimiento.
• Trabajar en equipo.
Además, necesitan:
• Dar seis controles de lectura (20% de la nota).
• Hacer tres trabajos prácticos (o ejercicios integrativos) en clase –y lo
que quede para la casa-. (30% de la nota).
• Dar dos pruebas. (50% de la nota).

• Si tiene bajo 5 de promedio, además dar un examen.


Ayudantías:
• Habrá 6 ayudantías durante el curso, a cargo de José Antonio.
• Es importante que asistan, ya que repasarán materia en momentos
estratégicos del curso. Es una forma costo-efectiva de que les vaya
bien.
• La primera ayudantía es la tercera semana de clases.
Vamos con el curso:
• Vamos a repasar los contenidos básicos del curso anterior para que
todos y todas estemos en la misma sintonía.
• Si se quedan colgados o colgadas: Pregunten.
• Vamos a ver fórmulas
• Pero no se asusten: Se las vamos a explicar, y recuerden que
requieren de sumar, restar, multiplicar y dividir.
Repaso de lo básico: Variables,
niveles de medición,
descripción y distribuciones.
Dr. Cristóbal Hernández C. PhD.
Escuela de Psicología.
Universidad Adolfo Ibáñez.
Niveles de medición:
• Nominal: Números se usan solo para asignar una etiqueta o
clasificación.
• E.g.: 0 = Hombre; 1 = Mujer; 2 = Otro.
• Usualmente se presentan frecuencias.
• Ordinal: Orden de ranking, no se asumen como números reales
(intervalos no iguales). Típico en ciencia psicológica.
• E.g.: Escala Likert.
• Usualmente se trabaja con Mediana y MAD, sin embargo Media y SD también
se utilizan si se aproxima normalidad.
Ordinal: Intervalos que no son iguales
entre sí.
Intervalar: Los intervalos son iguales
entre sí.
• Intervalar: Posee el atributo de igualdad de los intervalos entre
puntos de medida, sin embargo tiene un cero relativo (no
necesariamente implica ausencia de atributo).
• Ratio: Equivalente a la intervalar pero incluyendo un cero absoluto.
Cero Relativo

Intervalos iguales
(volumen gas)

Cero Absoluto
Distribuciones de frecuencia:
• La distribución de frecuencias es tabular el número de ocurrencias de
cada valor y contarlo.
• Si fuese una muestra completamente aleatoria nos da una
probabilidad de que algo ocurra en la población.
• Podemos tabularlo o graficarlo, veamos la parte gráfica con un
histograma:
Histograma:
• Cuenta el número de valores que se encuentra en un valor o rango de
los datos.
Forma de la distribución:
• Simetría: Nos dice si es que tiene la misma forma para ambos lados. Implica que
las probabilidades son equivalentes hacia los valores arriba y debajo de la media.

• Positivamente sesgada: Nos dice que hay mayor probabilidad de valores en el


espectro más bajo que en el más alto (Por ejemplo en índices de patología).

• Negativamente sesgada: Nos dice que hay mayor probabilidad en los valores
más altos que en los más bajos (por ejemplo en índices de bienestar).

• Modalidad: Cuántos peaks hay, por ejemplo unimodal o bimodal.


Media, Mediana y Moda:
• Media: Sumamos todos los valores y lo dividimos por el número de
valores. Es sesgada ante distribuciones asimétricas.
• Los valores extremos generan un peso importante y la “tiran” hacia ellos.
• Mediana: Ordenamos todos los valores de menor a mayor y
seleccionamos el que está a la mitad. Marca el percentil 50.
• Cuando la distribución es simétrica, media y mediana tienden a coincidir.
• Moda: Es el valor más repetido.

𝛴 𝑥𝑖
𝑥=
𝑁
Ejemplo del sesgo: La media de los
ingresos en Chile.
• Año 2021 (INE):
• Media mensual de ingresos en Chile: $681.039
• Mediana mensual de ingresos en Chile: $457.690
• Si tomáramos la media, asumiríamos que “en promedio” las personas ganan
un 49% más de lo que realmente ganan. La media no es un buen modelo para
una distribución asimétrica y para eso usamos la mediana.
• Base para malas decisiones.
Varianza y Desviación Estándar:
Variabilidad/Precisión.
• La Varianza es la medida promedio en la cual un valor se distancia de
la media.
• Es el promedio del cuadrado de las desviaciones de la media.
Media gusto por helado = 5+6+4+1+2+3+5+2+4+1/10
Usamos N-1
Para no subestimar
Media = 3.3 la varianza poblacional
Al estar los valores más
cerca de la media
Distancia -2.3 5 muestral.

6
4
1
2
3 La desviación estándar es
5
2 solo la raíz cuadrada de la
4 varianza.
1
Entonces:
• La varianza es una medida cuadrática de dispersión promedio del
promedio (si suena complicado es porque repetimos la palabra
promedio dos veces).
• Nos dice cuan preciso es.
• NO es fácilmente interpretable, porque está al cuadrado.
• Para volverla a su escala original (puntaje de gusto por los helados)
revertimos al sacar su raíz cuadrada (Desviación estándar).
• La desviación estándar, entonces, es el promedio de desviaciones del
promedio en su escala original.
Veamos cómo se hace en R:
Percentiles: Clasificación
• Podemos también identificar los percentiles de una distribución.
• Estos son valores bajo los cuales se ubica cierto porcentaje de los
puntajes.
• ¿Dónde está el percentil 50 acá?
Interpretando un Box Plot:
Puntaje Z (estandarización) y escalamiento:
Queremos hacer las cosas comparables

• Los puntajes Z son puntajes estandarizados. Esto quiere decir que se


transforma la unidad de medición para que sea comparable.

• La unidad de un puntaje Z es “desviaciones estándar de la media”.

• Existen varias formas de re-escalamiento para hacer los valores


comparables.
¿Qué es una distribución?
• Una distribución de probabilidad describe la probabilidad de ocurrencia de
ciertos eventos.
• Por lo mismo la suma de sus probabilidades (discreta) o la integral sobre el rango
completo (continua) deben sumar 1.
• Describe cómo se distribuyen las probabilidades a lo largo de una variable
aleatoria.
• Una variable aleatoria es una variable que puede tomar un set de valores
posibles asociados a una probabilidad.
• En concreto, asumimos que una variable aleatoria es aquella que proviene
de una distribución en particular, con una expectativa (e.g.: su promedio) y
una varianza.
Variable aleatoria:
• Una variable aleatoria es una variable que puede tomar un set de
valores posibles asociados a una probabilidad.
• Es una representación matemática de un proceso aleatorio.
• En concreto, asumimos que una variable aleatoria es aquella que
proviene de una distribución en particular, con una expectativa (e.g.:
su promedio) y una varianza.
La famosa distribución normal
• Simétrica.
• Forma de campana.
• Colas tienden al infinito positivo y
negativo.
• En puntaje z se llama la distribución
normal estándar y su unidad son
desviaciones estándar de la media.
• Se hace más ancha o más delgada según
su varianza (menos varianza, más precisa
es la media, por ende más delgada y alta).
• Distribuciones más anchas son más
“bajas”.
• Se describe por su media y varianza.
Distribución normal estándar: La regla
de 68, 95, 99.7
• 68% de los valores se encuentran a
1 desviación estándar del
promedio.
• 95% de los valores se encuentran a
2 desviaciones estándar del
promedio.
• 99.7% de los valores se
encuentran a 3 desviaciones
estándar del promedio.
Veamos esto en R:
Próxima clase:
• Vamos a continuar viendo el teorema del límite central y la ley de los
números grandes, que nos permiten entender la generación de la
distribución normal y la convergencia de la media muestral con la
poblacional al aumentar el número de casos.
• Vamos a ver inferencia estadística y la lógica del valor de probabilidad.
• Vamos a diferenciar la probabilidad del tamaño del efecto.
• Vamos a ver, además la prueba x2 que será nuestra primera prueba
estadística inferencial.
• Vamos a trabajar ahora con datos reales, para acercarnos a lo que
hacemos en realidad en la práctica.

También podría gustarte