Documentos de Académico
Documentos de Profesional
Documentos de Cultura
cuantitativos II.
Dr. Cristóbal Hernández C. PhD.
Escuela de Psicología.
Universidad Adolfo Ibáñez.
Presentación equipo docente:
• Profesor: Cristóbal Hernández Contreras, PhD.
• Ayudante: José Antonio Garcés, MsC.
Presentación del curso:
• Curso de Estadísticas inferenciales: Vamos a crear modelos para intentar
entender mejor el mundo y explicar lo que vemos.
• Modelo: Una simplificación útil del mundo, los usamos para (Page, 2021):
• Razonar: Identificar condiciones y deducir implicancias lógicas.
• Explicar: Contar con explicaciones testeables de fenómenos empíricos.
• Diseñar: Diseñar características de políticas e instituciones.
• Comunicar: Conocimiento y entendimiento.
• Actuar: Tomar decisiones estratégicas.
• Predecir: Hacer predicciones numéricas y categóricas del futuro y fenómenos
desconocidos.
• Exporar: Investigar las posibilidades e hipotéticos.
De los datos hacia la sabiduría:
• Data: Datos brutos.
• Información:
Información organizada
y particionada.
• Conocimiento: Modelos
con estructura
correlativa, causal o
lógica.
• Sabiduría: Aplicación de
los modelos para la
toma de decisiones.
Entender el
mundo:
DATOS
Hacer cosas en el mundo:
Transforma la salida del La estadística se unió a la ciencia
modelo a muchas
probabilidades, y computacional, facilitando
selecciona la palabra con desarrollos tecnológicos notables
mayor score. y muy útiles.
• Para convivir con ellos hay que
entenderlos.
Modela relaciones más
complejas y sutiles del
texto a través de varios
modelos.
Transforma palabras a
vectores numéricos que
representan relaciones y
contextos.
El presente curso:
• Para su tranquilidad: Veremos las estadísticas inferenciales básicas
que les capacitaran para entender la literatura científica, y comenzar
su viaje de entendimiento del mundo natural y psicológico.
• Comparar proporciones: Prueba Chi-Cuadrado.
• Comparar promedios entre grupos: Pruebas T.
• Medidas de asociación: Correlaciones.
• Predicción: Regresión lineal y modelo lineal.
• Comparar promedios entre varios grupos: ANOVA.
Lo que necesitan para aprobar el
curso:
• Saber sumar.
• Saber restar.
• Saber dividir.
• Saber multiplicar.
• Hacer todas esas juntas.
• Trabajar en R y R studio.
• Paciencia y mentalidad de crecimiento.
• Trabajar en equipo.
Además, necesitan:
• Dar seis controles de lectura (20% de la nota).
• Hacer tres trabajos prácticos (o ejercicios integrativos) en clase –y lo
que quede para la casa-. (30% de la nota).
• Dar dos pruebas. (50% de la nota).
Intervalos iguales
(volumen gas)
Cero Absoluto
Distribuciones de frecuencia:
• La distribución de frecuencias es tabular el número de ocurrencias de
cada valor y contarlo.
• Si fuese una muestra completamente aleatoria nos da una
probabilidad de que algo ocurra en la población.
• Podemos tabularlo o graficarlo, veamos la parte gráfica con un
histograma:
Histograma:
• Cuenta el número de valores que se encuentra en un valor o rango de
los datos.
Forma de la distribución:
• Simetría: Nos dice si es que tiene la misma forma para ambos lados. Implica que
las probabilidades son equivalentes hacia los valores arriba y debajo de la media.
• Negativamente sesgada: Nos dice que hay mayor probabilidad en los valores
más altos que en los más bajos (por ejemplo en índices de bienestar).
𝛴 𝑥𝑖
𝑥=
𝑁
Ejemplo del sesgo: La media de los
ingresos en Chile.
• Año 2021 (INE):
• Media mensual de ingresos en Chile: $681.039
• Mediana mensual de ingresos en Chile: $457.690
• Si tomáramos la media, asumiríamos que “en promedio” las personas ganan
un 49% más de lo que realmente ganan. La media no es un buen modelo para
una distribución asimétrica y para eso usamos la mediana.
• Base para malas decisiones.
Varianza y Desviación Estándar:
Variabilidad/Precisión.
• La Varianza es la medida promedio en la cual un valor se distancia de
la media.
• Es el promedio del cuadrado de las desviaciones de la media.
Media gusto por helado = 5+6+4+1+2+3+5+2+4+1/10
Usamos N-1
Para no subestimar
Media = 3.3 la varianza poblacional
Al estar los valores más
cerca de la media
Distancia -2.3 5 muestral.
6
4
1
2
3 La desviación estándar es
5
2 solo la raíz cuadrada de la
4 varianza.
1
Entonces:
• La varianza es una medida cuadrática de dispersión promedio del
promedio (si suena complicado es porque repetimos la palabra
promedio dos veces).
• Nos dice cuan preciso es.
• NO es fácilmente interpretable, porque está al cuadrado.
• Para volverla a su escala original (puntaje de gusto por los helados)
revertimos al sacar su raíz cuadrada (Desviación estándar).
• La desviación estándar, entonces, es el promedio de desviaciones del
promedio en su escala original.
Veamos cómo se hace en R:
Percentiles: Clasificación
• Podemos también identificar los percentiles de una distribución.
• Estos son valores bajo los cuales se ubica cierto porcentaje de los
puntajes.
• ¿Dónde está el percentil 50 acá?
Interpretando un Box Plot:
Puntaje Z (estandarización) y escalamiento:
Queremos hacer las cosas comparables