Está en la página 1de 21

Aprender estadísticas con jamovi: un tutorial para

estudiantes de psicología y otros principiantes

(Version 0.65)

Danielle Universidad Navarro de


Nueva Gales del Sur
d.navarro@unsw.edu.au

Foxcroft Universidad de
Oxford Brookes David
david.foxcroft@brookes.ac.uk

https://sites.google.com/brookes.ac.uk/learning-stats-with-jamovi
Visión general

estadísticas con jamovi aprendizaje cubre el contenido de una clase de introducción a la estadística, ya que normalmente
enseña a estudiantes universitarios de psicología. El libro discute cómo iniciarse en jamovi, así como dar una introducción a la
manipulación de datos. Desde un punto de vista estadístico, el libro analiza la estadística descriptiva y gráfica primera fi, seguido
de capítulos sobre la teoría de la probabilidad, muestreo y estimación y prueba de hipótesis nula. Después de la introducción de
la teoría, el libro cubre el análisis de tablas de contingencia, correlación, t- pruebas, regresión y ANOVA. estadística bayesiana
están cubiertos al final del libro.

Citación

Navarro DJ y Foxcroft DR (2018). un tutorial para estudiantes de psicología y otros principiantes: las estadísticas con jamovi
aprendizaje. (Versión 0.65). [Disponible en URL: https://sites.google.com /brookes.ac.uk/learning-stats-with-jamovi ]

ii
Este libro se publica bajo una licencia Creative Commons BY-SA (CC BY-SA) versión 4.0.
Esto significa que este libro puede ser reutilizado, remezclado, retenido, revisado y redistribuye (incluido el comercio),
siempre y cuando se dé crédito apropiado a los autores. Si remezclar, o modificar la versión original de este libro de texto
abierto, debe redistribuir todas las versiones de este
libro de texto abierto bajo la misma licencia - CC BY-SA.

https://creativecommons.org/licenses/by-sa/4.0/

iii
Este libro fue traída hoy por la letra 'R' y la palabra 'jamovi'

iv
Tabla de contenido

Prefacio ix

Antecedentes I 1

1 ¿Por qué aprendemos estadísticas? 3


1.1 En la psicología de las estadísticas . . . . . . . . . . . . . . . . . . . . . . . . . . .3

1.2 La advertencia de la paradoja de Simpson . . . . . . . . . . . . . . . . . . . . . 6


1.3 Estadísticas de la psicología . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.4 Estadísticas en la vida cotidiana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.5 Hay más de los métodos de investigación que las estadísticas . . . . . . . . . . . . . . . . . 11

2 Una breve introducción al diseño de la investigación 13


2.1 Introducción a la medición psicológica . . . . . . . . . . . . . . . . . . . . 13
2.2 Escalas de medición . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . dieciséis
2.3 Evaluación de la fiabilidad de una medición . . . . . . . . . . . . . . . . . . . . . 22
2.4 El “papel” de variables: predictores y resultados . . . . . . . . . . . . . . . . . 23
2.5 La investigación experimental y no experimental . . . . . . . . . . . . . . . . . . . 24
2.6 La evaluación de la validez de un estudio . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.7 confunde, objetos y otras amenazas a la validez . . . . . . . . . . . . . . . . . 29
2.8 Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

II Una introducción a jamovi 41

3 Introducción a jamovi 43
3.1 Instalación jamovi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
3.2 análisis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
3.3 La hoja de cálculo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
3.4 Carga de datos en jamovi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
3.5 La importación de datos inusual archivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
3.6 Modificación de los datos de un nivel a otro . . . . . . . . . . . . . . . . . . . . . . 53
3.7 Instalación de módulos adicionales en jamovi . . . . . . . . . . . . . . . . . . . . . . . 53
3.8 Dejar de jamovi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
3.9 Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55

III Trabajar con datos 57

4 La estadística descriptiva 59
4.1 Medidas de tendencia central . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
4.2 Medidas de variabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
4.3 Inclinación y curtosis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76

v
4.4 Estadística descriptiva separado para cada grupo . . . . . . . . . . . . . . . . . . 79
4.5 puntuaciones típicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
4.6 Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82

5 gráficos de dibujo 85
5.1 Los histogramas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
5.2 Boxplots . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
5.3 Los gráficos de barras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
5.4 Ahorro de archivos de imagen utilizando jamovi . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
5.5 Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96

6 asuntos pragmáticos 97
6.1 Tabulación y transversal tabular los datos . . . . . . . . . . . . . . . . . . . . . . . . 98
6.2 Las expresiones lógicas en jamovi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
6.3 Transformación y recodificación de una variable . . . . . . . . . . . . . . . . . . . . . . . 105
6.4 Un poco más funciones y operaciones matemáticas . . . . . . . . . . . . . . . . 114
6.5 Extraer un subconjunto de los datos . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
6.6 Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117

La teoría estadística IV 119

7 Introducción a la probabilidad 127


7.1 ¿Cómo son probabilidades y estadística di↵erent? . . . . . . . . . . . . . . . . . . . . 128
7.2 ¿Qué significa la probabilidad? . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129
7.3 teoría de la probabilidad básico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134
7.4 La distribución binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137
7.5 La distribución normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139
7.6 Otras distribuciones útiles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146
7.7 Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148

8 Estimación de cantidades desconocidas de una muestra 151


8.1 Las muestras, las poblaciones y de muestreo . . . . . . . . . . . . . . . . . . . . . . . . . 151
8.2 La ley de los grandes números . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158
8.3 distribuciones de muestreo y el teorema del límite central . . . . . . . . . . . . . . . 161
8.4 Estimación de los parámetros de población . . . . . . . . . . . . . . . . . . . . . . . . . 167
8.5 Estimación de un intervalo de confianza . . . . . . . . . . . . . . . . . . . . . . . . . . . 173
8.6 Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177

9 La prueba de hipótesis 179


9.1 Una colección de animales de hipótesis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179
9.2 Dos tipos de errores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183
9.3 Prueba estadísticas y distribuciones de muestreo . . . . . . . . . . . . . . . . . . . . . 185
9.4 La toma de decisiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187
9.5 La pag valor de una prueba . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 190
9.6 Informe de los resultados de una prueba de hipótesis . . . . . . . . . . . . . . . . . . . . . 192

vi
9.7 Ejecución de la prueba de hipótesis en la práctica . . . . . . . . . . . . . . . . . . . . . . 195
9.8 tamaño E↵ect, tamaño de la muestra y el poder . . . . . . . . . . . . . . . . . . . . . . . . . 196
9.9 Algunas cuestiones a tener en cuenta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 202
9.10 Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 204

herramientas V estadísticos 207

análisis 10 Los datos categóricos 209


El 10.1 2 ( chi-cuadrado) fi t prueba de bondad de- . . . . . . . . . . . . . . . . . . . . . . 209
El 10.2 2 prueba de independencia (o asociación) . . . . . . . . . . . . . . . . . . . 223
10.3 La corrección de continuidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 227
10.4 tamaño E↵ect . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 228
10.5 Supuestos de la prueba (s) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 229
10.6 La prueba exacta de Fisher . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 230
10.7 La prueba de McNemar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 232
10.8 ¿Cuál es la di↵erence entre McNemar y la independencia? . . . . . . . . . . . 233
10.9 Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 236

11 Comparación de dos medios 237


11.1 El de una muestra Z- prueba . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 237
11.2 El de una muestra t- prueba . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 243
11.3 Las muestras independientes t- de prueba (test de Student) . . . . . . . . . . . . . . . . . . 248
11.4 Las muestras independientes t- prueba (prueba de Welch) . . . . . . . . . . . . . . . . . . . 256
11.5 Las-muestras pareadas t- prueba . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 259
11.6 Una cara pruebas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 263
11.7 tamaño E↵ect . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 265
11.8 Comprobación de la normalidad de una muestra . . . . . . . . . . . . . . . . . . . . . . . . . 268
11.9 Pruebas de datos no normales con pruebas de Wilcoxon . . . . . . . . . . . . . . . . . . . 272
11.10 Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 274

12 de correlación y regresión lineal 277


12.1 Las correlaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 277
12.2 Diagramas de dispersión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 286
12.3 ¿Qué es un modelo de regresión lineal? . . . . . . . . . . . . . . . . . . . . . . . . . 290
12.4 Estimación de un modelo de regresión lineal . . . . . . . . . . . . . . . . . . . . . . . . 292
12,5 regresión lineal múltiple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 294
12.6 Cuantificación de la fi t del modelo de regresión . . . . . . . . . . . . . . . . . . . . . 296
12.7 pruebas de hipótesis para los modelos de regresión . . . . . . . . . . . . . . . . . . . . . . . 299
12.8 En cuanto a coecients regresión . . . . . . . . . . . . . . . . . . . . . . . . . . 302
12.9 Supuestos de regresión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 305
comprobación 12.10 Modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 306
Selección 12.11 Modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 314
12.12 Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 319

vii
13 La comparación de varios medios (ANOVA de una vía) 321
13.1 Una datos ilustrativos establecer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 321
13.2 ¿Cómo funciona ANOVA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 323
13.3 Ejecución de un ANOVA en jamovi . . . . . . . . . . . . . . . . . . . . . . . . . . . . 332
13.4 tamaño E↵ect . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 333
13.5 Múltiples comparaciones y pruebas post hoc . . . . . . . . . . . . . . . . . . . . . . 334
13.6 Supuestos de ANOVA de una vía . . . . . . . . . . . . . . . . . . . . . . . . . . 338
13.7 Comprobación de la homogeneidad de la varianza supuesto . . . . . . . . . . . . . . . . 339
13.8 Comprobación de la hipótesis de normalidad . . . . . . . . . . . . . . . . . . . . . . . . . 341
13.9 Extracción de la hipótesis de normalidad . . . . . . . . . . . . . . . . . . . . . . . . 341
13.10 Sobre la relación entre ANOVA y Student t- prueba . . . . . . . . . . . 344
13.11 Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 345

14 ANOVA factorial 347


14.1 ANOVA factorial 1: diseños equilibradas, no hay interacciones . . . . . . . . . . . . . . 347
14,2 ANOVA factorial 2: diseños equilibrados, las interacciones permitidos . . . . . . . . . . . . 357
14.3 tamaño E↵ect . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 365
14,4 comprobación asunción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 369
14,5 ANOVA como un modelo lineal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 369
14.6 maneras Di↵erent para especificar contrastes . . . . . . . . . . . . . . . . . . . . . . . . . . 381
14.7 Las pruebas post hoc . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 384
14.8 El método de las comparaciones planificadas . . . . . . . . . . . . . . . . . . . . . . . . 387
14.9 ANOVA factorial 3: diseños desequilibrados . . . . . . . . . . . . . . . . . . . . . . 388
14.10 Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 399

VI Endings, alternativas y perspectivas 401

15 estadística bayesiana 403


15.1 razonamiento probabilístico por agentes racionales . . . . . . . . . . . . . . . . . . . . . . 403
15.2 pruebas de hipótesis bayesiano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 408
15.3 ¿Por qué ser un bayesiano? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 411
15.4 bayesiano t- pruebas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 418
15.5 Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 421

16 Epílogo 423
16.1 Las estadísticas no descubiertos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 423
16.2 El aprendizaje de los conceptos básicos, y les aprendizaje en jamovi . . . . . . . . . . . . . . . . . 432

viii
Prefacio a la versión 0.65

En este tenedor de las 'estadísticas de aprendizaje con R' excelente, de Danielle Navarro, hemos reemplazado el software
estadístico utilizado para el análisis y ejemplos con jamovi. A pesar de que R es un potente lenguaje de programación
estadística, no es la primera elección fi para cada instructor y el estudiante al comienzo de su aprendizaje estadístico. Algunos
profesores y estudiantes tienden a preferir el estilo de apuntar y hacer clic de software, y ahí es donde entra en juego jamovi.
Jamovi es un software que pretende simplificar dos aspectos del uso R. Es un o↵ers y hacer clic punto de interfaz gráfica de
usuario (GUI), y también proporciona funciones que combinan las capacidades de muchos otros, con lo que un método más o
SPSS-SAS-como de la programación a R. es importante destacar que, jamovi siempre será libre y abierto - que es uno de sus
valores fundamentales - porque jamovi se hace por la comunidad científica,

Con esta versión Estoy muy agradecido por la ayuda de otras personas que han leído a través de corrientes de aire y proporcionadas
excelentes sugerencias y correcciones, en particular el Dr. David Emery y Kirsty Walter.

David Foxcroft 1 ª de
julio de, 2018

Prefacio a la Versión 0.6

El libro no ha cambiado mucho desde 2015, cuando lanzó la versión 0.5 - es probablemente justo decir que he cambiado más de lo
que tiene. Me movido desde Adelaida a Sydney en 2016 y mi enseñanza per fi l en la UNSW es ​di↵erent a lo que era en Adelaida,
y realmente no he tenido la oportunidad de trabajar en él desde que llegó aquí! Es un poco extraño mirando hacia atrás en esta
realidad. Algunos comentarios rápidos ...

• Extrañamente, el libro consecuentemente Me misgenders, pero supongo que sólo tengo yo la culpa de que uno :-) Ahora hay una
breve nota a pie de página 12 que menciona esta cuestión; en la vida real que he estado trabajando a través de un proceso de
armation de género durante los últimos dos años y la mayoría ir por ella / sus pronombres. Estoy, sin embargo, tan vago como lo que
nunca fue así que no he tomado la molestia de actualizar el texto en el libro.

• Para la versión 0.6 no he cambiado mucho que he hecho algunos cambios menores cuando las personas han señalado los errores
tipográficos u otros errores. En particular, vale la pena señalar el problema asociado con la función en el etaSquared LSR paquete
(que en realidad no se está manteniendo más) en la Sección 14.4. La función se puede utilizar para definir los ejemplos sencillos
en el libro, pero hay errores de cantidad infinita de ahí que no he encontrado tiempo para comprobar! Así que por favor tener
cuidado con eso.

• El cambio más grande es realmente el otorgamiento de licencias! He publicado bajo una licencia Creative Commons (CC
BY-SA 4.0, específicamente), y se coloca toda la fuente de los archivos al repositorio GitHub asociada, si alguien quiere
adaptarla.

ix
Tal vez alguien quisiera escribir una versión que hace uso de la tidyverse ... He oído que se ha vuelto bastante importante a R
en estos días :-)

Mejor,
Danielle Navarro

Prefacio a la Versión 0.5

Otro año, otra actualización. En esta ocasión, la actualización se ha centrado casi por completo en las secciones de teoría del libro.
Los capítulos 9, 10 y 11 han sido reescritas, esperemos que para mejor. En el mismo sentido, el capítulo 17 es completamente nuevo,
y se centra en la estadística bayesiana. Creo que los cambios han mejorado el libro mucho. Siempre me he sentido incómodo por el
hecho de que todas las estadísticas de inferencia en el libro se presentan desde el punto de vista ortodoxo, a pesar de que casi
siempre está presente análisis bayesiano de datos en mi propio trabajo. Ahora que he sabido exprimir métodos bayesianos en el libro
en algún lugar, estoy empezando a sentirse mejor sobre el libro en su conjunto. Yo quería conseguir algunas otras cosas en esta
actualización, pero como siempre estoy corriendo en los plazos de enseñanza, por lo que la actualización tiene que salir de la manera
que es!

Dan Navarro 16 de de febrero

de, el año 2015

Prefacio a la Versión 0.4

Un año ha pasado desde que escribí la última prefacio. El libro ha cambiado en algunas maneras importantes: los capítulos 3 y 4
hacen un mejor trabajo de documentar algunas de las características de ahorro de rstudio tiempo, los capítulos 12 y 13 ahora hacen
uso de nuevas funciones en el paquete LSR para ejecutar pruebas de chi-cuadrado y pruebas de la t, y la discusión de las
correlaciones se ha adaptado para referirse a las nuevas funciones en el paquete LSR. La copia suave de 0.4 ahora tiene una mejor
referencia interna (es decir, enlaces reales entre secciones), aunque que se introdujo en 0.3.1. Hay algunos ajustes aquí y allá, y
muchas correcciones typo (gracias a todos los que señaló los errores tipográficos!), Pero en general no es di↵erent 0,4
masivamente de 0,3.

Ojalá hubiera tenido más tiempo en los últimos 12 meses para agregar más contenido. La ausencia de cualquier discusión de medidas
repetidas ANOVA y modelos mixtos de manera más general realmente me molestan. Mi excusa para esta falta de progreso es que mi segundo
hijo nació en el inicio de 2013, y por lo que pasó la mayor parte del año pasado tratando de mantener la cabeza fuera del agua. Como
consecuencia, los proyectos laterales pendientes de pago, como este libro consiguieron dejados de lado en favor de las cosas que realmente
pagan mi sueldo! Las cosas son un poco más tranquilo ahora, para suerte con cualquier versión 0.5 será un paso adelante grande.

Una cosa que me ha sorprendido es el número de descargas el libro recibe. I finalmente consiguió cierta información básica
de seguimiento de la página web hace un par de meses, y (después de excluir

X
robots obvias) El libro ha tenido un promedio de 90 descargas por día. Eso es alentador: hay al menos unas pocas personas
que encontramos útil el libro!

Dan Navarro 4 de
febrero de, 2014

Prefacio a la Versión 0.3

Hay una parte de mí que realmente no quiere publicar este libro. No está terminado.

Y cuando digo esto me refiero a ella. La referencia es irregular en el mejor de los resúmenes de los capítulos son sólo listas de
títulos de las secciones, no hay índice, no hay ejercicios para el lector, la organización no es óptima, y ​la cobertura de temas no es sólo
lo suficientemente amplio como para mi gusto. Además, hay secciones con contenido que no estoy feliz con cifras, que realmente
necesitan ser rediseñados, y he tenido muy poco tiempo para cazar a las inconsistencias, errores tipográficos o errores. En otras
palabras, este libro no está terminado. Si no tenía una fecha límite que se avecina la enseñanza y un bebé debido en unas pocas
semanas, realmente no estaría haciendo esta disponible en absoluto.

Lo que esto significa es que si usted es un académico en busca de materiales de enseñanza, un Ph.D. estudiante en busca
de aprender R, o simplemente un miembro del público general interesado en las estadísticas, yo le aconsejaría que ser cautos. Lo
que están viendo es un proyecto de primera, y puede no servir a sus propósitos. Si viviéramos en los tiempos en que la
publicación era caro y el Internet no estaba cerca, nunca considerar la liberación de un libro en esta forma. La idea de que
alguien desembolsar $ 80 para esto (que es lo que me dijo una editorial comercial sería un costo de cuando o↵ered para
distribuirla) me hace sentir más que un poco incómodo. Sin embargo, es el siglo 21, por lo que se puede publicar el pdf en mi
página web de forma gratuita, y se puede distribuir copias impresas a través de un servicio de impresión bajo demanda de menos
de la mitad de lo que cobraría un editor de libros de texto. Y por lo que mi culpabilidad se alivió, y estoy dispuesto a compartir!
Con esto en mente, se puede obtener de forma gratuita copias blandas y duras copias baratas en línea,

http://www.compcogscisydney.com/learning-statistics-with-r.html
Copia fuerte: www.lulu.com/content/13570633

Aun así, la advertencia sigue en pie: lo que está viendo es la versión 0.3 de un trabajo en progreso. Si y cuando llega a la versión
1.0, yo estaría dispuesto a respaldar el trabajo y decir, sí, este es un libro de texto que me gustaría animar a otras personas a utilizar.
En ese momento, probablemente voy a empezar sin vergüenza fl la explotación forestal la cosa en el Internet y en general actuar como
una herramienta. Pero hasta que llegue ese día, me gustaría que quedar claro que estoy muy ambivalente sobre la obra tal y como
está.

Todo lo anterior se dice, hay un grupo de personas que me puedo apoyar con entusiasmo a este libro: los estudiantes de
psicología de tomar nuestras clases de métodos de investigación de pregrado (goteo y goteo: A) en 2013. Para usted, este libro es
ideal, porque que fue escrito para acompañar a sus estadísticas de conferencias. Si surge un problema debido a una deficiencia de
estas notas, puedo y adaptar el contenido de la mosca a fi jar ese problema. E↵ectively, usted tiene un libro de texto escrito
específicamente para sus clases, distribuidas de forma gratuita (copia electrónica) o a precios casi de coste (en papel). Mejor todavía,

xi
las notas han sido probados: La versión 0.1 de estas notas se utilizó en la clase de 2011, Versión 0.2 fue utilizado en la clase de
2012, y ahora se encuentra en el mercado la nueva y mejorada versión 0.3. I '[para un resumen histórico] No digo que estas notas son
de titanio plateado genialidad en un palo - aunque si tú quería decir lo que en los formularios de evaluación de los estudiantes,
entonces es totalmente bienvenido a
- porque no son. Lo que digo es que han sido probados en años anteriores y que parecen funcionar bien. Además, hay un
grupo de alrededor de nosotros para solucionar problemas si surgen problemas, y se puede garantizar que al menos uno de sus
profesores ha leído toda la cubierta que hay que cubrir!

De acuerdo, con todo lo que fuera del camino, que debería decir algo sobre lo que el libro pretende ser. En su esencia, se trata de un
libro de texto de introducción a la estadística de tono principalmente a los estudiantes de psicología. Como tal, abarca los temas estándar
que usted esperaría de un tal libro: diseño del estudio, la estadística descriptiva, la teoría de la prueba de hipótesis, t- pruebas, 2 pruebas,
ANOVA y regresión. Sin embargo, también hay varios capítulos dedicados a la R paquete estadístico, que incluye un capítulo sobre la
manipulación de datos y otro en las secuencias de comandos y de programación. Por otra parte, cuando nos fijamos en el contenido que
se presenta en el libro, se dará cuenta de una gran cantidad de temas que tradicionalmente se barren debajo de la alfombra en la
enseñanza de la estadística a los estudiantes de psicología. El bayesiano / división frecuencial se disussed abiertamente en el capítulo de
la probabilidad, y el desacuerdo entre Neyman y Fisher en probar hipótesis hace acto de presencia. Se discute la di↵erence entre la
probabilidad y la densidad. Se proporciona un tratamiento detallado de Tipo I, II y III sumas de cuadrados para desequilibrada ANOVA
factorial. Y si usted tiene una mirada en el Epílogo, debe quedar claro que mi intención es agregar una gran cantidad de contenido más
avanzado.

Mis razones para seguir este enfoque son bastante simple: los estudiantes pueden manejar la situación, y que incluso parecen
disfrutar de ella. En los últimos años he estado agradablemente sorprendido con lo poco diculty que he tenido en lograr que los
estudiantes universitarios de psicología para aprender R. Ciertamente, no es fácil para ellos, y he encontrado que tengo que ser un poco
de caridad en el establecimiento de normas de marcado, pero lo hacen con el tiempo llegar allí. Del mismo modo, no parecen tener una
gran cantidad de problemas para tolerar la ambigüedad y la complejidad en la presentación de ideas estadísticas, siempre y cuando se
les asegura que las normas de evaluación se establecerán de manera que sea apropiada para ellos. Así que si los estudiantes pueden
manejar la situación, ¿por qué no ¿enseñalo? Los beneficios potenciales son bastante atractivos. Si aprenden R, los estudiantes tienen
acceso a CRAN, que es quizás la biblioteca más grande y completa de herramientas estadísticas existentes. Y si aprenden acerca de la
teoría de probabilidades en detalle, es más fácil para ellos para cambiar de ortodoxa prueba de hipótesis nula a los métodos bayesianos
si quieren. Mejor aún, aprenden habilidades de análisis de datos que se pueden tomar para un empleador sin depender de software caro
y propietaria.

Lamentablemente, este libro no es la bala de plata que hace que todo esto sea posible. Es un trabajo en progreso, y tal vez
cuando está terminado será una herramienta útil. Uno entre muchos, yo pensaría. Hay un número de otros libros que tratan de
ofrecer una introducción básica a las estadísticas de uso de R, y no soy tan arrogante como para creer que el mío es mejor. Aún
así, me gusta más el libro, y tal vez otras personas les resulta útil, incompleto que es.

Dan Navarro 13 de enero


de, 2013

xii
Parte I.

Fondo

- 1-
1. ¿Por qué aprendemos estadísticas?

“No has de responder a cuestionarios o pruebas


sobre A↵airs Mundial,
Ni con el cumplimiento Tome cualquier prueba.
No has de sentarse con los estadísticos ni se
comprometen
Una de las ciencias sociales”

- WH Auden 1

1.1

En la psicología de las estadísticas

Para sorpresa de muchos estudiantes, la estadística es una parte signi fi cativa bastante de una educación psicológica. Para sorpresa de nadie, la
estadística es muy raramente el favorito parte de la educación psicológica de uno. Después de todo, si realmente le encantó la idea de hacer las
estadísticas, lo que probablemente será inscrito en una clase de estadísticas en este momento, no es una clase de psicología. Así que, como es
lógico, hay una muy buena parte de la base de que el estudiante no está contento con el hecho de que la psicología tiene tanto las estadísticas en
el mismo. En vista de esto, pensé que el lugar adecuado para empezar podría ser la respuesta a algunas de las preguntas más comunes que las
personas tienen acerca de las estadísticas.

Una gran parte de este problema que nos ocupa se refiere a la idea misma de la estadística. ¿Qué es? ¿Cómo es allá? Y por qué los
científicos están tan sangrienta obsesionado con ella? Todas estas son buenas preguntas, cuando se piensa en ello. Así que vamos a empezar
con el último. Como grupo, los científicos parecen estar extrañamente fi xated sobre la ejecución de las pruebas estadísticas en todo. De hecho,
utilizamos estadísticas tan a menudo que a veces nos olvidamos de explicar a la gente por qué lo hacemos. Es una especie de artículo de fe
entre los científicos y los científicos - sobre todo sociales - que sus hallazgos no se puede confiar hasta que haya hecho algunas estadísticas.
Los estudiantes no graduados podrían ser perdonado por pensar que todos estamos completamente loco, porque nadie se toma el tiempo para
responder a una pregunta muy simple:

1 La cita es a partir de 1946 el poema de Auden Bajo Qué Lira: Un Tracto reaccionaria para el Times, entregado como parte de un discurso de graduación en

la Universidad de Harvard. La historia del poema es bastante interesante:


http://harvardmagazine.com/2007/11/a-poets-warning.html

- 3-
¿Por qué haces estadísticas? ¿Por qué los científicos no sólo tiene que utilizar el sentido común?

Es una pregunta ingenua en algunos aspectos, pero la mayoría son buenas preguntas. Hay un montón de buenas respuestas a ella, 2 pero para mi
dinero, la mejor respuesta es un muy simple: no confiamos en nosotros mismos lo suficiente. Nos preocupa que somos humanos, y susceptibles a
todos los prejuicios, las tentaciones y debilidades que los seres humanos su↵er partir. Gran parte de las estadísticas es básicamente una
salvaguardia. El uso de “sentido común” para evaluar las pruebas significa instinto de confianza, basándose en argumentos verbales y sobre el uso
de la fuerza bruta de la razón humana para llegar a la respuesta correcta. La mayoría de los científicos no creen que este enfoque es probable que
funcione.

De hecho, ahora que lo pienso de ella, esto se parece mucho a una pregunta psicológica para mí, y como yo trabajo en un
departamento de psicología, parece una buena idea para profundizar un poco más aquí. ¿Es realmente plausible pensar que este
enfoque “sentido común” es muy digno de confianza? argumentos verbales tendrá que ser construida en el lenguaje, y todos los idiomas
tienen sesgos - algunas cosas son más difíciles de decir que otros, y no necesariamente porque son falsas (por ejemplo, la
electrodinámica cuántica es una buena teoría, pero difícil de explicar con palabras). Los instintos de nuestra “tripa” no están diseñados
para resolver problemas científicas, que están diseñados para manejar el día a día inferencias - y dado que la evolución biológica es
más lento que el cambio cultural, debemos decir que están diseñados para resolver el día a día los problemas de una mundo di↵erent que
el que vivimos. Fundamentalmente, razonando con sensatez requiere la gente a participar en la “inducción”, haciendo suposiciones
prudentes e ir más allá de la evidencia inmediata de los sentidos para hacer generalizaciones sobre el mundo. Si usted piensa que
usted puede hacer eso sin ser influenciado por varios distractores, bueno, tengo un puente en Londres me gustaría vender. Heck, como
en la siguiente sección, ni siquiera podemos resolver los problemas “deductivo” (aquellos en los que no se requiere de adivinanzas) sin
ser influenciado por nuestros prejuicios preexistentes.

1.1.1 La maldición de sesgo creencia

Las personas son en su mayoría muy inteligente. Estamos sin duda más inteligente que las otras especies que comparten el
planeta con (aunque muchas personas podrían estar en desacuerdo). Nuestras mentes son cosas bastante sorprendentes, y que
parecen ser capaces de las más increíbles hazañas de pensamiento y la razón. Eso no nos hace perfecto sin embargo. Y entre las
muchas cosas que los psicólogos han mostrado en los últimos años es que la verdad es que les resulta difícil ser neutral, para evaluar
las pruebas con imparcialidad y sin dejarse llevar por los prejuicios preexistentes. Un buen ejemplo de esto es el creencia sesgo e↵ect en
el razonamiento lógico: si le preguntas a la gente a decidir si un determinado argumento es lógicamente válido (es decir, la conclusión
sería cierto si las premisas eran ciertas), que tienden a ser influenciados por la credibilidad de la conclusión, aun cuando no debería.
Por ejemplo, aquí hay un argumento válido donde la conclusión es creíble:

Todos los cigarrillos son caros (Premisa 1) Algunas cosas adictivas son de bajo costo
(Premisa 2) Por lo tanto, algunas cosas adictivas no son cigarrillos (Conclusión)

Y aquí hay un argumento válido cuando la conclusión no es creíble:


2 Incluyendo la sugerencia de que el sentido común es escaso entre los científicos.

- 4-
Todas las cosas adictivas son caros (Premisa 1) Algunos cigarrillos son
baratos (Premisa 2) Por lo tanto, algunos cigarrillos no son adictivos
(Conclusión)

la lógica estructura del argumento # 2 es idéntica a la estructura del argumento # 1, y los dos son válidos. Sin embargo, en el
segundo argumento, hay buenas razones para pensar que la premisa 1 es incorrecta, y como resultado es probablemente el caso de
que la conclusión también es incorrecto. Pero eso es totalmente irrelevante para el tema que nos ocupa; un argumento deductivo es
válido si la conclusión es una consecuencia lógica de las premisas. Es decir, un argumento válido no tiene por qué implicar
afirmaciones verdaderas.

Por otro lado, aquí hay un argumento no válido que tiene una conclusión creíble:

Todas las cosas adictivas son caros (Premisa 1) Algunos


cigarrillos son baratos (Premisa 2)
Por lo tanto, algunas cosas adictivas no son cigarrillos (Conclusión)

Y fi nalmente, un argumento no válido con una conclusión increíble:

Todos los cigarrillos son caros (Premisa 1) Algunas cosas adictivas son de
bajo costo (Premisa 2) Por lo tanto, algunos cigarrillos no son adictivos
(Conclusión)

Ahora, supongamos que la gente realmente son perfectamente capaces de dejar de lado sus prejuicios preexistentes sobre lo que es verdad y
lo que no lo es, y puramente evaluar un argumento en sus méritos lógicos. Es de esperar que el 100% de las personas que dicen que los
argumentos válidos son válidos, y el 0% de las personas a decir que los argumentos no válidos son válidos. Así que si ejecutó un experimento
mirando esto, se esperaría ver datos como estos:

conclusión siente conclusión verdadera siente falsa

argumento es válido 100% dice “válido” 100% dice “válido”

argumento no es válido 0% dice “válido” 0% dice “válido”

Si los datos psicológicos tenían este aspecto (o incluso una buena aproximación a esta), puede ser que se sienten seguros en tan sólo confiar
en nuestros instintos. Es decir, que sería perfectamente válido sólo para que los científicos evalúan los datos en función de su sentido común,
y no molestarse con todo esto stu↵ estadísticas turbia. Sin embargo, ustedes han tomado clases de psicología, y ahora es probable que saber
a dónde va esto.

En un estudio clásico, Evans, Barston, y Pollard (1983 ) Corrió un experimento mirando exactamente
esta. Lo que encontraron es que los sesgos cuando se pre-existentes (es decir, creencias) estaban de acuerdo con la estructura de los datos,
todo fue la forma en que usted esperaría:

conclusión siente conclusión verdadera siente falsa

argumento es válido 92% dice “válido”

argumento no es válido 8% dice “válido”

- 5-
No es perfecto, pero eso es bastante bueno. Pero mira lo que pasa cuando nuestros sentimientos intuitivos sobre la verdad de la
conclusión correr en contra de la estructura lógica del argumento:

conclusión siente conclusión verdadera siente falsa

argumento es válido 92% dice “válido” 46% dice “válido”

argumento no es válido 92% dice “válido” 8% dice “válido”

Oh querido, eso no es tan buena. Al parecer, cuando las personas se presentan con un fuerte argumento que contradice nuestras
creencias preexistentes, encontramos bastante difícil incluso percibimos que es un fuerte argumento (la gente sólo lo hicieron el 46% de
las veces). Peor aún, cuando las personas se presentan con un argumento débil que está de acuerdo con nuestros prejuicios
preexistentes, casi nadie puede ver que el argumento es débil (la gente tiene que equivocado 92% del tiempo!). 3

Si se piensa en ello, no es como si estos datos son terriblemente abrumador. En general, la gente hizo lo mejor que el azar a compensar
sus prejuicios anteriores, ya que alrededor del 60% de los juicios de las personas fuera correcta (lo que espera el 50% por casualidad). Aun
así, si usted era un “evaluador de pruebas” profesional, y alguien vino a lo largo y o↵ered una herramienta mágica que mejora sus
posibilidades de tomar la decisión correcta desde el 60% a (por ejemplo) 95%, lo que probablemente saltar en ella, ¿verdad? Por supuesto
que sí. Afortunadamente, en realidad tienen una herramienta que puede hacer esto. Pero no es magia, es la estadística. Así que esa es la
razón # 1 por qué los científicos aman las estadísticas. Es sólo demasiado fácil para nosotros “creer lo que queremos creer”. Así que en lugar,
si queremos “creer en los datos”, vamos a necesitar un poco de ayuda para mantener nuestros prejuicios personales bajo control. Eso es lo
que hace estadísticas, que ayuda a mantener la honestidad.

1.2

La advertencia de la paradoja de Simpson

La siguiente es una historia real (creo!). En 1973, la Universidad de California, Berkeley tenía algunas preocupaciones sobre las
admisiones de los estudiantes en sus cursos de postgrado. Específicamente, lo que causó el problema era que el desglose por
sexo de sus ingresos, que se veía así:

Número de candidatos por ciento admitió varones


8442 44%
Las hembras 4321 35%

Teniendo en cuenta esto, que estaban preocupados por ser demandado! 4 Teniendo en cuenta que había cerca de 13.000 solicitantes, un di↵erence del

9% en las tasas de ingresos entre hombres y mujeres es simplemente demasiado grande como para ser una coincidencia. Pretty datos convincentes,

¿verdad? Y si yo fuera a decir a usted que estos datos actualmente

3 En mis momentos más cínicos Siento que solo este hecho explica el 95% de lo que he leído en Internet.
4 Las versiones anteriores de estas notas de forma incorrecta sugirieron que, efectivamente, fueron demandados. Pero eso no es cierto. Hay un buen

comentario sobre esto aquí: https://www.refsmmat.com/posts/2016-05-08-simpsons-paradox-berkele


y.html . Un gran agradecimiento a Wilfried Van hirtum por señalar esto a mí.

- 6-
re fl ejan un sesgo débil en favor de las mujeres (más o menos!), lo que probablemente piensa que yo estaba loco o sexista.

Curiosamente, en realidad es una especie de verdad. Cuando la gente comenzó a buscar con más cuidado los datos de admisión
contaron una historia bastante di↵erent ( Bickel, Hammel, y O'Connell 1975 ). Específicamente, cuando observaron que en un departamento
por departamento de base, resultó que la mayoría de los departamentos de hecho tenían un poco mayor tasa de éxito para las solicitantes
que para los solicitantes de sexo masculino. La siguiente tabla muestra las cifras de admisión fi para los seis departamentos más grandes
(con los nombres de los departamentos eliminadas por razones de privacidad):

Los machos Las hembras

Los solicitantes Departamento Porcentaje de solicitantes admitidos por ciento admitió


UNA 825 62% 108 82%
segundo 560 63% 25 68%
do 325 37% 593 34%
re 417 33% 375 35%
mi 191 28% 393 24%
F 272 6% 341 7%

Sorprendentemente, la mayoría de los departamentos tenían una mayor tasa de ingresos para las mujeres que para los hombres! Sin embargo, la tasa

global de admisión a través de la universidad para las mujeres era inferior que para los hombres. ¿Cómo puede ser esto? ¿Cómo pueden estas dos

afirmaciones ser verdad al mismo tiempo?

Esto es lo que está pasando. En primer lugar, observe que los departamentos son no iguales entre sí en términos de sus porcentajes
de admisión: algunos departamentos (por ejemplo, A, B) tendido a admitir un alto porcentaje de los solicitantes cali fi cados, mientras que
otros (por ejemplo, F) tendían a rechazar la mayoría de los candidatos, incluso si eran alta calidad. Así, entre los seis departamentos que
se muestran arriba, observe que el departamento A es el más generoso, seguido de B, C, D, E y F, en ese orden. A continuación,
observe que machos y hembras tendían a aplicar a di↵erent departamentos. Si clasificamos los departamentos en términos del número
total de solicitantes de sexo masculino, obtenemos UNA ° segundo ° re ° do ° F ° E (los departamentos “fáciles” están en negrita). En general,
los hombres tienden a aplicarse a los departamentos que tenían altas tasas de admisión. Ahora comparar esto con cómo los solicitantes
femeninas se distribuyeron. Clasificación de los departamentos en términos del número total de solicitudes de mujeres produce una
di↵erent bastante ordenar C ° mi ° re ° F ° UNA ° SEGUNDO. En otras palabras, lo que parecen estos datos que se sugiere es que los
solicitantes femeninas tienden a aplicar a los departamentos “más duros”. Y de hecho, si nos fijamos en la figura 1.1 vemos que esta
tendencia es sistemática, y bastante sorprendente. Esto se conoce como e↵ect

La paradoja de Simpson . No es común, pero a veces ocurre en la vida real, y la mayoría de la gente está muy sorprendido por que
cuando primero lo encuentran, y muchas personas se niegan a creer que ni siquiera es real. Es muy real. Y si bien hay un montón
de lecciones estadísticos muy sutiles enterrados allí, quiero usarlo para hacer un punto mucho más importante: hacer la
investigación es difícil, y hay un montón de trampas sutiles, contra-intuitiva al acecho de los incautos. Esa es la razón # 2 por qué
los científicos aman las estadísticas, y por qué enseñamos los métodos de investigación. Porque la ciencia es difícil, y la verdad es
a veces hábilmente escondido en los rincones y grietas de datos complejos.

Antes de abandonar este tema por completo, quiero señalar algo realmente crítico que a menudo se pasa por alto en una clase de
métodos de investigación. Estadísticas sólo resuelve parte del problema. Recordemos que empezamos todo esto con la preocupación de
que los procesos de admisión de Berkeley podrían estar sesgadas injustamente a las candidatas. Cuando nos fijamos en los datos
“agregados”, que parecía como

- 7-
100
80
tasa de admisión (ambos sexos)

60
40
20
0

0 20 40 60 80 100

Porcentaje de mujeres solicitantes

Figura 1.1: Los Berkeley 1973 admisiones de las universidades de datos. Esta cifra representa gráficamente la tasa de admisión para
los 85 departamentos que tenían por lo menos un solicitante femenino, como una función del porcentaje de solicitantes que eran
mujeres. La trama es un nuevo trazado de la figura 1 a partir de Bickel, Hammel, y O'Connell (1975 ). Círculos departamentos parcela
con más de 40 candidatos; el área del círculo es proporcional al número total de los solicitantes. Las cruces traman departamentos con
menos de 40 solicitantes.

..............................................................................................

la universidad se discrimina a las mujeres, pero cuando nos “desagregar” y observó el comportamiento individual de todos los
departamentos, resultó que los departamentos reales eran, en todo caso, ligeramente sesgada a favor de las mujeres. El sesgo
de género en los ingresos totales fue causado por el hecho de que las mujeres tienden a auto-selección de los departamentos
más duras. Desde un punto de vista legal, que probablemente poner la universidad en la clara. admisiones de postgrado se
determinan a nivel del departamento individual, y hay buenas razones para hacerlo. A nivel de los departamentos individuales
las decisiones son más o menos imparcial (el sesgo débil en favor de las mujeres en ese nivel es pequeño, y no es coherente
en todos los departamentos). Dado que la universidad no puede dictar qué departamentos personas optan por aplicar a,

- 8-