Manual de Estadística Aplicada A La Psicología

MANUAL DE ESTADÍSTICA APLICADA A LA
PSICOLOGÍA
Guía para estudiantes
Preuss, Maximiliano; Gruppi, Rocío; Ferrero, Florencia y Arruabarrena, Lucila.
1
A la memoria de Enzo Moreno.
2
ÍNDICE
Prefacio………………………………………………………………………………………………………………………………………………………………………………………………………… 3
Capítulo I. Armado de base de datos…………………………………………………………………………………………………………………………………………………………… 4
Capítulo II. Ordenar casos……………………………………………………………………………………………………………………………………………………………………………. 19
Capítulo III. Frecuencias………………………………………………………………………………………………………………………………………………………………………………... 25
Capítulo IV. Seleccionar casos y Segmentar archivo…………………………………………………………………………………………………………………………………………… 32
Capítulo V. Recodificación de variables……………………………………………………………………………………………………………………………………………………….. 55
Capítulo VI. Calcular variable………………………………………………………………………………………………………………………………………………………………………... 82
Capítulo VII. Medidas de tendencia central y dispersión………………………………………………………………………………………………………………………………. 95
Capítulo VIII. Valores extremos……………………………………………………………………………………………………………………………………………………………………….. 112
Capítulo IX. Puntajes transformados: Percentil……………………………………………………………………………………………………………………………………………. 121
Capítulo X. Puntajes transformados: Cuartil……………………………………………………………………………………………………………………………………………... 134
Capítulo XI. Puntajes transformados: Puntaje Z…………………………………………………………………………………………………………………………………………. 138
Capítulo XII. Estadística inferencial……………………………………………………………………………………………………………………………………………………………... 145
Capítulo XIII. Prueba de normalidad…………………………………………………………………………………………………………………………………………………………….. 148
Capítulo XIV. Estadísticos de relación de variables……………………………………………………………………………………………………………………………………… 161
Capítulo XV. Estadísticos de diferencia de grupos………………………………………………………………………………………………………………………………………. 179
Capítulo XVI. Procedimientos y respuestas en Estadística inferencial………………………………………………………………………………………………………… 218
3
Prefacio
Este manual fue inspirado y realizado en tributo a Enzo Moreno, un brillante estudiante quien ha dejado una huella imborrable en la Universidad Abierta
Interamericana, especialmente destacado en el campo de la Metodología y la Estadística y cuyo deceso debimos lamentar a muy temprana edad, cuando aún
no se había graduado.
Desde entonces, la idea del manual siempre estuvo vigente en la mente de los autores y fue este contexto de crisis motivada por el Covid-19 el que
permitió consumar dicha idea en realidad, pues consideramos de vital importancia tener un manual de referencia al cual acudir en este marco de no
presencialidad.
Evidentemente existen muchos textos de Estadística y de autores de gran renombre (éste no sería el caso), por lo que difícilmente este libro pueda
siquiera compararse con ellos.
No obstante, existe un marcado déficit de bibliografía que específicamente refiera a cuestiones atinentes a la vinculación entre estadística y psicología
y es este inconveniente el que humildemente pretendemos morigerar. Además la presentación icónica de gran parte del material procura amenizar el estudio
por parte de los alumnos, supliendo aquellos contenidos técnicos intrascendentes que operan más bien como obstáculos que como facilitadores.
La idea de esta publicación es presentar una aproximación rudimentaria a las nociones estadísticas básicas y pensar su aplicabilidad en investigaciones
en psicología bajo la lógica de la versión hipotético-deductivista del método científico.
Si bien el manual está pensado para estudiantes que cursan la asignatura “Estadística Aplicada a la Psicología” en la Universidad Abierta Interamericana,
también puede resultar de utilidad a quienes se encuentren realizando su tesis y necesiten refrescar las cuestiones relativas al procesamiento de datos.
Finalmente, para culminar, cabe referir que esta obra conjuga conceptos estadísticos con procedimientos a efectuar en el SPSS (Paquete Estadístico para
Ciencias Sociales) donde dichos conceptos quedan debidamente visibilizados y aplicados, pues no hay que olvidar el marcado tinte práctico de la asignatura.
4
Capítulo I
Armado de base de datos
5
Estadística Aplicada a la Psicología
La estadística es una técnica de organización y sistematización que se utiliza desde tiempos inmemoriales. Los primeros esbozos de la misma provienen
del Antiguo Egipto donde se hallaron rastros de cierto orden administrativo en los que se observaban los movimientos poblacionales de manera periódica y
sistemática, pasando por la Antigua Grecia en la que el mismísimo Sócrates destaca el valor fundamental de pesquisar el desarrollo tanto de la población como
de las riquezas; y Roma con sus famosos censos romanos en los que se observaba y calculaba el volumen poblacional y sus bienes. De esta manera y durante
muchos siglos fue utilizada en asuntos políticos y de estado (Barreto Villanueva, 2012; Cortada de Kohan, 1994).
En el siglo XVI se le otorga el nombre de estadística a lo que en la actualidad se entiende como “los métodos científicos por medio de los cuales podemos
recolectar, organizar, resumir, presentar y analizar datos numéricos relativos a un conjunto de individuos u observaciones y que nos permiten extraer
conclusiones válidas y efectuar decisiones lógicas, basadas en dicho análisis” (Cortada de Kohan, 1994, p. 23); y fueron autores como Pearson, Neyman y Fisher
-entre otros- quienes introducen la estadística en otros ámbitos tales como la agronomía, la biología y la actividad científica en general (Barreto Villanueva,
2012).
Claro está que esta disciplina también se ha incluido en la Psicología. Cuando se estudia una característica de un particular grupo sin arribar a ninguna
conclusión sobre ello, se estará en presencia de estadística descriptiva. Un ejemplo de ello es el porcentaje de pacientes con diagnóstico de depresión en un
hospital psiquiátrico. Si, en cambio, se hacen inferencias a partir de los resultados obtenidos y se sacan conclusiones acerca de la población estudiada, se
hablará de estadística inferencial. Por ejemplo: relación entre abuso de sustancias y depresión.
En un principio la recolección y análisis de datos se llevaba adelante de forma manual pero, con el paso de los años y los avances tecnológicos, se han
creado programas computacionales específicos para abordar con éxito esta tarea. La mayoría de estos programas tienen un funcionamiento similar. Uno de
ellos, y del que particularmente se encargará este manual, es el IBM® SPSS® (Statiscal Package for the Social Sciences o -en español- Paquete Estadístico para
las Ciencias Sociales) que es, de hecho, uno de los más famosos y difundidos en su ramo. Entonces, será de vital importancia que los lectores tengan en su
ordenador el programa instalado para aprovechar al máximo la información aquí suministrada.
6
Armado de la base de datos
Cuando se abre el programa aparece la siguiente ventana. La misma debe cerrarse (X) como cualquier otra ventana de Windows.
7
Luego, en la parte inferior de la ventana, existen dos vistas:
1- Vista de datos: Es el espacio donde serán cargados los datos recolectados.
8
2- Vista de variables: Es el lugar donde se crean las variables de la base de datos.
En primer lugar, cuando se habla de variable se hace referencia a las propiedades o características de una entidad que adquieren diversos valores
(Cortada de Kohan, 1994; Núñez Flores, 2007). En palabras de Baranger (2009), una variable es “un conjunto estructurado de valores” (p. 17). Ejemplos
de variables son: edad, estado civil, nivel educativo, nivel de ansiedad, nivel de resiliencia, etc. Se llaman variables, precisamente, porque estos atributos
varían de un sujeto a otro.
Es en esta vista donde se comenzará a trabajar.
9
Componentes de la vista de variables
1- Nombre: Es el nombre de la variable abreviado. No puede llevar espacio, no puede comenzar con un número así como tampoco puede empezar ni
terminar con punto (pero éste puede utilizarse entre palabras). Además, cada nombre debe ser único, no pueden existir dos variables con idéntico
nombre.
Una vez que se aprieta ENTER, por default aparecerán completos los siguientes casilleros (campos) a la derecha, los cuales hay que disponerse a
modificarlos.
2- Tipo: Tipo de variable a utilizar, el mismo dependerá de los valores de la variable.

• Numérico: Este tipo aplica a aquellas variables que presentan escala de valores o se completan con un número (ej. Sexo: 1.Femenino - 2.Masculino -
3.Intersexual).
• Fecha: Formatos de Fecha (Ej.: dd.mm.yy)
• Cadena: Son aquellas variables que no poseen escala de valores y se completan con palabras (ej. Profesión). La respuesta se escribe en letras.
10
3- Anchura: Número de caracteres que se necesitan para cargar los datos de una variable en la Vista de Datos (ej.: en una variable de tipo numérico, con
menos de 10 valores, corresponde 1(un) dígito de anchura, a partir del 10 se requieren 2 (dos) dígitos; a partir del 100 se necesitan 3 (tres) dígitos,
etc.). En el ejemplo de la variable Sexo la anchura correcta es 1, puesto que posee tres valores; en cambio si el tipo es cadena, la anchura dependerá de
lo que el encuestado deba completar (un número estándar es 50). La anchura que aparece por default es 8 (como se observa en el segundo renglón),
pero puede y debe ajustarse según las características de la variable que se esté ingresando.
Nota: Para valor 1 en anchura el valor en el campo DECIMALES debe estar en 0, ya que el campo decimal no puede ser superior al valor en ANCHURA.
11
4- Decimales: Cantidad de decimales que desean consignarse por variable (desde la cátedra se recomienda no utilizar decimales y por ende se sugiere
siempre colocarlos en 0, a menos que sean indispensables para la medición, tal como ocurre en variables tales como peso, altura, etc).
12
5- Etiqueta: Es la descripción detallada del nombre de la variable (Ej.: la etiqueta de la variable Sexo podría ser: Sexo del encuestado).
13
6- Valores: Son las diversas categorías que componen una variable (Korn, 1984), es decir las diferentes opciones de respuesta que ésta presenta (por
ejemplo, valores de la variable sexo son: 1. Femenino – 2. Masculino – 3. Intersexual). Estos valores pueden representar presencia o ausencia, orden o
jerarquía o bien, magnitudes. Los valores deben cumplir tres requisitos: ser exhaustivos, excluyentes y coherentes. Esto significa que deben
contemplar todas las opciones posibles (exhaustivos), que cada uno de los valores sean invalidantes de los otros, si se clasifica como mujer no se
puede clasificar como hombre al mismo tiempo (excluyente) y, por último, los valores deben tener sentido, sería incoherente colocar “caballo” como
un valor de la variable sexo.
Para acceder a la configuración de los valores, se debe hacer click en la celda y a la derecha aparecerá un cuadrado con tres puntos .
Hacer click en los tres puntos y se desplegará la siguiente ventana:
Se debe completar valor (se carga la posición de manera numeral que ocupará la opción, ej.: 3); etiqueta (se carga el significado de dicha opción, ej.:
Intersexual), click en Añadir, una vez completos los valores, click en Aceptar.
14
7- Perdidos: Son todos los datos que el encuestado no ha completado o ha marcado más de una opción, por lo tanto, se anula.
8- Alineación: El programa colocará por defecto las variables numéricas a la derecha y las cadenas a la izquierda, pero puede ser modificada.
9- Columnas: Indica el ancho de la celda (en caracteres) en la que se ingresaron los valores.
10- Rol: Implica la función que cumple una variable en una investigación (dependiente, independiente, etc).
15
11- Medida: Este es uno de los campos primordiales a aprender y, tal como su nombre lo expresa, indica el nivel de medición de una variable. Existen
cuatro tipos de medidas que se utilizan en ciencias sociales: nominales, ordinales, escalares de intervalo y escalares de razón.
Las escalas nominales representan el nivel más bajo de medición que una variable puede obtener. Se utiliza para clasificar o describir los valores de la
variable por nombres o categorías. La asignación de números es completamente arbitraria, es decir, queda a criterio de quien carga los valores. Además, no
presentan ningún orden determinado. Ejemplo de este tipo de medida es la variable sexo, compuesta por los valores: 1- femenino, 2- masculino, 3-intersexual,
esto significa que como la variable es nominal no se explica si las mujeres son superiores o inferiores a los hombres. El fin último de este tipo de variables es
rotular (Beltrán, 2012; Clark-Carter, 2002; Cortada de Kohan, 1994; Levin y Levin, 2001; Pagano, 2011).
Las escalas ordinales, tal como su nombre lo indica, deben colocarse en un orden. Entre las categorías de la variable se pueden establecer relaciones,
eso permite que rija un orden jerárquico para los valores. Lo que no se puede determinar es la distancia exacta entre un valor y el otro, se sabe que uno es
superior o inferior a otro, pero no se conoce la magnitud de esta diferencia (Cortada de Kohan, 1994; Levin y Levin, 2001; Pagano, 2011). Un ejemplo de
variable orinal es el nivel educativo de un sujeto, puesto que entre los valores primario, secundario, terciario, universitario y posgrado hay un orden claramente
establecido, pero no se sabe con exactitud en qué momento se encuentra el encuestado o qué etapa de cierto nivel alcanzó.
Por último, en las variables cuya medida es escalar los valores poseen propiedades de magnitud, por lo que serán exactas. Entonces, no sólo se puede
establecer un orden, sino que además se puede conocer la distancia específica entre valores. Existen dos tipos de escalares: de intervalo y de razón. Las
primeras, las escalares de intervalo, permiten asignar un valor real a todos los atributos. La particularidad que tienen estas variables es que tienen 0 (cero)
arbitrario. Un ejemplo clásico de este tipo es la temperatura, en la que una temperatura de 0°C no significa ausencia de la misma, sino que ésta es demasiado
baja y que en el exterior hace mucho frío. Sin embargo, las escalares de razón son variables que sí poseen 0 (cero) absoluto, esto significa que el 0 coincide
con la nada, existe un punto de partida fijo. Ejemplos de este tipo de variables son: la edad, el peso, la altura de un individuo (Clark-Carter, 2002; Cortada de
Kohan, 1994; Levin y Levin, 2001; Pagano, 2011).
16
En resumen:
Nominal: son aquellas variables cuyos valores presentan un orden aleatorio, no tienen jerarquía y sólo se utilizan para nombrar algo (ej.: Sexo – Estado Civil).
Ordinal: son aquellas variables cuyos valores se rigen por un criterio ordenador y, si bien no son precisos, existe una jerarquía entre ellos (ej.: Nivel Educativo).
Escalar: son variables que tienen intervalos regulares y, generalmente, se reconocen porque dan cuenta de puntajes, valores y demás datos que pueden medirse conforme a
valores numéricos precisos o fórmulas matemáticas (ej.: Edad – Ingresos económicos – variables psicológicas en general, tales como: ansiedad, estrés, etc.)
Escala de Intervalo: carece de cero absoluto (cuando el 0 –cero- no indica ausencia, ej. Temperatura, coeficiente intelectual, etc.).
Escala de razón: posee cero absoluto (cuando el 0 –cero- indica ausencia de algo, ej. Cantidad de Hijos, Mascotas, etc.).
17
Ejemplo de vista de variables completa
18
Carga de la vista de datos
Una vez que se ha completado la vista de variables, es necesario dirigirse a la vista de datos para poder cargar todos y cada uno de los datos de los
encuestados. Como se observa en la imagen siguiente, arriba de las celdas se encuentra cada una de las variables creadas anteriormente.
19
En las celdas en blanco se deben cargar los datos de los encuestados. La carga se realiza de forma horizontal: con la flecha ( ) del teclado o haciendo
click con el mouse. Luego, presionando ENTER se procede a cargar datos de otro sujeto.
Si las variables tienen valores o son escalares, los datos se cargan con los números del teclado. A continuación, se presenta un ejemplo de una vista de
datos completa.
20
Existe un comando que permite corroborar si los datos que se cargaron en forma numérica son correctos. Haciendo click en el botón
A continuación, se presenta un ejemplo de una vista de datos completa habiendo hecho click en la opción anteriormente mencionada.
21
Capítulo II
Ordenar casos
22
Ordenar casos
Esta opción permite ordenar el archivo de acuerdo con una o más variables en sentido ascendente o descendente (por defecto, el primero).
Este comando sirve para organizar la información de la base de acuerdo con determinados criterios fijados de antemano, útiles para el
análisis.
Por ejemplo, como parte de una investigación se ha solicitado ordenar los casos de acuerdo con Sexo de modo ascendente (primero se
visualizarán los casos femeninos y luego los masculinos) y Estado Civil de forma descendente (primero se observarán los casos de personas viudas,
luego aquellos que se encuentren separados o divorciados, continuarán los que se encuentren casados o en pareja y finalizarán los que estén solteros).
De este modo, rápidamente se pudo visualizar que en los casos de las participantes no se hallaron mujeres que se encuentren viudas, separadas
o divorciadas, además, se observaron pocos casos de mujeres casadas o en pareja y por el contrario predominaban las mujeres solteras.
En síntesis, ordenar los casos nos facilita la organización de la información en función de algún/os criterio/s especifico/s.
23
Pasos a seguir:
1- Click en Datos
24
2- Ordenar casos
25
3- Se selecciona en la ventana que se despliega, la variable a ser utilizada para determinar el orden, desde el listado de variables en el cuadro izquierdo y
se pasa con doble click o al cuadro “Ordenar por”
AVISO IMPORTANTE: LAS VARIABLES SE ORDENAN RESPETANDO EL ORDEN PRIORIZADO CON ANTELACIÓN.
26
4- El tipo de orden se determina en ascendente (de menor a mayor) o descendente (de mayor a menor) según la ubicación de los valores en la escala. Luego
se presiona ACEPTAR.
Por ejemplo, si se quiere ordenar la base de modo tal que aparezcan en primer lugar las mujeres (variable Sexo) casadas o en pareja (variable Estado
Civil), es necesario en primer lugar pasar la variable Sexo y clickear ascendente pues femenino es el valor que aparece primero en la escala de valores,
mientras que para Estado Civil se colocará descendente (pues el valor correspondiente aparece debajo en la escala de valores).
27
Ejemplo de base posterior a realizar Ordenar casos
Se puede observar que en primer lugar aparecen las mujeres casadas o en pareja y luego continúa de manera descendente presentando el resto de los
estados civiles.
28
Capítulo III
Frecuencias
29
Frecuencias
En ocasiones se recolecta una cantidad pequeña de valores, por lo tanto, con realizar un rápido registro visual se puede tener una primera
aproximación de qué significan esos valores. Otras veces, sucede que el caudal de datos es demasiado amplio y es imposible conseguir hacer una inspección
breve y comprender que quiere decir esa información. Por ejemplo, si se les pregunta a 10 sujetos cuántos hermanos tienen y seis (6) de ellos responden que
tienen dos (2) hermanos, otros tres (3) dicen tener uno (1) y los últimos dos responden que no tienen hermanos, rápidamente podemos observar que la
mayoría de los encuestados tiene dos hermanos. Ahora bien, si se hace la misma pregunta, pero, esta vez, a 1.000 (mil) individuos habrá una variabilidad
inconmensurable de respuestas, por lo que no se podrá saber cuál es la cantidad de hermanos más frecuente de manera inmediata. Para estos casos,
entonces, se debe usar una herramienta denominada: Frecuencia.
Las frecuencias son aquellas puntuaciones, obtenidas en una variable, presentadas de manera ordenada y resumida en una tabla, cuyos valores crecen
de arriba hacia abajo (Botella Ausina, et al., 2012; Hernández-Sampieri y Mendoza Torres, 2018).
Existen cuatro tipos de frecuencias (Botella Ausina et al., 2012; Levin y Levin, 2001):
1- Frecuencia Absoluta: Es la cantidad de casos que cumplen con determinada característica. Se simboliza con fi.
2- Frecuencia Relativa: Es la cantidad de casos que cumplen una determinada característica, dividido el número total de casos. Es decir, la frecuencia
absoluta de un valor dividido por el tamaño de la muestra (representado por el símbolo N). Se simboliza con hi.
hi = fi/N
3- Frecuencia Porcentual: Es el porcentaje de casos que presenta determinada característica (la frecuencia relativa multiplicada por 100). Se representa
con el símbolo p.
p = (fi/N) * 100
4- Frecuencia Acumulada: Es el porcentaje de casos con determinada característica, incluida la suma de los porcentajes anteriores. Se simboliza mediante
fa .
fa = (fi/N) * 100 + (fi/N) * 100 + etc., Hasta llegar a 100% de los casos.
30
Pasos a seguir:
1- Analizar
31
2- Estadísticos descriptivos
32
3- Frecuencias
33
4- Se abrirá una ventana donde se podrá seleccionar la variable deseada para calcular la frecuencia. Una vez seleccionada se traslada al cuadro de
“Variables” haciendo click aquí
34
5. Por último, se hace click en Aceptar.
35
Una vez realizados todos los pasos anteriores, se abrirá otra ventana donde se visualizarán los resultados dentro de un cuadro con el nombre de la
variable.
36
Cómo interpretar los datos:
-N: Es el número total de casos
-Válidos: Da cuenta de los casos con datos consignados sin tener en cuenta los casos perdidos (no contestados o mal contestados).
-Frecuencia: Esta columna da cuenta de la Frecuencia Absoluta (la cantidad de casos que reúnen una determinada característica).
-Porcentaje: Esta columna hace referencia a la Frecuencia Porcentual, teniendo en cuenta los casos perdidos.
-Porcentaje válido: Aquí también se indica la Frecuencia Porcentual pero sólo con el análisis de casos con datos consignados, sin tener en cuenta los casos
perdidos. El Porcentaje y el Porcentaje válido coinciden sólo cuando no existen casos perdidos.
-Porcentaje acumulado: Es el porcentaje de casos que presentan determinada característica incluidos todos los casos anteriores.
Sucede que no todas las variables pueden ser analizadas desde los cuatro tipos de frecuencias. La medida de la variable [revisar Capítulo I] cobra
importancia sustancial en este punto, pues las variables cualitativas -nominales- no pueden ser interpretadas desde la frecuencia absoluta, aun cuando dicho
resultado se visualice en el software. Esto sucede porque los elementos acumulados sólo pueden aplicarse en variables que impliquen magnitudes, no es
posible de emplear cuando los números son meras etiquetas, por tal motivo, las variables de tipo ordinal y escalar se estudian a través de los todos los
aspectos (Botella Ausina et al., 2012).
37
Capítulo IV
Seleccionar casos y Segmentar archivo
38
Seleccionar casos
En las investigaciones, muchas veces, se necesita obtener una mayor profundidad para describir como algunas variables se comportan
únicamente en un conjunto de casos particulares, que se definen por tener una característica en común (Bernal, 2017).
Los procesos de análisis se pueden efectuar sobre el total de datos que hay en un archivo, o sobre un subconjunto de datos, precisamente
aquí es cuando se utiliza el comando de selección de casos para filtrar la base. Por lo tanto, se emplea cuando se requiere analizar un único valor
de una variable o más.
La selección de datos puede realizarse a partir de diferentes opciones (Herrera, 2005):
1. Si se satisface la condición: dentro de la cual se deberán explicitar los valores de la o las variables a seleccionar, como puede ser Sexo=2
& Estado Civil= 4, en este caso particular estaríamos seleccionando los casos que cumplan con dos características específicas, que sean
masculinos y viudos. Esta opción es la más utilizada ya que permite analizar valores determinados.
2. Muestra aleatoria de casos: a partir de esta opción se selecciona una muestra aleatoria determinando el tamaño de la misma como un
porcentaje del total o un número exacto de casos.
3. Basándose en el rango del tiempo o de los casos: es únicamente válida para datos de series temporales, fundamentando la selección en
intervalos de tiempo. Selecciona los casos basándose en un rango de los números de caso o en un rango de las fechas/horas.
4. Usar variable de filtro: utiliza como variable para el filtrado, la variable numérica seleccionada del archivo de datos. Se seleccionan los
casos con cualquier valor distinto del 0 o del valor perdido para la variable seleccionada.
Por último, a partir de los datos que han sido seleccionados se puede:
a. Descartar casos no seleccionados: los casos no seleccionados no se incluyen en el análisis, pero se conservan en el conjunto de datos.
Podrá utilizar los casos no seleccionados más adelante en la sesión, si desactiva el filtrado.
b. Copiar casos seleccionados a un nuevo conjunto de datos: los casos seleccionados se copiarán a un nuevo conjunto de datos, lo que
mantendrá inalterado el conjunto de datos original.
c. Eliminar casos no seleccionados: los casos no seleccionados se eliminarán del conjunto de datos.
A fines operativos, los autores de este manual recomiendan emplear el criterio 1. (Si satisface la condición), el cual se explica a continuación:
39
Pasos a seguir:
1- Datos
40
2- Seleccionar casos
41
3- En la siguiente ventana se elegirá la opción Si satisface la condición
42
4- Click en Si la opción
43
5- En esta pantalla se determinarán las variables a utilizar (en caso de ser más de una se utiliza “&” entre cada variable).
Se colocan los datos como fórmulas Variable-Operación-Valor. Se selecciona la variable, se pasa al rectángulo blanco con doble click o la flecha
correspondiente y posteriormente se utiliza la calculadora para realizar la operación. Por ejemplo: Si se quieren seleccionar los hombres la fórmula es
Sexo=2.
44
Por ejemplo, si se quiere seleccionar de la base aquellos hombres (variable Sexo cuyo valor es 2) y viudos (variable Estado Civil con valor 4), ésta es la forma
en la que se debe proceder.
45
6- Click en Continuar
46
7- Click en Aceptar
47
Se desplegará la siguiente ventana denominada Resultados. Lo que se puede observar allí es que se aplicó la selección de casos. La misma puede
minimizarse o cerrarse.
48
Ejemplo de la base luego de la Selección de casos
Como se puede observar, las mujeres y aquellos que refieren un estado civil distinto a viudo/a están tachados.
49
El único sujeto que satisface las condiciones de selección se encuentra sin tachar, mientras que los hombres que refieren un estado civil distinto a
viudo están tachados.
50
Una vez que esa selección no se necesite más se debe restablecer la base.
Pasos a seguir:
Datos – Seleccionar casos – Restablecer – Aceptar (es sumamente importante que se dé click en aceptar, sino la base no se restablece).
51
De esta manera, la base vuelve a su estado original.
52
Segmentar archivo
En investigación, es frecuente realizar comparaciones de grupos, como por ejemplo con la variable Sexo. Para que esta comparación resulte
más sencilla, el SPSS nos facilita el comando de Segmentar archivo.
Segmentar archivo divide la base de datos en distintos grupos para el análisis, basándose en los valores de una o más variables de agrupación.
Es decir, este comando compara los distintos valores de una misma variable.
Por ejemplo, en una investigación se ha consultado el estado civil predominante de hombres y mujeres. A tal fin, para obtener esta información,
se decidió realizar una comparación de grupos entre los diferentes sexos. Para ello es necesario segmentar la base de datos en función de la variable
sexo y, posteriormente, realizar un análisis de Frecuencias, que tal como se lo expresó en el capítulo III, son aquellas puntuaciones obtenidas en una
variable, en este caso de estado civil, presentadas en una tabla.
La tabla obtenida a partir de tal procedimiento expresa las distintas frecuencias, pero con la división de la variable sexo, es decir, comparando
femenino y masculino.
53
Pasos a seguir:
1- Datos
54
1- Segmentar archivo (según la versión empleada del SPSS también puede aparecer como Dividir archivo)
55
2- En la siguiente ventana elegirá la opción Comparar los grupos
56
3- Pasar la variable que se quiere comparar mediante doble click o la flecha correspondiente
57
4- Aceptar
58
Se desplegará la siguiente ventana de Resultados. Lo que se puede observar allí es que se aplicó la división del archivo por sexos. La misma puede
minimizarse o cerrarse.
59
Ejemplo de división de archivo y frecuencia luego
Como se puede observar, la base quedó divida según el sexo, es decir, en hombres y mujeres.
Posteriormente se sacó la frecuencia de la variable Estado civil. De esta forma se pueden conocer los diferentes estados civiles de las personas de sexo
femenino y masculino que conforman la base.
60
Una vez que esa división no se necesite más, se debe restablecer la base.
Pasos a seguir:
Datos – Segmentar archivo – Restablecer – Aceptar (es sumamente importante que se dé click en aceptar, sino la base no se restablece).
61
De esta manera, la base vuelve a su estado original. Se abrirá la ventana de resultados con la leyenda: Split File Off.
62
Capítulo V
Recodificación de variables
63
Recodificar variables
En investigación, es moneda corriente modificar valores de determinada variable con el fin de alcanzar ciertos objetivos que se propone el/la autor/a.
En ocasiones, los valores que se le han asignado a una variable no permiten la interpretación certera de los datos y se requiere agruparlos de una manera
distinta a la original, o bien el/la investigador/a pudo haber utilizado una variable de tipo cadena y al momento de realizar el análisis de la información desea
transformarla en otro tipo de variable, por ejemplo: numérica. El SPSS brinda una herramienta que facilita este procedimiento sin tener que volver a crear una
variable y cargar los datos en función de la nueva categorización.
Por ejemplo: como parte de una investigación se ha consultado a los encuestados su edad, se les solicitó que den cuenta de su edad estipulada en
años. Luego, la persona que recolectó los datos se dispuso a transcribirlos al SPSS y se dio cuenta que la muestra era sumamente variada y que algunos de
sus participantes eran adolescentes, otros adultos jóvenes, otros adultos y algunos adultos mayores. Es por ello que para realizar un análisis pormenorizado
de la edad de los sujetos que contestaron la encuesta le resultó conveniente recodificar la variable y agrupar a los sujetos según rangos etarios. De 15 a 17
años será el grupo de adolescentes, de 18 a 25 el de adultos jóvenes, de 26 a 59 adultos y de 60 en adelante serán adultos mayores.
El programa permite dos posibilidades para esta función: recodificar en la misma variable y recodificar en distintas variables. Si se utiliza la primera
opción se modificará la variable original. En cambio, si se utiliza recodificar en distintas variables se conservará la variable de origen y se creará una con los
nuevos valores al final de la vista de variables. Esta opción suele ser la más recomendable con el objetivo de no alterar la base original.
En síntesis, recodificar variables es un comando que permite agrupar los valores de una variable de una manera diferente, estableciendo nuevas
categorías.
64
Pasos a seguir:
1- Transformar
65
2- Recodificar en distintas variables (se utiliza esta opción para no afectar la variable original).
Nota: si se utilizara la opción recodificar en las mismas variables, reemplazaría los valores de la variable original por la variable con los nuevos
códigos de valor.
66
3- Se selecciona la variable que se desea recodificar
Ejercicio de Ejemplo: Se pide reorganizar los valores de la variable campus según la sede a la que concurre el alumno, sin importar el turno al que asista.
67
4- Trasladar la variable al cuadro de la derecha, aparecerá un signo de pregunta (-> ?). Gracias al siguiente paso, éste se completará con el nombre de
la variable con nuevos códigos de valor.
68
5- El nombre debe completarse siguiendo los mismos requisitos que el nombre de la vista de variables (no puede llevar espacio ni símbolos, no puede
comenzar con un número y no puede comenzar ni terminar con punto -pero sí puede contener punto-).
También se completará la etiqueta al igual que en la vista de variables (nombre detallado de la variable). Luego click en Cambiar.
69
6- Ahora ya no aparecerá un signo de pregunta, sino el nuevo nombre de la variable. Se ingresará a “Valores antiguos y nuevos” para establecer los
nuevos códigos de valor.
70
ACLARACIÓN: Si una vez que están aquí no recuerdan los valores que posee la variable, se los puede consultar haciendo click derecho sobre la variable ya
trasladada y luego sobre información de la variable.
62
71
7- Para cambiar los valores se debe releer la consigna del ejercicio, en el caso del ejemplo: se pide reorganizar los valores de la variable campus según la
sede a la que concurre el alumno, sin importar el turno al que asista. Se aconseja realizar un diagrama en hoja borrador que permita cambiar los
códigos de valor de forma correcta antes de ingresarlos al programa.
Valores antiguos Valores nuevos

1 Centro mañana
2 Centro Tarde 1 Centro
3 Centro Noche
4 Ituzaingó 2 Ituzaingó
5 Berazategui mañana
6 Berazategui tarde 3 Berazategui
7 Berazategui noche
8 Lomas mañana 4 Lomas
9 Lomas Noche
72
Cada vez que se agregue un valor antiguo y se le asigne un valor nuevo se hace click en Añadir.
Nota: Si el valor asignado fue erróneo y ya se hizo click en añadir, se podrá editar lo deseado con el comando Cambiar o eliminarlo con el comando Eliminar
73
Una vez asignados y revisados los nuevos valores se continúa con el ejercicio haciendo click en Continuar y luego Aceptar.
74
(A continuación, se desplegará en la ventana de resultados, el resumen de lo recién recodificado, en este caso deben minimizarla o cerrarla para luego
completar el ejercicio desde la vista de variables, deslizándose hacia abajo hasta llegar al final de la lista para encontrar la nueva variable recodificada).
8- Para completar el ejercicio de ejemplo, posicionándose en la vista de variables, se tendrán que asignar etiquetas a los “valores nuevos” de la
variable CAMPUSR haciendo click en los 3 puntos suspensivos que figuran en la columna valores, correspondiente a la variable recodificada.
75
Aquí se le asignará una Etiqueta de valor a cada nuevo código de valor teniendo en cuenta la consigna del ejercicio (Y EL CUADRO REALIZADO EN
EL PASO 7-)
Una vez escrita la etiqueta se hará click en Añadir.
76
9- Para finalizar el ejercicio se presiona Aceptar.
Nota: Con este mismo proceder se realiza la inversión de ítems; esta última refiere al procedimiento que se aplica cuando se invierten los
valores de los ítems que conforman una variable escalar, tal como se explica a continuación.
77
INVERSIÓN DE ITEMS
Se utiliza para invertir los puntajes de aquellas frases cuyo sentido es opuesto a lo que se pretende medir.
Los ítems o reactivos son aquellas afirmaciones con las que se conforma una Escala, Cuestionario o Test psicológico.
Ítems o Reactivos
78
Para evitar el sesgo de aquiescencia (tendencia a dar respuestas afirmativas más allá del contenido de las preguntas o enunciados) la mayoría
de las Escalas invierten varios de sus ítems dándole un sentido contrario al constructo psicológico que desean medir (Por ejemplo: Siempre
estoy tranquilo -> Ansiedad).
Pasos a seguir:
Trasformar ->Recodificar en distintas variables -> Pasar las variables a recodificar al cuadro de la derecha.
79
Establecer un nuevo nombre y etiqueta a cada Item a recodificar que sea identificable para luego utilizarlo. -> Hacer click en Cambiar -> Hacer click
en Valores antiguos y nuevos.
80
Teniendo en cuenta que en este caso los valores antiguos conforman opciones de respuesta tipo likert, las cuales oscilan de 1 a 4 (de “Muy en
desacuerdo” a “Muy de acuerdo”), los valores nuevos serán de 4 a 1.
81
Una vez expresados los nuevos valores se hace click en Continuar.
Una vez realizado dicho procedimiento, se pulsa Aceptar.
Se desplegará la ventana de resultados, con el resumen de lo recién recodificado. La misma debe minimizarse o cerrarse. Desde la vista de variables,
deslizarse hacia abajo para encontrar las nuevas variables recodificadas.
Atención: Existen variables que no poseen valores preexistentes para recodificar (por ejemplo: Edad).
82
RECODIFICACIÓN DE VARIABLES SIN VALORES
Ejercicio de ejemplo: Se pide agrupar la variable Edad en tres rangos etarios que respondan a: 1-Sujetos menores de 30 años, 2-entre 30 y 60 años, y
3-mayores de 60 años.
Pasos a seguir:
Transformar -> Recodificar en distintas variables -> Pasar la variable de interés al cuadro de la derecha -> Establecer un nuevo Nombre (EdadR)
y Etiqueta (Edad Recodificada) -> Click en Cambiar -> Valores antiguos y nuevos.
83
7- Los valores antiguos se establecerán por rangos de acuerdo a la información que brinde la consigna.
a- En el caso del primer grupo (1- menores de 30) para el valor antiguo, se utilizará la opción de “rango, INFERIOR hasta valor” cuando se
desconoce el valor de inicio, pero sí se conoce el valor de cierre (29). Y luego se establece el valor nuevo, en este caso 1.
Se hace click en Añadir y se prosigue con el siguiente grupo.
84
b- Para establecer el valor 2 (de 30 a 60 años), se debe introducir la información en la opción “Rango”, ya que se conoce el valor inicial y el
final.
Se hace click en Añadir y se prosigue con el siguiente grupo.
85
c- La información que presta la consigna para el último grupo (más de 60 años) es sólo la información de inicio, pero no de cierre. En este caso,
se utilizará la opción de “Rango, valor hasta SUPERIOR”, puesto que se desconoce el valor de cierre. Se le asigna el valor nuevo, en este
caso 3. Luego se hace click en Añadir
Una vez establecidos los nuevos valores se hace click en Continuar.
86
Se desplegará la ventana de resultados, el resumen de lo recién recodificado, en este caso debe ser minimizada o cerrada para luego completar el
ejercicio desde la vista de variables, deslizándose hacia abajo para encontrar la nueva variable recodificada.
87
8- Para completar el ejercicio de ejemplo, posicionándose en la vista de variables, se tendrán que asignar los valores nuevos de la variable EdadR.
Haciendo click en los 3 puntos suspensivos que figuran en la columna valores, correspondiente a la variable recodificada, se abrirá Etiquetas
de valor donde se colocará la descripción de los valores recodificados.
88
9- Ya establecidas las Etiquetas de valor se hace click en Aceptar.
89
Ejemplo de recodificación de variables sin valores, con los nuevos valores establecidos
90
Capítulo VI
Calcular variable
91
Calcular variable
La mayoría de los constructos que se pretenden evaluar en instrumentos se componen de distintas dimensiones o variables formadas por
determinados ítems o reactivos. Estas dimensiones nos permiten evaluar distintos aspectos de un constructo o bien, la sumatoria de todas ellas, nos
permite evaluar el constructo en general.
El SPSS brinda una herramienta que facilita el proceso de agrupación de los distintos ítems o reactivos que conforman a las dimensiones. Es
decir, nos permite crear nuevas variables a partir de las que ya existen en el archivo.
Esta función, Calcular variable, nos permite designarle un nombre a la nueva variable, establecer el tipo (Numérico o Cadena), y la etiqueta.
Luego de designarle lo antes mencionado a la nueva variable, es necesario sumar los ítems que la van a conformar.
Por ejemplo, en el caso que a continuación se detalla en imágenes, para formar la variable Interés en Otros, es necesario sumar los ítems o
reactivos M15+M40+M65+M91+M115+M140. El nombre de dicha variable es Esc6 y por ende su etiqueta va a ser Interés en Otros.
En síntesis, calcular variable es una función que nos permite agrupar distintos ítems para crear una nueva variable o dimensión de un
instrumento.
92
Pasos a seguir:
1- Click en Transformar
2- Calcular variable
93
3- En la ventana de Calcular variable, lo primero a completar es Variable de destino, con el nombre abreviado de la variable que se pretende crear
En este caso, se tomará como ejemplo la variable Interés en Otros. Por lo que, en primer lugar, se coloca el nombre abreviado de la variable
que es: Esc6.
94
4- Click en Tipo y etiqueta
95
Allí se coloca la etiqueta de la variable, es decir, el nombre detallado de la misma. Luego hacer click en Continuar
96
5- En Expresión numérica se pasan las variables que están ubicadas en la lista de la izquierda, haciendo doble click sobre éstas o utilizando la
flecha. Entre las variables se debe colocar el signo +.
Si se han recodificado variables (ítems), éstas aparecerán al final de toda la lista de variables.
97
6- Click en Pegar
98
7- Se desplegará una ventana denominada: Sintaxis en la que se encontrarán las variables elegidas. Este espacio sirve para corroborar que los ítems
pasados para conformar la variable sean los correctos y, en caso contrario, realizar las correcciones pertinentes antes de enviarlos a la base.
Si la ventana no se despliega es necesario revisar en la barra de herramientas de la PC.
99
8- Seleccionar los datos de la variable que aparecen en la sintaxis una vez corroborados
100
9- Click en Ejecutar selección
101
Se desplegará la ventana de Resultados, la cual es preciso minimizar o cerrar.
102
Ejemplo de Calcular variable en la base
Al final de la vista de variables se encontrará la variable recientemente creada.
103
Capítulo VII
Medidas de tendencias central y
dispersión
104
Medidas de tendencia central
Constantemente el ser humano se encuentra exponiéndose a preguntas tales como: ¿cuál es el promedio de accidentes automovilísticos en Buenos
Aires?, ¿qué promedio obtuviste en la secundaria?, ¿cuál es el promedio de cigarrillos que este adulto fuma por semana?, entre otras tantas. Entonces,
un promedio representa el resumen de una cantidad de datos considerables que den una visión más acabada del fenómeno. Por ejemplo, si se le pregunta
a siete individuos su edad y éstos responden: 25 – 30 – 33 – 18 – 22 – 43 – 22, podemos decir que el promedio de edad de estos cinco sujetos es de 27,57
años. En investigación ese valor se conoce como medida de tendencia central. La media (promedio), la mediana y la moda son medidas de tendencia
central (Clark-Carter, 2002; Levin y Levin, 2001).
La media, por su parte, es la suma de un conjunto de puntajes dividido por la cantidad de respuestas que se tengan del puntaje antes mencionado
(tal como sucede en el ejemplo de la edad antes esbozado). Ésta se representa mediante una X y sobre ella un guión (-). La fórmula que la representa es
la siguiente:
(Levin y Levin, 2001).

La mediana es aquel valor que se encuentra en el medio de todos los valores. Entonces, la mediana será una puntuación que separará el 50% por
encima de la misma y el otro 50% de los valores por debajo de ella (Botella Ausina et al., 2012; Pagano, 2011). Retomando el ejemplo de la edad la
mediana estaría representada por el sujeto de 25 años. Es decir que, para obtenerla, el conjunto de datos deberá ordenarse de menor a mayor.
La moda, por su parte, es el puntaje más representativo de los participantes. Será, entonces, aquel puntaje que más se repita en el conjunto de
valores (Clark-Carter, 2002). En el ejemplo de la edad mencionado al principio del capítulo el valor más frecuente entre las edades es 22 años.
Los psicólogos utilizan constantemente la media para hacer alusión a ciertos resultados hallados, y esto sucede, porque -probablemente- es un
número que permite dar cuenta rápidamente de cómo fueron los valores obtenidos en una variable. Aun así, es importante destacar que la media es
sumamente susceptible a los valores extremos. Se puede afectar de manera simple introduciendo al conjunto de datos un valor considerablemente alto
o bajo, de esta forma, la media se torna poco precisa. Hay maneras de subsanar este efecto, pero exceden los objetivos de este manual (Clark-Carter,
2002).
105
Pasos a seguir:
1- Analizar -> Estadísticos descriptivos -> Frecuencias -> Pasar la variable al cuadro de variables.
106
2- Estadísticos
En este caso se tomará como ejemplo la variable Interés en sí mismo
107
3- Tildar haciendo click en Media, Mediana y Moda. 97
98
108
5- Aceptar
En esta ocasión no se debe minimizar la ventana de resultados.
99
109
En la ventana de resultados aparece un cuadro con los valores de la media, mediana y moda señaladas de la variable Interés en sí mismo.
Aclaración: no es necesario marcar las tres medidas de tendencia central, las mismas se seleccionan en función de lo necesitado.
110
Medidas de dispersión
Las medidas de dispersión, a diferencia de las de tendencia central, “cuantifican la magnitud de la dispersión” (Pagano, 2011, p. 76). Levin y Levin
(2001) utilizan un ejemplo que es sumamente útil a estos fines: los autores esbozan que en Honolulu (Hawaii) y en Sonora (México) la media de
temperatura durante el día es de 38°C, es decir, es idéntica. Viéndolo de este modo, podríamos inferir que las temperaturas de ambos sitios son
prácticamente iguales y que se podrían realizar actividades acuáticas en cualquier época del año. Pero no es así puesto que la temperatura en Honolulu
solo tiene leves variaciones, la misma oscila entre los 33°C y 42°C, esto significa que realizar actividades acuáticas en este lugar es posible durante todo
el año; en cambio, en Sonora tienen una temperatura mínima de 21°C en invierno y máximas de 45°C en verano, lo que indica que durante los meses
más fríos las actividades acuáticas disminuyen notablemente, eso no sucede en Hawaii teniendo en cuenta que el clima es constante durante todo el año.
Este ejemplo sirve para ilustrar que, a pesar de tener medias iguales, uno de los lugares presenta mayor dispersión respecto a su temperatura que el
otro. Lo mismo puede suceder cuando se lleva adelante una investigación. Para esto, es preciso identificar las medidas de dispersión, estas son cinco:
máximo, mínimo, rango, varianza y desvío típico o estándar.
Máximo: reporta el valor mayor de un conjunto de datos (Clark-Carter, 2002);
Mínimo: es el valor más bajo de un grupo de valores (Clark-Carter, 2002);
Rango: es la diferencia entre el/los valor/es menor/es y los mayor/es. Esto permite que distintas muestras obtengan rangos similares aunque
los máximos y los mínimos varíen (Clark-Carter, 2002; Pagano, 2011);
Varianza: toma la diferencia entre el valor que obtuvo cada sujeto y la media de todo el conjunto (Levin y Levin, 2001). La fórmula de la varianza
es la siguiente:
S2 = ε (Xi – X)2
n-1
Desviación típica o estándar: se vincula directamente con la varianza -mencionada anteriormente- y es, justamente, la raíz cuadrada de ésta. Es,
por lo tanto, una medida que se relaciona con la media. Además, es la medida que se utiliza más frecuentemente en investigación (Levin y Levin, 2001).
111
En resumen, con un ejemplo:
1- Máximo: es el puntaje más elevado de un grupo;
2- Mínimo: es el menor puntaje de un grupo;
3- Rango: es la diferencia entre el máximo y el mínimo;
4- Varianza: es la distancia de un conjunto de valores con respecto a la media.
5- Desvío típico: Sirve para ver la diferencia de un valor con respecto al promedio. Es la raíz cuadrada de la varianza.
Ejemplo: notas de cursada
• Máximo: 10
• Mínimo: 2
• Rango: 10 – 2 = 8
• Varianza: 4.5
Varianza: Notas de parciales de un alumno: 2 – 4 - 5 – 7 – 7
Muestra de Varianza sin elevar al cuadrado los resultados de la resta realizada por el valor y la media
Varianza: Valor – Media = (2-5) + (4-5) + (5-5) + (7-5) + (7-5) = (-3) + (-1) + (0) + (2) + (2) = 0
Cantidad de Valores - 1 (5 -1) (5 – 1)
Varianza final (Con la correspondiente elevación al cuadrado)
Varianza: Valor – Media 2 = (2-5)2+ (4-5) 2+ (5-5) 2+ (7-5) 2+ (7-5) 2 = (-3) 2+ (-1) 2+ (0) 2+ (2) 2+ (2) 2 = 9+1+0+4+4 = 18 = 4.5
Cantidad de Valores - 1 4 4 4 4
• Desvió Típico: 2.12
√4.5 = 2.12
112
Pasos a seguir:
1- Analizar
113
102
114
3- Frecuencias
115
4- Ingresar la variable
116
5- Click en Estadísticos
117
6- Marcar (haciendo click) las medidas de dispersión
118
7- Continuar
119
8- Aceptar
120
A continuación, se desplegará la pantalla de Resultados. Los datos de las medidas de dispersión se reflejarán en el siguiente cuadro
Aclaración: no es necesario marcar las cinco medidas de dispersión recién vistas; las mismas se seleccionan en función de lo necesitado.
121
Atención: De acuerdo a la medida de la variable, varían las medidas de tendencia central y/o dispersión que
pueden ser calculadas.
CUADRO RESUMEN
Nivel de medición Tendencia central Dispersión Ejemplo de variable
MEDIA MÁXIMO
MEDIANA MÍNIMO
ESCALAR EDAD
MODA RANGO
- VARIANZA / DESVÍO TÍPICO
MEDIANA MÁXIMO
ORDINAL NIVEL DE ESTUDIOS
MODA MÍNIMO
NOMINAL MODA _______________________ ESTADO CIVIL
122
Capítulo XIII
Valores extremos
123
Valores extremos
Para realizar un primer análisis descriptivo de una base de datos, es necesario conocer los valores extremos en la o las variables que sean
necesarias. El SPSS facilita el comando de explorar, el cual arroja los valores extremos de la variable que utilicemos y así detectar de un modo sencillo
los casos atípicos.
El análisis exploratorio de datos está diseñado para la detección de casos atípicos fácilmente, antes de llevar a cabo cualquier análisis de
estadística inferencial. El programa va a expresar los resultados en un diagrama de caja, el cual es un tipo de gráfico, dividido en cuartiles que permite
interpretar los datos de las variables analizada, es decir, representa la distribución de una variable, que proporciona información sobre el grado de
dispersión de los datos y el grado de asimetría de la distribución.
En el diagrama el caso más atípico se encuentra representado con una estrella, y el resto de los casos atípicos con círculos, en la totalidad de los
casos el número que se observa es el número del renglón en el cual se encuentra ubicado el caso atípico. Por ejemplo, en el caso de la variable Edad, el
caso más atípico se encuentra en el renglón 25, representando a un sujeto de 80 años.
Asimismo, cabe aclarar, que no siempre aparece una estrella que indique el caso más elevado o más bajo. Si no hay una distancia sustancial
entre un valor y otro, todos los casos atípicos aparecen representados con círculos.
124
Pasos a seguir:
1- Analizar
113
125
126
3- Explorar
115
127
4- Pasar la variable que se pretende analizar a lista de dependientes
116
128
5- Aceptar
117
129
A continuación, se desplegará la hoja de Resultados. Allí es preciso descender hasta encontrar el siguiente gráfico de caja. El mismo se divide en cuatro
sectores, cada uno de los cuales se delimita a partir de unos puntajes de referencia denominados cuartiles (Q). Los cuartiles son tres valores que dividen
al conjunto de datos en 4 partes iguales. El Q1 representa al 25% de los casos, el Q2 al 50% y por ende coincide con la mediana ya que constituye el valor
central y el Q3 representa al 75% de los casos. Por ejemplo, a simple vista puede observarse que el 75% de los sujetos de esta base (Q3) tiene
aproximadamente 22 años o menos (ver valores de referencia a la izquierda), mientras que la mitad de los sujetos tiene 17 años o menos.
Sector 4
Q3 (cuartil 3)
Sector 3
Q2 (cuartil 2)
Sector 2
Q1 (cuartil 1)
Sector 1
Sector 1
Sector 1
Sector 1
130
Sector 1
Continuando con el ejemplo de la variable Edad, al desplegarse la hoja de resultados se observará la siguiente caja
Caso más atípico de todos
Números de renglones
donde se ubican los casos
atípicos
En este ejemplo, todos los valores extremos se encuentran por encima del Q3. Cabe referir que siempre los casos atípicos se localizan o bien por encima
del Q3 o bien por debajo del Q1.
En este caso, 9 son los casos atípicos. Posteriormente, es necesario dirigirse a la vista de datos, a la variable estudiada (en este caso Edad) para ver
qué valor corresponde a dicho renglón.
119
131
Al dirigirse a la vista de datos, se puede observar de la siguiente manera
Como se puede observar, el sujeto del renglón 25 tiene 80 años, siendo así el individuo más longevo de la base. Con este mismo
procedimiento se identifican los demás casos atípicos.
132
Capítulo IX
Puntajes transformados:
Percentil
133
Percentil
Los percentiles -también llamados centiles- son 99 valores que dividen en 100 a la distribución de puntajes obtenidos en una variable
(Botella Ausina et al., 2012). En palabras de Pérez (2009) “el percentil -también llamado centil por muchos autores- expresa qué porcentaje de
mediciones de la muestra tiene por debajo o el mismo valor cada puntaje bruto”. Es, entonces, un número que indica el porcentaje que se
encontrará por debajo de un puntaje dado (Levin y Levin, 2001). Tomemos como ejemplo un examen de Estadística Aplicada a la Psicología, en
el cual la alumna López obtuvo un puntaje de 7 en su examen, a priori se podría decir que el rendimiento fue bueno, lo que no se puede saber es
si el resto de sus compañeros obtuvieron notas más altas. Si sometemos las notas de los exámenes a un análisis percentilar y encontramos que 7
se encuentra en el percentil 90, entonces quiere decir que la nota de la alumna López ha sido considerablemente alta respecto de la de sus
compañeros, ya que dicho percentil se interpreta de la siguiente manera: el 90% de los estudiantes obtuvo un puntaje de 7 o menos en el examen
de Estadística.
La ventaja más notable de los percentiles es que arroja valores sumamente fáciles de interpretar. En esta línea, resulta sencillo realizar una
tabla con puntajes brutos y asignarles un percentil; esto se conoce como baremo y es un recurso altamente utilizado en psicología (Pérez, 2009).
Según Pérez (2009) el percentil tiene ciertas características destacables a tener en cuenta, tales como: los percentiles que se encuentran en los
extremos tienen la condición de ser más imprecisos que los percentiles centrales; los extremos antes mencionados no representan, bajo ningún punto de
vista, los valores máximos ni mínimos de una variable; y, por último, a pesar de que puede leerse como un porcentaje el percentil no es un porcentaje, es
una medida de posición, esto indica que jamás podrá ser mayor a 99.
En ocasiones la teoría dispone que considera un percentil alto, medio o bajo, si este no fuera el caso, los intervalos más usuales de interpretación
son los siguientes:
Percentil entre Valor
1-10 Muy bajo
11-25 Bajo
26-75 Término medio
76-90 Alto
91-99 Muy alto
(Pérez, 2009)
134
Ejemplo de baremo de un instrumento para medir la creatividad (Corbalán Berná et al., 2006):
Puntajes brutos que

puede obtener un
individuo al completar el
Percentil que puede
test CREA, que mide la
alcanzar a través del
creatividad.
puntaje bruto.
Los autores establecen que los rangos son:

1-25: Creatividad Baja;
26-74: Creatividad Media;
75-99: Creatividad Alta.
Por ejemplo: un adulto cuyo puntaje bruto fue de 20, se encuentra
dentro del 5% de sujetos que obtuvieron un puntaje más alto en
Creatividad. En otras palabras, el 95% de los individuos con los que
se confeccionó el baremo puntuaron 20 o menos en esta variable.
135
Para averiguar el percentil
Pasos a seguir:
1- Analizar
136
2- Estadisticos descriptivos
137
3- Frecuencias
138
4- Al cuadro de Variables de la derecha se traslada la variable de la que se pretende averiguar el percentil al que corresponde determinado
valor (Por ejemplo: a qué percentil pertenece el puntaje 19 en Búsqueda del Placer).
139
5- Click en Estadisticos
140
6- Se tilda Puntos de corte para 10 grupos iguales, y luego click en Continuar.
Nota: El número 10 en este caso se toma como medida estándar, ese número determinará en cuantos grupos iguales se dividirá al
conjunto general de datos. Durante la cursada se utilizará siempre por default esta medida.
141
7- Click en Aceptar
Se desplegará la ventana de resultados, en este caso NO debe minimizarse, ya que ahí se encuentra el resultado buscado.
142
8- De acuerdo con el ejemplo, aquí se buscará a qué percentil pertenece el valor 19 de la variable Búsqueda del Placer.
El resultado da cuenta de cómo el valor o puntaje 19 de la variable Búsqueda del placer se encuentra en el percentil 40.
(Teniendo en cuenta que el percentil se lee como un porcentaje y el valor obtenido como una frecuencia acumulada, puede sostenerse que el
40% de los sujetos de la base puntúan 19 o menos en Búsqueda del placer).
143
Si se desea averiguar el puntaje que corresponde a un percentil (por ejemplo qué puntaje le corresponde al percentil 50 en la variable Búsqueda del
Placer). Los pasos a seguir son:
Analizar -> Estadisticos descriptivos -> Frecuencias -> Se pasa la variable de interés (En este caso Búsqueda del Placer) -> Click en Estadísticos
-> Se tilda Percentiles y se ingresa el dato del percentil que nos presentó el ejemplo (50), para averiguar su valor. -> Click en Añadir
144
6- Click en Continuar.
145
7- Click en Aceptar
Se desplegará la ventana de resultados, en este caso NO debe minimizarse, ya que ahí se encuentra el resultado buscado.
146
Para averiguar el puntaje
La respuesta da cuenta que el puntaje perteneciente al percentil 50 es 20. El percentil 50 equivale al Q2 y a la mediana, por lo cual se interpreta que
el 50% de los sujetos de la base (la mitad) puntúa 20 o menos en Búsqueda del Placer.
147
Capítulo X
Puntajes transformados:
Cuartil
148
Cuartil
Los cuartiles son tres valores de referencia que dividen al conjunto en cuatro partes iguales, cada una representando al 25% del total (Q1, Q2,
Q3). Éstos son un subtipo especial de percentiles y equivalen al percentil 25, 50 y 75 respectivamente (Botella Ausina et al., 2012; Levin y Levin,
2001):
Percentil Cuartil
25 Q1
50 Q2
75 Q3
Si la distribución de los cuartiles es simétrica, éstos deben estar a la misma distancia de la mediana, ya que el valor indicado en el cuartil 2 (Q2)
es el mismo que la mediana. Es decir, que, si por ejemplo el Q2 es el número 20, se entiende que el puntaje 20 es la mediana de la variable analizada.
149
Se calculan de la siguiente manera:
Pasos a seguir:
Analizar-> Estadísticos descriptivos -> Frecuencias -> Se pasa la variable de interés -> Click en Estadísticos -> Tildar Cuartiles
• Click en Continuar
150
• Click en Aceptar
Se desplegará la ventana de Resultados, en este caso NO debe minimizarse, ya que ahí se encuentra el resultado buscado.
151
Interpretación de resultados:
El valor que pertenece al cuartil 1 es 17, al cuartil 2 es 20 y al cuartil 3 es 21.
152
Capítulo XI
Puntajes transformados
Puntaje Z
153
Puntaje Z
El puntaje Z es un puntaje transformado, que es posible calcularlo a partir de un puntaje bruto y que puede ser un número positivo o negativo
dependiendo de la desviación del puntaje bruto, es decir, puede estar por encima o por debajo de la media (Pérez, 2009). El valor del Z permitirá,
entonces, deducir que tan común o poco común es el puntaje que obtiene un individuo en determinada variable.
Este tipo de puntaje -como muchos otros que se han desarrollado en este libro- no sólo se utiliza en investigación, sino que también es
sumamente utilizado en el área clínica, teniendo en cuenta que arroja un valor de lectura sencilla que permite dar cuenta rápidamente que tan
frecuente es la puntuación que obtuvo un paciente/cliente en una prueba psicológica. Las pruebas en psicología permiten obtener resultados que no
siempre arrojan una puntuación valorada de la misma forma. Instrumentos como el WISC o el WAIS -por ejemplo- brindan puntajes CI y el test CREA -
mencionado en el capítulo IX- ofrece puntaje percentilar. Entonces, si se le toman a un individuo ambas pruebas, será importante tener una medida
más acabada que permita interpretar fácilmente si su inteligencia y creatividad son altas, medias o bajas, pero a través de un mismo puntaje, este es el
puntaje z.
El z se calcula sencillamente con los siguientes tres datos: el puntaje bruto, la media y el desvío típico o estándar:
Volviendo al ejemplo del test de creatividad podemos pensar en un sujeto que en la imagen A obtuvo un puntaje bruto de 14 puntos, si a este
valor le restamos la media (11,53) y lo dividimos por el desvío típico (5,335) obtenemos un puntaje z de: 0,46, ¿y eso como se interpreta? Bien, lo
primero que hay que tener en cuenta es que todos los valores positivos indican que el sujeto se encuentra por encima de la media, por lo tanto, todos
los puntajes negativos revelan que el individuo puntuó por debajo de la media. Si el z expresa un valor entre 1 y -1 significa que el puntaje bruto del
sujeto está dentro de los rangos esperables o típicos. Si el z es mayor a esos puntajes (pudiendo alcanzar valores de 5 o -5) ello enseña cómo el sujeto
en determinada variable se aleja de los parámetros de normalidad. Siguiendo con el ejemplo, el sujeto que puntuó 14 se encuentra casi medio desvío
por encima de la media, lo que indica que su creatividad alcanza los parámetros típicos.
De ello se desprende también que la media y el z=0 coinciden puesto que alguien que obtenga dicho puntaje tendrá, precisamente, el valor
equivalente al promedio general de la población.
154
En resumen:
En Puntaje Z la media es interpretada como 0 (cero), dado que si z=0 ello implica que determinado valor coincide con el puntaje de la
media.
Media
-6 -5 -4 -3 -2 -1 0 1 2 3 4 5 6
Desvío típico
Los puntajes Z positivos indican que un valor está por encima de la media, mientras que los puntajes Z negativos dan cuenta de valores que
se encuentran por debajo del promedio.
Pasos a seguir:
1- Analizar
155
120
156
140
3- Descriptivos
157
4- Pasar la variable
158
5- Tildar Guardar valores tipificados como variables
159
6- Aceptar
160
A continuación, es necesario dirigirse al final de la vista de datos (última columna a la derecha) para poder hallar el Puntaje Z
El número que aparece antes de la coma representa la cantidad de desvíos que se aleja un valor respecto de la media (cuando no aparece
ningún número, significa que el mismo es 0 y por ende menor a un desvío).
De esta manera se puede observar que, por ejemplo, el primer sujeto de la base (con respecto a la escala Interés en otros) se aleja más de un
desvío y medio por encima de la media.
161
Capítulo XII
Estadística inferencial
162
Una inferencia es una conclusión a raíz de las pruebas que se realizan con los datos obtenidos de una muestra de participantes. Las pruebas
estadísticas se utilizan con el fin de establecer la probabilidad de que una conclusión obtenida sea aplicable a la población de la cual se obtuvo la
muestra (Flores-Ruiz et al., 2017).
La estadística inferencial nos permite realizar análisis de la relación entre variables o de diferencias de grupos. Para la elección de la prueba
estadística pertinente es necesario tener en cuenta tres cuestiones clave: el diseño de la investigación (exploratorio, descriptivo, correlacional o
explicativo), el nivel de medición de las variables (nominal, ordinal o escalar) y la distribución de las variables escalares. En caso de realizarse una
diferencia de grupos, también es necesario atender a la cantidad de grupos a comparar.
A su vez, las pruebas estadísticas se dividen en dos: las pruebas paramétricas y las pruebas no paramétricas. Las paramétricas solo se utilizan
en caso de que los datos tengan una distribución normal, es decir, aquellos que se grafican por medio de la Campana de Gauss (Flores-Ruiz et al.,
2017). Por otro lado, las pruebas no paramétricas o también llamadas de distribución libre, son aplicables a datos jerarquizados y la distribución no es
normal (Berlanga & Rubio Hurtado, 2012).
Respecto a las relaciones entre variables, existen diversos estadísticos: R de Pearson, Rho de Spearman, Tau b de Kendall y Chi2. En cambio,
para los estadísticos de diferencia de grupo se pueden utilizar: T de Student, U de Mann Whitney, F de Anova y H de Kruskal Wallis.
Realizar deducciones e interpretaciones del resultado, a partir de los datos

En síntesis, permite Efectuar cruces de variables
Establecer diferencias de grupos
163
Cruces de variables
Tipo de cruce Alcance de los estudios Detalle Estadísticos que:
Son estudios causales en los cuales existe

una variable independiente y otra
dependiente sobre la cual se ve el efecto de
Explicativo
la primera. Ejemplo: Impacto emocional
(variable independiente) y Recuerdo
(variable dependiente)
Relacionan variables
Relación entre variables (R de Pearson, Tau b de Kendall, Rho
Analiza la relación entre dos o más de Spearman, Chi2)
variables en uno o más grupos. Ambas
variables se relacionan recíprocamente, por
Correlacional lo que no se puede establecer causa-efecto.
Ejemplo: Estrés y Rendimiento académico
(dos variables) en estudiantes de
Psicología.
Aquellas investigaciones que estudian las Comparan variables en distintos

características de una variable en uno o grupos
Diferencia de grupo Descriptivo
más grupos. Ejemplo: Nivel de Ansiedad (T de Student, F de Anova, U de Mann
(variable) en hombres y mujeres Whitney, H de Kruskal Wallis)
Relacionan variables
Son las primeras investigaciones sobre un (R de Pearson, Tau b de Kendall, Rho
tema, son trabajos incipientes que dan de Spearman, Chi2) y/o
Relación entre variables y/o respuestas a nuevas problemáticas o a otras Comparan variables en distintos
Exploratorio
Diferencia de grupo ya tratadas, pero con respuestas grupos
insatisfactorias. Ejemplo: estudios sobre la (T de Student, F de Anova, U de Mann
histeria de Breuer y Freud. Whitney, H de Kruskal Wallis)
164
Capítulo XIII
Prueba de normalidad
165
Prueba de normalidad
La distribución de datos es sumamente importante porque es el primer paso a realizar para saber qué pruebas estadísticas se aplicarán
posteriormente. No es igual trabajar con una variable que se distribuye dentro de los parámetros normales que con una variable que no corre la misma
suerte (Clark-Carter, 2002). El supuesto básico de ciertas herramientas estadísticas es que los puntajes se distribuyen de manera normal (Isaza
Echeverri et al., 2015). Los análisis de normalidad pueden diferenciarse en tres estrategias diferentes: aquellas basadas en representaciones gráficas,
en métodos analíticos y en test de hipótesis (Porras Cerrón, 2016). A los fines de este manual sólo se destacarán los análisis de test de hipótesis, pues se
tornaría dificultoso abarcar todas y cada una de las teorías.
Dos son los test que se tendrán en cuenta: Shapiro-Wilk y Kolmorogov-Smirnov, lo que los diferencia es -simplemente- el tamaño de la muestra.
Si la población no alcanza los 50 participantes entonces se utilizará Shapiro-Wilk, en cambio si la muestra está compuesta por 50 o más individuos será
preciso utilizar Kolmorogov-Smirnov.
Pero… ¿qué significa que una variable se distribuya de manera normal o no normal? La distribución normal indica que los valores de la variable
se agrupan alrededor de la media por lo que habrá una mayor cantidad de puntajes conglomerados en la parte central de un eje de abscisas e irá
decreciendo hacia los extremos (Pérez, 2009). Por el contrario, si la distribución de la variable es no normal los puntajes se encontrarán dispersos por
todo el eje, en pocas palabras, indica que los puntajes no se encuentran en torno a la media, sino que los sujetos han obtenido puntuaciones más
heterogéneas.
Pérez (2009) señala que la curva de distribución normal es asintótica, esto significa que nunca toca el eje, por lo tanto, nunca llega a cero. Por
otra parte, esboza que hay puntos destacados en el eje de abscisas, estos corresponderán con la media (el pico más alto) y a medida que decrece se
podrán figurar los desvíos típicos, tanto por encima como por debajo de la media. La media y la mediana arrojan el mismo valor que, a propósito, coincide
-también- con la parte central de la curva.
166
Variable de distribución normal
-La mayoría de los valores se agrupan alrededor de la media (valores
homogéneos);
-Hay pocos valores en los extremos y muchos agrupados en el centro.
Variable de distribución no normal
-Los valores están dispersos (valores heterogéneos)
167
Pasos a seguir:
1- Analizar
168
2- Estadisticos descriptivos
169
3- Explorar
170
4- Pasar la/las variable/s a Lista de dependientes
171
5- Click en Gráficos.
172
6- Tildar Gráficos de normalidad con pruebas
8- Click en Continuar.
173
9- Click en Aceptar
174
7- Interpretación de los resultados
Observar la tabla Pruebas de normalidad (anterior a todos los gráficos). Es preciso posicionarse en la prueba de Shapiro-Wilk, donde se
leerá el número arrojado por la significación (sig.) de la variable -en este caso Evitación del displacer-, número que dará cuenta del tipo de
distribucion que posee.
En este caso es una variable de distribucion no normal ya que su significacion dio 0,00 (< a 0,05).
Si la significación es mayor o igual a 0,05 la variable presenta una distribución normal.

Si la significación es menor a 0,05 la variable es de distribución no normal.
175
También se puede pasar más de una variable a la vez para calcular la prueba de normalidad de manera conjunta
ATENCIÓN: La prueba de normalidad sólo se calcula en variables Escalares

AVISO IMPORTANTE: SI SE SELECIONARON CASOS, LA PRUEBA DE NORMALIDAD SUFRE MODIFICACIONES. POR LO
TANTO, PRIMERO SE PROCEDE A SELECCIONAR CASOS Y LUEGO A EJECUTAR LA PRUEBA DE NORMALIDAD.
176
8- Click en Gráficos -> Se tilda en “Gráficos con prueba de normalidad” -> Click en Continuar-> Click en Aceptar
Se desplegará la ventana de resultados donde se hallará el cuadro de pruebas de normalidad.
177
Aquí se puede interpretar la significación de las cuatro variables calculadas.
- Evitación del displacer -> 0,000
- Búsqueda del placer -> 0,000 Las 4 variables siguen un patrón de distribución no normal en esta muestra, ya que
- Adaptación activa -> 0,004 los números que arroja la significación son menores a 0,05
- Adaptación pasiva -> 0,005
La prueba de normalidad es necesaria para saber qué estadístico utilizar
178
Capítulo XIV
Estadísticos de relación de variables
179
Estadísticos de relación entre variables
Analizan la relación entre dos o más variables en uno o más grupos. Dependiendo del nivel de medición de las variables y la distribución de las
escalares, se usará el estadístico pertinente. La relación de variables se denomina correlación, lo cual sirve para averiguar si existe un vínculo y
además para determinar la magnitud y la dirección.
El coeficiente correlación es lo que nos va a aportar los datos necesarios para establecer la dirección y la magnitud de la relación. Dicho
coeficiente puede variar de 1 a -1, y dicho signo nos va a indicar si la relación es positiva (directa) o negativa (inversa). En el caso de las relaciones
positivas se entiende que al aumentar las puntuaciones de una variable también aumentan los de la otra, por ejemplo, a mayor Conducta Social
Sumisa, mayor Conducta Social Insegura. También puede ocurrir que ambas variables covaríen de modo decreciente. Por el contrario, en las relaciones
negativas cuando aumentan los valores de una variable, los de la otra disminuyen en forma concomitante y viceversa, por ejemplo, a mayores niveles
de Conducta Social Segura, menores niveles de Conducta Social Sumisa (Pagano, 2011).
Por otro lado, existen distintas magnitudes de fuerza en el vínculo de las variables, por ende, un coeficiente de correlación de 1 significa que la
relación es perfecta y positiva, y un coeficiente de correlación de -1 significa que la relación es perfecta pero negativa. También existen relaciones
imperfectas que tienen coeficientes de correlación entre 0 y 1. Por último, puede que la relación sea inexistente y por lo tanto el coeficiente de
correlación va a ser igual a 0 (Pagano, 2011).
Finalmente, es importante aclarar que la existencia de relación entre dos variables no asegura una causalidad, en este punto es importante
distinguir covariación de causalidad. Una covariación implica una relación recíproca entre variables, mientras que con causalidad se alude a una
relación lineal entre ellas.
A fines pedagógicos sólo se vinculan en los diagramas dos variables, pero, tal como se mencionó, pueden ser más.
180
Escalar
R de Pearson De distribución normal
Escalar
Ordinal Nominal
Tau b de Kendall Chi
cuadrado
Ordinal Nominal
Escalar De distribución normal

Escalar
Rho de Spearman De distribución no normal Rho de Spearman
Escalar Escalar De distribución

no normal
Escalar
Rho de Spearman
Ordinal
181
Para que este proceso sea más claro, se partirá del siguiente ejemplo: Eustaquio piensa que las variables Conducta Social Sumisa y Conducta Social Insegura,
están relacionadas. ¿Esto es así?
Pasos a seguir:
1- Analizar
182
2- Correlacionar
183
3- Bivariadas
184
4- Ingresar las variables. Siguiendo el ejemplo, las mismas serán: Conducta Social Sumisa y Conducta Social Insegura
185
5- Tildar el estadístico correspondiente (de acuerdo a la distribución de las variables)
En este caso se tildó Spearman, ya que las variables se distribuyeron de manera no normal.
Por default el programa tiene tildado Pearson, si el estadístico a utilizar es otro, entonces es necesario destildar el primer estadístico
mencionado.
186
6- Aceptar
187
A continuación, se desplegará la ventana de Resultados con la siguiente tabla. Tanto para Rho de Spearman, Tau b de Kendall así como para R de Pearson, las
tablas de correlaciones son iguales.
Significación: es el margen de error permitido para que una relación sea estadísticamente comprobable.
Toda significación cuyo valor sea 0,05 o menor (margen de error del 5% menos) da cuenta de un vínculo significativo entre las
variables, es decir, existe una relación estadísticamente comprobable. En caso de ser superior a 0,05 no hay relación entre ellas.
188
Coeficiente de correlación: permite conocer cómo es la relación entre dos o más variables y la fuerza del vínculo. Sólo se aclara si existe relación.
Directa
(ambas variables aumentan o Cuando no hay Débil o baja (va de 0 a 0,399)
disminuyen paralelamente) signo, la correlación
Tipo de relación es Directa. En Fuerza del vínculo Moderada (va de 0,4 a 0,699)
Inversa cambio, es Inversa
(mientras aumentan los valores cuando existe signo
de una variable, disminuyen los negativo.
Alta (va de 0,7 a 1)
de la otra)
189
Chi Cuadrado
Este estadístico vincula variables nominales.
Para una mejor comprensión del estadístico, se partirá del siguiente ejemplo: Eustaquio piensa que las variables Campus y Sexo, están relacionadas. ¿Esto
es así?
Al tratarse de dos variables nominales se utilizará Chi2
Pasos a seguir:
1- Analizar
190
191
3- Tablas cruzadas
192
4- Pasar una de las variables a Filas (en este caso, se pasará Campus del alumno) y la variable restante pasarla a Columnas (Sexo, en este
ejemplo)
193
5- Click en Estadísticos
194
6- Tildar Chi-cuadrado
195
8- Click en Aceptar
196
A continuación, se desplegará la hoja de Resultados. Allí, se debe observar la tabla Pruebas de chi-cuadrado, luego ubicar Chi cuadrado de
Pearson y mirar la Significación asintótica bilateral [Sig. asintótica (bilateral)] para interpretar el resultado y saber si hay -o no- relación entre las
variables.
Interpretación del resultado: La significación hallada es 0,851 (mayor a 0,05) por lo que no existe relación entre las variables.
EN CASO DE EXISTIR RELACIÓN, PARA DAR CUENTA DE LA MISMA, ES PRECISO OBSERVAR LA TABLA CRUZADA
(SEÑALADA EN VERDE)
197
Capítulo XV
Estadísticos de diferencia de grupos
198
Estadísticos de diferencia de grupos
1 variable escalar de distribución normal 1 variable escalar de distribución no normal
T de Student U de Mann Whitney

1 variable Nominal con 2 grupos 1 variable Nominal con 2 grupos
1 variable de distribución normal 1 variable escalar de distribución no normal

F de Anova H de Kruskal Wallis
1 variable Nominal con 3 o más grupos 1 variable Nominal con 3 o más grupos
RECORDAR:
5% ES EL MARGEN DE ERROR TOLERADO EN PSICOLOGÍA.
Por ello: 5% = 5/100 = 0.05, lo cual es la medida utilizada como parámetro.
Un margen de error del 5% equivale a un 95% de certeza sobre el resultado.
199
Para que este proceso sea más claro se partirá del siguiente ejemplo: Nicasio piensa que las mujeres son más Neuróticas que los hombres. ¿Esto es
así?
En el enunciado pueden identificarse 2 variables -> Sexo (Mujeres/Hombres) y Neuroticismo.
Sexo: Variable nominal compuesta por dos grupos (los grupos varían de acuerdo a la cantidad de valores).
Neuroticismo: Variable Escalar.
Para saber que estadístico utilizar primero se debe calcular la prueba de normalidad de la variable escalar.
La variable Neuroticismo es de distribución normal (sig. 0,129 > a 0,05)- Por lo tanto, el estadístico a utilizar para resolver la consigna es
T de Student.
200
Pasos a Seguir:
1- Analizar
201
2- Comparar Medias
202
3- Prueba T para muestras independientes
203
4- Pasar la variable escalar al cuadro Variables de prueba
204
5- Pasar la variable Sexo al cuadro Variable de agrupación y hacer click en Definir grupos
205
6- Establecer el número del valor a comparar, en este caso son 2 grupos: 1= Femenino y 2= Masculino
No tiene por qué coincidir el Grupo1 con el valor 1 y el Grupo 2 con el valor 2, bien puede pasar que se compare el valor 2 y 3 de una variable con 3 valores,
por ende Grupo 1 sea 2 y Grupo 2 sea 3.
206
7- Click en Aceptar
207
8- Se desplegará la ventana de resultados, aquí se observará el cuadro Pruebas de muestras independientes, donde se verá la Significación de
la Prueba de Levene y luego la Significación bilateral correspondiente. Si la primera arroja un valor de 0,05 o superior, se entiende que las
varianzas son iguales, por lo tanto se mira la primera significación bilateral (Se asumen varianzas iguales), tal como se refleja en el ejemplo a
continuación. De no ser así (Prueba de Levene menor a 0,05), se observa la segunda significación bilateral (no se han asumido varianzas
iguales).
Si la significación bilateral es MENOR o IGUAL a 0,05 eso significa que existen diferencias entre los grupos.
En cambio, si la significación es MAYOR a 0,05 se entiende que no existe diferencia entre los grupos.
208
En este caso sí existe diferencia de grupos ya que la significación fue 0,010 (< a 0,05), por ende se miran los valores de la media del cuadro ubicado
más arriba “Estadisticos de Grupo”. En este caso, las mujeres obtuvieron una media de 17 puntos y los hombres una media de 15,05.
Se puede responder al enunciado: Nicasio tiene razón, las mujeres de esta base son más neuróticas que los hombres.
Si en vez de comparar los grupos de la variable Sexo (1=Femenino, 2= Masculino) con Neuroticismo, se hubiera comparado con Estado civil, teniendo
en cuenta que Neuroticismo es una variable escalar de distribución normal y Estado Civil tiene más de 3 valores (Soltero, Casado, Divorciado
y Viudo). El estadístico a utilizar en este caso sería F de ANOVA.
209
Pasos a Seguir:
1- Analizar
210
2- Comparar Medias
211
3- Click en Anova de un factor
212
4- Pasar la variable de interés (en este caso Neuroticismo) al cuadro de Lista de dependientes.
213
5- Pasar la variable con más de 3 valores o grupos (Estado Civil) al cuadro de Factor
6- Click en Aceptar 194
214
7- Se desplegará la ventana de resultados donde se visulizará en la tabla de ANOVA la significación, que da cuenta del análisis inter-grupos.
Interpretación del resultado: Según la significación= 0,178 (> a 0,05), no hay diferencia entre los grupos, por ende, en las personas de esta base no existen
diferencias significativas en la variable Neuroticismo según su estado civil.
COMO NO DIO SIGNIFICATIVO AQUÍ TERMINA EL EJERCICIO. SÓLO SE MIRAN LAS MEDIAS DE LOS GRUPOS SI DA SIGNIFICATIVO.
215
SI ESE FUERA EL CASO, (SIGNIFICACIÓN MENOR O IGUAL A 0,05) SE PROCEDE A REALIZAR UNA PRUEBA POST HOC (TUKEY) CUYO PROCEDIMIENTO SE
MUESTRA A CONTINUACIÓN.
Pasos a seguir:
1- Click en pruebas Post hoc
216
2- Tildar Tukey
3- Continuar
217
4- Aceptar
218
Aclaración preliminar: la prueba de Tukey, aquí enseñada, solo ha sido presentada a modo de ejemplo puesto que únicamente ha de realizarse
cuando existen diferencias significativas entre los grupos, lo cual no fue el caso ni con Estado Civil ni con Calidad general del dibujo.
La forma de interpretarlo, en caso de producirse una diferencia significativa, es idéntica a la de t de Student.
219
U DE MANN WHITNEY
Es un estadístico que trabaja con variables escalares de distribución no normal y variables nominales con 2 grupos
Para que este proceso sea más claro se partirá del siguiente ejemplo: Estanislao piensa que las mujeres son más Extrovertidas que los hombres.
¿Esto es así?
En el enunciado pueden identificarse 2 variables -> Sexo (Mujeres/Hombres) y Extroversión.
Sexo: Variable nominal compuesta por dos grupos (los grupos varían de acuerdo a la cantidad de valores).
Extroversión: Variable Escalar.
Como ya hemos visto, para saber qué estadístico utilizar, primero se debe calcular la prueba de normalidad de la variable escalar.
Se puede observar que la variable Extroversión se distribuyó de manera no normal, y como se la quiere estudiar en dos grupos (hombres y mujeres)
se procederá a realizar el estadístico U de Mann Whitney.
220
1- Analizar
221
2- Pruebas no paramétricas
222
3- Cuadros de diálogo antiguos
223
4- 2 muestras independientes
224
5- Pasar la variable en cuestión (en este caso es Extroverión) a Lista Variables de prueba:
225
6- Luego se pasa la variable nominal a Variable de agrupación (en este caso Sexo). Hacer click en Definir grupos
226
7- Es necesario definir los grupos según Grupo 1 y Grupo 2 (tal como sucede en t de Student). Para continuar con el ejemplo seleccionaremos
Grupo 1=1 (mujeres) y Grupo 2=2 (hombres)
227
9- El estadístico U de Mann Whitney ya está tildado, por lo que, únicamente es necesario hacer click en Aceptar.
228
Se desplegará la hoja de resultados. Allí hay que observar la Significación asintótica bilateral [Sig. Asintót. (bilateral)] para saber si existe o no
diferencia entre los grupos.
Interpretación del resultado: la significación fue 0,967 (mayor a 0,05) esto significa que las mujeres no son más extrovertidas que los hombres.
Además, si se observan los rangos promedio (encerrados en color verde) se puede observar que los puntajes de ambos sexos no difieren
sustancialmente.
229
H DE KRUSKAL WALLIS
Es un estadístico que trabaja con variables escalares de distribución no normal y variables nominales con 3 o más grupos
Si en lugar de comparar dos grupos con Extroversión, se quisiera comparar con Estado civil, teniendo en cuenta que Extroversión es una variable
escalar de distribucion no normal y Estado Civil tiene más de 3 valores (Soltero, Casado, Divorciado y Viudo), el estadístico a utilizar en este
caso sería H de Kruskal Wallis.
230
Pasos a seguir:
1- Analizar
231
2- Pruebas no paramétricas
232
3- Cuadros de diálogo antiguos
233
4- K muestras independientes
234
5- Pasar la variable escalar (Extraversión en este caso) a Lista Variables de prueba
235
6- Pasar la variable nominal (en este caso Estado civil) a Variable de agrupación. A continuación, click en Definir rango
236
7- En este paso es imprescindible recordar cuál es el primer valor y el último. En caso de no recordarlo, hacer click derecho en la variable
nominal (en este caso Estado civil) y chequear los valores
237
Aquí puede observarse que Estado civil cuenta con 4 valores (Soltero, Casado o en pareja, Divorciado o separado y Viudo)
238
8- Completar Rango para variable de agrupación: mínimo que representa el valor más pequeño de la variable (en este caso será 1) y máximo,
hace referencia al valor más alto de la variable en cuestión (en este caso será 4).
239
10- El estadístico H de Kruskal Wallis está tildado por default, por lo tanto, sólo es preciso hacer click en Aceptar
240
11- Se desplegará la hoja de Resultados. Allí, es preciso observar la Significación asintótica [Sig. asintót.].
Interpretación del resultado: La significación es de 0,330 (> a 0,05), por lo tanto, no hay diferencia entre los grupos. Esto significa que en las
personas de esta base no existen diferencias significativas en la variable Extroversión respecto de su estado civil.
COMO NO DIO SIGNIFICATIVO AQUÍ TERMINA EL EJERCICIO. SÓLO SE MIRAN LOS RANGOS DE LOS GRUPOS SI DA SIGNIFICATIVO.
SI ESE FUERA EL CASO (SIGNIFICACIÓN MENOR O IGUAL A 0,05) SE PROCEDE A REALIZAR LA PRUEBA DE GAMES-HOWELL. Los pasos son idénticos a los
de Tukey pero en este caso se tilda la prueba Games-Howell.
241
242
Capítulo XVI
Procedimientos y respuestas en
243
Compendio sintético de pasos a seguir en todos los ejercicios de estadística inferencial
1- Reconocer la medida de las variables en cuestión (nominal – ordinal - escalar)
2- Sacar la prueba de normalidad (sólo para variables escalares)
3- Aplicar el estadístico correspondiente
4- Interpretar el resultado
Los enunciados funcionan como hipótesis, las mismas son inferencias que se pueden someter a comprobación (por ejemplo: Eustaquio piensa que las
variables Conducta Social Sumisa y Conducta Social Insegura están relacionadas ¿esto es así?). En este caso, la hipótesis propone una relación entre dos
variables. Por lo tanto, siguiendo los pasos anteriores se logrará confirmar, rechazar o confirmar parcialmente la hipótesis.
Existen dos tipos de hipótesis:
a) Las hipótesis descriptivas o correlacionales (tales como la del ejemplo)
b) Las hipótesis nulas: la negación de la hipótesis de estudio (en el caso del ejemplo: no se hallará relación entre las variables)
Lo ideal es refutar la hipótesis nula, es decir, que no se cumpla la hipótesis nula.
Cuando la hipótesis nula se rechaza/refuta, las variables están asociadas o hay diferencias entre los grupos.
Para cada uno de los estadísticos existe una hipótesis nula particular
• Estadísticos de relación: Las variables son independientes.
• Estadísticos de diferencia de grupos: Las medias son iguales (t de Student y F de Anova) o Los rangos promedio son iguales (U de Mann Whitney y H
de Kruskal Wallis).
244
Compendio sintético de respuestas en todos los ejercicios de estadística inferencial
1- Responder al enunciado
2- Indicar estadístico utilizado y se aclara si se seleccionaron casos o si se recodificó una variable
3- Indicar la significación (si se halló relación o diferencia de grupos es preciso colocar el coeficiente de correlación, las medias o rangos promedio según
corresponda)
4- Confirmar o rechazar la hipótesis nula (aclarando de qué hipótesis nula se trata).
La respuesta para el ejemplo es la siguiente : Eustaquio tiene razón, existe relación entre Conducta Social Sumisa y Conducta Social Insegura. Se utilizó Rho de
Spearman, obteniendo una significación de 0,001. La relación es directa y moderada (Rho=0.568) Se rechaza la hipótesis nula de independencia de variables.
A continuación, a modo de cierre, se presenta un cuadro resumen de los estadísticos, la medida de las variables, pasos a seguir, hipótesis nula e
interpretación:
245
ESTADÍSTICOS NIVEL DE MEDICIÓN PASOS HIPÓTESIS NULA INTERPRETACIÓN
Toda significación mayor a
0,05 confirma la hipótesis
Escalar y Escalar (distribución Analizar – Correlaciones – Las variables son
R de Pearson nula y por ende toda
normal) Bivariadas – Tildar Pearson independientes
significación menor a 0,05 la
rechaza
Escalar y Escalar (distribución
Analizar – Correlaciones – Las variables son
Rho de Spearman no normal, mixta o escalar y Idem
Bivariadas – Tildar Spearman independientes
ordinal)
Analizar – Correlaciones –
Las variables son
Tau – b de Kendall Ordinal y Ordinal Bivariadas – Tildar Tau – b de Idem
independientes
Kendall
Analizar – Estadísticos
descriptivos – Tablas de Las variables son
Chi cuadrado Nominal y Nominal Idem
cruzadas – Estadísticos – independientes
Chi 2
Analizar – Comparar medias
Escalar de distribución – Prueba T para muestras
t de Student Las medias son iguales Idem
normal y Nominal (2 grupos) independientes (no olvidar
definir grupos en la nominal)
Analizar – Pruebas no
Escalar de distribución no paramétricas – Cuadro de Los rangos promedio son
U de Mann Whitney Idem
normal y Nominal (2 grupos) diálogo antiguos – 2 iguales
muestras independientes
Analizar – Comparar medias –
Anova de un factor. En caso de
Escalar de distribución
resultar significativas las
F de Anova normal y Nominal (3 o más Las medias son iguales Idem
diferencias, realizar Tukey para
grupos) ver entre cuáles se dan las
variaciones significativas
Analizar – Pruebas no
paramétricas – Cuadro de
diálogo antiguos – K muestras
Escalar de distribución no
independientes. En caso de Los rangos promedio son
H de Kruskal Wallis normal y Nominal (3 o más Idem
resultar significativas las iguales
grupos) diferencias, realizar Games-
Howell para ver entre cuáles se
dan las variaciones significativas
246
Referencias bibliográficas
Badler, C. E., Alsina, S. M., Puigsubirá, C., y Vitelleschi, M. S. (2004, 26-29 de noviembre). Tratamiento de bases de datos con información faltante según
análisis de las pérdidas con SPSS [Simposio]. Jornada de Investigaciones en la Facultad de Ciencias Económicas y Estadística, Rosario, Argentina.
Barreto Villanueva, A. (2012). El progreso de la Estadística y su utilidad en la evaluación del desarrollo. Papeles de Población, 18(73), 1-31.
Berlanga, V., & Rubio Hurtado, M. J. (2012). Clasificación de pruebas no paramétricas. Cómo aplicarlas en SPSS. REIRE. Revista d'Innovació i Recerca en
Educació, 5(2), 101-113.
Bernal, D. (2017). Manual de SPSS: De un estudiante para los estudiantes. Observatorio del Estudiante.
Botella Ausina, J., Suero Suñe, M., y Ximénez Gómez, C. (2012). Análisis de datos en psicología I. Pirámide.
Clark-Carter, D. (2002). Investigación cuantitativa en Psicología. Del diseño experimental al reporte de investigación. Oxford University Press.
Cortada de Kohan, N. (1994). Diseño estadístico para investigadores en ciencias sociales y del comportamiento. Eudeba.
Flores-Ruiz, E., Miranda-Novales, M. G., y Villasís-Keever, M. Á. (2017). El protocolo de investigación VI: cómo elegir la prueba estadística adecuada.
Estadística inferencial. Revista Alergia México, 64(3), 364-370.
Hernández-Sampieri, R. y Mendoza Torres, C. P. (2018). Metodología de la investigación. McGraw-Hill.
Herreras, E. B. (2005). SPSS: Un instrumento de análisis de datos cuantitativos. Revista de informática educativa y medios audiovisuales, 2(4), 62-69.
Korn, F. (1984). Conceptos y variables en la investigación social. Nueva Visión.
Levin, J. y Levin, W. C. (2001). Fundamentos de Estadística en la investigación social. Oxford University Press.
Pagano, R. (2011). Estadística para las ciencias del comportamiento. Thomson.
Pérez, M. A. (2009). Las puntuaciones de los test. En M. F. Liporace, A. N. Cayssials y M. A. Pérez, Curso básico de psicometría (pp. 75-115). Lugar
Editorial.
247

Manual de Estadística Aplicada A La Psicología

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Manual de Estadística Aplicada A La Psicología

Cargado por

Copyright:

Formatos disponibles

MANUAL DE ESTADÍSTICA APLICADA A LA

Preuss, Maximiliano; Gruppi, Rocío; Ferrero, Florencia y Arruabarrena, Lucila.

Capítulo I. Armado de base de datos…………………………………………………………………………………………………………………………………………………………… 4

Capítulo II. Ordenar casos……………………………………………………………………………………………………………………………………………………………………………. 19

Capítulo III. Frecuencias………………………………………………………………………………………………………………………………………………………………………………... 25

Capítulo IV. Seleccionar casos y Segmentar archivo…………………………………………………………………………………………………………………………………………… 32

Capítulo V. Recodificación de variables……………………………………………………………………………………………………………………………………………………….. 55

Capítulo VI. Calcular variable………………………………………………………………………………………………………………………………………………………………………... 82

Capítulo VII. Medidas de tendencia central y dispersión………………………………………………………………………………………………………………………………. 95

Capítulo VIII. Valores extremos……………………………………………………………………………………………………………………………………………………………………….. 112

Capítulo IX. Puntajes transformados: Percentil……………………………………………………………………………………………………………………………………………. 121

Capítulo X. Puntajes transformados: Cuartil……………………………………………………………………………………………………………………………………………... 134

Capítulo XI. Puntajes transformados: Puntaje Z…………………………………………………………………………………………………………………………………………. 138

Capítulo XII. Estadística inferencial……………………………………………………………………………………………………………………………………………………………... 145

Capítulo XIII. Prueba de normalidad…………………………………………………………………………………………………………………………………………………………….. 148

Capítulo XIV. Estadísticos de relación de variables……………………………………………………………………………………………………………………………………… 161

Capítulo XV. Estadísticos de diferencia de grupos………………………………………………………………………………………………………………………………………. 179

Capítulo XVI. Procedimientos y respuestas en Estadística inferencial………………………………………………………………………………………………………… 218

siquiera compararse con ellos.

en psicología bajo la lógica de la versión hipotético-deductivista del método científico.

ordenador el programa instalado para aprovechar al máximo la información aquí suministrada.

1- Vista de datos: Es el espacio donde serán cargados los datos recolectados.

varían de un sujeto a otro.

Es en esta vista donde se comenzará a trabajar.

2- Tipo: Tipo de variable a utilizar, el mismo dependerá de los valores de la variable.

• Fecha: Formatos de Fecha (Ej.: dd.mm.yy)

un valor de la variable sexo.

Hacer click en los tres puntos y se desplegará la siguiente ventana:

Kohan, 1994; Levin y Levin, 2001; Pagano, 2011).

se pasa con doble click o al cuadro “Ordenar por”

entonces, se debe usar una herramienta denominada: Frecuencia.

“Variables” haciendo click aquí

-N: Es el número total de casos

aspectos (Botella Ausina et al., 2012).

femenino y masculino que conforman la base.

variable y cargar los datos en función de la nueva categorización.

la variable con nuevos códigos de valor.

nuevos códigos de valor.

Valores antiguos Valores nuevos

Una vez escrita la etiqueta se hará click en Añadir.

Se hace click en Añadir y se prosigue con el siguiente grupo.

Se hace click en Añadir y se prosigue con el siguiente grupo.

Una vez establecidos los nuevos valores se hace click en Continuar.

Si la ventana no se despliega es necesario revisar en la barra de herramientas de la PC.

(Levin y Levin, 2001).

En esta ocasión no se debe minimizar la ventana de resultados.

Ejemplo: notas de cursada

Varianza: Notas de parciales de un alumno: 2 – 4 - 5 – 7 – 7

Cantidad de Valores - 1 (5 -1) (5 – 1)

Varianza final (Con la correspondiente elevación al cuadrado)

• Desvió Típico: 2.12

Nivel de medición Tendencia central Dispersión Ejemplo de variable

- VARIANZA / DESVÍO TÍPICO

NOMINAL MODA _______________________ ESTADO CIVIL

Caso más atípico de todos

Puntajes brutos que

Los autores establecen que los rangos son:

Realizar deducciones e interpretaciones del resultado, a partir de los datos

Tipo de cruce Alcance de los estudios Detalle Estadísticos que:

Son estudios causales en los cuales existe

Aquellas investigaciones que estudian las Comparan variables en distintos

Variable de distribución no normal

-Los valores están dispersos (valores heterogéneos)