Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Curso
Curso
2.1.6.-Valores Son los diferentes valores que puede tomar la variable. Se van añadiendo a
la lista, mediante el botón Añadir. Se pueden introducir modificaciones con los botones
Cambiar y Borrar.
Ejemplo En el caso de estar definiendo la variable sexo, los valores que puede tomar la
variable son dos: Mujer y Hombre, le asignamos a las mujeres un 1 y a los hombres un 2.
Al ir definiendo cada una de las variables del fichero, puede ocurrir que
queramos utilizar la misma opción para más de una variable. En lugar de ir definiendo
cada variable, se puede copiar la información de una (con Ctrl + C o Edición + Copiar)
y pegarla en otra/s (con Ctrl + V o Edición + Pegar).
Por ejemplo, si queremos utilizar los mismos "Valores" para más de una
variable, basta definirlos para una, a continuación se selecciona la celdilla que
corresponde la los Valores de esa variable, se pincha Ctrl + C o Edición + Copiar, y se
selecciona el resto de variables que van a llevar los mismos valores (seleccionado con
el ratón las celdillas correspondientes a los valores), y se pincha Ctrl + V o Edición +
Pegar. Esto puede hacerse con todas las opciones menos con el Nombre de la
variable.
Una vez que están todas las variables definidas se meten los datos (la
operación puede realizarse a la inversa, metiendo primero los datos y definiendo
seleccionada.
INDICE
RESULTADOS demás.
La parte de la derecha, es la que muestra los
resultados de los análisis efectuados.
8.2.2.- Dónde lo queremos exportar Hay que especificar dónde se quiere exportar
el visor de resultados, para lo que hay que ir a Exportar archivo.
9.2.- EN FORMATO HTML El archivo exportado puede ahora abrirse desde cualquier
ordenador que no tenga instalado el programa SPSS, ahora con formato HTML. Para
ello abriremos el procesadores de texto Word. Para abrirlo, accedemos a Archivo –
abrir en tipo de archivo, seleccionamos Documento HTML o Todos los archivos,
buscamos el que queremos abrir y aparece un documento con el aspecto siguiente:
Se da la opción de mostrar / no
mostrar la tabla de frecuencias. Para
obtenerlas, debe estar marcado ()
A continuación se presentan las tablas de frecuencias, una para cada variable, en la que se aparece
la frecuencia directa, su porcentaje directo, así como el válido (después de eliminar valores
perdidos), y el acumulado.
Porcentaje Porcentaje
Frecuencia Porcentaje válido acumulado
Válidos Sin estudios 7 7.0 7.0 7.0
Primarios 14 14.0 14.0 21.0
Secundarios 16 16.0 16.0 37.0
Bachiller 21 21.0 21.0 58.0
Univ. Medios 16 16.0 16.0 74.0
Univ. Superiores 18 18.0 18.0 92.0
Otros 8 8.0 8.0 100.0
Total 100 100.0 100.0
ESTADÍSTICA PARAMÉTRICA:
PRUEBA T DE STUDENT
Con la prueba “t de Student” se intenta probar la diferencia de medias para
uno, dos o más grupos. Se trata de una prueba paramétrica, es decir, que entre otras
cosas, la/s variable/s dependiente/s deben estar medidas en nivel de intervalo o razón.
19
Ho (2): No existen diferencias estadísticamente significativas en el Rendimiento de los
alumnos en Filosofía en función de la variable Sexo.
Ho (3): No existen diferencias estadísticamente significativas en el Rendimiento de los
alumnos en Idioma en función de la variable Sexo.
Ho (4): No existen diferencias estadísticamente significativas en el Rendimiento de los
alumnos en Matemáticas en función de la variable Sexo.
Ho (5): No existen diferencias estadísticamente significativas en el Rendimiento de los
alumnos en Dibujo en función de la variable Sexo.
Interpretación de resultados
En el visor de resultados encontramos dos tablas (aquí se presenta la segunda
en dos partes). En la primera tabla, el programa calcula los ESTADISTICOS DEL
GRUPO, concretamente la media, la desviación típica y el error típico de medida de
cada categoría de la variable independiente, sexo en este caso.
Estadísticos de grupo
A continuación aparece una tabla que consta de dos partes, en la primera, el programa
realiza una prueba a priori, la F de Levene, para comprobar si existe o no homogeneidad de
varianzas (uno de los requisitos para aplicar pruebas paramétricas).
20
diferencias estadísticamente significativas entre hombres y mujeres en el
Rendimiento en Historia.
En las siguientes columnas, el programa nos ofrece los diferentes intervalos
confidenciales (nivel de confianza 95%) para cada una de las comparaciones.
Para el resto de las Hipótesis Nulas planteadas Ho (2), Ho (3), Ho (4), Ho (5), podemos
aceptarlas ya que las probabilidades asociadas al estadístico t (0,702 - 0,699 - 0,470 -
0,891 respectivamente) son mayores que (0,05), por lo que:
No existen diferencias estadísticamente significativas en el Rendimiento de los
alumnos en Filosofía en función de la variable Sexo . Ho (2)
No existen diferencias estadísticamente significativas en el Rendimiento de los
alumnos en Idioma en función de la variable Sexo. Ho (3)
No existen diferencias estadísticamente significativas en el Rendimiento de los
alumnos en Matemáticas en función de la variable Sexo Ho (4)
No existen diferencias estadísticamente significativas en el Rendimiento de los
alumnos en Dibujo en función de la variable Sexo Ho (5)
Contrastes Posteriores
En caso de haber encontrado diferencias significativas, y para ver hacia que dirección
de dan, se consulta la tabla ESTADÍSTICOS DE GRUPO, y en la columna MEDIA, se
puede ver qué grupo obtiene una media superior.
2.- PRUEBA T PARA MUESTRAS RELACIONADAS
Dentro del menú Analizar, entramos en la opción comparar medias y dentro de
esta opción accedemos a Prueba T para muestras relacionadas. En este caso se trata
21
de comprobar si existen diferencias estadísticamente significativas entre la Capacidad
de Concentración antes (de recibir un programa de entrenamiento de la concentración
PEC), y la Capacidad de Concentración después (del PEC). Seleccionamos estas
variables porque están medidas en nivel de razón.
La H0 planteada es que no existen diferencias estadísticamente significativas
entre la Capacidad de Concentración antes y la Capacidad de Concentración
después.
Interpretación de resultados
Aparece en primer lugar una tabla que resumen la información de las variables
incluidas en el análisis. Podríamos haber metido más de un par de variables, en los
resultados se identifican como Par 1, Par 2, etc.
A continuación aparece una tabla que nos proporciona la correlación entre las
N Correlación Sig.
Par 1 Capacidad de
concentración antes y
100 .744 .000
Capacidad de
concetración despues
variables:
Podemos ver que la correlación es significativa (sig. = 0,000 < = 0,05) y muy alta
(ver práctica de correlación)
22
Por último aparece la tabla en la que se contrasta la hipótesis que poníamos en juego:
Diferencias relacionadas
95% Intervalo de
Error típ. confianza para la
Desviació de la diferencia Sig.
Media n típ. media Inferior Superior t gl (bilateral)
Par 1 Capacidad de
concentración
antes - Capacidad -10.32 13.92 1.39 -13.08 -7.56 -7.415 99 .000
de concetración
despues
Podemos ver que la probabilidad asociada al estadístico t es menos que , por lo que
rechazamos la H0 planteada y afirmamos que existen diferencias estadísticamente
significativas entre la Capacidad de Concentración antes y la Capacidad de
Concentración después.
Contrastes posteriores
Una vez que hemos visto que las diferencias entre la capacidad de concentración
antes y la capacidad de concentración después son significativas, puede interesar en
qué dirección se dan estas diferencias. Para ello, volvemos a la tabla primera que
proporciona el programa, y vemos en que variable a media es más alta.
23
ESTADÍSTICA NO PARAMÉTRICA
Moses)
24
H0: No existen diferencias estadísticamente significativas en los intereses
profesionales de los alumnos en función del sexo.
Interpretación de resultados
En los resultados aparece una tabla en la que se muestra el número de sujetos que
hay en cada categoría de la variable independiente, el rango promedio y la suma de
Rangos
Rango Suma de
Sexo N promedio rangos
Interes profesional Mujer 53 52.39 2776.50
del alumno Hombre 47 48.37 2273.50
Total 100
rangos.
A continuación encontramos la tabla en la que aparecen los estadísticos de contraste.
Aunque aparecen por defecto la U de Mann Whitney, W de Wilcoxon y la Z,
interpretaremos solo la primera de ellas, aunque como puede verse, la significatividad
asociada a los tres estadísticos es la misma.
Así pues, en función de la probabilidad asociada al valor del estadístico U de Mann
Whitney, podemos concluir que no existen diferencias estadísticamente
significativas en los intereses profesionales de los alumnos en función del sexo,
ya que este valor (0,479) es mayor que (0,05)
Estadísticos de contrastea
Interes
profesional
del alumno
U de Mann-Whitney 1145.500
W de Wilcoxon 2273.500
Z -.707
Sig. asintót. (bilateral) .479
a. Variable de agrupación: Sexo
25
2.- PRUEBA NO PARAMÉTRICA PARA K MUESTRAS INDEPENDIENTES
Para el caso de más de dos muestras independientes vamos a utilizar la
Prueba H de Kruskal-Wallis. Accedemos al menú Analizar – Pruebas no paramétricas
– K muestras independientes Del mismo modo que el anterior contraste no pediremos
estadísticos descriptivos en el menú opciones y seleccionaremos las variables
dependientes. En este caso vamos a utilizar como variables dependientes el nivel de
estudios y profesional de los padres, y como variable independiente, el nivel social de
la familia.
Interpretación de resultados
En los resultados aparecen las siguientes tablas:
Sexo
A continuación aparece la tabla con los valores del estadístico Chi cuadrado, los
grados de libertad y la probabilidad asociada al estadístico.
Las probabilidades asociadas a los valores de chi cuadrado son 0,549 - 1,000 y 0,002,
en el caso de Sexo y del Grupo mayores que el valor de = 0,05, y en el caso de
Nivel Social Familiar, inferior a este valor, por lo que afirmamos que no existen
diferencias (mayores que las esperadas por azar) entre las diferentes categorías de
las variables Sexo y Grupo de Clase, y si que las hay en la variable Nivel Social
Interpretación de resultados
En la primera tabla que aparece podemos contrastar las hipótesis nulas, siempre
comparando con la probabilidad asociada al estadístico F
ANOVA
Suma de Media
cuadrados gl cuadrática F Sig.
Rendimiento en historia Inter-grupos 246.350 3 82.117 29.933 .000
Intra-grupos 263.360 96 2.743
Total 509.710 99
Rendimiento en filosofía Inter-grupos 298.440 3 99.480 39.372 .000
Intra-grupos 242.560 96 2.527
Total 541.000 99
Rendimiento en idioma Inter-grupos 22.320 3 7.440 1.762 .160
Intra-grupos 405.440 96 4.223
Total 427.760 99
Rendimiento en Inter-grupos 122.440 3 40.813 15.272 .000
matemáticas Intra-grupos 256.560 96 2.673
Total 379.000 99
Rendimiento en dibujo Inter-grupos 221.640 3 73.880 28.216 .000
Intra-grupos 251.360 96 2.618
Total 473.000 99
Contrastes posteriores
Para comprobar hacia qué lado se dan las diferencias encontradas, vamos a la siguiente
tabla. A continuación se presenta el extracto de dicha tabla correspondiente a la variable
Comparaciones
dependientes Rendimiento en Historia. múltiples
Scheffé
Diferencia de Diferencia
Variable dependiente (I) Grupo(J) Grupo medias (I-J) Error típico Sig. significativa
Rendimiento en historia Grupo A Grupo B -2.64* .47 .000
Grupo C .28 .47 .949
Grupo D -3.28* .47 .000
Grupo B Grupo A 2.64* .47 .000
Grupo C 2.92* .47 .000
Diferencia no
Grupo D -.64 .47 .602
significativa
Grupo C Grupo A -.28 .47 .949
Grupo B -2.92* .47 .000
Grupo D -3.56* .47 .000
Grupo D Grupo A 3.28* .47 .000
Grupo B .64 .47 .602
Grupo C 3.56* .47 .000
Rendimiento en idioma Grupo A Grupo B -.68 .58 .714
Grupo C -1.16 .58 .270
En la primera columna aparece
Grupo D la diferencia
-8.00E-02de medias .58de cada.999
categoría de la
Grupo B Grupo A .68 .58la sustracción
.714
variable independiente con el resto, adjudicando al minuendo de el nombre
Grupo C -.48 .58 .877
(I), y al sustrayendo el nombre (J), en la
Grupo D segunda columna
.60 (Diferencia
.58 de.785
medias (I-J), se
Grupo C Grupo A
presentan los resultados de dicha diferencia. En el 1.16 .58
caso de aparecer .270
un asterisco (*) al
Grupo B .48 .58 .877
lado del resultado, y según consta GrupoaD pie de tabla,1.08 la diferencia
.58 será.333 significativa. La
Grupo D seGrupo
significatividad de la diferencia A
ve igualmente en la columna.58
8.00E-02 Sig. en la que aparece la
.999
Grupo B -.60 .58 .785
probabilidad asociada a la diferencia. Como puede verse, para las probabilidades que no
Grupo C -1.08 .58 .333
son*.significativas (es las
La diferencia entre decir, queesson
medias mayores
significativa = 0,05), no aparece asterisco (*) en el
que .05.
al nivel
valor de la diferencia, y cuando no aparece el asterisco (*) en este valor, la probabilidad
no es significativa (su valor es mayor que = 0,05).
2.- ANÁLISIS DE VARIANZA FACTORIAL
Cuando se quiere comprobar si existen o no diferencias entre más de dos
variables independientes y una dependiente, utilizamos el Análisis de Varianza Factorial,
al que accedemos a través de la secuencia Analizar – Modelo Lineal General –
Univariante.
Como en el caso del Análisis de Varianza Simple, este es el momento de pedir (si se
quieren) los contrastes posteriores, para lo que accedemos de nuevo a Post Hoc...
La hipótesis nula (Ho) que vamos a contrastar queda pues formulada en los
términos siguientes: No existen diferencias estadísticamente significativas en el
Rendimiento Global obtenido por los alumnos en función del efecto conjunto de las
variables Grupo de clase al que pertenecen y Nivel Social de la Familia.
Interpretación de resultados
La primera tabla que aparece en la salida nos muestra un resumen de los casos
incluidos en el estudio
Factores inter-sujetos
Etiqueta
del valor N
Grupo 1 Grupo A 25
2 Grupo B 25
3 Grupo C 25
4 Grupo D 25
Nivel 1 Bajo 14
social 2 Medio-Baj
familiar 33
o
3 Medio 26
4 Medio-Alt
17
o
5
Alto 10
La tabla proporciona también un ANOVA simple para cada una de las variables
independientes por separado. El estadístico F para el factor Grupo tiene una probabilidad
asociada de 0,000, a un nivel de significación de 0,05, resulta significativo.
Por el contrario, el valor de la probabilidad asociada a F para la variable Nivel social es de
0,789 resultando no significativa para un valor de de 0,05.
Contrastes Posteriores
En las tablas siguientes pueden hacerse los contrastes posteriores, del mismo modo que
se hacían en el caso de ANOVA simple
Comparaciones múltiples
Intervalo de confianza al
Diferencia 95%.
entre Límite
(I) Grupo (J) Grupo medias (I-J) Error típ. Significación Límite inferior superior
Grupo A Grupo B -.3200 .2651 .693 -1.0772 .4372
Grupo C 1.1080* .2651 .001 .3508 1.8652
Grupo D -1.3840* .2651 .000 -2.1412 -.6268
Grupo B Grupo A .3200 .2651 .693 -.4372 1.0772
Grupo C 1.4280* .2651 .000 .6708 2.1852
Grupo D -1.0640* .2651 .002 -1.8212 -.3068
Grupo C Grupo A -1.1080* .2651 .001 -1.8652 -.3508
Grupo B -1.4280* .2651 .000 -2.1852 -.6708
Grupo D -2.4920* .2651 .000 -3.2492 -1.7348
Grupo D Grupo A 1.3840* .2651 .000 .6268 2.1412
Grupo B 1.0640* .2651 .002 .3068 1.8212
Grupo C 2.4920* .2651 .000 1.7348 3.2492
Basado en las medias observadas.
*. La diferencia de medias es significativa al nivel .05.
Comparaciones múltiples
Intervalo de confianza al
Diferencia 95%.
entre Límite
(I) Nivel social familiar (J) Nivel social familiar medias (I-J) Error típ. Significación Límite inferior superior
Bajo Medio-Bajo -.1058 .2990 .998 -1.0487 .8370
Medio -.1863 .3108 .985 -1.1662 .7936
Medio-Alto -.1433 .3383 .996 -1.2101 .9236
Alto -.1986 .3881 .992 -1.4225 1.0253
Medio-Bajo Bajo .1058 .2990 .998 -.8370 1.0487
Medio -8.0420E-02 .2458 .999 -.8556 .6947
Medio-Alto -3.7433E-02 .2799 1.000 -.9199 .8451
Alto -9.2727E-02 .3384 .999 -1.1598 .9743
Medio Bajo .1863 .3108 .985 -.7936 1.1662
Medio-Bajo 8.042E-02 .2458 .999 -.6947 .8556
Medio-Alto 4.299E-02 .2924 1.000 -.8790 .9650
Alto -1.2308E-02 .3488 1.000 -1.1122 1.0876
Medio-Alto Bajo .1433 .3383 .996 -.9236 1.2101
Medio-Bajo 3.743E-02 .2799 1.000 -.8451 .9199
Medio -4.2986E-02 .2924 1.000 -.9650 .8790
Alto -5.5294E-02 .3736 1.000 -1.2333 1.1227
Alto Bajo .1986 .3881 .992 -1.0253 1.4225
Medio-Bajo 9.273E-02 .3384 .999 -.9743 1.1598
Medio 1.231E-02 .3488 1.000 -1.0876 1.1122
Medio-Alto 5.529E-02 .3736 1.000 -1.1227 1.2333
Basado en las medias observadas.
3.- ANÁLISIS DE COVARIANZA
El análisis de covarianza (ANCOVA) es una combinación de las técnicas de
regresión y análisis de varianza, que se utiliza para comprobar la existencia de
diferencias estadísticamente significativas entre una variable independiente (más de dos
grupos o categorías) y otra dependiente (nivel de medición intervalo o razón), eliminando
la interacción de una variable extraña que controlamos a través de éste método,
introduciéndola en el análisis como COVARIABLE.
La suposición específica del ANCOVA es que la variable concomitante (covariable)
no debe ser afectada por los tratamientos, es decir, que los tratamientos aplicados a las
unidades experimentales para poder observar sus efectos en la variable Y no deberían
influir en los valores esperados de X.
Accedemos al análisis de covarianza a través del menú Analizar – Modelo Lineal
General – Univariante.
Por lo tanto, la H0 queda formulada de la forma siguiente: No existen diferencias
estadísticamente significativas en el Rendimiento Global de los alumnos en función del
Grupo de clase al que pertenezcan, controlando la influencia del Nivel Social de la familia.
Interpretación de resultados
De la tabla podemos deducir una serie de conclusiones (tantas como pruebas de
significatividad realizadas) que se presentan a continuación:
1. Modelo corregido Se pone a prueba la existencia de diferencias estadísticamente
significativas en el Rendimiento Global obtenido por los alumnos en función del Grupo
al que pertenecen, controlando el efecto que pueda ejercer el Nivel Social Familiar. La
probabilidad asociada al estadístico F calculado es de 0,000 al ser un valor menor
que (0,05), rechazamos H0 y afirmamos que existen diferencias en el
Rendimiento Global obtenido por los alumnos en función del Grupo al que
pertenecen, controlando el efecto que pueda ejercer el Nivel Social Familiar
2. Intersección En este caso se pretende comprobar la existencia de diferencias
estadísticamente significativas en el Rendimiento Global de los alumnos, provocadas
por la acción conjunta de las variables Grupo de Clase y Nivel Social Familiar. En este
caso, la probabilidad asociada a F es también de 0,000, y al ser menor que (0,05),
se rechaza H0, por lo que se confirma la existencia de diferencias
estadísticamente significativas en el Rendimiento Global de los alumnos,
provocadas por la acción conjunta de las variables Grupo de Clase y Nivel
Social Familiar
3. Por último se hace un ANOVA con cada una de las variables independientes
utilizadas. En el primer caso (para la Variable Nivel Social Familiar) se acepta la H0 al
ser la probabilidad asociada a F mayor que (0,05) (para Nivel Social Familiar la
probabilidad asociada a F es de 0,533), por lo que no hay diferencias
estadísticamente significativas en el Rendimiento Global de los alumnos en
función del Nivel Social Familiar.
4. En el segundo caso se rechaza la H0 al ser la probabilidad asociada a F menor que
(0,05) (para Grupo de Clase la probabilidad asociada a F es de 0,000), por lo que
hay diferencias estadísticamente significativas en el Rendimiento Global de los
alumnos en función del Grupo de clase al que pertenecen.
CORRELACIÓN
La correlación es una medida de la relación entre dos variables. Su valor oscila
entre –1 y +1 pasando por 0. Los coeficientes de correlación indican dos cosas;
primero indican la cuantía de la relación, para lo que se tiene en cuenta el valor
absoluto del coeficiente, y que se interpreta según la siguiente tabla:
COEFICIENTES DE CORRELACIÓN
- Pearson El coeficiente de correlación de Pearson se utiliza cuando las
variables del análisis están medidas en nivel de intervalo o razón. En ambos
casos la interpretación se hace igual.
- Spearman Utilizaremos el coeficiente de correlación de Spearman cuando las
variables a relacionar estén medidas en nivel nominal u ordinal.
Interpretación de resultados
Una vez que tenemos las variables que queremos correlacionar, aceptamos y
en el visor de resultados aparecerá una matriz en la que aparecen de nuevo los
siguientes datos:
- Coeficiente de correlación Valor del coeficiente, que se interpreta según la
tabla que aparece al principio de la práctica.
- Significatividad (Sig.) Es lo primero que hay que mirar, indica si la
correlación es significativa, si el valor es menor que nuestro , entonces la
correlación es significativa (no se debe al azar). Mediante la opción Marcar
las correlaciones significativas, el programa señala con un asterisco (*) o
dos (**) las correlaciones que son significativas al 0,05 o al 0,01, indicando
a pie de tabla la clave de interpretación.
- N Número de sujetos que intervienen en el análisis
Correlaciones
Correlaciones
Rendimiento
Rendimiento Rendimiento Rendimient en Rendimiento Rendimiento
en historia en filosofía o en idioma matemáticas en dibujo global
Rendimiento Correlación
1.000 .576** .010 .239* .205* .714**
en historia de Pearson
Sig. (bilateral) . .000 .922 .017 .041 .000
N 100 100 100 100 100 100
Rendimiento Correlación
.576** 1.000 .033 .267** .253* .752**
en filosofía de Pearson
Sig. (bilateral) .000 . .743 .007 .011 .000
N 100 100 100 100 100 100
Rendimiento Correlación
.010 .033 1.000 -.225* .044 .288**
en idioma de Pearson
Sig. (bilateral) .922 .743 . .025 .660 .004
N
100 100 100 100 100 100
Rendimiento en Correlación
.239* .267** -.225* 1.000 .328** .530**
matemáticas de Pearson
Sig. (bilateral) .017 .007 .025 . .001 .000
N 100 100 100 100 100 100
Rendimiento Correlación
.205* .253* .044 .328** 1.000 .623**
en dibujo de Pearson
Sig. (bilateral) .041 .011 .660 .001 . .000
N 100 100 100 100 100 100
Rendimiento Correlación
.714** .752** .288** .530** .623** 1.000
global de Pearson
Sig. (bilateral) .000 .000 .004 .000 .000 .
N 100 100 100 100 100 100
**. La correlación es significativa al nivel 0,01 (bilateral).
*. La correlación es significante al nivel 0,05 (bilateral).
En esta tabla podemos ver que existe correlación (y muy alta en algunos
varias asignaturas.
REGRESIÓN
Anteriormente hemos visto los coeficientes de correlación, que indican el grado
o la cuantía en que varían conjuntamente dos mediciones o variables. El conocimiento
de la relación entre variables es algo más que un fin en si mismo; en algunas
ocasiones se quiere aprovechar el conocimiento de una relación entre variables como
punto de partida para realizar un pronóstico o predicción. Es decir, al conocer la
variable X y su relación con la variable Y, se trataría de averiguar en qué forma se
pueden considerar los valores particulares de la variable X y predecir a partir de ellos
los valores que corresponden en Y. El Análisis de Regresión es la técnica que
utilizamos para ello.
La regresión lineal estima los coeficientes de la ecuación lineal, con una
(regresión simple) o más (regresión múltiple) variables independientes, que mejor
prediga el valor de la variable dependiente. Tanto la variable dependiente como la/s
independiente/s deben ser continuas (en caso contrario se utilizaría Análisis de
Varianza). Por ejemplo, se puede intentar predecir el rendimiento de un alumno
(variable dependiente) a partir de su nivel de motivación, edad, o capacidad de
concentración (variables independientes).
Variables introducidas/eliminadasa
Variables Variables
Modelo introducidas eliminadas Método Esta tabla nos presenta las
1 Por variables que han sido incluidas
pasos
(criterio: en el modelo, y el orden de
Prob. de
Motivación F para inclusión de las mismas (como es
después del , entrar <=
programa ,050,
regresión simple, solo se incluye
Prob. de una variable)
F para
salir >=
,100).
a. Variable dependiente: Rendimiento en matemáticas
ANOVAb
Suma de Media
Modelo cuadrados gl cuadrática F Sig.
1 Regresión 52,352 1 52,352 15,707 ,000a
Residual 326,648 98 3,333
Total 379,000 99
a. Variables predictoras: (Constante), Motivación después del programa
b. Variable dependiente: Rendimiento en matemáticas
Coeficientesa
Coeficient
es
Coeficientes no estandari
estandarizados zados
Modelo B Error típ. Beta t Sig.
1 (Constante) 3,687 ,540 6,832 ,000
Motivación después
3,237E-02 ,008 ,372 3,963 ,000
del programa
a. Variable dependiente: Rendimiento en matemáticas
INTERPRETACIÓN DE RESULTADOS
Variables introducidas/eliminadasa
Variables Variables
Modelo introducidas eliminadas Método En esta primera tabla se presentan las
1 Por
pasos variables que han sido incluidas en el
(criterio:
modelo, y el orden de inclusión de las
Prob. de
F para mismas
Inteligencia
, entrar <=
general
,050,
Prob. de
F para
Tenemos dos modelos, el primero (1) con
salir >= la variable independiente Inteligencia
,100).
2 Por General y el segundo (2) con las variables
pasos independientes Inteligencia General +
(criterio:
Prob. de Motivación Después del Programa.
Motivación F para
después del , entrar <=
programa ,050,
Aunque habíamos seleccionado en primer
Prob. de
F para lugar la Motivación Después del Programa,
salir >=
,100). en el análisis ha entrado antes la
a. Variable dependiente: Rendimiento global Inteligencia General porque explica mayor
porcentaje de los cambios en la variable
Recordar que hemos elegido el método de Pasos Sucesivos que, frente al de
Introducir (que introduce todas las variables independientes a la vez), va
introduciéndolas una por una.
ANOVAc
Suma de Media
Modelo cuadrados gl cuadrática F Sig.
1 Regresión 78,405 1 78,405 93,130 ,000a
Residual 82,505 98 ,842
Total 160,910 99
2 Regresión 89,306 2 44,653 60,490 ,000b
Residual 71,604 97 ,738
Total 160,910 99
a. Variables predictoras: (Constante), Inteligencia general
b. Variables predictoras: (Constante), Inteligencia general, Motivación después del
programa
c. Variable dependiente: Rendimiento global
Coeficientesa
Coeficient
es
Coeficientes no estandari
estandarizados zados
Modelo B Error típ. Beta t Sig.
1 (Constante) -23,365 2,998 -7,795 ,000
Inteligencia general ,335 ,035 ,698 9,650 ,000
2 (Constante) -19,856 2,952 -6,727 ,000
Inteligencia general ,283 ,035 ,589 8,028 ,000
Motivación después
1,601E-02 ,004 ,282 3,843 ,000
del programa
a. Variable dependiente: Rendimiento global
En la última tabla aparecen las variables que han quedado excluidas del
análisis. La exclusión no tiene que deberse forzosamente a que la variable no sea
importante a la hora de explicar los cambios de la variable dependiente, simplemente
querrá decir que su aportación a la explicación de los cambios de la variable
dependiente ya está explicada por otras variables incluidas, y que su inclusión puede
resultar redundante. En este caso se ha excluido finalmente la Motivación Después del
Programa porque como puede verse en la tabla-resumen del modelo, su contribución
al Rendimiento Global es muy pequeña.
Variables excluidasb
Estadístic
os de
colinealid
Correlación ad
Modelo Beta dentro t Sig. parcial Tolerancia
1 Motivación después a
,282 3,843 ,000 ,363 ,851
del programa
a. Variables predictoras en el modelo: (Constante), Inteligencia general
b. Variable dependiente: Rendimiento global
ANÁLISIS FACTORIAL
El análisis factorial es una técnica estadística multivariada cuya finalidad
consiste en obtener un número reducido de variables abstractas, que están
compuestas por distintas cargas o saturaciones sobre variables empíricas, en función
de la estructura de los datos obtenidos al realizar el proceso de medida de dichas
variables empíricas. Como el número de factores que se obtienen al realizar un
análisis factorial es menor que el número de variables de las que partimos y contienen
la misma información, cada factor explica una conducta más compleja que la explicada
por las variables empíricas.
Para realizar un Análisis Factorial con SPSS, elegiremos en el menú- analizar,
la opción Reducción de datos- Análisis Factorial
En la opción método de
ROTACIÓN de los factores,
aparecen varios métodos, de
entre los que elegiremos el
Respecto a la EXTRACCIÓN
de los factores, el método de
Componentes Principales es
el que vamos a utilizar.
- La opción DESCRIPTIVOS nos permite especificar al programa si
queremos que en la salida aparezcan la solución inicial y estadísticos univariados,
así como lo que queremos que aparezca en la matriz de correlaciones
(coeficientes, niveles de significación, matriz inversa, reproducida o anti-imagen,
determinante y la prueba de Barlett) para elegir cualquiera de ellos, basta con
seleccionarlos ().
- La opción PUNTUACIONES, nos permite obtener las puntuaciones factoriales de
los sujetos, para ello, seleccionamos la opción y elegimos el método de Barlett. Las
puntuaciones factoriales de cada sujeto en cada factor aparecerán al final del
fichero de datos como nuevas variables con el nombre factnºdel factor_ nº de
análisis.
Interpretación de resultados
Comunalidades
Inicial Extracción
Edad 1.000 .486
Sexo 1.000 .503
Grupo 1.000 .765
Rendimiento global 1.000 .961
Rendimiento en historia 1.000 .634 La tabla de comunalidades nos
Rendimiento en filosofía 1.000 .687
Rendimiento en idioma 1.000 .783 indica cómo está representada cada
Rendimiento en una de las variables en la solución
1.000 .582
matemáticas
Rendimiento en dibujo 1.000 .536 factorial (utilizamos el criterio > 0,60
Estudios del padre 1.000 .646
para establecer que las variables
Profesión del padre 1.000 .785
Estudios de la madre 1.000 .636 están bien representadas en la
Profesión de la madre 1.000 .607
Nivel social familiar
solución factorial)
1.000 .728
Situación laboral del
1.000 .664
alumno
Interes profesional del
1.000 .687
alumno
Capacidad de
1.000 .859
concentración antes
Capacidad de
1.000 .881
concetración despues
Motivación antes del
1.000 .718
programa
Motivación después del
1.000 .805
programa
Método de extracción: Análisis de Componentes principales.
La tabla de Varianza total explicada nos informa del número total de factores
(componentes) extraídos, así como de la varianza explicada por cada factor en la
solución factorial, tanto antes como después de la rotación. En esta tabla podemos ver
cuáles son los factores significativos, que serán aquellos cuya varianza explicada
Varianza total explicada
Componente
1 2 3 4 5 6 7
Edad 3.784E-02 5.927E-02 -.241 .345 .376 -.391 9.626E-02
Sexo 4.277E-02 -4.54E-02 .232 .652 -8.01E-02 -7.49E-02 -8.94E-02
Grupo .343 -.127 .245 -.298 .680 -4.58E-02 .133
Rendimiento global .917 6.126E-02 -4.90E-02 -7.33E-03 -6.26E-02 .293 .158
Rendimiento en historia .727 -.173 .122 -.112 .176 9.478E-02 9.488E-02
Rendimiento en filosofía .816 -3.40E-02 -2.92E-02 -7.52E-02 9.493E-02 3.712E-02 -5.66E-02
Rendimiento en idioma 6.141E-02 4.061E-02 2.887E-02 3.964E-02 8.593E-02 .872 -8.57E-02
Rendimiento en
.500 .184 -7.57E-02 -5.88E-03 -.312 -.309 .315
matemáticas
Rendimiento en dibujo .540 .188 -.197 .146 -.267 .165 .225
Estudios del padre -5.95E-02 .785 -2.94E-02 -7.47E-02 -6.74E-02 -2.92E-02 -.123
Profesión del padre 8.774E-02 -.868 -9.35E-02 -9.55E-03 2.598E-02 -1.79E-02 -.119
Estudios de la madre -2.09E-02 4.817E-02 1.552E-02 .105 .118 .119 -.771
Profesión de la madre 1.363E-02 -8.66E-04 -2.01E-02 .356 .223 3.830E-02 .654
Nivel social familiar 7.748E-03 .846 -4.69E-02 -8.57E-02 1.712E-03 4.983E-02 -1.73E-02
Situación laboral del
2.918E-02 -.121 -.120 .774 -3.93E-02 7.180E-02 .170
alumno
Interes profesional del
-.371 -1.89E-02 -.128 1.848E-02 .697 .191 -9.38E-02
alumno
Capacidad de
-5.43E-02 4.100E-02 .898 9.690E-02 -.151 8.297E-02 -9.63E-02
concentración antes
Capacidad de
-6.32E-03 -1.69E-02 .924 -1.98E-02 .157 3.656E-03 5.527E-02
concetración despues
Motivación antes del
.698 -.164 -3.01E-02 .224 -.122 -.312 -.202
programa
Motivación después del
.765 -.129 3.363E-03 .197 -.133 -.347 -.158
programa
MétodoAdepartir de los
extracción: pesos
Análisis significativos
de componentes de las variables en los factores, iríamos
principales.
Método de rotación: Normalización Varimax con Kaiser.
dando larotación
a. La naturaleza al factor,
ha convergido es decir, poniéndole nombre. En este análisis se ha
en 9 iteraciones.
PUNTUACIONES FACTORIALES
En caso de haber solicitado al programa las puntuaciones de cada sujeto en
cada factor, al final del fichero de datos aparecerán unas variables nuevas, con el
aspecto que se muestra a continuación:
ANÁLISIS DE COVARIANZA
Interpretación de resultados
De la tabla podemos deducir una serie de conclusiones (tantas como pruebas de
significatividad realizadas) que se presentan a continuación:
5. Modelo corregido Se pone a prueba la existencia de diferencias estadísticamente
significativas en el Rendimiento Global obtenido por los alumnos en función del
Grupo al que pertenecen, controlando el efecto que pueda ejercer el Nivel Social
Familiar. La probabilidad asociada al estadístico F calculado es de 0,000 al ser un
valor menor que (0,05), rechazamos H0 y afirmamos que existen
6. diferencias en el Rendimiento Global obtenido por los alumnos en función
del Grupo al que pertenecen, controlando el efecto que pueda ejercer el Nivel
Social Familiar
7. Intersección En este caso se pretende comprobar la existencia de diferencias
estadísticamente significativas en el Rendimiento Global de los alumnos,
provocadas por la acción conjunta de las variables Grupo de Clase y Nivel Social
Familiar. En este caso, la probabilidad asociada a F es también de 0,000, y al ser
menor que (0,05), se rechaza H0, por lo que se confirma la existencia de
diferencias estadísticamente significativas en el Rendimiento Global de los
alumnos, provocadas por la acción conjunta de las variables Grupo de Clase
y Nivel Social Familiar
8. Por último se hace un ANOVA con cada una de las variables independientes
utilizadas. En el primer caso (para la Variable Nivel Social Familiar) se acepta la H0
al ser la probabilidad asociada a F mayor que (0,05) (para Nivel Social Familiar
la probabilidad asociada a F es de 0,533), por lo que no hay diferencias
estadísticamente significativas en el Rendimiento Global de los alumnos en
función del Nivel Social Familiar.
9. En el segundo caso se rechaza la H0 al ser la probabilidad asociada a F menor
que (0,05) (para Grupo de Clase la probabilidad asociada a F es de 0,000), por
lo que hay diferencias estadísticamente significativas en el Rendimiento
Global de los alumnos en función del Grupo de clase al que pertenecen.
ANÁLISIS DE ÍTEMS: ITEMAN
EL FICHERO DE DATOS
El programa ITEMAN funciona bajo MS-DOS, por lo que los datos deben
introducirse con formato ASCII (texto), por ejemplo desde el editor del DOS,
Word Pad o Bloc de Notas de Windows. El fichero de datos va a tener un
aspecto similar al siguiente:
Las cuatro primeras líneas del fichero de datos son fundamentales y debe
extremarse la atención al escribirlas, que cualquier error en ellas (un espacio
de más o de menos, un punto, etc.) puede hacer que el programa no se ejecute
o lo haga de forma incorrecta.
La primera línea está formada por 10 columnas que indican lo siguiente:
Columnas 1 a 3 Número de ítems de que consta el test (máximo
250 ítems). En el ejemplo anterior, el test consta de 80 ítems, observar
que la primera columna queda en blanco, hubiera sido igual poner 035,
pero siempre respetando las tres columnas.
Columna 4 Espacio en blanco.
Columna 5 Código para las respuestas omitidas (en el Fichero del
ejemplo, el 9 es el valor que se asigna a los ítems no contestados).
Columna 6 Espacio en blanco
Columna 7 Código para los ítems no alcanzados. Especialmente
importante cuando se trata de test de velocidad, es el valor que se asigna a
los ítems que no han sido alcanzados por el alumno por falta de tiempo (en el
Fichero del ejemplo, el 8 es el valor que se asigna a estos ítems, pero no
aparece ninguno porque no se trata de una prueba de velocidad).
Columna 8 Espacio en blanco
Columnas 9 y 10 Número de caracteres utilizados para identificar a
los sujetos. En el fichero de ejemplo se especifica un 3 porque se utilizan las
dos primeras para enumerar del 1 al 50 y una más de separación entre la
identificación y los datos, total, 3 columnas.
En la segunda línea se especifica la clave de corrección, la alternativa correcta
de cada ítem. Debe haber tantos dígitos como ítems.
En la tercera línea se indica el número de alternativas que hay para cada uno
de los ítems del test. En el fichero del ejemplo cada ítem tiene 4 alternativas
En la cuarta línea se especifican los ítems que entran en el análisis. Y significa
que el ítem se analizará; N significa que no se analizará. Debe haber tantos Y/N
cono ítems en el test. En el fichero de ejemplo se pide el análisis de los 80 ítems.
A partir de la quinta línea se empiezan a escribir los datos.
EJECUCIÓN DE ITEMAN
Acceder al programa Inicio - Programas - ITEMAN
Lo primero que pide el programa es el fichero de los datos. Se escribe el nombre
del fichero de datos (por ejemplo a:datos.txt) y se pulsa INTRO
ITEMAN pregunta si se quiere un fichero con los estadísticos (Do you wnat to write
statistics to a external file?). En este caso, diremos al programa que NO, pero si se
quieren, el programa pide que se le especifique el nombre (por ejemplo a:estadis)
Al pulsar INTRO, sale una pantalla en la que hay que especificar las opciones de
configuración del análisis. En nuestro caso vienen señaladas por defecto, así que
simplemente pulsamos Continuar (INTRO)
Una vez terminado el análisis, aparece una barra roja que dice ***ITEM ANALYSIS
COMPLETE***. Para ver los resultados, puede pulsarse directamente F2 para
acceder al editor de ITEMAN o abrir el archivo desde el Word Pad
LOS RESULTADOS
EN la salida encontramos, en primer ligar, información referida al programa
(versión, año, etc.). A continuación los detalles específicos del análisis:
******************** ANALYSIS SUMMARY INFORMATION ********************
Scale: 0
-------
Type of Scale DICHOT
N of Items 80
N of Examinees 50