Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Manualspss
Manualspss
Los resultados de 18 estudiantes en un test sobre hbitos de estudio han sido los siguientes:
154, 109, 138, 115, 154 , 140, 154, 178, 101, 103, 126, 127, 137, 165, 165, 129, 200, 148.
calcula la media, la moda, la mediana. Haz el grfico de cajas.
El nmero de horas de sol registradas en el mes de enero en 49 Estaciones meteorolgicas ha
sido: 83, 82, 78,72, 107, 107, 93, 72, 85, 98, 71, 76, 83, 72, 126, 102, 70, 112, 99, 155, 118,
150, 129, 119, 148, 181, 151, 167, 156, 180, 173, 149, 80, 131, 121, 110, 200, 162, 214, 176,
186, 187, 186, 141, 212, 186, 199, 198, 219.Forma una tabla de intervalos de amplitud 20
tomando 70 como extremo inferior del primer intervalo y determina media, mediana e intervalo
modal. Haz el histograma y el diagrama de cajas
A un grupo de 10 estudiantes se les hizo una prueba de razonamiento y otra de habilidad.
Calcular en qu prueba hubo mayor variabilidad de resultados, sabiendo que stos fueron:
Razonamiento: 40, 38, 65, 56, 16, 55, 28, 62, 32, 48
Habilidad:
36, 18, 54, 47, 21, 56, 68, 70, 72, 38.
Indicacin: comparar los coeficientes de variacin.,
Regresin lineal
Hacer las siguientes ejercicios, primero "a mano" y luego usando el SPSS.
El nmero de horas de estudio de una asignatura y la calificacin obtenida en el examen
correspondiente fue para siete personas, la siguiente:
Horas
5
8
10
12
15
17
18
Calificacin
3
6
5
6
9
7
9
Dibuja la nube de puntos y traza, aproximadamente, la recta de regresin asociada.
La tabla siguiente muestra para los aos que se indican, la natalidad por cada 1000
habitantes de una ciudad espaola.
Aos
1986 1987 1988 1989 1990 1991
Natalidad
21
21
20
18
16
15
Los aos se pueden poner como 1,2,3,4,5,6(para hacerlo a mano simplifica clculos)
Calcula: el coeficiente de correlacin y la ecuacin de la recta de regresin
Dibuja la nube de puntos
En la siguiente tabla aparece la evolucin del rcord del mundo de salto de longitud
masculina, en metros
Aos 1901 1921 1925 1931 1935 1961 1962 1968 1991
Marca 7,61 7,69 7,89 8,13 8,28 8,31 8,35 8,90 8,95
Los aos para hacerlo a mano se pueden poner: 1, 21,25,31,61,62,68 y 91
a) representa la nube de puntos asociada a estos datos
b) Calcula: el coeficiente de correlacin y la ecuacin de la recta de regresin
Instrucciones para hacer el primer ejercicio de regresin lineal con SPSS.
recuento de los datos del estudio) y las frecuencias esperadas (las que se deberan obtener si las
variables no estuvieran asociadas). La salida que se obtiene al pedir una chi cuadrado muestra el valor
del estadstico, los grados de libertad de la tabla (gl) , el nivel de significacin (Sig. Asinttica) que
equivale a la probabilidad de equivocarnos al rechazar la hiptesis nula que afirma que las variables son
independientes.
Conviene que antes de realizar el test fijemos el nivel de confianza que estimamos necesario para que
los resultados sean aceptables, por ejemplo:O,05 0,01. Estos valores no se introducen en el SPSS,
sirven para comparar con la significacin que calcula el SPSS a partir de nuestros datos. Si el nivel
prefijado es 0,05 y la significacin que obtiene el SPSS es menor que 0,05 habr que rechazar la
Hiptesis nula (la que afirma que las variables son independientes)
Significacin < 0,05 rechazamos H0 y concluiremos que las variables son dependientes entre s
Significacin > 0,05 aceptamos H0 y concluiremos que las variables son independientes entre s
Con podemos conocer si dos variables estn asociadas estadsticamente o no. Pero si el resultado
es afirmativo, no se conoce la fuerza de la asociacin. Para saber si la asociacin es fuerte o dbil se
emplean otros estadsticos.
Buscaremos parejas de variables para las que 2 confirme que son dependientes. ( estupa = Nivel de
estudios de los padres y nivsoc = Nivel socioeconmico familiar)
2
Para variables medidas en escala nominal:PHI es el coeficiente adecuado para tablas 2x2. V de
Cramer Es adecuado para tablas de dimensiones mayores, el coeficiente de contingencia: tiene la
pega de que no llega a valer 1
Los coeficientes anteriores son medidas simtricas de la fuerza de la asociacin y se interpretan
como el coeficiente de correlacin de Pearson R
La R de Pearson se usa para variables continuas (de intervalo) toma valores en el intervalo [-1,1]
Adems R2 mide la capacidad de la variable independiente para predecir la dependiente (cociente entre
la varianza explicada y la varianza total)
La RHO de Sperman solo debe aplicarse cuando las dos variables a comparar son ordinales y pueden
tomar muchos valores diferentes, mientras que las Tau-b, Tau-c y Gamma son mas adecuadas para
variables con pocas categoras. Estas variables son dependientes del tamao de la tabla, por lo que no
sirven para comparar tablas de distintas dimensiones.
La d de Sommer es una medida de asociacin asimtrica que indica la proporcin en que se reduce el
error al pronosticar una variable en funcin de la otra.
Hay pues dos tipos de medidas de asociacin : las simtricas y las asimtricas. Las simtricas se
interpretan como ndices del grado de asociacin entre dos variables, pero sin supeditar la una a la otra,
mientras que las asimtricas dan una medida del grado en que se reduce el error cuando se predice una
variable a partir de la otra. En este caso el/a investigador/a definir previamente cual es la variable
independiente (predictora) y cual es la variable dependiente (criterio)
RECODIFICACIN DE VARIABLES
Toda variable de intervalo se puede recodificar para ser transformada en variable ordinal.
Para trabajar con tablas de contingencia, a veces es interesante que los valores de las variables se
agrupen en pocas categoras. Para que un test de 2 sea vlido no debera haber celdas vacas y no
ms del 20% de las celdas deben tener una frecuencia menor o inferior a 5. Este problema se puede
resolver disminuyendo el nmero de categoras en los resultados de las variables o aumentando el
tamao de la muestra.
Vamos a ver cmo se recodifica una variable.
Veamos el caso concreto de la variable PAGA. Ya hemos podido comprobar que las pagas de las
personas de nuestra encuesta varan entre 6 y 30. Vamos a definir una nueva variable PAGA2 en la que
los resultados solamente sean 1, 2 o 3 (poco, regular y mucho). Haremos que los que tiene una paga
entre 6 y 14 en PAGA2 tengan un 1 y le pondremos una etiqueta de poco, los que tengan una paga
entre 15 y 23 en PAGA2 tengan asignado un 2 y le pondremos una etiqueta de regular y los que tiene
una PAGA 24 a 30, en PAGA2, les asignaremos un 3 y una etiqueta de mucho.
Los pasos a realizar son:
Con el fichero de datos cargado elegiremos en el men superior la opcin
TRANSFORMAR RECODIFICAR en distintas variables
Es importante NO elegir en la misma variable, pues en ese caso se pierde la informacin anterior y solo
nos quedamos con los valores de las tres categoras que vamos a definir, pero perderamos el valor de la
paga real.
Nos aparecer un rectngulo a la izquierda con la lista de todas las variables de nuestro fichero de datos,
pasaremos al rectngulo de la derecha las variables que vamos a recodificar, en este caso PAGA. En el
rectngulo Variable Resultado Nombre pondremos PAGA2, pulsaremos en el botn cambiar y en la
etiqueta pondremos PAGA CODIFICADA EN 3 NIVELES, pulsamos en valores antiguos y nuevos y en
RANGO pondremos de 6 hasta 14 valor nuevo 1 (aadir); de 15 hasta 23 valor nuevo 2 (aadir); de 24
hasta 30 valor nuevo 3 (aadir) y aceptar.
Al final de la lista de variables tiene que aparecer la nueva variable PAGA2 que acabamos de definir. En
la columna VALORES de esa nueva variable pincharemos para definir las etiquetas:
Valor 1 etiqueta valor poco (AADIR); VALOR 2, etiqueta valor regular (AADIR); VALOR 3, etiqueta
valor mucho (AADIR) Y ACEPTAR.
Para estar seguros de que todo ha ido bien podemos ver la distribucin de frecuencias de la nueva
variable PAGA2, en el men superior ANALIZAR ESTADISTICOS DESCRIPTIVOS FRECUENCIAS
Variables adecuadas para recodificar y alguna sugerencia para ello:
Nmero de hermanos: podemos hacer 3 grupos : pocos para 1 y 2, regular para 3 y 4, y muchos para
5,6 o 6.
En edad tambin 3 grupos el primero de 12 a 14, el segundo de 15 a 17 y el tercero de 18 a 20
Rendimiento escolar: recodificar a suspenso, aprobado, notable y sobresaliente.
Verbal hacer otra 3 categoras (18-26)(27-35)(36-45)
Libros ( de 2 a 6, de 7 a 12 y de 13 a 24)
Buscar los valores mximos y mnimos de CINE , TEATRO , CONCIERT Y tv y recodificarlas a 2 o tres
categoras. Dejar NIVSOC en solo 3 categoras: bajo, medio y alto.
Despus de las recodificaciones anteriores buscar entre todas las variables disponibles parejas de
variables que resulten ser independientes, o dependientes entre s y anotar cuales son. En las
dependientes estudiar adecuadamente la fuerza de la asociacin .
Comparacin de Medias
Este anlisis tiene como objetivo comparar si la media es significativamente diferente en diversas
variables o en distintos subgrupos de la misma variable .
El ms sencillo es el test de la t .
Para realizar estos anlisis se elige: Analizar -> comparar medias y las posibles opciones son: Medias,
Pruebas T para una muestra, Pruebas T para muestras independientes, pruebas T para muestras
relacionadas y Anova de un factor.
La primera opcin (Medias) nos permite una variable dependiente (por ejemplo paga semanal) y una
variable dependiente que haga subgrupos en la poblacin total, por ejemplo Nivel socioeconmico. Y da
la media y la desviacin tpica de las variables elegidas, en los subgrupos creados por el Nivel
socioeconmico y en la poblacin completa. As pues el procedimiento Medias calcula medias de
subgrupo y estadsticos univariados relacionados para variables dependientes dentro de las categoras
de una o ms variables independientes.
La segunda , El procedimiento Prueba T para una muestra contrasta si la media de una sola variable
difiere de una constante especificada por el investigador. Recordar que la decisin de aceptar la
Hiptesis nula (No hay diferencias significativas) se toma en funcin del nmero que aparece en la
casilla que da la significacin. Si el nmero de esa casilla es menor que el nivel mnimo aceptable
prefijado (por ejemplo: 0,05 o 0,01)se rechaza la H 0 y en caso contrario de acepta. Tambin nos da
este procedimiento un intervalo de confianza para la diferencia entre la media y el valor elegido por
nosotros.
El procedimiento Prueba T para muestras independientes compara las medias de dos grupos de
casos. Para esta prueba, idealmente los sujetos deben asignarse aleatoriamente a dos grupos, de forma
que cualquier diferencia en la respuesta sea debida al tratamiento (o falta de tratamiento) y no a otros
factores. Este caso no ocurre si se comparan los ingresos medios para hombres y mujeres. El sexo de
una persona no se asigna aleatoriamente. En estas situaciones, debe asegurarse de que las diferencias
en otros factores no enmascaren o resalten una diferencia significativa entre las medias. Las diferencias
de ingresos medios pueden estar sometidas a la influencia de factores como los estudios y no solamente
el sexo. Lo que decide si hay que considerar igual varianza lo da el nmero que aparece bajo Sig
(detrs de F). Lo que decide si los subgrupos tienen media significativamente distinta es el nmero que
aparece bajo Sig. Bilateral. La interpretacin de estos nmeros es la ya explicada previamente.
El procedimiento Prueba T para muestras relacionadas compara las medias de dos variables de un
solo grupo. Calcula las diferencias entre los valores de las dos variables de cada caso y contrasta si la
media difiere de 0. Es lgico elegir variables cuya media sea similar, en caso contrario carece de sentido
realizar esta prueba.
El procedimiento ANOVA de un factor genera un anlisis de varianza de un factor para una variable
dependiente cuantitativa respecto a una nica variable de factor (la variable independiente). El anlisis
de varianza se utiliza para contrastar la hiptesis de que varias medias son iguales. Esta tcnica es una
extensin de la prueba t para dos muestras, la diferencia es que ahora los grupos pueden ser mas de
dos. Pero la variable que hace los grupos (el factor) debe estar definida al menos como ordinal.
Definir conjuntos: permite seleccionar las variables que se van a usar en el estudio
En primer lugar hay que dar nombre al conjunto y despus llevar del rectngulo de la izquierda
al de la derecha que est bajo el ttulo Variables del conjunto, las variables que nos interesen.
Pulsar aadir conjunto y cerrar.
La opcin usar conjunto nos permite usar los conjuntos definidos previamente. Para ello hay
que llevar el conjunto de inters al rectngulo conjuntos en uso. Si dejamos en el rectngulo
conjuntos en uso Allvariables, se usarn todas las variables y no ser efectiva la seleccin
efectuada en los conjuntos definidos previamente.
Se recomienda estudiar individualmente y por parejas las variables de la encuesta que se
piense pueden resultar interesantes para una investigacin sobre "EMIGRACIN" e ir
tomando notas de los resultados obtenidos.
Intervalos de confianza para la media
Analizar -> estadsticos descriptivos -> explorar
Llevar las variables de las que queremos conocer el intervalo de confianza al rectngulo
"Dependientes" (por ejemplo "simpata norte- africanos")
En estadsticos sealar descriptivos y el nivel de confianza se puede dejar al 95% o cambiarlo.
Si se desea tener un intervalo de confianza para los hombres y otro para las mujeres habr que
llevar la variable sexo al rectngulo "Factores"