Está en la página 1de 70

PRÁCTICA 1: EJEMPLO DE ENCUESTA

Para realizar esta práctica hemos abierto el programa SPSS y


hemos introducido los datos que se nos solicitaban. Para ello, hemos
abierto el archivo de datos “encuesta”; a continuación mostramos el
archivo de datos “encuesta”:

1. Calcular una nueva variable que indique la altura en metros de


cada sujeto.
Para calcular lo que se nos pide en el enunciado seguiremos el
procedimiento siguiente: primero seleccionamos en la barra de
herramientas del SPSS la opción transformar, calcular

1
Una vez abierto el cuadro de diálogo calcular variable, creamos la
nueva variable de destino “alturam”; a continuación introducimos la
altura en centímetros en expresión numérica y /100; nos quedaría
esta expresión: “altura / 100”, aceptamos. Nos quedaría así:

Antes de acabar debemos comprobar que las columnas de la vista


de variables estén correctas. Debemos fijarnos sobretodo en la anchura
de la variable, en los decimales y en la medida. Como hemos creado una
nueva variable, hay que cambiar la anchura de la misma a 4 y
determinar cómo se mide la nueva variable; en este caso, como es una
variable cuantitativa pondremos que la medida es escala.

2. Calcular una nueva variable que indique el porcentaje de masa


corporal de cada sujeto - peso(kg)/altura(cm)*100 .
Para realizar este cálculo realizaremos el mismo procedimiento
que en el ejercicio anterior. Primero seleccionamos de la barra de tareas
la opción transformar, calcular.

Abierto el cuadro de diálogo creamos la nueva variable destino


“masa” y añadimos en expresión numérica las variables peso en kg. /
altura en cm. * 100. Quedaría así:
2
Igual que antes tenemos que corregir los datos que por defecto
nos aparecen en la vista de variables; la anchura la cambiaremos a 5,
porque contamos los números y el decimal. En medida hay que poner
que es escala porque es una variable cuantitativa.

3. Recodificar en la misma variable las puntuaciones de la prueba


de segundos transcurridos como acierto/error. Considerar hasta 15
segundos como acierto y el resto error.
Para realizar el siguiente ejercicio lo primero que debemos hacer
es cambiar la etiqueta de valor de la variable “segundos transcurridos”,
asignando el acierto como 1 y el error como 2. Esto quedaría de la
siguiente forma:

A continuación tenemos que seleccionar la opción: Transformar,


recodificar en misma variable.

3
Una vez tenemos hecho esto nos aparece el siguiente cuadro de
diálogo:

Como vemos hemos añadido en variables numéricas “segundos


transcurridos”; seguidamente debemos pinchar en valores antiguos y
nuevos para determinar el criterio a seguir.

4
Aquí consideramos de 0 a 15 como acierto y le asignamos el valor
nuevo 1; a todos los demás valores le asignamos un 2.
De esta forma cuando nos vamos a la vista de datos, en lugar de
aparecer los segundos nos aparecerá un 1 o un 2, dependiendo de la
respuesta que se haya dado.

4. Recodificar en una variable nueva los valores obtenidos para


metros cuadrados de aula, considerando las categorías siguientes:
pequeña, menos de 100 metros; normal, entre 100 y 150 metros y
grande, mas de 150 metros.

En este ejercicio se nos pide algo diferente al ejercicio anterior; se


nos pide que creemos una nueva variable. Lo que tenemos que hacer es
ir a transformar, recodificar en distintas variables, añadir la variable
superficie y en variable de resultado poner el nombre de la nueva
variable que vamos a crear, en este caso, aula2. Podemos cambiar aquí
el nombre de la etiqueta o bien hacerlo después en la vista de variables.

Una vez realizado esto volvemos a ir a valores antiguos y


nuevos.

5
5. ¿Cuántos alumnos y porcentaje, creen que deben subir 40 o más
escalones?. Comenta los estadísticos utilizados.

Para realizar este ejercicio debemos pedir una tabla de


frecuencias ya que queremos saber el número de alumnos que creen
que suben 40 escalones o más. Para pedir la tabla de frecuencias nos
vamos al menú: analizar, estadísticos descriptivos, frecuencias.

Una vez realizado esto obtenemos la siguiente tabla:

6
N. escalones?

Porcentaje Porcentaje
Frecuencia Porcentaje válido acumulado
Válidos 26 2 2,8 2,8 2,8
30 7 9,9 9,9 12,7
32 6 8,5 8,5 21,1
35 2 2,8 2,8 23,9
36 2 2,8 2,8 26,8
37 1 1,4 1,4 28,2
38 1 1,4 1,4 29,6
40 30 42,3 42,3 71,8
45 1 1,4 1,4 73,2
46 2 2,8 2,8 76,1
48 3 4,2 4,2 80,3
50 6 8,5 8,5 88,7
52 1 1,4 1,4 90,1
Estadísticos
60 5 7,0 7,0 97,2
N. escalones? 70 1 1,4 1,4 98,6
N Válidos 71 90 1 1,4 1,4 100,0
Perdidos 0 Total 71 100,0 100,0

Como se nos pide el número y el porcentaje de sólo los que suben


40 o más debemos desechar los casos que no cumplen el criterio.
Esto es así:

N. escalones?

Porcentaje
Frecuencia válido
Válidos 40 30 42,3
45 1 1,4
46 2 2,8
48 3 4,2
50 6 8,5
52 1 1,4
60 5 7,0
70 1 1,4
90 1 1,4
Total 50 70,4

Viendo las frecuencias podemos decir que hay 50 (sumamos todas


las frecuencias) que creen subir 40 o más escalones. El porcentaje que
representan es el 70,4%.

7
6. Obtener los descriptivos –indicadores y gráficos- mas adecuados
para la variable porcentaje de masa corporal. Comenta los
estadísticos utilizados.

El primer paso que debemos realizar es identificar el tipo de


variable con la que estamos trabajando; como es una variable
cuantitativa podemos pedirle todos los indicadores.
Vamos a calcular: los valores extremos (mínimo y máximo), la
media, la desviación típica, la curtosis y la asimetría. El gráfico que
utilizamos para esta variable cuantitativa que es masa corporal es el
histograma.
El procedimiento a seguir es el siguiente: analizar, estadísticos
descriptivos: opciones.

El grafico lo pedimos de la siguiente forma: gráficos, histograma


y añadimos la variable porcentaje de masa corporal.

8
Realizado esto obtenemos las siguientes tablas de resultados:

Estadísticos descriptivos

N Mínimo Máximo Media Desv. típ. Asimetría Curtosis


Estadístico Estadístico Estadístico Estadístico Estadístico Estadístico Error típico Estadístico Error típico
porcentaje de masa
71 26,67 47,02 34,2912 3,88499 ,724 ,285 ,804 ,563
corporal
N válido (según lista) 71

16

14

12

10

Desv. típ. = 3,88


2
Media = 34,3
0 N = 71,00

porcentaje de masa corporal

Con los resultados obtenidos podemos decir que, en cuanto a la


tendencia central, la media del porcentaje de masa corporal de los
alumnos es de 34,29, por lo que deducimos que la mayoría de alumnos
se concentran en torno a ese valor.

9
En cuanto a la variabilidad podemos decir que los datos no están
muy dispersos, se concentran en torno a la media. Posee una amplitud
de 20,35.
Para finalizar si hablamos de la forma de la distribución podemos
señalar que muestra una distribución asimétrica positiva, ya que la
mayoría de las puntuaciones se concentran en la parte izquierda de la
gráfica y se dispersan más por la derecha. Además esto se ve reforzado
por el resultado de la tabla, que nos dice que la simetría es 0,724. La
curtosis, cuyo resultado es 0,804, muestra una distribución
leptocúrtica (relativamente alta y estrecha).

7. Obtener los descriptivos –indicadores y gráficos- más adecuados


para la variable 15, comparando entre hombres y mujeres. Comenta
los estadísticos utilizados.

Este ejercicio nos pide que comparemos la variable nota final de


la asignatura para hombres y mujeres; por eso el primero paso que
debemos realizar es segmentar el archivo, comparar los grupos.

Una vez segmentado el archivo nos vamos a menú: analizar,


estadísticos descriptivos, frecuencias, descriptivos y solicitamos la
moda, la mediana, la amplitud, el mínimo y el máximo. Los resultados
que obtenemos son:
10
Estadísticos

Nota final asignatura?


Hombre N Válidos 27
Perdidos 0
Mediana 2,00
Moda 2
Rango 3
Mínimo 1
Máximo 4
Mujer N Válidos 44
Perdidos 0
Mediana 2,00
Moda 2
Rango 4
Mínimo 1
Máximo 5

Nota final asignatura?

Porcentaje Porcentaje
Sexo del encuestado? Frecuencia Porcentaje válido acumulado
Hombre Válidos Suspenso 4 14,8 14,8 14,8
Aprobado 16 59,3 59,3 74,1
Notable 6 22,2 22,2 96,3
Sobresaliente 1 3,7 3,7 100,0
Total 27 100,0 100,0
Mujer Válidos Suspenso 2 4,5 4,5 4,5
Aprobado 34 77,3 77,3 81,8
Notable 7 15,9 15,9 97,7
Matricula 1 2,3 2,3 100,0
Total 44 100,0 100,0

El gráfico que solicitamos es el diagrama de barras puesto que es


el más indicado para variables cuasi-cuantitativas.

11
Nota final asignatura? Nota final asignatura?
SEXO: 1 Hombre SEXO: 2 Mujer
20 40

30

10 20

Frecuencia
Frecuencia

10

0 0
Suspenso Aprobado Notable Sobresaliente Suspenso Aprobado Notable Matricula

Nota final asignatura? Nota final asignatura?

Vemos que en ambos casos coinciden la moda y la mediana.


Observando las gráficas vemos que los hombres suspenden más que las
mujeres pero tienen más notables. Las mujeres no obtienen
sobresalientes pero es porque obtienen matrícula, mientras que los
hombres sólo obtienen sobresalientes.

12
PRÁCTICA 2: ANÁLISIS EXPLORATORIO DE DATOS

1. Solicitar el gráfico de tallo y hojas para la variable Metros


cuadrados del aula.

Para realizar este ejercicio debemos seguir los pasos que exponemos
a continuación : seleccionar analizar, estadísticos descriptivos y
explorar.

Como el ejercicio nos pide que hallemos el gráfico para la variable


“metros cuadrados del aula”, es ésta la que debemos introducir en
“dependientes”. A continuación, en gráficos, seleccionamos sólo el
diagrama de tallo y hojas, puesto que no se nos pide ningún otro más.
Quedaría así:

13
Los resultados que se obtiene tras aplicar lo anteriormente citado
son los siguientes:

Resumen del procesamiento de los casos

Casos
Válidos Perdidos Total
N Porcentaje N Porcentaje N Porcentaje
Metros cuadrados
71 100,0% 0 ,0% 71 100,0%
del aula?

14
Descriptivos

Estadístico Error típ.


Metros cuadrados Media 124,38 9,305
del aula? Intervalo de confianza Límite inferior 105,82
para la media al 95% Límite superior
142,94

Media recortada al 5% 116,69


Mediana 110,00
Varianza 6147,868
Desv. típ. 78,408
Mínimo 30
Máximo 400
Rango 370
Amplitud intercuartil 80,00
Asimetría 1,582 ,285
Curtosis 3,078 ,563

Metros cuadrados del aula? Stem-and-Leaf Plot


Frequency Stem & Leaf
6,00 0 . 333344
23,00 0 . 55556666666777777777899
20,00 1 . 00001111222233344444
11,00 1 . 55555555558
5,00 2 . 00034
2,00 2 . 55
4,00 Extremes (>=300)
Stem width: 100
Each leaf: 1 case(s)

Al mirar el gráfico, podemos fijarnos en la simetría, la curtosis, etc.


de la variable, y podemos deducir que existe una distribución
leptocúrtica, puesto que la distribución de resultados es muy alta
alrededor de la media y menor cuanto más se aleja de ella. También
podemos observar la distribución, que presenta cierta asimetría, y
puesto que está algo más desplazada hacia la izquierda podríamos decir
que se trata de una asimetría positiva.

15
2. Solicitar el diagrama de cajas de la variable peso en Kilogramos

En este ejercicio hemos de ir también al menú analizar,


estadísticos descriptivos, explorar, seleccionando la variable “peso
en kilogramos”, y en lugar de solicitar el grafico de Tallo y hojas,
desactivamos dicha opción y activamos la opción de Diagramas de
cajas, y obtenemos estos resultados:

Resumen del procesamiento de los casos

Casos
Válidos Perdidos Total
N Porcentaje N Porcentaje N Porcentaje
Peso en kg 71 100.0% 0 .0% 71 100.0%

Descriptivos

Estadístico Error típ.


Peso en kg Media 57,35 ,900
Intervalo de confianza Límite inferior 55,56
para la media al 95% Límite superior
59,15

Media recortada al 5% 56,98


Mediana 56,00
Varianza 57,460
Desv. típ. 7,580
Mínimo 44
Máximo 79
Rango 35
Amplitud intercuartil 9,00
Asimetría ,752 ,285
Curtosis ,644 ,563

90

80
60
66
40
5

70

60

50

40
N= 71

Peso en kg
16
La caja representa los casos más cercanos a la media. La línea de
dentro de la caja representa la mediana, que en este caso, parece
coincidir o se acerca mucho a la media. El ancho de la caja determina el
apuntamiento de la variable, podemos afirmar que hay una
distribución mesocúrtica, ya que los casos se muestran agrupados y el
ancho de la caja no es excesivo.

En referencia a los bigotes que acompañan a la caja, podemos


decir que representan la asimetría de la variable, que se mide con la
distancia entre el bigote superior y la mediana y viceversa. En este caso
es mucho más larga la distancia entre la mediana y el bigote superior,
por lo que tenemos que decir que existe una asimetría positiva.

3. Solicitar el gráfico de tallo y hojas y el diagrama de cajas de la


variable altura en centímetros comparándola para ambos sexos.
Interpreta y razón los resultados para la tendencia central,
variabilidad, forma de la curva y/o valores extremos.

Puesto que se nos pide que comparemos dos grupos, lo primero


que debemos hacer es segmentar el archivo. Para ello nos vamos al
menú datos, segmentar archivo, comparar casos. Introducimos la
variable “sexo” para que fragmente el archivo según este criterio.

17
Una vez segmentado el archivo, nos vamos al menú analizar,
estadísticos descriptivos, explorar e introducimos la variable “altura
en centímetros” como dependiente.

Pulsamos seguidamente en gráficos y seleccionamos los gráficos


de tallo y hojas y el diagrama de cajas.

Obtenemos las siguientes tablas:


Resumen del procesamiento de los casos

Sexo del encuestado? Casos


Válidos Perdidos Total
N Porcentaje N Porcentaje N Porcentaje
Altura Hombre
en cm. 27 100,0% 0 ,0% 27 100,0%

Mujer 44 100,0% 0 ,0% 44 100,0%

18
Descriptivos

Sexo del encuestado? Estadístico Error típ.


Altura en cm. Hombre Media 170,78 1,101
Intervalo de confianza para la media Límite
168,52
al 95% inferior
Límite
superior 173,04

Media recortada al 5% 170,86


Mediana 170,00
Varianza 32,718
Desv. típ. 5,720
Mínimo 160
Máximo 180
Rango 20
Amplitud intercuartil 9,00
Asimetría -,055 ,448
Curtosis -,783 ,872
Mujer Media 164,66 ,668
Intervalo de confianza para la media Límite
163,31
al 95% inferior
Límite
superior 166,01

Media recortada al 5% 164,68


Mediana 165,00
Varianza 19,625
Desv. típ. 4,430
Mínimo 155
Máximo 173
Rango 18
Amplitud intercuartil 7,00
Asimetría -,154 ,357
Curtosis -,573 ,702

El gráfico de tallo y hojas queda así:


Altura en cm. Stem-and-Leaf Plot for
SEXO= Hombre

Frequency Stem & Leaf

2,00 16 . 00
10,00 16 . 5555778889
7,00 17 . 0012234
6,00 17 . 567888
2,00 18 . 00

Stem width: 10
Each leaf: 1 case(s)

Altura en cm. Stem-and-Leaf Plot for


SEXO= Mujer
19
Frequency Stem & Leaf

,00 15 .
5,00 15 . 57789
12,00 16 . 000001112333
20,00 16 . 55555556666777788888
7,00 17 . 0000233

Stem width: 10
Each leaf: 1 case(s)

El diagrama de cajas se nos quedaría de la siguiente forma:

190

180

170
Altura en cm.

160

150
N = 27 44

Hombre Mujer

Sexo del encuestado?

Después de observar los diagramas, tanto el de tallo y hojas como


el de cajas y bigotes, se observa que hay una diferencia en las medias,
puesto que la de los chicos es 170,78 y la de las chicas es 164,66.
Dicha diferencia demuestras que los chicos son más altos que las
chicas. Además la mediana es distinta, habiendo una diferencia de 5
puntos.
Respecto a la variabilidad podemos decir que la varianza es mayor
para los chicos que para las chicas, lo que significa que el grupo de los
chicos es más variable. La desviación típica es también mayor para los
chicos por lo que se deduce que hay una mayor dispersión en este
grupo.
Si hablamos de la distribución decimos que los dos grupos
presentan una asimetría negativa, ya que sus valores son –0,05 para los
chicos y –0,15 para las chicas. Las dos distribuciones son platicúrticas
20
puesto que sus valores son menores que 0; esto nos dice que la
agrupación es ancha y baja, alejándose los valores extremos de la
media.

4. Comparar los resultados del diagrama de cajas según la Opción


elegida en BUP para la variable Nota final en la asignatura.
Interpreta y razón los resultados para la tendencia central,
variabilidad, forma de la curva y/o valores extremos.

En primer lugar debemos segmentar el archivo, puesto que se nos


pide los resultados según la Opción de BUP, para ello nos vamos al
menú datos, segmentar archivo, comparar casos, donde
introducimos la variable “Opción elegida en BUP”. A continuación en el
menú analizar, estadísticos descriptivos, explorar seleccionamos la
variable “Nota final en la asignatura” y pasamos a Gráficos. Una vez
dentro seleccionamos el diagrama de cajas y bigotes. Una vez hecho
todo esto, obtenemos los siguientes resultados:
Resumen del procesamiento de los casos

Opción en
BUP? Casos
Válidos Perdidos Total
N Porcentaje N Porcentaje N Porcentaje
Nota final Ciencias
29 100,0% 0 ,0% 29 100,0%
asignatura?
Letras 16 100,0% 0 ,0% 16 100,0%
Mixto 26 100,0% 0 ,0% 26 100,0%

21
Descriptivos

Opción en BUP? Estadístico Error típ.


Ciencias Nota final asignatura? Media 2,41 ,105
Intervalo de confianza Límite inferior 2,20
para la media al 95% Límite superior
2,63

Media recortada al 5% 2,37


Mediana 2,00
Varianza ,323
Desv. típ. ,568
Mínimo 2
Máximo 4
Rango 2
Amplitud intercuartil 1,00
Asimetría ,990 ,434
Curtosis ,067 ,845
Letras Nota final asignatura? Media 2,00 ,224
Intervalo de confianza Límite inferior 1,52
para la media al 95% Límite superior
2,48

Media recortada al 5% 1,89


Mediana 2,00
Varianza ,800
Desv. típ. ,894
Mínimo 1
Máximo 5
Rango 4
Amplitud intercuartil ,00
Asimetría 2,556 ,564
Curtosis 9,368 1,091
Mixto Nota final asignatura? Media 2,00 ,096
Intervalo de confianza Límite inferior 1,80
para la media al 95% Límite superior
2,20

Media recortada al 5% 2,00


Mediana 2,00
Varianza ,240
Desv. típ. ,490
Mínimo 1
Máximo 3
Rango 2
Amplitud intercuartil ,00
Asimetría ,000 ,456
Curtosis 1,902 ,887

22
6

5 8

Nota final asignatura? 3 43


44
35

1 29
5
47 38
46
45

0
N= 29 16 26

Ciencias Letras Mixto

Opción en BUP?

Lo primero que nos llama la atención es la forma del gráfico, en el


que se pueden ver que sólo hay una caja para la opción ciencias. Esto
es así porque la variable con la que trabajamos es cuasi-cuantitativa.
Podemos observar que hay gran diferencia según las opciones de
BUP. En primer lugar, si analizamos la opción de ciencias vemos que
hay unos resultados algo dispersos, ya que la caja es bastante ancha,
pero por otro lado no se ve ningún valor extremo. Los resultados de la
caja son los representativos de la media y no coinciden completamente
con la mediana, la cual está desplazada hacia la parte inferior de la
caja.

Podríamos decir que esta distribución presenta un apuntamiento


mesocúrtico. Aún así existe asimetría puesto que la mediana se
encuentra situada en la parte inferior de la caja.

A continuación pasamos a analizar las opciones de letras y mixto,


en ella los casos están totalmente agrupados. Media, mediana y moda
coinciden, lo que hace que no se vean los resultados de la media, ni la
caja de resultados, ni los bigotes.

23
La curtosis refleja claramente unas distribuciones leptocúrticas,
puesto que los datos están extremadamente agrupados.

24
PRÁCTICA 3: RELACIÓN ENTRE VARIABLES

1. Explorar gráficamente la relación entre Peso en Kg. y altura en


cm. Interpreta la gráfica obtenida.

Para observar la relación que existente entre la relación entre el


peso en kilogramos y la altura en centímetros debemos utilizar el
coeficiente de correlación de Pearson puesto que las variables que se
nos dan son cuantitativas. Para llegar a ese coeficiente de correlación,
en primer lugar vamos a analizar, después seleccionamos
correlaciones y dentro de ella seleccionamos bivariadas:

Tras marcar las correlaciones bivariadas, hemos de añadir las


variables “peso en Kg.” y “altura en cm.” Y también seleccionar a
Pearson dentro de los coeficientes de correlación.

25
Tras aceptar obtenemos los siguientes resultados:

Correlaciones

Peso en kg Altura en cm.


Peso en kg Correlación de Pearson 1 ,622**
Sig. (bilateral) , ,000
N 71 71
Altura en cm. Correlación de Pearson ,622** 1
Sig. (bilateral) ,000 ,
N 71 71
**. La correlación es significativa al nivel 0,01 (bilateral).

Para observar la dispersión de los valores acompañaremos a este


cuadro con una gráfica de dispersión; para obtenerla nos vamos a
gráficos y dentro de este apartado seleccionaremos dispersión, en el
cual marcamos la opción simple. El gráfico quedará de la siguiente
forma:
80

70

60
Peso en kg

50

40
150 160 170 180 190

Altura en cm.

Puesto que los puntos de la gráfica están algo dispersos, y a pesar


de que se concentran en un espacio, no se puede realizar una línea
recta que pase por todos los puntos, pero si que se puede trazar una
línea recta que pase, más o menos, por el centro de los puntos. Por ello,
podemos afirmar que existe relación entre las variables. La línea que se
forma va creciendo desde los valores más pequeños a los más grandes,
lo que nos indica que hay una relación positiva. Además podemos
observar dicha relación mediante la observación de los resultados
obtenidos en la tabla, ya que da un valor de 0,62 y hay relación entre
las variables.
26
2. Indicar gráficamente y mediante un índice la relación entre
Metros cuadrados del aula y Nº de escalones.

En este ejercicio se nos pide que indiquemos que relación existe


entre las variables “metros cuadrados del aula” y “número de
escalones”. Como las dos variables son cuantitativas utilizaremos el
coeficiente de correlación de Pearson para observar la relación
existente, ya que con este coeficiente podemos conocer el grado de
relación exacto de las variables, para llegar hasta ese coeficiente
seguiremos los mismos pasos que en el ejercicio anterior. En primer
lugar vamos a analizar, después seleccionamos correlaciones y dentro
de ella seleccionamos bivariadas, en el cuadro de variables pondremos
las variables “metros cuadrados del aula.” y “número de escalones” y
dentro de los coeficientes de correlación, marcamos la opción de
Pearson. Una vez hecho esto, nos aparece la siguiente tabla de
resultados:

Correlaciones

Metros
cuadrados N.
del aula? escalones?
Metros cuadrados Correlación de Pearson 1 ,169
del aula? Sig. (bilateral) , ,158
N 71 71
N. escalones? Correlación de Pearson ,169 1
Sig. (bilateral) ,158 ,
N 71 71

El gráfico que se obtienen es el siguiente:

27
500

400

M e tr o s c u a d r a d o s d e l a u la ? 300

200

100

0
20 30 40 50 60 70 80 90 100

N. escalones?

Como se puede observar en la gráfica, los valores están demasiado


dispersos, por lo que no se podría dibujar una elipse; esto nos indica
que no existe relación entre las variables. Además no se puede trazar
una línea que pase por todos los puntos ya que están demasiado
dispersos.

3. Obtener una matriz de correlaciones para todas las variables


cuantitativas presentes en el archivo. Indica entre que variables
existe un mayor y un menor grado de relación.

Este ejercicio es similar a los anteriores, pero ahora se van a


utilizar todas las variables cuantitativas para observar entre que
variables existe mas y menos relación. Puesto que el ejercicio es similar
a los anteriores seguimos los mismos pasos, primero vamos a analizar,
después seleccionamos correlaciones y dentro de ella seleccionamos
bivariadas. Dentro del cuadro de variables pondremos todas las
variables cuantitativas, seleccionaremos Pearson y obtenemos el
siguiente cuadro de correlaciones:

28
Correlaciones

N. personas Cuantos
que Posicion Metros Segundos alumnos
Edad Peso Altura conviven entre los cuadrados N. transcurrid asisten a
(años) en kg en cm. contigo hermanos del aula? escalones? os? clase?
Edad (años) Correlación de
1 -,047 ,042 ,007 ,065 -,111 ,012 -,207 -,024
Pearson
Sig. (bilateral) , ,699 ,729 ,953 ,592 ,358 ,921 ,083 ,843
N 71 71 71 71 71 71 71 71 71
Peso en kg Correlación de
-,047 1 ,622** -,128 -,017 ,008 ,108 ,225 -,038
Pearson
Sig. (bilateral) ,699 , ,000 ,288 ,890 ,945 ,368 ,059 ,755
N 71 71 71 71 71 71 71 71 71
Altura en cm. Correlación de
,042 ,622** 1 -,109 ,084 ,136 ,050 ,020 ,023
Pearson
Sig. (bilateral) ,729 ,000 , ,364 ,488 ,259 ,677 ,865 ,850
N 71 71 71 71 71 71 71 71 71
N. personas que Correlación de
,007 -,128 -,109 1 ,473** ,153 -,028 ,038 -,212
conviven contigo Pearson
Sig. (bilateral) ,953 ,288 ,364 , ,000 ,202 ,814 ,752 ,075
N 71 71 71 71 71 71 71 71 71
Posicion entre los Correlación de
,065 -,017 ,084 ,473** 1 ,027 -,144 ,008 -,312**
hermanos Pearson
Sig. (bilateral) ,592 ,890 ,488 ,000 , ,820 ,229 ,950 ,008
N 71 71 71 71 71 71 71 71 71
Metros cuadrados Correlación de
-,111 ,008 ,136 ,153 ,027 1 ,169 -,042 ,150
del aula? Pearson
Sig. (bilateral) ,358 ,945 ,259 ,202 ,820 , ,158 ,730 ,213
N 71 71 71 71 71 71 71 71 71
N. escalones? Correlación de
,012 ,108 ,050 -,028 -,144 ,169 1 -,041 ,261*
Pearson
Sig. (bilateral) ,921 ,368 ,677 ,814 ,229 ,158 , ,733 ,028
N 71 71 71 71 71 71 71 71 71
Segundos Correlación de
-,207 ,225 ,020 ,038 ,008 -,042 -,041 1 -,116
transcurridos? Pearson
Sig. (bilateral) ,083 ,059 ,865 ,752 ,950 ,730 ,733 , ,337
N 71 71 71 71 71 71 71 71 71
Cuantos alumnos Correlación de
-,024 -,038 ,023 -,212 -,312** ,150 ,261* -,116 1
asisten a clase? Pearson
Sig. (bilateral) ,843 ,755 ,850 ,075 ,008 ,213 ,028 ,337 ,
N 71 71 71 71 71 71 71 71 71
**. La correlación es significativa al nivel 0,01 (bilateral).
*. La correlación es significante al nivel 0,05 (bilateral).

Al observar la tabla de resultados podemos comprobar que las


variables entre sí no muestran una estrecha relación, puesto que los
valores de la correlación se aproximan casi todos a cero, no existe
ningún valor que tenga una buena aproximación a 1 ó -1. A pesar de
ello vamos a ver entre que variables hay mayor y menor relación:

o Las variables que mayor relación presentan son “peso en Kg”


con “altura en cm” y “número de personas que viven contigo”
29
con “posición entre los hermanos” cuyos valores son 0,622 y
0,473 respectivamente. Estas relaciones no llegan a ser
perfectas.
o Las variables que presentan menor relación son “edad” con
“número de personas que viven contigo”, “edad” con “Número
de escalones” y “peso” con “metros cuadrados del aula” y sus
valores son 0,07; 0,012 y 0,08 respectivamente.

4. Controla el efecto de la variable Peso en Kg. en la relación entre


Edad (años) y Número de Escalones.

En este ejercicio se nos pide hallar la relación que existe entre las
variables “edad” y “número de escalones”. También se nos pide que
controlemos el efecto de la variable “peso” ya que puede influir en la
relación de las otras variables.
Por todo esto, utilizamos las correlaciones parciales, ya que con
ellas se puede controlar el efecto de una variable sobre otras. Para
realizar el ejercicio debemos de realizar lo siguiente: primero debemos
analizar la relación que existe entre las variables “edad” y “número de
escalones” sin controlar la variable “peso”. Para ello nos iremos al
menú: analizar, correlaciones bivariadas.
Una vez mostrado el cuadro de diálogo correspondiente
introducimos las variables. Esto quedaría así:

30
Una vez introducidas las variables aceptamos, obteniendo este
resultado:

Correlaciones

N.
Edad (años) escalones?
Edad (años) Correlación de Pearson 1 ,012
Sig. (bilateral) , ,921
N 71 71
N. escalones? Correlación de Pearson ,012 1
Sig. (bilateral) ,921 ,
N 71 71

Una vez hecho esto realizaremos lo mismo pero controlando la


variable “peso”. El procedimiento es el siguiente: analizar,
correlaciones parciales. Una vez seleccionado esto, nos aparece una
ventana con un cuadro de variables donde ponemos “edad” y “número
de escalones” y un cuadro de “controlando para” donde pondremos la
variable que va a ser controlada, en este caso es “peso”, quedando de la
siguiente manera:

Tras aceptar obtenemos los siguientes resultados:

31
--- PARTIAL CORRELATION COEFFICIENTS ---

Controlling for.. PESO

EDAD ESCALO

EDAD 1,0000 ,0171


( 0) ( 68)
P= , P= ,888

ESCALO ,0171 1,0000


( 68) ( 0)
P= ,888 P= ,

(Coefficient / (D.F.) / 2-tailed Significance)

" , " is printed if a coefficient cannot be computed

Observando los resultados de los análisis podemos ver que existe


una escasa relación entre las variables “edad” y “número de escalones”,
el resultado de la correlación nos da 0,012; al aproximarse bastante a
cero la relación es mínima.
Teniendo en cuenta el efecto de la variable “peso” podemos decir
que tampoco existe mucha relación entre las variables anteriores, ya
que el valor que nos da es 0,0171. En conclusión, la variable “peso” no
afecta a la relación entre las variables “edad” y “número de escalones”

5. ¿Podemos pensar que la relación entre Peso en Kg. y Altura en


cm. se ve afectada por la variable Edad (años)? Razona tu
respuesta.

El ejercicio propuesto es similar al ejercicio cuatro, en él debemos


comprobar la relación existente entre dos variables controlando el efecto
de una tercera; para realizarlo debemos utilizar la correlación parcial.
Para ello vamos a seguir los mismos pasos que en el ejercicio anterior,
el primer paso será ir a analizar, después seleccionamos correlaciones
y dentro de ella seleccionamos parciales. Dentro de las correlaciones

32
parciales pondremos en el cuadro de variables “peso” y “altura” y en el
cuadro “controlando para” se pondrá “edad”. Se obtiene lo siguiente:

--- PARTIAL CORRELATION COEFFICIENTS ---

Controlling for.. EDAD

PESO ALTURA

PESO 1,0000 ,6251


( 0) ( 68)
P= , P= ,000

ALTURA ,6251 1,0000


( 68) ( 0)
P= ,000 P= ,

(Coefficient / (D.F.) / 2-tailed Significance)

" , " is printed if a coefficient cannot be computed

Si observamos la relación existente entre las variables “peso” y


“altura” podemos comprobar que presentan cierta relación. Cuando
controlamos el efecto de la variable “edad” en la relación de las
anteriores variables observamos que el valor a penas varía ya que pasa
de ser 0,622 a 0,6251. Por tanto, podemos decir que la variable “edad”
no influye en la relación de las otras variables.

6. Calcula la relación entre Opción en BUP y Deporte favorito.


Interpreta y razona los resultados obtenidos.

En este ejercicio nos piden que calculemos la relación existente


entre dos variables no cuantitativas, por tanto tendremos que utilizar
las tablas de contingencia, puesto que es la técnica más adecuada para
este tipo de variables.

33
Para realizar las tablas de contingencia hemos de ir a analizar,
después seleccionamos estadísticos descriptivos y dentro de estos
seleccionamos tablas de contingencia:

Una vez dentro de la ventana tenemos que rellenar los cuadros


con las variables a relacionar; hay dos cuadros en los que pone “fila” y
“columnas”; en ellos se pondrán cada una de las variables, quedando de
la siguiente forma:

Tras estos pasos, aceptamos y obtenemos los siguientes


resultados:
34
Resumen del procesamiento de los casos

Casos
Válidos Perdidos Total
N Porcentaje N Porcentaje N Porcentaje
Opción en BUP? *
71 100,0% 0 ,0% 71 100,0%
Deporte favorito?

Tabla de contingencia Opción en BUP? * Deporte favorito?

Deporte favorito?
Futbol Baloncesto Tenis Ciclismo Otros Ninguno Total
Opción Ciencias Recuento 6 2 5 2 14 29
en BUP? % de Opción en BUP? 20,7% 6,9% 17,2% 6,9% 48,3% 100,0%
% de Deporte favorito? 60,0% 28,6% 50,0% 40,0% 38,9% 40,8%
% del total 8,5% 2,8% 7,0% 2,8% 19,7% 40,8%
Letras Recuento 2 3 2 7 2 16
% de Opción en BUP? 12,5% 18,8% 12,5% 43,8% 12,5% 100,0%
% de Deporte favorito? 20,0% 30,0% 40,0% 19,4% 66,7% 22,5%
% del total 2,8% 4,2% 2,8% 9,9% 2,8% 22,5%
Mixto Recuento 2 5 2 1 15 1 26
% de Opción en BUP? 7,7% 19,2% 7,7% 3,8% 57,7% 3,8% 100,0%
% de Deporte favorito? 20,0% 71,4% 20,0% 20,0% 41,7% 33,3% 36,6%
% del total 2,8% 7,0% 2,8% 1,4% 21,1% 1,4% 36,6%
Total Recuento 10 7 10 5 36 3 71
% de Opción en BUP? 14,1% 9,9% 14,1% 7,0% 50,7% 4,2% 100,0%
% de Deporte favorito? 100,0% 100,0% 100,0% 100,0% 100,0% 100,0% 100,0%
% del total 14,1% 9,9% 14,1% 7,0% 50,7% 4,2% 100,0%

Tras observar la tabla de contingencia podemos decir que,


independientemente de la opción de bachillerato o el deporte favorito lo
que más han respondido los alumnos es “otros” (otro tipo de deportes
que no reflejados). Esta opción representa el 50,7%. Después de este
deporte podemos decir que el fútbol y el tenis son los dos deportes
favoritos, ya que sus porcentajes son de 14,1% en cada caso.
Analizando los resultados por opciones en BUP señalamos que en
el caso de ciencias, que representan un 40,8% de los casos, el deporte
menos escogido es baloncesto y ciclismo con un 2,8% en cada caso. La
opción de letras representa un 22,5% de los casos y aquí destaca que
baloncesto es un deporte que no es practicado por nadie. Por último, de
la opción de mixto podemos resaltar que el baloncesto es un deporte
bastante escogido entre los alumnos.

35
Veamos ahora la relación entre estas dos variables con más
exactitud. Para ello utilizamos las pruebas de chi-cuadrado, puesto que
son más aclaratorias:

Pruebas de chi-cuadrado

Sig. asintótica
Valor gl (bilateral)
Chi-cuadrado de Pearson 12,358a 10 ,262
Razón de verosimilitud 13,875 10 ,179
Asociación lineal por
,969 1 ,325
lineal
N de casos válidos 71
a. 15 casillas (83,3%) tienen una frecuencia esperada inferior a
5. La frecuencia mínima esperada es ,68.

En la tabla vemos que la significación asintótica es de 0,262. Esto pone


de manifiesto la inexistencia de relación entre las dos variables del
ejercicio (“opción en BUP” y “deporte favorito”). Sería necesario que la
significación fuera menor al 0,05 para que existiera relación.

7. Obtener la relación entre Opción en BUP y Nota final en la


asignatura. Interpreta y razona los resultados.

Este ejercicio es muy similar al anterior; nos piden que calculemos


la relación existente entre dos variables no cuantitativas, por tanto
seguiremos los mismos pasos: analizar, estadísticos descriptivos,
tablas de contingencia. Seguidamente colocamos las variables “opción
en BUP” y “nota final” en sus respectivas casillas, aceptamos y
obtenemos los siguientes resultados:

Resumen del procesamiento de los casos

Casos
Válidos Perdidos Total
N Porcentaje N Porcentaje N Porcentaje
Opción en BUP? *
71 100,0% 0 ,0% 71 100,0%
Nota final asignatura?

36
Tabla de contingencia Opción en BUP? * Nota final asignatura?

Nota final asignatura?


Suspenso Aprobado Notable Sobresaliente Matricula Total
Opción Ciencias Recuento 18 10 1 29
en BUP? % de Opción en BUP? 62,1% 34,5% 3,4% 100,0%
% de Nota final
36,0% 76,9% 100,0% 40,8%
asignatura?
% del total 25,4% 14,1% 1,4% 40,8%
Letras Recuento 3 12 1 16
% de Opción en BUP? 18,8% 75,0% 6,3% 100,0%
% de Nota final
50,0% 24,0% 100,0% 22,5%
asignatura?
% del total 4,2% 16,9% 1,4% 22,5%
Mixto Recuento 3 20 3 26
% de Opción en BUP? 11,5% 76,9% 11,5% 100,0%
% de Nota final
50,0% 40,0% 23,1% 36,6%
asignatura?
% del total 4,2% 28,2% 4,2% 36,6%
Total Recuento 6 50 13 1 1 71
% de Opción en BUP? 8,5% 70,4% 18,3% 1,4% 1,4% 100,0%
% de Nota final
100,0% 100,0% 100,0% 100,0% 100,0% 100,0%
asignatura?
% del total 8,5% 70,4% 18,3% 1,4% 1,4% 100,0%

Como se puede observar en la tabla, en general, la gran mayoría de


alumnos, ha aprobado la asignatura, en total un 70,4%. Sólo un 1,4%
de los alumnos ha obtenido un sobresaliente o una matricula y un 8,5%
ha suspendido. Si observamos los resultados por opciones vemos que:

- De la opción de ciencias un 62,1% ha aprobado, un 34,5% ha


obtenido un notable y un 3,4% ha sacado un sobresaliente. La
opción de ciencias es la opción con mayor número de alumnos
(40,8% del total de alumnos).
- De la opción de letras un 75% ha aprobado, un 18,8% ha
suspendido y un 6,3% ha obtenido una matricula. Es la opción
que mas bajas tiene las notas.

- De la opción mixto un 76,9% ha aprobado, siendo este porcentaje


el mayor de todas las calificaciones en cualquier opción de
bachillerato y un 11,5% ha obtenido suspenso y notable.

Pasamos ahora a analizar el chi-cuadrado:


37
Pruebas de chi-cuadrado

Sig. asintótica
Valor gl (bilateral)
Chi-cuadrado de Pearson 17,853a 8 ,022
Razón de verosimilitud 21,809 8 ,005
Asociación lineal por
5,622 1 ,018
lineal
N de casos válidos 71
a. 11 casillas (73,3%) tienen una frecuencia esperada inferior a
5. La frecuencia mínima esperada es ,23.

Comprobamos aquí que sí existe relación entre la opción elegida en BUP


y la nota media de la asignatura; la opción ciencias tiene mejores notas
que la opción mixta o la de letras, que es la que tiene peores notas.

8. Calcula la relación entre Sexo y el resto de variables no


cuantitativas. Interpreta los resultados e indica con que variables
aparece una mayor y una menor relación.

Otra vez se nos presenta un ejercicio similar a los anteriores.


Vamos a calcular la relación entre varias variables no cuantitativas. Los
pasos a seguir son los mismos en los otros apartados. Los resultados
que obtenemos son:
Resumen del procesamiento de los casos

Casos
Válidos Perdidos Total
N Porcentaje N Porcentaje N Porcentaje
Opción en BUP? * Sexo
71 100,0% 0 ,0% 71 100,0%
del encuestado?
Medio de transporte? *
71 100,0% 0 ,0% 71 100,0%
Sexo del encuestado?
Tienes ordenador en
casa? * Sexo del 71 100,0% 0 ,0% 71 100,0%
encuestado?
Deporte favorito? * Sexo
71 100,0% 0 ,0% 71 100,0%
del encuestado?
Nota final asignatura? *
71 100,0% 0 ,0% 71 100,0%
Sexo del encuestado?

Sexo del encuestado? * Opción en BUP?

38
Tabla de contingencia

Sexo del encuestado?


Hombre Mujer Total
Opción Ciencias Recuento 12 17 29
en BUP? % de Opción en BUP? 41,4% 58,6% 100,0%
% de Sexo del
44,4% 38,6% 40,8%
encuestado?
% del total 16,9% 23,9% 40,8%
Letras Recuento 7 9 16
% de Opción en BUP? 43,8% 56,3% 100,0%
% de Sexo del
25,9% 20,5% 22,5%
encuestado?
% del total 9,9% 12,7% 22,5%
Mixto Recuento 8 18 26
% de Opción en BUP? 30,8% 69,2% 100,0%
% de Sexo del
29,6% 40,9% 36,6%
encuestado?
% del total 11,3% 25,4% 36,6%
Total Recuento 27 44 71
% de Opción en BUP? 38,0% 62,0% 100,0%
% de Sexo del
100,0% 100,0% 100,0%
encuestado?
% del total 38,0% 62,0% 100,0%

Pruebas de chi-cuadrado

Sig. asintótica
Valor gl (bilateral)
Chi-cuadrado de Pearson ,942a 2 ,624
Razón de verosimilitud ,954 2 ,621
Asociación lineal por
,623 1 ,430
lineal
N de casos válidos 71
a. 0 casillas (,0%) tienen una frecuencia esperada inferior a 5.
La frecuencia mínima esperada es 6,08.

Lo primero que podemos observar es que hay mayor porcentaje de


mujeres que de hombres, 62% frente a un 38% respectivamente. La
opción mixta es la más escogida por el sexo femenino (25,4%), mientras
que los hombres suelen escoger la opción de ciencias (16,9%)
La prueba del chi-cuadrado nos apunta que no existe correlación
entre el sexo del encuestado y la opción de BUP (la significación es de
0,624)

39
Sexo del encuestado? * Medio de transporte?
Tabla de contingencia

Sexo del encuestado?


Hombre Mujer Total
Medio de Coche Recuento 3 5 8
transporte? % de Medio de
37,5% 62,5% 100,0%
transporte?
% de Sexo del
11,1% 11,4% 11,3%
encuestado?
% del total 4,2% 7,0% 11,3%
Autobus Recuento 5 20 25
% de Medio de
20,0% 80,0% 100,0%
transporte?
% de Sexo del
18,5% 45,5% 35,2%
encuestado?
% del total 7,0% 28,2% 35,2%
Metro Recuento 7 4 11
% de Medio de
63,6% 36,4% 100,0%
transporte?
% de Sexo del
25,9% 9,1% 15,5%
encuestado?
% del total 9,9% 5,6% 15,5%
Andando Recuento 11 15 26
% de Medio de
42,3% 57,7% 100,0%
transporte?
% de Sexo del
40,7% 34,1% 36,6%
encuestado?
% del total 15,5% 21,1% 36,6%
Otros Recuento 1 1
% de Medio de
100,0% 100,0%
transporte?
% de Sexo del
3,7% 1,4%
encuestado?
% del total 1,4% 1,4%
Total Recuento 27 44 71
% de Medio de
38,0% 62,0% 100,0%
transporte?
% de Sexo del
100,0% 100,0% 100,0%
encuestado?
% del total 38,0% 62,0% 100,0%

Pruebas de chi-cuadrado

Sig. asintótica
Valor gl (bilateral)
Chi-cuadrado de Pearson 8,341a 4 ,080
Razón de verosimilitud 8,865 4 ,065
Asociación lineal por
2,384 1 ,123
lineal
N de casos válidos 71
a. 5 casillas (50,0%) tienen una frecuencia esperada inferior a 5.
La frecuencia mínima esperada es ,38.

Observando la tabla comprobamos que el medio de transporte más


utilizado en general tanto por hombres como por mujeres es el autobús
(35,2%). Hay que destacar también que muchas personas prefieren no
utilizar ningún medio de transporte e ir caminando 36,6% (el porcentaje
40
más grande de todos en general). Por sexos el medio de transporte más
utilizado es: para las mujeres el autobús y los hombres prefieren ir
andando.
En este caso si hay relación entre el sexo del encuestado y el medio
de transporte ya que la significación es menor al 0,05.

Sexo del encuestado? * Tienes ordenador en casa?


Tabla de contingencia

Sexo del encuestado?


Hombre Mujer Total
Tienes ordenador Si Recuento 14 20 34
en casa? % de Tienes
41,2% 58,8% 100,0%
ordenador en casa?
% de Sexo del
51,9% 45,5% 47,9%
encuestado?
% del total 19,7% 28,2% 47,9%
No Recuento 13 24 37
% de Tienes
35,1% 64,9% 100,0%
ordenador en casa?
% de Sexo del
48,1% 54,5% 52,1%
encuestado?
% del total 18,3% 33,8% 52,1%
Total Recuento 27 44 71
% de Tienes
38,0% 62,0% 100,0%
ordenador en casa?
% de Sexo del
100,0% 100,0% 100,0%
encuestado?
% del total 38,0% 62,0% 100,0%

Pruebas de chi-cuadrado

Sig. asintótica Sig. exacta Sig. exacta


Valor gl (bilateral) (bilateral) (unilateral)
Chi-cuadrado de Pearson ,274b 1 ,600
Corrección por
a ,078 1 ,780
continuidad
Razón de verosimilitud ,274 1 ,600
Estadístico exacto de
,632 ,390
Fisher
Asociación lineal por
,271 1 ,603
lineal
N de casos válidos 71
a. Calculado sólo para una tabla de 2x2.
b. 0 casillas (,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mínima esperada
es 12,93.

Apreciamos que hay más hombres que tienen ordenador en casa


(19,7%) que hombres que no tienen (18,3%). Mientras que para las
mujeres es al contrario, un 28,2% tienen ordenador frente a un 33,8%

41
que no tienen ordenador. El porcentaje de mujeres que tienen
ordenador es mayor que el de hombres; esto es debido a que el
porcentaje de mujeres es mayor que el de hombres. En este caso no
existe correlación entre las dos variables analizadas.

Sexo del encuestado? * Deporte favorito?

Tabla de contingencia

Sexo del encuestado?


Hombre Mujer Total
Deporte Futbol Recuento 4 6 10
favorito? % de Deporte favorito? 40,0% 60,0% 100,0%
% de Sexo del
14,8% 13,6% 14,1%
encuestado?
% del total 5,6% 8,5% 14,1%
Baloncesto Recuento 1 6 7
% de Deporte favorito? 14,3% 85,7% 100,0%
% de Sexo del
3,7% 13,6% 9,9%
encuestado?
% del total 1,4% 8,5% 9,9%
Tenis Recuento 3 7 10
% de Deporte favorito? 30,0% 70,0% 100,0%
% de Sexo del
11,1% 15,9% 14,1%
encuestado?
% del total 4,2% 9,9% 14,1%
Ciclismo Recuento 3 2 5
% de Deporte favorito? 60,0% 40,0% 100,0%
% de Sexo del
11,1% 4,5% 7,0%
encuestado?
% del total 4,2% 2,8% 7,0%
Otros Recuento 15 21 36
% de Deporte favorito? 41,7% 58,3% 100,0%
% de Sexo del
55,6% 47,7% 50,7%
encuestado?
% del total 21,1% 29,6% 50,7%
Ninguno Recuento 1 2 3
% de Deporte favorito? 33,3% 66,7% 100,0%
% de Sexo del
3,7% 4,5% 4,2%
encuestado?
% del total 1,4% 2,8% 4,2%
Total Recuento 27 44 71
% de Deporte favorito? 38,0% 62,0% 100,0%
% de Sexo del
100,0% 100,0% 100,0%
encuestado?
% del total 38,0% 62,0% 100,0%

42
Pruebas de chi-cuadrado

Sig. asintótica
Valor gl (bilateral)
Chi-cuadrado de Pearson 3,219a 5 ,666
Razón de verosimilitud 3,446 5 ,632
Asociación lineal por
,501 1 ,479
lineal
N de casos válidos 71
a. 8 casillas (66,7%) tienen una frecuencia esperada inferior a 5.
La frecuencia mínima esperada es 1,14.

En general el porcentaje mayor se concentra en otros deportes no


señalados (50,7. A éste le seguiría tenis y fútbol con un mismo
porcentaje (14,1%). Separado por sexos mujeres y hombres comparten
que el deporte favorito es “otros”, con un porcentaje de 29,6%, y 21,1%
respectivamente.
Para estas dos variables la prueba de chi-cuadrado nos indica que
no existe correlación entre ambas.

43
Sexo del encuestado? *Nota final asignatura?

Tabla de contingencia

Sexo del encuestado?


Hombre Mujer Total
Nota final Suspenso Recuento 4 2 6
asignatura? % de Nota final
66,7% 33,3% 100,0%
asignatura?
% de Sexo del
14,8% 4,5% 8,5%
encuestado?
% del total 5,6% 2,8% 8,5%
Aprobado Recuento 16 34 50
% de Nota final
32,0% 68,0% 100,0%
asignatura?
% de Sexo del
59,3% 77,3% 70,4%
encuestado?
% del total 22,5% 47,9% 70,4%
Notable Recuento 6 7 13
% de Nota final
46,2% 53,8% 100,0%
asignatura?
% de Sexo del
22,2% 15,9% 18,3%
encuestado?
% del total 8,5% 9,9% 18,3%
Sobresaliente Recuento 1 1
% de Nota final
100,0% 100,0%
asignatura?
% de Sexo del
3,7% 1,4%
encuestado?
% del total 1,4% 1,4%
Matricula Recuento 1 1
% de Nota final
100,0% 100,0%
asignatura?
% de Sexo del
2,3% 1,4%
encuestado?
% del total 1,4% 1,4%
Total Recuento 27 44 71
% de Nota final
38,0% 62,0% 100,0%
asignatura?
% de Sexo del
100,0% 100,0% 100,0%
encuestado?
% del total 38,0% 62,0% 100,0%

44
Pruebas de chi-cuadrado

Sig. asintótica
Valor gl (bilateral)
Chi-cuadrado de Pearson 5,467a 4 ,243
Razón de verosimilitud 6,047 4 ,196
Asociación lineal por
,044 1 ,833
lineal
N de casos válidos 71
a. 7 casillas (70,0%) tienen una frecuencia esperada inferior a 5.
La frecuencia mínima esperada es ,38.

En general el mayor porcentaje de la nota de la asignatura, lo tiene


la calificación de aprobado con un porcentaje de 70,4%. A ésta le sigue
el notable con un porcentaje de 18,3%, lo que significa que aprobado y
notable son las calificaciones más frecuentes. Para las mujeres la
calificación de aprobado es la que mayor porcentaje presenta y también
para los hombres.
Aquí tampoco existe una correlación entre la variable sexo del
encuestado y la nota final de la asignatura (la significación asintótica es
de 0,243).

45
PRÁCTICA 4: CONTRASTE DE HIPÓTESIS

1. Comprobar si la variable Edad del Alumno muestra diferencias


significativas entre hombres y mujeres para el nivel del 1%.

Para comenzar, hemos de saber claramente cuales son las


variables con las que vamos a trabajar, una vez conocidas esas
variables pasamos a realizar las posibles hipótesis que se puedan dar.
En este caso las variables son: edad del alumno y sexo. A partir de aquí
podemos plantear las siguientes hipótesis:
- Ho → X eh =X em

- Hi → X eh ≠X em

Una vez planteadas las hipótesis, debemos verificar el supuesto de


normalidad para poder quedarnos con una u otra hipótesis y para ello
hemos de aplicar la prueba de Kolmogorov-Smirnov. Puesto que se nos
pide que veamos si hay diferencias según sexo debemos segmentar el
archivo; para ello nos vamos a Datos, elegimos la opción Segmentar
archivo y nos aparecerá el siguiente cuadro de diálogo.

En el cuadro marcamos la opción Comparar casos y los Grupos


basados en Sexo.

46
Una vez segmentados los archivos, hemos de realizar la prueba de
Kolmogorov-Smirnov, para realizarla nos vamos a Analizar, después
seleccionamos Pruebas no paramétricas y dentro de esta
seleccionamos K-s de 1 muestra

Tras esto nos aparecerá:

En este cuadro marcamos edad del alumnos y lo ponemos en


Contrastar variables. Entonces nos aparecen los resultados siguientes:

47
Prueba de Kolmogorov-Smirnov para una muestra

Sexo del alumno Edad del alumno


Hombre N 36
Parámetros normales(a,b) Media 14,53
Desviación típica
,910

Diferencias más extremas Absoluta ,281


Positiva ,191
Negativa -,281
Z de Kolmogorov-Smirnov 1,689
Sig. asintót. (bilateral) ,007
Mujer N 23
Parámetros normales(a,b) Media 14,26
Desviación típica
1,137

Diferencias más extremas Absoluta ,214


Positiva ,214
Negativa -,177
Z de Kolmogorov-Smirnov 1,027
Sig. asintót. (bilateral) ,242
a La distribución de contraste es la Normal.
b Se han calculado a partir de los datos.

Tras observar los resultados nos encontramos con que no se


cumple el supuesto de normalidad, y puesto que las dos muestras son
independientes hemos de aplicar un contraste no paramétrico .
Para llevar a cabo este contraste nos vamos a Analizar,
Comparar medias y marcamos la opción Prueba T para muestras
independientes. La pantalla ha de quedar así:

48
Tras eso nos aparecerá el siguiente cuadro de diálogo, en él
hemos de poner las variables que se muestran ( edad del alumno para
contrastar variables y sexo como variable de agrupación):

Tras ello los resultados que se obtienen son:

Estadísticos de grupo

Desviación Error típ. de


Sexo del alumno N Media típ. la media
Edad del alumno Hombre 36 14,53 ,910 ,152
Mujer 23 14,26 1,137 ,237

Prueba de muestras independientes

Prueba de Levene
para la igualdad de
varianzas Prueba T para la igualdad de medias
95% Intervalo de
confianza para la
Diferencia Error típ. de diferencia
F Sig. t gl Sig. (bilateral) de medias la diferencia Inferior Superior
Edad del alumno Se han asumido
2,838 ,098 ,996 57 ,323 ,27 ,268 -,270 ,803
varianzas iguales
No se han asumido
,948 39,527 ,349 ,27 ,281 -,302 ,836
varianzas iguales

Como el valor de la significación es mayor al 1% nos quedaremos


con la Hipótesis nula (Ho) , y el optar por la Ho significa que las
varianzas son iguales. Podemos decir que existe homogeneidad en las
variables y que las medias son muy similares por lo tanto no existen

49
diferencias significativas lo cual demuestra que la relación entre ambas
variables no existe.

2. Existen diferencias, con un nivel de significación del 5%, para


las faltas de los alumnos entre el 1er y el 3er trimestre.

En este ejercicio vamos a trabajar con las variables “faltas de los


alumnos en el 1º trimestre” y “faltas de los alumnos en el 3º trimestre”. A
partir de estas variables formulamos las posibles hipótesis:

- Ho → X1º = X3º
- Hi → X1º ≠ X3º

Se trata de muestras relacionadas, por ello podríamos aplicar la


prueba T de medias comparadas pero siempre verificando el supuesto
de normalidad para poder quedarnos con una u otra hipótesis; para ello
aplicaremos la prueba de Kolmogorov-Smirnov. Introduciremos las dos
variables y obtendremos el siguiente cuadro:

Prueba de Kolmogorov-Smirnov para una muestra

Nº de faltas Nº de faltas
en el 1er en el 3er
trimestre trimestre
N 60 59
Parámetros normales a,b Media 19,92 17,32
Desviación típica
9,645 10,002

Diferencias más Absoluta ,137 ,126


extremas Positiva ,129 ,126
Negativa -,137 -,101
Z de Kolmogorov-Smirnov 1,058 ,971
Sig. asintót. (bilateral) ,212 ,303
a. La distribución de contraste es la Normal.
b. Se han calculado a partir de los datos.

Como la significación asintótica es 0,212 y 0,303 se cumple el


supuesto de normalidad, y ya que la significación es mayor al 5%
podemos aceptar la Hipótesis nula.
50
Ya que las muestras son relacionadas, puesto que la variable se ha
medido en momentos temporales distintos pero sobre los mismos
sujetos, y el supuesto de normalidad se cumple hemos de aplicar la
prueba T, para ello pasamos al menú analizar, comparar medias y
accedemos a la prueba t para muestras relacionadas

Una vez dentro de ese apartado nos aparece una ventana en la que
debemos seleccionar las variables que correspondan:

Una vez seguidos estos pasos obtenemos lo siguiente:

51
Estadísticos de muestras relacionadas

Desviación Error típ. de


Media N típ. la media
Par 1 Nº de faltas en
19,95 59 9,725 1,266
el 1er trimestre
Nº de faltas en
17,32 59 10,002 1,302
el 3er trimestre

Correlaciones de muestras relacionadas

N Correlación Sig.
Par 1 Nº de faltas en el 1er
trimestre y Nº de faltas 59 ,627 ,000
en el 3er trimestre

Prueba de muestras relacionadas

Diferencias relacionadas
95% Intervalo de
confianza para la
Desviación Error típ. de diferencia
Media típ. la media Inferior Superior t gl Sig. (bilateral)
Par 1 Nº de faltas en el 1er
trimestre - Nº de faltas 2,63 8,526 1,110 ,41 4,85 2,367 58 ,021
en el 3er trimestre

Tras analizar la media de faltas de ambos trimestres podemos


decir que el número de faltas cometidas es mayor en el primer trimestre
ya que su media es algo mayor.
Como la significación asintótica es menor al 5% hemos de rechazar
la Hipótesis nula y aceptar la alterna que nos dice que existen
diferencias entre las faltas de ambos trimestres.

3. Demuestra si los hombres tienen una nota en matemáticas


inferior a la de las mujeres con un nivel de significación del 5%.
Comprobarlo también con la nota en lengua.

Este ejercicio es muy similar a los anteriores, especialmente al


primero, ya que aquí entra en juego la variable sexo y por tanto se
deberá segmentar el archivo. En primer lugar, formulamos las hipótesis
que se puedan dar para la nota en matemáticas:
52
- Ho → X mh =X mm

- Hi → X mh ≠X mm

A partir de aquí, como en el ejercicio 1, debemos de verificar el


supuesto de normalidad para poder quedarnos con una u otra hipótesis
y para ello aplicaremos la prueba de Kolmogorov-Smirnov. Como nos
piden que veamos si hay diferencias según sexo deberemos segmentar
el archivo y seguidamente realizar la prueba de Kolmogorov-Smirnov
para la variable “nota en matemáticas” y obtenemos los siguientes
resultados:

Prueba de Kolmogorov-Smirnov para una muestra

Nota media
en
Sexo del alumno Matemáticas
Hombre N 36
Parámetros normales a,b Media 4,997
Desviación típica
1,8358

Diferencias más Absoluta ,251


extremas Positiva ,251
Negativa -,138
Z de Kolmogorov-Smirnov 1,508
Sig. asintót. (bilateral) ,021
Mujer N 24
Parámetros normales a,b Media 5,717
Desviación típica
2,2272

Diferencias más Absoluta ,234


extremas Positiva ,234
Negativa -,210
Z de Kolmogorov-Smirnov 1,147
Sig. asintót. (bilateral) ,144
a. La distribución de contraste es la Normal.
b. Se han calculado a partir de los datos.

La significación asintótica de los hombres es menor al 5% (0,021)


y la de las mujeres es mayor (0,144), por lo tanto no se cumple la
hipótesis nula ya que existen diferencias entre hombres y mujeres; al
53
quedarnos con la hipótesis alterna damos por hecho que no se cumple
el supuesto de normalidad. Debido a esto hemos de aplicar la Prueba U
de Mann – Whitney por ser dos muestras independientes. Para calcular
esta prueba seguimos los siguientes pasos: analizar, pruebas no
paramétricas y 2 muestras independientes:

Una vez dentro aparece un cuadro de dialogo donde debemos


seleccionar las variables implicadas, en el apartado de contrastar
variables ponemos la variable “nota en matemáticas” y en variable de
agrupación ponemos la variable “sexo”, quedando de la siguiente
forma:

54
Y los resultados que obtenemos son los que a continuación se
muestran:
Rangos

Rango Suma de
Sexo del alumno N promedio rangos
Nota media en Hombre 36 27,86 1003,00
Matemáticas Mujer 24 34,46 827,00
Total 60

Estadísticos de contrastea

Nota media
en
Matemáticas
U de Mann-Whitney 337,000
W de Wilcoxon 1003,000
Z -1,436
Sig. asintót. (bilateral) ,151
a. Variable de agrupación: Sexo del alumno

La significación en este caso es mayor al 5% así que rechazamos la


Hi y nos quedamos con la Ho. Con esto se puede decir que las
diferencias entre la nota de hombres y mujeres no son significativas.

Ahora nos piden que hagamos lo mismo pero esta vez para la nota
de lengua. Las hipótesis que se puedan dar son:

- Ho → X lh =X lm

- Hi → X lh ≠X lm

Al igual que antes deberemos segmentar el archivo y seguidamente


realizar la prueba de Kolmogorov-Smirnov pero esta vez para la
variable “nota en lengua” y obtenemos los siguientes resultados:

55
Prueba de Kolmogorov-Smirnov para una muestra

Nota media
Sexo del alumno en Lengua
Hombre N 36
Parámetros normales a,b Media 61,486
Desviación típica
21,4316

Diferencias más Absoluta ,261


extremas Positiva ,261
Negativa -,136
Z de Kolmogorov-Smirnov 1,566
Sig. asintót. (bilateral) ,015
Mujer N 24
Parámetros normales a,b Media 74,896
Desviación típica
20,4460

Diferencias más Absoluta ,256


extremas Positiva ,256
Negativa -,168
Z de Kolmogorov-Smirnov 1,253
Sig. asintót. (bilateral) ,087
a. La distribución de contraste es la Normal.
b. Se han calculado a partir de los datos.

Observando los resultados vemos que la significación asintótica es


diferente puesto que la de las mujeres es superior al 5% y la de los
hombres es menor. Por lo tanto, hemos de aceptar la Hipótesis alterna y
aplicar la prueba de U de Mann-Whitney, obteniendo los resultados
siguientes:

Rangos

Rango Suma de
Sexo del alumno N promedio rangos
Nota media en Lengua Hombre 36 25,03 901,00
Mujer 24 38,71 929,00
Total 60

Estadísticos de contrastea

Nota media
en Lengua
U de Mann-Whitney 235,000
W de Wilcoxon 901,000
Z -2,978
Sig. asintót. (bilateral) ,003
a. Variable de agrupación: Sexo del alumno

Tras ver los resultados observamos que la significación asintótica


es menor al 5%, lo que significa que debemos quedarnos con la

56
hipótesis alterna que dice que la nota media de lengua para los
hombres es inferior a la nota media en lengua de las mujeres.

4. Existen diferencias entre los hombres y las mujeres para la


variable Número de faltas (faltot) con un nivel del 1%?

El primer paso que debemos realizar es identificar las variables que


se van a analizar para así poder formular las hipótesis que puedan
darse. En este caso las variables implicadas son “número de faltas” y
“sexo”, y las posibles hipótesis:

- Ho → X fh =X fm (la media en el número de faltas de los hombres


es igual a la media de las mujeres).
- Hi → X fh ≠X fm (la media en el número de faltas de los hombres
es distinta a la media de las mujeres).

Como en ejercicios anteriores tenemos que verificar el supuesto de


normalidad; al pedirnos que veamos si hay diferencias según el sexo
debemos segmentar el archivo y seguidamente realizar la prueba de
Kolmogorov-Smirnov para la variable “número de faltas”. Para llevar a
cabo la prueba seguimos los mismos pasos que en los ejercicios
anteriores: analizar, pruebas no paramétricas y dentro de esta
seleccionamos K-S de una muestra. Una vez realizados estos pasos
seleccionamos la variable “número de faltas”, aceptamos y obtenemos
los siguientes resultados:

57
Prueba de Kolmogorov-Smirnov para una muestra

Sexo del alumno Nº de faltas


Hombre N 36
Parámetros normales a,b Media 57,2500
Desviación típica
25,65193

Diferencias más Absoluta ,149


extremas Positiva ,131
Negativa -,149
Z de Kolmogorov-Smirnov ,893
Sig. asintót. (bilateral) ,403
Mujer N 24
Parámetros normales a,b Media 52,9167
Desviación típica
22,99133

Diferencias más Absoluta ,144


extremas Positiva ,144
Negativa -,118
Z de Kolmogorov-Smirnov ,706
Sig. asintót. (bilateral) ,702
a. La distribución de contraste es la Normal.
b. Se han calculado a partir de los datos.

En ambos casos comprobamos que la significación es


mayor al 1%, tanto para los hombres como para las mujeres, por lo que
se cumple el supuesto de normalidad. Esto a su vez nos hace aceptar
en principio la hipótesis nula.

Verificado el supuesto de normalidad pasamos al menú analizar,


comparar medias, prueba T para muestras independientes:

58
Estadísticos de grupo

Desviación Error típ. de


Sexo del alumno N Media típ. la media
Nº de faltas Hombre 36 57,2500 25,65193 4,27532
Mujer 24 52,9167 22,99133 4,69309

Prueba de muestras independientes

Prueba de Levene
para la igualdad de
varianzas Prueba T para la igualdad de medias
95% Intervalo de
confianza para la
Diferencia Error típ. de diferencia
F Sig. t gl Sig. (bilateral) de medias la diferencia Inferior Superior
Nº de faltas Se han asumido
,749 ,390 ,668 58 ,507 4,3333 6,49091 -8,65964 17,32630
varianzas iguales
No se han asumido
,683 53,020 ,498 4,3333 6,34850 -8,40003 17,06670
varianzas iguales

Lo que hacemos a continuación es comprobar si la significación es


mayor o menor a 1% para poder quedarnos con una de las dos
hipótesis. En este caso es mayor, por eso nos quedamos con la hipótesis
nula, que apunta que no existen diferencias entre la nota final de
hombres y mujeres.

5. Comprueba si obtienen una nota final mejor los absentistas


bajos que los absentistas crónicos para un nivel de significación del
5%.

Las variables implicadas en este ejercicio son nota final y tipo de


absentismo; las posibles hipótesis son:
- Ho → X nab =X nac

- Hi → X nab ≠X nac

Primero verificamos el supuesto de normalidad aplicando la prueba


de Kolmogorov-Smirnov. Antes de realizar la prueba debemos
segmentar el archivo porque es necesario hacerlo para poder ver si hay
diferencias de nota final según el tipo de absentismo. Una vez
segmentado nos vamos al menú analizar, pruebas no paramétricas,

59
K-1 de una muestra, contrastar variable “nota final”. Los resultados
que obtenemos son:
Prueba de Kolmogorov-Smirnov para una muestra

Nota media
Tipo de Absentismo del alumno
Bajo N 13
Parámetros normales a,b Media 6,9828
Desviación típica
1,18192

Diferencias más Absoluta ,228


extremas Positiva ,217
Negativa -,228
Z de Kolmogorov-Smirnov ,822
Sig. asintót. (bilateral) ,510
Regular N 22
Parámetros normales a,b Media 6,1608
Desviación típica
1,20747

Diferencias más Absoluta ,175


extremas Positiva ,170
Negativa -,175
Z de Kolmogorov-Smirnov ,819
Sig. asintót. (bilateral) ,513
Crónico N 25
Parámetros normales a,b Media 5,6352
Desviación típica
2,22195

Diferencias más Absoluta ,250


extremas Positiva ,250
Negativa -,133
Z de Kolmogorov-Smirnov 1,249
Sig. asintót. (bilateral) ,088
a. La distribución de contraste es la Normal.
b. Se han calculado a partir de los datos.

En los tres casos la significación es mayor al 5% por lo que


podemos decir que se cumple el supuesto de normalidad y que en
principio aceptamos la hipótesis nula que dice que obtienen una nota
mejor los absentistas bajos que crónicos.
Para verificar esta elección pasamos a comparar las medias:
analizar, comparar medias, prueba T para muestras independientes;
estos son los resultados:

Estadísticos de grupo

Desviación Error típ. de


Tipo de Absentismo N Media típ. la media
Nota media del alumno Bajo 13 6,9828 1,18192 ,32780
Crónico 25 5,6352 2,22195 ,44439

60
Prueba de muestras independientes

Prueba de Levene
para la igualdad de
varianzas Prueba T para la igualdad de medias
95% Intervalo de
confianza para la
Diferencia Error típ. de diferencia
F Sig. t gl Sig. (bilateral) de medias la diferencia Inferior Superior
Nota media del alumno Se han asumido
6,143 ,018 2,033 36 ,049 1,3476 ,66278 ,00336 2,69174
varianzas iguales
No se han asumido
2,440 35,941 ,020 1,3476 ,55221 ,22755 2,46755
varianzas iguales

En primer lugar nos fijamos en las medias; vemos que hay


bastante diferencia entre absentistas bajos (13) y absentistas crónicos
(25). Pasamos pues a ver la significación y comprobamos que en ambos
casos no es igual ni supera el 5%. Con estos resultados podemos
señalar que debemos quedarnos con la hipótesis alterna (H 1) y rechazar
la hipótesis nula (H0); traducido a otras palabras diríamos que no
obtienen mejor nota los absentistas bajos que los crónicos.

6. Los alumnos con nivel económico bajo obtienen una media


menor que los alumnos de nivel económico alto en alguna de las
tres asignaturas (Matemáticas, Medio Ambiente y Lengua), utiliza
un nivel de 5%.

Otra vez, como en apartados anteriores, debemos identificar las


variables y formular las hipótesis posibles. Las variables implicadas son
nivel económico y nota media en las tres asignaturas, y las posibles
hipótesis son:
- Ho → X nb = X na (no existen diferencias entre los alumnos con
nivel económico alto y los alumnos con nivel económico bajo en
las asignaturas de matemáticas, lengua y medio ambiente)
- H1 → X nb ≠ X na (no existen diferencias entre los alumnos con
nivel económico alto y los alumnos con nivel económico bajo en
las asignaturas de matemáticas, lengua y medio ambiente)

Para verificar el supuesto de normalidad aplicamos la prueba de


Kolmogorov-Smirnov, segmentado antes el archivo para comparar los
61
grupos según el nivel económico. Seguidamente realizamos la prueba de
Kolmogorov-Smirnov de la siguiente forma: analizar, pruebas no
paramétricas, K-1 de una muestra; esta vez en lugar de seleccionar
solo una variable seleccionamos las tres variables de nota en la
asignatura (nota media en matemáticas, nota media en lengua y nota
media en Medio Ambiente) ya que debemos de observar la nota en las
tres asignaturas y si existen diferencias en alguna de ellas según el
nivel económico de los alumnos. Los resultados obtenidos son:

Prueba de Kolmogorov-Smirnov para una muestra

Nota media Nota media


en en Medio Nota media
Nivel Económico Matemáticas Ambiente en Lengua
, N 13 13 13
Parámetros normales a,b Media 5,115 52,08 59,338
Desviación típica
1,4070 13,294 18,2465

Diferencias más Absoluta ,335 ,364 ,316


extremas Positiva ,335 ,240 ,316
Negativa -,228 -,364 -,229
Z de Kolmogorov-Smirnov 1,209 1,314 1,139
Sig. asintót. (bilateral) ,108 ,063 ,149
Bajo N 15 15 15
Parámetros normales a,b Media 3,960 32,20 53,720
Desviación típica
1,2557 17,193 18,1044

Diferencias más Absoluta ,261 ,396 ,347


extremas Positiva ,261 ,396 ,347
Negativa -,222 -,257 -,191
Z de Kolmogorov-Smirnov 1,010 1,536 1,342
Sig. asintót. (bilateral) ,259 ,018 ,054
Medio N 19 19 19
Parámetros normales a,b Media 6,321 54,16 82,221
Desviación típica
2,2491 13,150 19,1572

Diferencias más Absoluta ,232 ,257 ,243


extremas Positiva ,152 ,181 ,243
Negativa -,232 -,257 -,194
Z de Kolmogorov-Smirnov 1,009 1,119 1,058
Sig. asintót. (bilateral) ,260 ,164 ,213
Alto N 13 13 13
Parámetros normales a,b Media 5,469 55,08 67,046
Desviación típica
2,1422 6,487 20,9784

Diferencias más Absoluta ,354 ,298 ,261


extremas Positiva ,354 ,298 ,261
Negativa -,222 -,223 -,221
Z de Kolmogorov-Smirnov 1,276 1,074 ,942
Sig. asintót. (bilateral) ,077 ,199 ,338
a. La distribución de contraste es la Normal.
b. Se han calculado a partir de los datos.

Si observamos la significación por materias vemos que en


matemáticas y en lengua es mayor al 5% en los dos grupos pero en
medio ambiente no lo es en los dos grupos. Para el grupo de nivel
62
económico bajo la significación es menor a 5% mientras que para el
grupo de nivel económico alto es mayor a 5%. De este modo el supuesto
de normalidad sólo se cumple para matemáticas y lengua, para medio
ambiente no.
Una vez comprobada la normalidad, debemos utilizar diferentes
procedimientos: como en las materias de matemáticas y lengua la
significación es mayor debemos realizar la prueba T, mientras que para
la asignatura medio ambiente aplicamos la prueba de U de Mann-
Whitney
-Prueba T para matemáticas

Estadísticos de grupo

Desviación Error típ. de


Nivel Económico N Media típ. la media
Nota media en Bajo 15 3,960 1,2557 ,3242
Matemáticas Alto 13 5,469 2,1422 ,5941

Prueba de muestras independientes

Prueba de Levene
para la igualdad de
varianzas Prueba T para la igualdad de medias
95% Intervalo de
confianza para la
Diferencia Error típ. de diferencia
F Sig. t gl Sig. (bilateral) de medias la diferencia Inferior Superior
Nota media en Se han asumido
11,616 ,002 -2,312 26 ,029 -1,509 ,6527 -2,8509 -,1676
Matemáticas varianzas iguales
No se han asumido
-2,230 18,784 ,038 -1,509 ,6768 -2,9270 -,0915
varianzas iguales

-Prueba T para lengua

Estadísticos de grupo

Desviación Error típ. de


Nivel Económico N Media típ. la media
Nota media en Lengua Bajo 15 53,720 18,1044 4,6745
Alto 13 67,046 20,9784 5,8184

Prueba de muestras independientes

Prueba de Levene
para la igualdad de
varianzas Prueba T para la igualdad de medias
95% Intervalo de
confianza para la
Diferencia Error típ. de diferencia
F Sig. t gl Sig. (bilateral) de medias la diferencia Inferior Superior
Nota media en Lengua Se han asumido
1,537 ,226 -1,805 26 ,083 -13,326 7,3830 -28,5021 1,8498
varianzas iguales
No se han asumido
-1,785 23,941 ,087 -13,326 7,4636 -28,7322 2,0799
varianzas iguales

63
Con esto resultados podemos ver que la significación asintótica
para matemáticas es menor al 5%, por ello debemos rechazar la
hipótesis nula y aceptar la alterna, que dice que existen diferencias
entre alumnos con nivel económico bajo y entre alumnos con nivel
económico alto. Sin embargo para el caso de lengua es diferente; al ser
la significación mayor al 5% aceptamos la hipótesis nula, que apunta
que no existen diferencias entre los niveles económicos alto-bajo.
-Prueba U de Mann-Whitney

Rangos

Rango Suma de
Nivel Económico N promedio rangos
Nota media en Bajo 15 10,60 159,00
Medio Ambiente Alto 13 19,00 247,00
Total 28

Estadísticos de contrasteb

Nota media
en Medio
Ambiente
U de Mann-Whitney 39,000
W de Wilcoxon 159,000
Z -2,719
Sig. asintót. (bilateral) ,007
Sig. exacta [2*(Sig. a
,006
unilateral)]
a. No corregidos para los empates.
b. Variable de agrupación: Nivel Económico

Para medio ambiente la significación asintótica es menor al 5%


(0,006), por lo que rechazamos la hipótesis nula y aceptamos la alterna,
que nos dice que existen diferencias entre los alumnos de nivel
económico alto y nivel económico bajo.

7. Demostrar si existen diferencias entre las medias de faltas del


primer trimestre y el segundo trimestre para un nivel del 5%.

En este ejercicio las variables son número de faltas del primer


trimestre y número de faltas del segundo trimestre. Las hipótesis que
pueden formularse son:

64
- Ho → X f1 =X f2

- Hi → X f1 ≠X f2

Ahora verificamos el supuesto de normalidad aplicando la prueba


de Kolmogorov-Smirnov. Seguimos los pasos ya descritos en ejercicios
anteriores, introducimos las dos variables y obtenemos el siguiente
cuadro:

Prueba de Kolmogorov-Smirnov para una muestra

Nº de faltas Nº de faltas
en el 1er en el 2º
trimestre trimestre
N 60 60
Parámetros normales a,b Media 19,92 18,57
Desviación típica
9,645 8,420

Diferencias más Absoluta ,137 ,128


extremas Positiva ,129 ,096
Negativa -,137 -,128
Z de Kolmogorov-Smirnov 1,058 ,988
Sig. asintót. (bilateral) ,212 ,283
a. La distribución de contraste es la Normal.
b. Se han calculado a partir de los datos.

La tabla obtenida nos muestra que la significación es mayor al 5%


(0,212 y 0,283 respectivamente), por lo que podemos decir que se
cumple el supuesto de normalidad y que nos quedamos con la
hipótesis nula.
Una vez realizado este paso pasamos a calcular la prueba T. Los
pasos a seguir son (igual que en el segundo apartado): analizar,
comparar medias, prueba T para muestras relacionadas.
Hecho esto obtenemos los siguientes resultados:

Estadísticos de muestras relacionadas

Desviación Error típ. de


Media N típ. la media
Par 1 Nº de faltas en
19,92 60 9,645 1,245
el 1er trimestre
Nº de faltas en
18,57 60 8,420 1,087
el 2º trimestre
65
Correlaciones de muestras relacionadas

N Correlación Sig.
Par 1 Nº de faltas en el 1er
trimestre y Nº de faltas 60 ,645 ,000
en el 2º trimestre

Prueba de muestras relacionadas

Diferencias relacionadas
95% Intervalo de
confianza para la
Desviación Error típ. de diferencia
Media típ. la media Inferior Superior t gl Sig. (bilateral)
Par 1 Nº de faltas en el 1er
trimestre - Nº de faltas 1,35 7,691 ,993 -,64 3,34 1,360 59 ,179
en el 2º trimestre

Observando los valores de las medias de faltas comprobamos que


no existe una gran diferencia entre las faltas del 1º trimestre y las faltas
del 2º trimestre.

Referente a la significación, vemos que es mayor a 5% por ende nos


quedamos con la hipótesis nula, que dice que no existen diferencias
significativas entre el número de faltas cometidas en el primer trimestre
y el número de faltas cometidas en el segundo trimestre.

8. Comprueba si los alumnos con una nota final superior o igual a


5 tienen un número de faltas mayor en el segundo trimestre que en
el tercero, con un nivel de significación del 5%.

El primer que debemos realizar es la identificación de las variables


con las que se vamos a trabajar para poder formular las hipótesis
convenientes. Las variables implicadas son nota media del alumno y
número de faltas tanto del segundo como del tercer trimestre. Las
hipótesis que se pueden plantear son:

66
- Ho → X f2ºa = X f3ºa (la media de faltas en el segundo trimestre
para los alumnos aprobados es igual a la media de las faltas
cometidas en el tercer trimestre para los mismos alumnos).
- Hi → X f2ºa ≠ X f2ºa (la media de faltas en el segundo trimestre
para los alumnos aprobados es distinta a la media de las faltas
cometidas en el tercer trimestre para los mismos alumnos).

A continuación verificamos el supuesto de normalidad aplicando la


prueba de Kolmogorov-Smirnov. Antes de realizar otro paso debemos
seleccionar los casos, ya que nos piden que comprobemos las
diferencias de número de faltas solo para los alumnos que tienen una
nota final superior o igual a cinco. Para realizar la selección de los casos
nos vamos a menú, datos, seleccionar casos, seleccionar “si se
satisface la condición”. Una vez aquí debemos poner la condición, que
sería escoger solamente a los alumnos con nota igual o superior a cinco;
esto queda de la siguiente forma:

67
De este modo tenemos seleccionados únicamente los casos que nos
interesan.
Seleccionados los casos debemos segmentar el archivo,
seleccionando la opción comparar grupos. Acto seguido introducimos la
nueva variable creada (nota final pero solo con los que tienen cinco o
una nota superior).

Ahora aplicamos la prueba de Kolmogorov-Smirnov, contrastando


las variables de número de faltas en el primer trimestre y número de
faltas en el tercer trimestre.
Los resultados que obtenemos son los siguientes:

68
Prueba de Kolmogorov-Smirnov para una muestra

Nº de faltas Nº de faltas
en el 2º en el 3er
notfinal >= 5 (FILTER) trimestre trimestre
Seleccionado N 44 43
Parámetros normales a,b Media 16,41 14,37
Desviación típica
8,587 9,355

Diferencias más Absoluta ,133 ,181


extremas Positiva ,133 ,181
Negativa -,099 -,139
Z de Kolmogorov-Smirnov ,880 1,190
Sig. asintót. (bilateral) ,421 ,118
a. La distribución de contraste es la Normal.
b. Se han calculado a partir de los datos.

En la tabla podemos apreciar que la significación es mayor a 5%,


por consiguiente se cumple el criterio de normalidad; por eso nos
quedamos con la hipótesis nula. A continuación calculamos la prueba
T, para poder comparar las variables: analizar, comparar medias,
prueba T para muestras relacionadas.
Al introducir las variables obtenemos estos resultados:

Estadísticos de muestras relacionadas

Desviación Error típ. de


notfinal >= 5 (FILTER) Media N típ. la media
Seleccionado Par 1 Nº de faltas en
16,47 43 8,680 1,324
el 2º trimestre
Nº de faltas en
14,37 43 9,355 1,427
el 3er trimestre

Correlaciones de muestras relacionadas

notfinal >= 5 (FILTER) N Correlación Sig.


Seleccionado Par 1 Nº de faltas en el 2º
trimestre y Nº de faltas 43 ,597 ,000
en el 3er trimestre

69
Prueba de muestras relacionadas

Diferencias relacionadas
95% Intervalo de
confianza para la
Desviación Error típ. de diferencia
notfinal >= 5 (FILTER) Media típ. la media Inferior Superior t gl Sig. (bilateral)
Seleccionado Par 1 Nº de faltas en el 2º
trimestre - Nº de faltas 2,09 8,118 1,238 -,41 4,59 1,691 42 ,098
en el 3er trimestre

Podemos observar que las medias del número de faltas en el


trimestre 2 y el número de faltas en el trimestre 3 son ligeramente
diferentes en un caso y en otrora, ya que la media de faltas el segundo
trimestre es mayor que la del tercer trimestre. Esto significa que se ha
cometido mayor número de faltas en el segundo trimestre aunque la
diferencia no es muy abultada.

La significación es mayor al 5% por lo que debemos quedarnos con


la hipótesis nula que dice que la media de faltas en el segundo trimestre
para los alumnos con una nota superior o igual a cinco es igual o
similar a la media de las faltas cometidas en el tercer trimestre para los
mismos alumnos.

70

También podría gustarte