Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Introducción
[11] 213
soras; así como investigar si ellas están asociadas o correlaciona-
das entre si.
Diagrama de dispersión
Y Y
. .
.. .. . . .
.. . . . .
. . . X . . . X
a) Relación lineal Positiva o Directa b) Relación lineal Negativa o
Inversa
214
Y Y
..
. ..
.. . . .. . ... .. .
. .... ..... .. .
. .. . . .. . ..
X X
c) No hay Relación lineal d) Relación No Lineal
entre X e Y
215
se mantiene el aumento o crecimiento de una variable a partir del
aumento de otra variable o viceversa.
216
Se demuestra que los valores a y b que hacen mínimo SSE,
satisfacen el denominado sistema de ecuaciones normales:
n n
∑ yi = an + b∑ xi
i =1 i =1
n n n
∑ xi yi = a ∑ xi + b∑ xi
i =1 i =1 i =1
n n n n
∑ y ∑x −∑x ∑x y
i
2
i i i i
a= i =1 i =1 i =1 i =1
2
n
n
n ∑ xi2 − ∑ xi
i =1 i =1
n n n
n ∑ xi yi − ∑ xi ∑ yi
b= i =1 i =1 i =1
2 ,
n
n
n ∑ x − ∑ xi
2
i
i =1 i =1
217
Ejemplo 5.1
1 16 15
2 13 11
3 15 17
4 12 14
5 11 11
6 16 14
7 13 15
8 10 12
Solución
218
Figura Nº 5.1: Diagrama de dispersión de rendimiento en
secundaria y rendimiento en superior de un grupo de alumnos
Rendimiento en secundaria
Rendimiento en superior
xi yi xi2 xi yi
16 15 256 240
13 11 169 143
15 17 225 255
12 14 144 168
11 11 121 121
16 14 256 224
13 15 169 195
10 12 100 120
8 8 8 8
∑ y ∑x −∑x ∑x y
i
2
i i i i
109 × 1440 − 106 × 1466
a= i =1 i =1 i =1 i =1
= = 5.51,
8 × 1440 − (106)
2 2
8
8
n ∑ xi2 − ∑ xi
i =1 i =1
n n n
n ∑ xi yi − ∑ xi ∑ yi
8 × 1466 − 106 × 109
b= i =1 i =1 i =1
= = 0.61,
8 × 1440 − (106)
2 2
n
n
n ∑ xi2 − ∑ xi
i =1 i =1
219
y luego la recta de regresión estimada por el método de míni-
mos cuadrados, de Y sobre X es la siguiente:
Yˆ = 5.51 + 0.61 X
Ejemplo 5.2
1 8 12
2 5 8
3 3 8
4 6 10
5 7 10
220
Solución
1 8 12 96 64 144
2 5 8 40 25 64
3 3 8 24 9 64
4 6 10 60 36 100
5 7 10 70 49 100
221
8 8 8 8
∑ y ∑x −∑x ∑x y
i
2
i i i i
( 48)(183) − ( 29( 290)
a= i =1 i =1 i =1 i =1
2
= =5.05
8
8 5(183) − ( 29) 2
n ∑ xi2 − ∑ xi
i =1 i =1
n n n
n ∑ xi yi − ∑ xi ∑ yi
(5)( 290) − (29)( 48)
b= i =1 i =1 i =1
2
= = 0.78.
n
n 5(183) − (29)2
n ∑ xi2 − ∑ xi
i =1 i =1
Ejemplo 5.3
Solución
222
El output del SPSS muestra lo siguiente.
Linear
Regression
y = 5.05 + 0.78 * X
R-Square = 0.81
Y
Coefficientsa
Unstandardized Standardized
Coefficients Coefficients
a
b
Yˆ = 5.054 + 0.784 X ,
223
donde, manteniendo constante la variable años de escolaridad
de la madre aun podemos estimar la calificación promedio de los
hijos en la prueba de matemática, en 5.054 puntos. Un incremento
en los años de escolaridad de la madre de un año, por ejemplo, es
acompañado por un incremento en la calificación de sus hijos en la
prueba de matemática en 0.784 puntos.
Pruebas de hipótesis
Prueba t
Paso 1:
H0 : b = 0
H1 : b ≠ 0
bˆ
t= tiene distribución t(n −1)
Sbˆ
224
donde:
Paso 3:
α
Para un nivel de significancia α, P[t(n −1) < tteórico ] = 1 − . En la ta-
2
bla - t-Student se obtiene tteórico .
Paso 4:
H0 : b = 0 bˆ
t= tc > t(1−α )
H1 : b > 0 Sbˆ
H0 : b = 0 bˆ tc < −t(1−α )
t=
H1 : b < 0 Sbˆ
225
Ejemplo 5.4
Solución
Coefficientsa
Unstandardized Standardized
Coefficients Coefficients
a
b
Sbˆ Saˆ
bˆ 0,784
tc = = = 3.596
Sbˆ 0,218
226
[ ]
Paso 3: Para = α = 0,05, P t(5 ) < tteórico = 0.975 . En la tabla t con 5
grados de libertad se encuentra el valor de tc = 3.596.
Y Y
. .
... .. . .
.. . . . .
. . . X X
a) Correlación positiva b) Correlación negativa
Y
. . .
.. . . ...
. . . . . . c) Correlación nula
. ..
. . . .. .
227
Ejemplo 5.5
Nº SUJETO xi yi
1 5 12
2 8 20
3 12 30
4 16 30
5 16 42
6 24 40
7 8 50
Solución
Figura Nº 5.2
Puntuaciones en Literatura y Lenguaje de un grupo de alumnos
Puntuaciones en Literatura
Puntuaciones en Lenguaje
228
Como se puede observar, cuando aumenta el valor de la varia-
ble X también aumenta el valor de la variable Y, de esto se concluye
que existe correlación positiva o directa entre las puntuaciones en
Literatura y puntuaciones en Lenguaje.
Ejemplo 5.6
alumnos xi yi
1 10 30
2 30 15
3 38 37
4 40 25
5 60 35
6 65 05
7 80 20
8 90 10
229
Solución
Figura Nº 5.3
Puntuaciones en Literatura y Matemática de un grupo de alumnos
Puntuaciones en Literatura
Puntuaciones en Matemática
Correlación nula
Ejemplo 5.7
230
Tabla Nº 5.5:
Puntuaciones en deporte vs. puntuaciones en
matemática de un grupo de alumnos
Nº sujeto xi yi
1 02 20
2 04 15
3 04 35
4 08 05
5 08 40
6 14 05
7 14 15
8 14 40
9 18 20
10 18 35
Solución
Figura Nº 5.4:
Puntuaciones en Deporte en Matemática de un grupo de alumnos
Puntuaciones en Deporte
Puntuaciones en Matemática
231
Coeficiente de correlación de Pearson (r)
232
Individuos xi yi xi2 yi2 xi yi
1 x1 y1 x12 y12 x1 y1
2 x2 y2 x22 y 2
2 x2 y 2
3 x3 y3 x32 y32 x3 y3
... ... ... ... ... ...
n xn yn x 2
n y 2
n xn yn
n n n n n
Totales ∑ xi
i =1
∑ yi
i =1
∑ xi2
i =1
∑ yi2
i =1
∑x y
i =1
i i
n ∑ xi yi − (∑ xi )(∑ yi )
r=
[n∑ x 2
i
2
][
− (∑ xi ) n ∑ yi2 − (∑ yi )
2
]
b) Para puntuaciones Z (puntuaciones típicas)
∑ (x − x ) ∑ (y )
n n
2 2
n n −y
∑x ,
i i
x= i y= ∑y i , s xi = i =1 , s yi = i =1
i =1 i =1 n −1 n −1
∑z xi z yi
r = i =1
n −1
233
luego, mediante una prueba de hipótesis, comprobar si es ma-
yor de lo que podría esperarse solamente por casualidad.
Propiedades
234
En la hipótesis nula se postula que no existe asociación entre
las variables, y en la hipótesis alternativa: se postula que existe
asociación entre las variables. La representación es la siguiente:
H0 : ρ = 0
H1 : ρ ≠ 0
r
t= ~ t (n − 2) ,
1 − r2
n−2
235
Ejemplo 5.8
Solución
Estudiante CI Puntaje
xi yi xi2 yi2 xi yi
1 120 17 14400 289 2040
2 112 15 12544 225 1680
3 110 15 12100 225 1650
4 120 19 14400 361 2280
5 103 12 10609 144 1236
6 126 20 15876 400 2520
7 113 15 12769 225 1695
8 114 17 12996 289 1938
9 106 14 11236 196 1484
10 108 14 11664 196 1512
11 128 19 16384 361 2432
12 109 14 11881 196 1526
236
Obtenemos el coeficiente de correlación de Pearson r
12(21993) − 1369(191)
r= = 0,953
(12(156859) − (1369) )(12(3107) − (191) )
2 2
Solución
H0 : ρ = 0
H1 : ρ ≠ 0
0.953
tc = = 9.93
1 − 0.9532
10
237
Ejemplo 5.9
xi yi z xi z yi
120 17 0.7531 0.4392
112 15 -0.2651 -0.3716
110 15 -0.5197 -0.3716
120 19 0.7532 1.2501
103 12 -1.4107 -1.5879
126 20 1.5168 1.6555
113 15 -0.1379 -0.3716
114 17 -0.0106 0.4392
106 14 -1.0289 0.7771
108 14 -0.7743 -0.7771
128 19 1.7714 1.2501
109 14 -0.6470 -0.7771
238
En el output del SPSS se lee:
rendimiento Zscore:
rendimiento
( z yi )
coeficiente de
inteligencia Pearson Correlation .953 .953
Zscore: coeficiente
de inteligencia ( z yi ) Pearson Correlation .953 .953
n
∑z xi z yi
r = i =1 = 0.953.
n −1
Ejemplo 5.10
1 8 12
2 5 8
3 3 8
4 6 10
5 7 10
239
En el siguiente cuadro se presentan los cálculos auxiliares:
1 8 12 96 64 144
2 5 8 40 25 64
3 3 8 24 9 64
4 6 10 60 36 100
5 7 10 70 49 100
Ejemplo 5.11
240
Tabla Nº 5.8: Rendimiento y Edades de una muestra de estudiantes del
Colegio Teresa Gonzales de Fanning, 1998
1 15 16 14 13
2 14 15 14 14
3 13 12 15 14
4 12 12 16 14
5 11 10 16 12
6 13 15 17 15
7 15 15 17 15
8 15 16 16 14
9 16 17 15 14
10 12 15 15 14
11 11 12 16 9
12 8 9 17 11
13 10 11 17 13
14 15 14 18 15
15 13 15 15 13
∑x i = 193 ∑y i = 204 ∑x 2
i = 2553 ∑x y
i i = 2691 ∑y 2
i = 2856
241
Luego reemplazando en la fórmula, el coeficiente de correla-
ción entre las notas de aritmética y lenguaje vale:
15(2691) − 193(204 )
r= = 0,878
15(2553) − (193) 15(2856) − (204 )
2 2
H0 : ρ = 0
H1 : ρ ≠ 0
0.878
tc =
1 − 0.8782 = 6.61
13
242
Ejemplo 5.12
Solución
n n n n n
Totales ∑x
i =1
i = ∑y i = ∑x
i =1
2
i = ∑y
i =1
2
i = ∑x y =
i =1
i i
i =1
n ∑ xi yi − (∑ xi )(∑ yi )
r=
[n∑ x 2
i
2
][
− (∑ xi ) n ∑ yi2 − (∑ yi )
2
]=
7(157576) − (114)(9686)
=
[7(1980) − 114 ][7(13495708) − 9686 ]
2 2
= -0.05
243
El valor obtenido nos indica una correlación nula entre las
variables involucradas. Es decir, para la muestra analizada las
variables años de servicio y sueldos no están correlacionadas.
Ejemplo 5.13
Solución
244
a) El diagrama de dispersión y el gráfico de la recta de regresión
ajustada por el método de mínimos cuadrados.
Notas álgebra
Model Summary
245
c) Los coeficientes de la recta de regresión son:
Coefficientsa
Unstandardized Standardized
Coefficients Coefficients
a b
Yˆ = 3.853 + 0.708X,
Introducción
Y = f (X 1 , X 2 , X 3 ,..., X k )
246
Explicaremos el análisis de regresión lineal múltiple con los
datos de la siguiente tabla, en la que se muestra los coeficientes
de inteligencia (IQ), los promedios de calificaciones y el tiempo
que 12 estudiantes dedican al estudio. Se desea predecir el pro-
medio de las calificaciones de estos estudiantes en función de sus
coeficientes de inteligencia y de los tiempos que dedican al estu-
dio. Se puede observar que se tiene dos variables, coeficiente de
inteligencia y tiempo dedicado al estudio, para explicar el com-
portamiento de las calificaciones promedio de los estudiantes.
Para el problema descrito se postula la forma general del mo-
delo de regresión lineal múltiple:
Y = β 0 + β1 X 1 + β 2 X 2 + e
donde:
247
ceptos de álgebra matricial se encuentran los estimadores de los
parámetros β0 , β1 , β 2 tema que escapa de los objetivos del cur-
so y que no será abordado aquí.
Los problemas de regresión múltiple serán resueltos con el
soporte del SPSS, puesto que en la mayoría de las investigacio-
nes el número de observaciones y el número de variables es gran-
de, lo que dificulta el trabajo manual.
Así, Yˆ = βˆ0 + βˆ1 X 1 + βˆ2 es las ecuación de la recta de regre-
sión múltiple ajustada por el método de mínimos cuadrados.
Ejemplo 5.14
Promedio de calificaciones,
coeficiente intelectual y tiempo dedicado al estudio
1 110 8 1.0
2 112 10 1.6
3 118 6 1.2
4 119 13 2.1
5 122 14 2.6
6 125 6 1.8
7 127 13 2.6
8 130 12 2.0
9 132 13 3.2
10 134 11 2.6
11 136 12 3.0
12 138 18 3.6
Solución
248
donde: X 1 : Coeficiente intelectual (IQ).
X 2 : Tiempo de estudio.
Y: Promedio de calificaciones
e : error
β 0 , β1 , β 2 : parámetros a estimar.
Coefficientsa
Unstandardized Standardized
Coefficients Coefficients
β̂1 βˆ0
βˆ2
249
donde:
Coeficiente de determinación
∑ (y i )
− y , se puede dividir en dos componentes: la suma de
∑ (yˆ )
2
cuadrados debido a la regresión, i − y , y la suma de cua-
250
El término coeficiente de determinación múltiple mide la
bondad de ajuste para la ecuación de regresión múltiple. Este co-
eficiente se calcula como sigue:
SCR
R2 =
SCT
Pruebas de hipótesis
251
Prueba F
SCR SCE
CMR = CME = S 2 =
k n − k −1
Y = β 0 + β1 X 1 + β 2 X 2 + ... + β k X k + e , entonces:
H 0 : β1 = β 2 = ... = β k = 0
H 1 : Al menos uno de los parámetros no es igual a cero
Estadística de prueba
CMR
F=
CME
Regla de decisión
252
Tabla de análisis de Varianza (ANOVA)
Ejemplo 5.15
Solución
Paso 1:
253
Paso 2:
ANOVAb
CMR F
CME
Estadística de prueba
CMR 3.194
Fc = = = 45.37
CME 0.0704
Paso 3:
[ ]
Para α = 0.05, k = 2; n - k - 1 = 9, P F(2,9 ) > Fteórico = 0.05 en la
tabla - Snedecor se encuentra el valor de Fteórico = 4.26 . La región
de rechazo de la hipótesis nula es el intervalo (4.26; ∞).
254
Paso 4:
Prueba t
Paso 1:
H 0 : βi = 0
H1 : βi ≠ 0
Paso 2:
βˆi
t= ~ t(n −1)
sβˆi
Paso 3:
α
[ ]
Para el nivel de significación α, P t(n −1) < tteórico = 1 − , en la ta-
2
bla t(n −1) se obtiene el valor teórico de t, tteórico . La región de re-
( ) ( )
chazo es el intervalo − ∞,−t(teórico ) U t(teórico ), ∞ .
Paso 4:
255
Si retomamos el ejemplo anterior y queremos saber si es estadísti-
camente significativo plantearemos las siguientes hipótesis.
H 0 : βi = 0
H1 : βi ≠ 0
Paso 2:
Coefficientsa
Unstandardized Standardized
Coefficients Coefficients
βˆ1 0.049
tc = = = 4.9
sβ1 0.010 .
Paso 3:
256
Paso 4:
Coefficientsa
Unstandardized Standardized
Coefficients Coefficients
βˆ2 0.118
tc = = = 4.21
sβ2 0.028
Pruebas no paramétricas
257
normal en la teoría estadística. Sin embargo, con frecuencia en mu-
chas situaciones no se conoce si la distribución desde la cual se ha
seleccionado la muestra es tal que sea aplicable el teorema del lími-
te central o si la aproximación a la distribución normal es lo sufi-
cientemente adecuada como para que los intervalos de confianza
resultantes y las pruebas de hipótesis basadas en la teoría normal
tengan validez. En tales situaciones se necesita de métodos estadís-
ticos cuya aplicación sea independiente de la forma de la densidad.
Estos métodos se denominan métodos no paramétricos.
Los métodos no paramétricos que se desarrollarán en esta sec-
ción se aplican a familias muy extensas de distribuciones en vez
de familias caracterizadas por una forma funcional particular.
La estructura de la mayoría de los métodos no pramétricos
descansa en las estadísticas de orden. Las estadísticas de orden
representadas por: X(1), X(2),…,X(n) son la consecuencia de haber
ordenado la muestra aleatoria original X1, X2, …,Xn en forma as-
cendente. Es decir:
Posición y dispersión
258
En el caso paramétrico hemos utilizado la media y la desviación
estándar poblacionales como medidas de posición y dispersión
respectivamente, pero los métodos no paramétricos utilizan como
medida de posición a la mediana M, que es el punto que divi-
de en dos partes iguales el área limitada por la función de densi-
dad f(x), tal como se grafica a continuación.
1
En una distribución continua P( X ≥ M ) = P( X ≤ M ) = .
2
f(x)
50% 50%
del del
área área
x( k +1) si n = 2k + 1
m = x( k ) + x( k +1)
si n = 2k
2
La mediana muestral no es un estimador insesgado de la me-
diana poblacional, pero este sesgo tiende a cero al aumentar el
tamaño de la muestra. Como medida de dispersión se emplea
entre otras el rango intercuartil, la diferencia entre el cuartil 3 y
el cuartil 1: R = Q3 − Q1
Ejemplo 5.16
259
Se cuenta con los siguientes valores: x1 = 0.62, x2 = 0.98, x3 = ;
0.31, x = 0.81, x = 0.53 los cuales corresponden a n = 5 valores
4 5
observados de 5 ensayos independientes de un experimento. Se
determinará la mediana muestral.
Prueba de Wilcoxon
Supuestos
260
3. La población se distribuye simétricamente
4. La escala de medición es al menos de intervalo
Hipótesis
I. H0 : M = M 0 II . H 0 : M ≥ M 0 III . H 0 : M ≤ M 0
H1 : M ≠ M 0 H1 : M < M 0 H1 : M > M 0
En cada uno de los casos con un nivel de significación α.
Estadística de prueba
261
Dependiendo de la hipótesis alternativa planteada se considera
{ }
como estadística de prueba a T = min T + , T − , T + o T − .
Si la hipótesis nula H0 es verdadera, es decir, si la mediana
poblacional, M, es igual a la mediana hipotética, M0, y se cum-
plen los supuestos, la probabilidad de observar una diferencia Di
positiva es igual a la probabilidad de observar una diferencia ne-
gativa. Entonces al repetir el muestreo, el valor esperado de T+ es
igual al valor esperado de. En una muestra específica no sucede
que T + sea exactamente igual a T -. Sin embargo, cuando H0 es
verdadera no esperamos una gran diferencia entre ambos valo-
res. Esto trae como consecuencia que un valor suficientemente
pequeño de T + o T - causa el rechazo de H0.
Valores críticos
Región crítica
Ejemplo 5.17
Hipótesis Estadística de Prueba Regla de decisión
Rechazar, H 0 : M = M 0 si
I. H0 : M = M 0
H1 : M ≠ M 0 T = min{T + , T − } T ≤d
II . H 0 : M ≥ M 0
H1 : M < M 0 T+ T+ ≤ d
III . H 0 : M ≤ M 0
H1 : M > M 0 T− T− ≤ d
262
Un psicólogo está interesado en tener evidencia suficiente para con-
cluir que las calificaciones de destreza manual promedio en estu-
diantes discapacitados es diferente de 45 puntos. Para llevar a cabo
su estudio selecciona una muestra aleatoria de 25 estudiantes dis-
capacitados y registra sus calificaciones de destreza manual. La
información que obtiene es la siguiente:
36 47 41 32 20 42 34 53 37 35 47 42
Solución.
Paso 2:
n = 25
263
Obs xi Di rango sig ran Obs xi Di rango sig ran
(|Di|) (|Di|) (|Di|) (|Di|)
Estadística de prueba:
Paso 4. Decisión
264
Región de rechazo
101 T
EDITOR OUTPUT
265
En Test Statistics el p-value = Wilcoxon
0.008 < 0.05, entonces
Signed se rechaza H0.
Ranks Test
Ranks
N Mean Sum of
Rank Ranks
destrez -
mediana
Z -2.666(a)
Asymp. Sig. (2-tailed) .008
Prueba de MANN-WHITNEY
266
dentro de cada muestra las observaciones que la conforman tam-
bién son independientes.
Esta prueba fue propuesta por Mann y Whitney (1947), ade-
más se tiene referencia que Wilcoxon (1945), propuso un proce-
dimiento semejante. Es por ello que también es conocida como la
prueba de Wilcoxon-Mann-Whitney.
Supuestos
• Las muestras aleatorias, X11, …., X1n1 y X21, …., X2n2, utiliza-
das para el análisis son seleccionadas independientemente
de sus respectivas poblaciones.
• La variable de interés es continua.
• La escala de medición observada es al menos ordinal.
• Las dos poblaciones en estudio difieren sólo con respecto a
su posición.
Hipótesis
I . H0 : M1 = M 2 II . H 0 : M 1 ≥ M 2 III . H 0 : M 1 ≤ M 2
H1 : M 1 ≠ M 2 H1 : M 1 < M 2 H1 : M 1 > M 2
267
dente (desde la más pequeña a la más grande).
3. Se asignan los rangos a cada una de las n1 + n2 observaciones
teniendo en cuenta a que muestra pertenecen. Si dos o más
observaciones son iguales (empatan) se obtiene el promedio
de los rangos que ocupan dichas observaciones en el orde-
namiento y este promedio es asignado a cada una de las ob-
servaciones empatadas.
4. Obtener la suma de los rangos asignados a la muestra 1:
n1
S= ∑ R( X ) .
i =1 1i
Estadística de Prueba
n (n +1)
La estadística de prueba es, T = S − 1 1
2
donde:
Valores críticos
Región crítica
268
Hipótesis Estadística de Prueba Regla de decisión
Rechazar, H 0 : M 1 = M 2 si
I. H 0 : M 1 = M 2 n1 ( n1 + 1)
T =S− T < wα 2 o T > w1−α 2
H1 : M 1 ≠ M 2 2
III. H 0 : M 1 ≤ M 2 n1 ( n1 + 1)
T =S− T > w1−α
H1 : M 1 > M 2 2
Gráficamente:
I. H 0 : M 1 = M 2
H1 : M 1 ≠ M 2
II. H 0 : M 1 ≥ M 2
H1 : M 1 < M 2
III. H 0 : M 1 ≤ M 2
H1 : M 1 > M 2
269
Ejemplo 5.18
Fac.Admin. 99 85 73 98 83 88 99 80 74 91 80 94 94 98 80
Fac. Derch. 78 74 69 79 57 78 79 68 59 91 89 55 60 55 79
Solución.
Hipótesis alternativa: H1 : M 0 ≠ M 1
270
Paso 2: En base a las muestras aleatorias se realizan los cálculos
para obtener la estadística de prueba.
55 1,5
55 1,5
57 3
59 4
60 5
68 6
69 7
73 8
74 9,5
74 9,5
78 11,5
78 11,5
79 14
79 14
79 14
80 17
80 17
80 17
83 19
85 20
88 21
89 22
91 23,5
91 23,5
94 25,5
94 25,5
98 27,5
98 27,5
99 29,5
99 29,5
Suma de 148
rangos: S
271
Estadística de prueba:
15(15 + 1)
T = 148 − = 28
2
Paso 4. Decisión
272
2. Proceder a ejecutar los siguientes comandos: Analyze/
Nonparametric Test/Two-Independent-Samples Test/
test type Mnn-Whitney U, llevar la variable puntaje a
test variable list y la variable facultad a grouping va-
riable/ mediante define groups se indican los grupos/
click OK..
273
OUTPUT
NPar Tests
Mann-Whitney Test
Ranks
Test Statistics
PUNTAJE
Mann-Whitney U 28,000
Wilcoxon W 148,000
Z -3,511
Asymp. Sig. (2-tailed) ,000
Exact Sig. 2*(1-tailed Sig.) ,000
Prueba de Kruskall-Wallis
274
Supuestos
Hipótesis
275
Estadística de prueba:
12 k
Ri2
H= ∑ − 3(n + 1)
n( n + 1) i =1 ni
Ejemplo 5.19
276
gador está interesado en conocer si existe diferencia en las califica-
ciones medias de las poblaciones en estudio. Las calificaciones son
las siguientes:
85 75 59 94
92 69 78 89
83 83 67 80
79 81 62 88
81 72 83
69 79 76
90
Solución
85 18 75 7 59 1 94 23
92 22 69 4,5 78 9 89 20
83 16 83 16 67 3 80 12
79 10,5 81 13,5 62 2 88 19
81 13,5 72 6 83 16
69 4,5 79 10,5 76 8
90 21
n1 = 6 R1 = 84,5 n2 = 7 R2 = 78,5 n3 = 6 R3 = 39 n4 = 4 R4 = 74
277
Estadística de prueba:
12 4 Ri2
H= ∑ − 3(23 + 1)
23(24) i =1 ni
H > 7.81
Paso 4. Decisión
278
279
OUTPUT
Kruskal-Wallis Test
Ranks
GRUPO N Mean
Rank
CALIFICA 1 6 14,08
2 7 11,21
3 6 6,50
4 4 18,50
Total 23
Test Statisticsa,b
CALIFICA
Chi-Square 8,308
df 3
Asymp. Sig. ,040
280
ño n, X 1 , X 2 ,.., X n . Cuando no existen observaciones iguales, la
función de distribución empírica está definida por,
Supuesto
Hipótesis
281
Región crítica
Ejemplo 5.20
Considere α = 0.05
Solución
282
Paso 2. Cálculo de la estadística de prueba
( x − 152)
x Frecuencia z= F0 ( x ) S20 ( x ) D = S 20 ( x ) − F0 ( x )
13
Región crítica
283
No se puede concluir que la población no se distribuya nor-
malmente.
284
OUTPUT
NPar Tests
MEDIDA
N 20
Normal Parameters a.b Mean 152,2500
Std. Deviation 13,0943
Most Extreme Absolute ,108
Differences Positive ,108
Negative -,071
Kolmogorov-Smirnov Z ,485
Asymp. Sig. (2-tailed) ,973
285
Ejerccios
286
c) Usar comandos del SPSS y obtener el coeficiente de correlación
lineal e interprete.
d) Suponiendo que sea posible, realice el análisis de regresión
lineal simple e interprete los coeficientes.
e) Usando las correspondientes fórmulas, compruebe los valo-
res encontrados.
Candidato A B C D E F G H I J
X 2.96 2.46 3.36 3.40 2.43 2.12 2.85 3.12 3.20 2.75
Y 529 506 591 610 474 509 550 600 575 540
Ansiedad 28 41 35 39 31 42 50 46 45 37
Examen Final 82 58 63 89 92 64 55 70 51 72
287
d. Determine la línea de regresión por mínimos cuadrados para
predecir la calificación del examen final dado el nivel de an-
siedad.
e. Si un estudiante tiene un nivel de ansiedad de 38, ¿qué valor
podría predecirse para su calificación en el examen final?.
1 14 5 14
2 8 15 5
3 9 19 8
4 13 33 11
5 10 39 15
6 11 38 14
7 14 74 18
8 15 74 19
9 11 11 7
10 16 78 17
288
c. Realice un análisis de regresión lineal de: Y con X2.
d. Realice un análisis de regresión lineal de: Y con X3.
e. Realice un análisis de regresión múltiple.
Y X1 X2 X3
48 22 38 15
48 19 38 15
47 20 37 20
46 20 37 17
46 17 35 19
43 21 34 15
42 21 34 14
42 19 33 20
41 17 33 13
40 15 32 15
39 15 32 12
32 11 25 15
31 17 25 9
30 16 23 9
29 15 22 13
29 15 21 9
28 16 20 11
27 16 18 11
27 13 17 10
27 12 15 8
26 12 15 8
289
Adolescentes Wais Razonamiento Razonamiento Relaciones Velocidad y
mecánico abstracto espaciales exactitud
Y X1 X2 X3
1 48 22 38 15 25
2 48 19 38 15 40
3 47 20 37 20 21
4 46 20 37 17 20
5 46 17 35 19 18
6 43 21 34 15 17
7 42 21 34 14 31
8 42 19 33 20 35
9 41 17 33 13 35
10 40 15 32 15 27
11 39 15 32 12 17
12 32 11 25 15 28
13 31 17 25 9 29
14 30 16 23 9 37
15 29 15 22 13 29
16 29 15 21 9 39
17 28 16 20 11 28
18 27 16 18 11 38
290
5.8 Se conocen las edades (X) y la presión sanguínea (Y) de 12
mujeres. Si
∑x i = 628, ∑y i = 1684, ∑x 2
i = 34416, ∑y 2
i = 238822, ∑x yi i = 89894.
X: Primera
Prueba 12 10 16 16 14 12 20 8 18 14
Y: Segunda
Prueba 16 14 14 20 10 16 20 12 16 12
Creatividad: CREAT.
Coeficiente intelectual: C.I.
Capacidad de orden: ORDEN
Rendimiento escolar: RENDIM.
291
CASO ORDEN C.I. RENDIM. CREAT. CASO ORDEN C.I. RENDIM. CREAT.
292
d) Sobre la base de los datos obtenidos en esta experiencia pode-
mos afirmar que existe relación lineal entre rendimiento esco-
lar y creatividad?.
e) ¿Cuál es la recta que mejor permite predecir la variable ren-
dimiento escolar en función de la variable creatividad? In-
terprete.
f) ¿Manteniendo constante la capacidad intelectual de los
alumnos, la creatividad está relacionada con el rendimiento
escolar?.
g) En base a los datos obtenidos en esta experiencia podemos
afirmar que ¿existe relación lineal entre el rendimiento es-
colar y la inteligencia?.
h) ¿Cuál es la ecuación de la recta que permite predecir el ren-
dimiento escolar en función de la variable inteligencia? In-
terprete.
293
muestra ciudades de cada una de ellas. Obteniéndose la siguien-
te información.
294