Está en la página 1de 183

ES

Estadstica descriptiva

.Jess Amn
. 1
NDICE GENERAL

Prlogo ... ... . .. . .... .. ........ . . ... .. .... ... .. ... .. . . .. ...... . ..... .. ... 7

l. INTRODUCCIN

1. Matemticas en Psicologia . . . . . . . . . . . . . . .. . . . . . . . . .. . . . . . . . . . . . . . . . 19

l. l. Lenguaje matemlico en las ciencias . . . . .. . . . . . . . . . . . . . . .. . . . . . . . .. . .. . 19


1.2. Lenguaje matemtico en Psicologa ........ . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 19
1.3. Matemticas y complejidad de las manifestaciones psicolgicas . . . . . . . . . . . 21
1.4. Comentario sobre los modelos matemlicos complejos en Psicologa . . . . . . 22

2. Medida en Psicologa .. . . .. . . . . . . . . . . . . . . . . . . . . . . .. .. . . . . .. . . . . . . . . . 25

2. 1. Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . .. . . . . . . 25
2.2. Carac1crsticas y modalidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.3 . Delinicin de medida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.4. Delinicin de escala de medida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.5. Tipos de escalas de medida (nominal , onJinal, de intervalos, de razn) . . . 29
2.6. Comentario sobre las escalas de medida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
2.7. Resumen: Deliniciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

3. Qu es la Estadistca7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

3. 1. Conceptos previos (poblacin. muestra. parmelro, estadstico) . . . . . . . . . . . 36


3.2. Delinicin de Es1adstica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
3.3. Divisin de la Estadistica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
3.4. Tareas de la Estadstica Descripliva (recogida. organizacin y anlisis de
datos) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
3.5. Resumen: Definiciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
12 / Indice general
Indice general / 13

11. ESTUDIO DE UNA SOLA VARIABLE 8. Puntuaciones tpicas . 1.14

8 .1 . Puntuaciones J irccta,. d ifen,nciak ~ y t1p1ca, . . ... .... . . 1}4


8.2. Propiedades de las puntuaciones tpicas . . . ....... ... . .... . . . 1:15
4. Organizacin de datos . ... 45
8.3. Significado de las puntuaciones d irectas, diferenciales y tpicas . . . 138
!!.4. Comparabilidad de las puntuaciones tpicas .. . . ..... .. . ... .. . .... . 139
4.1. Definicio nes p revias (consta nte. variable. mud:~idades y clase,. frecuencia. 142
8.5. Nota . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . ... .. ..... . . .
proporcin, porcentaJe) ......... . .. ...... ........ . .. ....... . ......... . 45 143
8.6. Combinaci n de puntuaciones . . . . . . . . . . . . . . . . . . . . . . . .. . . .
~.2. Organizacin de datos (variables cualitativa,, variabks cuasi-cuanlitativas . 8. 7. Desviac in tpica y puntuac,onc, tpkas . .......... . .. . .... .... . .. . ... . 144
variables cuan cicacivas discretas. v ariabks cuan ti ta ti vas conti nua,) ... ... . . 47
8 .8 . Puntuaciones tpicas y curva normal (lmite del hi;tograma ,un intervalos
4.3. Resumen: Definiciones ................................. .. ... . 61
infinitamente pequeo,. n ,rva normal, relacin entre las reas bajo la curva
Ejercicios ... ..... .... .. . .... . ... .. . ... . ........ .... . . . . . .. . ... . . . . . . 62
normal y propor<:ione; o probabilidades, uso de la tabla de las reas bajo la
curva normal) ...... .. .. . . . .. .. . .. . .... ..... . . . .. . .......... .... .. . 144
8.9. Puntuaciones T . ..... .. ......... .. ... . .. .. . ... .. .. . ...... .... ..... . . 149
64 M.10. Resumen: Definiciones y f rmulas . . . . . .. . . ...... . ..... . ... .. . 150
5. Estadsticos de posicin o tendencia central ... . . . ..... ... .. . .... .
Ejercicios . . . . . . . . . . . . . . ... .... .. ...... . . . ... . .. . . . .... .... .. . .... . 151
5.1 I ncroduccin . ....... . . . . ..... ... ... .... .. ...... . .... . .... .. ......... . 64
5.2. Media aritmtica (definicin. clculo. propiedades. mtodo abreviado pa ra e l
c:kulo de la media, media ponderada. medias aritmticas generalizadas) .. 64 111. ESTUDIO CONJUNTO DE DOS VARIABLES
5.3. Mediana (intro<luccin previa. d efinicin. d kulo. propiedades) ....... . .. . 78
5.4. Moda (d efinicin , p ropiedades) .. . . ... . . . ... . ... . . .... .. . ..... . . . ... .. . 89
5.5. Percen tilcs (definicin , clculo) .. . . . .... .. . . . . .. . . . , ... . .. .. ..... ... .. . 91 9. Organizacin de datos e ndices de tendencia central y variabilidad 159
5.6. Resume n: Definiciones y frmul as ............................ . ...... . . 95
Ejercic ios ....... . .... ... .... ... . . .. .. . .... . ......... ... .. .. .. . . .. .. 97 9.1. Oistribucin conjunta de frecuencias . . .. . .. . .. .. ... .... .. .... .. . . . .. .. 159
9.2. Representacin grfica ............. . . .... ..... .. .. .. .. .. ... . . .. . . . .. . 160
9.3. Distr ibucio nes marginales de X y de Y ....... .. ... . . .. . .. ... ..... . ... . . 161
9.4. Distribucio nes cond icionales de X y de Y ..... .. .. . ........... . .. 163
6. Estadsticos de variabilidad o dispersin .............. .. ...... ... . 103 168
9.5. Covar ianza de X e Y (definicin. clculo . propiedad es) . . . . . . . . . . . . . .
9.6. Resumen: Definiciones y frmulas ............. .... ...... . .. . . ...... .. . 175
6.1. Introduccin ................... .. .... ...... . ....... .. .... ...... ..... . 103 176
Ejercicios . . . . . . . . . . . . . . . .... . ...... .. .... . .. .... . .. . . . . .. .. ... . .. . . .
6.2. Desviacin media (definicin. clculo. propiedades) ... .. .. . .... .. ..... . . . 103
6 .3. Varianza y d esviacin tpica (introduccin, tlcfinkin. clculo. p ropiedades,
mto tlo abreviatlo para el clculo de la varianza) ... . . ........... . ...... . 105 179
10. Relacin (lineal) entre dos variables ..... . ... . ..... . .
6.4. Amplitud total (definicin. clculo. propied atles) . . .. .. .. .... . ...... . ... 114
6.5. Amplitud semiintercuartil (tlefinicin. clculo. p ropiedades) ...... . . ... . .. 116 179
10.1. Idea general ....... ....... .. . .... . ........... . . .. ...... . ...... . . . . . . .
6 .6. Coeficiente <le variac i n (tlefinicin. clculo, propiedades) .. ... . . ... .. .. 117
10.2. Coeficiente tle correlacin de Pearson (definicin. clculo. propiedades,
6.7. Notas ...... .. . ......... ..... .............. - - - - - . ... 11 !! 180
mtodo abreviado para el calculo de ,,,.) . . ..... ....... .. .... .. . ... .. . . .
6.8. Resumen: Definiciones y frmu las . . .. . .......... .. . . . ....... . .. . . . .. 119 190
10.3. Factores de los que d epende r,, . ... ... . . , .. . ........... . .. . . . .. ..... .
Ejercicios ........ . . ........ .... . ... . .. . ........... . ...... ..... . .. . . . . 120 195
10.4. Condicin esencial para poder calcular ,., . .......... ... . . . . . .. . .. . ... .
10.5. Interpretacin de ,,,. ........... . ............ .... . .... .. . . .. . .. . ..... . 196
10.6. Correlacin y causalidad ... .... . . . .... . .... . ........... .. . ... . . .. ... . 196
10.7. Resumen: Definiciones y frmulas ... .. .. . . . . .. ... . ...... ... ...... . 197
7. Estadsticos de asimetra y apuntamiento . . . . .. .. . .. . ... . ..... . . . . 123
Ej ercicios .. ..... . . . . . . ..... .... . .. .. . . .. .. . .............. . ......... 198

7.1. 1ntro<lu ccin 123


7.2. Asimetra (idea ge neral , ndice basado en los tres cuartiles. indice basado en 201
el momento tic tercer ord en) ................ . ...... . .... . .. .... ...... . 123 11. Ecuaciones de regresin
7.3. Apuntamiento (idea previa. ntlic c basatlo en el momento de cu arto orden) 130
11.1 . Regresin y prediccin ......... .... . .... ......... . ......... .. , . . . . .. 201
7.4 . Resumen: Defi niciones y frmulas ........ ... .. ....... . . ..... .. . . . . ... . ) )2
11.2. Ecuacin de la rec ta en el plano . . .. . ..... . .. .... ........... . .. . ..... . 201
Ejercicios .... .. ......... .... . .. .. ... .......... . .... ............ . .. . 133
14 / Indice g eneral Indice general / 15

11.3. Ecua ciones de las rec tas de regresin d e Y sobre X segn el cri terio d e 15. Relacin entr variables nominales .. . . ... . ... ...... . ... < .. 272
mnimos cuadrados ............... . .......................... . .. . . . . . 203
11.4. Ecuaciones de las rectas d e regresin de X sobre Y seg n el criterio de 15. l. Idea previa. .. . . . . ..... . .. .. . .. . ................. . . . . . . . . . . . . . . . . . . . 272
mnimos cuadrados .. . .. . . . ....... . .... . .... . . .. . . . ..... . . .. . . . . . . .. . 21 4 15.2. Coeficiente Q de Yule (undamento y rmula, clculo, propiedades) . . . . 272
11.5. A plicacin d e las rectas de regresin ...... . .... .. . . ........ . .... . . .. . . 2 16 15.3. Coeficie nte 1.' (fundamento y frmula , clculo. prop iedades} . . . . . . . . . . . . . 279
11 .6. Resume n: Definiciones y frmulas ........... . . . . . ........... . .. ..... . 21 7 15.4 . Coeficiente de conti ngencia, C (fundamento y frmula. clculo. propiedades) 284
Apndice. (Introduccin , fu nci n c uadrtica , potencial, exponencial. loga- 15.5. 1n terprc taci n de Q y C . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 287
rtmica/ . . .. .. .. . .. ..... . .... . ...... . .. . . ...... .... .... .. .. . .. . ..... . 218 15.6. Resumen : Definiciones y frmu las . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 287
E1ercicios .. .. . . .. . ... . .. .. , .... .. .. . . . .. . ... . . . . . .. ........ . ... . . .. 228 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 288

16. Relacin entre variabl es dicotmicas o dicotomizadas 289


12. El coeficiente de correlacin de Pearson r,,., y las rectas de
16. 1. Conceptos previos (variables d icotmicas y dicotomizadas) . . . .. . ... . .. . . 289
regresin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 230
16.2 . Coefi cientes de correlaci n q ue son mera aplicacin de r,, (coeficiente de
correlaci n biserial puntu al , rr coeficiente de correlacin cp. propiedades
12. 1. r_;, como ndice de reduccin error en los pronstic os . . . . . . . . . . . . . . . . . . 230
d e rr y de <p . interpretacin de rr y de cp ) .. . . ... .. . . . .. . . . 289
12.2. r;, co mo ndice de aproximacin d e los puntos a la rec ta de regresin.. . 234
)6.3 . Coefi cientes de correlacin que son estimacin de r,, (coeficiente de corre-
12.3. r;, com o proporcin d e la varianza d e Y a sociada a la var iacin de X . . . 235
lacin biserial, r. coeficiente de correlacin tetracrica , r, . propiedades de r
12.4. Resum en: Definiciones y frmulas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 239
y de r,, interpretacin de r, y de r. ) ... . .. . . ....... . .. . .. .. .. .. . ... .. . 297
Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 239
16.4. Comparacin de rb, y de r .. .... . .. .. . ... . .. . .. . .. ... .. . ........ . . 303
16.5. Co mparacin d e 1p y r, . ... .. .. ... ..... . .. .. ..... .. . ... . . .... . .... .. . . 304
16.6. Resumen: Definiciones y f rmulas . .... . .. .. ....... . ... . ...... . . ..... . 304
16.7. Apndice: Ded uccin de las frmu las derr y de <p a partir der,,. (d educcin
13. Relacin (curvilnea) entre dos variables: Razn de correlacin . 243
de la frmula de r,, a partir de r,,., deduccin de la frmula de cp a partir
305
13. 1. Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 243
t e;~i~i;s : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 308
13.2. Fu ndamento y d efinicin (razn de correlacin d e Y sob re X) . . . . . . . . . . 244
13.3. Clcu lo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 247
13.4 . P ropiedades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . .. . . . .. . . . . .. . . . . . 250 IV. ESTUDIO CONJUNTO DE TRES VARIABLES
13.5. Raz n de correlacin d e X sobre Y . . . . . . . . . . . . . . . . . . . . . . . . . 252
13.6. Interpre taci n d e 11;, o d e 11',,. . . . . . . . . . . . . . .. . . . . . .. . . .. .. .. . . . . .. . . 252
13.7. R esu men : Definicin y frmu las . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 253 17. Correlacin y regresin . ... ............ . . ......... ..... ... .. . .... . . 313
Ej ercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 253
17. 1. Introduccin ..... . . . . . .... ........... .... .. . . ... . .... .. ........ . . .. . 313
17.2. Correlaci n parcial (u ndamento y frm ula, clculo, propiedades) . .. .. .. . 3 13
17 .3. Regresin mltip le (introduccin, ecu aci n del p lano en un espacio tridi-
14. Relacin entre variables ordinales . . . . . . . . . . . . . . . . . . . . . . . . .. .. . . . . 255 mensional , ecuaciones d e los planos de regresin de X, sobre X, y X, segn
el criterio de mnimos cuadrados , ap licacin de los planos de regresin) . 3 16
17.4. Correlaci n m ltiple (definici n . clculo, propied ades) . . ....... .. . 330
14 . 1.Idea p revia.......... . .. . ..... . .... . . . . . . .. . .. .. . . . ........... . .. . 255
17.5. Resumen: Defi niciones y frmulas . .................... . . ... ........ . . 333
14.2. Coefi ciente d e correlacin d e Spea rman r, (fu nd amento y frmula. clculo ,
Ejercicios . . .. .. ....... .. .. .. .. .. . . .. . ...... .. ..... . .. .. . . . .. . .. ... . . 337
propiedades) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 255
14.J. Coefi ciente d e correlaci n d e Ke ndall t (fundame nto y definic i n , clculo ,
propiedad es) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 259 18. El coeficiente de correlacin mltiple y los planos d e regresin . 339
14 .4. Coeficiente de correlacin d e G oodman y Kru skal (introdu ccin . definicin ,
clculo, p ropiedades) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 262 18 . 1. R1" como ndice de reduccin de error en los pronsticos .. .. . .. ... .. . 339
14 .5. Interpre tacin d e los coefi cientes d e correlacin o rdinal . . . . . . . . . . . . . . . . 267 18.2. R;"' co mo nd ice de aproximacin d e los puntos al plano de regresin .. 343
14.6. A pndice: Deduccin d el coeficie nte d e correlaci n d e Sp carman ........ 267 18.3. Rl "' como proporcin d e la varianza de X, asoc iada a la variacin d e X , y X , 344
14.7. Resumen: Definicio nes y frmulas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 269 18.4. Resumen : Definiciones y frmulas . . .... .. ... ...... . .. . .. ........ . ... . 346
Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 269 Ejercicios ... . .. .. . ... . .... . .. . . . ... . .. . .. . .. ... ....... . . . . . 346
16 / Indice general

V. APNDICES ..,,.

Apndice 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 351

1. Signo (simple) de sumar. r (definicin, propiedades) . . . . . . . . . . . . . . . . . . . . . . 351


2. Signo (doble) de sumar. rr (definicin. propiedades) .... .... ...... ... ..... 354
Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 359

Apndice 11. Soluciones a los ejercicios propuestos .................. 361

Apndice 111. Tablas .. ... ..... ..... .............. .. ... .. ..... ... .. ... ...

Bibliografa .. .. .. . .. .. . .. .. . .. .. .. .. .. . .. . .. .. . .. . . . .. . . . . .. .. .. .. .. .. .. .
371

375
1
381
Indice de autores
Indice de materias . .. . . . . . . . . .. . .. . .. . . . . . .. . . . . . . . . . . . . . . .. . . . . . .. . . . .. 383

Introduccin
1
Matemticas en Psicolog a

1.1. Lenguaje matemtico en las ciencias

Po r regla general, las ciencias se han man tenido a un nivel meramen te cuali-
tativo en su in fancia y han ido ascendiendo a niveles superiores cuantitativos al
ir alcanzando su edad adulta. Los investigadores se han esforzado en ir traducien-
do a lenguaje matemtico la form ulacin verbal primitiva d e las ideas cientficas
y este esfuerzo ha resuhado fec undo p ara la ciencia por un doble motivo . En primer
lugar, el in tento de expresar matemticamen te las hiptesis cientficas ha obli-
gad o a los investigadores a clarificar ms sus conceptos y a perfil ar mejor esas
hiptesis an tes de p lasmarlas definitivamente. En segundo lugar, toda hiptesis
cien tfica es susceptible de una comprobacin experimental ms satisfactoria
cuando viene formulada matemticamente que cuando viene propuesta en forma
meramente verbal.
Son m ltiples las citas aducibles segn las cuales van unidos estrechamente el
progreso de una ciencia y el grado de su desarrollo matemtico. Slo voy a presen-
tar el testimonio de dos psiclogos. Para Stevens (l 951, pg. 1), la importancia
de una ciencia es medida comnmente por el grado segn el cual hace uso de las
matemticas. A juicio de Atkinson et al., (1965, pg. 2), es un hecho histrico
fam iliar que a medida que la ciencia progresa, ;us teoras se van haciendo ms
y ms matemticas en la forma.
Parece, pues, clara la tendencia general de las ciencias modernas a expresar sus
conceptos matemticamente.

1.2. Lenguaje matemtico en Psicologa

La Psicologa moderna, casi desde sus comienzos, ha intentado proponer sus


leyes {o, al menos, algunas) bajo frmulas matemticas. A este respecto puede
ser consultado Miller (1964). Thurstonc (1959, pg. 9) cree que la Psicologa se-
guir el camino recorrido por otras ciencias, hacindose cad a vez ms y ms ma-
20 / Estadstica para Ps,clogos Matemticas en Psicologa / 21

temtica a medida que vaya formu lando ms rigurosamente sus ideas fundamentales. o fr ecido cada uno de ellos por separado. En algunas ocasiones. la discordancia
Horst (i966, pg. 2) piensa que la Psicologa ha tardado tanto tiempo en ocupar entre los resultados de uno y otro enfoque puede sugerirnos un plan teamien to
su lugar apropiado entre las ciencias aplicadas, quiz por no haber reconocid o la n uevo m ucho ms acertado que el concebid o previamente.
importancia de la medida en la investigacin psicolgica. Segn Nunnally (1967,
pg. 6) todas las teoras psicolgicas, con el tiempo, irn siendo propuestas en for-
ma matemtica. Bailey (1967, IX) admite que la Biomatemlica ayudar a la Bio-
1.3. Matemticas y complejidad de las manifestaciones
loga y a la Medicina, como la Fsica matemtica ha ayudado a la Fsica. Existe.
psicolgicas
pues, un convencimiento casi general de que el lenguaje cuantitativo ir asumiend o
cada vez mayor relieve en las ciencias de la conducta y, en particular, en la Psico-
loga. De hecho, los modelos matemticos juegan hoy un papel importante en mu- De lo dicho se infiere que hoy las tcnicas matemticas son utilizadas en Psico-
chas reas psicolgicas: Psicologa experimental, diferencial, social, industrial, logia con gran profusin y no poco xito. Por ello consideramos superfluo poner-
pedaggica, ... y aun clnica. La lectura de bastantes artculos y libros relaciona- nos a refutar ciertas dificultades clsicas contra la aplicabilidad de los mtodos
dos con estas disciplinas exige una preparacin matemtica no ligera y, en oca- matemticos en Psicologa. Si n embargo, queremos responder a una pregunta
siones, profunda. Desde luego, sin esta ltima es imposible leer revistas de espe- que, obviamente, pueden hacer muchos lectores. Es posible acercarse a los pro-
cializacin psico o bio-matemtica (Psychometrika, Biometrica, Biome- blemas psicolgicos, de innegable complejidad, con instrumentos de naturaleza
trics, ,dournal of Mathematical Psychology, etc.) o entender libros, cada vez simple y elemental?
ms numerosos, que abordan los problemas psicolgicos de modo rigurosamente Comencemos admitiendo que tanto en Psicologa humana , como, sobre todo ,
mtrico. Igualmente, es necesaria una slida preparacin matemtica para com- en Psicologa animal, existen procesos bastante rudimentarios encajables fcil-
prender diversas leyes o teoras psicolgicas, tal como hoy son propuestas . As, mente dentro de esquemas matemticos. En estos casos no s lo es p osible, sino.
por ejemplo, leyes psicofisicas y psicomtricas, teoras sobre el aprendizaje, teora tambin, muy til la introduccin de instrumentos matemticos. No obstante,
de la decisin y teora de la informacin aplicadas a la Psicologa, teora de tests, debemos aceptar que son escasos los fenmenos psicolgicos de gran simpl icidad
etctera. En conclusin , las matemticas se van h aciendo cada vez ms indispen- y q ue, sobre todo, los fenmenos psquicos de mximo inters son p recisamente
sables dentro de las ciencias humanas y, en particular, dentro de . la Psicologa. los de contextura ms compleja. Qu hacer? En primer lugar, podernos conside-
Los mltiples libros de Matemticas para psiclogos, socilogos, bilogos, etc., rar aspectos parciales del fenmeno com plejo, limitando nuestra investigacin
que vienen apareciendo durante estos ltimos aos, son un ndice cla ro de que a ellos y, por supuesto, restringiendo, despus, n uestras conclusiones a esos ni-
estos investigadores necesitan y piden una fundamentacin matemtica cada vez cos aspectos. De esta manera pod remos uti lizar tcnicas matemticas relativamente
ms seria para poder abordar adecuadamente muchos problemas de sus corres- simples. En segundo lugar, conviene advertir que existen modelos matemticos
pondientes especialidades. muy complejos y a los q ue podemos acudir en muchos casos. Desde Juego, su ma-
Sin negar, ni mucho menos, la importancia del lenguaje matemtico en Psico- nejo exige con ocimientos matemticos no asequibles a .todos los psicl ogos. Es una
loga, conviene, no obstante, advertir que la tarea fundamental de un psiclogo dificultad innegable, pero no invencible. Es extrnseca y superable con una prepa-
es llegar a consecuencias psicolgicas a partir de premisas, tambin, psicolgicas. racin matemtica adecuada. En conclusin, parece p osible acercarse a muchos
Los instr umentos matemticos sern tiles en Psicologa en cuanto nos ayuden problemas psicolgicos con instrumentos matemticos con tal que stos sean sufi-
a alcanzar conclusiones psicolgicas. Sin duda alguna, es mucho ms estimable cientemente apropiados. Aclaremos lo dicho con un ejemplo.
una afirmacin con contenido psicolgico, expuesta en trminos verbales, que una Dos personas. Pablo y Santiago, consideran una frase sobre cierto problema
afirmacin carente de significado psicolgico, por ms elegante que sea su formu- social. Tienen que decir si estn de acuerdo o en desacuerdo con la misma. Pues
lacin matemtica y por ms riguroso que sea el proceso matemtico que nos ha bien, la situacin siguiente es muy posible. Pa blo responde que est de acuerdo
llevado a ella. Por tanto, como psiclogos, deberemos abordar matemticamente y Santiago que est en desacuerdo. Cuando Santiago escucha a Pablo razonar
un problema psicolgico siempre y slo cuando esta tctica nos ayude a encon- su respuesta afirmativa , nos dice : Yo tambin habra estado de acuerdo si hu-
trar una solucin psicolgica apropiada. Si un problema psicolgico no admite biera considerado la fra se desde el punto de vista bajo el cual l la ha considerado.
un enfoque matemtico, no nos empearemos en introducir modelos matemti- A su vez, cuando Pablo escucha a Santiago razonar su respuesta negativa, nos
cos que, en el caso ms favorable. sern perfectamente intiles. Con todo , si un dice : Yo tambin habra estado en desacuerdo si hubiera considerado la frase
problema psicolgico admite un enfoque matemtico y otro no matemtico. ser. desde el pun to de vista bajo el cual l la ha consid erado. Sin embargo. es muy pre-
muy interesante acometer el problema bajo los dos puntos de vista. Ambos enfo- visible que no preguntemos a ninguno de los dos la razn de sus respuestas y nos
ques, lejos de se;: antitticos, se complementarn mutuamente. El resultado con- contentemos con atribuir a Pablo un 1 (por estar de acuerdo) y a Santiago un O
junto de ambos puede ofrecernos una solucin ms rica que la que nos hubiera (por estar en desacuerdo). Si se trata de un cuestionario compuesto de diversas
22 / EstadstJca para Psiclogos
M atemticas en Ps,col oga / 23
frases, nos limitaremos a atribuir a cada persona una puntuacin igual al nmero
b) Es verdad que los modelos matemaucos complejos suelen ser los nica-
de frases con las que ha estado de acuerdo. Este tratamiento matemtico es muy
mente vlidos en situaciones psicolgicas compl~jas y que el dominio de tales mo-
asequible. De modo muy elemental dispondremos enseguida de una puntuacin
d elos exige un nivel matemtico algo ms que mediano. Sin embargo. conviene
para cada persona. Pero, es esto legtimo? Probablemente, no. En efecto, la tc-
hacer algunas pun tualizaciones. En primer lugar, segn ya hemos indicado, no
tica anterior supone implcitamente que a alta puntuacin en el cuestionario co-
todos los problemas psicolgicos son extremad amente complejos. Ms adelante
rresponde estar de acuerdo con el tema social del mismo . Ahora bien, tal supo-
sicin slo sera defendible si dicho tema social fuera unidimensional, admitiese nos encontraremos, de hecho, con situaciones bastante simples. Comprobaremos
cmo en ellas son aplicables legtimamente tcnicas matemticas sencill as y cmo
un nico enfoque, y ste hubiera sido asumido por todas las personas que respon-
sus resul tados numricos son susceptibles de una interpretacin psicolgica muy
den al cuestionario. Ms an, deberamos estar seguros de que la nica dimensin
satisfactoria. En segundo lugar, la apl icacin de modelos matemticos complejos
considerada por ellas ha sido entendida tal como lo pretenda el que aplica el cues-
no implica necesariamente una preparacin matemtica extremadamente especia-
tionario. De no cumplirse estas condiciones, el nmero atribuido a cada persona
lizada . Son deseables unos conocimientos matemticos serios, pero no es nece-
es susceptible de mltiples y aun equvocas interpretaciones psicosociales. Esto
sario que el in vestigador psicomatemtico sea especialista en reas matemticas
quiere decir que el modelo matemtico simple aplicado en esta ocasin no es el
concretas. Lo verdaderamente importante es que sepa acercarse con mentalidad
ms apropiado, pero ello no significa que sea rechazable todo tratamiento mate-
matemtica a los problemas q ue se le presenten. Es d ecir, que se esfuerce en asim ila r
mtico. Podemos valernos de un modelo que nos descubra las dimensiones fun -
el proceso lgico subyacente al razonamiento matemtico. que logre captar la es-
damentales simples del tema social complejo y que nos permi ta determinar la si-
tructura formal del modelo matemtico de que se trate, q ue conozca las condiciones
tuacin de cada persona respecto a cada una de esas dimensiones o facetas. Este
que lo hacen posible y, consiguientemen te, las condiciones que ste exige de la
modelo matemtico tratara de considerar los diversos aspectos considerados por
realidad concreta para que sea legtima su aplicacin a la misma . Slo as, sabr
las personas que responden al cuestionario, evaluando a las personas segn cada
elegir el modelo matemtico ms apropiado en cada situacin prctica de la vida
uno de estos aspectos, sin contentarse con clasificarlas en las dos nicas categoras
real. Por otra parte, asimilada esta mentalidad matemtica, no slo podr manejar
a favor o en contra. Es posible que muchos temas sociales, simples y unidi-
mensionales en apariencia, sean complejos y multidimensionales *. Pero ello no con suficiente pericia instrumentos matemticos bastan te sofisticados, sino que
podr enta blar dilogo con los especialistas en Estadstica matemtica para que
implica que sea inviable todo enfoque matemtico. Slo quiere decir que los pro-
le asesoren en el planteamiento mtrico de algn problema psicolgico y con los
blemas psicosociales multidimensionales deben ser afrontados con modelos mul -
especialistas de un Centro de Clculo para que le ayuden en la eleccin o creacin
tidimensionales. Admitimos ciertas dificultades de orden prctico en su aplica-
del programa ms adecuado con el q ue pueda resolver su problema psicolgico
cin, pero negamos la imposibilidad de acometer dichos problemas complejos con
instrumentos matemticos. mediante un ordenador electrnico.
e) Los modelos matemticos, aun los ms complejos, son todava bastante
elemen tales respecto a la realidad psicolgica concreta. Las relaciones previstas
por el modelo se verifican exactamente en una realid ad simplificada, ideal, y slo
1.4. Comentario sobre los modelos matemticos complejos aproximadamente en la realidad compleja, existente. El grado de aproximacin
en Psicologa ser tanto m,iyor, cuanto menor haya sido el proceso simplificador que ha permi-
tido crear el modelo. Cuanto ms mutilemos la realidad concreta, ms sencillo
a) Ante todo, queremos reafirmar que estos modelos complejos no slo son
y ms manejable ser el modelo creado a p artir de esa realid ad cercenad a, pero
posibles, ~ino que an son los nicos realistas en muchos casos. Es errneo creer ms problemtica ser su aplicacin a la realidad concreta, no mutilada. Cuanto
que las tcnicas matemticas algo complicadas son construcciones puramen te menos m utilemos la realidad concreta, mas com plicado ser el modelo, pero ms
ideales, muy propias para discusiones tericas, pero sin relacin alguna con los fiable ser su aplicacin a dicha realidad. Tendremos que ll egar a un compromiso:
problemas de la vida real. Con gran frecu encia los instrumentos sencillos y d e fcil simpl ificar la realidad concreta lo menos posible, p ero , a la vez lo suficiente de
aplicacin suelen ser menos realistas y menos tiles que los modelos matemticos modo que el modelo creado a partir de ella sea fc ilmen te manejable desde el punto
complejos a la hora de tomar decisiones psicolgicas de importancia en situaciones de vista in strumental matemtico. En Psicologa los casos prcticos que se nos
prcticas complejas. presentan en la vida real suelen ser ms complejos q ue los que aparecen en otras
ciencias de la Naturaleza. Por ello, si deseamos modelos sencillos, deberemos
Por poner un ejemplo, Amn ()969} comp rob cmo una faceta social tan aparentemente un1 simplificar la realidad concreta de man era notable. Aun q uedndonos con mo-
dimensional como la religio sidad l:)tililaria. medida con un cuestionario sumamente purificado. se ma - delos algo complejos, deberemos imponer a la realidad mutilaciones de ciena
nifest como pluriditp.cosional, siendo, adems. bast ante independientes entre s la s dimension es en las
que se descompoo3.-' impor tancia. Ello quiere decir que en Psicologa debemos ser prudentemente
cautos en la aplicacin de los modelos a la realidad concreta y en la traduc-
24 / Estadstica para Pstclogos

c1n a lenguaje psicolgico de los resultados numricos obtenidos mediante el


modelo.
Conviene advertir que los investigadores psicomatemticos con slida pre-
paracin matemtica suelen ser muy cautos en la interpretacin psicolgica de
2
los resultados numricos. La razn es que ellos conocen muy bien las limitaciones Medida en Psicologa
de los modelos matemticos aun de aquellos que pueden aparecer bastan te com-
plejos. Son mucho ms audaces en dichas interpretaciones psicolgicas los que
carecen de adecuada preparacin matemtica, precisamente por carecer de ella,
por desconocer la limitacin de los modelos que usan. Es necesaria una buena
preparacin matemtica para conocer la potencia y la debilidad de las tcnicas
estadsticas y, consiguientemente, para saber usarlas con eficacia y, a la vez, con
prudencia.

2.1 . Introduccin

Hemos visto que es posible enfocar matemticamen te los problemas psicol-


gicos. Este enfoque im plica atri buir nmeros a las manifestaciones psicolgicas,
someter estos nmeros a ciertas tcnicas matemticas de modo que lleguemos a
un resultad o numrico fi nal e interpretar psicolgicamente este resultado. En
realidad, el estadio estrictamente matemtico es el segundo que comienza con
datos numricos y concluye con resultados, tambien, n umricos. Pero ste es in-
concebible sin una preva atribucin d e nmeros a las manifestacio nes psicol-
gicas. Por ello, vamos ahora a referirnos brevemente a dicha atribucin numrica o,
lo que es equivalente, a la delnicin de medida.

2.2 . Caracteristicas y modalidades

Los objetos manifiestan caractersticas segn diversas modalidades. Asi, por


ejemplo, las personas manifiestan la caracterstica sexo segn dos modalida-
des: varn y mujer: la caracterstica religin segn muchas modalidades: cat-
lico, protestante, mahometano, budista, ateo, etc. ; la caracterstica peso segn
infini tas modalidades, pues entre d os modalidades, por prximas que se encuentren,
son siempre posibles otras modalidades in termedias.

2.3. Definicin de medida

Atribucin de n meros a los objetos segn ciertas reglas* .

La definicin anterior est tomada de Stevens . En su primera publ icacin sobre la medida
~.-!'"
( 1946. pg. 2 , deca: Parafra seando a N. R, Campbell . ... . podemos deci r que medid a. en su sentido
mas ampli o. es definida como la at ribucin de numerales a objetos o su cesos de acuerdo con regl as"' ,
26 / Estadstica para Psiclogos Medida en Psicologa / 21

Tenemos por una parte nmeros y, por otra, objetos con sus correspondientes dola en algunos casos particulares, para concluir ofreciendo una defin icin general.
modalidades. Entre los nmeros existen ciertas relaciones que son vlidas siempre Consideremos la caracterstica peso. Aceptemos como u nidad emprica de
dentro del mundo aritmtico, ideal. Entre las modalidades existen ciertas relacio- medida la modalidad p resentada por un cuerpo elegido arbitrariamente. Me-
nes (en unos casos, pocas y simples; en otros, bastantes y complejas) que son veri- diante una balanza podemos elegir otro cuerpo que manifieste la caracterstica
ficables en el mundo emprico, real. Pues bien, la atribucin d e nmeros a los ob- peso bajo la misma modalidad que el primero (es decir, que pese lo mismo ). Me-
jetos no va a ser arbitraria, sino de acuerdo con esta regla general: aceptar slo diante estos dos cuerpos podemos elegir otro nuevo cuya modalidad sea igual a
como relaciones vlidas entre los nmeros aquellas que sean verificables emp- la suma de las modalidades de los dos cuerpos anteriores (es decir, q ue pese lo
ricamente entre las correspondientes modalidades. Esta regla general se concre- mismo que los dos primeros juntos). Para ello, basta con colocar estos dos cuerpos
tar en unas u otras reglas particulares, segn sea mayor o menor el nmero de en un platillo de la balanza y en el otro un tercer cuerpo tal que la balanza quede
relaciones verificables empricamente. equilibrada. Esta operacin la podemos ir repitiendo, poniendo tres cuerpos d e
Exigimos, por tanto, un cierto paralelismo o isomorfismo entre las relaciones peso unidad en un platillo y en el otro un cuerpo tal que la balanza permanezca
aceptadas como vlidas entre los nmeros y las relaciones verificables entre las en equilibrio. Asi, llegaremos a obtener un conjunto de cuerpos materiales, uno
correspondientes modalidades (en nuestro caso, psicolgicas). Consiguientemente, con la modalidad unitaria , otro con una modalidad dos veces mayor que la uni-
con los nmeros atribuidos a las modalidades, slo podremos realizar aquellas taria, etc. Podemos ahora atribuir nmeros a estas modalidades (o a estos cuerpos
operaciones que estn de acuerdo con las relaciones aceptadas como vlidas entre manifestando la caracterstica, segn estas modalidades). Una atribucin obvia
los mismos. Por otra parte, estas relaciones son precisamente las verificables entre (no la nica, como luego veremos) es asignar el 1 a la primera modalidad, el 2 a
las modalidades empricas, psicolgicas. En consecuencia, parece que el resul- la modalidad emprica doble, el 3 a la triple, ele. Esta atribucin es obvia, en cuanto
tado numrico final, obtenido operando de este modo con los nmeros atribuidos que la primera modalidad ha sido elegida arbitrariamente como modalidad em-
a las modalidades psicolgicas, admitir una interpretacin psicolgica razonable. prica unitaria.
Ordinariamente, la expresin atribucin de nmeros a las modalidades Pues bien, llamaremos escala de medida a este conjunto de modalidades em-
ser una simplificacin de atribucin de nmeros a los objetos segn las modali- pricas distintas y de nmeros distintos, puestos en correspondencia biunvoca
dades bajo las cuales manifiestan cierta caracterstica. Pasamos por alto las ven- (a cada modalidad le corresponde un solo nmero y a cada nmero una sola mo-
tajas e inconvenientes que esta equivalencia lleva consigo. Tampoco nos detene- dalidad). O, lo que es igual, a este conjunto de cuerpos materiales, con pesos dis-
mos a discutir si los nmeros deben ser atribuidos a los objetos o a sus caracters- tintos, y de los nmeros distintos atribuidos a dichos cuerpos. Medi ante esta es-
ticas, por creer dicha discusin ajena al fin de este tex to . nicamente, nos conten- cala podemos atribuir nmeros de modo coherente a otro cuerpo cualquiera,
tamos con proponer la anterior equivalencia, usando preferentemente la expresin comparando su modalidad peso con las modalidades de la escala tipo acabada
primera por meras razones de sencillez. de cons1ruir y atribuyndole el nmero de la escala asociado a la modalidad que
coincide empricamente con la modalidad del cuerpo en cuestin.
Veamos otro ejemplo algo ms complejo. Se trata de la caracterstica tempera-
tura . Consideremos una vasija llena de agua y situada sobre una fuente calorifica.
2.4. Definicin de escala de medida Introduzcamos dentro del agua un tubo estrecho de vidrio en uno de cuyos extre-
mos lleva un pequeo depsito conteniendo mercurio. Al aumentar la tempera-
La palabra escala es usada profusamente en la literatura psicomatemtica , tura el mercurio se dilata y va avanzando por el tubo de vidrio que supondremos
pero raramente definida. Ya Suppes y Zinnes se quejaban (1968, pg. 10) de que en posicin vertical y con el depsito de mercurio en su extremo inferior. En un
es raro encontrar en la literatura sobre la medida una definicin exacta de escalas. momento arbitrario la vasija manifestar la caracterstica temperatura segn cier1a
Ni el mismo Stevens ha si do lo suficientemente explcito. Suppes y Zinnes han pre- modalidad determinada y la columna de mercurio habr alcanzado una altura de-
sentado una definicin clara de escala. Algo parecido ocurre con Coombs, Dawes terminada. Sealemos una raya en el tubo de vidrio junto al nivel alcanzado por
y Tverski (l 970) y con Pfanzagl (1971). el mercurio en ese momento. Vayamos aumentando la temperatura del agua y
Veamos qu entendemos aqu por escala de medida . Comenzaremos definin- en otro momento, tambin arbitrario, veamos hasta dnde ha ascendido la columna
de mercurio marcando otra raya en el tubo de vidrio junto al nivel alcanzado por
el mercurio en este segundo momento . Sigamos calentando el agua hasta el pre-
En artculos posleriores (195 1, 1959. 1966. 1968a , 1975. por ejemplo) volver a proponer illnlicas o
parecidas formulaciones sobre la medida. Ordinanamenle usa la r alabra numeral, pero, lambin. ciso momento en que la diferencia entre esta altura y la obtenida en el momento
usa la palabra nmero (vase, por ej emplo, 1968b, pg. 850). Segn algu nos amores, hay que segundo sea igual que la diferencia entre las alturas alcanzadas en los momentos
diferenciar cuidadosamen1e los dos vocablos numeral y nmero. As, enlre olros. Lorge (1%7,
pg. 44), Sender (l'ljS, pg. 50). Segn ellos. numeral es un concepto ms amplio que nmero.
segundo y primero respectivamente y hagamos otra raya en el tubo de vidrio junto
Con todo, Steveos ( 19~9. pg. 19) no parece dar mayor imponancia a esta dislincin. al nivel alcanzado por el mercurio en este tercer momento . Si verificamos una ope-
28 / Estadstica para Psiclogos Medida en Ps,co/ogia / 29

racwn semejante en repetidas ocasiones, el tubo de vidrio habr quedado mar- Ntese que hablam os de modalidades y nmeros relacionados biunvocamente.
cado con una sucesin de rayas equidistantes, correspondientes a las modalida- Ordinariamente, tendremos conjuntos de objetos tales que, dentro de cada con-
des de la caracterstica temperatura manifestadas por el agua de la vasija en el junto, todos sus objetos no manifiesten la caracterstica de que se trate bajo moda-
primer momento, en el segundo, en el 1ercero, etc. Podemos, ahora, atribui r n- lidades distintas. Es decir, 1endremos ms objetos que modalidades. En este caso,
meros a esas rayas. A una cualquiera de ellas le atribuimos el valor O. A cada una a cada objeto le corresponde un solo nmero; pero un mismo nmero puede corres-
de las rayas superiores (correspondientes a modalidades ms clidas) les vamos ponder a varios objetos (todos los que manifies ten la caracterstica seg n la misma
atribuyendo los nmeros 1, 2, 3, . .. A su vez, a cada una de las rayas inferiores modalidad). En el caso general, tendremos n objetos y III modalidades. Si defini-
(correspondientes a modalidades ms fras) les vamos atribuyendo los nmeros mos la escala como conjunto de objetos y de nmeros, deberemos distinguir d os
- 1, - 2, - 3, . .. casos. En el primero, m = n ; habr correspondencia biunvoca entre objetos y
Pues bien, llamaremos escala de medida a este conjunto de rayas y de nmeros nmeros (isomorfismo ). En el segundo, m < 11; no habr correspondencia biu-
relacionados biunvocamente. Mediante esta escala podemos atribuir nmeros nvoca, ser slo unvoca : a cada objeto un solo nmero (homomorfismo). Para
de modo coherente a un cuerpo cualquiera. Para ello, le ponemos en contacto con evitar estas distinciones, hemos definido la escala como un conjunto de modali-
el tubo de vidrio tipo (o termmetro), acabado de construir, y observamos hasta dades (distintas) y de nmeros (distintos) relacion ados, siempre, biunvocamente.
qu raya de ste, r., ha ascendido la columna de mercurio. Hecho esto, atribui-
remos al cuerpo en cuestin el nmero correspondiente a '
Por supuesto, la sucesin de nmeros(... , - 3, - 2, -1, O, !, 2, 3, . . .), aunque 2.5. Tipos de escalas de medida
obvia, no es la nica, segn veremos ms adelante. Adems, es claro que ahora la
medida es indirecta, en cuanto que lo que medimos directamente es la altura alcan- Al medir, o sea, al atribuir nmeros a los objetos, decamos q ue slo acept-
zada por el mercurio e indirectamente la temperatura causante de esa altura. Antes, bamos como vlidas entre los nmeros aquellas relaciones que fueran verificables
en cambio, medamos directamente la caracter.stica peso. empricamente entre las correspondientes modalidades. Ahora bien , estas rela-
Consideremos, finalmente, la caracterstica provincia de origen. Emprica- ciones son muy simples en algunos casos y complejas en otros. Por consiguien-
mente podemos distinguir las modalidades Soria y Segovia, por ejemplo. Tendre- te, en unos casos slo aceptaremos como vlidas entre los nmeros, relaciones
mos tantas modalidades distintas como provincias espaolas. Podemos atribuir muy sen cillas ; en cambio, en los otros daremos validez a relaciones aritmticas
a cada provincia un nmero distinto. Tendremos tantos nmeros distintos como ms complejas.
provincias distintas.
Pues bien, diremos que nos encon tramos a bajo o alto nivel de medida, segn
Pues bien, llamaremos escala de medida a este conjunto de modalidades (tantas sea menor o mayor la complejidad de las relaciones que podamos verificar emp-
como provincias espaolas) y de nmeros relacionados biunvocamen te. Mediante ricamente entre las modalidades. Esta terminologa parece la ms oportuna. Sin
esta escala, podemos atribuir nmeros de modo coherente a una persona cualquiera. embargo, en vez de niveles se suele hablar preferentemente de escalas de med ida.
Le atribuiremos, sencillamente, el nmero de la escala correspondiente a la mo- Nosotros hablaremos a veces de niveles de medida ; pero, por ahora, aceptaremos
dalidad bajo la cual manifiesta esa persona su provincia de origen . Por supuesto la expresin escalas de medida, dada su aceptacin casi un iversal. Esta ltima
existen infinitas sucesiones de nmeros distintos que puedan ser atribuidos a las expresin tiene, tambin, un sentido razonable. La escala es el conjunto de moda-
modalidades anteriores, segn veremos luego. lidades empricas y de nmeros relacionados biunvocamente. Pues bien, segn
En conclusin, podemos ofrecer la siguiente definicin general de escala : con- que entre las modalidades de la escala sea verificable uno u otro tipo de relaciones,
junto de modalidades (dis1intas) y conjunto de nmeros (distintos) relacionados tendremos uno u otro tipo de escala. Naturalmente, dentro de cada uno de estos
biunvocamente. Es decir, a cada modalidad le corresponde un solo nmero y a tipos slo sern vlidas entre los nmeros aquellas relaciones que sean verifica-
cada nmero una sola modalidad. bles entre las correspondientes modalidades.
La escala, as definida, es un instrumento natural de medida . Con ella podemos Distinguiremos cuatro tipos de escalas, siguiendo el esq uema tradicional pro-
atribuir nmeros a cualquier objeto. Para ello, basta con observar qu modalidad, puesto ya por Stevens en su primera publicacin sobre teora de la med ida (1946).
m,, de la escala coincide empricamente con la modalidad del objeto en cuestin,
atribuyendo a ste el nmero correspondiente a m, en la escala.
La definicin anterior de escala est de acuerdo con la idea que tenemos de 2.5.1. Escala nominal
uno de los instrumentos de medida ms usuales, la regla. Una regla no es ms que
un conjunto de rayas equidistantes marcadas sobre un listn de madera (o de otro Supongamos que, dadas dos o ms modalidades, slo podemos comprobar
material) y un ~pnjunto de nmeros, en correspondencia biunvoca : a cada raya empricamente si ellas son iguales o distin tas. Consiguientemen te, entre los nmeros
le corresponde n solo nmero y a cada nmero una sola raya. atribuidos a las mismas slo aceptaremos como vlida la relacin igualdad-des-
30 / Estadistica para Psiclogos Medida en Psicologia / 31
igualdad. Si, por ejemplo, se trata de la caracterstica provincia de origen y por ellos). Sigamos as hasta poner en l timo lugar aquel que raya a los nueve res-
atribuimos el 1 a la modalidad Soria, el 2 a la modalidad Segovia y el 3 a la moda- tantes y no es rayado por ninguno de ellos.
lidad Avila, entre los nmeros l, 2 y 3 slo aceptaremos como vlida la relacin Tenemos, por tanto, diez modalidades de la caracterstica dureza ordenadas
igualdad-desigualdad. Es decir, el smbolo l ser considerado como algo distinto empricamente desde la ms blanda hasta la ms dura. Atribuyamos a la primera
de los smbolos 2 y 3, y stos, tambin, como distintos entre s, del mismo modo que modalidad el nmero l, a la segunda el nmero 2, ... , a la ltima el nmero 10.
son distintas entre s las tres modalidades correspondientes; pero, el 2 no ser Ahora a ceptaremos no slo que los nmeros l , 2, . .. , l O son smbolos distintos,
considerado como mayor que el 1, ni el 3 como mayor que el 2 y el 1, del m ismo sino que, adems, el 2 es mayor que el l , el 3 es mayor que el 2 y el l, .. . , el 1O
modo que la modalidad Segovia no es una manifestacin mayor de la caracters- es mayor que los nueve primeros nmeros enteros positivos. Pero, a este nivel no
tica provincia de origen que la modalidad Soria, sino, simplemente, una mani- tiene sentido admitir como vlida entre los nmeros una igualdad del tipo 7 - 6 =
festacin distinta. A este nivel, los nmeros atribuidos son puros nombres>> (de = 3 - 2, pues no podemos comprobar empricamente si la diferencia de dureza
aqu el apelativo nominal) que podan ser sustituidos por cualesquiera smbolos entre la modalidad a la que he atribuido el 7 y la m odalidad a la que he atribuido
no numricos: letras, colores, figuras geomtricas, etc. Por consiguiente, los n- el 6 es igual que la diferencia de dureza entre la modalidad a la qu e he atribuido
meros no gozan aqu de ninguna de las propiedades aritmticas. No tiene ningn el 3 y la modalidad a la que he atribuido el 2.
sentido aceptar a este nivel que 3 = 2 + J, pues ello implicara que la modalidad Evidentemente, la escala ordinal permanece invanante frente a cualquier trans-
Avila era el resultado de unir las modalidades Soria y Segovia. En otras palabras. formacin montona creciente. En otras palabras, seguiremos teniendo una misma
que el resultado de unir una persona con la modalidad Soria y otra persona con escala ordinal, cuando, permaneciendo las mismas modalidades tipo, los n meros
la modalidad Segovia dara como resultado una nueva persona con la modalidad atribuidos a las mismas sean sometidos a una transformacin m ontona creciente,
Avila. es decir, que haga corresponder a una sucesin ordenada de nmeros otra sucesin
Evidentemente, la escala nominal permanece invariante frente a cualquier trans- de nmeros ordenados del mismo modo que los primeros. Si, por ejemplo, a tres
formacin que a nmeros distintos haga corresponder nmeros distintos. Es decir, modalidades ordenadas de menor a mayor les hemos a tribuido los nmeros 3, 5 y 8,
seguiremos teniendo una misma escala nominal, cuando, permaneciendo las mismas podemos atribuirles, con igual derecho, otras ternas del tipo : 6, 70, 95 ; 82, 195,
modalidades tipo, los nmeros atribuidos a las mismas sean transformados en otros 981; etc.
con la nica limitacin de que a nmeros distintos primitivos, correspondan , tam-
bin, nmeros distintos nuevos. Si, por ejemplo, a tres modalidades distintas les
hemos a tribuido los nmeros 5, 7, JO, podemos atribuirles con igual derecho cuales- 2.5.3. Escala de intervalos
quiera otra terna compuesta de nmeros distintos como 6, 9, 2; 7, 3, 1; etc.
Supongamos que, dadas dos o ms modalidades, n o slo podemos comprobar
empricamente la igualdad-desigualdad y el orden, sino que, tambin , podemos
2.5.2. Escala ordinal establecer una unidad emprica de medid a y observar cuntas veces se encue ntra
contenida dentro de la diferencia entre dos modalidades cualesquiera. Consiguien-
Supongamos que, dadas dos o ms modalidades, no slo podemos comprobar si temente, dadas tres modalidades a, b y e, podemos comprobar empricamen te
son iguales o distintas, sino, siendo distintas, cul de cada dos es la mayor. Es decir, cuntas veces la diferencia entre a y b es mayor (o menor) que la diferencia entre
dados dos objetos, podemos comprobar empricamente si ambos manifiestan una b y e, suponiendo que las dos diferencias son distintas. Consiguientemente, entre
caracterstica segn la misma o distinta modalidad y, supuesto que la manifiesten los nmeros atribuidos a las modalidades admitiremos como vlidas las relaciones
segn distinta, podemos comprobar cul de los dos la manifiesta segn una moda- igualdad-desigualdad y orden, y las operaciones suma y resta entre ellos . Adems,
lidad mayor. Consiguientemente, entre los nmeros atribuidos a las modalidades podemos admitir como vlidas la multiplicacin y divisin entre las diferencias
admitiremos como vlidas las relaciones igualdad-desigualdad y orden. obtenidas a partir de dichos nmeros (no entre los m ismos nmeros).
Si, por ejemplo, se trata de la caracterstica dureza, diremos que A es ms duro Supongamos que se trata de la caracterstica temperatura. Elegimos tres cuer-
que B si A raya a By no es rayado por ste, al frotarlos entre s. Es una definicin pos y los ponemos en contacto con un tubo de vidrio en uno de cuyos extremos
operativa de dureza, es decir, verificable empricamente. Vamos a construir una lleva un pequeo depsito con mercurio. Observamos ahora el nivel alcanzado
escala de dureza, o sea, una escala para medir la caracterstica dureza. Elijamos por el mercurio en cada uno de los tres casos. Tendremos tres niveles termomtri-
diez cuerpos de naturaleza fsica distinta y ordenmoslos empricamente de acuerdo cos n 1 , n 2 , 11 3 Elegimos arbitrariamente una unidad emprica de medida, es decir,
con la definicin anterior. Pongamos en primer Jugar aquel cuerpo que es rayado una distancia arbitraria sobre el tubo de vidrio. Por sencillez, supongamos que las
por todos y no raya a ninguno. Pongamos en segundo lugar aquel que raya al pri- diferencias entr e 11 1, n 2 y n 3 contienen esa unidad un nmero entero de veces. Pa ra
mero (sin ser fyado por ste) y no raya a ninguno de los restantes (siendo rayado ser ms concretos, supongamos que la unidad emprica q ueda comprendida dos
32 / Estadistica para Ps,clogos Medi da en Ps,colog ia / 33
veces entre n 1 y n 2 , y ocho veces entre n2 y n 3 , es decir, que la diferencia entre n 2 arbitrario que llamaremos v. Aplicamos r. a las tres varillas A, B y C y contamos
y n 3 es cuatro veces mayor que la diferencia entre 11 1 y 112 (No se olvi de que todas el nmero de veces q ue v. cabe.en A, en B y en C. Supongamos q ue v. cabe tres veces
estas relaciones las estamos constatando empricamente.) en A, seis veces en B y 24 veces en C. Tenemos, pues, tres objetos manifestando la
Pues bien, una atribucin obvia de nmeros a las tres modalidades anteriores caracterstica longitud segn tres modalidades distintas y equivalentes respecti-
puede ser: 4, 6, 14. Entre estos tres nmeros aceptaremos como vlidas las rela- vamen te a tres, seis y veinticuatro veces la mod alidad unitaria.
ciones: 4 f 6 f 14, 4 < 6 < 14, 14 - 6 = 4(6 - 4). Una atribucin obvia de nmeros a las tres modalidades anteriores puede ser:
Evidentemente, la escala de intervalos permanece invariante frente a cualquier 3, 6, 24. Entre estos tres nmeros son vlidas las relaciones siguientes : 3 ef= 6+ 24,
transformacin de la forma y = ax + b, donde a y b son dos constantes arbitra- 3 < 6 < 24, 24 - 6 = 6(6 - 3), y, adems, 6/3 = 2, 24/3 = 8, 24/6 = 4, dado
rias. En otras palabras, seguiremos teniendo una misma escala de intervalos, que empricamente podemos comprobar que la modalidad longitud de B es
cuando, permaneciendo las mismas modalidades tipo, los nmeros atribuidos a doble de la de A , la de Ces ocho veces la de A y la de Ces c uatro veces la de B .
ellas son sometidos a una transformacin de la forma y = ax + b. Esto es debido Evidentemente, la escala de razn es invariante fren te a cualquier transforma-
a que son arbitrarios tanto el origen, como la unidad de medida. Por consiguiente, cin de la forma y = ax, d onde a es una constan te arbitraria . En o tras palabras,
tan legtima es la terna primitiva 4, 6, 14, como la terna (4a + b), (6a + b), (14a + b), seguiremos teniendo la misma escala de razn, cuando, permaneciendo, las mismas
donde a y b son dos constantes arbitrarias. As, por ejemplo, para a = 2 y b = - 5, modalidades tipo, los nmeros atribuidos a ellas son sometidos a una transformacin
tendremos la terna 3, 7, 23. Para esta nueva terna siguen siendo vlidas las tres de la forma y = ax. Esto es debido a ser a rbitraria la unidad de medida, pero no
relaciones que fueron vlidas para la terna primitiva, a saber, 3 4= 7 4= 23, 3 < 7 < el origen. Ahora el origen emprico corresponde siempre a la carencia total de la
< 23, 23 - 7 = 4(7 - 3). caracterstica, a la modalidad nula. No lo podemos elegir arbitrariamente donde
Ntese que la introduccin de la unidad emprica de medida legtima la suma y nos parezca.
resta entre los nmeros atribuidos a las modalidades y la multiplicacin y la divisin Por consiguiente, tan legtima es la terna primitiva: 3, 6, 24, como la terna:
entre las diferencias obtenidas a partir de dichos nmeros. Pero no legitima la mul- 3a, 611, 24a, donde II es una constante arbitraria. As, por ejemplo, para 11 = 5,
tiplicacin y divisin entre los nmeros mismos. La legitimidad de estas ltimas tendremos la terna : 15, 30, 120. Para esta nueva terna siguen siendo vlidas las
operaciones slo es posible cuando contemos con un origen emprico absoluto y mismas r elaciones que fueron vlidas para la terna primitiva : 15 ef= 30 f 120,
no con un origen meramente arbitrario. Ahora bien, esta arbitrariedad en el origen 15 < 30 < 120, 120 - 30 = 6(30 - 15), 30/ 15 = 2, 120/ 15 = 8, 120/30 = 4.
es propia de las escalas de intervalos. As, por ejemplo, el origen emprico d e iem-
peraturas en la graduacin centgrada no corresponde a la temperatura nula , a la
carencia total de calor, es decir, no es absoluto. Ese origen corresponde a la moda-
lidad o grado de temperatura a la cual se funde el hielo, es decir, es arbitrario. Con 2.6. Comentario sobre las escalas de medida
el mismo derecho podramos haber elegido como modalidad origen cualquier otra
temperatura inferior o superior a la que se funde el hielo. As se hace, por ejemplo, En primer lugar, la aceptacin de cuatro tipos de escalas es tan arbitraria como
en las escalas Fahrenheit y Reaumur. lo hubiera sido aceptar dos, veinticinco u otro nmero cualquiera . El mismo Stevens,
propugnador de las cuatro escalas, acepta la posibilidad de esquemas no cuatri-
partitos. Las anteriores escalas representan los cuatro tipos de uso comn . Otros
2.5.4. Escala de razn tipos son posibles (1968b, pg. 850). De hecho, otros autores han aceptado otros
tipos de escalas o han aceptado el cuatripartito d e Stevens, pero modificado .
Supongamos que, dadas dos o ms mo dalidades, no slo podemos comprobar En segundo lugar, conviene distinguir en tre medida y estadstica . Esta es una
empricamente la igualdad-desigualdad, el orden y cuntas veces la diferencia ciencia matemtica que comienza y concluye con nmeros, sin atender al origen
entre dos modalidades es mayor que la diferencia entre otras dos, sino, adems, ex tramatcmtico de los mismos y sin pretender in terpretaciones ul tramatem ticas
cuntas veces una modalidad es mayor que la otra. Por tanto, en tre dos nmeros (psicolgicas, por ejem plo ). La medida, en cambio, como atribucin de n meros a
atribuidos a las modalidades admitiremos como vlidas las relaciones igualdad- modalidades empricas (psicolgicas, en par ticular ), es el eslabn que une las modali-
desigualdad y orden, y las operaciones suma, resta, multiplicacin y divisin . dades empricas con los nmeros y, gracias a l, podemos interpretar empricamente
Supongamos que se trata de la caracterstica longitud. Elegimos tres va rillas (psicolgicamente, en particular) los resultados numricos fina les que nos ofrece la
metlicas que manifiesten la caracterstica longitud segn tres modalidades distin - estadstica. Los p uros estadsticos prescinden de las escalas de medida. As, por ejem-
tas. (Basta con escoger tres varillas tales que, al compararlas simultneamente, plo, Savage (1957, pg. 331 ). Los psiclogos, en ca mbio, no pueden adop tar una pos-
coincidaJ las tres en uno de sus extremos y difieran en el otro. ) Determinarnos tura aspticamente matemtica. Necesitan recoger da tos psicolgicos, atribuirles
arbitra'riarnente una unidad emprica de medida, es decir. un trocito de varil la nmeros, operar con estos nmeros e interpretar psicolgicamente los resultados
'l
'
li
: 34 / Estadistica para Psiclogos Medida en Ps,col og,a / 35

viene advenir, adems, que muchos de los q ue anatematiLa n a quienes usan ins-
1 finales. Si los nmeros con los que empezamos una investigacin estadstica estn
desligados de las realidades psicolgicas, no ser fcil dar una interpretacin psico- trumentos estad sticos sin encontrarse al nivel estricto de medida requerido por
lgica al resultado obtenido a partir de aquellos nmeros iniciales. estos ltimos, luego los utilizan ellos mismos sin graves escrpulos en circunstan-
cias idnticas o muy parecidas.
Est claro, pues, que como psiclogos no podemos prescindir de la interconexin
entre modalidades psicolgicas y nmeros, ni del paralelismo en tre la contextura
relacional de las modalidades psicolgicas y la contextura relacional de los nmeros.
Sin embargo, tampoco debemos exagerar la necesidad de este paralelismo. En 2.7. Resumen : Definiciones
efecto, si llevramos a sus ltimas consecuencias este isomorfismo entre modali-
dades psicolgicas y nmeros, nos sera imposible aplicar muchas de las tcnicas
estadsticas que muy frecuente y razonablemente usamos en Psicologa. Suponga- Supuesto que los objetos manifestaban cierta s caracter1sticas segn d iversas
modalidades, proponamos las siguien tes definiciones:
mos, por ejemplo, que tres personas A, By Chacen un examen de Geografia. Aunque
con las naturales reservas, podemos aceptar que la lectura imparcial de los tres ex- Medida : atribucin de nmeros a los objetos segn ciertas reglas. Estas reglas
menes nos permitir ordenar empricamente a las tres personas segn las modalidades se resumen en la siguiente: aceptar slo como vl idas entre los nmeros aquellas
bajo las cuales manifiesta cada una de ellas su ciencia geogrfica. Pero, nos atre- relaciones que sean verificables empricamente en tre las correspondientes modali-
dades.
veramos a determinar empricamente cuntas veces la diferencia de ciencia geo-
grfica entre A y B es mayor o menor que la diferencia de ciencia geogrfica entre Escala de medida: conjunto de modalidades (distin tas) y de nmeros (distintos)
By C? Esta determinacin no parece muy viable. Ahora bien, slo bajo esta con- relacionados bi un vocamente. Es decir, a cada modalidad le corresponde un solo
dicin los nmeros atribuidos a las tres modalidades pueden ser considerados nmero y a cada nmero una sola modalidad. Tendremos uno u otro tipo de escala.
corno autnticos nmeros, es decir, susceptibles de ser sometidos a operaciones segn que sean verificables empricamente ms o menos relaciones entre las moda-
aritmticas como la suma y la resta. En otras palabras, la atribucin de un 10, un lidades que forman parte de la escala. De acuerdo con este criterio. hemos distin-
g uido cuatro tipos de escalas.
9 y un 7 (con propiedades de nmeros estrictamente dichos) a las tres modalidades,
slo sera legtima si pudiramos comprobar empricamente que la diferencia entre a) Nominal: slo es verificable empricamente la igualdad-desigualdad.
la ciencia de A y la de B era la mitad que la diferencia entre la ciencia de By la de C. b) Ordinal: son verifica bles empricamente igualdad-desigualdad y orden.
Pero, como ya hemos dicho, esta comprobacin es muy dificil en una gran mayora c) De imerrulos : son verificables empricamente igualdad-desigualdad y orden.
de los casos que se presentan en Psicologa. Podemos, adems, comprobar cun tas veces q ueda contenida una unidad emp-
Qu decisin tornar ? Llegar a un compromiso razonable guiados por el sentido rica, elegida arbitrariamen te, dentro de la diferencia entre dos modalidades.
comn. Usar aquellas tcnicas estadsticas que creamos ms apropiadas en cada d) De razn; son verificables empricamente igualdad-desigua ldad y orden.
caso, en cuanto usndolas esperamos llegar, como psiclogos, a conclusiones Adems de poder comprobar empricamente cun tas veces queda contenida una
psicolgicas razonables. La experiencia parece confirmar que podemos llegar a unidad emprica , elegida arbitrariamente. dentro de la diferencia entre dos mo-
resultados numricos interpretables psicolgicamente, aunque las tcnicas esta- dalidades, podemos, tam bin, comprobar cun tas veces una modalidad cualquiera
dsticas utilizadas no hayan sido las ms oportunas, teniendo en cuenta el nivel contiene dicha unidad emprica.
o escala de medida requeridos por los datos. El mismo Stevens (1968) reconoce
este h echo. Por su parte, Amn (1 968) pudo comprobar cmo eran susceptibles
de una misma interpretacin psicolgica los resultados obtenidos a par tir de unos
datos, valindose de unas tcnicas que implicaban mero nivel nominal, de otras
que implicaban nivel ordinal y, finalmente, de otras que requeran nivel de in ter-
valos.
De todo lo dicho se desprende que no aceptamos la postura de textos como
Sender (1958), Freeman (1968), el mismo Siegel (1958), etc., que encuadran algo
rgidamente las tcnicas estadsticas dentro del esquema cuatripartito de Stevens.
Si con alguna frecuencia acudimos nosotros, tambin, a dicho esquema, ser
con gran flexibilidad y valindonos de l con fines preferentemente d idcti-
cos. En ningn caso condenaremos a los que, por ejemplo, calculen la media
aritmtic.(cfe las puntuaciones dadas por un profesor a sus alumnos en un examen
o use oiras tcnicas estadsticas sin encontrarse a su estricto nivel de medida . Con-
/!j
!I,
1
Ou es la Estadstica ? / 37

3 versitarios espaoles, pues d icha media aritm tica no es ms que la suma de las
alturas de la poblacin de universitarios espaoles dividida por el nmero de stos,
es decir, es una funcin definida sobre los valores numricos de la poblacin.
Qu es la Estadstica? Conviene distinguir entre la funcin, como tal, y el resultado numrico obte-
nido mediante la misma en cada caso concreto . La funcin es idntica en todos los
casos particulares. Por el contrario , el resultado numrico varia, en general, de
caso a caso.

3.1.4. Estadstico

Toda funci n definida sobre los valores numricos de una muestra. As, p or
ejemplo, ser estadstico la media aritmtica de las alturas de una muestra de 300 uni-
3.1. Conceptos previos versitarios espaoles.
Supongamos una poblacin constituida por diez personas a quienes hemos
3.1. 1. Poblacin aplicado una prueba objetiva. Tenemos diez observaciones y diez valores num-
ricos. Supongamos que stos son : 3, 12, 14, 8, 7, 7, 3, JO, 6, 8. Las puntuaciones
Conjunto de objetos (realmente existentes o posibles) que verifican una de- 8 y 10, por ejemplo, constituirn una muestra de esa poblacin . Ser un parmetro
finicin bien determinada. Por objeto entendemos cualquier persona, animal, cosa, la media aritmtica de las diez pun tuaciones (poblacin ), es decir, (3 + 12 + 14 +
operacin, famil ia, institucin, etc. As, por ejemplo, constituirn una poblacin + 8 + 7 + 7 + 3 + 10 + 6 + 8)/ 10 = 7,8. Ser un estadstico la media aritm-
los universitarios espaoles, las familias europeas, los coches fabricados al ao tica de las dos puntuaciones 8 y 10 (m uestra), es decir (8 + 10)/2 = 9.
por cierta empresa automovilstica, los posibles lanzamientos de un d ado. Consideremos ahora el sexo de las diez personas. Atribuyamos un J a los va-
rones y un O a las mujeres. Tenemos, tambin, diez observaciones y diez valores
numricos. Supongamos que stos son: O, 1, 1, O, 1, O, 1, l, 1, l. Ellos constituyen
3.1.2. Muestra la poblacin. Los tres primeros, por ejemplo , constituirn una muestra de esa po-
blacin. Ser un parmetro la proporcin de unos (varones ) en la poblacin
Cualquier subconjunto de una poblacin. La muestra hace siempre referencia
de las diez personas, es decir, 7/ 10 = 0,70. Ser un estadstico la proporci n de
a una poblacin de la cual es parte. Asi, por ejemplo, constituirn una muestra
de las anteriores poblaciones : 300 universitarios espaoles, 1.200 familias europeas, unos (varones) en la muestra de las tres primeras personas, es decir, 2/ 3 = 0,67.
213 coches, 80 lanzamientos de un dado.
Supongamos que observamos una caracterstica de los objetos de una pobla-
cin. Por ejemplo, consideremos la altura de los universitarios espaoles (pobla- 3.2. Definicin de Estadstica
cin). Tendremos una poblacin de observaciones y una poblacin de nmeros.
Paralelamente, observando la altura de una muestra de universitarios espaoles , Ciencia que recoge, ordena y analiza los datos de una muestra, extrada de cier-
tendremos una muestra de observaciones y una muestra de nmeros. ta pobl acin, y que, a par tir de esa muestra, valindose del Clculo de Probabili-
Es claro que, dada una misma poblacin de objetos, podemos tener diversas dades, se encarga de hacer inferencias acerca de la poi.ilacin.
poblaciones de observaciones y, consiguien temente, diversas poblaciones de n- Ordinariamente, las inferencias versarn sobre los parmetros d e la poblacin
meros, segn que estudiemos una u otra caracterstica. As, con los mismos uni- a partir de los estadsticos de la muestra. Pero, tambin, haremos inferencias acerca
versitarios espaoles, podamos haber considerado su peso, su capacidad inte- de la forma de la distribucin* de la poblacin, a partir de la forma de la distribu-
lectual, su actitud fren te a la guerra, etc. cin de la muestra. En cualquier caso las inferencias estarn basadas nicamente
en la informaci n objetiva contenida en la muestra. La informacin ser exclusi-
vamente objetiva, no su bjetiva ; contenida en la m uestra y no en o tras fue ntes ex-
3.1.3. Parmetro traas a la misma. Esta postura es la llamada clsica cuyo exponente mximo
ha sido Ronald Aymer Fisher (1890-1962). Nos limitamos a este punto de vista
Toda jtncin definida sobre los valores numricos de una poblaci n. As,
por ejemplo, ser parmetro la media ari tmtica de las alturas de todos los un i- "' En el captulo 4 trataremos sobr e di stribucin de frecuencias
11
i
!
38 / Estadistica para Psiclogos
Out! es la Estadistica? / 39
clsico por una doble razn. En primer lugar, slo con una base slida en esta-
dstica clsica es posible acceder a otros puntos de vista como el bayesiano o el A su vez, es prcticamente imposible presentar el muestreo sin haber expuesto
de la teora de la decisin . En segundo lugar, ni la estadstica enfocada bayesiana- algunas nociones previas de Probabilid ad.
mente, ni la teora de la decisin pueden presentar hoy un cuerpo de doctrina tan
estructurado como el que presenta la estadstica clsica. Adems, el enfoque clsico
hoy por hoy es mucho ms til en la aplicacin a los casos prcticos psicolgicos 3.4.2. Organizacin de los datos
que los otros dos enfoques.
Conviene distinguir entre Estadstica, estadsticas y estadstico (o estadsticos). Supongamos una muestra de 300 nmos a quienes aplicamos una prueba de
a) Estadstica es la ciencia acabada de definir. inteligencia. Estos nios manifestarn dicha caracterstica segn diversas modali-
b) Estadsticas son los resultados numricos obtenidos mediante la Estads- dades. Si la prueba consta de 20 pregu ntas, un conjunto posible de modalidades
tica : nmero de accidentes de trfico durante un mes, proporcin d e alcohlicos sera: ninguna pregunta bien respondida, una pregunta bien respondida, . .. ,
en diversas naciones, consumo medio semanal de leche por famili a, etc. veinte preguntas bien respondidas. Atribuyamos nmeros a esas modalidades.
e) Estadstico es todo valor numrico obtenido a partir de los valores pre- Una atribucin razonable (no la nica) puede ser la siguiente: un O a la primera
sentados por una muestra, segn lo dicho anteriormente. modalidad, un I a la segunda, . .. , un 20 a la vigsimo primera. (Recurdese que
Por supuesto, estadstico como sustantivo es, tambin, usado para denominar esta atribucin de nmeros, en rigor, no es propia de la Estadstica que comienza
a la persona dedicada a la Estadstica. Como adjetivo es utilizado para calificar a actuar sobre unos nmeros ya atribuidos previamente.)
personas y cosas relacionadas con la Estadstica. Tenemos, por tanto, 300 nmeros (varios de ellos necesariamente iguales entre
s) correspondientes a los 300 nios. Este conjunto desordenado de nmeros nos
ofrece una informacin muy pobre sobre la inteligencia de la muestra. Una orde-
3.3. Divisin de la Estadstica nacin razonable consiste en colocar los 21 nmeros posibles (O, 1, 2, .. . , 20)
de menor a mayor. Pues bien, al nmero de ceros le llamaremos frecuencia corres-
Segn la definicin acabada de dar en el prrafo anterior, la Estadstica cons- pondiente a la primera modalidad (mejor an, correspondien te al O, atribuido
ta de dos partes fundam entales: a la primera modalidad ), al nmero de unos le llamaremos frecuencia correspon-
a) Recogida, ordenacin y anlisis de los datos de una muestra. diente a la segunda modalidad (mejor an, correspondiente al 1, atribuido a la
b) Verificacin de inferencias acerca de la poblacin (de sus parmetros, d e segunda modalidad), ... , al nmero de veintes le llamaremos frecuencia corres-
la forma de su distribucin), a partir de la muestra (de sus estadsticos, de la fo rma pondiente a la vigsimo primera modalidad (mejor an, correspondiente al 20,
de su distribucin). atribuid o a la vigsimo primera modalidad). Por fin, llamaremos distribucin
La Probabilidad es el puente que nos permite pasar vlidamente de la muestra de frecuencias al conjunto de todas las modalid ades (mejor an, de todos los n-
a la poblacin, que legitima el salto desde las caractersticas (conocidas) de la mues- meros atribuid os a dichas modalidades) y de sus correspondientes frecuencias.
tra hasta las caractersticas (desconocidas) de la poblacin. De esta manera obtendremos una informacin ms clara sobre la inteligencia de
La primera parte constituye la Estadstica Descriptiva, cuyo cometido es des- la muestra.
cribir una muestra. La segunda parte constituye la Estadstica Jnferencial, cuyo Es posible que sean muchas vein tiuna modalidad es. Por esta razn, podamos
cometido es hacer inferencias sobre la poblacin, a partir de la muestra. En este reducirlas, por ejemplo, a siete clases, cada una de ellas con tres modalidades.
primer tomo nos limitaremos a la Estadstica Descriptiva. En el segundo tomo , La primera compuesta d e las modalidades: ninguna pregunta bien respondida,
tras unos captulos sobre Probabilidad, estudiaremos la Estadstica Inferencia!. una pregun ta bien respo ndida, dos preguntas bien respondidas. Y as, suce-
All discutiremos la diferencia entre Probabilidad y Estadstica y veremos el papel sivamente. En este caso la distribucin de frecuencias quedara constituida por el
que juega la Probabilidad en la fundam entacin de las inferencias estadsticas. conjunto de las siete clases (mejor an, por el conjunto de los siete nmeros atri-
buidos a las siete clases) y de sus correspondientes frecuencias. Por regla general,
este agrupamiento en pocas clases nos ofrece una informacin ms asequible que
3.4. Tareas de la Estadstica Descriptiva la ofrecida por las 21 modalidades.
En el caso de caractersticas no cuan tificables, por ejemplo, provincia de ori-
3.4.1 . Recogida de datos gen, podemos seguir haciendo algo anlogo a lo acabado de realizar. Suponga-
mos una muestra de J.000 espaoles que manifiestan la caracterstica provincia
Posponemos la consideracin de este apartado, dejndola para el tomo JI. de origen segn diversas modalidades. En principio el nmero de modalidades
Es muf dificil hablar de recogida de datos sin haber tratado sobre el muestreo. posibles es 50. Podemos atribuir los nmeros 1, 2, . .. , 50 a estas modalidades.
Tendremos 1.000 nmeros (varios de ellos necesariamente iguales entre s), corres-
j!
li
1
i1 40 / Estadstica para Psiclogos Ou es la Estadstica? / 41
pondientes a los 1.000 espaoles. Podemos seguir un esquema anlogo al anterior Estadslica ; ciencia que recoge, ordena y ana liza los datos de una muestra,
hasta llegar a una distribucin de frecuencias. De igual modo podemos reducir extrada de cierta poblacin, y que, a partir de esa muestra, valindose del Clculo
las 50 modalidades (provincias) a un nmero menor de clases (por ejemplo, ha- de Probabilidades, se t>ncarga de hacer inferencias acerca de la po blacin.
ciendo de cada regin una clase). Es claro que, bajo estas condiciones, las diversas Estadstica Descriptira; parte de la Es tadstica que se limita a recoger, ordenar
clases no estarn constituidas por el mismo nmero de modalidades. y analizar los datos de una muestra . Es d ecir, se limita a describir la muestra.
Estadstica Inferencia/: parte de la Estadstica que se encarga de hacer nfe-
rencias acerca de la poblacin a partir de una muestra extrada de la misma.
3-4.3. Anlisis de los datos

a) Supul'sla una sola caracterstica

En el caso de caractersticas cuantificables nos ser muy til obtener un solo


nmero, promedio de todos los nmeros de la muestra, y que, como tal, los repre-
sente a todos ellos y nos indique su posicin. Tambin, nos ser til obtener un
valor numrico que nos diga si los nmeros de la muestra se encuentran muy pr-
ximos entre s (y respecto del promedio de todos ellos) o muy distantes o dispersos
unos de otros. En resumen, calcularemos estadsticos de tendencia central o de
posicin y estadsticos de variabilidad o de dispersin.

b) Supuestas dos o ms caractersticas

Comenzaremos estudiando conjuntamente dos caractersticas. As, por ejem-


plo, podemos considerar la inteligencia espacial y la habilidad mecnica de 368 adul-
tos. Tendremos 368 pares de nmeros (cada persona tiene dos puntuaciones, una
en inteligencia espacial y otra en habilidad mecnica). A partir de ellos construi-
remos diversos ndices que nos manifiesten el grado de relacin existente entre
esas dos caractersticas y que nos permitan pronosticar, del mejor modo posible,
la puntuacin de una persona en una de las dos caractersticas, conociendo la que
ha obtenido en la otra. Veremos ms adelante cmo nos ser posible elaborar
ndices de correlacin e instrumentos de pronstico, tanto en el caso de variables
cuantificables como en el caso de no cuantificables, aunque sean distintos los modos
de alcanzarlos en uno y otro caso.
Estudiado el caso ms simple de solas dos variables, trataremos el caso de tres
variables.

3 .5. Resumen: Definiciones

Poblacin : conjunto de objetos (actuales o posibles) que veri fi can una defi-
nicin bien determinada.
Muestra: cualquier subconjun to de una poblacin.
Patjmetro : toda funcin definida sobre los valores numricos de una poblacin.
Esradsrico: toda funcin definida sobre los valores numricos de una muestra.
Q)
.e
ctl
;::
-
ctl
o>
-e ctl
.:3
(1)
o(1)
LU
ctl
e
::::,
Q)
-e
\..
1 ;
i

4
Organizacin de datos

4.1. Definiciones previas

4.1.1. Constante

Caracterstica que slo puede manifestarse bajo una nica modalidad. Por
ejemplo, la longitud de todas las circunferencias con el mismo radio.

4.1.2. Variable

Caracterstica que puede manifestarse segn dos o ms modalidades. Por


ejemplo, el peso, la inteligencia, la edad, la agudeza visual, etc. Cuando una carac-
terstica, en s misma variable, slo puede manifestarse bajo una modalidad, ser
considerada como constante. Por ejemplo, si estudiamos la extroversin en un
grupo de varones, diremos que la caraclerslica sexo se mantiene conslante en dicho
grupo .

Variable cualitatfra

Caracterstica que slo puede ser considerada a nivel meramente nominal :


sexo, profesin, lugar de origen, ele. Los nmeros atribuidos a sus moda lidades
solamente gozan de la relacin igualdad-desigualdad.

Variable cuasi cuantitatirn

Caraclerslica que puede ser considerada, como mximo, a nivel ordinal: du-
reza de los cuerpos, responsabilidad de un grupo d e operarios estimada por su ca-
...~ pataz, etc. Los nmeros atribuidos a sus modalidades slo' gozan de las relaciones
igualdad-desigualdad y orden.
1!

46 / Estadstica para Psiclogos Organizacin de datos / 47

Variable cua11tratim 4.2. Organizacin de datos

Caracterstica que puede ser considerada, al menos, a nivel de intervalos: peso, 4.2. 1. Variables cualitativas
inteligencia, fuerza fsica, nmero de hijos, etc. Con los nmeros atribuidos a las
mismas podemos realizar operaciones aritmticas. Warren (1974) investig la caracterstica tipo de color asociado a la palabra
paz (en tre otras). Para ello, la present a un grupo de cien personas, pidiendo
que cada una escogiese entre 4 colores (rojo, azul, amarillo y verde) el que mejor
Variable cuantitatira discl'l'la se ajustase a dicha palabra.
La distribucin de frecuencias fue la siguiente:
Caracterstica que no admite siempre una modalidad intermedia entre dos
cualesquiera de sus moda lidades: nmero de hijos, nmero de coches vendidos al
ao, nmero de caras al lanzar diez monedas al aire, etc. Una familia puede tener, Distribucin de frecuencias
por ejemplo, cuatro o cinco hijos, pero no cuatro y medio. Esta modalidad es im-
posible.
Color Frecuencia Proporcin Porcentaje
--- - -- - - - - -
Variable cuantitativa continua rojo 6 0,06 6
azul 58 0,58 58
amarillo 19 0,19 19
Ca racterstica que admite siempre una modalid ad intermedia entre d os cuales- verde 17 0,17 17
quiera de sus modalidades: fuerza fisica, lo ngitud, inteligencia, etc. - - - - ---
100 1,00 100

4.1.3. M odalidades y clases

Represemacin grfica
Como ya hemos indicado, frecuentemente es muy grande el nmero de moda-
lidades bajo las cuales puede manifestarse una caracterstica. Conviene reducir
estas mltiples modalidades a un nmero menor de clases. Estas clases deben
estar bien definidas (es decir, debemos saber claramente qu modalidades inclu ye
cada una de ellas dentro de s), deben ser mutuamente exclusivas (es decir, nin-
guna modalidad puede pertenecer simultneamente a dos o ms clases distintas),
deben ser exhaustivas (es decir, toda modalidad debe pertenecer necesariamente
a alguna de las clases).

4.1.4. Frecuencia, proporcin, porcentaje

Frecuencia (o, frecuencia absoluta) de una clase es el nmero d e observaciones


contenidas dentro de ella.
Proporcin (o, frecuencia relativa) de una clase es el cociente entre la frecuenc ia
1 1
absoluta d e dicha clase y el nmero total de observaciones (en todas las clases).
verde amarillo azul
Porcentaje de una clase es igual a la proporcin multiplicada por 1OO . rojo
Distribucin de frecuencias: conjunto de las clases y de las frecuencias (pro-
porciones o porcentajes) correspondientes a cada una de aquellas. O, mejor an ,
Los cuatro rectngulos anteriores tienen la misma base y sus alturas (y reas)
conjunto,<tle los nmeros atribuidos a las clases y de las frecuencias (proporciones
o porcntajes) correspondientes a cada una de aquellas. son proporcionales a las frecuenc ias (proporciones y porcentajes) correspondientes.
i:
: 1

48 / Estadistica para Psiclogos Organizacin d e datos / 49

Otras representaciones grficas son posibles: ciclogramas, pictogramas, etc. El A n ivel ordinal tiene sentido hablar de frecuencias, proporciones y porcentajes
fin de todas ellas es representar de modo intuitivo las frecuencias de cada una de acumulados (Fr. ac., Prop. ac., Porc. ac.). Ordinariamente, se suele comenzar la
las modalidades (o clases de modalidades). acumulaci n a parllr de la clase infe rior. As lo hemos hecho en el cuadro adjunto .
En el diagrama de barras las modalidades (o clases de modalidades) pueden La primera frecuencia acumulada es la frecuencia de la clase inferio~. La segunda
ser coiocadas en cualquier orden, pues representan distintos aspectos, no orde- frecuencia acumulada es la suma de las frecuen cias de las dos clases in feriores.
nados, de una caracterstica. La tercera frecuencia acum ulada es la suma de las frecuencias de las tres clases
En el ejemplo anterior las modalid ades eran slo cua tro y no pareca razona- infer iores o , lo que es equivalente, la suma de la segunda fre cuencia acumulad a
ble agruparlas en clases. Pero pueden darse otros casos en los que el agrupamiento ms la de la tercera no acumulada. Y as sucesivam ente. Por supuesto la ltima
en clases sea muy conveniente. As, por ejemplo, supongamos un colegio mayor frecuencia acumulada ser igual, siempre, a la frecuencia total. En n uestro ejemplo,
con 80 universitarios. Estudiemos la caracterstica carrera universitaria y su-
po ngamos que tenemos 15 modalidades d istintas: Filologa Clsica, Arte, Fsica, Primera frecuencia acumu lada : 147
Ingeniera Naval, Qumica, etc. Hagamos con estas 15 modalidades cuatro clases Segunda frecuencia acumulada : 147 + 129 = 276
que las engloben a todas ellas, de acuerdo con el siguiente esq uema: Tercera frecue ncia acumulada : 147 + 129 + 212 = 276 + 212 = 488
Cuarta frec uencia acumulada : 147 + 129 + 212 + 134 = 488 + 134 = 622
Distribucin de frccuC'llcias De modo anlogo se obtienen las proporciones y los porcentajes acumulados
a partir de las proporciones y porcentajes sin acum ular. Naturalmente, las pro-
Carrera univ. Frecuencia Proporcin Porcentaje porciones acumuladas p ueden, tambin , ser obknidas dividiendo cada frecuencia
-- - - acumulada por el total de las observaciones. As, en nuestro caso, 147/622 = 0,2363,
Letras 24 0,30 30 276/ 622 = 0,4437, 488/622 = O,7846, 622/622 = 1,0000_ Multiplicando por 100
Ciencias 28 0,35 35 estas proporciones acum uladas, obtendremos los correspondientes porcentajes
Ingeniera 8 0, 10 10 acumulados.
Derecho 20 0,25 25
- - --
80 l,00 100 Representacin grf ica

Con esta distribucin de frecuencias tendramos una representac10n grfica Usaremos el diagrama de barras, como antes. Sin em bargo, ahor a las clases
deben ser colocadas segn un orden bien determinado, pues represen tan aspectos
semejante a la anterior, con la nica diferencia que ahora cada barra representa a
ordenados de una caracterstica.
una clase de modalidades y no a una sola modalidad.
La figura 4. l y la figura 4.2 han sido construidas con distinta unidad de medid a.
La primera barra de la izquierda de la figura 4 .1 y la primera barra de la izquierda
4.2.2. V ariables cu as-cuantitativas de la figura 4.2 representan lo mismo, a saber, la frecue ncia (proporcin o por-
centaje) correspondiente a la modalidad mejora n ula. La razn de elegir una
Con objeto de investigar la eficacia diagnstica y teraputica de algunas tc- distinta unidad de medida ha sido meramente prctica. Si hubiramos elegido la
nicas clnicas, Harrower (1965) recopil los datos que exponemos a continuacin misma unidad, o la fi gura 4. 1 habra quedado excesivamente reducida, o la fig u-
sobre la mejora de 622 pacientes. ra 4.2 habra quedado exageradamente grande.

Mejora Free. Prop. Porc. Fr. ac. Prop~ ac. Porc. ac.
-- --- ---- - - 4.2.3. Variables cuant itat ivas discretas
Mxima (4) 134 0,21543 21.543 62 2 1,0000 100,00
Moderada (3) 212 0,34084 34,084 4 88 0,7846 78,46 Considerem os cierta situacin experimental en que una persona debe aprender
Leve (2) 129 0,20740 20,740 276 0 ,4437 44.37 una lista de pares de palabras, de manera que al presentar le una pa labra de cada
Nula (l ) 147 0.23633 23,633 147 0,2363 23,63 par sepa decir cul es la otra que forma parte del m ismo . Tomaremos como nd ice
- - - -- - - -- de dificultad de la tarea, el nmero de ensayos necesarios para asociar cada palabra
.,.""; - 622 1,00000 100,000 con la correspondiente de su par. A continuacin proponemos la distribucin


:I '
11
1

50 / Estadistica para Psiclogos


Organizacin de datos / 51

Representacin grfica

r--

.---
-
.---

(l) (2) (3) (4)

Fig. 4.J (Sin acumular) Fig. 4.2 (Acumulando)


1
de frecuencias y la representacin grfica acerca del nmero de ensayos necesitados 4 5 6 7 R 9 JO 1l 12 13
por un grupo de 59 estudiantes de Psicologa para aprender una lista de dificultad F ig . 4.3 (Sin acumular ) Fig . 4.4 (Acu mulando )
media formada por seis pares de palabras (Jez, 1976).
Respecto a la unidad de medida usada en la figura 4.3 y la usada en la figura 4.4
vale lo dicho para las figuras 4.1 y 4.2.
Dis1ribucin de frecuencias
Otra manera de representar grficamente las frecuencias acumuladas, en e(
caso de variables discretas, es la siguiente:
Nmero de ensayos Free. Prop. Porc. Free. ac. Prop, ac. Porc. ac,
------e~
13 2 0,0339 3,39 59 1,0000 100,00 ----e
12 2 0,0339 3,39 57 0,9661 96,61 --e
11 3 0,0508 5,08 55 0,9322 93,22
10 6 0,1017 10, 17 52 0,88 14 88, 14
9 10 0,1695 16,95 46 0,7797 77,97 ----<:
8 8 0,1356 13,56 36 0,6102 61,02 ~
7 7 0,1186 11 ,86 28 0,4746 47,46
6 6 0,1017 10,17 21 0,3559 35,59 ---e
5 JO 0, )695 16,95 15 0,2542 25,42 ----e
4 5 0,0847 8,47 5 0,0847 8,47

. f' . 59 0,9999 99,99 ---.e

6 9 10 11 12 13 14
11 ,
I
.,1
1 52 / Estadisttca para Psiclogos Organizacin de datos / 53
1
Este grfico es el que usaremos en Probabilidad para representar la funcin H abra que distinguir entre intervalos abiertos y cerrad os, abiertos por la de-
1 de distribucin (concepto muy parecido al de distribucin de frecuencias acumu- recha (izquierda) y cerrados por la izq uierda (derecha). En rigor, la amplitud de
ladas) en el caso de varia bles aleatorias discretas. cada intervalo elemental valdr la unidad de medida utilizada si nos valemos de
Ntese que los saltos vienen dados en los puntos 4, 5, 6, ... Por ejemplo. al intervalos semiabiertos. Sin embargo, estas distinciones, aunque importantes a
punto 6 (necesitar 6 o menos ensayos) le corresponde exactamente la proporcin nivel matem tico, tienen poca importancia a n ivel psicolgico-estadstico . Por
acumulada 0,3559. Al punto 7 le corresponde 0,4746. A todos los puntos en trt: 6 ello, las pasaremos po r alto y aceptaremos un mismo valor com o lmite exacto
y 7 (excluido el 7) les hacemos corresponder la proporcin 0,3559, pues necesitar comn de dos intervalos consecutivos, admitiendo que la amplitud de cada in -
6,45: 6,78: ... (cualquier valor entre 6 y 7, excluidos ambos) equivale a necesitar tervalo elemental vale la unidad de medida.
seis ensayos, ya que es imposible necesitar seis ensayos y una fraccin de ensayo.
Por eso, a todos los valores entre 6 y 7 (excluidos a mbos ) les hacemos corresponder
la misma proporcin que corresponde al punto 6 (necestar seis ensayos). 4.2.4.2. Interva los elementales y compuestos

Recordemos que cada valor d iscreto representa a todos los valores situados
4.2.4. Variables cuantitativas continuas media unidad a su izquierda y meda unidad a su derecha. Es decir, con cada va lor
discreto va asociado un intervalo de amplitud unidad qu e hemos llamado element al.
4.2.4.1. Interpretacin continua de los valores discretos Llamaremos intervalo compuesto (o, simplem ente, intervalo) al conjunto de var ios
intervalos elemen ta les consecutivos. Por regla general, todos los inte rvalos com-
puestos (para un conjunto de datos) contendr n cada uno de ellos e l mism o n -
Consideremos, por ejemplo, la longitud. Entre dos modalidades cualesquiera mero de intervalos elemen tales.
existe un nmero infinito de modalidades posibles. Sin embargo, de hecho, slo
somos capaces de detectar un nmero finito de ellas, debido a la imperfeccin del
instrumento de medida, en este caso, la regla. Cuanto ms fina sea dicha regla. es 4.2.4.3. Lmites exactos y lm i tes apa rentes
1 decir. cuanto mayor nmero de subdivisiones contenga, tanto mayor ser el e-
mero de modalidades que podremos detectar. Pero, en todo caso, ese nmero 1rr Supongamos que en u na investigacin el valor discreto mnimo obtenido es 8
finito, por culpa del instrumento de medida. En conclusin, la variable que en s y el mxim o es 19. Los va lores-discretos posibles (incluy~ndo el 8 y el 19) ser.in:
misma es continua se manifiesta, de hecho. como discreta. El nmero de modali- 8, 9, 1O, 11, 12, 13, 14, 15, 16, 17, 18, 19. Cada uno de ellos representa un intervalo
dades discernibles es finito y, por ta nto, ser finito el nmero de va lores atribuibles elemental unitario. Formemos un intervalo compuesto con los intervalos elemen-
a dichas modalidades. Contemplemos algo ms despacio este nm ero finito le tales r epresentados por 8, 9 y 10. D ado que es 7,5 el limite exacto inferior del in-
valores discretos. tervalo elemental representado por el 8 y es 10,5 el lmite exacto superior del inter-
Supongamos que nuestra regla no discierne ms all de los centmetros. Ello valo elemental representado por el 10, ac;eptaremos 7,5 como lmite exacto
nos permitir atribuir valores tales como 1,87, 1,88, 1,89, por ejemplo, pero 110 inferior del intervalo compuesto y 10,5 como lmi te exacto superior del mismo .
valores intermedios. Ahora bien, esta limitacin, segn lo visto, es debida a la m- Por consiguiente, tendremos 4 intervalos compuestos cuyos lmites exactos sern :
perfeccin del instrumen to material de medida, no a que sean imposi bles esos ,i,a- 7,5-10,5 ; 10,5-13,5 ; 13,5-16,5; 16,5-19,5 . Llamaremos lmites aparentes de estos
lores intermedios. Por ello, p ara salvar la con tinuidad, vamos a admi tir que C11.rla cuatro in terva los a: 8 - 10, 11 - 13, 14 - 16, 17 - 19. Ntese que estos valores
valor discreto r epresenta a todos los infini tos valor es situados media unidad ,de aparentes son los nicos que, de hecho, p ueden aparecer.
medida (medio centmetro ) a su izquierda y media unidad a su derecha. En n uestro
caso. l ,68 representa a los infinitos valores que van desde J ,675 hasta 1,685 (in -
cluid o el mismo 1,68), el valor 1,69 representa a todos los valores que van da;de 4.2.4.4. Amplitud y punto medio de los i ntervalos. A mp litud tota l
1.685 hasta 1,695, etc. Es decir, 1,68 representa a una clase con infinitas modali-
dades. Llamaremos intervalo elemen tal a cada una de estas clases. D inmos La ampli tud de un intervalo es la diferencia ent re su lmite exacto superior y
que 1,675 es el lmite exacto inferior del intervalo representado por 1,68, y l.685 su lmite exacto inferior. En el ejemplo anterior la amplitud de los cuatro intervalos
su lmite exacto superior. Diremos que 1.685 es el lmite exacto inferior del ima.er- ser: 10,5 - 7,5 = 13,5 - 10,5 = 16,5 - 13,5 = 19,5 - 16,5 = 3. Aceptamos
valo representado por l ,69, y 1,695 es su limite exacto superior. Admitiremos, como punto medio de cada intervalo la media aritmtica de sus d os lmites exac-
por t~o, q ue 1,685 es, a la vez, limite exacto superior de un intervalo y lmite tos. As, los puntos medi os de los intervalos anter iores sern : (7.5 + 10,5)/2 = 9,
exacto inferior del intervalo siguiente (10,5 + 13.5)/2 = 12, (13,5 + 16,5)/2 = 15, (16,5 + 19.5 )/2 = 18. A los mismos
1 ,
, 1
1
r

54 / Estadstica p ar a Psiclogos
Organ,zac,n de datos / 55

Ordenemos estas puntuaciones:


resultados habramos llegado calculando la media aritmet1ca de los dos lm ites
aparentes de cada intervalo. En el ejemplo ante rior: (8 + 10)/2 = 9, (11 + 13)/2 = 6 6 6 6 7 7 8 8 8 8 9 9 9 9 JO 10
12, (14 + 16)/2 = 15, (17 + 19)/2 = 18. 11 11 11 11 11 12 12 12 12 12 12 12 12 12 13 13
Llamaremos amplitud total de una serie de valores numricos a la diferencia 13 13 14 14 14 14 14 15 15 15 16 16 16 16 17 17
entre el lmite exacto superior del intervalo mximo y el lmile exacto infe rior del 19 19
intervalo mnimo. En nuestro caso , 19,5 - 7,5 = 12 .
Decidimos elegir cinco in terva los . La a mpli tud total vale 19,5 - 5,5 = 14.
Calculamos 14/5 = 2,8. La amplitud mnim a posible d e cada intervalo ser 3.
4.2 .4.5. Nmero y amplitud de los intervalos
Y, por ello, la elegimos como ampli tud comn a los cinco intervalos.
Ordinar iam ente, se suele comenzar por fija r el lmite inferior del intervalo m -
Para una misma amplitud total, si aumenta el nmero de intervalos, tan to menor
nimo. Hay varias reglas convencionales en la eleccin de dicho lmi te. Segn unos,
ser la a mplitud de cada uno de ellos. Se recomienda que, con 100 o ms observa-
debe ser la pun tuacin mnima (en nuestro caso 6). Segn otros, debe ser mltiplo
ciones, el nmero de intervalos no sea meno r que 12, ni mayor que 18. Segn otros,
de la a mplitud elegida (en nuestro caso, 3, 6). De acuerdo con algunos autores,
ni menor que 10 ni mayor que 20. Sin embargo, ninguna de estas reglas es inllexible.
es mejor comenzar lijand o el lmite sup erior del intervalo mximo. Desde luego,
Elegiremos en cada caso la regla que juzguemos ms oportuna.
estas reglas son convencionales y no tenemos por qu acomodarnos a ellas.
Ordinariamente, comenzamos fijando el nmero de intervalos en funcin del
La distr ibucin de frecuencias en n uestro caso puede ser la sigu iente ;
nmero total de observaciones. La amplitud de cada uno de los intervalos, d epen-
der de la amplitud total , una vez fijado su nmero . Por ejemplo, suponga mos
que 8, 8, 10, 1l , 11 , 12, 14, 15, 15, 15, 17, 19, 20, 2 1 son las puntuaciones obtenid as
en una prueba por 14 personas. La amplitud total es 21 ,5 - 7,5 = 14. Suponga- Free. Prop. Porc. Fr. ac. Prop. ac. Porc. a c.
mos que decid imos hacer tres intervalos. La amplitud de cada uno de ellos tiene que
ser 5 por lo menos. Si fuera slo 4, alguna puntuacin quedara no contenida den- 17-19 //// 4 0,08 8 50 1.00 100
tro de esos tres intervalos. As, aceptando como intervalo nfimo el 8-11 , el segun do 14-16 lfl/ fH/ // 12 0,24 24 46 0,92 92
sera el 12-15 y el tercero el 16-19. No quedaran incluidas dentro de ello s las pun- 11-13 . fH/ fH/ 11/ 18 0,36 36 34 0.68 68
tuaciones 20 y 21. La amplitud 5 sera suficiente, pues dentro de tres intervalos 8-10 /fl/ fH/ 10 0,20 20 16 0,32 32
de amp litud 5 pueden caber todas las puntuaciones. (Advirtase que, tam bin, 5.7 lfl/ I 6 0,12 12 6 0,12 12
podran caber dentro de tres intervalos de amplitud 6, 7, 8, 9, 10, 11 y aun 12.) Lo
ordinario es elegir la mnima entre todas las posibles. En el caso an terior elegira- 50 1,00 100
mos la amplitud 5. Con esta amplitud seran posibles dos ternas de intervalos:
(8-1 2, 13-17, 18-22) y (7-11 , 12-16, 17-21 ).
Segn algunos autores, es preferible elegir amplitudes iguales a uno de los va- D esde luego, podamos haber elegido 14 intervalos de amplitud unidad y cuyos
lores siguientes: 1, 2, 3, 5, 10 20. Estos nmeros y sus mltiplos son fcilmente p untos medios fueran 6, 7, .. . , 19. Es claro que, bajo esta cond icin, las puntua-
manejables. Sin embargo , este cr ite rio es a rbitrar io y puede ser rech azado siempre ciones originales coincidirn con los puntos medios de los intervalos un itarios.
que sea conveniente.

4.2.4.7. Represent aci n g rfica


4.2.4.6. Distribucin de frecuencias
a) His1ograma y polgono de fi-ecuencias 110 acumuladas
Cinc ue nta estudiantes han obtenido en un a prueba de in teligencia las siguientes
puntuaciones: Com enzam os aceptando que todos los intervalos tienen la m isma a mplitud.
Esto supuesto, sobre cada uno de ellos, como base, levantamos un r ec1ngulo cuya
8 JI t i 8 9 JO 16 6 12 19 13 14 9 13 15 9 altura (y rea) sea proporcional a la frecuencia (p roporcin o porcentaje) no acumu-
.,.12 16 8 7 14 11 15 6 14 14 17 11 6 9 10 19 lados de dic ho intervalo . Llamamos histograma de frecuencias no acumu ladas a
.. 12 11 12 6 15 16 16 12 13 12 12 8 17 D 7 12 este conjunto de rectngulos consecutivos.
14 12
Orgamzac,n de da tos / 59
58 / Estadistica para Ps,clogos
TABLA 4. 1
4.2.4.8. Normas prcticas para las representaciones grficas Distribucin d" edades correspondwntes a los 1aro11es

a) El eje de abscisas (horizontal) representar las puntuaciones de la variable Edad Free. Pro p. Po rc. 1- rec. ac. Prop. ac. Porc. ac.
de que se trate, y el eje de ordenadas (eje vertical) re presentar las frecuencias , pro- -- -- - -
20-2 1 17 0, 1954 19.54 87 1,0000 100,00
porciones o porcentajes.
21 0.2414 24,14 70 0,8046 80,46
b) En el eje de abscisas pondremos las puntuaciones menores a la izquierda 18-19
16-17 33 0,3793 37,93 49 0,5632 56,32
y las mayores a la derecha. En el eje de ordenadas pondremos las frecuencia s me- 16 0. 1839 18.39
14- 15 15 0, 1724 17.24
nores abajo y las mayores arriba. 1 0,01 15 1, 15 l 0.0 115 1.15
12-1 3
e) La unidad de medida elegida en cada uno de los ejes ser tal que el grfico --
construido tenga una altura y una anchura cuya relacin aproximada sea igual 87 1,0000 100,00
a 3/ 5. Es decir, si tiene una altura de 9 cm, por ejemplo, deber tener una anchura
aproximada de 15 cm . T ABLA 4 .2
d ) La interseccin de los dos ejes ser tomada como orige n de puntuaciones Distribucin d, edades torrespondientes a la., mujeres
en el eje de abscisas y como origen de frecuencias, proporciones o porcentajes en
el eje de ordenadas . Edad Free. Prop. Porc. Free . ac Prop. ae. Pore. ac.
e) Si la puntuacin mnima de que se trate es alta y la frecuencia mnima en -- - -
20-21 13 0. 1857 18,57 70 1,0000 100,00
cuestin es, tambin, alta, tanto en el eje de abscisas como en el de ordenadas se
18-19 25 0,3571 35,71 57 0,8 143 81,43
suelen hacer dos cortes, segn la figura adj unta.
16-17 16 0,2286 22,86 32 0,4571 45,71
14-15 16 0.2286 22,86 16 0,2286 22.86
12-13 o 0,0000 00.00 o 0,0000 00,00
-
70 1,0000 100,00
v.
"'
;:;
e
0,40
"~ _ __ __ varone s
u: /\
- -- - - ~ mujeres I \
I \
~
I \
0 ,30
"'
80 90 100 1 ro 120
-e
"'
]
\\
Cocie ntes lntelec tua1cs \
"o ,- \
C
0,20 1
/) Conviene indicar explcitamen te qu repr esenta el grfico en ge neral y ~
I \
" \'
-~"
qu representa cada uno de los ej es, siempre que sea necesario. I ~
I \\
Por supuesto, las anteriores normas son convencionales y slo las seguiremos o
en tanto que nos sean tiles. e
~
0 , 10
I
l.
I \\
~
i
/

4.2.4.9. Polgonos de frecuencias de varios grupos


considerados conjuntamente
/J
'
Veamos la distribucin de edades de 157 a do lescentes (87 var ones y 70 muje- l0.5 12.5 14,5 16,5 18 .5 20.5 22.5
res ) con<lerectos auditivos y en los cuales Balow, Fulton y Peploe (1 971) estudia ron Edades
algunas implicaciones educa tivas de la sordera .

... r.:"
.
h~<
/2
~... ? .
1 TI
!

1

60 / Estadisllca para Psiclogos Organizacin de datos / 61

bk la masa informe de datos primitivos. Sin em ba rgo , tiene el inconvenien te de


1,00 '-"arones
falsear ms o m enos, de cercenar en parte, la informacin contenida en los datos
mujeres originales. En resumen, la informacin o frecida por los d atos no agrupa dos es la
~
h verdadera e ntegra, pero es menos manejable . La informacin ofrecida por los
~
datos a grupados es ms manejable, pero es menos ntegra y verda dera.
"
"C
'l
"
,; '
I
/ 4.3. Resumen : Definiciones
"
~
0.50 I
"ee: /
/
2 '/
/ Constante: caracters tica que slo puede m an ifestarse bajo una nica moda-
e
c. 1/
o lidad.
; Variabll': carac terstica que puede ma nifestarse bajo dos o ms modalidades.
/,
/ Variable cua/itatim: caracterstica que slo puede ser considerada a nivel me-
/.
? ramen te nominal.
Variable cuasi cwmtit,1tira: ca racterstica que slo puede ser considerada a
nivel mxim o ordinal.
11.5 13,5 15 ,5 17,5 19.5 21.5 Variable cuamitatim : caracterstica que puede ser considerada, a l menos, a
nivel de interva los.
Edades
Variable cuantitatim discreta : carac terstica que no admite siempre una mo-
dalidad intermedia entre d os cua lesquiera de sus modalidades.
Valindonos de proporciones no a cumuladas y d e proporciones acumuladas.
Variable cuantitativa cominua : ca rac terstica que admite siempre una moda-
tendremos las dos representaciones grficas anteriores .
lidad interm edia entre dos cualesquiera de sus modalidades.
Frecuencia de una clase : nmero de observaciones contenidas dentr o de ella.
4.2.4 .1O. Datos sin agrupar y agrupados Proporcin de una clase: cociente entre la frecuencia de una clase y e l nmero
total de obse rvaciones.
Agrupar ciertas puntuaciones en intervalos implica h acerlas equivalen tes a los Porcentaje de una clase: proporcin de la misma m ultiplicad a por I OO.
puntos medios de los intervalos dentro de los cuales se e ncuentra cada una de ellas. Distribucin de frecuencias: conjunto de nmeros, a tribuidos a las modali-
As, por ejemplo, al agrupar en cinco intervalos las cincuen . 1 puntuac iones pro- dades o clases, y de las frecuencias (propo rciones o porcentajes) correspondientes
puestas en el aparta do 4.2.4.6, nos quedaremos con slo cinco va lores distintos, a cada una de aquellas.
los puntos medios de los cinco intervalos. Es decir, /mermlo: tratndose de vana bles continuas, clase compuesta de infinitas mo-
dalidades o, mejor, com puesta de los infinitos nm eros a tribuibles a dichas m o-
6, 6, 6, 6, 7, 7 (dentro del intervalo 5-7) equivaldrn a 6. dalidades y situados entre dos valores numricos que llamaremos sus lmites e.me-
8, 8, 8. 8, 9, 9, 9. 9, 10, 1O (d entro del intervalo 8-10) equivaldrn a 9. tas. Llamaremos amplitud d el intervalo a la diferencia en tre esos dos lmites exac-
11 , 11, 11, 11 , 11, 12, 12, 12, 12, 12, 12, 12, 12, 12, 13, 13. 13, 13 (dentro d el inter- tos y pumo medio a la semisuma de dichos lm ites. D iremos que u n intervalo es
valo 11 - 13) eq uivaldrn a 12. elemental si su amplitud es la unidad de medida utilizada y diremos que es com-
14, 14, 14. 14, 14, 15, 15, 15, 16, 16, 16, 16 (dentro del inte rvalo 14- 16) equivaldrn puesto si su amplitud es mayor que dicha unidad.
a 15.
Histograma : supuesto que todos los in terva los tienen la m isma a mplitud. le-
17, 17. 19, 19 (den tro del in tervalo 17-19) equivaldrn a 18. vantamos sobre cada intervalo , como base, u n rectngulo c uya a ltura (y rea)
sea proporcional a la frec uencia (proporcin o porcentaje) de dicho inter valo, lla-
Si el nmero de da tos fuera mayor (por ejemplo , 350), haciendo diez interva los mando histograma a l conjunto de estos rectngulos consecutivos.
nos queda ramos slo con d iez p untuac iones distintas. Evidentemente, es ms Polgono de fi-ecuencias: dibujado un pun to sobre la mitad del lado sup erior
manejable el nuevo conjunto de d iez datos distintos que el conjunto d e las puntua- (el opuesto a la b ase) de cada rectngulo, unimos cada d os puntos consecutivos
ciones q~gm ales y tanto ms manejable, cuanto mayor sea el nmero de p untuacio- mediante un segmento rectilneo, llamando polgono de frecuencias a la lnea o rigi-
nes originales distintas. El agrupamiento tiene la ventaja de hacer ms maneja - nada po r este conjunto d e segmentos rectil neos.
I !"J
62 / Estad,st,ca para Ps,clogos
Organizacin de datos / 63
EJERCICIOS
Calcular las proporciones y porcentaj es correspondientes a cada una de las cate-
goras y dibujar el correspondiente diagrama de barras.
4.1. , Cules son los lmites exactos de los siguientes intervalos 9
4.8. A partir de la siguiente distribucin de frecuencias, calcular las frecu encias
a) 15 - 24 b) 62,5 - 68,5 e) 20,0 - 20, 8 d) 44.35 - 54,35 acumuladas y las proporciones y porcentajes sin acumular y acumulados. Dibujar,
adems, el histograma y el polgono de frecuencias, considerando stas sin acumu-
4.2. Cul es la amplitud de los intervalos anteriores? lar y acumuladas.

4.3. Cul es su punto medio ?


X 11
4.4. En un examen de Estadstica los alumnos han obtenido las siguientes pun -
tuaciones: 16, 18, 26, 15, 17, 21, 27, 21, 21 , 26, 14, 20, 23, 16, 19, 24, 22, 23, 20, 26, 20-24 12
18, 20, 14, 17, 21 , 17, 24, 27, 18, 17, 25, 19, 22, 21 , 21, 15, 24, 22, 15, 18. 15- 19 18
Preparar una distribucin de frecuencias, sin acumular y acumuladas, introdu- 10-14 24
ciendo intervalos de amplitud 3. Calcular las proporciones y porcentajes sin acumu- 5-9 16
lar y acumulados. 0-4 10

4.5. Dibujar el correspondiente histograma y el polgono de frecuencias sin acumu-


lar y acumuladas a partir de los datos del ejercicio anterior. 4.9. Las puntuaciones en una prueba de inteligencia abstracta han sido las si-
4.6. A parlir de la siguiente distribucin de frecuencias, calcular las frecuencias guientes:
acumuladas y las proporciones y porcentajes sin acumular y acumulados. Dibujar,
adems, el histograma y el polgono de frecuencias, considerando stas sin acumu- 91 , 92, 83, 81, 88, 94, 9 1, 87, 90, 94, 85, 85, 93, 90, 89, 86, 87, 89, 85, 89
lar y acumuladas.
Preparar una distribucin de frecuencias, sin acumular y acumuladas, in troducien-
X ni do intervalos de amplitud 4. Calcular las p roporciones y porcentajes sin acumular
y acumulados.
17-19 8
14-16 9 4.10. Dibujar el correspondiente histograma y el polgono de frecuencias sin
Jl-13 12 acumular y acumuladas a partir de los datos del ejercicio an terior.
8-10 10
5-7 7
2-4 4

4.7. Durante el curso 1971 -1972 en las Facultades universitarias estatales espa-
olas estaban matriculados los siguientes alumnos:
Facultad de Ciencias . . . . . .. .. . 42.572
Fac. de Cienc. Polit. Econm . y Comerc .. . 25.683
Fac. de Derecho. . . . . . . . . . . . . ...... . .. . 22.665
Fac. de Farmacia. . . . . . . . . . . . ... . . .. . . 8.083
Fac. de Filosofia y Letras .. .. ... . . . ... . 49.049
Fac. de Medicina ......... .. . .. .. .... . 37.578
Fac. de Veterinaria .. . . . . . . . . . . . . . ... . 2.166

187.796

FUENTfi--Comentaro soco/gco, Esm,c1ura social de Espaa. 1973-74. Confederacin Espaola


, de CaJas de Ahorro , ao 11 , nms. 4-5 .
. 1
'1
1

'
!1
Estadisr,cos de posicin o tend enc,a central / 65

5 Es decir, la med ia ari tmtica de 11 valores no es ms que su suma divid ida por
el n mero de ellos.

Estadsticos de posicin o tendencia central 5.2.2. Clculo

a) Dalos 110 agrupados

Aplicacin directa de la frm ula (5.1) a los datos o riginales. es decir. sumando
una a una las 11 puntuacion es y dividiendo el resu ltado por 11 .
EJEMPLO 5.1. Para obtener un ndice de la carga de significacin que posee la
palabra GOLA, Jez (1 976) la present a 23 personas con objeto de observar
el nmero de palabras que GOLA suscitaba en cada persona d urante cuarenta y
cinco segundos y obtuvo los siguientes r esultados:
5.1. Introduccin
10, 5, 2, 7, 9, 5, 7, 6, 5, 9, 12, 2, 6, 6, 9, 12, 6, 6, 6, 4, 9, 7. 12
Supongamos que deseamos comparar el aprovechamiento en Estadistica de una
muestra de 200 varones con el de otra muestra de 250 mujeres. Esta comparacin La media aritm tica fue tomada como ind ice de la carga de significacin de
ser muy difcil si hemos d e tener en cuenta todas las puntuaciones de ambos gru- GOLA y vali:
pos. Lo que solemos hacer es comparar el promedio de la primera muestra con el
promedio de la segunda. En otras palabras, lo que hacemos es determinar un esta- i = JO+ 5 + 2 + + 7 + 12 = 7,04
dstico (funcin de las puntuaciones de la muestra) que nos ofrezca la posicin 23
de una y otra muestra en la variable aprovechamiento. En general, este tipo d e
estadsticos se utiliza para darnos la posicin de cada una de las mues tras a las qu e b) Dalos agrupados
va representando y, por esta razn, deber ir tomando siempre un valor situado
hacia el centro de las puntuaciones de cada una de dichas muestras. Debido a esta Supongamos n observaciones agrupadas en r in terva los, lod os ellos de igua l
circunstancia, suelen ser llamados de posicin o tendencia central. amplitud. Sea X , el pun lo m edio del intervalo primero y 11 1 el nmero de observa-
Antes de comenzar a estudiar estos estadsticos, el lector d ebe consultar el ciones dentro del mismo. Sea X2 el pun to med io del in tervalo segundo y 11 1 el n-
Apndice A que trata sobre el signo de sumar :E. Este signo ser utilizado muy mero de obser vaciones d entro del mismo. Sea X, el punto m edio del intervalo r
profusamente de ahora en adelante y, por ello, conviene que el lector se familia- y n, el nmero de observaciones dentro del mismo . Segn sabemos, al agrupar las
rice con su uso. pun tuaciones en in tervalos, atrib uimos a cada u na de ellas (como pun tuacin )
el punto medio dentro d el intervalo dentro del cual se encuentra. Por consiguien le,
dentro del intervalo primero tendremos n 1 puntuacrnnes iguales a X , y su suma
valdr n 1 X 1 Dentro del intervalo segundo tendrem os 112 pun tuaciones igua les
5.2. Media aritmtica* a X, y su suma valdr n 2 X 2 . Dentro del intervalo r- sim o tendremos 11, puniuacio-
nes iguales a X, y su suma valdr n,X,. En conclusin, la suma !Otal de las n, + 11 2 +
5.2.1. Definicin + + n, = n puntuaciones valdr n 1 X 1 + 111 X 2 + + n,X, y su med ia ar it-
mtica valdr

Dados n valores, X 1 , X 2 , .. , X., su media aritmtica, i , viene d efin ida por


X= 111 X, + 11 2 X 2 + + 11,X, = I:n 1X1 ~ ~~
(5.2 1
11, + 11 2 + + 11, r.11
1
n
X = Xi + X i .... + X. ~X, (5.1 )
EJEMPLO 5.2. Valin donos de los d atos del ej emplo 5.1, agrupmoslos ,:n
.,, }/ ll
cuatro intervalos de acuerdo con el cuadro siguiente y calculemos su media aril-
- mtica.
"' Siem pre que u semos )a expresin .. meda,. , nos r eferimos a la .-:media aritmtica .
I:I'
1 : :
Estadist,cos de posici n o tendenci a central / 61
66 / Estadistica para Psiclogos

5.2.3. Propiedades
X ", x, n)X1

a) Si k = X, la suma de las diferencias den pun tuaciones X 1 , X 2 , . . , Xn res -


10-12 4 11 44
pecto a k vale cero. Es decir, la suma de las diferencias den puntuaciones X 1 , X 2 , . ,
7-9 7 8 56
50
x = !~ = 6.70 X respecto a su media vale cero .
4-6 10 5 23
1-3 2 2 4 " En efecto, si k = X tendremos

23 154 - - :EX
:E(X.t - k ) = :E(X l
- X) = :EX t
- nX = :EX - n - /l '
J
= :EX. 1
- :EX- = O
1

Ntese que la definicin de media es la misma : sumar n puntuaciones y dividir a ' ) Si la suma de las diferencias de n puntuaciones X 1 , X2 , , X,, respecto
esa suma por n. Las que no suelen ser exaclamente iguales son las puntuaciones
a k vale cero, k = X.
antes y despus del agrupamiento en intervalos. As, comparando el ejemplo 5.1 En efecto, si se verifica que :E(X, - k) = O, entonces :EX, - nk = O. Es decir,
con el ejemplo 5.2, lenemos: :EX; = nk. Por tanto,
EJEMPL-0 5.1: 2, 2, 4, 5, 5, 5, 6, 6, 6, 6, 6, 6, 7, 7, 7, 9, 9, 9, 9, 10, 12, 12, 12
k =:EX, = X
EJEMPLO 5.2: 2, 2, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 8, 8, 8, 8, 8, 8, 8, 11 . 11 , 11, 11 11

Consiguientemente, el valor de la media aritmtica obtenida a partir de ciertos . 16 .


datos no agrupados en intervalos diferir, en general, del valor de la media arit- EJEMPLO 5.4. La media de 1, 2, 5, 8 vale- = 4. Pues bien. (1 - 4 ) + (2 - 4) +
4
mtica obtenida a partir de estos mismos datos, pero agrupados en in tervalos. + (5 - 4) + (8 - 4) = (-3) + ( -2) + (1 ) + (4) = O.
Adems, este ltimo valor ser en general, uno u otro segn que los mismos datos
sean agrupados de una u otra manera. b) Si k = X, la suma de las diferencias cuadrticas de n puntuaciones X 1,
Por supuesto, podamos haber elegido intervalos de amplitud unidad, cuyos X 2 , . , X0 respecto a k es mnima. Es decir, la suma de las difer encias cuadrticas
puntos medios coincidan con nmeros enteros consecutivos y tales que dentro de n puntuaciones X 1 , X 2 , . , x. respecto a su media es menor que la suma de las
de la sucesin de stos se encuentren las puntuaciones originales. Naturalmente, diferencias cuadrticas respecto a cualquier o tro valor distin to de la media.
bajo estas condiciones coincidirn la media aritmtica obtenida mediante datos
no agrupados y la obtenida mediante datos agrupados en in tervalos (unitarios).
Intentarnos probar que :E(X, - k) 2 > :E(X, - X)2 si k X. +
EJEMPLO 5.3. Valindonos de los datos del ejemplo 5.1 calculemos la media En efecto, si k f X, k = X + e (con e 1- O, bien positiva, bien negativa). Por
aritmtica agrupando los datos en intervalos unitarios, segn lo acabado de exponer. tanto,
l:(X, - k) 2 = :E[X, - (X+ c)] 2 = :E[(X, - X)- c] 2 = :E(X, - X)2 - 2c:E(X, - X) +
+ nc2 = :E(X, - X) 2 + ne', pues r(X, - X) = O, (segn a).
Xi n, n,x, Ahora bien, nc2 es un valor esencialmente positivo, pues tanto n como c2 son esen-
12 3 36 cialmente p ositivos. Por otra parte, :E(X, - X )2 es esencialmente no negativa
11 o o (ser siempre positiva, salvo el caso extrem o en que X1 = X 2 = = x. y en
10 1 10 el cual valdr cero). Por tanto, dado que l:(X; - k) 2 = l:(X, - %)2 + nc2 , nece-
9 4 36 sariamente :E(X, - k)2 > :E(X, - X)-'.
8 o o EJEMPLO 5.5. Reslcmos 1, 2, 5, 8 de su media 4, elevemos al cuadrado estas
3 21 X = 1: 11,X, = 162 = 7_04 diferencias y summoslas. Hagamos lo mismo con las diferencias cuadrticas res-
6 6 36 n 23
pecto a dos valores distintos de 4, el 5 (mayor que 4) y el 3 (menor que 4).
5 3 15
4 1 4
3 o o (1 - 4)2 + (2 - 4)2 + (5 - 4) 2 + (8 - 4 )2 = 9 + 4 + 1 + 16 = 30
2 2 4 (1 - 5) +
2
(2 - 5) 2
+ (5 - 5)2 + (8 - 5)2 = 16 + 9 + O + 9 = 34
1c,t -
23 162 (] - 3)2 + (2 - 3 )2 + (5 - 3) 2 + (8 - 3)2 = 4 + 1 + 4 + 25 = 34
r
11

68 / Estadistica para Psiclogos Estadist1cos de posicin o tendencia central / 69


Vemos cmo la suma de las diferencias cuadrticas respecto a 4 (media ) es
menor q ue la suma de las diferencias cuadrticas respecto a 5 y a 3 (distintos de X n,
la media).
b') Si la suma de las diferencias cuadr ticas de n puntuaciones X,, X 2 , . . . , X., 17 o ms 9
respecto a k es mnima, k = X. 14-1 6 15
En efecto, si k fuera distinta de la media, la suma de las diferencias cuadr 11 -13 22
8- 10 13
ticas no podra ser mnima (segn b), contra lo supuesto .
7 o menos 8
e) La media de Y, = AX, + B, Y2 = AX2 + B, .. . , Y., = AX., + B, sien-
do A y B dos constantes arbitraria!{, es Y = AX + B.
En efecto, Ir) La media es el centro de gravedad de la distribucin de frecue ncia s. Con -
sideremos un tablero ideal, sin peso, largo y estrecho. R epresentemos cada obser-
vacin por un cubo de peso unidad . Todas las observaciones con la misma pun-
y= ~ = !: (AX,+ B ) =A !: X,+ nB = A!: X,+ 11B =AX+ B tuacin son colocadas una encima de o tra sobre el punto d el tablero que coincide
n n n n n con esa puntuacin. Apoyemos el ta blero, as cargado con las observaciones, sobre
un fulcro F. Pues bien, solamente se mantendr en eq uilibrio el tablero, cuando
EJEM PLO 5.6. A p artir de las puntuaciones 1, 2, 6 (con media 3) formemos la media sea el punto de apoyo del mismo sobre el fulcro. Es decir, la media es el
las nuevas puntuaciones Y, = 2X, + 4, es decir, las puntuaciones Y, = 2X1 + 4 = centro de gravedad del sistema. Por ejemplo, supuestas las puntuaciones l, 1,
= (2)( 1) + 4 = 6, Y2 = 2X2 + 4 = (2)(2) + 4 = 8, Y3 = 2X3 + 4 = (2)(6) + 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 4, 5, 5, 6, 6, 6, 7, su media valdr 70/20 = 3,5. Pues bien,
+ 4 = 16 y veamos cmo la media de las nuevas puntuaciones debe valer Y = el tablero cargado con las veinte puntuaciones se mantendr en equili brio si se
= 2X + 4 = (2)(3) + 4 = 10. En efecto, apoya sobre el fulcro F en la pun tuacin 3,5 y perder dicho equilibrio si se apoya
sobr e un punto a la derecha o a la izquierda de 3,5.

y = !: Y, = 6 + 8 + 16 = 30 = JO
11 3 3

Si A = 1 y B j O, Y= (l)(X) + B = X+ B. Es decir, si sumamos a todas


las pun tuaciones una constante no nula, la media de las nuevas puntuaciones es
igual a la media de las antiguas ms esa constante B.
Si A f O y B = O, Y = AX + O = AA Es decir, si multiplicamos todas las
puntuaciones por una constante A, la media de las nuevas puntuaciones es igual
a la media de las antiguas multiplicada por esa constante A .
d) La media es sensible a la variacin de cada una de las puntuaciones . Basta
con que vare una sola puntuacin, para que vare la media. La media es funcin
de todas y cada una de las puntuaciones y variar con que vare una sola de ellas.
e) Es fu ncin de los intervalos elegidos (de su amplitud, de su nmero y de
los lmites de los mismos).
/ ) E s fundamento de muchas otras tcnicas estadsticas. F
g) No podr ser calculada si el intervalo mximo no tiene lmite superior
y/o el intervalo mnimo no lo tiene inferior. Pues si no conocernos los lmites ex-
tremos, no podremos calcular los puntos medios de los intervalos mximo y m- i) No es recomendable calcul ar la media cuando la distr ibucin de frecuen cias
nimo y, consiguientemente, no podrem os calcular la media que exige conocer los es muy asimtrica. Es decir, cuando existen una o muy pocas puntuaciones en uno
puntQf medios de todos los intervalos. As, por ejemplo, no podremos calcular de los dos extremos (o muy altas o muy bajas, respecto a las restantes que cons-
la media a pa rtir de la siguiente distribucin de frecuencias: tituyen la mayora).
.
1 11
l. II'
1

70 / Estadstica para Psiclogos Estadsticos de posicin o tendencia central / 71

j) Dados r grupos con n,, n2 , . , n, puntuaciones, respectivamente, y sien- x= (6)(5) + ~4li9! :!: (5)p~
do .X', X2 , , X, sus correspondientes medias, la media de las n, + n 2 + +
12(, = 8,40
15 15
+ n, = n puntuaciones vale X = (n,X, + n2.X\ + + n,X,)/n.
En efecto, sean EJEMPLO 5.8. Las puntuaciones de la tabla adjun ta representa n el aumento
X 11 , X21 , X., 1 las n 1 puntuaciones del grupo primero
. , en el cociente in telectual de un grupo de dos ni os y de un grupo de cuatro nias,
X, 2 , X 22 , , x.,
2 las 11 2 puntuaciones del grupo segundo todos de dos aos, tras haber sido estimulada la interaccin verba l co n sus madres
.... . . . ... . . . ' . .... . ........ . . . ......... . . . .... . duran te cua tro meses (Levenstei n, 1968). Ca lculemos el aum ento medio del grupo
Xi,, X 2 ,, . . , x.,, las n, puntuaciones del grupo r total, a partir del aumento med10 de los nios y del de las nias.

Esto supuesto, tendremos


X1 = (X 11 + X 21 + + X. 11 )/ 11 1 ; por tanto , 11 1 1' = X 11 + X 2 , + + X., 1 Nios Nias
~--- -
-~'i = (X 12 + X22 + + x.,2 )/n2 : por tanto, n2 X2 = X 12 + X22 + + x., 2 13 16
29 16
- -1) -+ -(4)(JO) = 6 =
(5.3) 82
2 X_ =(2)(2 13, 67
X,= (X 1, + X 2 , + + x.,,)/n,: por tanto, n,X, = X,,+ X 2, + + x.,, 6 6
42 40
Ahora bien, por definicin,
111 = 2 11, =4
x1 = 21 x, = 10
X= (X + X21 + . .. + x.,,) + (X12 + X22 + . .. + x . 12 ) + +
n 1 + 112 + + n,
+ + + (X 1 , + X 2, + + X.,,) En el caso particular en el que n 1 = n 2 = = n, = k,
(5.4)
+ n 2 + + n,
11 1
-
X= kX 1 + kX2 + + kX, = x + x
_1_ _ _ .._ +__ __
+ x
,
Por consiguiente, sustituyendo los r 1rminos del numerador de (5.4) por sus kr r
equivalentes en (5.3), nos q ued a
k) Sean r grupos con n1 , 11 2 , . . , n, p ersonas. Sean p 1 , p2 , . , p, las p ropor-
X = n1X1 + n2 X2 + + n,X, = n1x1 + n2 X2 + + n,X, ciones con cierta caracterstica dentro de cad a grupo. Por ejemplo , sea p 1 la pro-
porcin de varones en el grupo primero , p 2 la proporcin de varones en el grupo
n 1 + n2 + + n, n
segundo, . .. , p, ia proporcin de varones en el grupo r . Esto supuesto , la pro-
EJEMP LO 5.7 . porcin de varones en el grupo total vale

p 1 + 112 p 2 +
Grupo primero Grupo segundo Grupo tercero p = -n 1---- - - - - +- n,p,
- -
11 + n 2 + + n,
2 7 14
5 14 17
En efecto, llamando 11;, n;, .... n;
al nmero d e varones en el grupo p rimero,
4 7 8 en el segundo, ... , en el r , tendremos
7
7
8 12
9
p1= n;, de donde, 11; = n,P1; p2 = -n;, de d on de, 112' = n2 p2 , P, =~
n1 11 , 11,
5 de donde n; = n,p, .
-- - - -- - - -- -- - - - - - -- - --- -- Por definici n, la proporcin de varones dentro del grupo tota l va ldr,
30 36 60
..,,-r-
n1 =6 11, =4 11, =5 + 11; + + n;
x, = 5 x, = 9 x, = 12 11;
p= ~ -- - - -- -
11, + 11 2 + + n,
:

72 / Estadistica para Ps1cologos Estadist1cos de posicin o tendencia centr al / 73

Sustituyendo n; por n 1 p 1 , n por p


11 2 2 , , n; por n,p,, nos queda
X - Xo
x, XJ = __]_ -
p = 11 1 p 1 + 11 2p 2 + + n,p,
n 1 + n2 + + n,

EJEMPLO 5.9. En tres grupos distintos, con 270, 180 y 300 personas, la propor-
cin de demcra tas es 0,70, 0,65 y 0,62, respectivamente. Esto supu esto , cul X0 + 31 (Xo + 31) - .\ o = 3
es la proporcin de demcratas en el grupo toial ? I
X0 + 21 (Xo _: !! ) -: _:\'o = 2
= (270)(0,70) + (180)(0,65) + (300)(0,62) = 492 = O656 I
P 270 + 180 + 300 750 ' + /) -
X0 +l
(X 0
-- - - - - -X0 = l
I
La propo rcin de demcratas en el grupo to tal es 0,656 o, dicho de otro modo,
X0 + O _(~o -!"u = 0
_+__) -:
el 65 ,6 por 100 del grupo total son demcratas. I
(Xo - l) - Xo
X., - l - - -- - -=- !
5.2.4. M t odo abreviado para el c lculo de la media
X0 - 2/ ! X..<> --:_ }/J --: !~ = - 2
I
Supongamos n puntuaciones a grupadas en intervalos, todos ellos con am-
plitud /. Sea X0 el punto medio de uno de ellos, elegido arbitrariamente, al que (X0 - 31) - X0
Xo - 3/ - - I - -- - = -3
:;_, ' llamaremos intervalo origen. Hagamos

A B = X!'.
I I
EJEMPLO 5.10. Apliquemos el mtodo abreviado a la sigu iente distribucin
Segn 5.2.3. e), las puntuaciones de frecuencias, donde todos los intervalos tien en amplitud / = 3 y d onde hemos
elegido como origen el in tervalo 6 - 8.

-'1
' 1
= IX; + (-~o) = X, -I Xo n1 x; n_rY;

13 - 7
tendrn como media
,, 12- 14 8 -- -=- - = 2 16
X.
."\ ' = ~ X - ~ = :" - Xo
,<"-.: "' 9-ll 12 -
10 - 7
- - = 1 12
1 I J 3 -, 10
X = -- = 0,2
De d onde, X = J.f:' + X0 Esta ltima frmula nos permi te obtener X mediante 7- 7 50
6-8 16 =o o
3
.i', cuyo clculo suele ser mucho ms sencillo y breve que el de X. x = !3)(0.2) +7 = 7,6
Si X0 es el punto medio del intervalo origen, los puntos medios de los inter- 4 - 7
valos superiores al origen sern X0 + /, X0 + 21, X0 + 3/, . .. y los puntos medios
3-5 10
3
= -1 - 10

de los intervalos sucesivos inferio res al origen sern X0 - / , X0 - 2/ , X0 - 3/, .. . ,


1- 7
ya que la diferencia entre dos puntos medios consecutivos es igual a la ampli tud, 0-2 4 = - 2 - 8
3
l , d;:I intervalo. Consiguientemente la transformacin x 1'. =XL _!_Q... establece la
.~ I 50 10
siguiente correspondencia:
l",,
74 / Estadistica para Psiclogos Estadsticos de posicin o tendencia central / 75

Veamos en qu ha consistido la transformacin x; = ~-~


I
en el ejemplo Es decir, la media ponderada de n puntuaciones es la media de esas puntuacio-
nes multiplicadas o ponderadas por coeficientes o pesos apropiados. Ntese que
que acabamos de exponer. atribuir los pesos 4,5; 3,5 y 2 no es ms que hacer aparecer la primera puntuacin
4 5 veces, la segunda 3,5 veces y la tercera 2 veces. Es, por tanto, como si tuviramos
Escala original: X, 4'.5 + 3,5 + 2 = JO puntuaciones. De aqu que el denominador de la media p on-
10 13 derada sea igual a la suma de los pesos.
En realidad, la media obtenida con datos agrupados en intervalos es una me-
dia ponderada. El peso asignado a cada puntuacin (o punto medio del intervalo
de que se trate) es igual al nmero de observaciones d entro de dicho intervalo .

-7 X = n1 X, + n2 X2 + + n,X,
6 ./
,. .
;1 /
\
u ~-
T
, - ..-;
7 1 1 ) ' ' ....
n 1 + 112 + + n,
(cambio de ongen)

Escala nueva: x '; ; ex, - 7); 3 5.2.6. Medias aritmticas generalizadas

(camhio de unidad de medida. supuesto el cambio de origen) a) Media geomtrica

Llamamos media geomtrica, X9 , den valores X 1 , X 2 , , x. a la raz ensima


De lo dicho se in!ere que es muy sencilla la manera prctica de transformar
del producto de esos n valores. Es decir, X9 = j(X1 )(X2 ) .. . (X.) .
1.,: 1 las X; en las x;.
En efecto, basta con elegir como origen un intervalo cualquiera, Mientras que la media aritmtica se obtena sumando n puntuaciones y divi-
atribuyndole como punto medio el valor O. A continuacin, atribuir un 1 al inme- diendo psa suma por n, la media geomtrica se obtiene multiplicando las 11 pun-
diatamente superior, un 2 al superior siguiente, etc.; atribuir un - 1 al intervalo tuaciones y calculando la raz ensima de ese producto. Es decir, lo que all era
inmediatamente infer ior, un -2 al inferior siguiente, etc. Es claro que en el ejemplo suma, ac;u es producto; lo que all era divisin, aqu es radicacin.
acabado de exponer no compensa utilizar el mtodo abreviado puesto que el no Usando logaritmos, tendremos
abreviado es tan sencillo como el abreviado. Pero en otros casos no sucede esto.
La diferencia suele ser de cierta importancia cuando las puntuaciones contienen
cifras decimales, cuando son muchas las obser vaciones y grande el nmero de in-
log X, = log X 1 + log X 2 + + log x. = L log X,
/ n
tervalos.
Desde luego, la introduccin creciente de mquinas calculadoras y miniorde-
En otras palabras, la media geomtrica, X9 , es un valor tal que su logaritmo
nadores va haciendo cada vez menos necesario el uso de mtodos abreviados.
es igual a la media aritmtica de los logaritmos de los datos. De aqu que digamos
Igualmente, poseyendo dichos instrumentos de clculo, deberemos obtener la
que la media geomtrica es una media aritmtica generalizada.
media a partir de las puntuaciones originales, sin agruparlas en intervalos, siempre
EJEMPLO 5.11. En investigaciones sobre promedios de tiempos (latencias,
que las tengamos a nuestra disposicin . tiempos de reaccin, tiempo empleado en solucin de problemas, ... ) es frecuente
la utilizacin de medias geomtricas. Por tanto, si 22, 11 , 7, 7, 28 son los tiempos
(en segundos) empleados por una persona para la solucin de cinco problemas
5.2.5. Media ponderada (Sokolov, 1972), aceptaremos, como ndice del tiempo medio consumido por esa
persona en cada problema, la media geomtr ica de esos datos. Es deci r,
La media de 2, 4 y 12 es 6. Pero, si por ejemplo, atribuimos a la primera pu n-
tuacin un peso igual a 4,5, a la segunda un peso igual a 3,5 y a la tercera un
peso igual a 2, tendremos la siguiente media ponderada X9 = .j(22)(1 I )(7)(7)(28) = 12,71 segundos

4:t (4,5)(2) + q,5)(4) + (2)!_12) = ~~ = 4 7 EJEMPLO 5.12. En Psicofisica suele preferirse la media geomtrica a la media
4,5+3,5+2 10 ' aritmtica cuando se trata de promediar razones. Un caso tpico es el siguiente.
1~
:11

76 / Estadistica para Psiclogos


Estadsticos de p osicin o tendenci a cen tral / 77
A un sujeto se le impone la tarea de valorar las veces que cada uno de los estmulos va nerviosa por la q ue /a de transmitirse, la mitad de la distancia la recorre a un a
supera a los restantes, segn cierta caracterstica, es decir, la tarea de ofrecer la velocidad de 2 m /scg y el resto a una velocidad de JO m/seg. (Vase Osgood, 1953.)
la razn entre cada par de estmulos que l juzga ms exacta. Con frecuencia, el La velocidad media con que se traslada el imp ulso es la media a rm nica de las do s
mtodo experimental utilizado permite establecer varias estimaciones de cada velocidades. En efecto, de acuerdo con la ecuacin fundamental de la cinemtica .
razn. Pues bien, para poder alcanzar una mejor estimacin de ella, se suele calcu-
lar la media geomtrica entre las distintas estimaciones d e la misma. (Vase, por
ejemplo, Torgcrson, 1963 .)
( e)
e = vi o, r = - , en los pnmeros
I'

20
O,20 m se venfi1cara 11 = - - y en Jos u 1ttmos
2
Sean 3; 2,5; 4; 3,5 y 3,8 cinco estimaciones de la razn entre los estmulos A y B. 0,20 m se venf!Cara lz
= 102-. eOns1gmentemente,
1a ve1OC!da d me d 1a
. b USCa d a sera
Es decir, A es juzgado como 3; 2,5; 4; 3,5 y 3,8 veces mayor que B, en cinco ocasio-
nes d istin tas. Aceptaremos como estimacin media de la razn entre A y B igual al espacio total (0,20 + 0,20) recorrido, dividido por el tiempo (1 1 + r2 ) em-
pleado en recorrerlo. Es decir,
j(3)(2,5)(4 )(3,5)(3,8) = 3,31. En otras palabras, aceptaremos que el es tmulo A
es juzgado como 3,31 veces mayor que el estmulo B. t = (2 )(0,20 ) = _2_ = 113 /
Si los datos estuvieran agrupados en intervalos, "' 0,20 0,20 1 1 ,. m seg
- +- - + -
2 10 2 JO
X9 = i(x 1 r ' (X 2 r' ... (X,r
que es la media armnica de las dos velocidades.
donde 12 1 , 12 2 , . , 12, son las observaciones correspondientes a cada uno de los Si los datos estuvieran agrupa dos en in tervalos,
r intervalos (con 12 1 + 122 + + 12, = 12) y donde X 1, X2 , . . , X, son los pun-
tos medios de dichos intervalos. /j
Usando logaritmos, tendremos X"= - - - - - - -
: , log Xa = 12, log Xi + 12, log X2 + + 12, log X, L n; log X,
!!..!.+ 112 + . . . + 11_,_
X1 X2 X,
!!..!.. + 112 + . .. + !1_,
X1 X2 X,
n
n 12

donde 12 1 , n 2 , , n, son las o bservaciones correspondientes a cada uno de los r


b) Media armnica intervalos (con 12 1 + 122 + + n, = n) y donde X, , X2 , . . , X, son los p unto s
medios de dichos interva los.
Llama mos media armnica, X., de 12 valores X,, X 2 , , x. al reciproco de la
media a ritmtica de los recprocos de esos n valores. Es decir,
c) M edia cuadrtica
n
x. 1 1 1 1 1 I
- + - +--+ - -+ - + + - Llamamos media cuadrtica, X,, de II valores X1 , X 2 , .. , x. a la raz cuadrada
X X2 X. X X2 X. de la media aritmtica de los cuadrados de esos n valores. Es decir ,
ll

D e la expresin an terior se deduce que ~


. =v/ x 2
1
+ x 22 + --- + x2
1 I 1
-+ - + + - De la expresin anterior se deduce que
X X2 X.
X. = 12
g 2 _ Xf + X1 + + X;
En otras palabras, la media armnica, X. , es un valor tal que su recproco es ' - 12
igual a la media aritmtica de los recprocos de los datos. De aqu que digamos
que la media armnica es una media ari tmtica generalizada. En otras palabras, la media cuadr tica, X,, es un va lor tal que su cuadrado es
&l!MPLO 5.13. Sea un impulso nervioso eferente que recorre 0,40 m para al- igual a la m edia aritmtica de los cua drados de lo s d a los. De aqu que digamos
canz ar el msculo y provocar una contraccin. Debido a las carac tersticas de la que la media cua dr tica es una media aritmtica generalizada .
Es tadist,cos d e posicin o tendencia central / 19
78 / Estadistica para Psiclogos

1 ' 5.3.2. Definicin


EJEMPLO 5.14. Calculemos la media cuadrtica de 1, O, 3, - 1, 3.
Punto o valor numrico q ue d eja por encima y por debaJo de s el 50 por 100
x=
,
Jl + o+ 9
5
+ 1 +9= /20 = 2
Vs
de las observaciones.

5.3.3. Clculo
Si los datos estuvieran agrupados en intervalos,
a) Datos agrupados en i111en:alos

Comenzamos con datos agrupados en intervalos porque la aplicacin del con -


'n 1 X ~ 2 X~ + + n,X;
x' = n
cepto propuesto de mediana es ms obvia en este caso que en el de datos no agru-
pados.
EJEMPLO 5.1 5. Engelman (]970) investig la inluencia del_ educacin esco lar
sobre el cociente intelectual (CI) en un grupo de nios con bajo nivel social y cul-
donde n 1 , n 2 , . . . , n, son las observaciones correspondientes a cada uno d e los r tural. Para ello les som eti a un p rograma educativo intensivo dura nte dos aos
intervalos (con 11 1 + 112 + + n, = n ) y donde X 1, X2 , , X, son los puntos y midi sus cocientes intelectuales al principio y al fin d el programa. Comenzaron
medios de dichos intervalos. el programa 15 nios de cuatro aos. Lo concl uyeron 12. Los datos (agrupados
por nosotros en intervalos) de los 15 ni os al empezar son los siguientes :

5.2.7. NOTA
TAB LA 5. 1
La segunda propiedad de la media, la suma de las diferencias cuadrticas de --
n puntuaciones respecto a su media es mnima, queda legitimada ms sencilla- CI n,
mente derivando F(k ) = I: (X, - k) 2 respecto a k. En efecto, F ' (k) = 129,5
-2 I: (X; - k), F "(k) = 2n. 11 5 -129
Con estos supuestos, 114,5
a) Si k = X, F '(X ) = -2 I: (X; - X) = O, F " (X) = 2n > O. Por tanto, 100-114 4
99,5
para k = X, F pasa por un m nimo.
85-99 8
b) Si F pasa por un mnimo, F'(k) = - 2 I: (X; - k ) = O. Por tanto, I: X ; = nk, 84,5
k =:EX; = X 70-84 2
n 69,5
15

5.3. Mediana A partir de ellos, calculemos la mediana.

Comenzamos aceptando que d entro de cada intervalo, las observaciones en l


5.3.1. Introduccin previa
contenidas se distr ibuyen homogneamente. Es decir, que si en un in tervalo tene-
mos cinco observaciones, suponemos que cada una de ellas ocu pa la quinta parte
Suponemos que, antes de calcular la mediana, hemos ordenado las pun tua- del mismo_
ciones de m enor a mayor o de mayor a menor. Ordinariamente, lo haremos de La mediana tiene que ser un punto o valor nu mrico mayor que 69,5 y menor
menor a mayor. Nos limitamos a variables cuantitativas continuas, porque, aunque que 129,5, tal q ue deje por encima y por debajo de s el 50 por 100 de las 15 obser-
es posible calcularla en el caso de variables cuantitativas discretas y aun en el de vaciones, es decir, 7,5 observaciones. Evidentemente, 84,5 no puede ser la mediana,
var,iir$ls cuasi-cuantitativas (ordinales), sin embargo, de hecho, casi siempre suele pues deja por debajo de si 2 observaciones (y por encima 13 ). Tam poco 99,5 ser
ser' calculada para variables cuantita tivas contin uas.
80 / Estadistica para Psiclogos
Estadis t,cos de posicin o tendencia central / 81

mediana, pues deja por debajo de s 10 observaciones (y por encima 5 J. La mediana Ntese que
tiene que ser un valor entre 84,5 y 99,5. Llamemos crtico al in terva lo (84,5 -
- 99,5) y dibujmoslo ampliado (Fig. 5. 1). Md = 845 + 1031=845 + (5, 5 Hl 5 ) = 845 + 7 , 5 - 2 15 =
' ' ' 8 ' 8

~- 2)
t ~----~~r~-ur
99 5

(T
t t
---------- 2.5 x' 84.5 + 15 = 94.81

== .,O,
94.81--------- -- Ahora bien,
8 15 5,5 X
84,5 = !, : lmi te exacto inferior del intervalo crtico.
oblrv. unid.
~
2
= ~
2
mitad o 50 por 100 de las observaciones.

84 ,5 ==--J Fig. 5.1 15


2
8
= nb; nmero de observaciones bajo el intervalo crtico.
= 11,J: nmero de observaciones dentro del intervalo crtico".
= / : amplitud del intervalo crtico*.
Como el razonamiento expuesto en este caso par ticular es vlido para cualquie r
Si las ocho observaciones del intervalo (84,5 - 99,5) ocupan homogneamente otro caso, podemos aceptar como f rmula de la mediana:
una distancia igual a 15 unidades, las 5,5 observaciones (que con las 2 inferiores
forman el 50 por 100) ocuparn una distancia igual a x unidades. Es decir, - - n
ll )
Md = !, + ~ - -b 1 (5.5)
( nd
8 15 (5,5)(15)
~ x= - - - 10.31
5,5 x 8
Podamos, tambin, haber pensado as: Si las ocho observaciones del intervalo
(84,5 - 99,5) ocupan homogneamente una distancia igual a 15 unidades, la s
Por tanto, Md = 84,5 + 10,31 = 94,81
2,5 observaciones (que con las cinco superiores forman el 50 por 100) ocuparn
La vertical levantada sobre la mediana divide el rea total en dos reas de igual una_ distancia igual a x ' unidades. Es decir,
superficie (Fig. 5.2).
8 15 , (2,5 )(15)
-2,5 = -x' , x = -
8
- ~ = 4,69. Por tanto, Md = 99,5 - 4,69 = 94,81.

Ntese que
25
Md = 995 - 469 = 995 - ( , Hl2) = 995 - 75 - 5 15 =
' ' ' 8 ' 8

= 99,5 -
~-5)
( - 15 = 94,81

69,5 84 .5 '99.5 114,5


94,81
Es puramente casual que coJncida el valor deJ nmero de observaciones (n = 15) con el valor
f correspondiente a la amplitud del intervalo critico (! ; 15). Veremos cmo en el ejemplo 5. 16 no
Fig. 5.2 se da tal coincidencia.
82 / Estadistica para Psiclogos Esradist,cos de posicin o tenden cia cen tral / 83

Ahora bien, 122. 5 t


99,5 = !, : lmite exacto superior del intervalo crtico. 1 X

5 = n,: nmero de observaciones sobre el intervalo crtico.


119.17_ ____ ___ j_ __ j _______ :b~c- unid

2
15 , 8 y 15 s1gm
. .Ji1can Io mismo
. que en eI caso anterior.
.

Por consiguiente, podemos proponer la siguiente como frmula alternativa


J
ob ser v. unid .
10 1
para la mediana 2 X
., obs erv. unid .

-- n
n )
Md = !, - 2 nd s (5 .6)
(

EJEMPLO 5.16. Calculemos la mediana a partir de los datos (agrupados en


"'' Fig. 5.3
j
1, intervalos por nosotros) correspondientes a los 12 nios que concluyeron los dos
aos del programa intensivo. La tabla adjunta nos muestra los CJ de dichos nios
al final del segundo ao. Si las tres observaciones del intervalo (J 12,5 - 122,5 ) ocupan homognea
mente una distancia igual a diez un idades, las dos observaciones (que con las cuatro
inferiores forman el 50 por 100) ocuparn una distancia igual a x unid ades. Es
TABLA 5.2 decir,

3 10 (2)(10) = 6,67
CI n; -=- X = -3
142,5 2 X

133.142 2
132,5
123132 3 Por tanto, Md = 112,5 + 6,67 = 119, 17.
....:1 122,5 Por supuesto, a este mismo resultado habramos llegado aplicando (5.5 ). En
113122 3 efecto.
,:
112,5
.,1~ 103112 4
g _ 4
102,5
2
12 Md = 112,5 + -- 10 = 112,5 + 6,67 = 119,1 7
3

Podamos, tambin, haber pensado as : Si las tres observaciones del inter va lo


La mediana tiene que ser un punto o valor numenco mayor que 102,5 y (112,5 - 122,5) ocupan h omogneame nte una distancia igual a 10 unidades, la
menor que 142,5, tal que deje por encima y por debajo de s el 50 por 100 de nica observacin (que con las cinco superiores forma el 50 por 100) ocupar una
las 12 observaciones, es decir, seis observaciones. Evidentemente, 112,5 no puede distancia gua! a x ' unidades. Es decir,
ser la mediana, pues deja por debajo de s cuatro observaciones (y por enci
ma ocho). Tampoco 122,5 ser mediana, pues deja por debajo de s siete ob-- 3 10 (1)(1 0 ) = 3,33
x' = -3
servaciones (y por encima cinco). La mediana tiene que ser un valor entre l x' '
11 2, 5:,Y 122,5 . Llamemos crtico a l intervalo (112,5 - 122,5) y dibujmoslo
ampiado (Fig. 5.3). Por tan to, M d = 122, 5 - 3,33 = 11 9, 17
84 / Estadistica para Psiclogos Estadsticos de posicin o tendencia central / 85

Por supuesto, a este mismo resultado habramos llegado aplicando (5.6). En


efecto,

Mtl = 122,5 - -
~ - 5
2
3- 10 = 122,5 - 3,33 = 119,17 W8 &j+ : 1 D
6 7 9 !O 13
La vertical levantada sobre la mediana divide el rea total en dos reas d e igual
superficie. (Fig. 5.4.) Es decir, la mediana es la pun tuacin que ocupa el lugar cen tr al. La vertical le-
vantada sobre la mediana (9) divide el rea to tal en dos reas de igual superficie
(2 + 0,5 = 2,5 ; 2 + 0,5 = 2,5).
2) La puntuacin que ocupa el lugar central es igu al a una o varias de las
restantes.
EIEMPL05. 18. Calcul emos la mediana de 14, 15, 16, 18, 18, 18, 18, 19,20, 20, 22.
La puntuacin que ocupa el lugar sexto (el central) es 18 que es igual a las que
,;'
,. ocupan los lugares cuarto, quinto y sp timo. El intervalo crtico es el intervalo
'l unitario (17,5 - 18,5). Por tanto,
J

7 3)
... .!...!. _
:j Md = 17,5+ ( 1 17,5 + ?~ = 18,125
4
102 ,5 112,5 t 122 ,5 132,5 142,5
J
l 19,17
I'
/ Fg. 5.4

, La diferencia entre la mediana al principio del experimento y la m ediana al


fin del mismo (119,17 - 94,81 = 24,36 puntos del CI) manifiesta la inluencia de
1 la educacin escolar sobre el C/.
5 3
3 + 4 --- ~ 5,5 4+4 --- ~ 5,5

b) Datos no agrupados en intervalos

No es ms que una aplicacin de lo dicho en el apartado anterior para el caso


particular en que 1 = 1 y n4 = 1 o nd = k , segn que exista una sola o existan k
observaciones dentro del intervalo unitario crtico. Consideremos por separado
las dos alternativas: nmero impar de observaciones y umero par de las m ismas.
Nmero impar de observaciones. Tendremos un solo lugar central. 14 IS 16 18 19 20 22
1) La puntuacin que ocupa el lugar central es distinta de todas las dems. 18 . 125
EJEMPLO 5. 17. Calculemos la mediana de 6, 7, 9, 10, 13 . La puntuacin que
ocupa el lugar tercero (el central) es 9, que es distinta de todas las restantes. El
intervalo crtico es el intervalo unitario (8,5 - 9,5). Por tanto, La ver tical levantada sobre la m ediana (18,125) divide el rea total en dos reas
de igual superficie (3 + 2,5 = 5,5; 4 + 1,5 = 5,5 ).

.,.
' Md = 8,5 +
~- 2)
(T 1 = 8,5 + 0,5 =9
Nmero par de observaciones. Tendremos dos lugares centrales.
1) Las puntuaciones que ocupan los lugares centrales son distintas entre
s y ambas son consecutivas o no lo son.
86 / Estadistica para Psiclogos Esradisticos de posicin o tendencia central / 87

Bajo una y otra condicin es posible seguir aplicando la frmula general eli-
giendo como intervalo crtica>>unitario, bien el que contiene la puntuacin central
inferior, bien el que contiene la superior. Sin embargo, slo si las puntuaciones
centrales son consecutivas, el valor encontrado para la mediana es nico y, adems,
coincide con la media aritmtica de las dos puntuaciones centrales. Por el contrario,
si no son consecutivas, el valor obtenido para la mediana es uno si elegimos com o
intervalo crtico unitario el que contiene la puntuacin central inferior y es otro
si elegimos el que contiene la puntuacin central superior. Son, adems, posibles
otros infinitos valores distintos para la mediana, situados entre los dos anteriores.
Todos ellos verifican la definicin de mediana. Pero con el fin de fijar un valor nico 31 32 33 37 39 40
para la mediana, se suele tomar, arbitrariamente, como tal la media aritm tica 35
de las dos puntuaciones centrales.
En conclusin, en uno y otro caso la mediana ser la media aritmtica d e las 2) Las puntuaciones que ocupan los lugares centralesn son iguales entre s,
dos puntuaciones centrales. pero distintas de todas las dems.
EJEMPLO 5.19. Calculemos la mediana de 24, 25, 26, 26, 27, 27, 27, 29. Las EJEMPLO 5.21. Calculemos la mediana de 3, 3, 4, 6, 6, 7, 7, 9. Las puntua-
puntuaciones que ocupan los lugares cuarto y quinto (los dos centrales) son 26 ciones q ue ocupan los lugares cuarto y quinto {los centrales") son las dos
y 27. Por tanto, la mediana valdr 26,5, media aritmtica de 26 y 27. iguales a 6 y distintas de las restantes. El intervalo crtico es el interva lo uni-
. tario (5,5 - 6,5).
ii~ Por tan to,
j ~
1
Md = 5,5 +
~-3)
(-- l = 5,5 + 0,5 = 6

Es decir, la mediana es el valor comn a las dos p untuaciones centrales>>. La


vertical levantada sobre la mediana (6) d ivide el rea total en dos reas de igual
superficie (3 + 1 = 4: 3 + 1 = 4).
J 24 25 26 1 27
26,5
29
1
3+22 ~ 4 3+2..!..~4
2
Si el lector aplica la frmula general eligiendo como crtico tanto el intervalo
(25,5 - 26,5) como el intervalo (26,5 - 27,5) llegar al mismo resultado, a saber, 1
Md = 26,5. T
La vertical levantada sobre la mediana (26,5) divide el rea total en dos reas 1
de igual superficie (4 , 4 ). T
EJEMPLO 5.20. Calculemos la mediana de 31, 32, 32, 33, 33, 37, 37, 37, 39, 40.
Las puntuaciones que ocupan los lugares quinto y sexto (los dos centrales) son 6 9
33 y 37. Por tanto, la mediana valdr 35, media aritmtica de 33 y 37.
Si el lector aplica la frmula general q,ligiendo como crticm> el intervalo
(32,5 - 33,5) llegar a Md = 33,5. Si, en cambio, elige como crtico el interva- 3) Las puntuaciones que ocupan los lugares centrales son iguales entre s
lo (36,5 - 37,5) llegar a Md = 36,5. Ciertam ente, tanto 33,5 como 36,5 (y los e iguales a una o varias de las restantes.
infinitos si tuados entre ambos) verifican la definicin de m ediana. Sin embargo, EJEMPLO 5.22. Calculemos la mediana de 2, 5, 5, 5, 6, 8. Las puntuaciones
solemos elegir como mediana el situado en el punto medio de todos ellos, es decir, 35. que ocupan los lugares tercero y cuarto (los centrales) son iguales las dos a 5 e
Id vertical levantad a sobre la m ediana (35) divide el rea total en dos reas de iguales a la que ocupa el lugar segundo. El intervalo crtico>J es el intervalo uni -
igal superficie (5, 5). tario (4,5 - 5,5). Por tanto,
88 / Estadstica para Psiclogos Estadsticos de posicin o tendencia cenera/ / 89

Md = 4,5
~-1)
+ (T 1 = 4,5 + 0,67 = 5,17
Vemos, en efecto, cmo la suma de las diferencias (en valor absoluto) respec-
to a la media es mayor que la suma respecto a la mediana (la primera suma vale
8 y la segunda vale 7 ).
b) Es menos sensible que la media a la variacin de cada una de las puntua-
ciones. Aunque la variacin de una sola puntuacin (elegida a propsito) puede
La vertical levantada sobre la mediana (5,17) divide el rea total en dos reas
hacer variar la mediana, sin embargo, la variacin, de modo bastante anrquico,
de igual superficie (1 + 2 = 3; 2 + 1 = 3).
1 de la mayora y aun de todas las puntuaciones pueden dejar invariante la mediana.
As, por ejemplo, (2, 59, 61 , 945) y (57, 58, 62, 63) tienen la misma mediana (60).
e) Es funcin de los in tervalos elegidos (de su amplitud, de su nmero y de
1+3 .2. ; 3
3
2 + 3 ,_!_; 3
3
1 los lmites de los mismos).
d) Es fundamento de diversas tcnicas estadsticas. Sin embargo, el nmero
de stas es mucho menor que el de las tcnicas basadas sobre la media.
e) Puede ser calculada aunque el intervalo mximo no tenga lmite superior,
ni el intervalo mnimo lo tenga inferior (o, al menos, uno de los dos carezca de su
correspondiente lmite extremo). Con todo, cuando uno de esos dos intervalos
sin lmite extremo contenga dentro de s ms del 50 por 100 de los casos, tampoco

rr,.rro ,u~
5
1
6
o_ 8
podr ser calculada la mediana. As, ser imposi ble calcular la mediana, dada la
siguiente distribucin de frecuencias

5,17
1 X "i

46-4 8 2
NOTA . Quiz, sean un poco superfluas las distinciones acabadas de exponer 43-45
40-42 2
para el caso de datos no agrupados en intervalos y baste con el siguiente criterio:
37-39 14
,; a) Si el nmero de observaciones es impar, la mediana es la puntuacin de la
36 menos 20
observacin que ocupa el lugar central.
b) Si el nmero de observaciones es par, la mediana es la media aritmtica
1: de las puntuaciones correspondientes a las dos observaciones que ocupan los dos f) La mediana es un punto tal, que la vertical levantada sobre el mismo di-
f11 valores centrales. vide el rea total del histograma en dos reas con idntica superficie.
g) Es ms recomendable que la media cuando la distribucin de frecuencias
'.' es muy asimtrica.
p 5.3.4. Propiedades /) Dados r grupos con medianas Md 1 , Md2 , . , Md,, la mediana del grupo
total es igual o mayor que la mediana mnima e igual o menor que la mxima.
a) La suma de las diferencias (en valor absoluto) den puntuaciones respecto a (Vase Calot, 1969.)
su mediana es igual o menor que la suma de las diferencias (en valor absoluto) de
esas puntuaciones respecto a cualquier otro valor. Para la legitimacin de esta
propiedad pueden ser consultados Freeman (1963), Horst (1966), Calot (1969). 5.4. Moda
Aqu nos limitaremos a comprobarla con un,ejemplo muy sencillo.
EJEMPW 5.23. Dadas las puntuaciones 2, 4 y 9, calculemos la suma de sus di- 5.4.1. Definicin
ferencias (en valor absoluto) respecto de la media y de la mediana.
Su media vale 5 y su mediana vale 4. Esto supuesto, Nivel de intervalos o razn

.,(" . a) Datos no agrupados en intervalos.


12 .:.. 51 + 14 - 51 + 19 - 51 = s 12 - 41 + 14 - 41 + 19 - 41 = 7 Puntuacin a la que corresponde frecue ncia mxima. Es decir, la puntuacin
90 / Estadistica para Psiclogos Estadsticos de posicin o tendencia central / 91

que ms veces se repite. As, por ejemplo, valdr 2 la moda de las puntuaciones: Nivel nominal
2, 5, 7, 2, 4, 2, 6, 6, 4, 2, 2, 3, 2.
b) Datos agrupados en intervalos_. Modalidad o categora nominal a las que corresponde frecuencia mxima.
Punto medio del intervalo al que corresponde frecuencia mxima. EJEMPLO 5.26. Conde y Domnech (1976) proponen los siguien tes resultados
EJEMPLO 5.24. Conde y Domnech (1976) estudiando una mues tra de pacien- respecto a su muestra de esquizofrnicos.
tes esquizofrnicos encontraron la siguiente distribucin de frecuencias:
Estado civil Total Varones M ujeres

Edad Total Varones Mujeres


Solteros 80 52 28
Casados 20 JO 10
80-89 9 3 6
2 9
Viudos 7 o 7
70-79 11
60-69 15 9 6
50-59 16 5 11
40-49 7 3 4 La moda es la categora solteros tanto para el grupo total, corno para el gru-
30-39 11 9 2 po de los varones y de las mujeres por separado. Es la categora solteros a la que
20-29 31 25 6 corresponde frecuencia mxima. En otras palabras, la mayora de los esquizo-
10-19 7 6
frnicos estudiados son solteros.

La moda para el grupo total y para el de los varones vale 24,5 aos (punto medio 5.4.2. Propiedades
del intervalo 20 - 29) y vale 54,5 aos (punto medio del intervalo 50 - 59) para
a) Es muy sencilla de calcular.
el de las mujeres.
b) Tiene el inconveniente de no ser necesariamente nica. Dentro d e una misma
distribucin de frecuencias pueden aparecer dos o ms valores o d os o ms cate-
Nivel ordinal goras a los que corresponda frecuencia mxima.
e) Es funcin de los intervalos elegidos (de su amplitud, de su n mero y de
Valor o categora ordinal a los que corresponde frecuenci a mxima. los lmites de los mismos).
1,
-:~ EJEMPLO 5.25. Conde y Domnech (1976) en la misma investigacin acabada d) Puede ser calculada aunque el in tervalo mximo no tenga lmite superior
1;- de citar encontraron que el nivel cultural de 97 personas, de la muestra estudiada, ni el mnimo lo tenga inferior (o, al menos, uno de los dos carezca de su correspon-
diente lmite extremo). Con todo, cuando uno de esos dos intervalos sin lmite
era el siguiente:
extremo contenga dentro de s la frecuencia mxima, tampoco ser calculable la
1~; moda.
Nivel cultural Total Varones Mujeres

Superior (4) 14 13 1 1 5.5. Percentiles


Medio (3) 19 10 9
Inferior (2) 63 30 33
Nulo (1 ) 1 o 1 1 5.5.1. Definicin

Hemos definido la mediana como un valor numrico q ue deja por debajo de


s el 50 por 100 de las observaciones. Pues bien, definiremos el percentil k como un
La moda es la categora inferior (o valor ordinal 2) tanto para el grupo lota!,
valor numrico que deja por debajo de s el k por 100 de las observaciones. As,
como para el grupo de los varones y de las mujeres por separado. Es la categora
decir que 35 es el percentil 72 equivale a d ecir que dicho valor numrico deja por
inferior a la que corresponde frecuencia mxima. En otras palabras, el grupo
debajo de s el 72 por 100 de las observaciones del grupo de que se trate.
con nivel cultural inferior es el ms numeroso.
92 / Estadistica para Psiclogos
Esradisr,cos de posicin o tendencia centr al / 93

1 1
Todo percen til sigue siendo ndice de posicin. Nos indica la posicin dentro
del grupo del objeto (persona, animal, cosa, familia, entidad, etc.) que tiene como
50.5 1 1 t t
puntuacin dicho percentil. Si, por ejemplo, dicho objeto tiene como puntuacin 3 x'

LJ ____ T T
el percentil 80, sabemos que deja por debajo de s el 80 por 100 de los objetos de su
grupo. O, expuesto de otro modo, que su puntuacin supera al 80 por 100 de las
puntuaciones del grupo. Sin embargo, ya no podemos decir que sea ndice d e ten-
dencia central. Un percentil, por su propia naturaleza, es una p untuacin que puede 7 15
estar situada tanto hacia el centro de las restantes puntuaciones de un grupo, como observ. uni<l.
en uno cualquiera de los dos extremos.
4 X
obscrv. und.
1

"' . j j
5.5.2. Clculo

Se siguen pasos anlogos a los seguidos para el clculo de la mediana. En rea-


lidad, la mediana es un percentil determinado, el percentil 50. Al igual q ue sta,
Fig. 5.5
los percentiles son calculables a nivel ordinal. No obstante, slo suelen ser apli-
cados a variables cuantitativas y, ms concretamente, continuas. El percentil 60, P 60 , tiene que ser un pun to o valor numrico mayor que 5,5 y
Propondremos el clculo de percenliles nicamente en el caso de datos agru- menor que 80,5, tal q ue deje por debajo de s el 60 por 100 de las 20 observaciones,
pados en intervalos. El lector se encargar de hacer consideraciones anlogas a 6 2
las verificadas para el clculo de la mediana en el caso de datos no agrupados en es decir, ( 0)( 0) = 12 observaciones. Evidentemente 35,5 no puede ser P60 ,
100
intervalos. pues deja por debajo de si ocho observaciones. Tampoco 50,5 ser P6 0 , pues deja
EJEMPLO 5.27. Cravioto y Robles (1965), mediante el test de Gesell, encon-
por debajo de s 15 observaciones. P60 tiene que ser un valor entre 35,5 y 50,5. Llame-
traron los siguientes cocientes de desarrollo motor en un grupo de nios de corta
mos <<crtico al intervalo (35,5 - 50,5) y dibujmoslo ampliado (Fig. 5.5 ).
edad que sufran una fuerte desnutricin de protenas : 67, 25, 20, 20, 33, 33, 40, 69,
Si las siete observaciones d el intervalo (35,5 - 50,5) ocupan homogneamente
75, 42, 38, 46, 37, 52, 31, 57, 40, 39, 7, 26. Calculemos el percentil 60 de estos datos
una distancia igual a 15 unidades, las cuatro observaciones (que con las ocho in-
despus de haberlos agrupado en los siguientes intervalos :
feriores fo rman el 60 por 100) ocuparn una distancia igual ax unidades. Es decir,
7 15 =
~ = ~ X= (4)(151 8,57
X n, 4 X 7
80 ,5
;
66-80 3 Por tan to, P 6 0 = 35,5 + 8,57 = 44,07.
65,5
:f 51 -65 2
50,5
36-50 7
35,5
21-35 5
20,5
6-20 3
5,5
20

Comenzamos aceptando, al igual que lo hicimos al tratar de la mediana, que 5,S 20.5 35.5 4/0150,5 65 ,5 80,5
dentro-.de cada intervalo las o bservaciones, en l contenidas, se distribuyen homo- Fig. 5.6
gnemente.
94 / Estadistica para Psiclogos Estadsticos de posicin o ten dencia central / 95

La vertical levantada sobre P60 divide el rea total en dos reas iguales al 60 Ahora bien,
por 100 (la de la izquierda) y al 40 por 100 (la de la derecha) respectivamente
(3 + 5 + 4 = 12 ; 3 + 2 + 3 = 8) (Fig. 5.6). 50,5 = I,: lmite superior del intervalo crtico.
Ntese que
2
12 8 (40)( 0) = (k ' )(n): k ' por 100 de las observaciones, d onde k ' por 100 = 100 por
P6o = 35,5 + 8,57 = 35,5 + (4 )(I 5 ) = 35,5 + - 15 = ' 100 100
7 7 JOO - k por 100.
(60)(20) _ 8) 5 = n, : nmero de observaciones sobre el intervalo crtico.
100
= 35,5 + ( 15 = 44 ,07 7 y 15 representan lo mismo que en el caso anterior.
7
Ahora bien, Por consiguien te, podemos proponer la siguiente como frmula alternativa
para P1 ,
35,5 = I, : lmite exacto inferior del intervalo crtico.
(k ')(n ) _ 11
)
(60)(20) (k)(n) .
= 100 :k por 100 de las observacwnes. P, = /, _ ( 100 ' J (5.8)*
100 nd
8 = nb: nmero de observaciones bajo el intervalo crtico.
7 = nd; n mero de observaciones dentro del intervalo crtico.
15 = 1 ; amplitud del intervalo crtico. 5.6. Resumen: Definiciones y frmulas
Como el razonamiento expuesto en este caso particular es vlido para cualquier
otro caso, podemos aceptar como frmula del percentil k, P1 ;
Media aritmtica: Llamarnos media aritmtica den valores a la suma de ellos
dividida por n .
-(k)(n) - nb)
P, = I; + ( 100 nd 1 (5.7) X =LX, (d atos no agrupad os en intervalos)
11

Podamos, tambin, haber pensado as: Si las siete observaciones del intervalo
X- I:n X
= =-:..:.L.:..:.. (datos agrupa d os en m
. lerva 1os )
(35,5 - 50,5) ocupan homogneamente una distancia igual a 15 unidades, las n
tres observaciones (que con las cinco superiores forman el 40 por 100) ocuparn
una distancia igual a x ' unidades. Es decir, Medias aritmticas generalizadas

7 15
= (3)(15)
-7
= 6,43 a) Media geomtrica: Llamamos med ia geomtrica de n valores a la raz
3 =~ , x' ensima del producto de esos n valores.

Por tanto, P60 = 50,5 - 6,43 = 44,07.


Ntese que X, = j (X 1 )(X2 ) . . (X") (datos no agrupados en intervalos)

P 60 = 50 5 - 6 43 = 50 5 - (
3HI 5 ) = 50 5 - S - 5 15
, , ' 7 ' 7 X9 = J (X , )"' (X1 )"' (X, )"' (d atos agrupados en intervalos)

(40)(20) 5)
,,.f'
= 50 5 - ( IOO 15 = 44 07 El pcrcen!il 25 suele s er llamad o pri mer cua rt il , e l perccn!il 50 segundo cuart il (o me diana) y el
' 7 ' percent il 75 sue le denomi narse tercer cuartil.
96 / Estadistica para Psiclogos Estadsticos de posicin o tendencia central / 97

b) M edia armnica: Llamamos media annomca de 11 valores al reciproco EJERCICIOS


de la media aritmtica de los recprocos de esos 11 valores.
5.1. Calcular la media aritmtica a partir de los siguien tes datos no agrupados en
n
x = - - - - - --
1 1 1 1 l 1 (datos no agrupados
intervalos.
-X + - + " + -X,, - + - +"+- en intervalos)
X 2
Xi X2 X,, a) 8, 7, 2, 8, 6, 5, 2, 4 b) 18, 20, 18, 17, 24, 20, 23
n e) 5, -1, 4,8, - 2 d) 2, -3, 8, -9, O, 2, l, - 4, O, -2
e) 1/2, 1, 2/5 /) l/ 2, - 3, - 1/4, 2/5
ll
g) 0,050, - 0,200, 0,005, -0,01 O, -0, 100.
X= - - - -- - (datos agrupados en
~+ 112 + .. _+ 11, ~ + 112 + ... + 11,__ 5.2. Calcular la media aritmtica a partir de los siguien tes datos agrupados en
X1 X2 X, X1 Xi X, in lervalos) intervalos
ll
- --
a) X n, b) X n, e) X ni d) X n1
e) M edia cuadrtica: Llamamos media cuadrtica de 11 valores a la raz cua- - -- - - - - --
drada de la ~edia aritmtica de los cuadrados de esos 11 valores. 11 -13 3 100-104 1 80-83 8 41-47 7
8-1 0 6 95-99 5 76-79 12 34-40 14
-
X' _
,,xi1 + xi2 + . . . + xi (datos no agrupados en intervalos)
5.7 7 90-94 !O 72-75 14 27-33 12
- 11
2--4 4 85-89
80-84
7
2
68-7 1 6 20-26 5

11 1 X f + n 2 X + + 11,X,2 (datos agrupados en intervalos) - --


X =
' n e) X n1 [) X n; g) X 11,
- -- - - -- - --
Mediana: Punto o valor numrico que deja por encima y por debajo de si el 45.49 6 0,20-0,22 9 19-2 1 2
50 por 100 de las observaciones. 40-44 JO 0,17-0, 19 15 16-18 4
35-39 17 0, 14-0,16 18 13-15 7
30-34 18

-(i -
0, 11-0,13 20 10-12 8
11 25-29 10 0,08-0, 10 14 7. 9 6
Md = /, + (~ - nb) J = /, ' ) J 20-24 10 0,05-0,07 6 4- 6 5
"d lid 15- 19 9 1-3 4

Moda: Puntuacin a la que corresponde frecuencia mxima. O punto medio


del intervalo al que corresponde frecuencia mxima. (Si nos encontramos a nivel 5.3. Sabiendo que la media aritmtica vale 8,85, calcular las dos frecuencias que
de intervalos o de razn.) fallan en el cuadro siguien te :
Categora ordinal a la que corresponde frecuencia mxima. (Si nos encontra-
mos a nivel ordinal.) X n, n,x,
Categora nominal a la que corresponde frecuencia mxima. (Si nos encontra - - - --- --
mos a nivel nominal. ) 14-16
Percentil: Llamamos percen til k al punto o valor numrico que deja por debajo l l - 13
de si el k por 100 de las observaciones. 8-1 0 8
5.7 4
2-4
(k)(n) _ nb) ((100 - k)(n ) _ 11 )
.... pk =l + ( 100 1 = Is - 100 ' 1 177
-
nd nd
98 / Estadistica para Ps1c/ogos Estadsticos de pos,c,n o tendencia central / 99

5.4. La media aritmtica de dos nmeros vale 8 y uno de ellos es tres veces mayor 5.13. Calcular la proporc10n de mdicos, abogados e ingenieros dentro de un
que el otro, ,cunto valen ambos nmeros? grupo de 800 personas, conociendo el nmero de personas y la proporcin de m-
dicos, abogados e ingenieros dentro de cada uno de los subgrupos en los que se
5.5. Demostrar que, siendo X, = A, + B, + C,, X =A+ B + . divide el grupo primero, de acuerdo con el cuadro siguiente:
5.6. Deseamos transformar las puntuaciones 8, 13, 9, 15, 10 en otras (sumndoles
a todas ellas una misma constante) de modo que su media valga 26. Cul debe
ser esa constante aditiva ?
5.7. Ocho personas han comparado dos frases, A y B , acerca del divorcio, valo-
G r. 1. 0 , 11 1 = 2 10 Gr. 2. 0 , 11, = 180 Gr. 3. 0 , n 3 = 220 G r. 4.o, 114 = 190
- -
rando cuntas veces ms favorece A que B al divorcio. Los datos obtenidos han Mdicos 0,25 0,30 0,35 0,33
sido los siguientes: 2; 2,5; 2,7; 1,8; 3; 1,5: 2; 2,5. En qu proporcin, por trmi- Abogados 0,50 0,52 0,45 0,40
no medio, ha resultado ser ms favorabl e al divorcio la frase A que la B? Ingenieros 0,25 0, 18 0.20 0,27
5.8.Calcular dos nmeros tales que su media aritmtica valga 7,5 y su media
1,00
- - -- - - - - - --
1,00 1,00 1,00
geomtrica valga 6.
5.9. Sea k el valor de uno de dos nmeros cuya media aritmtica es igual que su
media armnica. Esto supuesto, cunto vale el otro nmero ?
5. 10. Un ciclista va de A a B a 20 km por hora y vuelve de B a A a 60 km por hora . 5.14. Calcular la proporcin de solteros, casados y viudos dentro de un grupo
Esto supuesto, cul es la velocidad media a la que ha recorrido la distancia total? de 150 adultos, conociendo el nmero de personas y la proporcin de solteros, ca-
(Sugerencia: utilizar la media armnica.) sados y viudos dentro de cada uno de los subgrupos en los que se divide el grupo
5. 11 .Calcular el peso medio de un grupo de personas, conocido el nmero de primero, de acuerdo con el cuadro siguiente:
personas y el peso medio de cada uno de los subgrupos en los que se divid e el grupo
total primero, teniendo en cuenta el cuadro siguiente :
Gr. l.". 11 1 = 60 Gr. 2. 0 , n 2 = 90
- - - --
Subgrupo i Personas (n;) Media (X.) So lteros 0,30 0.25
Casados 0,45 0,55
1 150 75 Viudos 0,25 0,20
2 220 60
3 180 65 1,00 1,00

[.::
5.12. Calcule la media aritmtica en lenguaje del primer curso de Bachillerato 5.15. Calcular la mediana a partir de los siguientes datos agrupados en intervalos:
de un centro escolar, sabiendo que est dividido en cuatro secciones, A, B , C y D,
segn el cuadro siguiente:
a) X "1 b) X 11 e) X n d) X
-- ~- "1
-- - -~ ~
Seccin N mero de al umnos Nota media 7-8 7 30-34 8 40-45 6 57-64 7
5-6 JO 25-29 18 34.39 12 49-56 11
A 20 10 3-4 8 20-24 20 28-33 16 4 1-48 18
B 50 6 1-2 5 15-19 16 22-27 14 33-40 15
..,:- e 60 5 - - - 10-14 10 16-21 8 25-32 JO
D 30 8 - -- 17-24 3
t Estadsticos de posicin o tendencia central / 1O1
100 / Esradst1ca para Psiclogos
1- --- --- t 5,20. Calcular la mediana de las puntuaciones 4, 4, 5, X, 5, 4, 4, sabiendo que su
1. X h) X n,
1 e) X
- -
",
38-41 13
f) X

137- 141
11)

lO
g)
- - -
n,

90-91 JO 122-128 5 ' media vale 5 y donde X es un valor desconocido.


. 5.21. Calc~lar los percentiles 15, 25, 36, 15 y 82, a partir de la siguiente distribu cin
34-37 26 132-1 36 17 88-89 o 115-121 JO de frecuencias
30-33
26-29
30
34
127-131
122-126
33
44
86-87 2
84-85 3
108-114
101-107
23
38
1
22-25 25 l 17-121 40 82-83 5 94-100 35 X ll;
18-21 18 112-11 6 24 87-93 30
14-17 12 80-86 14 100-104 2
95-99 lO
90-94 21
85-89 30
5.16. Calcular la mediana a partir de los siguientes datos no agrupados en inter- 80-84 40
valos. 75-79 38
70-74 34
a) 8, 1, 3, 5, 14, 2, 25 b) 87 , 42,21, 105,1 18,8, 102,20,38
65-69 18
e) 20, 4 , 14, 52, 39, 6, 1O, 35 d) 32, 5, 9, 18, 44, 60, 18, 11 60-64 7
e) 12, 3, 7, 12, 12, 13, 8, 12 /) 5, 1, 2, 5, 14, 5, 5, 12, l, 5
g) 1, 8, 9, 8, 11, 7, 8, 6, 3, I , 8 /) 22, 20, 37, 22, 25
D 4,4,2,2,4, 2, ~ 4,4
/. 5.22. Calcular los percentiles 25, 36 y 75, a partir de la siguiente d istrib ucin
5.17. , Es posi ble calcular la mediana a partir de los dos cuadros siguientes? de frecuencias

a) X n, b) X n, X n,

25 puntos o ms 3 25 puntos o ms 3 103-108 8


21-24 10 21-24 16 97-102 JI
17-20 26 17-20 18 91-96 16
13-16 38 13-16 24 85-90 10
12 puntos o menos 64 12 puntos o menos 63 79-84 5

5.18. ;, Cual de las dos, media o mediana, representa mejor a los valores numri-
cos : l, 3, 4, 6, 8, 200, 8, 6, 4, 3, I ? J. 5.23. A partir de la siguiente distribucin de frecuencias , calcular las dos pun-
tuaciones que dejan entre s las 133 observaciones centrales y decir qu percen-
5.19. Cul eligira usted en primer lugar, la media o la mediana, como medida
tiles son esas d os pun tuaciones.
de tendencia central, a partir de las siguientes distribuciones de frecuencias ?

a) X n, b) X n, e) X
- -- -
n, r X n,
- -- --
34-39 2 66-69 8 91-100 6 f.! 40-44 13
28-33 o 62-65 10 81-90 10
35-39 40
22-27 l 58-61 25 71-80 25
30-34 77
16-2 1 6 54-57 28 61-70 26 t: 25-29 25
-...... ,,1:
10-15 15 50-53 12 51 -60 11
20-24 20
4-9 12 49 puntos o menos 9 41 -50 5
- - -
102 / Estadistica para Psiclogos

J.
5.24. Llamemos decil primero, decil segundo, ... , decil noveno a los puntos de
la escala que dejan por debajo de s el 10 por 100, el 20 por 100, ... , el 90 por 100
de las observaciones, respectivamente. Esto supuesto, tiene que ser igual la dis-
6
tancia sobre la escala entre dos deciles cualesquiera consecutivos que la distancia Estadsticos de variabilidad o dispersin
entre otro par cualquiera de deciles tambin consecutivos?
1
i;,. 5.25. Los percentiles son valores esencialmente positivos. S? No?

6.1. Introduccin

Los estadsticos de tendencia central o de posicin indican dnde se sita un


grupo de puntuaciones (en zona alta, media o baja). Los de variabilidad o disper-
sin nos indican si esas puntuaciones se encuen tran muy prximas entre s o muy
dispersas. Por ejemplo (7, 9, 11) y (1, 10, 16) tienen la misma media (posicin ),
pero la variabilidad o dispersin de las p untuaciones del primer grupo es menor
que la de las puntuaciones del segundo.

6.2. Desviacin media

6.2.1 . Definicin

Es la media de las d iferencias (en valor absoluto) den puntuaciones respecto


a su media aritmtica. En otras palabras, d adas n puntuaciones X 1 , X2 , x., su
desviacin media viene definida por

DM = /xi - x + 1x2 - x + + x. - x = 1: xi - x (6.1 )


n ll

6.2.2. Clculo

a) Datos no agrupados en intervalos

Aplicacin directa de la frmula (6.l ) a los datos originales.


EJEMPLO 6.1. Diez ratas blancas podan o btener un poco de comida al mover
una palanca situada dentro de una caja. Cada da, despus de veintids horas de
..~ ayuno, las ratas eran introducidas en la caja y se meda el tiempo transcurrido desde
que se les abra el acceso a la palanca hasta que la movan. Los datos de la tabla
104 / Estadistica para Psiclogos Estadsticos de variabilidad o disp ersin / 105

adjunta corresponden al quinto da de entrenamiento. (Vase Hull, Felsinger,


Gladstone y Yamaguchi (1947).) Tiempo n xj nxj lxj- -x'I n,lx; - x')

2 1 2 1,2 2,4
x' = ~
JO = - 02

31-45
Rata n." 2 3 4 5 6 7 8 9 10 16-30 4 o o 0,2 0,8
1-15 4 - 1 -4 0,8 3,2
Tiempo (en seg.): 25; 1,43; 20; 1; 8,56; 16,5; 16; 34; 4,43; 44 X= 17,09 segundos
DM = 15 64 = 9,6 segundos
10 -2 6,4 10

17,09 1 + iJ,43 - 17,09 1 + . .. + j44 - 17,091 _ 109,26 -


DM = 125 10 - 10 -
Queda como ejercicio para el lector la legitimacin de (6.2) y (6.3).
10,926 segundos

6.2.3. Propiedades
b) Datos agrupados en interwlos
Es fcilmente inteligible y fcilmente calculable.
a)
Raramente usada debido a que los valores absolu tos son muy poco mane-
b)
DM = I: nIX; - XI = L n;IX - !_I (6.2) jables matemticamente.
I:nj n

donde nj y Xj ~on, respectivamente, el nmero de observaciones y el punto medio 6.3. Varianza y desviacin tpica
del intervalo j.
EJEMPLO 6.2. Agrupemos los datos del ejemplo 6. 1 en tres intervalos y calcu-
6.3.1. Introduccin
lemos la desviacin media.
Si sumamos las diferencias den p untuaciones respecto a su media, sabemos que
dicha suma vale siempre cero. Para evitar este inconveniente, podemos tomar
Tiempo n, X nX IX, - iJ nJ!X, - xJ -
X = -200 = 20 segund os
dichas puntuaciones en valor absoluto (caso de la desviacin media) o podemos,
tambin, elevar dichas diferencias al cuadrado y sumar estas diferencias cuadrticas.
36 JO
31-45 2 38 76 18 Esta ltima tctica es la que seguiremos en el caso de la varianza y de la desviacin
16-30 4 23 92 3 12 tpica.
1-15 4 8 32 12 48
DM = -96 = 9,6 segundos La varianza, referida a una m uestra, ser designada por s2 y, referida a una
10 poblacin , por a 2 Como en este tomo J nos limitamos al estudio de muestras,
10 200 96
usaremos s 2 al tratar de la varianza. Excepcionalmente usaremos el smbolo a2
cuando de modo incidental nos refiramos a la varianza de la poblacin. A su vez,
la desviacin tpica, referida a una muestra, ser designada por s y referida a una
Junto a la frmula (6.2) y mediante la transformacin x1= X - Xo de que poblacin por a. Llamaremos s;, s~ . .. , a la varianza de la variable X , Y, ...
1
hemos hablado en 5.2.4, tendremos la siguiente frmula
6.3.2. Definicin
DM = I: nlx1 - x'I = I: nlxJ ~ x'I (6.3)
I: n n a) Varianza

Es la media de las diferencias (al cuadrado) de n puntuaciones respecto a su


EJEMPLO 6.3. Elijamos como origen el intervalo 16 - 30 en el cuadro corres- media aritmtica. En otras palabras, dadas n puntuaciones Xi, X2 , . , X", su
pndiente al ejemplo 6.2 y calculemos la desviacin media. varianza viene definida por:
106 / Estadistica para Psiclogos Estadistcos de variabi hdad o dispersin / 107
1
X) 2 + X).2 + + (X. - X) 2 I: (X; - X)2 306
1 1
s; (X, - (X2 -
n
(6.4) Segn (6.4): s; = 5 = 61,20 sx = 7,823 ensayos
n

Segn (6. 5) : s,2 = -6.431 2


- - 35 = 1.286,20 - 1.225 = 6 1,20 sx = 7, 823 en-
b) D esviacin lipica 5
sayos
2
(5)(6.431) - 175
Es la raz cuadrada de la varianza. Ser considerada siempre como positiva. Segn (6.6): s; S2
32. l 55 - 30.625 = 61 ,20 s, = 7, 823
25 ensayos
6.3.3. Clculo

a) Dalos no agrupados en intervalos b) Datos agrupados en n/C'rva/os

Aplicacin directa de (6.4) a los datos originales. Supongam os II observaciones agrupadas en r intervalos, todos ellos de igual
Desarrollando (6.4) podemos llegar a otras dos frmulas equivalentes. amplitud. Sea X, el punto m edio del in tervalo primero y 11 1 el nmero de obser-
vaciones dentro del mismo. Sea X2 el pun to medio del intervalo segundo y n2 el
2
X)2 + X2 ) nmero de observaciones dentro del mismo . Sea X, el pun to medio del intervalo
I:
- (X,
~ -- - = I:
______c.(X; - 2XX,
._ ,__ __,___....:. = :I:
- X,2 2X I:-
- - - X, + nX
- = , y n, el nmero de observaciones dentro del mismo. Segn sabem os, al agrupar
n n n n n
las observaciones en intervalos, atribuimos a cada una de ellas (como puntuacin )
= I: Xt _ 2g 2 + gz _ :I: X _ gi _ I: Xf _ (:I: X,) 2 _ n I: X,2 -2 (:I: X, )2 el punto medio del intervalo dentro del que se encuentra. Restemos ahora cada
n n n n n una de las puntuaciones de la media del grupo y elevemos al cuadrado estas d ife-
rencias. Dentro d el intervalo primero tendremos n 1 puntuaciones iguales a X , y,
Por con siguiente, consiguientemente, n 1 diferencias cuadrticas iguales a (X, - X)2 cuya suma
I:- X _ X2 valdr n 1(X 1 - X) 2 . Dentro del intervalo segundo tend remos n2 puntuaciones
52 - (6.5)
x - n iguales a X2 y, consiguientemente, n 2 diferencias cuadrticas iguales a (X 2 - X )2
cuya suma valdr 112 (X2 - X )2. Dentro del intervalo r ten dremos n, puntuaciones
2 _ n I: X - (:I: X, )2 (6.6) iguales a X, y, consiguien temen te, n, diferencias cuadrticas iguales a (X, - X )2
Sx - nz cuya suma valdr n, (X, - X)2 . En conclusin, la suma de las 11 1 + n2 + + n, = n
dife rencias cuadrticas valdr: n 1 (X, - X )2 + 112 (%2 - X )2 + + n,(X, - X )2 =
EJEMPLO 6.4. Rachman (1968) en un experimento con cinco jvenes pudo = !: nj{Xj - X) 2 y su media (es decir, la varianza de las n puntuaciones) valdr:
confirmar la hiptesis de que el fetichismo sexual es un comportamiento que puede
ser establecido tras un proceso de condicionamiento clsico. El nmero de ensayos I: n1 (X1 - X) 2 !: n(Xj - X) 2
de condicionamiento que fueron necesarios para implantar una conducta fe ti- si = (6.7)
chista en cada uno de los cinco sujetos fue : 35, 36, 21, 45, 38. Calculemos la varianza
r ni n

y la desviacin tpica de estos da tos. De (6.7) es fcil deducir las dos f rmulas siguien tes, de acuerd o con lo dicho
para el caso de da tos no agrupados en intervalos,
X, X,' (X, - X) (X, - .f)2
s2 = :I: nj_ - .f2
35 1.225 o o X
n
(6.8)
36 1.296 1 1 - 175
21 441 -14 196 X = - = 35 ensayos ,2 = n r '!J.-2]_::_J!: 111xy (6.9)
100
5 n2
45 2.025 JO X

38 1.444 3 9
EJEMPLO 6.5. Agrupando en cuatro in terva los los da tos de Conde y Domnech
ns- 6.431 o 306 (1976) propuestos en el ejemplo 5.24, nos queda
108 / Estadi5tica para Psiclogos
Estadisticos de variabilidad o di spersin / 109

Si A = l y B + s;O, = ( 1)s;. Es decir, si sumarnos a todas las puntuaciones


Edad n1 X xi
)
njX1 n;Xf X; - X (X; - i)2 n(X, - X)' una constanle, B, la- varianza (y la desviacin tipica ) de las nuevas puntuaciones
es igual que la varianza (y que la desviacin tipica ) de las antiguas. Lo cual es obvio,
70-89 20 79,5 6.320,25 1.590,00 126.405,00 33,832 1.1 44,604 22.892,080
ya que aadir una constante, B, a todas las puntuaciones, equivale a moverlas corno
50-69 31 59,5 3.540,25 J.844,50 109.747,75 13.832 191 ,324 5.931,044
un bloque rgido, sin alterar su dispersin o variabilidad, bien hacia la derecha
30-49 18 39,5 1.560,25 7 11 ,00 28.084,50 - 6 ,168 38,044 684,792
(si Bes positiva), b ien hacia la izquierda (si Bes negativa).
10-29 38 19,5 380,25 74 1,00 14.449,50 -26, 168 684,764 26.021 ,032
Si A+ O y B = O, s; s;.
= A 2 Es decir, si multiplicarnos todas las puntuaciones
107 4.886,50 278.686,75 55.528,948 por una constante, A, la varianza de las nuevas puntuaciones es igua l que la varianza
de las antignas multiplicada por A 1 . Consiguientemente, la desviacin ti pica de
las nuevas es igual que la desviacin tpica de las antiguas multipl icada por A.
_
X =~
4.886,50 = 45,668 aos pero tornada sta en valor absoluto. La razn de esta restriccin es la siguiente.
Veremos enseguida que una desviacin tipica, no nula, tiene que ser positiva. Por
tanto, s, ser positiva. Ello lleva consigo que si A fuera negativa, s, = As, debera
Segn (6.7): ser negativa, lo cual no tiene sentido, segn lo acabado de indicar. De aqu se sigue
que A debe ser tornada en valor absoluto.
55.528,948 = 518,962 = 22,781
s; = 107 s, aos b) La varianza y la desviacin tpica son sensibles a la variacin de cada una
de las puntuaciones. Baste con que vare una de stas, para que varen aquellas.
Ello es debjdo a que varianza y desviacin tpica dependen de todas y cada una
Segn (6.8):
de las puntuaciones y, consiguientemente, de la media .
e) Son fundamento de muchas tcnicas estadsticas que tienen gran impor-
s; = 278.686
,n~'
75
- 45,6682 = 2.604,549 - 2.085,566 = 518,983, s, = 22,781
anos tancia en Psicologa.
d) Son funcin de los intervalos elegidos (de su amplitud, de su nmero y
Segn (6.9): de los lmites de los mismos ).
e) Fuera del intervalo (X - 2s,, X + 2s,) se encuentra, a lo ms, el [ (l /22 )l 00]
(107)(278.686,75) - 4.886,s2 = 29.819.482,25 - 23.877.882,25 = 518 962 por 100 = 25 por 100 de las observaciones. Fuera del intervalo (X - 3s, , X + 3s, )
s~ se encuentra, a lo ms, el [(1/3 2 )100] por 100 = 11 por 100 de las observaciones.
1072 11.449 '
En general, fuera del intervalo (X - ks, , X+ ks,) se encuentra, a lo ms, el
s, = 22,781 aos [(l /k2 )100J por 100 de las observaciones, sea cual sea la forma de la dist ribucin
de frecuencias.
La diferencia entre 518,962, en (6.7) y 518,983, en (6.8) y (6.9), es debida a efec- Esta propiedad quedar legitimada en el torno 2: Estadstica lnferencial.
tos de redondeo. f) No sern calculables, o no sern recomendables, cuando no sea calculable,
o no sea recomendable, la media corno medida de posicin o tendencia central.
g) La desviacin tpica viene expresada en las mismas unidades en las que
6.3.4. Propiedades vienen expresados los datos. No ocurre lo mismo con la varianza. Si los datos,
por ejemplo vienen dados en metros, la desviacin tpica vendr dada en metros,
a) La varianza de Y1 = AX1 + B, Y2 = AX2 + B, . . . , Yn = AX" + B,
pero la varianza ven dr dada en metros cuadrados.
siendo A y B dos constantes arbitrarias, es igual a la varianza de X multiplicada por h) Dados r grupos. el primero con 11 1 puntuaciones. meda X, y varianza sf,
A 2 . Consiguientemente, la desviacin tpica de Y,, Y2, , Yn, es igual a la des- el segundo con n 2 puntuaciones, media X2 y varianza si, .. . , el r-sirno con n,
viacin tpica de X multiplicada por !Al. puntuaciolleS, media X, y varianza s;, la varianza, s;, de las 11 1 + n 2 + + 11, =
En efecto, sabernos que Y = AX + B (vase 5.2.3.c). Por tanto , la varianza = n puntuaciones, vale
de las nuevas puntuaciones, s;,
valdr, por definicin,

s; = I [(AX,+ B) - (AX+ B)]


2
=I (AX, - AX )2 A1 I (X, - X)
- 2
= A2_1.~
1: n n 11 s2 _ L ll ST !; 11 -(X _ X)2
.._!' ;x - -~. + _ .,_J--'-'----'~
11 n
Consiguientemente, s,. = !Alsx.
11 O / Estadistica para Ps,c/ogos Estadis t,cos de var,ab1/Jdad o d1spers1n / 111

Es decir, la varianza de las n puntuaciones es igual a la media de las varianzas En-.MPLO 6.6.
ms la varianza de las medias.
En efecto, sean

X11 , X2 1 , , X,., 1 las n 1 puntuaciones del grupo 1.0 con media X\ y varianza s}. Gru po p rimero Grupo segundo G ru po tercero

X 12 , X 22 , , X,,, 2 las 11 2 puntuaciones del grupo 2.o con media %2 y varianza sf 1 6 3


-1 8 7 11 = 11
3 5
X 1 ,, X 2 , , . , X.,, las n, puntuaciones del grupo r-simo con media X, y varianza s;. 5 5 X =4
2
Sean X y s~ la media y la varianza del grupo total, es decir, del compuesto por .2 72
14 20 1
las n1 + n2 + + n, = n puntuaciones. Esto supuesto, 10 'X
11
11,=5 11,=2 1 =4
113
x, = 2 x, = 7 x, = 5
1
X) + {X - X)] 2 s = 4 s = 1 s~ = 2
s; = LE (X,j - X)
~,_, _ __ E E [(X,j -
J '
1

/l /l

E E {X,, - 2 1 2 2 E (Xi - X) E (X; - Xi ) E n(X - X )2 L nsj = (5)(4) + (2)( 1) + (4 )(2 ) 30


J ' + J ' + ~;_ _ __ 11 11 = Ti
n /l /J

I: n/X, - X) 2 (5)(2 - 4)2 + (2)(7 - 4)2 + (4 )(5 - 4)2 20 + 18 +4 42


E E (X, - Xi)1 11
E i (X - X)
2
E n -s2 E n (X, - X )2 n
11 = 11 = 11
j 1 + 0 +1 = = + --"--"--- -
n n n n
r . 72 . l 30 , 42
Vemos, en e,ecto, como - es 1gua a - mas --
11 11 11
Es decir, la varianza del grupo total es igual a la media de las varianzas de cada
uno de los r subgrupos ms la varianza de las medias de cada uno de estos mism os r
subgrupos.
6.3.5. Mtodo abreviado para el clculo de la varianza
Recurdese que, segn 5.2.3. a),
Supongam os n puntuaciones agrupadas en in tervalos, todos ellos de amplitud /.
Sea X0 el punto medio de uno de ell os, elegido ar bitrariamente. al que llamaremos
E (X,1 - X) = I: (X,2 - A\) = = E (X,, - X,) = O intervalo origen. Hagamos A = ~ . B =- Xo . Segn 6.3 .4.a), las puntuaciones
1 1 ,
I I
Por tanto, x'. = ~ X + (- Xo) = ~ L :::._ X..9 tendrn com o varianza s 2 - = 1
2
De do n- J.
, I ' I I ' /" . '.
de, s; !2s;-.
= Esta ltima frmula nos permite obten er mediante cuyo s; s;.,
E {X1 - X) E (X, - X, ) = (X , - X) E (X1 - Xi) + {X1 - XJE (X, 2 - 1') + clculo suele ser ms sencillo y breve que el de s;.
Recordando las indicaciones
) 1 1 l propues tas en 5.2.4, vamos a aplicar el m todo abreviado a los mismos datos del
+ ,- .!!= {X, - X ) E (X,, - X,)= O + O+ + O = O ejemplo (6.2) y de los que hemos calcu lad o, all, la varianza mediante el mtodo
1 no abreviado .
112 / Estadistica para Psiclogos
Estadisllcos de vanabi/1dad o dispersin / 113

EJEMPLO 6.7. resulta que la media de todas estas varianzas, as definidas, vale
11
-
1
a; y no a;.
11

Para alcanzar que esa media valga a;:, basta con multiplicarla por _ n_ o, lo que
111 x; x;2 IJ/<; IJ,-l/
> xj - _y (x; - n' n;(x; - .n' 11 - 1
. Iente, b asta con d efimir
es equ1va . s,2 = - 11 I (X, - X )2 = -I (X,
- - - - -- -
- X)
--- - .
2

40 80 1,6916 2,8615 57 ,2300


70-89 20 2 4 ll - J 11 ll - ]
31 0,6916 0,4783 14,8273
50-69 31 l l 31 Esta ltima definicin de s; es la que suele aparecer en ciertos libros de Esta-
o 0,0951 1,71 18
30-49 18 o o o -0,3084
dstica Descriptiva y es la que usan m uchas mquinas de calcula r. La discusin de
38 - 1,3084 1,7119 65,0522
10-29 38 - 1 1 -38
este problema la dejamos para el tomo 2: Estadstica Inferencia!. Por ahora nos
149 138,8213 limitamos a comprobar lo dicho con el siguiente ejemplo.
107 33
EJEMPLO 6.8 . Sea la poblacin finita compuesta por los tres elementos l, 2, 3.
' vale
Su media .
= 2 y su varianza 2)_
(l _- __:.
vale a 2 = .:.._
2
+__;(2__
- 2)2 + (3 - 2)2 2
....:__.....c...._ _c.. = - .

.f' = ]_~ = O 3084 3 . 3


107 ' Formemos todas las muestras binarias posibles. pero de modo q ue extrado un
elemento de la poblacin, lo repongamos en la misma antes de extraer el segundo.
Calcular s;, equivale a aplicar (6.7 ), (6.8) y (6.9) a las puntuaciones x;. Tendremos (3)(3) = 9 muestras bin arias.

Segn (6,7 ):

l 38,8213 Muestras :i.: (X, - X) 2 :i.: (X, - X) 2


2
Sx =- - 1,2974
binarias
x n
107 n-1
- -- - - ~ - - - - - - - --
1, l 1,00 0,00 0,00
Segn (6.8): 1, 2 1,50 0,25 0,50
l. 3 2,00 1,00 2,00
s2 .
X
= 149
107
- O 30842
'
1.3925 - 0,095 1 1,2974 2, 1 1,50 0,25 0,50
2,2 2,00 0,00 0,00
2, 3 2,50 0,25 0,50
Segn (6.9) : 3, 1 2,00 1,00 2,00
3, 2 2,50 0,25 0,50
52, = (107)( 149) - 33~ = 14.854 = J 2974 3,3 3,00 0,00 0,00
X 107 2 11.449 > - - --
3,00 6,00
Por tanto,
s; = (20)2( 1,2974) = 5 18,96 3 6 2
- =- - =-
9 3 9 3
2
6.3.6. NOTA: sobre la definicin de s
'
Comprobamos como la m edta d e 1as varianzas
' d efi1mctas por -'-'---
I (X - xi-
Supongamos una poblacin finita compuesta de l\' elementos equiprobables. n -1
2
2
I (X, - t) d d l d . d d. h
Por d e fim1c1on , su varianza va e ax = --- -- - , on e i es a me ta e 1c a
vale 3,
3
es decir, un valor igual que el de la varianza de la poblacin y cmo la media
N
, , poblacin. Formemos ahora todas las muestras ordenadas posibles de tamao n .
de 1as varianzas I (Xi - -X)'
d efi1m.das por-'--'- 1
' - vaIe -, es decir,
. un va Ior d1stinto
. . (me-
, -~ . . . . I (X, - X )1 11 3
y calculemos sus varianzas mediante la formula s; = - - - - - - . Pues
11

bien, nor) que el de la varianza de la poblacin.
114 / Estadstica para Psiclogos Estadsticos de variabilidad o dispersin / 115

6.4. Amplitud total


AT = 91 - 31 = 60 o AT = 91 - 31 + 15 = 98,5 - 23,5 = 75

Ahora, en realidad, las nicas puntuaciones ex istentes son los p untos medios
6.4.1. Definicin de los intervalos. Por tanto, la amplitud total ser la diferencia en tre el punto medio
del intervalo mximo (91) y el punto medio del intervalo mnimo (3 1). A su vez,
Diferencia entre la puntuacin mxima y la mnima. O, teniendo en cuenta los Ja unidad que puede ser aadida es una unidad de intervalo , medio intervalo por
lmites exactos de los intervalos elementales o compuestos, diferencia entre la pun- debajo del punto medio mnimo y medio intervalo por encima del punto medio
tuaci n mxima y la mnima ms una unidad. mximo. En otras palabras, aadir una unidad de intervalo, equivale a aceptar
romo amplitud total la diferencia entre el lmite exacto superior del intervalo m-
ximo y el lmite exacto inferior del intervalo mnimo.
6.4.2. Clculo
23,5 31 38,5 83 ,5 91 98,5
a) Datos no agrupados en intervalos
EJEMPLO 6.9. La fenilcetonuria es una enfermedad causante de un deterioro
1 ' / " 1

mental que se agudiza con la edad. Los datos siguientes, tomados de Berman, ~ '-- - - - - ~( 60 )>-- - -- - -
Waisman y Graham (1966) representan los cocientes intelectuales de cinco nios
afectados por dicha enfermedad y cuya edad media aproximada era de cinco aos. 75

18. 29, 39, 40, 54

AT = 54 - 18 = 36 o AT = 54 - 18 + 1 = 54,5 - 17,5 = 37 1 6.4.3. Propiedades


54 54 , 5
1
7
53,5 a) Muy fcilmente calculable.
17 .5 18 18,5
1 '( 1 <--~~--~- b) Presenta el inconveniente de tener en cuen ta nicamente dos puntuacion es:
las dos extremas. Si stas se man tienen constantes, la amplitud total se mantendr
constante aunque varen de cualquier modo las restantes, siempre claro est, que
37 1 stas queden dentro del in tervalo limitado por las dos primeras.
As, dejando intactas las dos puntuaciones extremas (18 y 54) del ejemplo 6.9,
hagamos variar las tres interiores de dos maneras distintas. Comparemos los re-
b) Datos agrupados en intervalos sultados del caso primi tivo con los de los dos nuevos y veamos cmo per manece
EJEMPLO 6.10. Calculemos la amplitud total de los cocientes in telectuales de
invariante la amplitud total en los tres y cmo varan claramente la desviacin media
y la desviacin tpica.
otro grupo de 22 nios fenilcetonricos ms jvenes que los del ejemplo 6.9 y,
como puede apreciarse, con menor deterioro mental. Los datos expu estos a conti-
nuacin estn tomados de Berman y otros (1966) y han sido agrupados en inter-
valos p or nosotros del modo siguiente :
Puntuaciones AT DM s,

18,29, 39, 40, 54 36 37 10 12,01 7


CI X; n;
18, 36, 36, 36, 54 36 37 7,2 11,384
- - - -- -
91 6
18. 54, 54, 54, 54 36 37 11,52 14,40
84-98
69-83 76 5
54-68 61 2
39-53 46 5
24-38 31 4 6.4.4. Nota
; 22 La amplitud total suele ser llamada, tambin, recorrido o rango.
116 / Estadistica para Psiclogos Estad1st1cos d e vanabilida d o dispersin / 117

6.5. Amplitud semintercuartil Mientras que la amplitud semiin tercuartil ha permanecido invariante frente al
cambio de puntuaci ones. la desviacin media ha pasado de 5 a 37,33 y la desviacin
6.5.1. Definicin
tpica ha pasad o de 7,07 a 59,58.

Semidistancia entre el tercer cuartil y el primer cuartil , es decir, entre el per.


centil 75 y el percentil 25. 6.6. Coeficiente de variacin

6.6.1. Nota previa


6.5.2. Clculo

Basta con calcular los percentiles 75 y 25 (segn lo dicho en 5.5.2) y hallar la Consid eremos dos variables distintas, por ejemplo, peso (X ) y altura ( Y). Es
semidiferencia entre ambos. claro que s, vendr dada en unidades de peso (por ejemplo, gramos ) y s,. en unida-
EJEMPLO 6.11. Calculemos la amplitud semiintercuartil, a partir de los datos des de longitud (por ejemplo, metros). Ambas desviaciones tpicas no son compara-
del ejemplo 6. 1O. bles. Si s, valiera 5 gramos y s, 3 me tros, 5 gramos no son ms ni menos que 3 me-
En dichos datos, P 7 5 = 84,75, P25 = 43. Por tanto tros, son cosas distintas. Para hacer comparables las variabilidades de ambos gru-
pos, con variables de d istinta naturaleza, es necesario que vengan expresadas en
nmeros abstractos (es decir, ni en me tros, ni en gramos). Un modo de conseguirlo
AS/ = 84,75 - 43 = 20 875 es tomar como medidas de variabilidad s_,/X y s,/Y. Estos cocientes son nmeros
2 ' abstractos. Lo nico q ue n os indican es el nmero de veces que el numerador con -
tiene al denominador, ind ependientemente de lo que ambos signifiquen (gramos,
metros, etc.).
; ' Consideremos ahora una misma variable y dos grupos distintos, cuyas medias
6.5.3. Propiedades en esa variable son muy distintas entre si. Por ejemplo, el peso de 100 elefantes y
; el de 100 hormigas. Es evidente que una misma desviacin tpica igual a l kg repre-
a) Es preferible a la desviacin tpica en el caso de distribuciones muy asim- senta una variabilidad insignificante para el grupo de los elefantes e inconcebible-
tricas. (Recurdese que en este caso la mediana era preferible a la media .) mente alta para el de las hormigas. Por tanto, la desviacin tpica ser algo equ-
b) Cuando el intervalo mximo carece de lmite superior y/ o el mnimo ca- voca, en este caso, como medida de variabilidad. Un modo de evitar esta dificultad
rece de lmite inferior, es imposible calcular la desviacin tpica. Bajo estas con- es dividir la desviacin tpica de cada grupo por su correspondien te media, s, ,!X,,
diciones es posible calcular la amplitud semiintercuartil, siempre que el primero s,,fX2
y el tercer cuarlil no se encuentren en esos intervalos extremos. (Recurdese que
bajo estas condiciones era posible calcular la mediana y no era posible el clculo
de la media.) 6.6.2. Definicin
e) Definida como distancia entre d os puntos, slo es calculable a nivel de
intervalos o de razn, pero no a nivel meramente ordinal. Resultado de dividir la desviacin tpica por la media. Ordinariamente, este
d) Menos sensible q ue la desviacin media y que la desviacin tpica a la va- cociente viene multiplicado por 100. Es decir,
riacin de los datos. Veamos confirmada esta afirmacin en los siguientes d atos :
CV =~ o , ms frecuentemente, CV =~ 100
X
Puntuaciones AS/ DM s,

(45 - 3~ = 5 5 7.07 6.6.3. Clculo


30, 30. 30, 40, 40,40, 40, 40, 40, 50, 50, 50
' 1 2
(109 - 99) Mera aplicacin de la frm ula anterior.
._;.. l, 98, 100, 100, 100, !08, 108, 108, 1JO, 207, 207 ---- = 5 37,D 59,58
2 EJEMPLO 6.1 2. El peso medio (media aritmtica) de un grupo de elefantes es
6.000 kg y el de un grupo de hormigas es 2 dg. Sup oniendo que la desviacin tpica
118 / Estadistica para Psiclogos Estad1sticos de variabihdad o dispersin / 119

en ambos grupos fuera l dg, ,cunto valdr el coeficiente de variacin en uno y hay alguna variabilidad) o nula (todas las puntuaciones son iguales entre s, no hay
otro grupo? variabilidad), pero es inconcebible una variabilidad negativa . De aqu que sean
esencialmente no negativos los valores que pueden tomar los ndices de variabilidad
CV = ~~ 1- - - = 0,0000000167 , multiplicado por 100, 0,00000167 o dispersin. Por esta razn, supondremos X j O y tomaremos X en valor absoluto.
60.000.000

CV = i= 0,5 o, multiplicado por 100, 50


6.8. Resumen: Definiciones y frmulas

El segundo CV es 30 millones (!) mayor que el primero. Esto quiere decir que
la variabilidad relativa de ambos grupos es enormemente distinta, a pesar de que Desviacin media: Media de las diferencias (en valor absoluto) den pu ntuaciones
son iguales sus desviaciones tpicas. Una desviacin tpica de l decigramo repre- respecto a su media aritmtica.
senta una variabilidad apreciable en relacin con el grupo de las hormigas y no
representa, prcticamente, variabilidad alguna en relacin con el grupo de los ele- DM = r.1x, -x 1 (datos no agrupados en intervalos)
fantes. n

6.6.4. Propiedades DM = Ln1IX1 - x (datos agrupados en interva los )


n
a) Es un valor abstracto, como cociente de dos nmeros concretos (es decir,
dados en ciertas unidades concretas de medida) del mismo tipo. Recurdese que Varianza: Media de las diferencias (al cuadrado) den puntuaciones respecto
la media y la desviacin tpica vienen dadas en las mismas unidades en las que a su media aritmtica.
vienen dadas las puntuaciones a partir de las cuales aquellas son calculadas.
b) Si a unas puntuaciones dadas les sumamos una cantidad positiva, el coe-
ficiente de variacin disminuir, ya que sx se mantendr constan te, pero X aumen- 2
Sx
r
= -
(X, - X) 2
-- (datos no agrupados en intervalos)
tar en esa cantidad. Por tanto, el cociente sx/X disminuir despus de dicha suma. n
Si, por el contrario, les restamos una cantidad positiva, el coeficiente de varia-
cin aumentar, por anloga razn .
s~ = ~~ - X)
2
e) Si multiplicamos unas puntuaciones dadas por cualq uier constante positiva,
(datos agrupados en intervalos)
el coefici ente de variacin se mantendr constante, pues el numerador, sx, y el ll
denominador, X, quedarn multiplicados por la misma cantidad.
Es recomendable que, junto al coeficiente de variacin , se ofrezcan las corres- Desviacin tpica : Raiz cuadrada de la varianza.
pondientes sx y X a partir de las cuales ha sido calculado . Amplitud total: Diferencia entre la pu ntuacin m xima y la mnima (o, entre
la mxima y la mnima ms una unidad).
Amplitud semiimercuartil: Semidiferencia entre el tercer cuartil , Q 3 , y el primer
6.7. Notas cuartil, Q 1

AS] = ql. -= i\
a) Recordemos que, a nivel de intervalos o de razn, todo ndice de tendencia 2
central era un valor numrico que vena representado por un punto sobre el eje
de abscisas. Pues bien, todo ndice de variabilidad es una distancia q ue viene repre- Coeficientl' de tariacin : Cociente entre la desviacin tpica y la media (multi-
sentada por un segmento rectilneo . plicado, ordinariamente, por 100).
b) Tengamos presen te que todo indice de variabilidad es esencialmente no
negativif. Las puntuaciones pueden ser positivas o nega tivas, pero su variabilidad CV =~ 100
o dispersin ser siempre positiva (no son todas las puntuaciones iguales entre s, X
120 / Estadistica p ara Psiclogos Estadistlcos de var,abl/1dad o dispersin / 121

EJERCICIOS 6.10. Sean 7 y 20, respectivamente, la media y la varianza de las puntuaciones


x1 , X2 , . X,,. Calcule la media de las nuevas pun tuaciones Xf . Xi, .. . , X,; .

6.1. Calcular la varianza y la desviacin tpica a partir de los siguientes datos ,w 6.l 1. Sean 10 y 4, respectivamente, la media y la desviacin tpica de las puntua-
agrupados en intervalos. ciones X 1 , X 2 , . , X,, . Calcule la media de las nuevas puntuaciones (X1 - 3)2.
{X 2 - 3)2 , ... , (X,, - 3)2
a) 3, 5, !, 6, 10 b) 3, 4, 1, 4 6.12. Calcule el coeficien te de variacin a parti r de los da los del ejercicio 6. 1.
e) 2, 5, 6, l. 1 d) 1, O, 3, 1, 3, 4
e) 5,2,1,5,3,8 f) 1, 9, 3, 7, 8, 8 6.13. Sean 4 y 3, respectivamente, la media y la desviacin tpica de las punt ua-
ciones X 1 , X 2 , . . . , X,,. Calcule la media y la desviacin tpica de las puntuaciones
6.2. Calcular la d esviacin media a pa r tir de los datos del ejercicio anterior. Xf , X], . . . , X;, sabiendo que el coeficiente de variacin de estas ltimas puntua-
ciones vale 96 .
6.3. Calcular la varian za y la desviacin tpica a par tir de los siguen tes da tos
agrupados en intervalos. 6. 14. Sean 25 y 15, respectivamente, la m edia y la desviacin tpica de las pun-
tuaciones 3X1 - 5, 3X2 - 5, 3X. - 5. Calcular la desviacin tpica de las
- - - - nuevas puntuaciones Xr, X;. ... , X;.
sabiendo que el coeficiente de variacin
a) X ", b) X ll; e) X llj d) X ", de estas ltimas vale 80.
---
9-11 1 10-12 1 9-1 0 1 15-2 1 4 6.15. Sabiendo que las cinco puntuaciones - 4, 2, X , 4, O tienen como varianza 16
6-8 2 7-9 4 7-8 2 8- 14 10 y como coeficiente de variacin 200, calcular el valor de la tercera puntuacin
3-5 5 4-6 3 5-6 l 1-7 6 desconocida, X , y la mediana de las cinco.
0-2 4 1-3 2 3.4 4
6.16. Sea un grupo compuesto de n 1 personas con media X1 y varianza sf y olro
i) --- 1-2 2
grupo compuesto de n2 personas con media X2 y va rianza sf Demostrar que la
variam.a del grupo total, s1 , compuesto de las n 1 + n 2 personas, vale:
{-
- --
e) X n, f) X n, g) X ni h) X n
ll1Si + n2si + '!/~2 - (%1 - X2 )2
11 + 112
11-13 2 109-113 2 110-1 12 2 75-78 2 s2
8- 10 3 104-1 08 4 107-109 4 71 -74 :l 11 + 112
5-7 6 99-103 8 104-106 3 67-70 8
2-4 4 94-98 5 101- 103 1 63-66 7 (Sugerencia: recordar la propiedad 6.3.4.i de la varianza.)
--- 89-93 1 59-62 4
6. 17. Deducir las frmulas (6.2) y (6.3 ).
55-58 1
6.18. Deducir las frmulas (6.8) y (6.9).
6.19. Supongamos una poblacin compuesta de los cuatro elementos : l , 2, 3 y 4.
6.4. Calcular la desviacin media a pa rtir de los da tos del ejercicio anterior. Formemos a partir de la misma las (4)(4)(4) = 64 muestras ternarias posibles,
6.5. Calcular la amplitud semiintercuartil a partir de los datos de los ejercicios entendiendo q ue, extrado un elemento de la poblacin, es devuelto a la misma
5.21 y 5.22. antes de extraer un segundo elemento y, a su vez, ste es devuelto a la misma antes
de extraer un tercero. Esto supuesto, calcular la media de las va ria nzas de las 64 m ues-
6.6. Demostrar que L (X, - X)2 =L (X; - k )2 - n(X - k) 2
2
6.7. Comprobar la igualdad a nterior para X 1 = 1, X 2 = 2, X3 = 6 y k = 5. tras, habiendo definido, primero, la varianza como L (X, - X) Hacer lo mismo,
11
6.8. Vlgase de la igualdad expuesta en 6.6 para calcular L (X, - X )2 usando I: , - 2
k = 5 y teniendo en cuenta los datos siguientes: 3, 4, 5, 4, 6, 7, 4, 5. habiendo definido la varianza como _Q._::-~)_ (donde 11 = 3 ). Comprobar.
11 - 1
6.9. /. Qu hara Vd. para sim plificar el clculo de la varianza de las siguientes - 2 - 2
. L (X - X) 480/9 5 . I: (X, - X ) 720/9 5
punt\]a6nes: 2,75; -3,25; 6,75; 1,75; 5,75; -2,25; 4,75; - 4,25? _Cunto vale fi na1mente, como - ~ 1 - -
'
=- -=
64
-
6
y como - ~ - - = -
2 64 4
dicha varia nza?
122 / Esiadistica para Ps,clogos

que es, precisamente, el valor de la varianza de la poblacin :

(l 2,5)2 + (2 - 2,5)2 + (3 - 2,5)2 + (4 - 2,5)


2 5
4
7
4 Estadsticos de asimetra y apuntamiento
(Recuerde el lector lo dicho en 6.3.6.)

7. 1. Introduccin

Una distribuci n de frecuencias queda bastante bien caracterizada mediante


los estadsticos de posicin o tendencia cen tral y de varia bilida d o dispersin,
pero quedar an mejor caracterizad :'\ si conocemos la sim etr a o asimetra de la
misma y su apuntamiento.

7 .2. Asimetra

7.2.1 . Idea general

Sabemos que la mediana d ivide el h istograma (represen tacin grfica de la


I> distribucin de frecuencias) en dos reas iguales, es decir, de igual superficie. Pues
bien , d iremos que la distribucin de frecuencias es sim trica si una de las reas
es imagen de la o tra. Ntese que si un rea es imagen de la otra, ambas tienen la
misma superficie, pero pueden tener a mbas la misma superficie y no ser una imagen
de la o tra. As, por ejemplo, en la figura 7. 1, A y A ' tienen igual superficie y una es
imagen de la otra . En cam bio. en la figu ra 7.2. A y A ', teniend o igua l superficie.
una no es imagen de la otra.

- - 7
f
L __

A'

~J'~

Fig. 7. 1 Fig. 7.2


124 / Estadistica para Psiclogos Estadist1cos de asimetra y apuntamiento / 125

Es claro que si la d istribucin es simtrica , la mediana es, tam bin, centro a e puntuaciones X 1 , X 2 . , x. sigue siendo el mismo que el obtenido a partir de
gravedad, es d ecir, la med ia na coincide con la media. Por otra parte, si la distribu- Jas puntuaciones Y1 = AX 1 + B, Y2 = AX2 + B. ... , Y. = AX. + B .
cin de frecuencias es unim oda l, esa nica m o da coincide con la m ediana y, con-
siguientemente, con la media. En conclusin, si la distribucin es sim trica, m edia,
med iana y moda co inciden .
Diremos que la asim etra es positiva si tenemos m uchas puntuaciones bajas y
pocas a ltas. D irem os que es negativa si sucede lo contrario . Un test dilcil dar
lugar a una d istribucin asimtrica positiva. U n test fcil da r lugar a una distri-
bucin asimtrica negativa :

Q, Q, Q, Q, Q, Q,
Asimetra positiva Asimetra negativa

5 10 15 20 25 30 JO IS 20 25 30
Asimetra positiva Asimetra negativa

T eniendo en cuenta estas consid eraciones, presentamos a continuacin diver-


sos estadsticos o ndices d e asimetra .

7.2.2. Indice basado en los t res cuartiles


Q, Q, Q,
Llamarem os Q 1 , Q 2 y Q 3 a los cuartiles primero (o pcrcentl 25), segundo (o Simtrica
pcrcentil 50. o m ediana ) y tercero (o percentil 75), respectivamen te. Esto su-
puesto : Ntese que a l dividir por (Q 3 - Q) = (Q 3 - Q 2 ) + (Q 2 - Q .), hacemos
Si la d istribucin es simtrica, Q.1 - Q2 = Q2 - Q1 Si es asimtrica positiva, que A, sea un nmero abstracto. adems de co nseguir que quede dentro del inter-
Q3 - Q2 > Q 2 - Q 1 Si es asimtrica nega tiva, Q 3 - Q 2 < Q2 - Q 1 (vase valo ( - 1, + 1).
figuras adju ntas). D e a qu to mar como ndice de asimetra el siguien te criterio: Conviene advertir lo siguien te a cerca del criterio (7.1 ):
a) Si la distribucin es simtrica. necesariamente Q3 - Q 2 = Q2 - Q, y,
A,= (Q~ Q2l - (Ql - Q,) _ (Q3 - Q2 ) - (Q2 - Q) consiguientemente, A, = O. Pero si Q 3 - Q 2 = Q 2 - Q 1 , la distribucin puede
(7 .1)
Q3 - Q - (Q 3 - Q2 ) + (Q2 - Q) ser simtrica o asim trica.
b) Si Q3 - Q2 1 Q2 - Q1 , necesariamente la distribucin es asimtrica.
Si la distribucin es a simtrica pos1t1va, A, > O. Si es asimtrica negativa, Pero, siendo la distribucin asimtrica, tanto puede verificarse Q 3 - Q 2 = Q2 - Q,,
A, < O. Si es sim trica, A , = O. Ad ems, - 1 < A , < l . En efecto, al tender como Q 3 - Q2 j Q2 - Q ,.
(Q 3 - 9.
2 a cero, A, tiende a - 1; y al tender (Q 2 - Q 1 ) a cero, A, tiende a l. E JEMPLO 7.1. Los siguientes d atos (una vez agrupados en in tervalos) corres-
El nmero as o btenido es invariante frente a cualquier tra nsformacin del origen ponden a la latencia media de una respuesta motora ma nifestada por 59 ratas blan-
y de la unidad de medida. En otras palabras, el nm ero ob tenido a partir de unas cas (vase Felsinger. Gladstone, Y amaguchi y Hull , 1947).
126 / Estadistica para Ps1clogos Estadist,cos de as,metria y apuntamien to / 127

TABLA 7.l Segn (7.l):

Latencia
x, - ex, - x A = (2,470 - 1,074) - (1,074 - 0,535) = 1,396 - 0,539 = 0,857 =
", x,
2
nJXi X X)2 ni(X, - (Xi - X)' niX1 - X)' 0443
(en segundos) ' (2,470 - 1,074) + (1,074 - 0,535) l,396 + 0.539 l ,935 '
9,00-10,49 1 9,75 9,75 7,91 62,57 62,57 494,9 1 494,91
La asimetra es positiva. Consideremos el histograma correspondi ente a la
7,50-8,99 1 8,25 8,25 6,41 41,09 41,09 263,37 263,37
distribucin de frecuencias an terior (Fig. 7.3).
6,00-7,49 l 6,75 6,75 4,91 24,11 24,11 118,37 118,37
4,50-5,99 3 5,25 15,75 11,63 34,89 39,65 EJEMPW 7.2. En la tabla 7.2, dentro de cada intervalo tenemos los nios na-
3.41 118,95
3,00-4,49 7 3,75 26,25 1,91 3,65 25,55 6,97 48,79 cidos que, entre 10.000, probablemente presentarn el sndrome de D own (mon-
1,50-2,99 5 2,25 l l ,25 0,4 [ 0,17 0,85 0,07 0,35 golismo) y cuyas madres tienen edades comprendidas dentro de dicho intervalo
0,00- 1,49 41 0,75 30,75 -1 ,09 1, 19 48,79 -1,30 -53,30 (vease Coliman y Stoller, 1962). Como se ve, el riesgo de tener un hijo monglico
aumenta con la edad, por lo cual la distribucin es asimtrica negativa.
59 108, 75 237,85 991,44

X= 1,84 seg. Md = Q2 = 1,074 seg. Mod = 0,75 seg. Q1 = 0,535 seg.


Q3 = 2,470 seg. S, = 2,01 seg.

2,195 "'-4,495 5,995 7,495 8,995 10,495


1,~95\
1 1 1
~
...,. q
:::e -<;;' .,.:,,
<:,'
"- \\
.,, .,, .,,::,
~
/
Cl,'
11
e
~f' ~
0
. 'd' ,,. Q, ~ 45, 12
31

Fig, 7.4
F ig. 7.3
Esradisticos de asimerria y apuntami ento / 129
128 / Esrad1st1ca para Psiclogos

TABLA 7.2 Pues bien, aceptaremos como indice de asimetra la expr esin

X)' n,(X1 X)'


X) 2 (X 1
l: (X, - %)3/n
-
Edad n, X; n,X, x1 - X (Xi - i)2 n;(X; -
-
-

- - -- -- -- -
m3
a3 = - - - = - ~- '-'-
_ "f.11 (X, - X )3/n
a3 - (7. 2 )

45-49 218 47 10.246 3,78 14,29 3.115,22 54 ,01 11.774,18 m~2 s; SJ


X

149,00 - t.82 - 182,00


4 .200 - 1,22 1,49
40-44 100 42 - 8.422.40
1.295 -6,22 38 ,69 1.354, 15 - 240,64 Segn sabemos, m 1 = O siempre. El momento m 2 (o va ria nza) es siempre no
35-39 35 37 - 1.412 ,47 - 15.537. 17
- 11 ,22 125,89 1.384.79 negativo. Ninguno de los dos nos vale para medir la asimetra. El momento de
30-34 JI 32 352 -34. 138,32
263,09 2.104,72 - 4.267,29 tercer orden, m 3 , puede ser positivo, negativo o nulo. Si la distribucin es simtri-
25-29 8 27 2 16 - 16,22
-9,555. 12 - 57.330,72
20-24 6 22 132 - 21 ,22 450,29 2.701,74
2.749,96 - 18.025.95 - 72.103,08 ca, m 3 = O. En efecto, debido a la simetra, a cada diferencia (Xi - X ) positiva,
15-19 4 17 68 - 26,22 687,49 le corresponde otra igual pero negativa. Consiguientemente, a cada cu bo (X, - X )3
- 175 .939,5 1 positivo le corresponde otro cubo igual pero negativo. Por tanto, la suma de todos
13.559,58
382 16. 509 los cubos ser nula y a 3 = O.
Por su parte, si la distribucin es asimtrica positiva, la s diferencias (X; - X )
Md = Q2 = 45, 12. Q, = 41 ,08, Q3 = 47,31 , s, = 5,96
i = 43,22, mximas son positivas y estas diferencias quedarn muy a umentadas al ser elevadas
al cubo. Ello hace que la suma de las diferencias positivas, elevadas al cubo, sea
Segn 7.1: mayor que la suma de las diferencias nega tivas, elevadas al cubo, aunq ue el n mero
de estas ltimas sea mayor que el de las diferencias p osi tivas. Lo contrario ocurre
A = (47,31 - 45,12) - (45, 12 - 41 ,08) 2, 19 - 4,04 =- 1.85 = _ 0.297 cuando la asimetra es negativa.
' (47,31 - 45,12) + (45, 12 - 41,08) 2,1 9 + 4.04 6.23 En conclusin, a 3 es positivo c uando la asimetra es positiva y es negativo c uan-
do la asimetra es negativa .
La asimetra es negativa. Consideremos el histograma cor respondiente a la La razn de dividir por s; a
es conseguir que 3 sea un n mero abstracto e inde-
distribucin de frecuencias anterior (Fig. 7.4). pendiente de la variabilidad del grupo.
EJEMPLO 7.3. Calculemos a 3 a partir de la tabla 7.1.

7.2.3. Indice basado en el momento de tercer orden 2


s,
237,85
= 59 = 4,03, s, = 2, o1, J
s, = 8,10
Llamaremos momento emprico de orden p respecto a la media. a la expresin :
a = 991,44/ 59 =
3 2 08
r.n -(X- - X)P 8,10 '
n 1P = r.~_,_,
(X, - X'f
_..:.... ,nP = J J
n
11
Ntese que hay 41 diferencias (X1 - X) nega tivas y slo 18 positivas, pero la
suma de stas (elevadas al cubo} es mucho mayor que la suma d e las primeras (ele-
E n particular, vadas, tambin , al cubo ).
EJEMPLO 7.4. Calculemos a 3 a partir de la tabla 7.2.
"f.(X, -X ) m1 = ~..!~}X1~ X)
m, =- - 11-- - n
13.559,58
r. (Xi - X)2 m = L n 1(X =- X)2
s2X = = 35,50, s, = 5,96, s_: =e 21 1,58
382
m2 = 11
2
11

- 175.939,5 1/ 382 = _ 2, 18
r. (X, - i)3 r. n}X1 - X) 3 3 = 2 11 ,58
nl3 = - - -- - m, =- - n -- -
11
Ntese que hay 218 diferencias (X1 - X ) p ositivas y slo 164 negativas, pero la
r. = ~~ ::..!1.. suma de stas (elevadas al cu bo) es mucho mayor que la suma de las primeras (ele-
4
X)
4 ..~
(X1 - /114
m4 = vadas, tambin, al cubo).
11
n
Estadsticos de asimetra y apuntamiento / 131
130 / Estadstica para Psiclogos
7.3.2. Indice basado en el momento de cuarto orden
Conviene advertir lo siguiente acerca del criterio (7.2):
3
a) Si la distribucin es simtrica. necesariamente l: (X, - X ) = O y, consi- Para dos curvas con la misma desviacin tpica, la ms apuntada deber con-
guientemente, 11 3 = O. Pero si ,1 3 = O, la distribucin puede ser simetrica o asi- tener ms observaciones bajo los dos extremos alejados de la media que la me-
m trica . nos apun tada. Para estas observaciones extremas, las diferencias (X, - .X) ser n
b) Si r (X, - .X) 3 +
O, necesariamente la distribucin es asimtrica, pero
3 grandes y sern mucho mayores al ser elevadas a la cuarta potencia. Por tanto ,
siendo la distribucin asimtrica, puede verificarse tanto l: (X, - X ) = O, como r (X; - X )4 ser mayor para la curva leplocrtica que p ara la platicrtica. Por
l: (X, - X )3
+O. .. .
otra parte, se dem uestra en Estadistica In feren cial que
l:(X- X )4/n
' 4 - 3 = O
s,
en el caso de la curva normal. Por e llo, suele ser elegido corno criterio de apunta-
7.2.4. Nota miento o curtosis la expresin
Hemos visto que si la distribucin es simtrica y unimodal, media, mediana y
moda coinciden y que si no coinciden, la dislribucin tiene que ser asimtrica. Fun- u4 = l: (X, - X)4/ n - 3
dados en ello, podemos introducir indices de asimetra . De hecho . han sido pro- s!
. d. d . .
puestos como m ices e as1metna A,= - - -
X - Mod y A,= --'---3(X - Md)
---' esperando De lo expuesto se infiere que a 4 > O para las curvas Ieptocrticas y a 4 < O
s,l; .\x
para las pla licrticas.
que A, > O si la asimetra es positiva y que A , < O si la asimetra es negativa. Lo
L a razn de dividir l: (X; - X) 4 /n por s! es a nloga a la ofrecida en 7.2.3 res-
que indudablemente es cierto es que A = O si la distribucin es simtrica y que
pecto a l ndice de asimetra a 3
si A, +
O, la distribucin es asimtrica . EJEMPLO 7. 5. Burt (1963) midi el cociente intelectual de un grupo numeroso
de nios y obtuvo la distribucin de frecuencias que, con ligeras modificaciones,
exponernos a continuacin.
7 .3. Apuntamiento
CI n1 x, n,X; (X1 - X) IX1 -X)2 ni(X - X)' n;(X; - X]4 /4 .659
7.3.1. Idea previa 150-159 5 154,5 772,5 55,74 3. 10<,,95 15.534,75 10.359,652
140-1 49 18 144,5 2.601,0 45,74 , 2.092, 15 37.658,70 16.9 10,81 1
De un modo no muy riguroso diremos que una curva es muy apuntada si es ff 130-139 84 134,5 11.298,0 35,74 1.277,35 107.297,40 29.4 17,433
muy alta y estrecha. Diremos que es p oco apuntada si es baja y ancha. Eligiendo 120-129 253 124,5 31.498,5 25,74 662,55 167.625, 15 23.837,570
como patrn la curva normal (de la que hablaremos pronto }, diremos que una JI0-119 74 7 114 ,5 85.531 ,5 15,74 247,75 185.0<,9,25 9.841 ,1 72
curva es leptocrtica si es ms apuntada que la normal y que es platicrtica si es 1 100-109 1.21 7 104,5 127. 176,5 5,74 32,95 40.100, 15 283,560
menos apuntada que la normal. Diremos que la curva normal es mesocrtica *. 90-99 1.148 94,5 108.486,0 -4,26 18,15 20.836,20 81 ,150
80-89 719 84,5 60.755,5 - 14 ,26 203,35 146.208,65 6.381 ,375
70-79 294 74,5 21.903,0 -24 ,26 588,55 173.033,70 2 1.858,372
60-69 99 64,5 6.385,5 -34,26 1.173,75 116.20 1,25 29.274,664
50-59 47 54,5 2 .561,5 - 44 ,26 1.958,95 92.070,65 38.712,462
40-49 21 44 ,5 934,5 - 54,26 2.944,15 61.827, 15 39.070,2 10
30-39 7 34,5 241 ,5 -64.26 4 .1 29,35 28.905,45 25.6 19,356

4.659 460. 145,5 1.192.368,45 251.647, 787

X=
460.145,5
4.659
= 98, 76, s; =
1.1 92.368,45
4 .659
= 255,93, s: = 65.500,1 6
X
25 1.647, 787
~1" 04 = - 3 = 3,84 - 3 = 0,84
Del griego, ,cnt<; (lepts): delgado, estrecho: ~tlI; (plats): ancho. extendido ; ,<!o<; 65.500, J 6
(mesos): medio : ppr,; (kirts): encorvado, convexo: xuptr~<; (kirtotes): curvatura.
132 / Estadistica para Psiclogos Estadsticos de asimetra y apuntamiento / 133

La distribucin es leptocrtica, lo cual indica que existen ms subnormales y EJERCICIOS


ms superdotados que los que habra habido si la distribucin hubiera sido normal.
7.1. Calcula r el ndice de asimetra basado en el momento de te rcer orden a parti r
de los siguientes datos: 10, 12, 12, 14, 10, 10, 16, 12, 14. JO.
7.4. Resumen : Definiciones y frmulas 7.2. Calcular el ndice de a puntamiento a partir de los da tos del ejercicio anter ior.
7.3. Sean n puntuaciones X, , X 2 , , x . Transfor mem os estas puntuaciones
Asimetra: Diremos que una distribucin de frecuencias es simtrica si a cada en las siguientes: r 1 = A X 1 + B, Y1 = AX2 + B, . . . , Y. = AX. + B . Demos-
puntuacin X, + d istante de la media, por la derecha, una distancia k, le corres- trar que el ndice de curtosis o apuntamiento, propuesto en el texto, de las nue-
ponde otra puntuacin X,_ distante de la media, por la izquierda, la misma dis- vas puntuaciones Y, es el mismo que el de las puntuaciones primitivas X, .
tancia k y tales que la frecuencia correspondiente a X;+ es la misma que la corres-
7.4, Calcular los ndices de asimetra, propuestos en el texto, a partir de las si-
pondiente a X, _ . guientes distribuciones de frecuencias :
Diremos que es asimtrica toda distribucin que no cumpla con lo acabado
de indicar.
a) X n, b) X 11
- -- - - -
ndices de usimetr1 : 10- 12 5 9-11 2
7-9 10 6-8 10
(Q3 - Q2) - (Q2 - Q) 4-6 20 3.5 6
J-3 15 0-2 2
a) A, = - - - - - - -
(Q3 - Q2) + (Q2 - Q1)

b) a3 =L (X, - X)3/n
7.5. Calcular el n dice de curtosis, propuesto en el texto, a partir de las d istri-
(para datos no agrupados en intervalos ) buciones del ejercicio a nterior.
53
X

7.6. Supongam os que, sie ndo simtrica la distribucin de frecue ncias, el per-
L n-(X - - X) 3 /n centil 25 vale 6,5, L n; = 12, L n;X; = 114, !: n;X; = l .259. Esto supuesto. calcu-
03 = 1 1 J
Sx
(para datos agrupados en intervalos)
lar el percentil 75 y el coeficiente de variacin.
7.7. En una distri bucin simtrica de 40 elementos, X 1 , X 2 , . , X40 , L (X, -
Apuntamiento : Diremos que una distribucin de frecuencias es muy apuntada
- 11 )2 = l.040, L x, - k I es m nima para k = 1O. Esto supuesto, calcular el
o poco apuntada segn que el correspondiente histograma sea alto y estrecho o coeficiente de variacin de dichas pu ntu aciones .
bajo y ancho.

ndice de apuntamiento :

a4 =L (X -
' X)4/n - 3 (para datos no agrupados en intervalos)
4
Sx

Ln(X - X)4 / n
a4 = 1 1
4
- 3 (para datos agrupados en intervalos)
sx

!'
Punruac,ones tip,cas / 135

8 equivale a

x , = AX, + B

Puntuaciones tpicas
con A 1y B = -X ;

1 -
= s- X - X 1 -
.X sx

equivale a

8.1. Puntuaciones directas, diferenciales y tpicas z, = A X,+ B

a) Puntuacin directa
l -
con A= - y B
sx
= -~
X
La atribuida directamente a cada objeto al ser sometido a cualquier tipo de
prueba . Estas puntuaciones suelen ser designadas en Estadistica Descriptiva, por
letras maysculas latinas.

8.2. Propiedades de las puntuaciones tpicas


b) Puntuacin diferencial
a) La media de las puntuaciones tpicas vale cero.
Puntuacin directa menos la media. Estas pun tuaciones suelen ser designadas, En efecto,
en Estadstica Descriptiva, por letras minsculas latinas.
1
:E::,- = !: (X, - X)/s, = (I/s,) r (X, - X) =o
c) Punwacin rpica
-pues segn sabemos (ver 5.2.3.a)
Puntuacin diferencial dividida por la desviacin tpica. Estas pun tuaciones
suelen ser designadas en Estadstica Descriptiva, por la letra min scula latina z.
r (X, - X)= o
EJEMPLO 8.1. Sean 6, 4, 2, 5, 8 los valores obtenidos directam ente en una
prueba por cinco personas. Su media vale 5 y su desviacin tpica vale 2. Esto su- Con siguientemente,
puesto, veamos cunto valen las puntuacio nes dife renciales y tpicas.
Puntuaciones directas : X, =6 4 2 5 8
Puntuaciones diferenciales : x , = X, - X = 1 -1 - 3 O 3
:; = L z/n = {l /11) L Z =
Puntuaciones tpicas : = x,ls, = (X, - X)/s., = 0,5 - 0.5 - 1.5 O I,5
Podamos, tambin, haber pensado as :
Ntese que
1 -
/" =- X, - X
X ;= x,. - X sx sx
136 / Estadistica para Psiclogos
Puntuaciones tpicas / 137
Por consiguiente, segn 5.2.3.c,
Por tanto,

:=2X -~ = 0
Sx Sx f = Az + B = (A)(O) + B = B (recordando 5.2.3 .c)
s, = IAl-r, = !A!O) = IA (reco rdando
1 6.3.4.a)
EJEMPLO 8.2 . Comprobemos esta propiedad con los datos del ejemplo 8.1.
EJEMPLO 8.4 . T ransformemos las puntuaciones tpicas del ejemplo 8.1 me-
: = (0,5) + (- 0,5 ) + (-1,5) + (0) + (1,5) = Q= O diante Y, = 10::, + 20 y comprohcmos cmo la media y la desviacin tpica de
5 5 Jas nuevas puntuaciones Y, valen, respectivamente, f = 20. = 1O. s,.
b) La varianza (y la desviacin tpica) d e las puntuaciones tpicas vale uno.
>' 1 = (1 0)(0,5) + 20 = 25 Y2 = ( 10)(-0.5) + 20 = 15
En efecto,
Y.i = (10)(-1 ,5) + 20 = 5 , Y4 = (10)(0) + 20 = 20
I _2 Y 5 = ( 10)(1, 5) + 20 = 35
s; = I (z, - .:)2 -2 I (x,/s,)2 I xf I I x; 1 2
- ~-'-- = ~ - = - - = - s
n n n (s;)(n) s; n s; '
y= 25 + 15 + 5 + 20 + 35 = l 00 = 20
De lo acabado de ver se deduce que I ::! = n . 5 5
Podamos, tambin, haber pensado as:
+ + + (20 - 20) 2 + (35 - 20) 2
s; (25 - 20)2 (15 - 20)' (5 - 20)2
5
-, = -l X, - ~-
Sx sx
500
100 1, = 10
Por consiguiente, segn 6.3.4.a, 5

2 1 2 Basndonos en esta propiedad podemos convertir unas puntuaciones dadas


s= =2sx =
s, X 1 , X 2 , , X,,, con media X y desviacin tpica s,, en otras puntuaciones Y1 ,
Y2 , , Y,. cuya media Y y cuya desviacin tpica s,, sean dos valores fijados de
EJEMPLO 8.3. Comprobemos esta propiedad con los datos d el ejemplo 8.1. antemano p or nosotros. En efecto. basta con transformar en tpicas las p untuacio -
nes primitivas. multi plicando, despus, dichas punt uaciones t picas por s, y su-
mando 9 a cada uno de esos productos. donde s,. e Y son dos valores elegidos a
{l,5)2 = ~ =
2
s! = (0,5)2 + (-0,5)2 + (- 1,5)
2
+ (0) + 1 nuestro a rbi tro. Es decir, las n uevas puntuaciones sern:
5 5

e) Si m ultiplicarnos las puntuaciones tpicas por una constan te A y sumamos }, =X,--


s . + }~
- X s, X +
= -.\x (l C s, - )
- -'- X
a esos productos otra constante B, las nuevas puntuaciones tienen como media 1 sx } j s.l
By corno desviacin tpica IAj.
En efecto, acabamos de ver que EJEMPLO 8.5. Deseamos t ransformar las p untuaciones 21 , 11, 1, 16, 31 obte-
nidas en un test en otras cuya media sea 100 y cuya desviacin tpica valga 20. Esto
z= o y s, = supuesto, en qu pun tuaciones se convertirn las puntuaciones da das?
La media de estas pu ntuaciones vale l 6 y la desviacin tpica vale I O. Por consi-
Ahora bien. las nuevas puntuaciones son guiente,

,,_-:-- 20 20
Y1 = A~,+ B Y = -- X + (100 - - - 16) = 2X + 68
' 10 ' 10 '
Puntuaciones //picas / 139
138 / Estadistica para Psiclogos

Supongamos dos grupos A y B. ta les que s,i = 2 y s8 = 4. La misma puntua-


Es decir,
cin diferencial tres, significa ms referid a a A que a B. Ahora bien, esta diferente
Y1 = (2)(21) + 68 = 110 Y2 = (2)(11) + 68 = 90 significacin viene dada precisamente por las correspondientes puntuaciones
, Y4 = (2)(16) + 68 = 100 tpicas, :,. = 3/ 2 = 1,5, : 8 = 3/4 = 0,75. Por consiguiente, la pun tuacin tpica
Y3 = (2)(1 ) + 68 = 70
admite una interpretacin ms completa sobre la memoria de Pedro.
l\ = (2 )(3 1) + 68 = 130

Las nuevas puntuaciones cumplen con las condiciones exigidas, Y= 100,


s, = 20. En efecto:

y = 110 + 90 + 70 + 100 + 130 = 500 = 100


5 5
(110 - 100)2 + (90 - 100)2 + (70 - 100)2 + (100 - 100)2 + (1 30 - 100)2
s; 5

= 2.000 = 400
5
S1. = 20
x~ t9 22
-J--.-
8.3. Significado de las puntuaciones directas, diferenciales
y tpicas En conclusin, el significado de las puntuaciones directas. consideradas en s
mismas, es prcticamente nulo. Admiten un cierto significado, consideradas en
Sabiendo que Pedro obtiene una puntuacin directa igual a 22 en una prueba relacin con la tendencia central (media). s te es an ms completo, consideradas
de memoria, nada podemos afirmar sobre su memoria. Es necesario conocer las en relacin con la tendencia central (media) y con la variabilidad (desviacin t-
puntuaciones obtenidas por las restantes personas del grupo al que pertenece pica). Es decir, las puntuaciones tpicas significan ms que las diferenciales y stas
Pedro. Este grupo puede ser reducido o amplio, puede constar de sus compaeros ms que las directas.
de clase, de los muchachos de su propia edad, de las personas de su nacin, de to- Pronto veremos que, muy frecuentemente, en Psicologa cada puntuacin tpica
dos los habitantes de la Tierra. Pero, pequeo o grande, es necesario un grupo de ser, adems, traducible en un porcentaje. Dada una puntuacin tpica, podremos
referencia para poder hacer la ms mnima afirmacin sobre la memoria de Pedro. calcular cuntas personas del grupo de referencia se encuentran po r debajo de ella.
Supongamos que, definido dicho grupo, la media de ste vale 19. La puntuacin As, m ediante las puntuaciones tpicas podemos obtener una interpretacin muy
diferencial de Pedro valdr 22 ~ 19 = 3. Por ser positiva comprobamos que Pe- razonable sobre la memoria de Pedro.
dro est encima de la media de su grupo. Si hubiera sido negativa, Pedro se habra
encontrado por debajo de la media . La puntuacin diferencial nos permite afirmar
algo sobre la memoria de Pedro, pero an esta interpretacin es bastante impreci- 8.4. Comparabilidad de las puntuaciones tpicas
sa. Superar la media en tres unidades, _es mucho o poco'? Depende de los casos.
Si nadie o casi nadie del grupo se aparta de la media tres o ms unidades, tres sig-
nifica mucho. Pero si bastantes la superan en ms de tres unidades, tres sign ifica En principio, dos puntuaciones directas (o diferenciales) r eferi das a dos carac-
mucho menos. Ahora bien, en general, en el primer caso la variabilidad del grupo tersticas distintas, no son comparables entre s. Si, por ejemplo, las dos caracters-
(y, en concreto, la desviacin tpica) ser pequea. Por el contrario, en el segundo ticas son p eso y altura, 70 kg ni son ms ni son menos que 180 cm. Son dos cosas
se:; grande. Por consiguiente, la in terpretacin de una misma puntuaci n diferencial distintas y, por tanto, no comparables. Por el contrario, dos pun tuaciones tpicas
-sr distinta segn sea una u otra la variabilidad del grupo y, en concreto, la des- son siempre comparables, al ser nmeros abstractos; es decir, al no venir expresadas
en ninguna unid ad concreta de medida.
viacin tpica.
140 / Estadistica para Psiclogos Puntuaciones tpicas / 141

Ms aun. En el caso de una sola caracterstica, seran ya comparables dos pun- Pero, A I dejar por debajo de s el 70 por 100 de los casos y A 2 slo el 60 por 100.
tuaciones directas y diferenciales, pues ambas vendran expresadas en una misma Es decir, a iguales puntuaciones tpicas (y directas) corresponden distintos por-
unidad de medida. Sin embargo, aun en este caso, las puntuaciones tpicas son centajes.
ms comparables entre s que las directas y diferenciales. Supongamos que dos es-
tudiantes, M y N, pertenecientes a dos grupos distintos realizan una misma prueba.
Es claro que las puntuaciones tpicas del primer grupo y las del segundo tienen una
misma media (igual a cero) y una misma desviacin tpica (igual a uno ). Por esta ra-
zn, las puntuaciones tpicas de M y N, referidas a una misma media y a una misma
desviacin tpica, son ms comparables entre s que sus puntuaciones directas,
referidas probablemente a distintas medias y a distintas desviaciones tpicas, y
que sus puntuaciones diferenciales, referidas probablemente a distintas desviaciones
tpicas. Por consiguiente, en general, dos puntuaciones tpicas admiten una com-
parabilidad mayor que las directas y diferenciales.
Con todo, esta mayor comparabilidad no implica que dos o ms personas,
40 30 20 20 30 40
pertenecientes a dos o ms grupos distintos, sean iguales bajo cualquier aspecto
por el mero hecho de haber obtenido las mismas puntuaciones tpicas. Vamos a 4 5
2 2
limitarnos a un par de casos elementales.
a) Dos grupos distintos realizan una misma prueba y obtienen la misma me-
dia y la misma desviacin tpica. Pues bien, si dos personas, una del primero y otra A su vez, A 1 con z , = 0,5, y ,4 2 con ::1 = 0,75, obtendrn puntuaciones d irectas
del segundo, obtienen la misma puntuacin tpica, obtendrn la misma puntuacin distintas X, = 3 + (1)(0,5) = 3,5, X 2 = 3 + (l )(0,75) = 3,75, pero dejarn por
directa (es decir, dentro de lo posible, manifestarn en el mismo grado la caracte- debajo de s el 70 por 100 en ambos casos. Es decir, a iguales porcentajes corresponden
rstica de que se trata), pero no dejarn necesariamente por debajo de si el mismo puntuaciones tpicas (y directas) distintas.
porcentaje. Recprocamente, si dos personas, una de cada grupo, dejan por debajo b) Dos grupos distintos realizan una misma prueba y alcanzan diversa media
de si el mismo porcentaje, no obtendrn necesariamente la misma puntuacin y/o diversa desviacin tpica. Pues bien , si dos personas, una del grupo primero
directa (es .decir, no manifestarn la caracterstica en el mismo grado) ni, en conse- y otra del segundo, obtienen Ja misma puntuacin tpica, obtendrn, en general,
cuencia, obtendrn necesariamente la misma puntuacin tpica. Consideremos, distintas pun tuaciones directas (es decir, manifestarn la caracterstica en distinto
por ejemplo, los dos grupos siguientes que, realizando una misma prueba , X, al- grado) y dejarn por debajo de s distintos porcentajes. Si dos personas, una del
canzan la misma media y la misma desviacin tpica, pero tales que el primero primer grupo y otra del segundo, obtienen la misma puntuacin directa, (mani-
muestra una clara asimetra positiva y el segundo una clara asimetra negativa. fiestan la caracterstica en el mismo grado), obtendrn, en general, distintas pun-
tuaciones tpicas y dejarn por debajo de s distintos porcentajes. Consideremos,
por ejemplo, los dos grupos siguientes que, realizando una misma prueba, X, al-
Grupo 1.0 Grupo 2. 0

x, n, n;X; n,X/ x, n, n,X, nXl


l canzan distinta media y distinta desviacin tpica, pero tales que el primero mues-
tra una clara asimetra positiva y el segundo una clara asimetra negativa.

4 40 160 640 Grupo J. 0 Grupo 2.0


5 JO 50 250
4 20 80 320 3 30 90 270
3 30 90 270 2 20 40 80 x, n, n,X, n;X/ x, il n;X
1 nX,2
2 40 80 160 1 10 10 10
5 JO 50 250 10 40 400 4.000
100 300 J.000 4 20 80 320 8 30 240 1.920
100 300 1.000
- 3 30 90 270 6 20 120 720
x, = 3, s, = 1 X, = 3, Sz =] 2 40
- - -- - --
80 160 4 JO 40 160

100 300 1.000 100 800 6.800


Dos personas, A 1 (del grupo 1. 0 ) y A 2 (del grupo 2.0 ), con la misma puntuacin t-
pica' 0,5, obtendrn la misma puntuacin directa : X 1 = X 2 = 3 + (1 )(0,5 ) = 3,5. x, = 3, s, = l
- x, = 8, s, = 2
Puntuaciones t1picas / 143
142 / Estadistica para Psiclogos
a posicin relativa idntica de dos personas segn uno de los dos criterios, corres-
ponde posicin relativa idntica de las mismas segn el otro criterio . Y a posic in
distinta, segn uno, corresponde posicin relativa dis tinta segn el otro .
Ahora bien, las distribuciones de frecuencias en Psicologa suelen ser normales
o aproximadamente normales con bastante frecuencia. En otras palabras, dos
grupos distintos sometidos a la misma o distinta prueba suelen dis tribuirse de la
misma manera, de acuerdo con la distribucin n ormal, de la que hablaremos en-
seguida . Por consiguie nte, con gran frecuenc ia, dos personas con la misma puntua-
cin tpica dejarn po r debajo de s, aproximadamente, el nsmo porcentaje . Ms
a n , conociendo esa puntuacin t pica, podremos determinar cul es el porcentaje
20 10 20 30 40 que queda por d ebaj o.
40 30

4 4 6 8 IO
2
8.6. Combinacin de puntuaciones
Dos personas, A 1 (del grupo 1.0 ) y A 2 (del grupo 2.0), con la misma puntuacin
tpica 0,5, obtendrn distintas puntuaciones directas: X 1 = 3 + (1 )(0,5) = 3,5,
x2 = 8 + (2)(0,5) = 9 y dejarn por debajo de s distintos porcen tajes : 70 por 100 Para combinar en una sola pun tuacin to ta l, las pun tuaciones de varias pruebas,
y 60 por 100 respectivamente. Es decir, a iguales puntuaciones tpica s correspon- conviene operar con puntuacion es tpicas. Es decir, reducir las unidades de las
den distintas puntuaciones directas y distintos porcentajes. distintas pruebas a una un idad comn. Esto es conveniente aun en el caso e n que
Dos personas, A 1 (del grupo 1.0 ) y A 2 (del grupo 2.0 ) con la misma puntuacin las pruebas sean muy semejan tes (por ejemplo, varias notas de una m isma asig-
45 3 nat ura com binad as para d ar la nota fin a l de curso) ya que superar la media en un a
directa 4, 5 , o b ten d ran
. d'1stmtas
. .
puntuac10nes ' .
t1p1cas: z 1 = -, --- = 1,5 , z 2 =
1 mism a distan cia significa ms cuando la desviacin tpica es pequea que cuando
es grande. D e aqui la necesidad de operar con puntuaciones tpicas, de tener en
= 4 ,5 - 8 = - 1,75 y dejarn por debajo de s distintos porcentajes: 90 po r l 00 cuenta la d esviacin tpica de cada prueba.
2
y 7,5 por 100 respectivamente. Es decir, a iguales puntuaciones directas corresponden EJEMPLO 8.6. Sean tres prueba s I, 11, Jll y dos al umnos A y B. Sean X 1 = 45,
s1 = 2; %11 = 60, s 11 = 4 ; %111 = 60, sm = 6. Sean fi na lmente las puntuaciones
distintas puntuaciones tpicas y distintos porcentajes.
Dos personas, A 1 (del grupo 1.0 ) y A 2 (del grupo 2.0 ) que dejan por debajo d e siguientes las obtenidas p or A y B en las tres prue bas :
s el mismo porcentaje (30 por 100), obtendrn distintas puntuaciones directas:
5 X 7 d' . . . . 2,25 - 3 7
X 1 = 2.2 , 2 = , y 1stmtas puntuaciones t1p1cas: z 1 = = - O, 5.
DIRECTAS DIFER ENCIAi. ES TIPICAS
1
z = -7 -- -8 = - 05 , . Es d ec1r,
. a 1gua
. 1es porcentajes,
. correspon d en d1stmtas
.. pun- JI JII TOTA L IJ IJl TOTAL 11 111 TOTAL
2
2
tuacioncs directas y distintas puntuaciones tpicas. A406466 170 - 5 4 6 5 - 2,5 -0.5
B 50 56 54 160 5 - 4 - 6 -5 2,5 - l - 1 0,5

8.5. Nota
El al umno A tiene una puntuacin total (a partir de las d irectas y diferenciales)
Acabamos de considerar dos criterios indicadores de la posicin relativa de un a mayor q ue B. Sin embargo, el a lumno B tiene una puntuacin total (a parti r de las
persona respecto a un grupo de referencia: a ) Posicin relativa como dista ncia de esa tpicas) m ayor que A . El alumno B est por encima de la media en una sola p rueba,
persona a la media del grupo (medida en unidades tpicas) ; b ) Posicin relativa pero d onde la variabilidad es muy pequea . En cambio, el alumno A est por encima
como porcentaje de personas del grupo que deja por debajo de s esa persona. He- de la media en dos pruebas, pero donde la variabilidad es muy grande. En co njunto,
mos visto que dos personas, pertenecientes a dos grupos distintos, cuya posicin rela- el a lumno B debera ser p referid o al A , pues su pun tuacin tpica total es mayor
tiva es"itlntica segn uno de los dos criterios, no lo es necesa riamen te segn el otro
que la de A .
Sin ~mbargo, si las distribuciones de frec uencias de ambos grupos son t!ua lc,.
144 / Estadistica para Psiclogos
Puntuaciones tpicas / 145
8.7. Desviacin tpica y puntuaciones tpicas 8.8.2. Curva normal

Desviacin tpica y puntuacin tpica son conceptos distintos. La primera De ella trataremos ampliamente en el tomo 2 (Estadstica Inferencia!). Sin
es propia del grupo. La segunda es propia de cada persona. En un grupo den personas, embargo, vamos a ofrecer ahora una idea sucinta sobre la misma. Suponemos
tenemos n puntuaciones tpicas (algunas de las c uales pueden ser iguales entre s) que operamos con proporciones. Ello significa que vale la unidad el rea limitada
y una sola desviacin tpica. Sin embargo, es equivalente decir que un a persona por el histograma o (en el lmite) por la curva F y el eje de abscisas. Bajo esta con-
obtiene una puntuacin tpica igual a dos o que supera a la m edia en dos desviacio- dicin, la cur va normal es la representacin grfica de la siguiente funcin :
nes tpicas. Por ejemplo, suponiendo X = 60, sx = 3, una persona con puntuacin
directa X, = 66, tendr como puntuacin tpica : 1 -2 1(~)2
6
y = -- e
.j2na
z = 66-60 =~=o2
1
3 3 == media de la poblacin, a= desviacin tpica de la poblacin, e= base de los
logaritmos neperianos: 2,718281828 . .. , n = relacin de la circunferencia a su
Esto equivale a decir que su distancia de la media (66 - 60 "' 6 unidades) dimetro: 3, 141592 . . .

contiene dos veces la desviacin tpica : 3, ( } "' 2), o, a decir que supera la media
Para cada par de valores de y de a tendremos una curva normal distin ta . Es
decir, tenemos una familia de curvas. Pero todas ellas coincid en en algunas carac-
en dos desviaciones tpicas. tersticas (vase la figura adjun ta ):

8.8. Puntuaciones tpicas y curva normal

8.8 .1. Lmite del histograma con intervalos infinitamente pequeos

Al aumentar indefinidamen te el nmero de intervalos, disminuye su amplitud


y los rectngulos del histograma se adelgazan ms y ms. En el limite, la lnea que-
brada H se identificar con la curva F. Esta curva es, con gran frecuencia , en Psi-
cologa la llamada curva normal o campana de Gauss.
-a ~+a

a) Tienen un nico mximo para X=.


b) Tienen dos puntos de inflexi n, para x = - a y para X= + a. Es
decir, en el punto X= - a la c urva pasa de ser cncava hacia arriba a ser cn-
cava hacia abajo y en el p unto X = + a la curva pasa de ser cncava hacia abajo
a ser cncava hacia arriba.
e) Se acercan asintticamente al eje de abscisas. En otras pala bras, se acercan
ms y ms a ese eje, tanto por la derecha como por la izquierda, sin llegar a tocarlo en
ningn punto finito.
d ) Son simtricas respecto al eje vertical que pasa por la media.

Suele ser til operar con p untuaciones tpicas. En este caso la ecuacin de la
curva normal viene dada por
1 _ !,!
-~ .v= fo
- -e 2
146 / Estadistica para Ps,clogos
Puntuaciones lip,cas / 147
y su representacin grfica es la siguiente:
8.8.4 . Uso de la tabla de las reas bajo la curva normal

La tabla A (Apndice lll) ofrece con cada puntuacin tpica la proporcin


(porcen taje si la multiplicamos por 100) o rea situadas bajo dicha puntuacin,
suponiendo, na turalmente, que la distribucin de frecuencias es normal.
EJEMPLO 8.7. ;.Qu porcentaje de observaciones queda por debajo de la pun-
tuacin directa X = 23, valiendo 30 la media y 4 la desviacin tpica?
Transformemos esa puntuacin directa e n tpica :

z
=n = -23 4 :,_cJ = _ 1,75
:--
-3 -2 -1 o 2

En la tabla, a:: = -1,75 le corresponde un porcentaje igual a 4,01. Por tanto,


Entre tres desviaciones tpicas por la izquierda y tres por la derecha (es decir, por debajo de la puntuacin tpica z = - 1, 75 (es decir de la directa X = 23 )
entre la puntuacin tpica - 3 y la puntuacin tpica 3) se encuentra el 99,74 por 100 queda el 4,01 por 100 de las observaciones.
del rea total contenida bajo la curva normal.

8.8 .3. Relacin entre las reas bajo la curva normal y proporciones
o probabilidades

En la figura adjunta el rea A representa la probabilidad de obtener una pun-


tuacin igual o menor que =A- Interpretada esta probabilidad como proporcin,
el rea anterior representa la proporcin de observaciones con puntuaciones igua-
les o menores que :,., en el supuesto, claro est, de que dichas observaciones se
distribuyan normalmente.

EJEMPLO 8.8. ,Q u porcentaje de observaciones queda por encima de la p un-


tuacin directa X = 54, valiendo 48 la media y 5 la desviacin tpica ?

z,

Por ahora, sern equivalentes para nosotros probabilidad y proporcin. En


el tomo 2 discutiremos ms detalladamente esta equivalencia. Naturalmente,
las .cas representadas sern porcentajes si multiplicamos las proporciones por
cien:
1.2
148 / Estadistcil para Psiclogos Puntuaciones t1picas / 149

T ransformemos esa puntuacin directa en tpica: EJEMPt.O 8.1 l. ,Qu puntuacin directa d eja por encima de s el 61 por 100
de las observaciones, va liendo 40 la med ia y 6 la desviacin tpica'>
48 = 1,2 Dejar por encima de s el 61 por 100 de las observaciones equivale a deja r por
:54 = 54-5-- debajo de s el 39 por 100 de las mismas. En la tabla, el porcentaje ms prximo a l
39 por 100 es el 38,97 por 100 y a este porcen taje le corresponde la p untuacin
En la tabla, a z = 1,2 le corresponde un porcentaje igual a 88,49. Por tanto, tpica :: = - 0,28 . Por tan to,
por encima de la puntuacin tpica z = 1,2 (es decir, de la directa X = 54 ) queda
el (100 - 88,49) por 100 = 11,51 por 100 de las observaciones. - 0,28 = X - 40 X = (6)( - 0,28) + 40 = 40 - 1,68 = 38,32
EJEMPt.O 8.9. _Qu porcentaje de observaciones queda po r encima d e la pun. 6
tuacin directa X = 9 y, simultneamente, por d ebajo de la puntuacin direcia,
X = 3 1, valiendo 25 la media y 8 la desviacin tpica ? EJEMPLO 8. 12. Calculemos d os puntuaciones directas, X 1 y X 2 , ta les que la pri-
mera deje por debajo de s un 10 por 100 de las observaciones y la segunda deje por
encima de s o tro 1O p or 100 de los casos, valiendo 40 la media y 7 la desvia cin
tpica.
En la tabla, el porcentaje ms prximo a l 10 por 100 es el 10,03 p or 100 y a este
porcen taje le corresponde la puntuacin tpica z = - 1,28. Po r otra parte, dejar

~
por encima el 10 por 100 eq uivale a dejar por debajo el 90 por 100. En la tabla el
porcentaje m s prximo al 90 por 100 es el 89,97 por 100 y a este porcentaje le corres-
ponde la puntuacin tp ica ;; = 1,28. Por tanto,

- 1,28 = X i - 40 X1 = (7)( - 1,28) + 40 = 40 - 8,96 = 31,04


-2 0,75 7

1, 28 = !-2 -7 40
-- X2 = (7)(1,28 ) + 40 = 40 + 8,96 = 48 ,96

Transformemos esas puntuaciones directas en tpicas.


8.9. Puntuaciones T

Z9 = 9 - 2~
-8
=_2 Z 31 = ~831 - 25 = 0,75
Las p un tuaciones tpicas ofrecen un doble inconveniente . En primer lugar,
unas son positivas y otras negativas (circunstan cia que puede ocasionar errores
En la ta bla, a :: = - 2 le corresponde un porcentaje igual a 2,28 y a ;: = O, 75
en los clculos). En segundo lugar , casi todas las o bser vaciones suelen quedar
un porcentaje igual a 77,34. Por tanto, por encima de la puntuacin tpica z = - 2 contenidas dentro de tres d esviaciones tpicas a la derecha de la media (igual a cero)
(es d ecir, de la directa X = 9) y, simultneamente, por debajo de la puntuacin y otras tres desviaciones tpicas a la izquierd a de la misma. Es decir , slo tendremos
tpica :: = O, 75 (es deci r, de la puntuacin directa X = 31) queda el (77,34 - 7 puntuaciones enteras posibles ( - 3, -2, - l , O, 1, 2, 3); tod as las dems sern
- 2,28) por 100 = 75,06 por 100 de las observacio nes. decimales (con los consiguientes inconvenientes para el clculo).
EJEMPLO 8. 10. ,Qu puntuacin directa deja por debajo de s e l 64 por 100 Para evitar los d ecimales (o, al menos, bastantes de ellos) multiplicamos las pun-
de las observaciones, valiendo 30 la media y 5 la desviacin tpica? tuaciones tpicas por una constante apropiada. Para evitar los valores negativos,
En la tabla , el porcentaje ms prximo al 64 por 100 es el 64,06 por 100 y a este sumamos a los productos o bten idos otra constante adecuada. En par ticula r, suelen
porcentaje le corresponde la puntuacin tpica z = 0,36. Por tanto: ser usadas, respectivam ente, 10 y 50. En otras ocasiones, 100 y 500 u otras cons-
tantes que nos sirvan para conseguir el fin pretendido.
,.. 0,36 =! - 30 X = (5)(0,36) + 30 = 1,8 + 30 = 31,8 Dentro de este contexto, llamaremos puntuaciones Ta las obtenidas mediante
- 5 la constante multiplicadora 10 y la constante aditiva 50, pero tras previa norma-
150 / Estadistica para Psiclogos Puntuaciones tipicas / 151

lizacin de la distribucin de frecuencias. Ello equivale a calcular las puntuaciones Cumu normal: representacin grfica de la siguiente funcin.
tpicas valindonos de la tabla de las reas bajo la curva normal y no mediante
la media y la desviacin tpica de las puntuaciones directas que nos son dadas.
Las puntuaciones tpicas as calculadas son las que se multiplican por l O y se les y = -_!_
:;:- (' _!2 (1_::_J'
)
'
(en punt uaciones directas)
aade la constan te 50. ,J.L1!
EJEMPLO 8.13. Calculemos las puntuaciones T a partir de la siguiente distri-
1 ,,
bucin de frecuencias: .V= - - e- -2 (en puntuaciones tpicas)
fo
+ 50
X; n, Free. ac. (pm) Porc. ac. (pm) zl (10)(: ; ) ()O)(z,)

95,63 1,71 17,1 67,1


18-20 7 76,5 EJERCICIOS
1,09 10,9 60,9
15-17 8 69 86,25
71,88 0 ,58 5,8 55,8
12-14 15 57,5
52,50 0,06 0,6 50.6
9-11 16 42 44,4
8.1. Calcular las correspondien tes puntuaciones diferenciales y tpicas a partir
28,75 - 0,56 -5,6
6-8 22 23 de las siguientes puntuaciones directas.
7,50 - 1.44 - 14,4 35,6
3-5 12 6
a) 2, 6, 8, 5, 4 b) 7, 4, 1, 5, 3 e) 1, 11, 11 , l
80
d) 2, 3, 5, 2 e) l, 4, 7

Free. ac. (pm): frecuencia acumulada hasta el punto medio. Es decir, hasta la mi- 8.2. Suponiendo X = 20 y s, = 4, q u puntuaciones diferenciales y directas
tad del intervalo (3-5) habr .13. = 6 observaciones. Hasta la mitad correspondern a las siguientes puntuaciones tpicas?
2
a ) z,=2 ; b ) Zx= 1,5 ; e) Zx = - 1 ; d) :, = - 0.25 ; e) Zx=0 ,9
del intervalo (6-8) habr 12 + ?~2 = 23. Etc.
8.3. Supongamos que X 1 , X 2 , , X" son ciertas puntuaciones directas y que
Porc. ac. (pm) : porcentaje acumulado hasta el punto medio . Basta con dividir x 1 , x 2 , , x" son sus correspondientes puntuaciones diferenciales. Esto supuesto,
cada frecuencia acumulada hasta el punto medio por 80 y mul- demostrar que 1: X,y, = L x,Y,
tiplicar este cociente por 1OO.
8.4. Calcular el coeficiente de variacin de X, sabiendo que
Z/ puntuacin tpica normalizada. Es decir, -1 ,44 es la puntuacin
tpica que, supuesta una distribucin normal, deja por de bajo Zx , = z>., z~i = ZJ'2' Z.x 1 = Zy~ que Sy = 4~
de s el 7,5 por 100 de las observaciones. Etc.
que el coeficiente de variacin de Y va le 20 y teniendo en cuenta el cuadro adj un to .

X, Y,
8.10. Resumen: Definiciones y frmulas
18
6 22
Puniuacin directa; la atribuida directamente a cada elemento de un grup o. 1 26

Puntuacin diferencia/; puntuac1on directa menos la media del grupo. 20

/Vntuacin tpica: puntuacin diferencial dividida por la desviacin tpica del


grupo. 8.5. Son tpicas las pun tuacion es - 3, 1, 1, O, 1, O, o btenidas por seis personas ?
152 / Estadstica para Psiclogos Puntuaciones t1picas / 153

8.6. Transformar las puntuaciones 9, 5, 7, 1, 13 en otras cuya media valga 50 y d) Mayores que 33. e) M a yores que 22 y menores que 28. j ) Mayores que 32
cuya desviacin tipica valga 12. y menores q ue 35. g ) Mayores q ue 28 y m enores que 34.

8.7. Sean X 1 , X2 , . . , X., n puntuaciones con media X = 10. Consideremos la s 8.14. Suponiendo que X = 50, s, = 8 y n = 500 y que la distribucin de frecuen-
puntuaciones 3X1 , 3X2 , . , 3X. cuya desviacin tpica nos es dada y va le 6. cias es normal, ca lcular la puntuacin directa que deja po r d ebaj o o por encima
Esto supuesto, calcular la varianza de las 2n puntuaciones X 1 X 2 . . , X., 3X 1 , de s los siguientes p orcentajes o nmero d e observaciones. a) Q ue deja por debaj o
3Xi, . . . , 3X . el 11 p or 100. b) Q ue deja por de bajo 220 observacion es. e) Q ue deja por encim a
el 48 por I OO. d) Que deja por encima 320 observaciones. e) D os pun tuaciones
8.8. Transformar las puntuaciones X , = 7, Xi = 5, X 3 = 3, X4 = 6, X 5 = 9 en (equidistantes de la media, a uno y otro lado de la misma ) q ue dejan entre ambas
otras puntuaciones Y tales que Y = 2X - 5, s, = 2sx. el 54 p or 100. f) D os pu ntuaciones (equidistan tes de la media) que dejan entre
ambas l 00 observa cion es.
8.9. Ponga las puntuaciones que fa ltan en el cuadro siguiente, sabiendo que
Zx, = z,,, , Zx , = z,.,, . . . , Zx , = z,.,, que Sx = 2 Y que los coeficien tes de va ria - 8.15. Calcular la media de un grupo de pe rsonas, suponiendo que la distribucin
cin de X y de Y valen 20 y 50, respectivamente . de frec uencia s es no rmal y sabien do que la desviacin tpica vale 10 y que el 4 0 por
100 obtiene punt uaciones menores q ue 28.

X, Y, 8.16. Calcular la med ia de un grupo de 200 personas, distri buidas normalmente,


sa biend o que la desviacin tpica vale 8 y que 15 personas obtienen puntuaciones
13 ma yores que 28.

7 4 8.17. Calcular la d esviacin tpica de un grupo d e personas, distribuidas normal-


JO men te, sabiend o que la media vale 47,7 y que el 98 por 100 o btiene puntuaciones
11 menores q ue 60.

8.18. Ca lcula r la desviacin tpica de un grupo de 120 personas, distribu idas


normalm ente, sabiendo que la m edia vale 44,24 y que 12 personas obtienen pun-
8.10. Sean X = 50 y Sx = 4 la media y la desviacin tpica de n puntua ciones t uacion es mayores q ue 50.
X 1 , Xi, . . . , x . Esto supuesto, cunto valdr el coeficiente de variacin de las
puntuaciones Y , = 3X , - 30, Y i = 3X 2 - 30, ... , Y. = 3X . - 30? 8. 19. C alcular la media y la desviacin tpica de un grupo de 500 personas, dis-
tribuidas nor malmente, sabiendo q ue 100 personas de d icho grupo han obtenido
8.11. Sabiendo que los coe!icientes de variacin de X e Y vale n, respectiva men te, pun tuaciones direc ta s mayores q ue 64,20 y 130 han obtenido pun tuaciones directas
40 y 50, que s,. = (3/4)sx y que la puntuacin tpica correspondien te a 24 en X es m enores que 56,80.
la misma que la correspondiente a 15 en Y, calcular X, Y, sx y s,..
8.20. Calcular la med ia y la desviacin tpica de un g rupo d e 5.000 personas,
8.12. Aplicado un test ll a un grupo normativo de person as, las p untuaciones distribuidas nor malmen te, sabiendo q ue el primer cua r til vale 30,65 y que 3.203
directas obtenidas por stas han sido transformadas mc_dia nte la ecuacin 3X + 45 personas han obtenido puntuacio nes directas mayores que 32,2.
con el !in de que su media fuera l 00 y su desviacin tpica, 20. E l mismo test II es
aplicado a tres nuevas personas que obtienen las puntuaciones d irectas 15, 22, 25 . 8.21. Calcular el n mero de personas que obtendrn p untuaciones directas ma-
En este supuesto: a ) Qu hara usted pa ra comparar estas tres puntu acio nes yores que 27,9 en un grupo de 50.000 cuya d istribuci n de frecuencias es norm al,
con las puntuaciones transformadas del grupo norma tivo ? b) Rea lizada la trans- cuya am plitud semiintercua rtil va le 2,01 y cuyo coeficiente de var iacin vale 10.
formacin apropiada a cuntas desviaciones tpicas se encuentran estas tres per-
sonas por encima o por debajo de la media ? 8.22. Sean 20, 26 y 32 las m edias o btenidas por tres grup os distintos, siendo nor-
males las tres distri buciones de frecuencias. Cada g rupo consta de 150 personas
8.13. Suponiendo que X = 30, sx = 4, n = 150 y que la d istribucin d e frecuencias y stas se ex tiend en d esde tres desviaciones tpicas a la izq uierd a de su media hasta
es normat, calcular el porcen taje y el correspondiente nmero de o bservaciones tres d esviaciones tpicas a la derecha de la misma . Esto supuesto, cuntas personas
con puntuaciones : a) Menores que 24 . b) M eno res que 34. e) M ayores q ue 28. quedarn d entro del rea rayada en el grfico adj unto , siend o s , = s 2 = s 3 ?
154 / Estadistica para Psiclogos Pun tuaciones tpicas / 155

aptitud mecnica, Y, se distribuyen normalmente. Calcular el porcentaje de nios


cuyas puntuaciones en X superan la media de las puntuaciones en Y, sabiendo que
Mdy - Mdx = 15, Md,, + Mdx = 95 y r. X;- = 850.000.
8.28. Calcular el coeficiente de variacin de un grupo de puntuaciones, sabiendo
que la distribucin es normal, que Q3 - Q1 = 5,36 y que P6 7 = 62,96.
8.29. Un grupo de 400 personas responde a un cuestionario y sus respuestas se
distribuyen normalmente. El coeficiente de variacin vale 25. Por encima de la pun-
tuacin directa 23,85 se encuen tran 88 personas. Calcular la media y la desviacin
tpica .
8.23. Sean dos grupos A y B, cada uno de ellos con 300 personas y distribuido 8.30. ,Es simtrica toda curva normal?
normalmente. En cada grupo las 300 personas se extienden desde tres desviacio-
nes tpicas a la izquierda de su media hasta tres desviaciones tpicas a la derecha 8.31. Es normal toda curva simtrica ?
de la misma. Suponiendo, adems, que s,. = s 8 , ,cuntas personas quedarn den- 8.32. Siempre que conozcamos unas puntuaciones tpicas, ,podemos determinar
tro del rea rayada en el grfico adjunto? el porcentaje que deja cada una de ellas por debajo o por encima de s, acudiendo
a la tabla de las reas bajo la curva normal?
8.33. Sean X 1 , X 2 , , Xn las puntuaciones directas obtenidas por n personas
en un test de extroversin. Supongamos q ue su distribucin de frecuencias es asi-
mtrica positiva. Transformamos en tpicas las puntuaciones directas anteriores.
Esto supuesto, ser normal (o, al menos, simtr ica) la distribucin de frecuencias
de estas puntuaciones tpicas?
8.34. Transforme en puntuaciones T (normalizadas ) las siguientes puntuaciones
directas:

a) X, n; h) X 11,
~ -
35 5 26 - 28 4
8.24. Hemos aplicado una prueba de memoria a 5.000 varones y a 2.000 mujeres
33 6 23 - 25 8
separadamente. Son normales tanto la distribucin de los varones como la de las 7 20 - 22 10
31
mujeres. Del total de los varones, l.148 superan la media de las mujeres. Adems, 29 12 17 - 19 14
134 mujeres han obtenido puntuaciones superiores a 70. Suponiendo que la me- 27 16 14 - 16 12
dia y la desviacin tpica de los varones valen 54,3 y 5 respectivamente, calcular 25 4 11 - 13 2
la media y la desviacin tpica de las mujeres.
8.25. Un grupo de personas se distribuye normalmente en la va riable X. Para
estas personas el percentil 6 I vale 44 y la desviacin tpica vale 5. Calcular la media
y la desviacin tpica de unas nuevas puntuaciones Y relacionadas con las prime-
ras mediante 4X - 2 Y - 20,4 = O.
8.26. De un grupo de 600 personas, distribuidas normalmen te, 114 obtienen una
puntuacin directa menor que 20. Sabiendo que la varianza vale 16, calcular la
moda de dicha distribucin y el nmero de personas con puntuaciones mayores que
24 y menores
,,.. . que 28.
8.27. '. Las puntuaciones de un grupo de 500 ni os en inteligencia espacial, X, y en
--
-- --- ---- ... ------~--
\.
9
Organizacin de datos e ndices
de tendencia central y variabilidad

9.1. Distribucin conjunta de frecuencias

Hasta aqu hemos considerado una sola variable. Ahora vamos a estudiar con-
juntamente dos variables. Por ejemplo, peso y altura de un grupo de estudian tes,
aptitud para una asignatura y aprovechamiento en la misma, provincia de origen
y carrera estudiada, etc. Con cada persona tenemos dos modalidades, una perte-
neciente a la primera variable y otra a la segunda.
D esde luego, podamos ir estudiando por separado cada uno de los casos po-
sibles: ambas variables nominales, ambas o rdinales, .. . ; una nominal y otra
ordinal, una nominal y otra de intervalos, etc. Sin embargo, no seguiremos es1e
camino por una doble razn . En primer lugar, sera enormemente prolijo irnos
~ I
deteniendo en cada uno de los casos posibles, dado su gran nmero. En segundo
lugar, ello nos llevara a repeticiones superfl uas ya que lo dicho para uno de los casos,
vale p rcticamen te para los resta ntes, salvo diferencias accidentales fci lmen te
comprensibles. Consiguientemente, nos limitaremos por ahora a exponer la distri-
bucin conjunta de frecuencias respecto al caso en que las variables sean estric ta-
mente cuantitativas (es decir, a nivel, al menos, de in tervalos), por ser el ms comn
en Psicologa.
EJEMPW 9.1. Supongamos que 50 personas han obtenido, segn podem os
ver en la tabla de la pgina siguiente, los siguientes resultados en un test de inte-
ligencia abstracta (X) y en una prueba de aritmtica ( Y).
Podemos considerar estas pu ntuaciones tal com o vienen dadas, es decir, no
agrupadas en intervalos ni en X ni en Y. Cada persona aparece con el par de pun-
tuaciones que ha obtenido directamen te en el tesl y en el examen . Pero, tambin,
podemos considerarlas agrupadas en intervalos. Para ello, est udian do por separado
cada una de las dos variahles, agrupa mos sus puntuaciones en intervalos, siguiendo
los criterios ya expuestos para agrupar datos en el caso de una sola variable. El n-
mero de intervalos en cada una de las dos variables puede ser el mism o o distinto.
-.,.~ La amplitud de los in tervalos en una de las dos variables puede ser la misma o dis-
tinta que la a mplitud de los intervalos en la otra. Elijamos p ara X !os intervalos :
160 / Estadistica para Psiclogos Organizacin de datos e indices de tendencia central y variabilidad / 161

- - -- - - - - - -y
X y X y X y X X )'

--
10 51
--
8 51
-13 -51 12- -56 -JO -52
12 51 10 53 19 55 18 55 14 53 5
10 54 9 53 12 53 17 56 16 56
5.
20 56 15 54 11 52 16 57 14 55
13 54 14 56 17 54 18 58 21 57 5
21 58 18 57 16 54 13 53 17 53 5'
13 52 JI 54 10 50 9 51 17 55
5
20 57 9 so 12 55 16 55 15 56
18 56 19 54 20 58 15 53 17 57
19 57 14 52 14 54 15 55 8 52

7- 10, 11 -14, 15-18, 19-22 (con puntos medios 8,5 ; 12,5 ; 16,5 y 20,5, respectivamente) tro ejemplo tendremos 50 puntos. Este conjunto o nube de puntos constituye el
y elijamos para Y los intervalos: 50-52, 53-55, 56-58 (con puntos medios 51, 54 y diagrama de dispersin.
57, respectivamente). Tendremos: Otra manera de representar grficamente los datos no agrupados sera la siguiente.
A cada valor X, le corresponde un intervalo unitario y a cada valor Y otro intervalo
TABLA 9.1 unitario. Es decir, a cada par de puntuaciones ( X ,, Y,) les corresponder un rec-
..
X X
..
tngulo unitario limitado por los intervalos unitarios. Pues bien. sobre cada rectn-
7-10 11- 14 15- 18 19-22 7-10 11 -14 15-18 19-22 gulo unitario podemos levantar un prisma con una altura proporcional al nmero
de personas cuyo par de puntuaciones coincide con el par correspondiente a ese
56-58 // fllJ /// fl{j/ 56-58 o 2 8 6 16
rectngulo unitario. Ntese que la unidad elegida en el eje de las X no tiene por qu
y 22
ser igual que la elegida en el eje de las Y. Si fue ra igual, el rectngulo unitario se
y 53-55 /!/ fllJ /// fllJ /!// /! 53-55 3 8 9 2
convertira en un cuadrado.
50-52 7 5 o o 12 Consideremos ahora los datos agrupados en intervalos. La representacin
50-52 fllJ // fllJ
grfica correspondiente al histograma (propuesto para el caso de una sola variable),
10 15 17 8 50 es la siguiente. El plano quedar dividido en (r) x (s) rectngulos, d onde res el n -
mero de intervalos en X y s el de intervalos en Y. La base de esos rectngulos ser
la amplitud de los intervalos de X . y su altura la amplitud de los intervalos de Y.
En general, tendremos r intervalos en X, y s in tervalos en Y. Llamemos (], , !') Pues bien, sobre cada uno de esos rectngulos (inciden talmente cuadrados) levan-
al par de intervalos i de X y j de Y. A cada (/, , // ) le corresponder una frecuen- tamos un prisma cuya altura sea proporcional a la frecuencia correspondiente a
cia n;; (nmero de o bservaciones con puntuaciones dentro del intervalo i de X y dicho rectngulo. Es decir, dados el intervalo con punto medio X , y el intervalo
dentro del intervalo j de Y). Pues bien, llamaremos distribucin conjunta de fre - con punto medio Y1, la altura ser proporcional a la frecuenc ia de personas que,
cuencias al conjunto de pares de intervalos (11, Ji') y de sus correspondientes fr ecuen- a la vez, se encuentran dentro del intervalo primero y del segundo. En nuestro ejemplo
cias {proporciones o porcentajes). (vase tabla 9.1) tendramos nueve prismas con alturas proporcionales a 2, 8, 6, 3, 8,
9, 2, 7, 5. (En rigor, tendramos doce p rismas, aunque tres de ellos con altura nula.)

9.2. Representacin grfica


9.3. Distribuciones marginales de X e Y
Comencemos considerando las puntuaciones anteriores no agrupadas en in-
tervalos. En este caso a cada puntuacin de X (eje de abscisas) y a cada p untuacin Llamarnos distribucin marginal de X a la distribucin en X de todas las obser-
y (eje ~> o rdenadas), tomadas conjuntamente, les corresponde un punto en el vaciones, independientemente de sus puntuaciones en Y. Viene dada, en la tabla 9.1.
plano,.rpresentante de la persona que ha obtenido esas dos puntuaciones. En nues- por la lila situada en el margen inferior. Es decir, es la siguien te:
162 / Estadistica para Psiclogos Organizacin de datas e in dices de tendencia central y variabi lidad / 163

TABLA 9.2,, 9.4. Distribuciones condicionales de X e Y


X ni x1
--- Llamamos distribucin condicional de X, para Y = Y1, a la distribucin en X
19-22 8 20,5 de todas, y solas, las observa ciones con puntuacin Yk en Y (bajo la condicin de
15-18 17 16,5 tener puntuacin Yk en Y). En la tabla 9.1 te ndrem os tres distribuciones condicio-
11-14 15 12,5 nales de X, correspondientes a Y = 51, Y = 54, Y = 57. Son las siguientes:
7- 10 10 8,5

50 TABLA 9.3

Para Y= 5 1 Para Y= 54 Para Y = 57


Llamamos distribucin marginal de Y a la distribucin en Y de todas las obser-
vaciones, independientemente de sus puntuaciones en X. Viene dada, en la tabla 9.l , X n X; X 11; xi X n1 xi
por la columna situada en el margen derecho. Es decir, es la siguien te:
19-22 o 20,5 19-22 2 20,5 19-22 6 20,5
15-18 o 16,5 15-18 9 16,5 15-18 8 16,5
TABLA 9.2b I 1-14 5 12,5 11-14 8 12,5 11-1 4 2 12,5
7-10 7 8,5 7- 10 3 8.5 7-10 o 8,5
y 11 Y
-- 12 22 16
56-58 16 57
53-55 22 54
50-52 12 51 Llamamos distribucin condicional de Y, para X = Xk, a la distribucin en
Y de todas, y solas, las observaciones con puntuacin Xk en X (bajo la condicin
50 de tener puntuacin Xk en X).
De acuerdo con la tabla 9.1 tendremos cuatro distribuciones condicionales de
Y, correspondientes a X= 8,5, X = 12,5, X= 16,5, X = 20,5. Son las siguientes:
Con la distribucin marginal de X tendremos una media, X, y una varianza,
s;, que llamaremos media y varianza marginales de X.
Con la distribucin marginal de Y tendremos una media, Y, y una varianza,
s;, que llamaremos media y varianza marginales de Y.
TABLA 9.4

De acuerdo con los datos de las tablas 92a y 9.2b, tendremos : Para X = 8,5 = = 16,5
Para X 12,5 Para X Para X = 20,5
x= (10)(8,5) + (15)(12,5) + (17)(16,5) + (8)(20,5) = 717 =
14 34 y n1 Y; y n1
y
j
y n1 Y y n, Y,
50 50 ' - -- - - - - ~-- - - - - - -- - -~
56-58 o 57 56-58 2 57
s; = (10)(8,5)2 + (15)(12,5)2 + (17)(16,5) 2 + (8)(20,5) 2 _ , ) =
0 4 34 2 53. 55 3 54 53-55 8 54
56-58
53-55
8
9
57
54
56-58
53-55
6
2
57
54
50 50-52 7 51 50-52 5 51 50-52 o 51 50-52 o 51
056 5
-
10
-
= 21- 50
- - 205 636 = 15 494
' '
15 17 8

y= (1 2)(51) + (~2)(54) + (16)(57) = 2.712 = 54 24


50 50 ' Con las tres distribuciones condicion a les de X, tendremos tres medias y tres
varianzas que llamarem os medias y varianzas condicionales de X.
s2 = ~2 + (22)(54)2 + (16)(57)2 - (54 242 = 147.348 - 2.941 978 = 4 982 Con las cuatro distribuciones condicionales de Y, tendremos cuatro medias
' 50 ' 50 ' ' Y cuatro varianzas q ue llam aremos medias y varianzas condicionales de Y.
164 / Estadistica para Psiclogos Organizacin de datos e indices de tendencia central y variabilidad / 165

De acuerdo con la tabla 9.3, las tres medias y las tres varianzas condicionales 1 -
(5)(51)2 + (8)(54)2 + (2)(57)2 -(53,40)2 =
Sy,X=l2,S -
S-On las siguientes: 15
42 83 1
Xr =si = (7)(8,5) + (5)(12,5) + (0)(16,5) + (0)(20,5) 122
10, 167
_
-
-
15
_ 2.85 l ,56 = 3,84
12 12
2
x_ = 14318 (0)(5 l ) + (9 )(54 J2 + (8 )( 57 J2 _ (55,4 1J 8)2 =
r- 54
= (3)(8,5) + (8)02,5) + (9)(16,5) + (2)(20,5) = 315
22 22 ,
s;. x~ 16,5
17

x _ = (0)(8,5) + (2)(12,5) + (8)(16,5) + (6)(20,5) = 280 =


17 500
- 52.236 - 3.070,468 = 2,24
- 17
Y - 57 (6 16 ,

s2 = (7)(8,5)2 2 2 2
+ (5)(12,5 ) + (0)(16,5) + (0)(20,5) _ (IO )2 = 2 - (0)(51 )2 + (2)(54)2 + (6){57)2 -(56,25)2 =
Sy, X=l0 . 5 - ~
X, Y=5 1 12 , 167
25 26
87 = : - 3.164,06 = 1,69
= 1.2 - 103 37 = 3 88
12 ' '
Comprobemos ahora cmo la varianza m argin al de X es igual a la media de
s;, r~s 4
2 2
(3)(8,5) + (8)(12,5) + (9)(16,5)
2
+ (2)(20,5) 2 - ( 14 318)2 = las varianzas condicionales de X ms la varianza de las medias condicionales de X y
22 ' cmo la varianza marginal de Y es igual a la media de las varianzas condicionales de Y
ms la varianza de las medias condicionales de Y. Ntese que estas dos relaciones
= 4 -757 ,5 - 205 00 = l l 250 no son m s que una aplicacin de la propiedad 6.3.4.i) de la varianza, donde los
22 ' ' r grupos en que alh se descomponia el grupo to ta l son ahora, bien las distribu-
ciones condicionales de X, bien las distribuciones condicionales de Y .
2 -
Sx,Y - 51
= 2 2 2
(0)(8,5) 2 + (2)(12,5) + (8)(16,5) + (6)(20,5) - (17 500)2
,
= Hemos visto que la var ianza marginal d e X, s;,
vala 15,494. Pues bien :
16
2 ( 16)(17,5 )2
012 -(12)(3,88)
- -+-(22)(1
- --1,25) + d6)(7)
- ~ + -(12)(10,
-- 167)2 + (22)(14,318) +
- -- - - - - - -
= 5 16 - 306 25
'
=7 50 50

- {14 ,34) 2 = 15,496


y _ = (7)(51) + (3)(54) + (0)(57) = 519 = 51 90
10 10 '
X-8,5
Hemos visto que la varianza marginal de Y, s;. vala 4,982. Pues bien:
y = (5)(51) + (8)(54) + (2)(57) = 801 = 53 40
X =l2 ,5 (5 15 , - ~ l~(l_,8_9)~+_(1_5~)(3_,8_4~) _+~(_17~_.2_4~) +
_ ~(8_)_(
1_
,69
~ )+
50
y = (0)(51) + (9)(54) + (8)(57) = 942 = 55.4 118
2 2 2
X = l 6.5 17 17 (10)(51,9) + (1 5)(53,4) + (17)(55,4118)2 + (8)(56,25) _ (5424)2 = 4 983
+ 50 ' ' .
y = (0)(51) + (2)(54) + (6)(57 ) = 450 = 56 25
X = 20 ,5
8 8 ,
EJEMPLO 9.2. Consideremos las p untuaciones de 40 estudiantes de Educaci n
General B sica en dos pruebas de razonamiento (Garca M ndcz, 1976, comunica-
s;,X = 8 ,5 = (7)(51)2 + (3)~:4)2 + (0)(57)2 -(51 ,90)2 = cin personal). La primera (X) mide la capacidad de razonamiento espacial. En ella
se les proponan diversas sucesiones de imgenes, cada una de las cuales repre-
sentaba varias posiciones de un cuerpo geometr ico movindose en el espacio segn
.!' = 26JO955 - 2.693 61
'
= 1 89
, una ley determinada que ellos deban descubrir. La otra prueba ( Y ) era de razona-
166 / Estadistica para Psiclogos Organizacin de datos e mdices de ten dencia central y vari abili dad / 167

mien to abstracto y en ella les eran presentadas a los estudiantes distintas sucesiones Distribuciones condicionales de X.
de figuras planas, pidindoles que averiguaran en cada sucesin cul era la ley de
transformacin de unas figuras en otras.
Para Y= 12 Para Y = 21 Para Y = 30 Para Y = 39
-
X y X y X y X y X n, x, X n, X X n, x, X ,,, X
- - -- - - -- ---
7 22 14 31 9 27 11 29 )5-20 o 17,5 15-20 2 17,5 15-20 6 17,5 15-20 4 17,5
5 8 6 21 15 35 8 JU 9-14 1 11.5 9-14 I 11 ,5 9- 14 13 11 ,5 9-14 3 11,5
9 9 17 32 13 31 3 9 3-8 5 5.5 3-8 5 5,5 3-8 o 5,5 3-8 o 5,5
9 31 4 11 16 34 10 27 - --
13 30 8 12 16 31 14 36 6 8 19 7
16 35 11 37 16 35 18 22
12 29 12 36 19 37 18 33
12 31 14 34 6 17 16 34 Xr - 12 = 6,50 XY 21 = 9,25 Xr . ' = 13,3947 X,=, = 14 ,9286
20 25 13 20 16 29 14
10
29
26
s;,r "" 12 = 5.00 s;, Y ll = 26,44 s;, Y JO = 7,78 s;, Y 39 = 8,82
10 30 3 23 5 25
-- --
Elijamos para X los intervalos (3-8), (9-14), (15-20) y para Y los intervalos Distribuciones condicionales de Y.
(8- 16), (17-25), (26-34), (35-43).
Tendremos la tabla siguiente:
Para X = 5,5 Para X= 11.5 Para X = 17,5
X
y 11 Y, y 11 Y, y n, y
J
3-8 9- 14 15-20 - -- -- -
35-43 o 39 35-43 3 39 35-43 4 39
35-43 o 3 4 7 26-34 o 30 26-34 13 30 26-34 6 30
17- 25 5 21 17-25 l 21 17-25 2 21
26-34 o 13 6 19 8-16 5 12 8-16 l 12 8- 16 o 12
y - - - - - -- - -
17-25 5 l 2 8 10 18 12

8-16 5 I o 6
l\.,., = 16,50 yX= l 1, 5 = 30 >'x =n,, = 31 ,5
10 18 12 40 s;.hs., = 20,25 s;. X = ll ,5 = 36 s;,x. 11., = 38,25

Distribuciones marginales de X y de Y
Comprobemos cmo la varianza marginal de X es igual a la media de las va rian-
y zas condicionales de X ms la varianza de las medias condicionales de X y cmo
a) de X: X ", x, h) de Y: ", y
J la varianza marginal de Y es igual a la media de las var ianzas condicionales de Y
ms la varianza de las medias condicionales de Y.
15-20 12 17,5 35-43 7 39
9-14 18 11 ,5 26-34 19 30 Hemos visto que la varianza marginal de X, vala 19, 71. Pues bien: s;,
3-8 JO 5,5 17-25 8 21
8- 16 6 12 (6)(5) + (8)(26,44) + (19)(7,78) + (7)(8,82)
40 40 +
40
2 2 2
,.f' (6)(6,5)2 + (8)(9,25 ) + (19)(13,3947) + (7)(14,9286} - (] 1 80 )2 = 19 7 1
x= 11,80 s; = 19,7 1 Y = 27,075 s; = 70,42 + 40 ' '
168 / Estadistica para Psiclogos Orga nizacin de datos e in dices de tendenci a central y var iabili dad / 169

Hemos visto que la varianza marginal de Y, s;, vala 70,42. Pues bien: x, Y, X,Y, x, - i Y,- y {X, - X)(Y, - Y)
2
(10)(20,25) + (18)(36) + (12)(38,25) (10)(16,5)2 + (18)(30) + ( 12)(31,5)
2
11 7 77 0,53 -5,24 - 2,7772
40 + 40 - 26 23 598 15,53 10,76 167,1028
9 12 108 - 1,47 -0,24 0,3528
- (27,075) 2 = 70,42 3 14 42 -7,47 1,76 - 13,1472 178
13 10 130 2,53 - 2,24 -5,6672 x= 17
= 10 47
'
5 10 50 -5,47 - 2,24 12,2528
18 16 288 7,53 3,76 28,3128 208
15 12 180 4,53 -0,24 -1 ,0872 Y= = 12 24
17 '
9 .5. Covarianza de X e Y 13 14 182 2,53 1,76 4,4528
12 15 180 1,53 2 ,76 4,2228 348,1 176
12 15 180 1,53 2 ,76 4,2228 s,, = - 1- 7 - = 20,4775
9.5.1. Definicin o 3 o -1 0,47 -9,24 96,7428
9 12 108 - 1,47 - 0,24 0,3528 2.526 178 208
Media aritmtica de los productos entre la diferencia (X, - X ) y la diferencia 13
9
14
14
182
126
2,53
- 1,47
1,76
1,76
4 ,4528
-2,5872
= u - 1111
( Y, - Y) correspondientes a cada uno de los n elementos que componen un grupo. 7 11 77 - 3,47 -1,24 4 ,3028 = 20,4775
La designaremos por cov(X, Y) o por sxr Por tanto, 3 6 18 -7,47 -6,24 46,6128

n 178 208 2.526 0,01 0,02 348, 11 76

cov(X, Y)= s
X)' -
_ li (X, - X) (Y, - Y)
ll

n EJEMPLO 9.4. Calculemos s, 1 a partir de los siguientes datos:


I X;Y,
= _;-_i ~ - XY (9.l )
ll X y XY (X- X) (Y- Y) (X - X) (Y- Y)

tf
je 1 i=:. J
n (X. - X) ( Y, - Y)
2
4
4
10
9
10
20
36
40
- 3
-1
- 1
1
o
1
- 3
o
- 1
65
s,,. = 20 = 3,25
cov(X, Y) = sx,. n 2 7 14 -3 -2 6
965
8 13 104 3 4 12 = - (5)(9) =
' r
I 11,,X;Y, 4 5 20 -1 -4 4 20
_ gy 9 12 108 4 3 12
j = 11 a 1
(9.2) 4 11 44 -1 2 -2 = 4 8,25 - 45 = 3,25
n -2 - 1 2
3 8 24
8 10 80 3 1 3
La frmula (9. 1) es la apropiada para datos no agrupados en in tervalos y la 7 11 77 2 2 4
(9.2) es la apropiada para datos agrupados en intervalos. Se entiende que , es el 5 8 40 o - 1 o
nmero de intervalos en que ha sido clasificada la variable X, s el nmero de inter- 6 13 78 l 4 4
1 5 5 -4 -4 16
valos en que ha sido clasificada la variable Y y n,i es el nmero de observaciones 2 6 12 -3 - 3 9
dentro del intervalo i en la variable X y del intervalo j en la varia bl e Y. 8 9 72 3 o o
5 6 30 o - 3 o
5 ll 55 o 2 o
6 6 36 1 - 3 - 3
9.5.2. Clculo 7 10 70 2 1 2

Aplicacin de las frm ulas (9. l ) y (9.2). 100 180 965 o o 65


EJEMPLO 9.3 . Calculemos la covarianza entre el rendimiento en lectura y el
rendimiento en aritmtica a partir de los siguientes datos : X =5 Y=9
170 / Estadstica para Psiclogos Organizacin de datos e ndices d e ten den ci a central y variabi/Jdad / 171

Agrupemos en intervalos los datos anteriores del modo siguiente : En este caso podemos agrupar los da tos en intervalos de amplitud unidad del
modo siguiente:
X
X
1-3 4-6 7-9
2 3

9-13 l 5 6 12 x = (5)(2) + (9)(5) ~ ~)(8) = 103 =


Y 4-8 20 20
5 15
'
o 1 ~ 4
4 4 o 8
2 o 3- 3 -~ . (4)(1) + (1 0)(2 ) + (6 )(3 ) 42
(8)(6) + (12)(11) X = 20 = 20 = 2l
5 9 6 20
_ 180
Y =-'--'--'-----=- = - = 9 y --+-
20 20 2 6 o 1 8 y = (2)(0) + (8)(1) + (6 )(2) + (4)(3) = ~ = 16
20 20 '
o 2 o o 1 2
= (4)(2)(6) + (4)(5)(6) + (0)(8)(6) + (1)(2)(11) + (5)(5)(11) + (6)(8)(11 ) _ 5)(9) = 6 I 20
s,, 20 (5, 1 4 10

= 49,65 - 46,35 = 3,30

EJEMPLO 9.5. Calculemos s,,. a partir del cuadro siguiente :


~.= (0)(1)(3)+ ())(2)(3) + (3)(3)(3) + (0)( 1)(2) + (3)(2)(2) + (3)( 3)(2)
w +
(2)(1)(1) + (6)(2)(1) + (0)(3)(1) + (2)(1)(0) + (0)(2)(0) + (0)(3 )(0) -2 1( 1 6) =
+ 20 ' '
X y XY (X-X) (Y - Y) (X - X)(Y - Y)
= -77 - 3,36 = 3,85 - 3,36 = 0,49
o o - 1,1 -1,6 1,76 20
2 1 2 - 0, 1 - 0,6 0,06
2 1 2 - 0,1 - 0,6 0,06 Ahora el resultado es el mismo agrupando los datos que sin agruparlos porque
2 2 4 - 0,1 0,4 - 0,04 al tener los intervalos amplitud unidad, cada puntuacin coincidir con el punto
3 3 9 0,9 1,4 1,26
medio del intervalo (unitario) dentro del cual se encuentra.
1 1 - 1,1 - 0,6 0,66
2 1 2 -0, l - 0 ,6 0,06 9 80
s ,, =
20 = 049
'
3 2 6 0,9 0,4 0,36
3 3 9 0,9 1,4 1,26 9.5.3. Propiedades
77
=
20 - =
2 2 4 - 0 ,1 0,4 -0,04 (2, 1)(1,6)
2 3 6 - 0, 1 1,4 -0,14 a) Sean V, = aX, + b y W, = cY1 + d, siendo a, b, e y d cuatro constantes
2 1 2 - 0, 1 - 0,6 0,06 arbitrarias. Pues bien, s,."' = (ac) s,,..
- 1,J -0,6 0,66 = 3,85 - 3,36 = 0,49 En efec to:
2 1 2 -0,J - 0,6 0,06
3 3 9 0,9 1,4 1,26
1 o o -1 ,1 -1 ,6 1,76 l:(V - V ) (W, - W) !: [ (aX, + h) - (a X + b)][(c Y, + d) - (cY + d)]
3 2 6 0,9 0,4 0,36 S L' lll =
n
= n
=
2 1 2 - 0, 1 - 0,6 0,06
3 2 6 0,9 0,4 0,36
2 2 4 - 0, 1 0,4 - 0,04
= !: (aX , - a X) (c Y, - cY) = l:a (X, - X )c( Y, - Y ) =
n 11

o.o
42 32 77
-~ 9,80
= ac !: (X, - X) ( Y, - Y)
= (ac) s
x = 2,1 Y= 1,6
/1 X )'
172 / Estadistica para Psiclogos Organizacin de datos e indices de tend encia cen tral y var,abilidad / 173

9.6. Transformemos los datos de la tabla 9.5 mediante la transfor-


EJEMPLO
macin V = 2X, + 1, W, = 3 Y, - 8 y comprobemos cmo, en efecto, s.,,= (2)(3)s, ,. =!
n
[
j :; 1 i == 1
(X,, - i ) ( Y.; - Y;) +
j:::: I
(Xj - X) I(
i 1"1
Y,; -

~
TABLA 9.5 Y)+ r (Y - Y) (X,; - X) + Lr 11; (X - X) (Y; - Y)
]

X, Y,
-
X,Y, V, w, V1W
.
I I
.,
J :::: I

(X,; -
i== l

X) ( Y,; - Y)
. j =- 1

n1 (X, - X) (Y1 - Y)
' = 1 f:;;:. 1 + = 1
3 5 15 x = ~4 = 4 7 7 49 -
V=
36
= 9
4 n n
3 3 3 1 3
pues:
5 5 25 -
y = -
24
=6
11 7 77
W = ~ =IO
~, ;
7 11 77
4
15 25 375
4 L ( Xi} - X;)= L (}',; - Y)= o
i==-1 I= 1
16 24 120 36 40 504
para
j = 1, 2, . . . , r
120
s,, = 4 - (4)(6) =6 s,.,.., -_ 504
4 _ (9 )(10) = 36 Pero :
r
, - ) (Y - y) n(X1 - X) ( Y1 - Y)
Es decir :
L
i= l ( X,; - X ij J = COV;(X, Y) y =1

11 n
s,.~ = 36 = (2)(3)(6) = (2 )(3) s,, = cov(X;, 1\ )

b) Sean : Por tanto,




1
r
n cov1 (X , Y)
r
n1 (X - X) ( Y1 - Y)
X 11, X 21, , Xn, t e Y, 1 , Y2 1 , . , Y.,1 las puntuaciones de n 1 personas
en dos variables X e Y.
cov(X, Y) = = 1 + ~=~1- -- -- --
n n
X 12 , X 22 , . , x.,2 e Y 12, Y 22, , Y. , 2 las puntuaciones de n 2 personas
en dos variables X e Y. En conclusin, la covarianza del grupo total es igual a la media de las covarian-
zas, ms la covarian za de las medias .
X 1 ,, X 2 ,, , x ., e Y 1 ,, Y 1 ,, , Y.,, las puntuaciones de n, personas
EJEMPLO 9.6. Consid eremos el siguiente grupo total compuesto por los tres
en d os variables X e Y.
Sean ..\', X1 , . . , X, e 5\, Y2 , . , Y, las medias de cada uno de los, grupos subgrupos siguien tes:
en X y en Y.
Sean cov(X, Y), cov2 (X, Y), . . . , cov ,(X, Y) las covarianzas entre X e Y res- G rupo 1.0 n1 =4 G rupo 2.0 n2 = 3
pecto al grupo primero, al segundo, . . . , al r .
Sean X e Y las medias en X y en Y del grupo total. Sea cov (X, Y) la covarianza
1
x, Y, X 1 Y1 X2 Y, X2 Y2
entre X e Y respecto al grupo total. !
En este supuesto, 2 4 8 o 2 o
o 2 o 1 2 2
4 4 16 5 5 25
cov( X , Y) =-
J
n
'
i "" l i >= t
~
( X,1 - X) ( YiJ - Y) = -
n
J
'
i=l i = t
f [(X;; -

X) + 6
--
10 60
6 9 27
12 20 84 x, = 2 :92 =3
~.,-t"
+ (X1 - X)] [ (Y,1 - Y1) + (Y1 - Y)] =
x1 =3 :91 = 5
174 / Estadistica para Psiclogos Organizacin de daros e indices de rendenc,a central y variabi lidad / 175

Grupo 3.0 n3 =5 Grupo total 11 = 12 Comprobamos cmo, en efecto:

X3 Y, X3Y3 X y XY

o 2 o 2 4 , , - - - y - Y)
2 o o o 2
8
o ni cov,(X, Y) -~i n(X X) ( , _ 220 + 13 = 233 = cov(X, Y)
3 4 12 4 4 16
1
n + - n - 48 48 48
5 6 30 6 IO 60
5 8 40 o 2 o
1 2 2 NOTA
15 20 82 5 5 25
X3 =3 >\ = 4 o 2 o Si X = Y1 , X 2 = Y2 , , x. = Y., las covarianzas se convertiran en varan
1
2 o o zas y la propiedad acabada de demostrar para las covarianzas quedara traducida
3 4 12 as: la varianza del grupo total es igual a la media de las varianzas ms la varianza
5 6 30 de las medias, propiedad de las varianzas que ya conocam os (vase 6.3.4.i).
5 8 40

33 49 193
49
X =~ Y=- 9.6. Resumen: Definiciones y frmulas
12 12

Distribucin conjunta de f recuencias (dos varab/C's): Supuestas clasificadas n


observaciones en r intervalos (respecto a una variable X) y en s intervalos (respecto
193 33 49 233
cov( X, Y)= - - - - = (2.316 - 1.617)/144 = 699/1 44 = - a una variable Y), tendremos (r) x (s) pares de intervalos (/,, 1;). Pues bien, llama-
12 12 12 48 remos distribucin conjunta de frecuencias al conjunto de esos (r) x (s) pares de
84 intervalos U,, 1; y de las frecuencias (proporciones o porcentaJes) correspondien-
COV(X, Y)= 4 - (3)(5) = 21 - 15 =6 tes a cada uno de ellos.
Distribucin marginal de X: Distribucin en X de todas las observaciones, in-
27 dependientemente de sus puntuaciones en Y .
COV,z(X, Y) =- - (2)(3) = 9 - 6 = 3 A la media, X, y a la va rianza , s;,
de esta distribucin las llamaremos media
3
y varianza marginales d e X.
82 Dislribucin marginal dC' Y: D istribucin en Y de todas las observaciones,
COV3(X, Y)= -
5
- (3)(4) = 16,4 - 12 = 4,4
independientemente d e sus puntuaciones en X.
A la media, Y, y a la varianza, s;,
de esta distribucin las lla maremos media
' ncov(X, Y) y varian7,3 ma rginales de Y.
o (4)(6) + (3)(3) + (5)(4,4) = 55 = 220 Distribucin condicional de X (para Y = Y.): Distri bucin en X de todas, y
11 12 12 48 solas, las observaciones con puntuacin Y = Y1 .
A la media, Xr=r,, y a la varianza, .~;_r=r, las llamaremos media y varianza
' n(X - X) (Y - condicion ales de X (para Y = Y1 ).
= l
Y) = -1 [ (4) ( 3 - -33)
- ( 5 - -49) + Distribucin condicional de Y (para X= Xd: D istribucin en Y de todas, y solas.
n 12 12 12 las observaciones con puntuacin X = x .
s;.
+(3) (2-:~) (3-;n+ (5)(3_~~) (4 - ;~)J= A la media, Yx = x., y a la varianza,
condicion ales de Y (para X = X.).
x = x., las llam arem os m edia y varia nza

Cornrianza de X e Y: Media a ritmtica de los productos entre la diferencia


f = _I__ [132 + 35 1 - 15] = 468 = ~ (X, - X) y la diferencia ( Y, - f') correspondientes a cada \rno de los n elementos
que componen un gru po. La designaremos por cov(X. Y) o por s,,.. Por tanto:
12 144 l .728 48
176 / Estadstica para Psiclogos Organizacin de datos e indices de tendencia central y variabilidad / 177

cov(X, Y)= sx, = :t (X, - X)(Y, - Y)= :tX,Y, - XY X


n n
(para datos no agrupados en intervalos)
9,5. A partir del cuadro siguiente, calcular: 1-3 1 4-6 1 7-9
a) Las medias marginales de X y de Y. 9-1 l [ 15 20
X Y) _ _ :t :t nu (X, - X) ( Y - Y) _ :t :t nuX, Y, _ X y b) La media condicional de X para Y = 4. 1 o __s_ --:7
COV( ' = sx, - n - n e) La media condicional de Y para X = 8. 6-8 i 5 j 13 6 1 24
d) Las varianzas marginales d e X y de Y.
(para da tos agrupados en in tervalos) e) La varianza condicional d e X para Y = 4. Y ~ - s 1o ~-;-o-
/) La varianza condicional de Y para X = 8
g) La covarianza de X e Y. 0 -2 --;-; -1 6 o 16
EJERCICIOS
20 ! 34 1 26 1 80

9.1. A partir de los datos siguientes. construir una tabla de frecuencias tal que en la
variable X existan tres intervalos de amplitud 4 y en la variable Y existan dos inter-
valos de amplitud 5. Dibujar el correspondiente diagrama de dispersin . n "
9.6. Demostrar que (X, - X)(}, - f) = X,Y, - nXY.
,~ 1 r: = l

~
X y X y X y X y 9.7. Demostrarque ' n,;(X,-X) ( Y; - Y)= ' ;_J.
n,; X , Y1 - nXY.
--- Je 1 i= l j~ 1 i= I

8 15 12 14 8 10 7 7 9.8. Sea un grupo compuesto de n 1 personas con medias X1 e l' en dos variables
12 11 6 12 4 10 2 8
X e Y.
13 13 4 8 3 7 10 14
Sea otro grupo compuesto de n2 personas con medias i 2 e f 2 en dos varia-
8 13 3 6 12 15 5 9
9 14 JI 12 3 7 5 bles X e Y.
Sean cov,(X, Y) y cov2 (X, Y) las covarianzas de X e Y para el grupo prime-
ro y para el grupo segundo.
Sea cov(X, }') la covarianza de X e r para el grupo to tal.
9.2. A partir de los datos anteriores (sin agrupar), calcular la covarianza de X e Y. Esto supuesto, demostrar que
9.3. A partir de los datos anteriores (agrupados segn 9.1), calcular:
cov(X, Y)= _ l _ _ [n 1 cov, (X, Y)+ n2 covz( X, Y) +111n2(l\ - X2 ) (Y1 - l\ )]
a) Las medias marginales de X y de Y. 11 1 + 11 2 n 1 + 11 2
b) Las medias condicionales de X y de Y.
e) Las varianzas marginales de X y de Y.
d) Las varianzas condicionales de X y de Y. 9.9. Comprobar la propiedad an terior con el ejemplo siguiente :
e) La covarianza de X e Y.
X
Grupo l.0 Grupo 2. 0 Grupo total
2 4 X y X y X y
9.4. A partir del cuadro siguiente, calcular:
--- - -- --- -
a) Las medias marginales de X y de Y. 8 36 44 80 2 l 8 6 2 l
b) Las medias condicionales de X y de Y. y 6 3 14 10 6 3
e) Las varianzas marginales de X y de Y. 5 4 16 20 JO 5 --- 10 5
d) Las varianzas condicionales de X y de Y. 8 6
e) 1.a covarianza de X e Y. 40 60 100 14 10
178 / Estadistica para Psiclogos

9.10. Sabiendo que X = 6, f


tan en el cuadro siguiente:
= 8, cov(X, Y) = 13, poner los va lores que fa _
10
X y XY Relacin (lineal) entre dos variables
2 8
4
80
10

10.1. Idea general

Intentamos medir la posible relacin entre d os variables. Estudiaremos bajo


el ttulo correlacin los problemas referentes a la variacin conjunta de dos vana-
bles, su intensidad y su sentido (positivo o negativo ). Estudiarem os bajo el ttulo
<<regresim, los problemas refe rentes a la prediccin o pronstico de los resultados
en una de las dos varia bles, conocidos los resultados en la otra.
Diremos que existe correlacin entre dos variables. si cierta o ciertas modali-
dades de una de las dos variables estn ligad as a cierta o ciertas modalidades de la
otra. As, a nivel n ominal, diremos que existe correlacin entre el lugar de origen y la
carrera universitaria elegida si, sistemticamente, las personas de cierta o ciertas
provincias (diversas moda lidades de la variable lugar de origen) tienden a estudiar
cierta o cier tas carreras universitarias (diversas modalidades de la variable carrera
universitaria). As, por ejemplo, los de la regin A estudian preferen temente Econ o-
ma, los de la B Medicina, los de la C Filosola, etc. La idea de correlacin apa rece
ms clara a nivel de intervalos. Diremos que existe correlacin positiva entre el peso
y la altura, si los de mucho peso tienden a ser altos (y recprocamente): si los de
peso medio, tienden a ser medianamente altos (y recprocamente) ; si los de poco peso,
tienden a ser bajos (y recprocamente). Diremos que existe, tambin, correlacin
positiva entre un test de aptitud, X , y el rendimiento en cierta asignatura, Y, si los
.alumnos con puntuaciones altas en X, tienden a a ser altos en Y ; si los alumnos con
puntuaciones medias en X, tienden a ser medios en Y; si los alumnos con puntua-
ciones bajas en X, tienden a ser bajos en Y. Existe una correlacin negativa (per-
fecta) entre la velocidad media a la que hemos recorrido cierta distancia y el tiempo
empleado en recorrerla. A velocidad alta, corto tiempo ; a velocidad baj a, largo
tiempo.
Comenzaremos con variables cuantitativas. Ms adelan te consideraremos va-
riables ordinales y variables nomina les.
En este captulo vamos a introducir un ndice que nos mida el grado de corre-
lacin en tre dos variables, X e Y, pero limi tndon os a variables cuantita tivas y que,
adems, estn relacionadas linealmente. Es decir, ta les q ue los puntos del diagrama
180 / Estadistica para Psiclogos Relacin /lineal) entre dos vanables / 181

de dispersin correspondiente a X e Y estn situados aproximadamente a lo largo de van de O a 100. Supongamos ahora los dos cuadros siguientes, el primero bajo la
una lnea recta. Este ndice va a ser el coeficiente de correlacin de Pearson y que condicin a) y el segundo bajo la condicin h ). Ambos son equivalentes. Slo di-
designaremos por r,,. Histricamente, la regresin aparece antes que la correlacin fieren en la unidad de medida elegida.
y, desde luego, tiene sus ventajas definir r,i a partir de la regresin. Noso tros, sin
embargo, por razones didcticas, propondremos r,, antes de introducir las rectas
de regresin. Con todo, una vez introducidas dichas rectas, volveremos a redefi. y (X-X) (Y- Y) (X-X)(Y - Y) X r (X - X ) 1r - Y) (X - X )( Y - Y)
X
nir r,)', dentro del contexto de la regresin, para alcanzar una idea ms clara y ms
cabal del mismo. 8 9 1,5 2 3 80 90 15 20 300
6 5 -0,5 -2 1 60 50 -5 -20 100
7 8 0,5 1 0,5 70 80 5 10 50
5 6 - 1,5 -1 1,5 50 60 -1 5 - 10 150
10.2. Coeficiente de correlacin de Pearson
26 28 6 260 280 600

10.2.1. Definicin s,, = 6/4 = 1,5 s., = 600/ 4 = 150

Segn lo indicado, la correlacin entre X e res positiva cuando X e Y cavaran Teniendo en cuenta el cuadro de la derecha, s,)' vale 100 veces ms que consi-
en el mismo sentido, es decir, cuando a estar por encima de la media en X correspon- derando el de la izquierda, por el mero hecho de haber elegido unidades de medida
de estar, tambin, por encima de la media en Y, y cuando a estar por debajo de la distintas.
media en X corresponde estar, tambin, por debajo de la media en Y. La corre- En segundo lugar, es algo discutible la interpretacin de los n meros 6 y 600,
lacin entre X e Y es negativa cuando covaran en sentido opuesto, es decir, cuando como suma que son de productos cuyo par de factores representan cosas de natura-
a estar por encima de la media en X corresponde estar por debajo de la media en leza distinta.
Y, y cuando a estar por debajo de la media en X corresponde estar por encima de Para evitar estas dificultades, una tctica obvia es dividir (X - X ) por s, e
la media en Y. La correlacin es nula cuando no cavaran en ninguno de los dos (Y - Y) por s)'" Segn sabemos, (X - X) y s, vienen dadas en una misma unidad
sentidos, es decir, cuando a estar por encima de la meda en X corresponde tanto de medida. Por tanto, el cociente (X - X )/s, es el mismo, sea cual sea la unidad de
estar por encima como por debajo de la media en Y, e, igualmente, cuando a estar medida elegida para medir la variable X. As, es fci l comprobar cmo en el cuadro
por debajo de la media en X corresponde tanto estar por encima como por debajo de la izquierda s, = 1,118 y cmo en el cuadro de la derecha s, = 11, 18. De donde
de la meda en Y. Por todo ello, la covarianza parece ser un ndice apropiado para se deduce que 1,5/ 1,118 = 15/ 11,18, -0,5/l,118 = -5/11,18, etc. De modo an-
medir la correlacin. En efecto, en el caso de correlacin positiva, (X - .X)e (Y - Y) logo es fcil comprobar cmo en el cuadro de la izquierda si, = 1,581 y cmo en el
sern para todas o casi todas las observaciones del mismo signo y, por tanto, su cuadro de la derecha s, = 15,81. De donde se deduce que 2/J,581 = 20/ 15,81,
producto ser positivo ; consiguientemente, s,i = E (X - X)( r - Y)/n ser posi- -2/ 1,581 = - 20/ 15,81, etc. En conclusin, L (X - X ) (Y - Y)/s,sl' es invariante
tiva. Por el contrario, en el caso de correlacin negativa, (X - X) e (Y - Y) sern, frente a cualquier cambio de unidad de medida. As, en nuestro ejemplo,
para todas o casi todas las observaciones de distinto signo y, por tanto, su producto
(X - X) ( Y - Y) ser negativo ; consiguientemente, s,, = E (X - X) ( Y - Y)/n 6/ (1 ,118)(1,581) = 600/( 11.1 8)( 15,81)
ser negativa. Finalmente, en el caso de correlacin nula, aproximadamente, para
la mitad de observaciones, (X - X) e ( Y - Y) sern del mismo signo y para la Por otra parte, tanto (X - X) como s, son nmeros concretos q ue representan
otra mitad, lo sern de distinto signo; por tanto, ms o tnenos, la mitad de los pro- alguna caracters tica (ambos la misma) como peso, aprovechamiento en Es-
ductos (X - X) ( Y - f') sern positivos y la otra mitad sern negativos. Consiguien- tadstica, actitud frente a la guerra, etc., y ambos vienen dados en una misma
temente, s,l' ser nula o muy prxima a cero. En conclusin, a correlacin positiva, unidad de medida elegida arbitrariamente. Mientras que(X - X )/s, es un mero
negativa o nula, corresponde covarianza positiva, negativa o nula, respectivamente. nmero abstracto que se limita a indicar cuntas veces el numerador contiene al
Sin embargo, s,,, como indice de correlacin presenta algunos inconvenientes. denominador, independientemente de lo que stos signifiquen. Lo mismo sucede con
En primer lugar, el valor de s,l' es funcin de las unidades de medida elegidas (Y - Y)/s,.
para X e Y. Supongamos, por ejemplo, que X es aprovechamiento en gramtica . (X - X) (Y - Y) .
Finalmente, - - - - - - - es un numero abstracto, como producto de
e Y-,-ts aprovechamiento en aritmtica. Calculemos s,i bajo dos condiciones sx s,.
distintas : a) las puntuaciones posibles van de O a 10, h) las puntuaciones posibles dos nmeros abstractos.
182 / Estadistica para Psiclogos Relacin (lineal) entre dos var,ables / 183

Por todas estas razones, en vez de usar EJEMPLO IO. l. Calculemos rx,. a partir de los cinco pares de puntuaciones
siguientes:
:E (X - X) ( Y - Y)
sX)' = - - n

como indice de correlacin, usaremos X y xi y2 XY X y x' yl xy z, Z~ Z>,

o o o o o
r(X - X)(Y- >') U~_- X)(Y- >')
3
5 12
9 9
25
81
144
27
60
-1
l 3
l
1 9 3
-0,5
0,5 0,5 0,25
Sx S. - = n = ~
(10.1) 4 o 16 o o o -9 o 81 o o - 1,5 o
n s,s,. s,s,. 7 18 49 324 126 3 9 9 81 27 1,5 1,5 2,25
1 6 l 36 6 - 3 -3 9 9 9 - 1,5 -0,5 0,75
Le llamaremos coeficiente de correlacin de Pearson y le designaremos por,,,.
La frmula ( I0.1) adopta diversas versiones, todas ellas equivalentes: 20 45 100 585 219 o o 20 180 39 o o 3,25

r (X - X) ( Y - Y) L(X - X)(Y-Y) s,,. = 39/ 5 = 7,8 s, = .fios = 2 s, = Ji80/5 = 6


rxy - ~ - - - n_- - = s. s' = L Zxz,. (1 0.2)
s,s,. s,s,. n n

!: (X - X) ( Y - Y) Segn (10.1):

=~
n !: (X - X) ( Y - Y) = !: xy =
'xy s.s, = - - -SxSy
- -- - n s,s,
(10.3) 7,8 = 0,65
n Sxs, r,,. = (2)(6)

LX}' Segn (10.2):


(10.3')
./!: x2 fty2
3,25
,., = ~5~
= 0,65
:E(X-X)(Y- Y)
n :l:XY- nXY Segn (10.3 ):
y.X)'=~=
s,s, s,s, n,L~-~~,!: ~-~W 39 39
~ ~ r ,= - - = ~ = O 65
X) (5)(2)(6) 60 ,
nLXY- :l:X!: Y (1 0.4) Segn (10.3'):
./n r X 2
- (r X) 2
..jn !: Y 2
- (L Y) 2
39 39
, .,. = fioJIBO = 60 = 0,65
10.2.2. C lculo
Segn (10.4):
a) Daros no agrupados
r = (5)(219) - (20)(45 ) = 1.095 - 900 = -~ = O65
~ a aplicacin de las frmulas anteriores, a los datos originales, es decir, X )' ../(5)(100) - 202../(5)(585 ) - 452 Jtoofioo (10)(30 ) ,
considerando una a una las puntuaciones dadas.
184 / Estadistica para Psiclogos Relacin (lineal/ entre dos variables / 185

a) Datos agrupados en intervalos La fila nx est formada por las frecuencias marginales de X. (5, 5, 10, 6, 4). La
fila X est formada por los puntos medios de los intervalos en los que ha sido dis-
rxy -_ --;===n=L=I:
= n='
x'=.X
==Y= -=-
(!:-;=
nx~X=)==('=!:=n~,=Y=')= tribuida la variable X (1, 4, 7, JO, 13). La columna n, est formada por las frecuencias
(10.5)
Jn I: n,X2 - (!: nxXJ2 Jn !: n,.Y2 - (!: n, Y) 2 marginales de Y (10, 12, 8). La columna Y est formada por los puntos medios
Donde: de Jos intervalos en los que ha sido distribuida la variable Y (2, 7, 12).
nxX consta de los productos de la fila nx por la lila X; (5)(1 ), (5)(4 ), (10)(7),
n,: representa el nmero de observaciones o frecuencias marginales de X. (6)(10), (4)( 13).
11,. : representa el nmero de o bservaciones o frecuencias margi nales de Y. nxX2 consta de los productos de la fila nxX por la lila X: (5)( 1), (20)(4), (70)(7),
11,_.: representa el nmero de observaciones dentro de cada una de las casi- 1
(60)(10), (52)(13).
llas interiores de la tabla de frecuencias. Es decir, el nmero de observaciones n,Y consta de los productos de la columna n,. por la columna Y: (8 )(1 2), (12)(7),
que simultneamente pertenecen a un cierto intervalo de la variable X y a otro
de la variable Y. {10)(2).
n,Y2 consta de los productos de la columna n,.Y por la columna Y: (96)(1 2),
EJEMPLO 10.2. Calculemos r xy a partir de la siguiente distribucin conjunta (84)(7), (20)(2).
de frecuencias. En cada una de las 15 casillas interiores d e la tabla anterior tenemos tres nmeros.
X El central indica el nmero de observaciones o frecuencia de cada casilla. El situa-
do arriba a la derecha es el producto de los puntos medios de los dos intervalos
0-2 3-5 6-8 9- 11 12-14 11,. correspondientes a cada casilla : (1)(2), (1)(7), (1)(12), (4)(2), (4)(7), (4)( 12), .. . ,
(13)(2), (13)(7), (1 3)(12). El situado abajo a la izquierda es el producto de la fre-
10-14 o o 2 2 4 8 cuencia, n.,., de cada casilla por el XY correspondiente a la misma casilla : (2)(4),
(7)(1), (12)(0), . .. , (26)(0), (91)(0), (156)(4).
y
5-9 l 2 6 3 o 12
La columna n,,X Y consta de la suma de los nmeros n,,x >, los situados abajo
a la izquierda, pertenecientes a las casillas de la primera lila, (1.032 ), de la suma
0-4 4 3 2 1 o 10
de los nmeros nx,.XY pertenecientes a las casillas de la segunda lila (567), de la suma
n, 5 5 10 6 4 30 de los nmeros nx,.XY pertenecientes a las casillas de la tercera fila (80 ).
Por consiguiente, aplicando la frmula (1 0.5 ):

Para calcular rx, organicemos los datos anteriores del modo siguiente. r = (30)(1.679) - (207)(200) = 8.970 =
0 688
X xy )(30)(1.85 ]) - (207) 2 J(30)(1.780) - (200)2 13.035,5 '
f,
t 0-2 3-5 6-8 9-1 l 12-14 ", Y n, Y n,.Y2 n,..TXY
12 48 84 120 156
10-14 o o 2 2 4 8 12 96 1.152 1.032 10.2.3. Propiedades
o o 168 240 624
7 28 49 70 91 a) El coeficiente de correlacin de Pearson no puede valer menos que -1 ni
y 5-9 1 2 6 3 o 12 7 84 588 567 ms que l. Es decir, -1 ~ rx, ~ l.
7 56 294 210 o
t- - r-- - En efecto, sean u = zx + z,, u = Zx - z,., donde z, y z, son puntuaciones
2 8 14 20 26
-- tpicas.
0-4 4 3 2 o
8 24
1 10 2 20 40 80 Evidentemente, ii = f = O. Por tanto,
.-------- r-- - -
28 20 o
n, 5
1 - --

5 10 6
r----- --
4 30 200 J.780 1.679
X 1 4 7 10 2 _ !: (zx + z,)2 = L z; + 2 !: z,zy +~ 1 + 2r,,, + 1 = 2(1 + r, ,)
13 s. - n n n n
11,X 5 20 70 60 52 207
11.,,,x: :f.. s 80 490 600 676 1.851 2 _ L (zx - z,)
1
= !: z; _ 2 !: z,z,, + !-_5_ = 1 - 2r,,. + 1 = 2(1 - rx,l
Sv - n n n n
186 / Estadistica para Psiclogos Relacin (lin eal) entre dos var iables / 187

z,
Ahora bien, tanto s~ como s~ son esencialmente no negativos. Por tamo - + + +
(1 + ,,,) ~ O. Es decir, r,, ~ - l. Igualmente, (! - ,,, ) : O. Es decir, r,, $ 1'.
En conclusin, -1 ::; r,, ::; l.
El coeficiente '"' alcanza su valor extremo 1, cuando cada una de las personas
obtiene la misma puntuacin tpica en X y en Y, o sea, cuando z, ~ z, para toda z.
persona del grupo. Evidentemente, en este caso

r,y = 1: z,z,. = 1: z,z, - :E z; + -


n - - --
n n
sern positivos y grandes. En cambio, los productos del par de puntuaciones t-
,.,. alcanza su valor extremo -1, cuando cada una de las personas obtiene picas de la minora sern negativos y pequeos. En conclusi n, la suma de los n
la misma puntuacin tpica (pero con distinto signo) en X y en Y, es decir, cuando productos, 1: z,z,., ser positiva y, por tanto, ,., ser positiva.
z, = - z. para toda persona del grupo. Evidentemente, en este caso
a .2) La mayor parte de las personas estn situadas en el 2.0 y 4.0 cuadran tes,
es decir, las d os puntuaciones tpicas de cada u na de estas personas son una posi-
r _ L z,zr
xy - = 1: z.x (-zx = - L
~
22
X = - ] tiva y la otra negativa. Adems, bastantes de ellas tienen puntuaciones tpicas
n n n
mayores (en valor absoluto) que las personas del 1. 0 y 3.0 cuadrantes. Esto quiere
En el primer caso, los puntos que representan a las n personas estn sobre la
z,
diagonal de los cuadrantes J. 0 y 3.0 (figura A). En el segundo, sobre la diagonal - + + +
de los cuadrantes 2.0 y 4. 0 (figura B).

z, z, z,

+ -
z. z.
decir que los productos d el par de puntuaciones tpicas de la mayora de las personas
sern negativos y grandes. En cambio, los productos del par de puntuaciones t-
'* picas de la minora sern positivos y pequeos. En conclusin, la suma de los n
(A) (B) productos, L z,z, ser negativa y, por tanto, r,, ser negativa.
a .3) Aproximadamente la cuarta parte de las n personas estn situadas en cada
Siempre que r,, = 1 o ,,., = - 1, los puntos siguen estando sobre una lnea uno de los cuatro cuadrantes. Por tan to, la mitad de ellas tendrn puntuaciones
recta (no necesariamente las dos diagonales anteriores) si nos valemos de puntua- tpicas del mismo signo y la otra mitad de signo distin to. Adems, en los cuatro
ciones diferenciales o directas. Y siempre que los puntos estn sobre una lnea recta,
,., = 1 o r,, = - J. Estas afirmaciones quedarn legitimadas en el captulo 12.
Veamos ahora lo que sucede cuando los puntos no estn sobre una lnea recta.
- . z,
+ +

Consideremos tres casos suponiendo puntuaciones tpicas.


a. l) La mayor parte de las personas estn situadas en el 1.0 y 3.0 cuadrantes, z.
es decir, las dos puntuaciones tpicas de cada una de estas personas son ambas
positivas o negativas. Adems, bastantes de ellas tienen puntuaciones tpicas ma-
yores (t:?valor absoluto) que las personas del 2.0 y 4.0 cuadrantes. Esto quiere de-
cir qu los productos del par de puntuaciones tpicas de la mayora de las personas
188 / Estadistica para Psiclogos
Relacin /lineal/ entre dos var,ab/es / 189
cuadrantes tenemos puntuaciones tpicas (en valor absoluto) altas, medias y bajas
Esto quiere decir que los productos del par de puntuaciones tpicas d e la mitad 10.2.4. Mtodo abreviado para el clculo de r,,
de las personas sern positivos y los de la otra mitad sern negativos. Por otra
parte, la suma de los productos de la primera mitad ser aproximadamente igual Basados en la propiedad 10.2.3.b), vamos a obtener un mtodo que simplifica
(y de signo contrario) que la suma de los de la segunda. En conclusin, la suma de los 0
abrevia el clculo de r,,.
n productos, r zxz,, ser nula o, aproximadamente, nula. Supongamos n pun tuaciones agrupadas en r intervalos (en una variable X ).
todos ellos con la misma amplitud /, y, a su vez, agru padas en s intervalos (en otra
b) El coeficiente rx,., en valor absoluto, entre dos variables es invarian te frente variable Y), todos ellos con la misma ampli tud !,.. Sean X 0 e }'0 los puntos medios
a cualquier transformacin lineal de ambas.
de dos intervalos (uno en X y otro en Y) elegidos arbitra riamente y a los que llamare-
Esto quiere decir lo siguiente :
Sean X 1 , X 2 , . , X, ; Y 1, Y 2 , , Y. las puntuaciones ob tenidas por n personas mas intervaos on.gen. Hagamos A = -1 B = - -Xo C = - 1 D = - _, Yo .mtro-
/, !, I ,. I ,.
en las dos variables X e Y. Sean X, Y, sx, s, las correspondientes medias y desviaciones
tpicas. Formemos las nuevas puntuaciones : duciend o x , = -1 X - -Xo y , = - y - Yo D a d o que x e I, son siempre
- . ..
positivas,
lx !, I, ! ,.
V1 =AX 1 + B, V2 = A X2 + B, . . . , V. = AX. +B r,r = r,,.. segn 10.2.3.h).
Segn sabemos (vase 5.2.4) las transfor macio nes an teriores hacen correspon-
W, = CY, + D, W 2 = C Y2 + D, ... , W. = C Y. +D
der a X 0 el valor x' = O, a las puntuaciones superiores a X 0 los valores x = l.
donde A, B, C y D son cuatro constan tes arbitrarias. Supuesto esto, lr,.,j = /r,yj. x' = 2, . . . , y a las puntuaciones inferiores a X O los valores x ' = - J. x ' = -2 . . . .
A su vez, hacen corresponder a Y 0 el valor y ' = O, a las puntuaciones su periores
En efecto, segn ya sabemos, V= AX + B. s,. = /A /sx, W = CY + D, s~. =
j Cjs,. Por consiguien le: a Y 0 los valores y ' = 1, y ' = 2, . . . y a las pu ntuaciones inferiores a Y 0 los valores
y' = - 1, y ' = - 2, . . .
r rw En conclusin, las transforma ciones anteriores nos permiten calcular el coefi-
'J.' JC =- - = r (V - V)( W - W)
ciente de correlacin de Pearson valindonos de las puntuaciones x ' e y ' que son,
11s,s., ns,,s,.
ordinariamente, mucho ms manejables que las puntuaciones originales X e Y.
La frmula (10.5) tomar ahora la forma siguiente
r [ (A X+ B) - (AX + B)][(CY + D ) - (CY + D )]
= n/AjsxjCfs,. = n r !: n,,.x'y' - (:E 11,x')(I: n,.y') (10.6)
r., = Jnrnxx ' 2 - ('E n,x')2 J nr n,.y'2 - (:E n,.y' )2

LA(X - X)C(Y - Y) AC :E(X- X )(Y - Y) AC rxy


jAC jnsxs, = /AC/ ns,s1 = /A C/ ns,s, = EJEMPLO 10.3. Apliquemos la f rmula (10.6) a los datos del ejemplo 10.2.

{ = r,,. si el signo de A es igual que el de C

i
AC 12-14 y n,y n,.y'2 n)(_,,x'y'
0-2 3-5 6-8 9-11 n,.
= /A C/ rx, = - rx,- si el signo de A es distinto que el de C
10-14 o o 2 2 4 8 1 8 8 10
Por tanto, /r,,./ = /r,,./.
5.9 l 2 6 3 o 12 o o o o
De esta propiedad se infiere fcilmente que en (10.4) las pun tuaciones directas - 0-4 o -1 - JO 10 10
1

en X y en Y pueden ser sustituidas por pun tuaciones diferenciales o tpicas. El
resultado final es el mismo usando directas-directas, que diferenciales-diferenciales,
4 3 2 1 JO

18 20
n, 5 5 10 6 4 30 -2 1
directas-diferenciales, diferenciales-tpicas, etc. En efecto, x = (1 )(X) + ( - X),
X - 2 - 1 o 1 2

(2)x + ( - 1),y = =(..!.) y+ (- ~I ) con s, 1


z, = (l )(Y) + ( -Y). z1 y s,
o
~ ~ ~ ll;r'< - 10 - 5 6 8 - 1

1 posiliva,s:f nxx2 20 5 o 6 16 47

il
190 / Estadistica para Ps,c/ogos Relacin (linea l) entre dos var iables / 191

El procedimienlo para construir la tabla es anlogo al utilizado en el ejemplo 10.2. Intm l1vamente se puede apreciar que la nube de puntos cor respondien te a l
Aplicando la frmula ( 10.6) nos queda: grupo total es ms estrecha y a largada que las dos nubes correspondientes al grupo
G1 y al G2 .
=
---;==
(30)(20) - ( - I )( - 2)
=======~ =---'-:======='== = -
_ 598 _ O
- 68 8 Pues bien , para Gr, 'x, = 0,84
f X)'
)(30)(47) - (- J)2j(30)(18) - (-2) 2 869 ' para G 1 , , , ,, = 0,3 8
pa ra G 2 , , ,,. = 0,67
El resultado es el mismo que el obtenido media nte el mtodo no abreviado.
Ntese que este valor de , , ,, menor para G 1 y G2 que para Gr, no es debido
a que los dos subgrupos consten de menos personas que el grupo total. En e fecto,
10.3. Factores de los que depende rx, del grupo total podemos elegir slo siete personas, pero que formen un grupo de
gran variabilidad. Elijamos, por ejemplo, las tres ms bajas en X y las tres ms
a) Vuri,tbilidoJ ,le/ grupo altas en X.
Supongamos dos variables, X (capacidad intelectual) e Y (xito escolar), rela-
cionadas linealmente. Calculemos el coeficiente de correlacin de Pearson entre
ambas del modo siguiente. Consideremos, en primer lugar, el grupo total, Gr, y, X y xi y2 XY
luego, dos subgrupos del mismo: G 1 , compuesto de los bajos en X (que, dada la
relacin lineal entre X e Y, tendern a ser bajos, tambin, en Y) y G2 , compuesto 8 7 64 49 56
de los altos en X (que, por la razn ante rior, tendern a ser altos, tambin, en Y). 7 7 49 49 49 (7)( 188) - (32)(31)
7 6 49 36 42 r.,. >. = -
Es claro que la variabilidad en X y en Y d e las personas del grupo Gr ser mayor j(7)(2 l4) - 322 J(7)(173) - 312 -
que la de las personas tanto de G 1 como de G 2 . En efecto, Gr consta de personas 7 5 49 25 35
3 9 3 324
altas y bajas en capacidad intelectual (y en xito escolar). En cambio, G I slo consta = - - =0 94
2 4 2
de personas bajas y G 2 slo consta de personas altas. Pues bien , '>" es mayor en 1 1 l
344,238 '
Gr que en G 1 y en G2 Es decir, el coeficiente de correlacin de Pearson queda re-
ducido al restringir la variabilidad del grupo en una variable (o en las dos). 32 31 214 173 188
EJEMPLO 10.4. Consideremos un grupo total, Gr, con 25 personas. Vamos
a descomponerlo en dos subgrupos : uno, G 1 , con las diez personas ms bajas en
X, y otro, G 2 , con las 15 ms altas en X.
Para este grupo reducido, pero muy heterogneo, ' x; = 0,94, mayor q ue el
La representacin grfica es la siguiente:
coeficiente de correlacin de Pearson correspondiente a l grupo tota l compuesto de
X 25 personas .
Ntese, tambin, que por razn del aumento de variabilidad, un solo dato
alejado mucho de los restantes puede h acer que a umente espectacularmente el coe-
ficiente de correlacin de Pearson . As, por ejemplo, el alumno puede comprobar
G, cmo r,,. = O en la tabla A, y cmo r,_.. = 0,95 en la ta bla B que no es ms que
G,
la tabla A con un nuevo punto, el (12, 12) muy a lejado de los cuatro restantes.
I Aho~ r:n X I
TA BL A A TABLA B
-y
X y X
-- - -
3 3 12 12
3 1 3 3
G, 1
X 1 3 3
1Ba1~ en X )
l l 3
~:t 4 6 7
Altos en X
192 / Estadstica para Psiclogos Relacin //mea/) entre dos var iabl es / 193

Este influjo de la variabilidad del grupo sobre r, , debe ser tenido en cuenta negativa. Este alto coeficiente de correlacin entre peso y habilidad numenca es
al valorar sta. Contemplemos un caso muy ordinario en Psicologa . De modo ele- debido a la presencia de una tercera variable: la edad. D entro del margen de edades
mental diremos que un test es fiable cuando, aplicado en d os ocasio nes distintas a un propuesto, al ir aumentando la edad aumentan simultneamente el peso y la habilidad
mismo grupo, da lugar a dos sucesiones de puntuaciones muy parecidas. Ms concre- en operar con n meros. Un modo de eliminar el influjo de la edad es dividir el grupo
tamente, llamaremos coeficiente de fiabilidad o, si mplemente. fiabilidad de un test total en subgrupos, tales que los nios de cada uno de ellos tengan la misma edad y
al coeficiente de correlacin de Pearson, r 12 , entre las puntuaciones obtenidas e~ calcular r,,. dentro de cada uno de dichos subgrupos. Pues bien, siguiendo esta tcti-
la p rimera ocasin y las obtenidas en la segunda. Pues bien, segn lo dicho anterior- ca veremos que el coeficiente de correlacin de Pearson entre peso y habilidad num-
mente, r 12 ser funcin de la variabilidad del grupo en aquella variable medida por rica es muy bajo, por muchos nios que elijamos de cada subgrupo de la misma edad.
el test. Si se trata de un test de inteligencia y aplicamos el test a un grupo de nios Ms adelante propondremos una manera de controlar estadsticamente el in-
muy homogneos (o todos muy inteligentes, o todos medios, o todos poco in teli- flujo de la tercera variable de que se trate, sin tener que dividir el grupo total en va-
gentes) obtendremos un valor para r 12 mucho menor que si lo hubiramos aplicado rios subgrupos, de acuerdo con lo indicado.
a un grupo muy heterogneo (compuesto de nios, unos muy in teligentes, otros La situacin presente quedara representada grficamente segn se ve en la
de inteligencia media y otros poco inteligentes). En otras palabras, el mismo test figura de la pgina anterior.
aplicado a un grupo muy homogneo puede dar lugar a r 12 = 0,75, por ejemplo, y Dentro de cada edad, r,, es prcticamente nula (una circun ferencia limita lo s
aplicado a un grupo heterogneo puede dar Jugar a r 12 = 0,93, por ejemplo. puntos representativos de las personas de cada edad). Pero consideradas conjunta-
mente todas las edades, es decir, sin controlar el influjo de la edad, r " >' crece sensi-
b) Influjo de una tercera w riab/e blemente (una elipse estrecha y alargada limita los puntos representativos de las
personas de todas las edades).
Si calculamos el coeficiente de correlacin de Pearson entre el peso y la habi- Vemos ahora una situacin en la que el influjo de la tercera variable tiende
lidad en realizar operaciones aritmticas para un grupo de nios cuyas edades os- a reducir la correlacin entre d os variables. Consideremos la capacidad intelectual.
cilen aproximadamente entre los cuatro y los doce aos, veremos que r,,. suele X, y el rendimiento escolar en cierta disciplina, Y. Consid eremos, adems, la moti-
ser positivo y alto. Quiere decir esto que, en general, los nios de ms peso tienen vacin como tercera variable, Z. Si controlamos Z, r,.,. ser, en general, alta . Pero
mayor facilidad para el clculo numrico que los nios de menor peso? A primera sin este control es posible q ue alumnos con gran motivacin logren alto rendimiento
vista y atenindonos al valor de r,,, parece que s. Sin embargo, la respuesta es escolar, a pesar de tener capacidad intelectual media y aun baja. Por el con trario,
otros alumnos, poco motivados, pueden lograr un bajo rendimiento esco lar, a pesar
de estar dotados de gran capacidad intelectual, y es probable que descienda r,, si
dejamos actuar a Z.
La situacin presente quedara grficamen te representada asi:

motivacin alta
(baja capacidad , alto rendimiento)

motivacin medfa, normal


~

o"'
~ motivaci n baJa
"o (alta ca pacidad. bajo re ndimiento)
j
g
:ae:
ii!

Habilidad numrica Capacidad inlelectual


194 / Estadistica para Ps,clogos Relacin //mea!) entre dos varia bles / 195

Si eliminamos los alumnos con motivacin alta y escasa capacidad intelectual y 10.4. Condicin esencial para poder calcular ,,r
los alumnos con motivacin baja y gran capacidad intelectual, rx, ser alta. (Una
elipse estrecha y alargada limita los puntos representativos de las personas no A nivel meramente descriptiro (en el cual nos movemos por ahora) la condicin
eliminadas.) Pero si no los eliminamos, rx,. puede descender sensiblemente (una cir- esencial para poder calcular r,,. es la linealidad de los puntos que representan a
cunferencia limita los puntos de todas las personas, sin eliminacin de ninguna). Jas n personas. Es decir, estos puntos deben estar situados prximos a una lnea
Consideremos un ltimo caso hiptetico. Supongamos que la relacin entre recta. No es necesario.que las dos variables se distribuyan normalmen te. Cualquier
dos variables, X e Y, es alta y positiva para las mujeres y alta y negativa para los tipo de distribucin es vlido, a condicin de que los puntos se siten cercanos a una
varones y es nula para el grupo total. En otras palabras, si prescindimos del influjo recta. Y esto es posible aun cuando las dos distribuciones sean asimtricas. Por
del sexo, rx, = O. Pero si tenemos en cuenta dicho influjo, rx, es alta y positiva 0
alta y negativa. ejemplo,
La situacin presente quedara representada grficamente as: X: l, 1, 1, l , l, 1, l, 2, 2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 4, 4, 5.
Y: 2, 2, 2, 2, 2, 2, 2, 4, 4, 4, 4, 4, 4, 4, 4, 6, 6, 6, 8, 8, 10.

son francame nte asimtricas. Sin embargo, los puntos (1 ,2), (1,2). .. . , (4,8), (5. 10)
se encuentran sobre la recta Y = 2X y 'x, vale l.
Advirtase que r,, puede ser calcu lado materialmente, siempre que tengamos
n pares de nmeros. Nuestro problema presente no es si puede ser calculado o no
mujeres
materialmente, sino si el resultado obtenido admi te una interpretacin razonable
como coeficiente de correlacin, es decir, como indicad or de la relacin existente en-
tre las d os variables. Pues bien, la interpretacin es razonable solamente cuando se
verifica la condicin de linealidad. Si los puntos representantes de las personas
y (es decir, de los pares de puntuaciones de cada persona) estn sobre una lnea curva,
r",. no sera recomendable, pues detectara muy p obremente la relacin curvilnea
entre las d os variables. Ms an, a una perfecta relacin curvilnea entre dos va-
varones
riables, puede corresponder rx,- = O. Vase el ejemplo siguiente:

X y
-- - - -- r (0,2)
2 o
/2 J2
X
o 2
,l 1
:j/2.0) X
- J. ../2 ( - 2,0)

Considerado el grupo formado simultneamente por varones y mujeres, rx, - 2 o


seria prcticamente nula (una circunferencia limita los puntos representativos de
dichas personas). Pero considerado exclusivamente el grupo de las m ujeres, rx,
- Ji - Ji ~ (--.,,-2.
(- , I 2. - , 2) - ,,1r.;2)

sera alta y positiva (una elipse estrecha y alargada que va del 1. 0 al 3." cuadrante o - 2 (O, - 2)
limita los puntos represen tativos de las mujeres), y considerado el grupo de los va- ,./2 -/ 2
rones, 'x, sera alta y negativa (una elipse estrecha y alargada que va del 2.0 al 4.0
cuadrante limita los puntos represen tativos de los varones).
De estas y otras consideraciones que pasamos por alto se infiere la gran uti-
lidad de d_ibujar el diagrama de dispersin antes de calcular el coeficiente de co- Los ocho pu ntos anteriores estn situados sobre la circunferencia X 2 + Y2 = 4.
rrelacir de Pea rson, para luego poder interpretar ste de modo apropiad o. Existe una correlacin (curvilnea) perfecta entre X e Y y, sin embargo, rx, = O.
196 / Estadistica para Psi clogos Rel;mn (lineal / en tr e d os variabl es / 197

Por tanto, si no existe relacin alguna entre dos variables, r,, = O. Pero si Lo cual no quiere decir que la abundancia de telfonos sea la causa de los accidentes.
r,,. = O, no se puede concluir que no exista relacin alguna. Ciertamente no existe Obviamente, a mayor nivel de vida corresponde simultneamente mayor n mero
relacin lineal, pero puede existir una relacin no lineal. En resumen, r, ,. mide la de telfonos y mayor nmero de coches y, como consecuencia, ms accidentes.
relacin lineal entre dos variables. Pronto veremos que r,,, = 1 si los puntos Pero a nadie se le ocurrira reducir el nmero de telfonos pensando que as iba
estn sobre una recta y, recprocamente, que si ,,, = 1, los puntos estn sobre a evitar muchos de los accidentes.
una recta. De aqu que volvamos a inculcar la importancia de dibujar el diagrama La correlacin indica una mera covariacin en tre dos variabl es y nada ms.
de dispersin antes de calcular 'Y para comprobar si los puntos siguen una tra-
yectoria ms o menos rectilnea. Slo bajo esta condicin ser recomendable r.,.
como ndice de correlacin.
10.7. Resumen : Definiciones y frmulas

Coeficiente de correlacin de Pearson entre X e Y, r,,. ; Cociente en tre la cova-


10.5. Interpretacin de,.,
rianza de X e Y y el producto de la desviacin tpica de X por la desviacin tpica de Y.

Sabernos que r,,. = 1 indica correlacin lineal perfecta, y que ,., = O indica
correlacin lineal nula. Esto supuesto, qu significa 0,65?, correlacin alta, media
r,..), = .!.,g__
S.xSy
o baja? Esta pregunta no tiene sentido considerada absolutamente. Depende de las
circunstancias. Es baja si se trata de la fiabilidad de un tes1. y es aJta si se trata de la
Otras frmulas equivalentes son :
validez del mismo. Ser baja si se trata de la correlacin entre dos tests de inteligencia
espacial parecidos, pero ser alta si se trata de la correlacin entre dos variables
sociales como, por ejemplo, patriotismo y prejuicio religioso. En general, la nica
valoracin razonable de un coeficiente de correlacin, es compararlo con los coefi-
= (
rX)' = LZn Z , don
d .
e z., y z , son puntuacmnes ,. )
llp1cas

cientes de correlacin encontrados por otros investigadores entre las mismas va-
riables y en circunstancias semejantes. El coeficiente de correlacin encontrado
por nosotros ser bajo, si es inferior al encontrado por otros investigadores; ser
= ns,,s,
L xy = ~/f~<r?:E x 2 L y2
(donde X e y son pun tuaciones diferenciales)

alto, si supera a los coeficientes obtenidos por estos. As, por ejemplo , si se trata
de las variables prejuicio antiprotestante y religiosidad utilitaria)), r.,. = 0,65 n:EXY-:EX:E Y
sera alto, pues no suelen alcanzar dicho valor los coeficientes encontrados por 2
(donde X e Y son puntuaciones di-
otros investigadores entre estas variables u otras muy semejantes corno prejuicio jn "J:,X - (LX) 2 j nT, Y 2 - (T, Y) 2 rectas)
racial)) y religiosidad utilitaria.
Por estas razones, son muy equvocas las tablas en las que se valoran los coefi-
n T, :E n,1.XY - (L n, X )(T, 11,. Y )
cientes de correlacin como bajos {por ejemplo, entre Oy 0,30), medios (por ejemplo, (donde X e Y son p untua-
entre 0,30 y 0,70), altos (por .ejemplo, entre 0,70 y 1), o segn otras categoras seme- J n L n,x2 - (L n,X)2 J n L n,. Y 2 - CE n,. Y)2 ciones directas y los da-
jantes. Es evidente que el nmero 0,40 es menor que 0,50. No obstante, la relacin tos se encuentran agrupa-
expresada por 0,40 puede significar ms que la expresada por 0,50. Depende de las dos en intervalos )
variables en cuestin.

10.6. Correlacin y causalidad

Por el hecho de que exista una alta correlacin entre dos variables, no- podemos
decir que una de ellas sea causa de la otra. Es claro que hay correlacin positiva entre
el nmero <!(!'accidentes de trfico y el nmero de telfonos en las viviendas. En las
regiones on mayor nmero de telfonos suelen darse ms accidentes de trfico.
198 / Estadistica para Psiclogos Relacin /lineal) entre dos variabl es / 199

EJERCICIOS 10.7. Se verifica necesariamente X = Y y s, = s 1. siempre que valga I el coefi-


ciente de correlacin de Pearson entre X e n
10.1. Calcular el coeficiente de correlacin de Pearson entre las variables X e Y, 10.8. Demostrar que si slo tenemos dos personas, con pun tuaciones en X y e n
a partir de los siguientes datos no agrupados en intervalos. Y, ,,, =1 ,,,. = - 1 r,, = O. ( En qu nicos casos se verificar ,, 1. = O?)

t0.9. Deseamos calcular r,, entre los resultados en u na prueba de aritm tica (X)
a) X y b) X y e) X y d) X y e) X r f) X y y otra de gramtica ( Y). Nos valemos de un o rdenador en cuya memoria se encuentra
- - - -- - - - - - --- - la frmula de , .,. en puntuaciones directas. Por distraccin introducimos en el or-
1 1 2 5 1 1 4 1 1 4 1 5 denador pu ntuaciones diferenciales en gramtica y tpicas en aritmtica. En este su-
2 2 4 7 2 3 6 1 2 2 3 2
puesto, a) Tendr algn sen tido el resultado que nos ofrezca la mquina ? b) Ser
4 5 5 4 6 2 2 2 3 6 4 4
este resul tado el mismo que el que hubiramos obtenido introduciendo p untua-
5 4 6 1 3 2 3 2 5 18 6 1
o 4 ciones directas en aritmtica y en gramtica?
8 3 --- 9 10
-- --- - -- JO. JO. Sean Xi, X 2 , . . , X. las puntuaciones directas obtenidas por II estudiantes
en la p rimera mitad de un examen de Estadistica, valiendo 4 la correspondiente
10.2. Calcular el coeficiente de correlacin de Pearson entre las variables X e Y, desvia cin tpica. Sean Y, , Y2 , , Y. las puntuaciones directas obtenidas por esos
a partir de los siguientes datos agrupados en intervalos. mismos estudiantes en la segunda mitad de dicho examen, va liendo 5 la correspon
diente desviacin tpica. Como notas finales en Estadstica aceptamos las siguientes:
3%1 + 2Y1 , 3X2 + 2Y2 , . , 3X. + 2Y. En este supuesto, cunto valdr la va-
a) 2-4 5.7 b) 6-9 10-13 e) 55-60 61-66 67-72 rianza de estas notas finales, a) si r,1 = O, b) si r,1 = 1, e) si ,,,. = -1 ?

4-6 4 10 13-17 3 o 94-100 1 2 6 10.11. Sean z 11 , z, 2 , . . . , z 1 las puntuaciones tpicas o btenidas por II estudiantes
1-3 4 2 8- 12 1 2 87-93 2 5 3 en Psicodiagnstico de nios y sean z 2 1 , z 22 , . . . , z 2 las pun tuaciones tpicas
3-7 o 4 80-86 6 4 1
obtenidas por esos mismos estudian tes en Psicodiagnstico de adultos. Como
nota fina l de Psicodiagnstico atribuimos a cada persona i la puntuacin
(zu + z 2 ,)/2. Demostrar que vale O la m edia de esas puntuaciones finales y que
18-20 21-23 24-26 27-29 vale ( 1 + r 12 )/2 la varianza de las mismas.
d) 62-66 67-71 72-76 e)
10.12. Sean X e Y dos variables tales que X = 40, Y = 15, s; = 25, r_
,,. = 0,125.
35.39 4 2 l 40--44 6 4 2 o
1 35.39 2 4 4 2 CV, = 10. Calcular la desviacin tpica de las puntuaciones W, = X, - Y; ,
30-34 l 3
25-29 l 4 3 30-34 o 3 6 6
10.13. Consideremos las puntuaciones X 1 , X2 , , x. e Y1 , Y2 , , Y. Intro-
20-24 o 1 4 25-29 o 1 3 7
duzcamos la n ueva variable V, = X; - Y, . Calcular el coeficiente de correlac in
de Pearson en tre X y V. y entre Y y V. en funcin des,, y s,. r,,,..
10.14. Calcula r el coeficien te de correlacin de Pearson introduciendo en la ecua-
10.3. D emostrar que la varia nza de V =X + Y es igual a la varianza de X ms
cin der.,. en puntuaciones directas, las puntuaciones dife renciales (1, - 1, O, - 3.
la varianza de Y, si r,y = O. 3) en X, y las p untuaciones tpicas (0.5, O, ~ 1,5, - 0,5, 1,5) en Y. Comprobar.
10.4. D emostrar que la varianza de V = X - Y es igual a la varianza de X ms adems, cmo ese resultado coincide con el obtenido median te I: z, z,/11, una vez
la varianza de Y, si,%, = O. transformadas en tpicas las puntuacion es diferen ciales en X.
10.5. Sean X e Y las medias de X,, X 2 , . , x. y de Y,, Y2 , , Y0 , respectiva-
10.15. Siendo z,, , z,,. . . . . z,. puntuaciones tpicas en X . y siendo Y1 , Y2, . Y.
mente. Form emos las nuevas puntuacion es X 1 Y, , X 2 Y2 , , X. Y . Supuesto esto,
demostrar que la media de estas nuevas puntuaciones es igual a XY si 'xr = O. . d. y I I: (}' - z )2
puntuaciones 1Tectas en , ca cular el valor de ' ' para r,,. = 1, r,,. = O.
10.6. ;Vale necesariamente 1 el coefi ciente de correlacin de Pearson entre X e Y n
si X = Y y s, = sy?
r,,, = - l. suponiendo que s,. = 2, Y = 6.
200 / Estadistica para Psiclogos

l0.16.Consideremos las puntuaciones X 1 , X 2 , . , x. e Y1 Y2 , . . Y. Sean


r,,. = 0,25. Calcular el coeficiente de correlacin de Pearson entre
s, = 4, s,. = 2.
X y V = X - Y.
11
l0.17. Sean W = X - V, I X 2 = 318, IX = 42. s,. = 3. n = 6. Calcu lar el Ecuaciones de regresin
valor de s~. cuando r,., = O y cuando r..- = 1.
10.18. Sabemos que el potencial excitatorio (E) se relaciona con la fuerza de h-
bito (H) y el drive (D) mediante la siguiente ecuacin: E = (H)(D). En un experi-
mento con cinco personas hemos obtenido E = 30, i5 = 6, ii = 5. Calcular el
coeficiente de correlacin de Pearson entre D y 1/.

11.1. Regresin y prediccin

Regresin equiva ldr a prediccin. La palabra regres1on se debe a Galton.


Estudiando la relacin en lre las caractersticas de los padres y las de sus hijos ob-
serv que a padres altos correspondan hijos altos, p ero que, en general, se acer-
caban ms a su media que los padres a la suya . Igualmen te, a padres bajos corres-
pondan hijos bajos, pero que, en general, se acercaban a su m edia ms que los
padres a la suya. Es decir, pareca darse cierta regresin hacia la media. Segn
este modo de pensar, los hijos seran ms iguales, ms h omogneos entre s que
lo eran sus padres. Pasamos por al to la discusin de esta interpretacin y nos limi-
tamos a constatar que el trmino regresin fue in troducido con ocasin de estos
estudios de Galton sobre la herencia y que hoy para nosotros equivale a predic-
cin, pronstico, estimacin. Es d ecir, ecuacin de regresin equivaldr a ecua-
cin de prediccin, de pronstico, de estimaci n.

11.2. Ecuacin de una recta en el plano

Es de la forma Y = a + bX, o sea, de primer grado en X y en Y. Las cons-


tantes a y b son propias de cada recta. Al variar a y/o b, vara la recta; y
al variar la recta, varan a y/o b. La constante a es llamada ordenada en el origen,
pues representa el valor de Y (ordena da) cuando X = O (es decir, cuando en el
eje de abscisas n os encontramos en el origen), La constan te b es llamada pen-
diente de la r ecta, y representa la inclinacin mayor o menor de la misma .
.f Veamos algunas ecuaciones de rectas y sus corr espondientes representaciones
grficas.
202 / Estadistica para Psiclogos Ecuaciones de regresin / 203

y y Las dos rectas anteriores tienen la misma ordenada en el origen (a = - J ),


es decir, cortan al eje O Y en el mismo punto (O, - 1). Tienen la misma pendien-
te, pero con distinto signo ( - 4 y 4 ).
Y= 2 + 3X
y y
y

X X
o

Para X= O, Y= 2; para X = 1, Y= 5. Por Para X = O, Y = - 1; para X = 1, Y = 2. y= JX


tanto, la recta pasar por los puntos cuyas Por tanto, la recta pasar por los puntos
coordenadas son: (0,2) y ( 1,5). cuyas coordenadas son: (O, - 1) y ( 1,2).
-'----9Ll.-'--'--'-....1....- X
Las dos rectas anterior es son paralelas. Coinciden en tener la misma pendien- I X O X
te (b = 3). Tienen distinta ordenada en el origen (2 y - 1), es decir, cortan al eje
O Y en distintos puntos.
y y
Las tres rectas anteriores tienen la m isma o rdenada en el origen (a = 0), es
decir, cortan al eje O Y en el mismo punto (O, O). En otras palabras, las tres carecen
de trmino independiente y pasan por el origen.
Y = 1+2X Y = l +SX

11.3. Ecuaciones de las rectas de regresin de Y sobre X


__._...,_..~_,__.___~~ X ~---~~~~~x
segn el criterio de mnimos cuadrados

Para X= O, Y = l; paraX = 1, Y = 3. Por Para X = O, Y = l; para X = 1, Y = 6 . Por Distinguiremos entre construccin y aplicacin. Comenzamos con la construc-
tanto, la recta pasar por los puntos cuyas tanto, la recta pasar por los puntos cuyas cin. Intentamos determinar una fun cin matemtica (una ecuacin) que nos
coordenadas son: (0,1 ) y ( t.3). coordenadas son (0, 1) y (1 ,6) . permita pronosticar la puntuacin de cada persona en una variable Y (cri terio ),
conocida su puntuacin en otra var iable X (variable predictora ). Entre todas las
Las dos rectas anteriores tienen la misma ordenada en el origen (a = 1), es funciones elegimos una m uy sencilla: la funcin lineal, la ecuacin de la lnea recta.
decir, corlan al eje O Y en el mismo punto (0, 1). Tienen distintas pendientes (2 y 5).
No son paralelas.
y {7 ,10)
y
10 - --- - - --- - ----- - - 1
X y Y, - Y', { 1

},,
Y = - l - 4X Y = -l + 4X
3
7 10 Y,
--'-++--'--'--'--'--'- X 10 8
X
o 1 2
4 9
_______0.:.l~i Y,
j Y',

Para X '.;. O, Y = - 1; para X = - 1, Y = 3. Para X = O, Y = - 1; para X = 1, Y = 3. ~ 5


Por t,mro. la recta pasar por los puntos Por tanto , la recta pasar por los puntos X,
cuyas coordenadas son: (0 ,- 1) y ( - 1,3). cuyas coordenadas son: ( 0,- 1) y (t.3).
204 / Estadistica para Psiclogos Ecuaciones de regresin / 205
Pues bien, deseamos construir una lnea recta tal que haga mnimo el error medio a) Expresada en puntuaciones directas
cometido en los pronsticos. Esta minimizacin del error la entendemos de la
siguiente manera. Comenzamos con la ecuacin
Supongamos un grupo de personas cuyas puntuaciones en X y en Y nos son
dadas. Por ejemplo, consideremos las cinco personas de la tabla anterior. Y'= A+ BX (l 1.1 )
En el grfico anterior llamemos Y/ a la ordenada del punto (sobre la recta r)
cuya abscisa es X,. En otras palabras, Y,' es la puntuacin pronosticada en Y me- Nuestro propos1to es determinar A y B, de modo que </J "" r (Y - Y')2 =
diante la rectar a la persona cuya puntuacin en X es X,. Es decir, Y, es la puntua- = r (Y - A - BX) 2 sea mnima. Segn se demuestra en Clculo, ello equivale
cin obtenida en Y e Y es la pronosticada. a resolver las dos ecuaciones
Es claro que con cada recca tendremos en nuestro caso cinco diferencias:
Y1 - Y{, Y2 - Y, Y3 - Y3, Y4 - Y, Y5 - Y5 o errores entre la puntuacin 8</ = O, o</J =o donde ?P. y
c</J
obtenida y la pronosticada. (En la figura adjunta tenemos las diferencias corres- oA cB cA ?B
pondientes a las dos primeras personas.) Si elevamos al cuadrado estos errores
y sumamos estos cuadrados, tendremos una suma de errores cuadrticos. Pues son las derivadas parciales de </J respecto a A y a B. Es decir,
bien, de todas las rectas posibles del plano pretendemos elegir aquella respecto
a la cual sea mnima dicha suma. En esto consiste la construccin de las rectas de a r (y - A - BX 2 = - 2 L ( y - A - BX ) = o
regresin de Y sobre X, segn el criterio de mnimos cuadrados. oA
En conclusin, la recta de regresin de Y sobre X es una recta tal que, en nues-
0 r (y - A - BX)2
tro ejemplo, haga mnima la suma: - 2!: (Y-A-BX)X=O
iJB

(Y, - r; 2 + (Y2 - Y) 2 + (Y3 - Y3)2 + (Y4 - Y1)2 + (Y5 - Y5)2 O, lo que es equivalente,

En general si tenemos n personas, intentamos construir una recta tal, que haga L ( Y - A - BX) = O, de donde, L Y= nA + B!: X ( 11.2)
mnima la expresin !: ( Y - A - BX )X = O, de donde, L XY = A L X + B !: X 2 ( 11.3)

Las ecuaciones (11.2) y (l 1.3) suelen ser llamadas normales . Ellas nos permi-
!: ( Y, - Y,') 2 donde i = 1, 2, ... , n.
ten despejar A y B. En efecto, dividiendo (1 1.2) por n nos queda

Ntese que para construir la recta de regresin necesitamos un grupo de per- Y= A+ BX ( 11.4 )
sonas cuyas puntuaciones en X y en Y conozcamos. En cambio, la aplicaremos de donde
a otras personas, semejantes a las anteriores, de las que slo conoceremos sus pun- A= Y- BX (11.5)
tuaciones en X. Supongamos que X es un test de aptitud para la Estadstica e Y el
aprovechamiento en la misma manifestado mediante un examen. Queremos cons- Multiplicando ( 11.4) por nX y restando de (11.3) nos queda,
truir una ecuacin que nos permita pronosticar del mejor modo posible el aprove-
chamiento, conocido el resultado en el test. Pues bien, para construir esa recta,
necesitamos unas personas cuyas puntuaciones en el test y en el examen nos sean !:XY- nXY = (A!:X + B!:X2 ) - (AnX + BnX2 ) =
conocidas. Una vez construida, la aplicaremos a otras personas, semejantes a = A(!: X - nX) + B(!: x i - nxi =
las anteriores, de las que slo conoceremos sus puntuaciones en el test de aptitud.
Dada la semejanza entre los dos grupos de personas, es de esperar que la recta
= O + B(!:X2 - nX2 )
de regresin que fue ptima en reducir los errores cuadrticos respecto al primer
Por tanto,
grupo, ser, tambin, razonablemente buena en reducir los errores cuadrticos
respecto al segundo.
Ex.J"llestas estas consideraciones previas, veamos cul es la recta de regresin B=!:XY-n~ ~ (1 1.6)
de Y sobre X. !: xi - n X2
Ecu aciones de regresin / 207
206 / Estadistica para Psiclogos
b) Expresada en puntuaciones diferencia/es
:EXY- n:EX ~ Comenzamos con la ecuacin
B = n n _ n :E XY - :E X :E y (11.7) (1 1.12 )
:E xi - n (r,/) i - n :E xi - (:E X)2 y'= a+ hx
2
Nuestro propsito es determinar a y b de modo que :E (y - y') = r. (y - a - bx )2
sea mnima. Segn un razonamiento an logo al seguido en el caso de puntuacio-
En resumen,
(11.S) nes directas, llegamos a las dos ecuaciones normales
A= Y- BX
(1 1.13)
:E y= na+ b :Ex
B = nr.XY - :EX:E Y (11.7) :E (y - a - bx) = O, de donde, 2
n :E X 2 - (:E X) 2 :E( y-a-bx )x=O, dedonde, :Exy =a :Ex +b :E x ( 11.14)

Teniendo en cuenta (11.1) y (11.5), Ahora bien, :Ex = :E y = O. Por consiguiente, las dos ecuaciones normales

Y' = A + BX = (Y - BX) + BX (11.8) quedan reducidas a


O= na + O, de donde, na = O, a= O
sta es la recta de regres1on de Y sobre X expresada en puntuaciones direc-
de donde , b = ~![2
tas, con B dada por (11.7)
De (11.8) se infieren inmediatamente las siguientes consecuencias:
:E xy = b :E x 2
, :E x

1) - :E Y ' - - :E X - - - - (11 .9) En conclusin,


Y '= - = (Y - BX) + B - = Y - BX + BX = Y (l 1.15)
n n a= O
Es decir, son iguales la media de las puntuaciones directas pronosticadas, Y', (1 1.lj
b=r, 0
x2
y la media de las puntuaciones directas obtenidas, Y.
(11.1 7)
= nrxysxs: =,. ~
2) s;, = B s; =
2 (teniendo en cuenta (11.8) y 6.3.4,a) 2
nsx
X)'
Sx

= [:E X Y - n X
L xi - n g2
Y] s 2
2
X
= (teniendo en cuenta 11.6) Ntese que

b = :E xy = :E (X - X)(Y - Y) = :E XY - n XY = B (11.18)
2
= [:E (X:E(X
- X)( Y -
- X)2
Y)] s: = [l:ns;xy]
2
x
2
2
Sx
= [n fxysxsr]
ns;
2
.2
s..
= r..2ys,.2 (11,10) r. x 2 :E (X - X) 2 L X 2 - 11 X

En otras palabras, la recta de regresin en puntuaciones directas y la recta de


Es decir, la varianza de las puntuaciones directas pronosticadas, es igual s;,, regresin en puntuaciones diferenciales tienen la misma pendiente, son paralelas.
o menor que la varianza de las puntuaciones directas obtenidas, pues 1. s;, r;y ::; Teniendo en cuenta (11.12) y (1 1. 15),
(11.19)
3) Sustituyendo X por X en (11.8), y '= bx

Y ' = (Y - BX) + BX = Y (11.11) sta es la recta de regresin de Y sobre X expresada en puntuaciones diferen-
" 1 1/;.\" 111 17 ).
208 / Estadistica para Psiclogos Ecu aciones de regresin / 209

1) En conclusin,
Y = ~ -= b~x = O (11.20)
n n a*= O (11.26)

Es decir, son iguales (valiendo ambas cero) la media de las puntuaciones di- b* = r,y (l 1.27)
ferenciales pronosticadas, y', y la media de las puntuaciones diferenciales obteni-
Teniendo en cuenta (11.23), (11.26) y (11.27),
das, y.
z;, = f x -, Zx (11.28)
2) s;, = b s; 2 (teniendo en cuenta (11.19) y 6.3.4 .a)

Esta es la recta de regresin de Y sobre X expresada en puntuaciones tp icas .


_
-
Z
rX)'
5_2 Sx2 (teniendo en cuenta (1 J.l 7)) De (11.28) se infieren inmediatamente las siguientes consecuencias :
Sr
1)

= r;, S:, (11.21) -,


z,. -- ~
n
-- rxy n
r =, -- o (11.29)

Es decir, llegamos al mismo resultado conseguido en (11.10).


Es decir, son iguales (valiendo ambas cero) la media de las puntuaciones tpi-
3) Sustituyendo x por x = O en (11.19), cas pronosticadas, z;,y la media de las puntuaciones tpicas obtenidas, z,.
y'= o (1 1.22)
2)
Es decir, la recta de regres1on de Y sobre X , en puntuaciones diferenciales, s;~ = r;},s;x (teniendo en cuenta (11.28) y 6.3.4a )
pasa por el origen (.x = O, y = 0), (Lo mismo sucede con la recta de regresin
de X sobre Y.)
~; = r;, (teniendo en cuenta 8,2 .b ) (11.30)

e) Expresada en puntuaciones tpicas Es decir, la varianza de las puntuaciones tpicas pronosticadas es igual o menor
que J. Esto significa que las puntuaciones z;.
no cumplen con una de las propie-
Comenzamos con la ecuacin dades esenciales de las puntuaciones tpicas, a saber, que su varianza vale nece-
sariamente J. Por esta razn, estas puntuaciones z;. deberan ser llamadas pseudo-
z; = a* + b*zx (11.23)
tpicas en vez de tpicas.

Nuestro propsito es determinar a y b* de modo que I: (z, - z;l2 = 3) Sus tituyendo : , por z, = O en ( 11.28),
= :!: (z, -a* - b*z,Y sea mnima. Segn un razonamiento anlogo al seguido
en el caso de puntuaciones directas llegamos a las dos ecuaciones normales z; = O
I: (z, - a* - b*zx) = O, de donde, I: z, = na* + b* I: Zx (11.24) O sea, la recta de regresin de Y sobre X, en puntuaciones pseudotpicas p asa
por el origen (z~ = O, :iy = O). (Lo mismo sucede con la recta de regresin de X
I: (z,, - a* - b*zx)Zx = O, de donde, I: ZxZy = a* I: Zx + b* I: z; (11.25) sobre Y.)
EJEMPLO 11.1. Comen zaremos in troduciendo un min iejemplo que ayude al lec-
Ahora bien , I: z, = I: zy = O, I: z; = n. Por consiguiente, las dos ecuaciones tor a comprender mejor la a plicacin de las frmulas anteriores. Despus, o fre-
normales quedan reducidas a ceremos otro ejemplo algo ms largo con unos datos ob tenidos en la vida real.
Supon gamos cinco personas con pun tuaciones en una variable predictora (X )
O = na* + O, de donde, na*= O, a * = O Y en un criterio ( Y), segn la tabla I l.l. (De acuerdo con la costumbre seguida
,!"
I: z,z,. = b*n, d e donde, b* = I: z, z,/n = r,, anteriormente, (X - X )= x, e (Y - f) = y .)
21 O / Estadstica para Ps,clogos
Ecuaciones de r egresin / 211
TABLA 11. l Por consiguien te,
X y X' r' xr X _1' x' r' xy -, =)' -x .. .r
y y _,
- y
y,' = 1,95 X , segn (11.19).
3 9 9 81 27 - 1 o 1 o o
- 0.5 o.o 0,00 7,05 - J ,95- 0.325
5 12 25 144 60 1 3 1 9 3 0,5 0,5 0,25 10,95 1,95 0,325 Aplicando esta ecuacin a los cinco puntos diferenciales en X (- 1, 1, O, 3, - 3),
4 o 16 o o o -9 o 81 o obtenemos la columna encabezada por y ' en la ta bla 12. l.
7 18 49 324 126 3 9 9 81 27
0,0
1,5
- 1,5
1,5
0,00 9,00
2,25 14,85
5,85
0,000
0,975 Ntese cmo :Ey = :Ey ' = O, o _v =Y= O.
6 1 36 6 -3 - 3 9 9 9 -1,5 - 0,5 0,75 3.15 - 5,85 -0,975
e) Recta de regresirn a partir d<' puntuaciones tpicas
20 45 100 585 219 o O 20 180 39 o.o o.o 3,25 45,00 0,00 0,000
Segn (11.27):
- 20 45 3,25 b* = 0,65
X= S = 4, f = - - = 9 s, = J205 = 2, s, = ~ = 6, r,,. =- - = 0,65 Segn (11.26):
5 ' 5
a* = O
Por consiguiente,
a) Recta de regresin a partir de puntuaciones directas
.,. = 0,65 ::, , segn (11.28 ).

Segn (11.7): Aplicando esta ecuacin a las cinco puntuaciones tpicas en X ( -0,5 ; 0,5; 0,0 ;
1,5; -1,5), obtenemos la columna encabezada por en la tabla 11.1. z;.
B = (5)(219) - (20)(45) = 195 = I
95 Ntese cmo :E z,. = :Ez;. = O, o, z,. = z;. = O.
(5)(100) - (20) 2 100 '
Segn (11.5): La representacin grfica de las tres rectas de regresin an teriores es la si-
guiente:
A = 9 - (1,95)(4 ) = 9 - 7,80 = 1,20
Por consiguiente,
y
Y= 1,20 + 1,95 X, segn (l 1.8).

Aplicando esta ecuacin a las cinco puntuaciones directas en X (3 , 5, 4, 7, 1),


o btenemos la columna encabezada por Y' en la tabla 11.l.
Ntese cmo :E Y = L Y'= 45, o, Y= Y' = 9.
,__t.., '1..-,.
b) Recta de regresin a partir de puntuaciones diferencia/es e1:a
-1<
... ,
Segn (11.16):

b =~= l 95
20 '
Segn (1 1.17):

b = O 65 ~ = 1 95
' 2 '
Seg.~ ( 11.1 5):
a =O X
212 / Estadistica para Psiclogos Ecuaciones de regresin / 213

EJEMPLO J 1.2. La tabla 11 .2 nos presenta las puntuaciones obtenidas por 22 l: XY = (2)(4,3) + (20 )(7,5 ) + + (16)(4,3 ) = 2.217,8
alumnos de Enseanza General Bsica de la ciudad de Oviedo en un tes! de ra.
= i/22)(5.972)~5O)' = 4 2843
zonamiento abstracto, X, y las notas alcanzadas por los mismos en rendimiento s, (22) 2 '
escolar, Y, a fin de curso (promedio de sus calificaciones en todas la s ma terias
cursadas). Los datos han sido ofrecidos por M . C. Garca Mndez. (22)(871 ,62) :_ (133,6)2
s). = (22)' = 1,6556

TABLA 11.2 (22)(2.217,8) - (350)( 133,6)


r,,. = -,=-:====:=:=::==;===c~~r:====.:======c=~ = 0,5918
j(22)(5.972) - (350)2 )(22)(871,62) - (133,6) 2
X y Y' y .. ,,
2 4,3 2,891 7 -3, 18 10 - 1,9214
20 7,5 7,0083 0,9356 0,5651 a) Recta de regresin a partir de puntuaciones directas
12 5,0 5,1787 -0,8940 - 0,5400
21 6,9 7,2370 1,1643 0,7032
Segn (11.7):
19 5,2 6,7796 0,7069 0,4270
17 4,4 6,3222 0,2495 0, 1507
14 6,3 5,6361 - 0.4366 -0,2637 B = (22)(2.217,8) - (350)033,6) = O
2287
13 5,6 5,4074 - 0,6653 - 0,4018 (22)(5.972) - (350) 2 '

21 8,7 7,2370 1,1643 0,7032 Segn (11.5):


19 7,6 6,7796 0,7069 0.4270 A= 6,0727 - (0,2287)( 15,909 1) = 2,4343
14 7,0 5,6361 -0,4366 - 0,2637
20 9,2 7,0083 0,9356 0,5651 Por consiguiente,
16 6,5 6,0935 0,0208 0,0126
17 6,3 6,3222 0,2495 0,1507
18 8,8 6,5508 0,4782 0,2888
Y,' = 2,4343 + 0,2287 X,
21 7,9 7,2370 1,1643 0,7032
11 5,0 4,9500 - 1,1227 -0,6781 Ntese cmo en la tabla 11.2 r: Y, = r: Y = 133,6
17 4,2 6,3222 0,2495 0,1507
16 4 ,1 6,0935 0,0208 0,0 126
13 5,2 5,4074 -0,6653 - 0,4018 b) Recta de regresin a partir de puntuaciones diferenciales
13 3,6 5,4074 - 0,6653 - 0,4018
16 4 ,3 0,208 0,0208 0,0126 Segn (11.1 8) :
b = B = 0,2287
350 133,6 133,5996 0,0002 0,0002 Segn (11.15):
a= O
Por consiguiente,

:!: X = 2 + 20 + + 16 = 350 y; = 0,2287 x,


350
X =
22 = 15,909 1 Ntese cmo en la Labia 11 .2 r: y = 0,0002 :o: 0,000 .

:!: Y = 4 ,3 + 7,5 + + 4,3 = 133,6 c) Recta de regresin a partir de puntuaciones tpicas

Y=!~~=60727 Segn (11.27):


22 ' b* = 0,5918
:!: X ' = (2) + (20) 2 + + (16 )2 = 5.972
2 Segn (11.26):
~:t
a* = O
:!: t 2 = (4 ,3)2 + (7,5) 2 + + (4,3)2 = 871,62
Ecuaciones de r egr esi n / 215
214 / Estadistica para Psiclogos

a) Expresada en puntua ciones directas


Por consiguiente,
Segn (11.32):
z;. = 0,5918 z, B = (5)(219) - (20)(45) = 195 = O 2 167
(5 )(585 ) - (45) 2 900 '
Ntese cmo en la tabla 11 .2 L z; = 0,0002 :,e 0,000. Segn (J 1.31 ):
A = 4 - (0,21 67)(9 ) = 2,0497

11.4. Ecuaciones de las rectas de regresin de X sobre Y, segn Por consiguiente,


el criterio de mnimos cuadrados
x = 2,0497 + 0,2167 Y,

Junto a las ecuaciones de regresin de Y sobre X, te nemos las ecuaciones de b) Expresada en puntuaciones diferenciales
regresin de X sobre Y. Mediante ellas intentamos pronosticar X a partir de Y.
Para ello nos valemos de una recta que haga mnima la expresin L (X, - X;2 . Segn (11.34 ) :
De acuerdo con un razonamiento anlogo al seguido en el caso de las rectas 39
b = -- = O 2 167
de regresin de Y sobre X, es fcil demostrar que ahora es: 180 '
Segn (1 1.33 ):
a=0
a) Expresada en puntuaciones directas Por consiguiente,
(1 1.31 )
A = X - BY x; = 0,2167 y,
B =nL YX - "!: Y LX (11.32)
e) Expresada en puntuaciones tpicas
2
n "!: Y 2 - (L Y)
Segn (11.3 7):
b* = 0,65
Segn ( 11.36):
b) Expresada en p11nt11aciones diferencia les
a= O
a=0 (11.33) Por consiguiente,

=~ = 0,65 z>'
b = LYX (1 1.34)
"!: y2 Las ecuaciones anteriores dan lugar a los siguientes valores pronosticados :

s, Puntuaciones directas pronosticadas : 4, 4,65, 2,05, 5,95, 3,35


b = r,r~
(11.35)
Puntuaciones diferenciales pronosticadas:
Puntuaciones pseudo tpicas pronosticadas:
0,65, - 1,95, 1,95, -0,65
O, 0,325, - 0,975, 0,975, -0,325

En adelante, h ablaremos slo de ecuaciones de regresin de Y sobre X. Con


c) Expresada en puntuaciones tpicas
ellas podemos resolver los problemas que se nos presenten . Basta con llamar X a
(11.36) la variable que har oficio de predic tora y lla mar Y a la que h ar o ficio de crite-
a = O
rio, es decir, a la que ser pronosticada a partir de la predic lora . Por ejemplo, si
(11.37)
b* = r,y intentamos pronosticar el peso a partir de la altura, llam ar emos X a la altura e
~!:" Y al peso. Pero si inte ntamos pronosticar la altura a partir del peso, llamaremos X
EJEMPLO 11.3 . Apliquemos estas ecu aciones a los datos del ejemplo J 1.1. al peso e Y a la a ltura.
216 / Estadistica para Psiclogos Ecuaciones de regresin / 217

11.5. Aplicacin de las rectas de regresin NotA l.


Las puntuaciones diferenciales y tpicas no son ms que las d irectas sometidas
Una vez construidas las rectas de regresin, las podemos aplicar a otras perso- a ciertas condiciones restrictivas. Por tanto, las relaciones vlidas entre las direc-
nas con tal que sean semejantes a aquellas con las que las hemos construido. En tas, sern, tambin, vlidas entre las diferenciales y tpicas, con tal que impon-
realidad, suponemos que tanto el grupo con el que hemos construido las rectas, gamos a las directas las restricciones requerid as.
como el grupo al que se las aplicamos no son ms que dos muestras de la misrna Ahora bien, introducir puntuaciones diferenciales equivale a imponer L x =
poblacin. = L y =