Está en la página 1de 565

ANÁLISIS

DE bATOS
EN PSICOLOGÍA I

José María Merino


Enrique Moreno
Miguel Padilla
Pedro Rodríguez-Miñón
Ángel Villarino •

UNIVERSIDAD NACIONAL DE EDUCACIÓN A DISTANCIA


José M." Merino
Enrique Moreno
Miguel Padilla
Pedro Rodríguez-M.ii,ón
Ángel Vill arin o

ANÁLISIS DE DATOS
EN PSICOLOGÍA I

UNIVERSIDAD NACIONAL DE EDUCACiÓN A DISTANCIA


/

UNIDADES DIDÁCTICAS (47105 UDOI )


ANÁLIS IS DE DATOS E N PSICOLOGÍA I

PRÓLOGO

l. El aná
1.1. b
1.2. E
1.3. (
I
Quedal1 rig ll rosQmewl! prohibidas. sil! (a ollton'lAcióll escrita I
de los ¡¡tillares del . COliyriJ¡gt. , bajo fas SaI/áolles establecidas en las leyes.
la refJrotlllccióIf /0/01 o parcial ,le es/a obra por cllalquier medio o procedimiento
I
compnmdidos la reprografía y el tralamimlo ¡,,(ormtftico, y la dislribllciótl 1.4. ~
tle ejem plares ,Je ellas me¡}iallle alquiler Q présltlmo pú blicos. I
I

l.
1.5. R
" UN IVERS IDAD NAC IO NAL 1.6. E
DE E DUCACiÓN A DI STANCIA - Madrid. 200 1
1. 7. S
Li brería UN ED: el Bravo Murillo. 38 - 280 15 Madlid
Teléfs.: 9 \ 398756017373 E-mai!: libreria@.adm.uncd.es 2. Clasi6«
© José M,o Meri no, Enrique More no, Miguel Padilla, 2.!. Ir
2. 2.
Pedro Ro<h iguez-Miñón. Angel Vi/!1lIino

ISBN: 84-362-4489-3 (o. c.)


2.
2.
'"
ISBN: 84-362-455 1-2 (vol. 1)
Depósito legal: M. 3 1.418-200 1 2.3. E
2.
Primcra edición: scplicmbrc de 200 1 2.
Imprcso en España - PTinlcd in Spain 2.4. D
Compuc~1O e i mp rc~o cn Fcrnándcz Cíudad, S. L. 2.5. R>
Ca talina Suárcz, 19.28007 Madrid 2.6. E.
ÍNDICE

PRÓLOGO .......... . .... . .... .. ....................... . 17

1. El análisis de datos y la medición en Psicología ..... . .. . 19


1.1. Introducción ..... . .......... . ...... . ....... . .. . 21
1.2. El método científico y el análisis de datos ....... . .. . 22
1.3. Conceptos generales ........ . ............ . . •..... 26
1.3.1 . Población y muestra . ................ . . . .. . 26
1.3.2. Parámetro y estadístico ........ . ... ... . . .. . 28
1.3.3. Caracteristica y modalidad ............. . .. . 29
lA. Medición y escalas de m edida .................. . . . 30
1.4.1. Escala nominal ................ . ......... . 33
1.4.2. Escala ordinal ........... . .. • .. . .. . . . . . ... 35
1.4.3. Escala de intervalo ...... . .. •... . .. . .. ..... 37
1.4.4. Escala de razón ........ . . . • ' • • .... . . . . ... 40
1.5. Resumen ......... . .............. . ... ......... . 42
1.6. Ejercicios ...... . ... . .......................... . 42
1.7. Soluciones a los ejercicios . . ............ . . . ...... . 44

2. Clasificación y notación de variables ..... ....... . . . .. . 47


2.1. Introducción .. . . ...... .. ....... . .. • ............ 49
2.2. Variables: Clasificación y notación .............. . 49
2.2.1. Clasificación . .. . ....... . ........ . .. .. . . 50
2.2.2. Notación de variables .... . .... . •.... . . . .. . . 52
2.3. El símbolo de sumar o sumatorio ................. . 52
2.3.1. Reglas del sumatorio ..................... . 53
2.3.2. Consecuencias del sumatorio ....... . ...... . 55
2.4. Doble sumatorio ...................... •. .. .. . ... 58
2.5, Resumen ., .......... , ....... , ......•... , .. , .,. 66
2.6. Ejercicios .. , ....... " . . .•..... , ... .•• . " ...... . 66
8 ANÁ LISIS DE DATOS EN PSICOLOGfA 1 fNDICE

2. 7. Soluciones a los ejercicios 69 4.2


4.3
3. Or ganización d e datos y r epresenta ció n gráfica . . . . . . . . 75
3.1. Introducción ................. . . . . . . .. 77
3.2. Di stribución de frecuencias. . . . . . . . . . . .. 78 4.4. Re
3.3. Distribución de valores dentro de un intervalo. . . . . . .. 86 4.5. Ej<:
3.4. Representaciones gráficas ........... . . . . . . . . .. 88 4.6. Sol
3.4.1. Representaciones gráficas de variables cua li tati-
vas y cuasicua nti lativas . . . . . . . . . . . .. 88 5. Índices I
3.4.1 .1. Di agrama de rectángu los ........... 88 5.1. Int
3.4.1 .2. Diagra ma de sectores o p ictograma .. 89 5.2. Ind
3.4.2. Representaciones gráficas de variables cuan t i- 5.2.
tativas ..... . . .......... . .. . 90 5.2.
3.4.2. 1. Diagrama de ban'as . ............. . 91 5.2.
3. 4.2.2. Histograma .... . ................ . 92 5.2.
3.4.2 .3. Po lígono de frec uencias ........... . 93
3.5. Convenciones ¡'especto a las representac iones gráficas. 95
3.6. Propiedades de la dist ¡-i bución de frecuencias ....... . 97
3.7. Resumen. . . .............. . 99 5.2.
3.8 . Ejercicios. . . . . . . ........... . 100 5.3. Ind:
3.9. Soluciones a los ejerc icios ................ . . .. . 104 5.3.
5.3.
4 . índices d e te nde ncia central y d e pOsición .... __ . . . . . 107 5.3 ..
4 .1. In trod ucc ión........... . ........ _.. ..... 109 5.4. Res'
4.2. Índices de tendenc ia central .. ' . . .. . . .. . .. . . . ... 110 5.5. Ejel
4.2.1. La moda........... . ........... 110 5.6. Soh
4 .2. 1. 1. La moda en variables cu ali tativas .... 110
4.2. 1.2. La moda en variables cu antita tivas. .. 111 6. P untuad
4.2. 1.3. Propiedades de la moda ..... 112 cu rtos is .
4.2.2. La mediana ....... , . . . . . . . . . 112 6.1. [ntri
4.2.2.1. Cálculo ................ 112 6.2. Pun
4.2.2.2. Propiedades de la mediana ... . 116 6.2.
4.2 .3. La media. . . . . . . . . ............... . 117 6.2.:
4.2.3.1. Definición y cálculo .............. . 118 6.3. Lae
4.2 .3.2. Propiedades de la media ........... . 120 6.3.
4.2.4. Cr iterios para la elección de un índice de len· 6.3.:
dencia cen tral ................ . 123 6.3.4
4.2.5 Otros índices de tendencia cen tra l 127 6.3.:
4.2.5.1. Med ia geométrica ........... . .. . 127 6.3.<
4.2.5.2. Med ia armón ica ............. . . . 129 6.4. Resl
4.2.5.3. Med ia cuadrá ti ca 130 6.5. Ejer
4.3. Medidas de posición ....... . 130 6.6. Solu
íNDICE 9

4.3.l. Percentiles o centiles 131


4.3.2. Otros índices de posición ..... . •... . . . . . .... 135
4.3.2. 1. Deciles .............. ..... . •..... 135
4.3.2.2. Cuartiles ....................... . 136
4.4. Resumen 136
4.5. Ejercicios ..... . ..... .. ..... . ...... .. • . • .... _ .. . 137
4.6. Soluciones a los ejercicios ............. . ......... . 140

5. Índices de variabilidad y sesgo o asimetria . . . . . . . . . . . .. 145


5.1. Introducción .. . .... ...... .............. . ....... 147
5.2. índices de variabilidad. . . . . . . . . . . . . . . . . . . . . . . . . .. 148
5.2. 1. Amplitud total. . .. . . . . . .. . . .. . .•• . .. . ... . . 148
5.2.2. Amplitu d semi-intercuartil .. . . . •..•... ..... 149
5.2.3. Desviación media ........ . ' .. ' . . ...... .. .. 150
5.2.4. Varianza y desviación típica ................ 150
5.2.4.1. Definición y cálculo ...... ... .. . .. . 15 1
5.2.4.2. Propiedades de la vari anza y la desvia-
ción típica . . ..................... 155
5.2.5. Coeficiente de variación. . . . . . . . . . . . . . . . . . .. 157
5.3. Indices de sesgo o asimenia . . . . . . . . . . . . . . . . . . . . . .. l 58
5.3.1. índice de asimetría intercuartílico . .... . ..... 159
5.3.2. índice de asimetría de Pearson . . . . . . . . . . . . .. 160
5.3.3. índice de asimetría de Fisher ............... 161
5.4. Resumen ................... . ......... . . . . . . ... 162
5.5. Ejercicios............................ .. ........ 163
5.6. Soluciones a los ejercicios . ....... . ............... 166

6. Puntuaciones derivadas. La curva nonnal. Apuntamiento o


curtosis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 171
6.1. In troducción... . . . .. . ..................... .. ... 173
6.2. Puntuaciones derivadas .. ...... .. ... . . .. . .••.... . 174
6.2.1 . Puntuaciones de desviación. . . . . . . . . . . . . . . .. 174
6.2 .2. Puntuaciones típicas .. .. . ... ...... . ....... 175
6.3. La curva normal . .... . .. .. .............. . . . . . . .. 176
6.3.1. Del histograma a la curva normal . . . . . . . . . . .. 177
6.3.2. Áreas y proporciones bajo la curva normal.. .. 181
6.3.4. Normalización de distribuciones . ........... 187
6.3.5. Puntuaciones y escalas derivadas normalizadas 189
6.3.6. Apuntam iento o curtosis .. ................. 189
6.4. Resumen .. . ...... .. .. . ........................ 191
6.5. Ejercicios ... . ...... . ............. . ..... . . ...... 191
6.6. Soluciones a los ejercicios .... . ... _• . . . . . . . . • . . . 193
10 ANÁLISIS DE DATOS EN PSICOLOGfA 1 ÍNDICE

7 . Análisis exploratorio de datos .. . ... . ................. 199 9. Relación


7.1. Introducc ión ................... . ............... 201 9.1. lnln
7.2. El anál isis exploratorio de datos ....•.......... " .. 201 9.2. Lap
7.3. Diagrama de lallo y hojas. . . . . . . . . . . . . . . . . . . . . . . .. 203 9.3. fndie
7.4. Diagramas de caja. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 208 drad
7.5. Índices es tad ís ticos resistentes ....• .• .. . ... .. . . . .. 211 9.3. 1
7.5. 1. Med ia reconada .... ...... •• ..• •. ......... 212 9.3.2
7.5.2. Med;a w;nsorizada ............. ... .. .... .. 213 9.3.3
7.5.3. Med ia centlal .............. ....• . . . . . .... 215 9.4. Indie
7.5.4. Media na recortada o lrimedia .... .. ......... 215 9.5. ReJa(
7.5.5. Meda...... ......... .. .... . .. . .... 216 tativ"
7.6. Resum en .. . ... .. . . . ... . . .. . ........ . ...... . ... 219 9.6. Resul
7.7. Ejerc icios..... . . .. . ... . ............... 219 9.7. Ejerc
7. 8. Solucio nes a los ejercicios ............... ... ...... 223 9.8. Soluc

8. Organización y representación conjunta de dos variables 225 10. Relación e:


8. 1. Inlroclucdón ..... . .. .. ......................... 227 tO . 1. lntro<.
8. 2. Orga ni zaci ón conjunta de datos de dos variables. . . . .. 228 10.2. Covar
8.3. Di s tribuc ión co njunta de dos vari abl es ca tegóri cas u 10.2. 1
o cdina les. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 228
8.3. 1. Dis tribuciones ma rginales. . . . . . . . . . . . . . . . .. 232 10.2.2
8.3.2. D;SII';buciones cond;cionadas . . . . . . . . . . . . . .. 234
8.4. Disllibució n conjunta de dos variables cuantitativas d is- 10.2.3.
cretas 237 10.2.4.
8.4.1. Medias de las distribuciones condicionadas ... 237 10.3. Coefic
8. 4.2. ReI::tción entre la med ia de una varia ble y s us 10.3. 1.
med ias condi cionadas .................... . 241 10.3.2.
SS Dis\ribución conjunta de dos val;ables cuanti\alivas con-
tÜluas . . .. . .. . .. . .. . .......................... 24 1 10.3.3.
8.6. El concepto de relación en tre va riables. . . . . . . . . . . . .. 244 10.3.4.
8.7. Representación gráfica conjunta de dos variables cuaH- lO A. Resum
t a ti _y~ i~ ~ . . . . . . . . . . . . . . .......... 245 10.5. Ejercic
8.7. 1. Representación tridimensional . ............. 245 10.6. Solucie
8.7.2. Representaci ón bidimensiollo:ll . ........ . .... 246 j
8.8. Representación gráfi ca conjunta de dos valiables cuan- 11. Regresión li
titati vas . ........................... . .. ........ 247 11.1 . lntrodll
8.8.1. Representación tridimensio na l .............. 248 11.2. La rect
8.8.3. Diagra ma de dispersión . . . . . . . . . . . . . • • . . . .. 249 11.2.1.
8.9. Resumen ............... ... . . ... . ..... . . .. ..... 252
8. 10. Ejercicios. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 252 11.2.2.
8. 11 . Sol uc iones a los ejercicios ......•...... .. ...• ..... 256 11.2.3.
íNDICE 11

9. Relación entre variables cualitativas y cuasi-cuantitativas 259


9.1. Introducción .......... .... . .. . ............ . .... 261
9.2. La prueba de cm-cuadrado ....................... 262
9.3. Índices de asociación basados en la prueba de cm-cua-
drado ............................... .......... 264
9.3.1. í ndice de asociación cp . . . . . . . . . . . . . . . . . . . .. 265
9.3.2. E l índice cp con variables dicotómicas. . . . . . . .. 265
9.3.3. El coefici ente de contingencia e . . . . . . . . . . . .. 268
9.4. índices de correlación para varia bl es ordinales ....... 269
9.5. Relación entre una variable dicotómica y una cuanti-
tativa ... ............... . . ... . ............ . ... . 272
9.6. Resumen........ . .. . .... .. . ................... 276
9.7. Ejercicios ......... .. .......... . . ... ... . ....... . 277
9.8. Soluciones a los ejercicios . . ..... . ... .. .• ......... 280

10. Relación entre variables cuantitativas .. . . .. . . ,...... . . 285


10.1. Introducción ... . .. .. ..... . ..................... 287
10.2. Covarianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 288
10.2. 1. Cálculo de la covarianza con datos no agrupa-
dos en intervalos. . . . . . . . . . . . . . . . . . . . . . . . .. 28B
10.2.2. Cálculo de la covarianza con datos agrupados en
intervalos .... ... . ....................... 292
10.2.3. Propiedades de la covarianza ............... 295
10.204. La covarianza y la varianza . . . . . . . . . . . . . . . .. 298
10.3. Coeficien te de correlación de pearson . . . . . . . . . . . . . .. 300
10.3.1. Cálculo del coeficiente de correlación de Pearson 300
10.3.2. Propiedades del coeficiente de corre lación d e
Pearson ......... . .................... . . . 305
10.3.3. Correlación y heterogeneidad ............... 306
10.3.4. Con'elación y causalidad . . . . . . . . . .. . .• • . . .. 307
lOA . Resumen . . ... . . ..... .. .............. . . . .. . . . .. 309
10.5. Ejercicios. . . . . . . . . . . . . . . . . . . . . . . . . . • . . . . . . . . . .. 3 10
10.6. Soluciones a los ejercicios . . .. . • ..•. . ... . .. .. . . ... 313
1__ _ 1
11. Regresión lineal y predicción ..... .. ..... . , . . . . . . . . . . . 319
11.1. Introducción .. ' ... .. .................. ' ........ 321
11.2. La recta de regresión . . .......................... 323
11.2.1. Cálculo de los coeficientes de la recta de regre-
sión ........................ ... ......... 325
11.2.2. Predicción de valores . . . . . . . . . . . . . . . . . . . . .. 331
11.2.3. La varianza residual o varianza error. . . . . . . .. 332
12 ANÁLISIS DE DATOS EN PSICOLOGÍA 1 lNDlCE

11.2.4. La recta de regresión y el coeficiente de correla- 1'


ción .................................... 335 1'
11.2.5. Regresión y correlación co n su maS de cuad ra- 14.3. TI
dos y productos cruzados .................. 337 1-
1 1.2.6. La recta de regresión de x sobre y . . . . . . . . . . .. 340 1-
I 1.3. Resumen ...................................... 34 1 14.4. T'
I 1.4. Ejerc ic ios. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 341 14.5. T'
1 1.5. Solución a los ejercicios . . . . . . . . . . . . . . . . . . . . . . . . .. 344 14.6. Ro
14.7. Ej
12. Introducción a la probabilidad .. .. ....... . •.......... 349 14.8. S<
12. 1. In troducción.......................... . ........ 35 1
12.2. Conceptos previos . .. ...... ' ..... . ... . . .• ....... 353 15, Distribl
12.2. 1. Experimento aleatorio ...... . .... o o o o • • • • •• 353 15. 1. In
12.2.2. Espacio muestral ... .. . ................... 354 15.2. V.
12.2.3. Sucesos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 354 15.3. Til
12.2.3. 1. Operaciones con sucesos ........... 356 15
12.2.3.2. Represemaciones gráficas .......... 357 15
12.3. De fini c ión de probabilidad para un espacio muestra l 15.4. Fu
discre to ....................................... 358 15
12.3.1. Defi nición clásica. . . . . . . . . . . . . . . . . . . . . . . .. 358 15
12.3.2. Definición estadísti ca. . . . . . . . . . . . . ... . . . . .. 359 15.5. Fu
12.3.3. Definic ión axiomática .......... " .. o o ••••• 36 1 15
12.4. Resumen ...................... o o o •• ' • •••• o • • •• 365 15
12.5. Ejercicios ....................... o o • • • • • •• 365 15.6. Re
12.6. Soluciones de los ejercicios ............... • •. 367 15.7. Eje
15.8. So
13. Combinatoria ................... , ....... . ... .. o • • •• 371
13.1. Introducción ............. o oo • ••••• • •• •• • •••••• 373 16. Variabh
13.2. Principio fundamental ................... •• ..... 374 16.1. Int
13.3. Permutac iones ..........•............... •. .... 375 16.2. M,
13.4. Variaciones ............. , ..... ,. o • • , • • • • o • • • • • 378 16.
13.5. Co mbinacio nes .......... ,................ . .... 379 16.
13.6. Permutacio nes con repetición .................... 384 16.3. Re
13.7. Variaciones co n repetición . ........... .. .. o o ••••• 384 16.4. Ej'
13.8. Comb inaciones con repetició n .... . . o • • • •• ••• o • • •• 385 16.5. So
13.9. Resumen ....... ... ........................... 387
13. 10. Ejercicios. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 388 17. Variable
13. 1 1. Soluciones a los ejercicios ...... •• .... • ... . ...... 390 17.1. Inl
17.2. Fu
14. Teoremas de probabilidad ...................... .. ... 393 17.3. Fo
14.1. In tl'oducció n ................. 395
o ••••••••••••••••• 17.4. F,
14.2. Teorema del producto ..... , .. . ...•.... •.... .. . ... 396 17.5. M
íNDICE 13

14.2.1. Para sucesos independientes .. . .. • ... . . ..... 399


14.2.2. Para sucesos dependientes ~ . . . . . . . . . . . . . . . .. 402
14.3. Teorema de la suma ............................. 406
14.3. 1. Para su cesos mutuamente excluyentes ........ 406
14.3.2. Para sucesos simultáneos .................. 407
14.4. Teorema de la probabilidad total. . . . . . . . . . . . . . . . . .. 409
14.5. Teorema de Bayes ................. . •• ........... 411
14.6. Resumen ..... . . .. . ............. . . ..• . • .... .... 415
14.7. Ejercicios ...... ........ ...... . .... .. ••.• .. . .... 416
14.8. Soluciones a los ejercicios .......... . ............. 41 8

15. Distribuciones de probabilidad de variables aleatorias .. 423


15.1. Introducción ............ . .. . ... ........ .. ...... 425
15.2 . Variable aleatoria: definición. . . . . . . . . . . . . . . . . . . . .. 426
lS .3 . Tipos de variab les aleatorias ........ ....• . .. . ..... 427
15.3 .1. Variables aleatorias d iscretas ..... •• •. . . .... 427
15.3.2. Variables aleatorias continuas ..... • • 4 • • • • • • • 428
15.4. Función de probabilidad ........... ' ... .• • ....... 429
15.4.1. Representación gráfica ............ .•• . . 432
15.4.2. Propiedades ......... ......... .. . . . • •. .. . 432
15.5. Función de distribución .. .. . .. ............ • • •.... 435
15.5. 1. Representación gráfica . ... • . ....... . ••.... 437
15.5. 2. Propiedades ............. • •.. .. . ... . . .... 438
15.6. Resumen ........ . ........................ . . ... 439
15.7. Ejercicios ...... . ... . ....... . .. . ............ . ... 440
15.8. Solución a los ejercicios. . . . . . . . . . . . . . . . . . . . . . . . .. 442

16. Variables aleatorias discretas (1):Una variable . . . . . . . . .. 447


16.1. Introducción ............................. ...... 449
16.2. Momentos de la variable aleatoria ............ . . .... 450
16.2.1. La esperanza matemática o media ........... 451
16.2.2. La varianza. . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 454
16.3. Resumen .... . .. . ........... . .................. 459
16 .4. Ejercicios. . . . . . . . . . . . . . . . . . . . . . . • . . . • . . . . . . . . .. 460
16.5. Soluciones a los ejercicios ............... ..... .. 462

17. Variables aleatorias discretas (11): Dos variables .. . . . . .. 467


17.1. Inlroducción .......... . ........................ 469
17.2. Función de probabilidad conjunta ................. 470
17.3. .Función de probabilidad margin al ................ 476
17.4. Función de probabilidad condicional. . . . . . . . . . . . .. 478
17.5. Momentos ...... . ............................. 481
14 ANÁLISIS DE DATOS EN PSICOLOGíA 1 IN DICE

17.5. 1. Respecto al origen: la esperanza . ......... . . 482 20. Apüca.!:


17.5. 2. Res pecto a la media: la covarian za .. ' . . . . . . . 483 lidad .
17.6. Independencia ent re variables aleatorias discretas ... 486 20.1. In
J 7.7. Función de dis tribución conjunta ............... . . 490 20.2. D
17.8. Resu me n .......................... . .......... 494 2(
17.9. Ejercic ios........................... .. . . ...... 495
17. 10. So luciones a los ejercicios ....................... 498
2e
18. Algunos modelos de distribuciones continuas de probabi-
lidad . . ........ .................. ...... .. .......... 503
18. 1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 505 20
18.2. La disu;bución nonnal . . . . . . . . . . . . . . . . . . . • . . . . .. 506
18.3. La di st!'ibución chi-cuadrado (;e ) ................. 515
18.4. La dis tl'ibución t de Student ... . ....... . .. . .. .... 521
18.5. La dis tl'ibució n F. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 525 20.3. Re
18.6. Resumen........ .. .......... ............ . . .. . 530 20.4. Ej<
18.7. Ejercicios .................... .... .. .... . .... .. 53 1 20.5. So
18.8 Soluciones a los ejercicios . ....... . .... ... .. . .... 534
Referencias .
19. Distribuciones discretas de probabilidad .... . ..... . ... 537
19. 1. In troducción ..... ......... . .......... . . .. .. ... 539 Apéndice: TA
19.2. La d isllibución de Belllouilli ............. . .. . . ... 541 Tabla Al
19.2.1. Función de probJ.biJidad .................. 542 Tabla Al
19.2.2. Función de distribución ..... • ...... " ..... 543 Tabla A3
19.3. La distribuc ión binomial ............•.... ... .... 544 Tabla A4
19.3. 1. Función de probabilidad ................. . 546 Tabla AS
19.3.2. Funció n de d istribución . . . . . . . . . . . . . . . . . .. 548 Tabla A6
19.3.3. Aproximación de la distribució n binomial a la Tabla A7
=~~ 5~ Tabla A8
19.4. La distribución binomial negativa. . . . . . . . . . . . . . . .. 559
19.4. 1. Función de probabi lidad .................. 560
19.4.2 . Función de dist¡i bución ....... ...... . .. .. . 563
19.5. La dis tribución de Poisson o ley de los sucesos raros . 566
19.5. 1. Func ión de probabilidad .................. 567
19.5.2. Función de distribución. . . . . . . . . . . . . . . . . .. 568
19.5.3. Aprox imación de la distribución de Po isson a la
normal .......................... ' . ..... 569
19.6. La dis ll-ibución muhinomia l ... . ................. 572
19.6 .1 . Función de probabilidad . .. . .. .. •• , ... 572
19.7. Resume n .......................... . .. •. ....... 575
19.8. Ejercicios ............ . .......... . . • ............ 575
19.9. Soluciones a los ejercicios ............•.•... • ..... 577
tNDJCE 15

20. Aplicaciones de las distribuciones Continuas de probabi-


lidad ........... . ... . ... . ... . ...................... 583
20.1. In troducción ................................... 585
20.2. Distribución muestral . . . . . . . . . . . . . . . . . . . . . . . . . . .. 587
20.2. 1. Distribución muestraJ de la media ........... 588
20.2.1. 1. Intervalo de probabilidad y de confian ~
za de la media .... ............... 594
20.2.2. Distribución muestra! de la varianza ......... 601
20.2.2. 1. Inten1alo de probabilidad y de confian -
za de la varianza ......... . ........ 602
20.2.3. Distribución muestra! del cociente entre varian-
zas . . ... . ......... . ............ ' ....... . 606
20.2.3.1. Intervalo de probabilidad y de confian-
za del cociente en tre varianzas .... . . 607
20.3. Resumen 611
2004. Ejercicios ...... ... . . . ... ... . ... . ............. . . 6 11
20.5. Soluciones a los ejercicios .. . .. • •.. .. . .. .. .••..... 613

Referencias bibliográficas . ......... . .•............. . ..... 617

Apéndic", TABLAS ...... . ... . ...... . .................... 619


Tabla Al. Distribución Normal. . . . . . . . . . . . . . . . . • . . . . .. 621
Tabla Al. Distribución Chi-cuadrado . . . . . . . . . . . . . . . . . .. 623
Tabla A3. Distribución t . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 624
Tabla A4. Distribución F ... . . . . . . . . . . . . . . . . . . . . . . . . .. 625
Tabla AS. Función de probabilidad binomial ..... . ... ... 631
Tabla A6. Función de distribución binomial ........ ..... 636
Tabla A7. Función de probabilidad de Poisson .... . ...... 641
Tabla A8. Función de distribución de Poisson . . . . . . . . . . .. 644
PRÓtOGO

El lexto que presentamos está dirigido, muy especialmente, a los


alumnos de Análisis de datos en Psicología 1 de la UNED y a todos aque-
llos que se inician en esta materia sin contar necesariamente con la ayu-
da de un profesor: Por este motivo, hemos procurado centram os en aque-
llas fórmulas y desarrollos matemáticos imprescin dibles para un
estudiante de Psicología, apoyando todas las explicaciones con ejemplos
sencillos que ayuden a comprender los conceptos y los desarrollos del
análisis. Hemos introducido numerosos ejemplos, aclaraciones y activi-
dades que ayuden a fijar los contenidos, distinguiéndose claramente del
texto. En esta misma linea, cada uno de los temas finaliza con un resu-
men del mismo y un grupo numeroso de ejercicios resueltos.
Los temas que se tratan en este texto son los relativos a teorta de la
medición en Psicología, Estadistica Descriptiva para una y dos varia-
bles, concep tos básicos de la Teoría de la Probabilidad y una introducción
él las distribuciones de probabilidad de variables aleatorias discretas y
continuas.
Para el análisis de datos en el ámbito de la Psicología, y del resto de
las Ciencias Sociales y de la Salud, es cada vez más imprescindible la ayu-
da del ordenador. Por este motivo hemos incorporado un CD que contie-
ne un programa de análisis que permite obtener los índices estadísticos
descriptivos básicos, representar gráficamente una y dos variables y tam-
bién permite el estudio, manipulando los parámetros, de las distribu-
ciones de probabilidad discretas y continuas.
Además del software de análisis estadís ti co, en el en también se ha
incorporado una presentación en PowerPoint, con una serie de diaposi-
tivas en las que se trata de manera resumida toda la asignatura, que
pensamos puede ser muy útil para el estudio de la materia.

18 ANÁLISIS DE DATOS EN PSICOLOGÍA 1

Acampanando al libro de texto se ha editado también un formulario


en modo de esquema, que contiene las fórmulas fundamentales recogidas
y explicadas en el texto.
Por último, a través de la plataforma WebCT. el alumno matriculado
en esta asignatura de primer curso puede acceder a los contenidos que el
equipo docente ha incorporado, y que son complementarios del material
didáctico impreso y del sofuvare de análisis estadístico.

Los AUTORES
Madrid, ablil de 200 I
Tema 1
El análisis de datos
y la medición en Psicología
.1.1. INTROI
SUMARIO
El efecto qu
1.1. Introducción Jos padres, Jos 1
1.2 . El m étod o científico y el aná lis is de d a tos de una empres<
cigar rill os, los
1.3. Conceptos generales
pendi en tes .. " ~
1.3.1. Población y muestra referencias de (
1.3 .2. Parám etro v estadístico sus vecinos, qu
1.3.3. Característica y modalidad la ligereza con
1.4. Medición y escalas de medida ellos. Probable
1.4.1. Escala nominal temática» de lo
1.4. 2. Esca la ordinal casos su base s
1.4. 3 . Escala de intervalo mrá a la opini('
1.4.4 . Esca.la de razón d e «autoridad
conocimiento ]
t .5. Resumen
hombre en la I
1.6. Ejercicios vamos a referil
1.7. Soluciones a los ejercicios cimiento adquiJ
n as se ñalarem~
á m b ito d e la P
Datos y analiz.
m os encontrar
Los objetiv(
siguientes:

• AdquirirJ
papel qu
1.1. INTHODUCCIÓN
El efecto que sobre la educación de los hijos tienen las conduclas de
los padres, los factores a tener en cuenta en la selección de los ejecutivos
de una empresa, las consecuencias de la publicidad sobre el consumo de
cigarri ll os. los efectos de una determin ada terapia en sujetos drogode-
pendientes .... y un sinfín de temas más pueden constituir capítulos o
referencias de cualquier tratado de Psicología. Si Vd. pregunta a uno de
sus vecinos. que no sea psicólogo , sobre estos temas se «asombrará» de
la ligereza con que a veces se opina o se supone «un conocimiento » sobre
ellos. Proba blemen te su vecino se apoyará en una «observación no sis-
temática» de lo que ocurre en su entorno familiar, de trabajo, etc.; en otros
casos s u base será <{el sentido común ,. 0 , en el mejor de los casos, recu-
rrirá a la opinión o los comen tarios de un expeno apoyándose en su nivel
de «autoridad en la materia». Se trata d e distintas formas d e adquirir
conocimiento y, de hecho, és te ha sido el procedimiento utilizado por el
hombre en la mayor parte de su historia sobre la tierra. Noso tros nos
vamos a referir únicamente al conocim ien to científico, es decir al cono-
cimiento adquirido utilizando el método científico. En las próximas pági-
nas sefialaremos las caracteristicas fu ndamentales de es te método en el
ámbito de la Psicología y el papel que en él desempeña el Análisis de
Datos y analizaremos después los distintos niveles de medida que pode-
mos encontrar en las variables psicológicas.
Los objetivos que pretendemos alcan zar podemos resumidos en los
siguientes:

" Adquirir las nociones básicas del método científico y estudiar el


papel que juega en éste el Análisis de datos.
22 ANÁLISIS DE DATOS EN PSICOLOGíA [ EL ANÁLISIS DE

a) El nivel
• Diferenciar y manejar con precisión algunos conceptos funcla-
b) El nive l
mentales como muestra y población, parámetro y estadís t ico,
caractenstica y modalidad. e) El nivel
• Adquirir un conocimiento preciso de Jo que es una escala de medi - El pri mer r
da y la importancia de la medición en Psicología. hipótesis conlr
• Distinguir con claridad los disti ntos niveles de med ida (no minal, tos propiamer
ordinal, de intervalos y de razón), las relaciones que pueden esta- determinación
blecerse dentro de cada una de estas escalas y el grupo de trans- datos, es decir
formacio nes adm is ibles para cada una de ellas. es taclístico-am
tras te de hipót
varía nuevame
proceso y dand
ligación cientfl
1.:1. El. \IETOIJO C1E"\TíFlCO
Vamos, a c,
Con frec ue ncia hemos oído que el «objeto de estudio » de la Psicolo- ejemplo concn
gfa es la cOl1ducta y es este objeto de estudio lo que la dis tingue de otras
ciencias. Pero ¿qué procedim iento o método utiliza remos para estudiar
la conducta ? Sin entrar en otras cons ideraciones, que no con 'esponden a Ejem plo I
esta maleria, diremos que el método ciel1tífico. Un ps icó
El método cie ntífico se caracteriza por se r «sistemático. y «replica- tas estereo
Su hipótes '
ble». El ténnino sis temático hace referencia a que se trata de un proceso
entre s i. Par
que tie ne unos pasos perfec tamen te establecidos y el término replicable
hace refe re nci a a que los datos obtenidos m ediante s u uso pueden ser víd eo oculu
rep licados o refutados por cualquier investi gador que lo desee. como taJes

Sin embargo, el método es sólo un compo nente -aunque muy impor- Ejemplo 2
tante- del proceso de inves tigación científica. Esquemá ticamente, y siem- Un nuevt
pre con el ri esgo que esta si m p lificación supone , pod emos seña lar los d es e ntre lo
siguiellles pasos: implanta. U
l . Defi nición del proble m a. Para ello, y
conju nto d
2. Ded ucció n de hipó tesis con trastables.
nario.
3. Es tab lecimiento de un procedimjento de recog ida d e datos.
4. Aná lis is d e los resu ltados obten idos.
Ejemplo 3

5. Discu sión de di chos resu ltados y búsqueda de conclusio nes Se supo


efecto nega
6. Elaboración de un infonne de investigación. da en que
Este proceso se cOlTesponde con las tres fases o nive les señalados por cólogo del
Amau ( 1990):
El ANÁLISIS DE DATOS Y LA MEDICIÓN EN PSICOLOGíA 23

a) El nivel teórico-conceptual
b) El nivel técnico-metodológico
e) El nivel estadístico-analítico.

El primer nivel incluiría la definición del problema y la deducción de


hipótesis contrastables. El segundo y tercer nivel constituitian los aspec-
tos propiamente metodológicos. En el segundo nivel se encontraría la
determinación de un plan de trabajo o procedimiento para la recogida de
datos, es decir la elección de un diseño de investigación. El tercer nivel. el
estadístico-analítico, conlleva el análisis de los datos obtenidos y el con-
traste de hipótesis. La interpretación de los resultados obtenidos nos lle-
valÍa nuevamente al nivel teórico-conceptual, iniciándose nuevamente el
proceso y dando lugar a una estructura dclica característica de toda inves-
tigación científica.
Vamos, a conti.nuación, a aplicar lo expresado anteri.ormente a tres
ejemplo concretos.

Ejemplo 1
Un psicólogo clínico está interesado en el estudio de las conduc-
tas estereotipadas que realizan los niños autistas mientras juegan.
Su hipótesis es que estas conductas no mantienen ninguna relación
entre si. Para probar su hipótesis registra, mediante una cámara de
vídeo oculta, las conductas de un grupo de niños diagnosticados
como tales en un aula.

Ejemplo 2
Un nuevo plan de estudios de Psicología genera distintas actitu-
des entre los profesores y alumnos de la universidad en la que se
implanta. Un pSicólogo quiere conocer cuáles son estas actitudes.
Para ello, y dado que no puede entrevistar a todos, selecciona un
conjunto de profesores y ot ro de alumnos y les aplica un cuestio-
nario.

Ejemplo 3
Se supone que el consumo de una determinada droga tiene un
efecto negativo sobre el aprendizaje y que éste disminuye en la medi-
da en que su consumo aumenta. Para probar esta hipótesis, un psi·
cólogo del aprendizaje selecciona un conjunto de ratas de la misma
24 ANÁLISIS DE DATOS EN PSICOLOGíA 1 EL ANÁUSIS

lambién en
cepa y de caractetisticas simjlares. Divide a las ratas en cuatro gru- pos. En fun
pos (A, B, e y D). A las ratas del grupo A les administra, por vía veno- cons ideranc
sa, una pequefta cantidad de droga (por ejemplo 0,0 I mg); a las del extremos se
grupo B una cantidad de 0,05 mg; a las del grupo e les administra mo de mani
0.1 mg. Finalmente a las de grupo D no les administra ninguna can- u n grado m~
tidad de droga. Durante un tiempo determinado no facilita comida con . Ia obse
a ninguna de las ratas y. a continuación, las coloca en la salida de un mento de lat
laberinto en cuyo final hay una bolita de comida (pelet) y registra el cuasi-experi
tiempo que cada una de las ralas tarda en recorrerlo. selec tivos o
mediante la ~
n Sl icas.
En los tres ejemplos señalados, y en lodos aquellos que podamos con-
siderar, es necesado tratal' un conjunto de datos o números con los que En mucho
desc ribir aquello que es ta mos estudiando. En el primer ejemplo, el psi- 10 que permil
cólogo se ha limitado a registrar u observar unas conduclas que se pro- guajes formal
ducen espontáneamente (diseño observacional) '1 el tratam iento de los empíricamen'
datos es meramente d e scriptivo: enumerar tos tipos de conducla, deter- entr<l.r a consi
minar la fn~.cuencia y/o el porcentaje de cada una de las conductas, cal- (Véase Jáñez,
cular la cO ITeladón entre ellas y efectuar una representación grá fi ca. la con trastaCl
nidos. En este
En el segundo ejemplo, debemos asegurar que el grupo elegido (que te entre los m
denominamos muestra) es representativo de la pobla ción (el conj unto adecuación de
de todos los alumnos y profesores en este caso) y aunque realizaremos un lo confirma.n e
análisis dcscripth10 de los resultados obtenidos nuestro objeth1o funda- que \a. discrepó
mental es extenderlos, con un detelminado nivel de cITar o probabilidad, zo nuevamentt
a loda la población. ueslro objetivo es fundam entalmente inferencia!. ca con la ley d<
El ca rácler meramente descriptivo y el inrerencial constituyen las dos v6 a S.S. Stevel
partes fundamentales de la Estadística. Esta ciencia, que es una rama de es sabido, pres
las mat emática s, constituye una herrami enta rundamental en todas las
Es rrecue nt
ci encias empíricas. La estadística, puede definirse como;
estadíst ica apl
los aspectos rOl
«La cien cia que recoge, ordena y a na li za los da tos de una mues- aplicación a un
tra, extraída de cierta poblac ión, y qu e, a pa rt ir de esa muestra, la es tadística de
valiéndose d el cálculo de probabilidades, se encarga de hacer inre- citar algunos ej
rencias ace rca de la población» (Amó n, 1984, p. 37). dística aplicada
ca aplicada a. la
la PSicología, e>
Ellercer ejemplo estaría denlro de la considerada metodología expe- con nombres C(
rime ntal. En este caso es el experimentador el que manipula o determi~ coesladíslica- (:
na lo que en metodología se denomina vadable independiente (la canti- han propuesto ~
dad de droga administrada). La estadística, en este caso, interviene de datos y así f
EL ANÁUSIS DE DATOS y LA MEDICIÓN EN PSICOLOGí A 25

también en la asignación de los sujetos experimentales a los dislintos gru-


pos. En fu nción del grado de manipulación de las variables que estemos
considerando nos encontraremos ante distintos diseños. En uno d e los
extremos se sitúa el diseño observacional -con ausencia o un grado míni-
mo de ma nipulación- y, en el otro extremo, el diseño experimental con
un grado máximo de manip ulación y se corresponden, respectivamente,
con ula observación naturalista o estudios d e campo» y con «el experi -
men to de laboratorio». A medio camino entre ellos se sitúan los diseños
cuasi-experimentales, que utilizan grupos no equivalen tes, y los diseños
selectivos o correlacionales que estudian las relaciones en tre variables
mediante la selección de los sujetos en función de alguna de sus caracte-
rísticas.
En muchos casos, una vez formulado un problema se plantea un mode-
lo que permile, h aciendo uso de desalrollos matemáticos o de otros len-
guajes formales, elaborar una predicciones que pueden ser contrastadas
empíricamente. Dado que no es este el momen to ni el lugar op0l1uno de
en trar a considerar en detalle los aspectos relacionados con los modelos
(Véase Jáñez, 1989) , baste decir que la Estadística interviene también en
la contrastación de las predicciones del modelo con los resultados ob te-
nidos. En este sentido, según Peña (1987), u... actúa como disciplina puen-
te entre los modelos matemáticos y los fe nómenos reales ... lO (p. 19). La
adecu ación de los resultados experimentales y las predicciones del mode-
lo confirman el carácter explicativo de la teona que Jo sustenta en tanto
que la discrepancia obliga a una reformulación del modelo y el com ien-
zo nuevamente del proceso. Esto ha sido lo que ha ocurrido en Psicofísi-
ca con la ley de Fechner : la discrepancia con los resultados existentes Ue-
vó a S.S. S tevens a presentar un nuevo modelo, la ley potencial, que, como
es sabido, presenta un mejor ajuste.
Es frecuente también distinguir entre una estadística teórica y un a
estadística aplicada. La primera se ocupa, como su nombre indica , de
los aspectos formales y nonnativos en tanto que la segunda constituye la
aplicación a un campo concreto. No todas las ciencias empíricas utilizan
la estadística de la misma manera y, desde esta perspectiva se habla, por
citar algunos ejemplos, de «Es tadística aplicada a la economía », uEsta-
distica aplicada a las ciencias de la vida » o «Bioes tadíslica» y uEstadísti-
ca aplicada a la Psicología» o Psicoestadística. En esta lín ea, y dentro de
la Psicología, existen algunos planes de estudio y algunas publicaciones
con nombres como uEstadística para psicólogos» (Amón , 1984) o «Psi-
coestadística» (San Martín y Pardo, 1989; Carro, 1994). Algunos au tores
han propuesto para la Estadística aplicada la denominación de Análisis
de datos y así está siendo recogida en algunas p ublicacion es (Botella,
EL ANÁLISIS DE I
26 ANÁLISIS DE DATOS EN PSICOLOGíA 1

Leó n y Sa n Martín , 1993; Pa rdo y San Martín , 1998) y así es tá siendo su acepción est
incor'porada en los nuevos planes de estudio. De hecho este es el nombre Ha. León y Sar.
de este libm y de la asignatura del nuevo plan de estudios de Psicología
de la UNE D. Podemos, por tanto, establecer la siguiente definición: Por pobla
mentos que,
El Análisis de datos en Psicología es una herramienta me lod ol ó~
gica necesaria, de carácter fundam en talmente estadístico, para la A cada uno
investigación en Psicología mina de mancr
ro de las entid:
infinita. El con,
Vamos ;1 expon er a cont inuación a lgun os de los conce pt os funda - municipios cor
mentales usados en esta disciplina. el lnsti lu lo Na,
año por una c<
caneleras es p~
1.:1. CO"\CI-.PTOS CE"\EIl \I.ES ciones finitas. :
o el conjunto ¿
En el punto anteIior se ha descIito de manera sintética el proceso que "es infinitas d,
se sigue en una investigación, desde la formul ac ió n del objeti vo o plan- dos conjuntos;
teamient o de un prob lema a la ext racción de co ncl us iones. En la d es- al conj unto de
cripc ión de este proceso se emp lean a lgunos términos cuyo uso es fTe - siempre habrá
cuente en los informes de carácter científico. Térm inos tales co mo
po blac ión, muestra, parámetro, y algunos otros, fOlman pal1e del voca- La teoría el
bulario estad íst ico y, por extensió n, también del científico. y a ellos vamos tar con ambos
a dedicar las próx imas páginas. población fini
estadfsticos co
que no siempI
I .:L l . PohliH'iou ~ 11111(':-;11-<1
ciones objeto
tadas como vi
En toda investigación se hace referencia a una determinada población,
sea del ti po que sea, aunque siempre se u tili7-3 una parte de esa población ACLARACIC
referent e para describir las propi edades Que la caracteri za n. Sobre e1tér- investigador
mi n o po bl ación se ha n d ad o difere ntes definiciones , aunque esenc ia l- tica obtener
men te lad as a luden a lo mis mo. Amó n ( 1984), po r ejem plo, defi ne el tér- describir adc
mi no población de la siguiente manera: «Conjunto de objetos (realmente cultad, lo qll
existentes o posibles) que verifican una definición bien determi- esle subcon,
nada ... » describir 1~
la que ha sic
Por objeto se puede entender cua lqu ier elemento, sea persona, animal, se le denom
cosa, o l'ga nismo, institución, etcétera, que cumpl a con la definición. Esta
definición siempre se hace en relación a algun a ca racte rfstica, y los ele-
1..0 (undan
men tos que la cumple n, y sólo esos, pueden formar parte de la población.
De acuerdo con esto. daremos una definición ge nél-ica de población, en tengan valide
EL ANÁLISIS DE DATOS Y LA MEDICIÓN EN PSICOLOGíA 27

su acepción estadística, que es básicamente igual a la ofrecida por Bote·


lla, León y San Martín (1993):

I Por población estadística se entiende el conju nto de todos los ele-


I mentas que comparten una o varias caracteríslicas

A cada u no de los elementos que componen una población se le deno.-


mina de manera genérica entidades estadísticas, y de acuerdo al núme-
ro de las en tidades que la componen, una población puede ser finita o
infinita, E l conjunto de españoles que padecen trastornos epilépticos, los
municipios con cinco mil habitantes o menos, los parados registrados en
el Instituto Nacional d e E mpleo, el conjunto de li bros p ublicados en un
año por una editorial, el total de accidentes d e tráfico ocurridos en las
carreLeras españo las durante el año 1999, son ejemplos claros de pobla-
ciones fi nitas. Por el contrario, el lanzamiento reilerado de una moneda,
o el conjunto de números naturales (1,2 ,3 ... ), son ejemplos de poblacio-
nes infin itas dado que no hay un límite establecido en ninguno de estos
dos conjuntos; siem pre se puede tirar la moneda una vez más y, respecto
al conjun to d e números naturales, por muy grande que sea u n n úmero
siempre habrá otros que lo su peren.
La teoría es tadística proporciona procedimientos diferentes para tra-
tar con ambos tipos de poblaciones, pero a medida que el tamaño de una
población 6 ni ta se incremen ta se puede considerar a efectos prácticos
estadísticos como si fuera infinita . Esto es lo que sucede en general, aun-
que no siempre, en las ciencias sociales, donde el tamaño de las pobla-
ciones objeto de interés es lo su ficien temente grande como para ser tra-
tadas como virtualm ente infini tas (o finitas no numerables).

ACLARACIÓN: El hecho de que las poblaciones que tienen interés para el


investigador social tengan numerosas entidades, hace imposible en la prác-
tica obtener información de todos y cada uno de estos elementos para poder
describir adecuadamente alguna de sus propiedades . Para superar eSla difi-
cultad, lo que se hace es trabajar con un subconjunto de la población, y en
este subconjunto se efectú an las operaciones pertinentes que permitirán
describir las propiedades que luego serán inferidas a la población tOlal de
la que ha sido extraído el subconjunto. A este subconjunlo de la población
se le denomina m uest ra.

Lo fundamental de tm muestra, para que las inferencias que se hagan


tengan validez, es que sea representativa d e la población d e la q ue ha
28 ANÁLISIS DE DATOS EN PSICO LOClA 1 EL ANÁLISIS O

sido extraída. Una muestra no r ep resentaliva puede aportar una des-


cripci ón distors io nada , y por tanto incOITeCta, de la población. Si se quie- Pa
re, por eje mpl o, estudiar por medio de una encues ta la acti tud de los E
madrileños hacia los espectáculos taurinos, y para ello el encuestador se
si túa e n la puel1a grande de la plaza de lOros de las Ventas y pregunta a
una per"sona de cada cuatro que van saliendo su opinión sob,"c el asunto, Es import
lo más probabLe es que ésta sea mayotilaliamente [avorable. Si con los nales tienen'
resultados de esa muestra se hace una inferencia al conjunto de los madri- por el contra
leños. la conc lu s ió n será claramen te equivocada, pues la muestra no es se extraigan (
representativa de todos los madrileños. Así pues, definiremos la muestra investigador~
de la s iguien te ma nera: maco para au
(Virus de lnn
Una muestra es un subconjunto representativo de los elementos tra de 100 in<
de una población ca. Al cabo dE
aumentado hl
to de mejora '
100 indjviduo
La eSlJ.drstica ha desarrollado un eampo específico en el que se estu · tado las defer
dian métodos para la extracción de muestras representat ivas de una ca, con un va
población, y que se e ngloban bajo la denominación de muestreo. En este ció n de dicht
libro no vamos a tratar ningu no de esos m étodos, pero a l lector intere· infectados, PI
sado le remi\imos a obras especifi cas tales como Azorin 'j Sánchez·Cres· mo el camete
po ( 1986).
Por fortun
yos una y otr:
técnicas de h
poblacional h
El objetivo de una inves tigación es caracterizar las propiedades de las técnica se der
poblaciones objeto de estudio. Esta caracterización se reali·t.3 mediante Con objet<
determinados va lores numéricos que resumen la poblaCión. Estos va lo· una diferente
res pueden referi rse a porcentajes, promed ios o algunos o tros que van a parámetros ~
aportar información sobre esa población. A cualquie ra de esos valores tras que para
numé ricos que se refieren a la población se les denomina parámetro. Sin las del a1fabe,
embargo, ya hemos visto que, dado que por lo general cltota l de la pobla. porción y deS'
ción es inacces ible al invest igador, y por lanto los diversos pará metros de en la mues lra
esa población son desconocidos, hay que servirse de una muestra (o sub·
conjunto de la población) para obtener la info nnació n que se precisa acer-
ca de la poblaCión. Con esa muestra el investigador va a calcu lar los valo-
res resu men, y co n esos resultados va a infedr detelminada propiedad a \':\':\, Ca .. "
la població n total. Pues bien, a cualqui era de esos va lo res I-esumen obte·
nidos en la mu eS ll-a se les denomina estadístico . Di cho esto, se pueden Uno de l o~
darlas s iguientes definiciones: propiedades e
EL ANÁLISIS DE DATOS Y LA MEDICIÓN EN PSICOLOGÍA 29
- - -- - - - - - - - - - ,
Parám etro: propiedad descriptiva de una población
Estadístico: p ropiedad descriptiva de la m uestra

Es importante te ner en cu enta que m ientras los parámetros pOblacio-


naJes tienen valores únicos, aunque sean desconocidos, los estadís ti cos,
por el con trario, p ueden tener tantos valor es di fere n tes com o m uestras
se extraigan de la población . Supongamos, p or ejemplo, que u n grupo de
inves tigadores ha estado trabajan do en la ela boración de un nuevo fá r-
maco para aumentar las defensas inmunológicas de los enfermos po\' VIH
(Virus de Inmunodeficiencia Humana). Para probarlo eligen u na mues-
tra de 100 individuos con rucha enfermedad y les adm inistran el fárma -
co, Al cabo de un tiempo observan que, de los 100 individuos, a 40 les ha
aumentado las defen sas. Este resultado favorable del cuarenta por cien -
to de mejora es un estadístico. Si posterionnente eligen otra m uestra de
100 individuos, y después del tratamiento observan que en 45 han aumen-
tado las defe nsas, este resultado , 45 por ciento, es tamb ién u n estadísti-
co, con un valor d iferen te al obtenido en la m u estra an terior, La repeti-
ción de dich o experimento clínico con o tras muestras d e in d ividuos
infectados, produ cirá resultados diversos, y todos ellos tendrán asimis-
mo el carácter de estadísticos.
Por fortu na, en la práctica investigadora no es preciso repetir los ensa-
yos una y otra vez, sino que, a p artir de una m uestra representativa, las
técnicas de la estadística infer encial permitirán estimar el parám etro
pobJacional basándose en los resulr.ados obtenidos en dicha m uestra. Esta
técnica se denomina Estimación de Parámetros.
Con objeto de distinguir los parám etros de los estadísticos se emplea
una diferente simbología para cad a u no, Para representar los diversos
parámetros se u tilizan letras del alfabeto griego, tales como ~ , '!t, 0, m ien-
tras que para representar los estadísticos se utilizan las letras mayúscu-
las del alfabeto latino tales como X, P, S" para representar a la media, pro-
porción y desviación típica, respectivamente, tanto en la población como
en la mues tra.

1.3.:3. CaJ'udel'ísiica y modaHdad

Uno de los objetivos de la investigación psicológica es determinar las


propiedades de u n a detenninada población, propiedades que estarán pre-
30 ANÁLISIS DE DATOS EN PSICOLOClA I EL ANÁLISIS DE

sen tes en todos y cada uno de los individuos que la confonnan. Sin embar- desarrollo de
go, aunque todos los elementos tengan esa prop iedad no todos la tienen (1824- 1907), q
e n el mi s mo grado. Po r ejemplo, una prop iedad de los mamíferos es el media nte núm
sexo, que presenta dos alternativas: macho y hembra; una propiedad d e ce algo sobre I
Jos seres humanos es el estado civil. con sus diferentes alt ernativas: sol- came nte, el ce
tero, casado, separado, viudo. etc.; otra puede ser las creencias religiosas: en Cowles, 19f
cd st ianos, mahometanos, budis tas ... agnósticos o ateos.
De estas y.
E n estos ejemplos se ve que las propiedades de los individuos de una que la merució
población pueden adoptar d iversas variedades. En términos estadrsticos, medición? En
a la propiedad de los individuos de una poblaci.ó n se le deno mina ca r-ac·
teristica , mien tras que a las di ferentes variedades de esa caractetistica se
le d enomi na modalidad. Medici6t
o caracteris
Un a caracter(s tiea es una propiedad de los individuos de una
población. Una I1lodalidad es cada uno de las v3!ianles como se mani-
Fiesta una ca racterística. Esta definic
1'05, y por otro
li dades. Entre
El estado civil. o las creencias religiosas, son caracteris licas que pre- trQ de! mund(
sentan pocas modalidades. Por el contralio, muchas caracteristicas o bje- modalidades e
to de estudio científico pueden presentar un número casi infinito de moda- son verificabh
lidades. S i tomamos por ejempl o la a ltu ra o el peso de la población b ien, medir s u
española, estaremos a nte caractensticas con un infinito número de moda- números y el r
lid ades, pues au nque dos modalidades estén muy próximas, s iempre son en e! mundo m
pos ib les moda li dades intennedias. van en el mUfi(
ricas que pued
En el á m b ito de la Psicología los estudios se refieren a características ceñimos por ej
ta les como perso nalidad, m emoria, percepción, ate nció n , inteligencia , vicluo (no imp<
motivación, etc. Respecto a cada una de estas caracterfst icas los indi vi- dar a 011'0 ind
duos adoptan d iversas modalidades, y estas modalidades, para poder ser
as ignen a estas
tra tadas estadís ti came nt e, han d e estar ex presadas en fo rma numérica.
s uperior del p:
En la p l-óx ima sección tratare mos el proceso de as ignación de números primer individ
a las moda li dades de una ca racterís tica.
esas dos moda
to a otra ca ra(
m3rse que un ¡
lA, \lI.DI('IO\ 1 I.SC\1. \S DI. IIEllID\ diferente a otn
simplemente lz
«Hasta que un fe nó meno de cualqu ier rama del conocimiento no ha otro. Pues biet
sido some ti do a la med ición y c uantificado no puede asumir el esta tuto ciones que se j
y di gnidad d e una Ciencia ,.. Co n estas co ntunden tes pa labras, Francis con los llamad
Galton ( J 822- 19 1 t) afirma ba la importancia ce nt ra l de la medida en el medida.
EL ANÁLISIS DE DATOS Y LA MEDICIÓN EN PSICOLOGíA 31

desarrollo de la ciencia. En esta misma línea se expresaba Lord Kelvin


(1824-1907), quien afinnaha que «sólo cuando se puede medir y expresar
mediante números aquello de lo que se habla, puede decirse que se cono-
ce algo sobre ello; si no se puede medir, y no se puede expresar numéri-
camente, el conocimiento adquirido es pobre e insatisfactorio.» (dtado
en Cowles, 1989).
De estas y otras afirmaciones análogas se desprende la importancia
que la medición tiene en el quehacer científico. Pero ¿qué se entiende por
medición? En su sentido más general , puede afinnarse lo siguiente:
,

II Medición es el proceso por el cual se asignan números a objetos


o características según determinadas reglas .

Esta definición implica poner en correspondencia, por un lado, núme-


ros, y por otro objetos o características con sus correspondientes moda-
lidades . Entre los números se dan ciertas relacion es que son válidas den-
tro del mundo aritmético, que es un mundo ideal. También entre las
modalidades de las características se dan detenninadas relaciones que
son verificables en el mundo empírico, es decir en el mundo real. Pues
bien, medir supone poner en relación estos dos mundos, el ideal de los
números y el real de los objetos, de modo que las relaciones que se dan
en el mundo numérico preserven exactamente las relaciones que se obser-
van en el mundo empírico, y sólo serán válidas aquellas relaciones numé-
ricas que puedan ser verificables empíricamente (Stevens, 1946). Si nos
ceñimos por ejemplo a la característica peso, puede decirse que un indi-
viduo (no importa de qué especie) presenta una modalídad de peso supe-
rior a otro individuo. Dada esta relación empírica, los n úmeros que se
asignen a estas modalidades deben reflejar de manera inequívoca el peso
superior del primer individuo respecto del segundo: si, por ejemplo, el
primer individuo pesa el doble que el segundo, los números asignados a
esas dos modalidades deben reflejar exactamente esta relación. Respec-
to a otra característica tal como el sexo, no puede em píricamente afir-
marse que un detenninado sexo sea superior a otro, sino que un sexo es
diferente a otro, por lo que los números asignados a cada sexo reflejarán
simplemente la diferencia, sin que ello suponga superioridad de uno sobre
otro. Pues bien, la medición, como ya se ha dicho, debe reflejar las rela-
ciones que se obsel\1an en el mundo empírico, y para lograrlo se cuenta
con los llamados modelos de medición, más conocidos como escalas de
medida.

32 ANÁ LISIS DE DATOS EN PSICOLOGlA I EL ANÁLISIS Of

Una escala de medida es, en un sentido ge neral. un procedí·


miento mediante el cual se relacionan de manera biunívoca un
conjunto de modalidades (distintas) con un conjunto de nÚlne·
ros (djstintos).

Esto es, a cada modalidad le correspo nde un s610 núm ero, y a cada
núme ro le con-esponde una sola modali dad. Un ejemplo claro y popular
de escala de med ida es la conocida regla que sirve para medir d istancias
en tre dos puntos. Una regla puede ser cualquier vari lla de madera. plás-
tico du ro o metal, en la que aparecen marcadas un conjunto de rayas equi-
d istan tes entre sí. A cada raya le corres pond e un número , y s6lo uno, de
modo que entre rayas y números se da una relación biunívoca. En el caso
de la regl¡:l las relac io nes empÍlicameme velificables entre las rayas, y por
ende entre los números que las representan, son de sobra conocidas, lma-
gin emos un a reg la con cien rayas equid istant es, num eradas en orden
asce ndente de cero a cien; es decir 100 intervalos iguales, La distanc ia
que hay entre la raya O y la raya SO es exacta mente la mitad de la que hay En los pr6xi
entre la raya O y la raya 100; o tra ,'elación es, po,' ejemplo, que la distan- de medida y I ~
cia que hay ent re la raya 25 y la raya SO es la misma que hay entre la raya se distorsionen
70 y la raya 95. lidades de las e

Sin embargo, en el ámbito de la Psicología, yen general en las cien-


cias soc iales, las relaciones que se pueden velificar nO siempre alca nzan
este nivel de complejidad , Pues bien, atendiendo a las relaciones que pue-
1.-1.1. 1."-,,1,,
d an ve rifi carse empíricament e entre las modal idades de los objetos o
caracte,isticas pueden distinguirse cuatro tipo de escalas de med ida, segú n En todas aq
el esquema tradicional propuesto por Steve ns ( 1946) en su plimera publi- comprobación
cación sob re teoría d e la medida, gualdad, su re~
te no minal. Si, J
Además de la complejidad de las relaciones velificables empíricamente, gen de los ciud¡
hay otro concepto jntimamente relacionado con las escalas de m edida, el número diferet
de transformación admisible , concepto que hace referencia a l proble- n(m1Cros o mocil
ma d e la unicidad de la medida y q ue pu ede plant earse de la siguiente mos atribuir, p(
manel'a: ¿ son las represemaciones numéricas que hacemos de las moda- los de España, l
lid ades las únicas posibles? La respuesta es un rot un do NO, ya que cual- el I S a los c iud~
q uiel' representac ió n numérica que preserve las relac iones empílicamente sólo podemos al
veli ficab les será esenciaJmente correcta, En el sigu iente esquema (Fig, 1.1) ro per1enecen a
se representa el proceso de medición, donde 0 , representa un objeto cual- ce a un Estado e
r
quiera, X, es un número, es la regla que asigna a cada obje to un núme- con ella sólo pUl
ro y g es la transformac ión admi sible de la escala. nes de igualdad-i
EL ANÁLISIS DE DATOS Y LA MEDICIÓN EN PSICOLOCIA 33
ESCALA

1
o, -- ----------------- - X, --
o, ...
~~i~> '- X, n

'M '
o, --- XI ---

,o. n
- X~ --

clo\l.~.
)

1
Fig. l . l. Representación del proceso de medición.


I En los próximos apartados, trataremos cada una de las cuatro escalas
de medida y las transformaciones que cada tipo de esca la ad m ite sin que
1 se distorsionen las relaciones em pÍlicas que se verifican entre las moda-
lidades de las caractelísti cas u objetos.

1
IA _!. ,. ..,,'ala nominal
)

1 En todas aquellas modalidades o ca rac terísticas en las que la única


comprobación empírica que puede h acerse es la de igualdad o desi-
gualdad, su represe ntació n numérica ha de tene r un carácter meramen-
te nominal. Si. por ejemplo, pensamos en la caractelís tica «Estado de OIi-
gen de los c iudadanos miembros de la Unió n Europea .. , y asignamos un
Illll11erO diferente según el Estado de origen, tendremos un to tal de 15
números o modalidades diferentes (tantos como Estados miembros). Pode-
, mos atdbuir, por ejemp lo, un 1 a los ciudadanos de Luxemburgo, u n 2 a
los de Espaii.a, un 3 a los de Alemania, y así suces ivamen te hasta at¡'ibu i¡-
el15 a los ciudadanos de Finlandia. Mediante esta a tribución numérica,
, sólo podemos afi lmar que dos ciudadanos que comparten el mismo núme-
) ro pertenece n al mismo Estado y, si no lo compal1en, cada uno pel1ene-
ce a un Estado diferente. La escala no m inal se ca racte¡iza, pues, porque
con ella sólo pueden representarse, y aceptarse como válidas, las relacio-
nes de igualdad-desigualdad de las modalidades de una detenninada carac-
34 ANÁLISIS DE DATOS EN PSICOLOGíA 1 EL ANÁLISIS DE

terística. En el ejemplo an terior, el hecho de atribuir un I a los ciudada- nar un 5 a la pi


nos de Luxemburgo y un 15 a los de FinJandia no supone, en ningún sen- naciones (5 y 4
tido, que éstos sean m ejores que aquellos; s610 son diferentes respecto a dad de la carac
la característica «Estado de origenll. Se podria haber intercambiado ambos y O).
números (un 1 para los de Finlandia y un 15 para los de Luxemburgo) y
el sign ificado sena el m ismo.
A este ni vel de relaciones empíricas (igua ldad-desigualdad) el hecho 1.'¡.~. l., ... tI.
de atribuir números hay que entenderlo como simples símbolos y por tan-
to no goza n de propiedades matem áticas. No se pueden sumar, restar, En algunas (
multip licar o d ividi r, y tanto daría, p ues, camb iarlos por símbolos no ciones de un nh
num éricos. Si identificál'amos a los ciudadanos por med io de la bandera teriza la escala
del Es tado de origen , selia tan válido como el atri bui rles números, caracteristica ,
que Jos represel
Mu chas so n las C3mcterísticas qu e sólo pueden se r represe nt adas a Un ejemplo típi
nive l nominal. En el ámb ito de la psicología de la personalidad, por ejem- la dureza de lo~
plo, se habla de personalidad extrovertida o perso nali dad introve rti da, que otros por el
términos que se refieren a la ma nera como los seres humanos nos rela- Ira de la gama (
cionamos con el entamo social. Las ti pologías respecto a l ca rác t el~ segú n que es rayado t=
la cu al los se res humanos pueden encuadra l"'Se en una de las cua tro cate- duro, porque ell
godas: flemático, melancólico, san guíneo o colérico, son también un ejem- otro mineral. Pt
plo de escala no minal de ca racterísticas ps icológicas, nstica dureza, e
Fonna li7..aremos ahora lo dicho sobre la esca la nominal. Supongamos Las relacion
que disponemos de un conjunto de n objetos con una detelminada carac- la igualdad-desil
lelistica que adopta distintas modalidades, A la modalidad de un objeto terística «durez.
genél'ico i la I'epresentaremos por 0 , y el número asignado a ese objeto, rente de otro y é
{(O,), será X" De la misma manera a la modalidad de un objeto i la desig- numérica estab
naremos por 0 1y el número asignado será XI' La asignación de los núme- mente las relacic
ros a los objetos, de modo que se preserven las relaciones empÍlicas obser- ros a los minen:
vadas, deberá cumplir las s iguientes condiciones: el yeso, y así SUI
Los valores asig¡
Si O, '" O; entonces X, ::: XI minera l detenn
ha asignado el '
Si 0 , * 0 , entonces X, * X, minera l es cmru
3 que le s iguen,
En el ámbitc
Después de lo expuesto hasta el momento respecto a la esca la nom i- e n las que las rt
na l, es fácil adivinar el tipo de transformación admisible que se puede caracteristicas, I
aplicar: cualquiera que preserve las relaciones de igualdad-desi- libro, nos han II
gualdad de los objetos respecto a una determinada característica. En todos los CUI
Respecto a la carac terís tica sexo, se puede asignar un 1 a la modali dad tenido que expo!
«he mbra ,. y un O a la modalidad «macho ,. , pero también se puede asig- de curso (los fal
EL ANÁLISIS DE DATOS Y LA MEDICIÓN EN PSICOLOGÍA 35

nar un 5 a la primera modalidad y un 4 a la segunda; estas últimas asig·


naciones (5 y 4) preservan las relaciones empíricas de igualdad-desigual·
dad de la caracten stica sexo lo mismo que las preservan las primeras ( 1
y O).

1A.2. Es .. ala OI·dil1al

En algunas caractensticas objeto de estudio científico se observan rela-


ciones de un nivel supelior al de la simple igualdad-desigua1dad que carac-
teriza la escala nom inal. Los objetos pueden manifestar determinada
caracteristica en mayor grado unos que otros, de modo que la escala
que los represente debe preservar esas relaciones empíricas observadas.
Un ejemplo típico, y que al lector le resultará sin duda fam iliar, es el de
la dureza de los minerales. Se sabe que unos minerales son más duros
que otros por el procedimiento empírico de que unos rayan a otros. Den-
tro de la gama de minerales, el talco es el mineral menos duro, debido a
que es rayado por todos los demás, mientras que el diaman te es el más
duro, porque empíricamente se comprueba que no es rayado por ningún
otro mineral. Pues bien, la escala que sirve para representar la caracte-
rística dureza, debe reflejar inequívocamente estas relaciones empíricas.
Las relaciones observadas entre los minerales presentan, ad emás de
la igualdad-desigualdad, una ordenación en función del grado de la carac-
terística «dureza». De un m ineral genérico se puede afirmar que es dife-
rente de otro y además que es más o menos duro que éste. La asignación
numérica establecida en el caso de los minerales preserva inequívoca -
mente las relaciones empíricas. En orden ascendente se asignan t O núme-
ros a los minerales en función de su dureza. El 1 para el talco, el 2 para
el yeso, y así sucesivamente hasta el diamante, al que se le asigna ellO.
Los valores asignados informan adecuadamente de cómo se comporta un
mineral detenninado respecto a esa característica: si, por ejemplo, se le
ha asignado el 7, el lector de la escala sacará la conclu sión de que ese
mineral es «más duro» que los 6 que le preceden y «menos duro » que los
3 que le siguen.
En el ámbito de las ciencias sociales, muchas son las características
en las que las relaciones empíricas de los objetos que comparten dichas
características, tienen un carácter ordinal. Al lector, y a los autores de este
libro, nos han medido más de una vez de acuerdo a una escala ordinal.
En todos los cursos académicos de la etapa de estudiante, cualquiera ha
tenido que exponer sus conocimientos en las más diversas materias a final
de curso (los famosos exámenes) y éstos han sido juzgados por un profe-
36 ANÁ LISIS DE DATOS EN PS ICOLOGíA 1 EL ANÁliSIS

sor O grupo de profesores de acuerdo a una escala ordinal. Si no se sabe


nada de la materia, o se sabe muy poco, lo más probable es Que el juicio
que el profesor haga de su exposición sea de . s u spenso »; por el con tra-
rio, s i se sabe bi e n la materia. y de igual manera se expresa, lo más pro-
bab le es que el juicio sea de ",sobresalien te». Si en vez de estos télminos
se emplea una escala numé¡;ca (O para s uspenso, I para aprobado. 2 para
notable, 3 para sob resa liente y 4 para matrícula de ho nor, s igui endo la
asignación numédca administrativa que se emplea en los estudios supe- Respecte
riores), la conclusión que sacará elleclor de. po nga mos, dos expedientes med ida, pUl
académicos de 2 alumnos distintos que hayan cursado una misma male- válida sieml
ria, es que s i u no de los alumnos ha ob tenido un 3 y el o tro un 1, el pri- ciente. en q
mero ha exhib ido un mayor conocim iento de la mater ia qu e el segundo, a una serie d
o, lo qu e es lo m is mo , que el segundo tenía menos conocimientos que el grado de ma,
primem. 7, 9 Y 11 (res,
peta las can<
Como ya se ha menc ionado, en las llamadas ciencias sociales (Psico-
trario, si se ¡
logía. Sociología, Política , Economía ... ) son muchas las ca racte ríst icas
valor por - 1),
objeto d e est udi o c uya medida sólo admite un ni vel ordinal. De hec ho ,
da de las dos
según seiiala Us lanel~ «el tipo de infOlmación más fiable que con más fre-
madón admi
cuenc ia usa el científico soc ial es de cankter o rdina l" (en la intmducc ión
del libro de Hildebra nt , Laing y Rosenthal. 1977). Veamos a lgu nos ejem-
plos.
!.-I.:!. ,.:,""
Los ps icólogos, e n s us aná lisis de variab les psicológicas que afectan
la conducla huma na, p"eguntan por reacciones a estímulos que se expre- Si, ademfu
san e n ténninos de _más" o «menos" intensos. Los sociólogos preguntan objetos, y la n
a los ciudadan os por el ni ve l d e prestigio socia l que atribuyen a pmfe- senten esos 01
s iones tales co mo vendedol~ psicólogo, secretario, fo nlanem, mat ro nas y to da que ésta
sepuhureros. Los politólogos, por su parte, también recaban la informa- ya que penni)
ció n relativa a la ideología política de los ciudadanos de acuerdo a cri te- cias en tre las
r ios como «izquierda, liberal. conservadora ». En todos los casos, se tra la de, por ejempl
de es tabl ece ,' un orden res pecto a alguna carac terís tica, según que los o bjetos (los ter
o bjetos eva luados la presenten «en mayol: menor o igua l grado». la es relativan¡
duce en agua (
Formalizaremos ahora lo dicho sobre la esca la o rdinal. Supongamos y se enfria has
que d isponem os de un conjunto de n objetos y cadí.\ uno con una cierta de m ercurio al
magnitud en una caractelÍstica detemli nada que adopta dis tintas moda- to se marca el
lidades. A la magnitud de un objeto genérico i la repl'esentaremos por O, lIición, y se ma
yel núm ero asignado a ese objeto, ((O,), será X,. De la misma manera a dido el mercur
la magni tud de un objeto j la design<lre mos por Ojy el número asignado divide e n I 00 ~
será XI" La asignación de los números a los objetos, de modo que se pre- y que es en def
serven las relaciones empíri cas o bservadas , deberá cum p lir las sigui en- to la unjdad de
tes cond iciones: origen de la es<
EL ANÁ LISIS DE DATOS Y LA MEDICiÓN EN PSICOLOGíA 37

Si Di =' Di entonces XI =' Xi


Si O; > O¡ entonces Xi > Xi
Si Di < Di entonces X; < XI
1
Respecto a las transformaciones que admite la escala ordinal de
med ida, pued e decirse que, en general , cualquier transformación es
válida siempre que preserve el orden de magnitud, creciente o decre-
ciente, en que los objetos presentan determinada característica. Si
a una serie de objetos se les asigna los números 30, 32, 34 Y 36 según un
grado de magnitud creciente, la transformación que lleva a los valores 5,
7,9 Y 11 (restar 25 a cada número), es perfectamente admisible, pues res-
peta las condiciones de construcción de una escala ordinal. Por el con-
trario, si se asignaran los valores -30, - 32, - 34 Y - 36 (multiplica r cada
valor por - 1), las conclusión de su lectura seria muy diferente de la extraí-
da de las dos asignaciones anteriores, y por tanto no sería un transfor-
mación admisible.

1.4.3. Escala de intt'rvalo

Si, además de la posibilidad de evaluar la igualdad -desigualdad de los


objetos, y la mayor o menor magnitud que de alguna caractenstica pre-
senten esos objetos, se puede contar con alguna unidad de medida, tan-
to da que ésta sea arbitraria, la mejora en el nivel de medida es sustancial,
ya que pennite establecer la igualdad o desigualdad de las diferen-
cias entre las magnitudes de los objetos medidos. Esto es lo que su ce-
de, por ejemplo, con las escalas que penniten medir la temperatura de los
objetos (los termómetros). El proceso de construcción de este tipo de esca-
la es relativamente simple. Para la escala Celsius. por ejem plo, se intro-
duce en agua destilada una varilla de cristal con mercurio en su interiOl~
y se enfr ía has ta el nivel de congelación. A esa temperatura, la columna
de mercurio alcanzará una altura detenninada en la varilla. En ese pun~
to se marca el O. Luego se calienta el agua has ta la temperatura de ebu-
llición, y se marca con un 100 el lugar de la varilla hasta donde ha ascen-
dido el mercurio. El espacio de varilla entre las dos marcas (O y 100) se
divide en 100 partes, y cada parte es el archifamoso «grado cenlígrado»,
y que es en definitiva la unidad de la escala Celsius de temperatu ra. Tan-
to la unidad de medida , el grado centígrado (simbolizado por OC) como el
origen de la escala, el punto O, son completamente arbitrarios. La unidad
38 ANÁLISIS DE DATOS EN PSICOLOClA I EL ANÁLISIS

surge por la divis ión e n 100 partes qu e hacemos del tramo de la va rilla Respec tl
qu e media entre O y 100, pero también se ha bria podido dividir en 60. escala de in
tipo:

ACLARACiÓN: Una de las características de la escala de in te rvalo es. como


se ha vis to, que el punto cero es arbitrario y no sign ifica carencia absoluta Es decir,
de la ca..-acteríslica medida. En el caso de la temperatura en grados centr- esca la de in
grados el valor O no s ignifica ausencia de temperatura (c3ractcristica), s ino
estipuladas.
temperatura de congelación del agua destilada.

AClAMCI
Una vez medidos un conjunto de objetos co n una escala de inlc lva los res puesta, ¡
ra 0, una v
se p ued e n eX lme '- algu nas conclus iones int eresa nt es. Por eje mplo , y
escala origi
siguiendo con la característica temperatura, s i dos objetos tienen una tem- tivo, la tral
perat ura de 40 y 46 ce, I'especti vamente , y otros dos objetos, ti enen una invariante J
temperatura de 27 y 33 ce , respectivamente, se puede afirmar que la dife- un se ntido
renc ia de tempe rat ura es igual entre los objetos J y 2, qu e entre los obje-
lOS 3 Y 4 , S i se m ide la temperatura de a iras dos obje tos y resulta ser de
14 y 17 grados , respectivamen te, podemos afirmar que la diferencia d e Un ejemp
tempera tum (3 grados) es infcl;or que la diferencia de temperatura de los ta nuevamen
obje tos J y 2 (6 grados), Este tipo de afirmaciones acerca de la igualdad escala Celsiu!
o desigualdad de las diferencias es im posible en una escala ordinal. pasar de una
Otro ejemplo, también muy fa miliaJ~ de escala de intelvalo es el calen- formac ió n:
da rio que, de una otra ma nera, pauta nuestras vidas, Por razones histó-
rico-religiosas se tomó como punto O el nacimiento de Jesús; y, por razo- Según est~
nes astronómicas, se tomó como unidad de medida el tiempo que tarda ponde con el
la tíen... en dar una vuelta al sol (3651 /4 días). escala se corr
FO l'malizare mos aho!'a lo dicho sobre la escala de intelvalo. Supon- do centfgraclc
gamos que d isponemos de un conjunto de 11 objetos y cada uno con una do Fahrenhei
cierta magnitud en una ca racterís ti ca determinada que adopta di stin- dial de estas e
las modalidades, A la magnitud de un objeto genérico i la re prese ntare- de las diferen
r
mos po r O, y el número asignado a ese objeto, (O;), será Xi' De la mis ma En Ps icolc
manera a la magnitud d e un objeto i la des igna remos pOI' O; Y el número lineales.
as ignad o se rá X;, a la magnitud de un objeto k la designa re mos po r Ok y
el número as ignado se rá Xl; y a la magnitud de un o bje to 111 la des igna re-
m os po r 0 ,,, y el número asignado será Xm • En lonces deberá n cumplirse ACLARAC II
las s iguien tes condiciones: parar valore
ra transfom
resulta.do de
Si O, - 0 , = Ok - 0 ,,, entonces X, - X, = X k - X m s u lectura rf
Si 0 , - 0 , > Ok - 0 '" entonces X, - X, > X4 - X", pos itivos, y
Si 0 , - 0 , < O, - 0 '" entonces X, - X, < X, -Xm segunda tra l
lA 1
EL ANÁLISIS DE DATOS Y LA MEDICIÓN EN PS1CO LOGIA 39

iJla Res pec lo a las transfonnaciones admisibles de los va lores d e una


escala de intcl"Valos. la condición que han de cumplir es que sean del
'. tipo:
g (x) = a + bx s iempre que b > O.
)

• Es dccil~ una trans rormación lineal ta l de los valores iniciales de una


escala de interva lo deja la escala invariante respec to a las condic io nes
)
estipu ladas e n el pánafo anterior.

ACLARACiÓN: ¿Por qué se ha añad ido la condición «siempre que b > O? La


respuesta, a poco que se rcflcx.ione, es bastante obvia. Por una lado, s i b fue-
llos ra O. una vez aplicada la transformación, todos los valores iniciales de la
0, y escala O1iginallcnchían un llnico valor, el de a. Por otro lado, s i b fuera nega-
em- tivo. la transformación que se aplicara a los valores inicia les ma ntendría
una invariante la igualdad o desigualdad de la.;; diferenci as. pem éstas tendtian
life- un sen tido opuesto al de las diferencias de los valon:s iniciales.
bje-
r de
• de Un ejemplo claro de transformación de la esca la d e in terva lo lo apor-
:los ta nueva mente la escala de tempemtura. En a lgunos países se emplea la
dad escala Celsius. m ientras que en otros se emplea la escala Fahrenhei l. Para
pasar de una escala a otra simplemente hay que aplicar la siguiente tm ns-
formació n:
Jen-
°F < (9IS) · oc + 32
.stó-
azo- Según esta transfolmación el valo r cero en la escala Celsi us se con'es-
mla ponde con el valor 32 en la escala Fahrenheit. mientras que el cero de esta
escala se cO'Tesponde con el valor-17.7777 de la Cclsius. Además. el gra-
>on- do centígrado (unidad en escala Celsius) es igua l a nu eve quintos de gm-
do Fa hren hcit. La tl'ansformación deja inva¡-iante la prop iedad primor-
una
.tin- dial de estas escalas: la posibilidad de compara r la igualdad o desigualdad
de las diferencias enll'e pares de va lores.
:are-
, ma En Psicología es fi'ec uente el empl eo de este tipo de transfOlma ciones
nero linea les,
O,y
tare- ACLARACiÓN: Como ve remos en capítulos posteriores. para poder com-
lirse parar valores obtenidos en diferentes pru ebas es obligado llevar una Pl'ime-
ra transfOnl1flción que se conoce como tipificació/I de las IJ/lIIWociolles. El
resultado de este proceso. produce valores positivos y negativos. por lo que
su lectura resulta algo compl icada, Para convCl't ir los valores negativos e n
positivos. y mantcner las relac io nes de la escala orig ina l se procede a una
segunda transfomlaci6n lineal,
40 ANÁLISIS DE DATOS EN PSICOLOGfA 1
EL ANÁ LI SIS DE :

una ca racterls
magnitud de UI
Como hemos explicado en el epígrafe anterior, las escalas de interva- asignado a ese
lo sirven para medir característ icas en las que el valor cero no significa de un objeto i ¡,
ausencia de dicha ca racterística, lo cual limi ta necesariamenle las con- magnitud de UJ
clusiones que se pueden extraer. En el caso de la escala de temperatura, será XI: y a la m,
una conclusión del tipo: «si un objeto 1 tiene una temperalUra de 30°, y ro asignado ser
Ol ro objeto 2 tie ne una temperatura de 60°, el objeto 2 tiene el doble de ciones:
temperatura que el objeto /", sería totalmente im p rocedente por inco-
n -ce la. Al no existir un cero absoluto, como valor que representa la ausen-
cia de caractelislica, no se pueden establecer conclusiones en términos Si
de razones ent re valores . Si
Si
Pocas so n las caractedsticas objeto de est udi o científico q ue admitan
una med ida co n escala de razón, y la mayoda d e ell as forman pal1e de l
abanico temá ti co de las denominadas ge nérica mente como «C iencias de
la Na tu raleza ». Carac lerísti cas tales como la di stancia (y sus derivados, Al tener un
su perfi cie y volumen), masa, velocidad y tiem po (no en su se ntido cro- admisible para
no lógico, s ino e n su sentido cro nométrico), po r ejemplo, tienen un Ori -
gen absoluto, no arbitrari o, o valor cero absoluto que s r s ignifica a usen-
c ia de caractel"Ística.
Esta transfol
medida de la es<
ACLARACIÓN : Una de las características distintivas de la escala de razón plo de transforn
fl"Cnte a la escala de intervalo es, como.se ha visto, que el pUnlO cero es abso- medida de longi
lula y significa carencia absolura de la caraclcrislica medida. En el caso del da: en el sistem;
peso, medido en gramos, el valor O significa ausencia de peso. Como con- que en algunos 1
secucncia dc ello. las conclusiones que pueden extraerse de la lectura de los valencia entre a
valo,"es de una escala de razón van más allá de lo que pocHa conclu irse de da a otro. Por ej
las escalas antc¡;ores.
se está en dispo:
s ido medida en
Si un objeto cualquiera presenta un valo r en la cal'acterfstica peso de En el Cuadre
75 gramos, y o tro p,"esenta un valor de 150 gramos, puede afinnarse con pueden extraers
toda prop iedad que el segundo objeto pesa exacta mente el doble que el ejemplos.
primel"O. Además, por el hecho de poder establecer razones entre valores,
éstas pueden compararse unas con o tras y colegir s i son o no iguales entre Has ta el mor
sr. Po r ejem plo, tomados otros dos objetos con peso 1.500 gra mos y 3.000 para referirnos
gra m os, respec tivamente, la razón entre ellos (uno pesa el doble que el ticas que se estu
otro) es igual a la razón del peso de los o bjetos cuyos pesos eran 75 y l 50 escalas de medi
gramos. mente a las cat
se ntación sólo I
Formalicemos lo dicho hasta el mOmento. Supongamos que dispone- moda lidades de
mos de un conjunto de n objetos y cada uno con una ciCI1a magn itud en nal, emplearem¡
EL ANÁ LISIS DE DATOS Y LA MEDICIÓ N EN PSICOLOGÍA 41

una caracter ís tica determinada que adop ta dis tintas m odalidad es. A la
magnitud de un objeto genérico i la representaremos por Di y el nú mero
asignado a ese objeto, f (O;), será Xi' De la m isma manera a la m agnitud
de un objeto j la design aremos por O¡ y el n úmero asignado será Xi' a la
magni tud de un objeto k la d esign aremos por O" y el núm ero asign ado
será X" y a la m agnitud de un objeto m la designaremos por Om Yel núm e-
ro asignado ser á Xm • Ento nces d eberá n cump li rse las s igu ientes con di -
ciones:

Si O¡ ( Di = Okl Om entoncesX¡ (Xi ::, X k I Km


Si O . I O¡ > Ok I Om entoncesX¡ IXi > Xk IX",
Si Di / Di < Ok I O", entonces Xi / X¡ < X k IX",

Al t ener u n o rigen de escala absoluto, la única tr a nsfo rmación


admisible para la escala de razón es del tipo:
g(x)=bx siendo b > O.
Esta transfOlmación supone sim plemen te un cambio en la unidad de
medida de la escala, preservando siempre el origen de la misma. Un ejem-
plo de transformación de escalas de razón son los diferen tes sistemas de
medida de longitud, en los qu e simplemente se varia la unidad de medi-
da: en el sistem a m étrico decimal, se usa el metro como un idad, mientras
que en algunos países anglosajones se emplea la yarda. Sabiendo la equi-
valencia en tre am bas unidades es sencillo pasar de un sistem a de medi-
da a otro. Por ejemplo, sabiendo que una yarda equivale a 0,9144 m etros
se está en disposición de expresar en yardas cualquier longitud que haya
sido medida en metros, y viceversa.
En el Cuadro 1.1. se resum en los tipos de escalas, las conclusiones que
pueden exlraerse de cada una, las tr ansformaciones adm isibles y algun os
ejemplos.
Hasta el momento hemos empleado el término genérico «modalidad»
para referirnos a las di fer entes variedades que presentan las caractens-
ticas que se estu dia.n. Considerando lo que se ha explicado respecto a las
escalas de med ida vamos a utilizar este térm ino par a referirnos ú nica-
mente a las categorias (modalidades) d e una car acterís tica cuya repre-
sentación sólo pu ed e entenderse a nivel nom inaL Para referirnos a las
modalidades de las características medidas a un n ivel superior al nomi-
nal, emplearemos, el término valor o puntuaciÓI1 , teniendo en cuenta que
El ANÁLISIS
42 ANÁLI SIS DE DATOS EN PSICOLOCLA 1

Cuadro 1.1. b) de i
Resumen de las escalas de medida e) de r

Tipo de escala
Conclusiones
QCerca ele •••
Transformockm
admisible E¡.mpIos [IJ La van
una eSt
Relociones del tipo Cualquiera que Xreser. Sexo, ro zo, estado a) ordi
Nominal ve \l!{uoldo Idesi- civil, diog~tico díni-
«igual que» o _distinto
que», oo. b) de r,
900
e) de iI
Relaciones del lipo (ooJquiero que preser- Dureza minerales,
«moyor que-, «menor ve el orden O grado de prestigio social de
Ordinal que., «iguol que., magnitud de los objetos Profesione!, ubicación
ideológica.
0 En un"
valores
mosun
JnlervoJo ~ooldod O desigualdad 0+0· )( Calendario, tempero-
e di(erencíos. (0)01 turo, inteligencia. 35 para
Rozón
~uoldod o desigualdad b· x longitud, mcw, ,iem- a) No e
e razooes. (b>O) po. b) Es u
e) No"
cuando se refiera a características medidas a n ivel ard i na !, es LOS valores la nc
o puntuaciones hay que en tenderlos como grados. rangos u órdenes. indis-
tintamente. 0 Utilizar
res (x):
mación
valores:
1..,. IILSl \11.\ a) g (xl
b) g (xl
En este lema hemos vislO el papel fundamental que juega el Análisis e) g (xl
de datos dent ro del método gene ral de la cienc ia y hemos visto algunos
co nce ptos importa nt es: población y muestra, parámetro y estadíst ico,
c:l I'ac tedstica y modalidad. Pos lcl;O t'mente hemos tratado el problema
m Indique
mación
de la medición y los dist intos ti pos de escala: nominal , ordinal, de int er- a) nom.
valo y de razón con sus caracteristicas pl"Opias (relaciones que mantienen b) nom:
y tra nsfo rmacio nes admis ibles para cada tipo de esca la ). e) toda!

1.11. 1:.I1.1WIClOS
ITl escala
Sea g (x
d
escala d
QJ variables no minales:
L HS a) Sie m
b) Nu n<
a) s6lo pu ede n tener dos valores pos ibles
e) Cuac
)(siempre tiene n 2 o más valores posi bl es
e) las dos a nt eriores son ciel1as
0 La lram
a) Siem
La va l"iable núme ro de palabras recordadas en una prueba de memo-
I'ia es tá en una escala: b) e uax
a) nominal e) Nun<
)LOGfA I
EL ANÁ LIS IS DE DATOS Y LA MED ICi ÓN EN PSICOLOGíA 43

b) de intervalos
e) de razón

La valiable tiempo de reacción ante una serie de estímulos está en


u na escala:
, eslodo a) ordinal
;tiro dini-
b) de razón
e) de intervalos
lif\efole\,
xiol de En una determi nada escala hemos asignado a la vadable sexo los
ubicación
va lores O para «mujer» y I para «hombre )O . Sobre esta escala defini-
mos una transformación de tal forma que tenemos los va lo l·es -20 y
~pero-
!\CIO. 35 para m ujer y hom bre, respectiva mente. Esta transformac ión:
no, tiem· ll) No es admisible para esa escala
b) Es una trans fon nació n ad m isible pa ra esa escala
e) No tiene sentido hablar de transforrnación adm is ible en u na esca-
valores la no mi nal
:s, indis- Utilizando una esca la de razón hemos obtenido los s iguientes va lo-
res (x): 2,5; 3; 8 y 9,5. Sobre estos valores aplicamos una transfor-
mación adm isible, g (x) , para esa esca la y obtenemos los siguientes
valores: 5, 6, 16 Y 19. La transfolTnación que hemos aplicado es:
a)g(x)=x'
b) g (x) =-2x
Análisis c) g(x)=2x
algunos
Ldís tico, Indique en qué escala o escalas es admisible la siguiente transfor-
--oblema mación g (x) = -l /x donde x sólo admite valores positivos
fe inter- a ) nom ina l
mtienen b) nominal y ordinal
e) todas

Sea g (x) = a + bx co n b > O u na tra nsformación adm is ible en una


escala de in tervalos. Esta transforlll <lción será admisible para una
escala de razón:
a) Siempre
b) Nunca
e) Cuando a = O

La transr-ormaci6n g (x) = Xl es admisible para una escala nominal:


~ memo- a) Siempre
b) Cuando x > O
e) Nunca
44 ANÁLISI S DE DATOS EN PSICOLOGÍA I El ANÁLISIS DI

[2] Si una transformación es admisible para una escala de razón


11 Situartenen
sob
a) No lo será para ninguna otra
te, los va
b) Lo será sólo para la ordinal
van la ig.
e) Lo será para todas que pres
La transfOlmación g(x) = Fx que 3 es
embargc
a) Es admis ible en una escala de intervalos
manera.
b) Es ad misible en una escala de razón admisibl,
e) No está bien definida escala de
es más re

1. ~ . SOl 1 ('10\1'''' \ I 0:-; UElH"lCIOS B La respu,


transfon:
escala de
D Las variables nominales pueden tenel' dos valores poSibles (por ejem-
plo el sexo) y se denom inan dicotó m icas (ver próx imo ca pftulo) pero
pueden tomar más de dos valores (por ejem plo estado civil) y se deno- 11 escala
La res pUi
ter
minan polilómicas (ver capítulo siguiente), Por lantO, la respuesta mos - l a:
COITec ta es b. s ib le par~
número a
11 Todas las vmiables que vienen definidas coma «número de ...... , por
ejemplo número de hijos de un grupo de parejas, número de }tems
11 Launarespue:
COITectame nte respondidos . .., y «nú mero de palabras recordadas en escala
una pru eba de memOlia» eS lán en una esca la de razón, Si una per- rior de me
sona ha recordado, por ejemplo, 10 palabras podemos decir que ha cior a tod¡
"ecordado el dob le que o lra que ha recordado 5 y la mitad que una
tercera que ha recordado 20. Por tanto, la respuesta correcta es c, Da La respue
negativos
piejos) y a
11 como
La vadable «tiempo de reacción», tanto si está medida en segu ndos
e n m ilisegundos (q ue suele ser lo habitual en ellaboratodo de negativos.
Psicología) está en una esca la de razón co n un punt o cero absoluto
que ind ica cal'encia del a l¡;buto que esta mos midiendo, en este caso,
el tiem po. La respuesta COlTecta es b.

11 Toda s las esca las t ie nen un conjun to de transformaciones adm is i-


bles por ta nto, la respuesta c no tie ne sen ti do. Los valor es - 20
y, y
35 sigu en mant eniendo la re lació n de igua ldad I des igua ldad que
con 'esponde n a una escala nom ina l. Por tanto , la respues ta COtTec-
ta es b.

11 Las trn.nsfOlmaciones admisibles para una escala de razón son de la


fOl"Ola g (x) = bx con b > O. Por lan lO la solución COITccta es c. Pue-
de comprobarse que los segundos va lo res de la escala son el resul-
tado de mult ipl icar los pl;meros por dos.
EL ANÁLISIS DE DATOS Y LA MEDICIÓN EN PSICOLOGÍA 45

11 Situartenemos los valores, por ejemplo 1, 2 Y 3, en una escala al efec-


sobre ellos esta transformación obtendríamos, respectivamen-
te, los valores: -1, - 1/2 Y -1 /3 . Vemos que los nuevos valores preser-
van la igualdad I desigualdad de una escala nominal. También vemos
que preservan el orden (-113 es mayor que -112 de la misma form a
que 3 es m ayor que 2) correspondien te a una esca la ordi nal. Si n
embargo las diferencias entre ellos no se mantienen de la misma
manera que los valores origi nales de la escala y, por tanto, no es
admisible en una escala de intervalos. Si no es ad misible para una
escala de intervalos tampoco lo será para una escala de razón que
es más restrictiva que ésta. Por tanto, la respuesta correcta es b.

11 Latransformación
respuesta correcta es c puesto que cuando el térm ino a O la
será g con
(x) = bx O que es admisible en una
b >
=

escala de razón.

11 escala
La respuesta correcta es cuando x O, la alternativa b. Si en una
>
tenemos valores positivos y negativos (por ejemplo asigna-
mos - 1 a ser mujer y 1 a ser varón) la transfonnación no será admi-
sib le para la escala pues _1 2 = 12 = 1 impli caría asignar el mismo
número a dos modalidades distintas d e la misma caractensti ca.

11 unarespueSLa
La COlTecta es c. Si una transfonnación es admisible para
escala lo será también para todas las que presentan un nivel infe-
rior de medida y la escala de razón presenta u n nivel de medida supe-
rior a todas las demás.
La res puesta correcta es c. No existe la raíz cuadrada de números
negativos en el campo de los números reales (si en el de los com-
plejos) y además la raíz cuadrada puede tomar valores positivos y
negativos.
Tema 12
Introducción a la probabilidad
12.1. 1\'1'1
SUMARIO
En los (el
12.1. Introducción tadoa lad~
ci6n de los f
12.2. COIICCI'(08IlrC\'ios
entre otros. ~
12.2.1. E.\:pcrimcll1o alculorio generalizar l
'12.2.2. Espacio lIIueslral denominarel
12.2.3. Sucesos tras conc!usi-
12.2.3.1. Operaciones con suce"os probabilisti
12.2.3.2. HcpresclllaciOllcs gTáfica" mos con una
12.3. Definición de probabilidad pura un espacio muestral ducimos el
di~creto HIPÓTESIS.
curso, es ne<
12.:3.1. Definición clásica
12.3.2. Definición cS~':lllíslica La2l.a e.
12.3.3. Definición axiOlllática porciona do
12.4. HC8umcn verosímil o fi.
un juicio o e
12.5. Ejercicios
probable eua
12.6. Soluciones ti los ejercicios verdadero sin
cos alegan r
fumador pad
posiblementl
Otra dcfi
der» porque
Bajo esta in<
determinada
dad de ocur
entiende qUE
En los temas estudiados hasta ahora, el análisis estadísLico se ha limi-
tado a la descripción de un conjunto pequeño de datos mediante la obten-
ción de los índices de tendencia central. de dispersión y de asociación,
entre otros. Sin embargo, en cualquier investigación es importante poder
generalizar nuestros resultados a un colectivo mucho más amplio al que
denominaremos población o universo. En este caso, la extensión de nues-
tras conclusiones requiere llevar a cabo una inferencia que siempre será
probabilística o fonnular una hipótesis que aceptaremos o rechazare-
mos con una detenninada probabilidad. Por esta razón, y antes de intro-
·.1 ducirnos en la INFERENCIA ESTADISTICA Y CONTRASTE DE
HIPÓTESIS, que se estudia en .Análisis de Datos en Psicología Il» en 2°
curso, es necesario abordar el estudio de la probabilidad.
La 21. a edición del Diccionario de la Real Academia Española pro-
porciona dos definiciones de Probabilidad. La primera se refiere a «lo
veros{mil o fundada aparieltcia de verdad,. y equivale al valor de verdad de
un juicio o conocimiento. En este sentido, se entiende que un juicio es
probable cuando existen suficientes razones que permiten aFilmarlo como
verdadero sin que pueda excluirse lo contrat;o. Así, por ejemplo, los médi-
cos alegan razones de peso para decirnos que es muy probable que el
fumador padezca trastornos cardiovasculares siendo esta una afinnación
posiblemente verdadera.
Otra definición se refiere a «la calidad de probable o qlle puede stlce-
den> porque hay buenas razones para creer que se verificará o sucederá.
Bajo esta inclinación, la probabilidad se aplica, no al valor de verdad de
detenninadas proposiciones, juicios o conocimientos, sino a la posibili-
dad de oculTencia de sucesos o acontecimientos y, en este sentido. se
entiende que un suceso es probable cuando puede ocurrir O no. Estudia-
352 ANÁLISIS DE DATOS EN PSICOLOGíA I INTRODUCCU

remos la probabilidad referida en este segundo contexto para lo que nos


serviremos de las matemáticas, pero de una matemática baSlante ele- • CaJcuJa
mental que cualquier estudiante --con conocimientos básicos y aún pro· definicl
veniente de «estudios de letras»- puede adquirir sin gran esfuerzo. mento 1
Haciendo un poco de historia, cabe señalar que el estudio malemáli-
co-cientffico de la probabilidad surge a mediados del siglo XV11 cuando,
en t 654 Y por el interés en los juegos de azar; el caballero de Meré IUVO la , .).,
-._..."
(·O~,

idea de consultar con el matemático Pascal una serie de preguntas orien-


ladas a dominar el desarrollo del azar durante los juegos de cartas o de Antes de i
dados. El problema era decidir si en 24 lanzamientos de un dado tenía el tes, que nos
mismo riesgo apostar la misma cantidad de dinero a favor o en conlra de so, es necesa
la aparición de, por lo menos, un doble seis. Estas y otras preguntas simi- Jé.-.:ico propif
lares dieron lugar a un intercambio de correspondencia entre Pascal y ceptos y la te
Fermal que pusieron las bases para que, más tarde, Laplace diese su defi-
nición, hoy llamada clásica, de probabilidad y que puede considerarse
como el inicio del estudio matemático de la probabilidad y que veremos
I ~.~.1. l ..
más adelante.
Como ya se ha apuntado, necesitamos conocer la probabilidad porque Entenden
cualquier lipo de inferencia que se haga, tanto en la investigación cientí- cual obtenen
fica como en la vida cOlidiana, a partir de la observación de unos pocos fin de realiza
hechos, se realiza en témlinos probabilísticos. En el campo de la Psico· el adjetivo "a
logia, y de las Ciencias Sociales en general, cualquier hipótesis que se for- nmento ale:
mule se acepla o se rechaza en términos probabilísticos. o podemos puede repel
tener una seguridad absoluta (del cien por cien) de que porque veamos resultado nl
romper las olas todos los días en nuestra playa, las olas rompan también nición tanto]
mañana, ni tampoco de que porque unos fumadores padezcan enferme- no entrenada
dades c.ardiovascuJares lodos Jos fumadores lengan que padecerlas (de elige o asom¡;
hecho no es así y en eso confiamos «probabilísticamente,. para seguir bre o una ml
fumando). sulta padece
Los objetivos que pretendemos son los siguientes: experimento
las. cuatro co
- Se puec
• Conocer los conceptos de expelimento aleatorio y espacio muestra!.
- En cad.
• Distinguir los distÍJltos tipos de sucesos: sucesos elementales y com·
conjunt
puestos, suceso imposible, suceso seguro, sucesos compatibles e
incompatibles. - Antes d
que oht
• Concepto de probabilidad y sus definiciones: clásica, eSladIslica y
axiomática. Un mismo concepto definido de tres formas diferen· - A medi¡
tes pero intimamente relacionadas. va -o pl
aproxin
)GfA t lNTRODUCC1ÚN A LA PROBABLUDAD 353

e nos
~ ele- • Calcular la probabilidad de aparición de un suceso aplicando la
pro- definicí6n clásica y conociendo el espacio muestral del experi-
mento aleatorio.

náti-
ndo,
10 la I~_~_ CO\CU'TOS I'HE\-IOS
ien-
)de Antes de introducimos de lleno en el estudio de este tema y los siguien-
ía el tes, que nos van a pennilir obtener probabilidades asociadas a un suce-
.de so, es necesario presentar algunos conceptos que nos familiaricen con el
roi- léxico propio de esta materia y nos faciliten la comprensión de los con-
al y ceptos y la teoría de la probabilidad.
di·
ne
:\os 12.2.1. L'lwrilllt'lIlO \lt'<.IltH·jo

lue Entendemos por experimento el desarrollo de un proceso mediante el


irí- cual obtenemos un conjunto de resultados, observaciones o datos con el
:os fin de realizar una comprobación o verificar una hipótesis. Si añadimos
:0- el adjetivo «aleatorio») es porque se incluye el a7..ar, de modo que un expe-
>r- rimento aleatorio es cualquier experimento realizado al azar que se
os puede repetir indefinidamente en las mismas condiciones y cuyo
os resultado no se puede predecir con certeza. De acue¡-do con esta defi-
!n nición lanto lanzar una moneda o un dado al aire. como situar a una rala
e- no entrenada en un labelinto con múltiples salidas y observar cuál de ellas
le elige o asomarse a la ventana y observar si la persona que pasa es un hom-
ir bre o una mujer, o esperar si la próxima persona que !lega a nueslra con-
sulta padece depresión, fobia, dislexia, amnesia, etc_, son ejemplos de
experimentos a[ealOdos pOI-que, como el lector puede advertir, cumple
las cualr-o condiciones siguientes:
- Se puede repetir indefinidamente en las mismas condiciones.
- En cada ensayo se obtiene un resultado que pel1enece alllniverso o
conjunlo de lodos los resultados posibles, E.
- Antes de cada ensayo no se puede predecir con certeza el resultado
que obtendremos.
- A medida que el número de ensayos aumenta, la frecuencia relati-
va -o proporción- de aparición de cada resullado posible tiende a
aproximarse a un valor fijo.
354 ANÁLISIS DE DATOS EN PSICOLOCIA 1 INTRODUCCI(

que definen las condiciones que debe cumplir un experimento para que
r A su vez,
podemos considerarlas como experimento aleatorio. ro, suceso in

Suceso 51
aleatorio. P<
11.1.1. L.. "al'in 'Iu('~lral
nemas, el su
que con toda
Espacio muestral es el conjunto fonnado por todos los resultados punlUación 1
posibles de un experimento aleatorio. Se representan con la letra
mayúscula E y también se llama universo o población del expe¡;menlo. Suceso ÍJ
que se repita
Por ejemplo. en el experimento .Ianzar una moneda al aire_ el espa·
cio muestral es: E -'" (cara. cruz). Si el experimento es lanzar un dado. el de seis caras
imposible. e
espacio muestral es E = {1, 2, 3. 4, 5, 6]. Y si el experimento consiste en
-que como SE
asomarse a la vemana y ver si la persona que pasa es hombre o mujer, el
espacio muestl-al es E = (H; M), etc. el COUoCw
conjunto Yac

Dado un:
deA, y se re¡:
rreA.
La ¡"calil.ación de un experimento aleatorio, proporciona uno o varios
resultados distintos que se Llaman sucesos y forman un subconjunto del Siguiendl
espacio muestral, E. En ellanzamienlo de una moneda, los sucesos son mas el SUce!
.cara. y .cruz. y lógicamente el conjunto de todos los sucesos forma el A = {obtener
espacio muestral del experimento aleatorio. so contrario I

Los sucesos pueden ser elementales o compuestos. El suceso sim- Sucesos E


ple o elemental consla de un solo resulcado del unit'erso o espacio mues- presentarse
tral, E, mientras que el suceso compuesto consta de dos o más resultados dción simulll
del espacio muestra!. Así, por ejemplo, al lanzar un dado, el suceso .obte- patibles son
ner un tres» es elemental mientras que el suceso _obtener un número par. miento del d
es un suceso compuesto formado por los elementos 2, 4 Y 6. Finalmente, e = (5.3.1). u
los sucesos se representan por letras mayúsculas y el símbolo .igual.. que recer simultá
contiene entre llaves, o corchetes, los elementos que lo fOlman. De este SULesos A y B
modo, los ejemplos antel'iores quedan representados de la siguiente fol'· simultáneaml
ma:
Sucesos c.
«obtener un tres» A = {3] depende del
dependencia:
«obtener un número par» A = (2, 4, 6]
babilidad de
En relación con estas normas puede observar que el espacio muestral Marruecos, p
-que se representa habitualmente con la letra E- es un caso especial de lugar de proo
suceso compuesto y está fOimado, como ya sabemos, por todos los resul- en el tema 14
t.ados posibles del experimento aleatorio. les de la prob
1
"..OGlA I INTRODUCCIÓN A LA PROBABJUDAD 355

ra que A su vez, los sucesos pueden ser de los siguientes lipos: suceso segu~
ro, suceso imposible, suceso contrario y sucesos incompatibles.

Suceso seguro es el que ocurre siempre que se realiza el experimento


aleatorio. Por ejemplo. al lanzar un dado y ver la puntuación que obte-
nemos. el suceso A == (puntuación menor de 7] es un suceso seguro por-
I que con toda segulidad siempre que lancemos el dado obtendremos una
'ados puntuación menor que 7.
letfa.
'oto. Suceso imposible es todo suceso que no puede ocurrir nunca aun-
que se repita infinitas veces el experimento. Por ejemplo al lanzar un dado
~spa­
de seis caras numeradas del I al 6. el suceso A =' [8) no puede ocurrir, es
\0, el
imposible. Como vemrnos más adelante, se representa con el símbolo 41
:e en
-que como se recordará, por quienes estudiaron la temía de conjuntos en
~r, el
°
el COU Curso de Acceso, es el mismo que se uüliza para representar al
conjunto vacío.

Dado un suceso A, se llama suceso contrario o complementario


de A, y se representa por A, al suceso que ocurre siempre que no ocu-
rreA.
nos
del Siguiendo con el mismo ejemplo dellanzamienlO del dado, si defini·
ion mos el suceso A ==- {obtener un número par], el suceso COnll'ario es
,el A;: [obtener un número impar), o bien, si A;: [2, 4, 6]. enlOnCe5 el suce-
1 so contrario es A "" (t, 3, 5].

m- Sucesos excluyentes o incompatibles son aquellos que no pueden


es- presentarse a Ja vez, o dicho con otras palabras, son aquellos cuya apa-
los rición simultánea es el suceso imposible. Por su parle, Jos sucesos com-
le- patibles son aquellos que sí pueden presentarse a la vez. En el lanza-
miento del dado, si definimos los sucesos A ;: [númem par); B '" [6};
'"le, e==- {5,3, 1J. Los sucesos A y e son incompatíbles por que no pueden apa-
,. recer simultáneamente un númem par que sea 5, 3 ó 1; pero no así los
le sucesos A y B que son compatibles ya que se puede dar un resultado que
r- simultáneamente sea par y sea c16.
Sucesos dependientes son aquellos cuya probabilidad de aparición
depende del suceso que haya surgido antedormente. De no exisfir esta
dependencia se trataría de sucesos independientes. Por ejemplo, la pro-
babilidad de ser mujer y morena, no es la mism<l en España que en
,1 Man"uecos, por lo que el suceso «ser morena» depende, en este caso, del
e lugar de procedencia. Sobre estos últimos sucesos volveremos a tratarlos
en el tema 14 cuando se expongan algunos de los teoremas fundamenta-
les de la probabilidad.
356 ANÁLISIS DE DATOS EN PSICOLOGlA I INTRODUCCIC

1:1.:1. :J. /. Op(·l"m·ioflf·... ('(UI ...11('(·..." ...


Actividad 14
Las posibles operaciones que pueden realizarse con los sucesos son , sosA=(1,2,
las propiedal
equivalentes a las que se pueden realizar con el álgebra de conjuntos y
que el alumno recordará de sus estudios de eDU o del Curso de Acceso.
La siguiente tabla recoge las operaciones más importantes del álgebra de
l ·)·,·)
_..,._. l'.el
conjuntos y sus equivalencias con los sucesos.

Tabla 12.1. Correspondencia entTe el Álgebra de conjuntos


Asumida
y los sucesos vamos a utili
operaciones (
lo 12.2.3. los
espacio muestral o suceso
~ conjunto universal nuestro a1fab
seguro
esta forma la
suceso ~
subconjunto del conjunto ya conocidas,
universal
elemento del conjunto Cuadro
suceso elemental ~
universal
suceso imposible ~ conjunto vacío EsI
suceso contrario ~ conjunto complementario
sucesos incompatibles
unión de sucesos
intersección de sucesos
.
~

~
conjuntos disjuntos
unión de conjuntos
intersección de conjuntos SU(

Teniendo en cuenta estas equivalencias podemos realizar con los suce·


sos las mismas operaciones que se hacían con los conjuntos y entre ellas
vamos a recordar las más importantes para nuestros fines, a saber: la
unión y la intersección. SU(

Se llama unión de sucesos A y B, Yse representa por AuB, al suceso


que ocurre siempre que OCUlTe A o B o ambos. Por su pal1e, se denomina
intersección de sucesos de A y B, Yse representa por A("'I8, al suceso que
OCtllTe siempre que ocurren A y B. Estas dos operaciones gozan de varias Unl
propiedades entre las que destacamos las siguientes:
yes
Tabla 12.2. Propiedades de la unión e intersección de sucesas se 1
Propiedades De la Unión De la Intersección
Inll
Conmulmiva AvB :: BuA A""¡¡ = B rvI se.!
Asociativa (AuB) U C - Au (BuC) (A""¡¡) ,.., C = A,.., (B,..,C)
Distributiva Au (B,-,c) - (AuB),..,(AuC) A,.., (BuC) - (A""¡¡)u(A,..,C) yes
Simplificación Au (BrvI) = A A,.., (BuA) =A sel
INTRODUCCIÓN A LA PROBABfLlDAD 357

Actividad 12.1. Imagine que lanzamos un dado y considerarnos los suce-


= (2, 5, 6) Y e = (3, 5), compruebe que se cumplen
sos A =(1, 2, 4, 6); B
las propiedades anteriores.

12.3.2. He(>l'(>scniaciones gráficas


Asumida la equivalencia entre el álgebra de conjuntos y los sucesos,
vamos a utilizar los diagramas de Venn para representar los sucesos y las
operaciones que con ellos podemos hacer. Como se ha señalado en el pun-
to 12.2.3, los sucesos los vamos a representar con letras mayúsculas de
nuestro alfabeto latino y el espacio muestral con la letra mayúscula E. De
esta forma las representaciones son que aparecen en el cuadro 12.1 son
ya conocidas.

Cuadro 12. l. Representaciones de los sucesos y sus operaciones

Espacio muestral E


E

Suceso E
A

Suceso complementario de A E
A

Unión de sucesos: se representa por AuS


AuB
'Y es el suceso que ocurre siempre que
se presenta A o B o ambos

Intersección de sucesos: se repre-


senta por
-
AnS

AnB
yes d suceso que ocurre siempre que
se presentan A y B
358 ANÁLISIS DE DATOS EN PSICOLOGfA 1 INTRODUCCiÓN ¡.

1:1.:1. DElT\IClÜ" DE 1'1I011\IlIUD.\D 1'\11 \ l" ESI'\C10


\Il ESTIl \1. IlISCIlETO

Expondremos tres definiciones diferemes del concepto de probabiH~


dad (la definición clásica. la estadística y al axiomática) encaminadas a
un mismo fin: calcular la ~posibilidad. de ocurrencia de un suceso. Vere- Por tant
mos que con cualquiern de estas tres definiciones, la probabilidad se cuan·
tiFica con un númeru comprendido entre O y l. Cero para el suceso impo-
sible como, por ejemplo, la probabilidad de ocurrencia del suceso que
más temor produce a los vaJientes guerreros de la tribu gala de Asterix y Respecto a es
Obelix: _que el cielo se desplome sobre sus cabezas_; pero como dice su
jefe Ahrocurcix para fortalecerlos: «eso no va a ocunir mañana_ (ni nun- - La primera
ca, añadiríamos nosotl"Os y de ahí su probabilidad nula). Asignamos un incorrecta I
uno al suceso seguro, como por ejemplo, la probabilidad de ocurrencia probabilid,
de la desagradable profecía del refrán: _Dentro de cien años... todos cal- la mayoría
vos_o Cualquier otm suceso tendni asignado un número entre O y I en dición de I
función de la cuantía de su probabilidad de ocurrencia. necesita co
favorables (
tados posib
1:!.:J.I. Ilt'liJlidun CI .. ,j.'a recurre en r
tema siguie
Esta definición fue establecida por Laplace y dice: _La probabilidad - La segunda
de un suceso A, es igual al cociente entre el número de casos favo- ma de enter
rables de que ocurra el suceso A, y el número de casos posibles en
trata de obt!
el supuesto de que todos los casos tengan la misma oportunidad de probabilida!
ocunir (es decir, sean igualmente probables) ... A esta probabilidad la rre, por ejen
representamos por P(A) y de acuerdo a esta definición, es: na el valor (
o mujer. Lo
trastorno ps
¿Cómo oblenE
donde "" representa el númem de casos favorables de que se presente el ción nos proporci
suceso A,'y N es el número de casos posibles. El siguiente ejemplo le ayu~
dará a empIcar esta definición.
I :!.:~.:!. Ul'Iinh.

Ejemplo J2,1. La07.amos un dado imparcial una sola vez. ¿Cuál Puesto que en
es la probabilidad de obtener un 2? los sucesos entre I
bilidad, algunos a'
Tenemos que ~lcuJar la probabilidad de obtener el suceso A = {2}. otra basada en la I
El espacio muestral, conjunto de todos los resuJtados posibles, es: idea con un ejemp
ellan7.amiento de
IGÍAI INTRODUCCIÓN A U. PROBABILIDAD 359

CIO
E:: (1,2, 3, 4, 5, 6) donde cada uno de los seis resultados tiene la mis-
ma probabilidad de salir. Sobre éstos 6 casos posibles y equiproba-
!bili· bies sólo hay un caso favorable (obtener un dos).
:las a
Vere- Por tanto: P(2) =!
6
:uan-
npo-
1 que

:rix y Respecto a esta definición hay que resaltar dos impc)Jtantes reflexiones:
:e su
nun- - La primera es que esta definición es, desde el punto de vista fonnal,
lS un incorrecta pues introduce en la definición e1ténnino definido (equj-
:ncla probabilidad) pero desde el punto de vista práctico es aplicable en
i caJ- la mayoña de los experimentos aleatorios donde se cumple la con-
1 en dición de equiprobabilidad. Para su aplicación práctica sólo se
necesita contar, en un experimento aleatorio, el número de casos
favorables de ocurrencia del suceso A y el número de casos o resul-
tados posibles que resultan del experimento aleatorio. Para ello, se
recurre en muchos casos a la combinatoria que estudiaremos en el
tema siguiente.
¡dad - La segunda es que el gran problema de esta definición está en la for-
:avo- ma de entender los casos favorables y los casos posibles cuando se
:5 en trata de obtener probabilidades de sucesos cuya condición de equi-
<1 de probabilidad no está garantizada y es más que discutible. Esto ocu-
adla n'e, por ejemplo, con la probabilidad de nacer varón a la que se asig-
na el valor 0,5 asumiendo la equiprobabilidad entre nacer hombre
o mujer. Lo mismo para obtener la probabilidad de padecer algún
trastorno psicológico o sufTir un accidente.
¿Cómo obtener entonces estas probabilidades? La siguiente defini-
ción nos proporcionará una salida.
lte el
ayu-

1::!,:i.::!. 1h-l'illi4'ioll E:-olailí:-olit'a

Puesto que en muchas situaciones es dificil reali7..ar la clasificación de


los sucesos entre los casos favorables y los posibles con la misma proba-
bilidad, algunos aulQres intentaron sustituir la definición de blplace por
2). otm basada en la estabilidad de las frecuencias relativas. Ilustremos esta
es: idea con un ejemplo. La frecuencia relativa, JI", de aparición de _cara» en
el lanzamiento de un moneda es la que se muestra en la tabla 12.3 don-
360 ANÁLISIS DE DATOS EN PSICOLOC!A I INTRODUCCiÓN J

de se indica que en un lanzamiento (N = 1) se ha obtenido una cara; en Con esta ide


dos lanzamientos (N = 2) hemos obtenido una cara y una cruz. En tres cuencia relativa
lanzamientos (N = 3) dos caras, etc. Dividiendo estas frecuencias por el atorlo un nÚln
número de lanzamientos o ensayos, obtenemos la frecuencia relativa o relativa o prop
proporción, P•. Estos resultados los podemos representar gráficamente tiende a aproxi
(Fig. 12.1) situando en el eje horizontal, o eje de abscisas. el número de aparición de e:
ensayos y en el eje de ordenadas la frecuencia relativa, la cuál se va apro-
ximando al valor 0.5 a medida que N aumenta. De este modo, la defini- Adoptando t
ción estadística de probabilidad es «el límite al que tiende la fre- experiencia y, CI
cuencia relativa de aparición de un suceso A cuando el número de elevado de pruel
ensayos, N, tiende a infinito»: determinado su
babiHdad a mee
ejemplo, imagin
P(A) = tim !!..d.. ma de que por e:
N-+_ N
51.264 son varor
babilidad de nac
mos visto que es
Tabla 12.3: Frecuencia, n., y propon::ión, P., de aparición de ~cara»
en N lanz.amientos de una moneda. (Datos supuestos.)
Jos casos favoral

N
I
.1
P.
I
De esta segul

- Comonoe
2 1 0,5
3 2 O,"
babilidad t,
4 1 0,25 un suceso«
- - -
38 21 0,55 Así las cosas,
- - -
factoría del cono
30 0,60
'"
-
-
-
-
-
-
bo de su pensam
a.xiomática que;
170 90 0,53
- -
178.4 902 0,505
- - - 11,:1,:1. D,-fin;
2000 999 0,.499

La dificultad
equiprobabilidad
relativa, llevó a I
número -entre I
piedades que se
que se aceptan si
0-1- --1 partir de los 1mb;
ca un trabajo do'
ción de probabili
Figuro 12.1. Representación gráfico de Jo estabilización de lo frecuencia relativo. este curso introd
)GÍA 1 INTRODUCCiÓN A LA PROBABILIDAD 361

a; en Con esta idea, Richard Van Mises define la probabiJidad como una fre-
l tres cuencia relativa de la siguiente fonna: si se realiza un experimento ale-
I()rei atorio un número suficientemente elevado de veces, la frecuencia
iva o relativa o proporción de veces que aparece un determinado suceso
lente tiende a aproximarse a un valor constante que es la probabilidad de
!'O de aparición de ese suceso.
.pro-
,lini- Adoptando esta definición, la probabilidad se estima a partir de la
. fre- experiencia y. como es fácil suponer, es preciso realizar un número muy
"O de elevado de pruebas para conocer la frecuencia relativa de aparición de un
determinado suceso, que se irá aproximando a su valor teórico de pro-
babilidad a medida que el número de experiencias tiende a infinito. Por
ejemplo, imaginemos que ellnslituto Nacional de Estadística nos infor-
ma de que porcada 100.000 nacimientos que se producen en nuestro país,
51.264 son varones. De acuerdo con estos datos podemos decir que la pro-
babilidad de nacer varón seria: 0.51264. Con la definición clásica había·
mas visto que esta probabilidad es 0,5 como resultado del cociente entre
los casos favorables, 1: vaTÓn, y los casos posibles, 2: vaTÓn + mujer.
De esta segunda definición se desprende la siguiente reflexión:

- Como no es posible aproximarse a infinito, la estimación de la pro-


babilidad teórica a panir de la frecuencia empírica de aparición de
un suceso está afectada por un error.

Así las cosas, y ante la imposibilidad de ofrecer una definición satis-


factoria del concepto de probabilidad, los matemáticos cambiaron el rum-
bo de su pensamiento que, con el correr de los años, originó la definición
axiomática que a continuación expondremos.

1:!.:L:L I)elinieión ,b.iOlllií.tka

La diricultad planteada para definir la probabilidad basándose en la


equipmbabilidad de sucesos y el error en estimada a partir de la frecuencia
relativa, llevó a los matemáticos a concebir la probabilidad como un
número -entre O y 1- asociado a un suceso y que posee varias pro-
piedades que se denominan axiomas, es decir, verdades o afinnaciones
que se aceptan sin demostración. Esta definición axiomática se origina a
PaJ1j¡' de los trabajos del matemático ruso Kolmogorov que en 1933 publi-
ca un trabajo donde establece una introducción axiomática de la defini-
ción de probabilidad. La idea básica, y simplificada por las exigencias de
Iliva. este curso introductorio, es la siguiente:
362 ANÁLISIS DE DATOS EN PSICOLOGíA 1 INTRODUCCiÓN J

Dado un espacio muestral E, llamamos probabilidad de un suceso


A definido en el espacio muestra! E y que designamos por P(A) a un Actividad 12
número real que asignamos al suceso A. tal que cumple los siguien- viéndose de UJ:
tes axiomas: teoremas. Es d
- peA) ~ O
sos: A = (1; 5)
mas anteno¡
-P(E)=!
- peA, uA, u ... uA,) = peA,) + peA,) + '" + P(A,)
Con el fin dt
siempre que los distintos sucesos A, del espacio muestra) sean mutua- expuestos en el :
mente excluyentes o incompatibles.
Las dos primeras propiedades indican que la probabilidad es cuanci- Ejemplo
[¡cable numéricamente con un número positivo comprendido entre cero se presen
y uno. Como se dijo en la introducción de este tema, asignamos un cero dedicado al
a un suceso que no puede ocurrir nunca y un uno al suceso que se pro· lidad de a
duce con seguridad. La tercera indica que la probabilidad de la unión de quec. ¿e
sucesos disjuntos (disjuntos porque su intersección es vacía: A, n Al = 41) a I,deap
o, con OIl"3S palabras, incompatibles (porque no se pueden producir a la
vez.) es igual a la suma de sus probabilidades individuales.
De estas propiedades se derivan los teoremas que se muestran en el
cuadro 12.2 y no demostraremos pero que el alumno puede comprender
fácilmente con a~'Uda de los diagramas de Venn que se incluyen al margen.

Cuadro 12.2. Teoremas

1. lo probabilidad del Meso imposible


es cero.
2. la probabilidad del suceso comple'
mentario de A, es igual a 1 menos la
probabilidad de ocummcio de A.
3. Si A es subcOfljunfo de B (es decir, si
todos las elementos de A pertenecen Veamos ahor.
también o Bl, que se represento como
Escrito, ahora formalmente, los teoremas son:
A e B, entonces: la prababilidad de
ocurrencia de A es siempre menor o 1. P{P)_ O
igual que lo probabilidad de B, y lo Ejemplo
2. P(AI- 1 - P{AI su probab'
probobilidad de B menos A es igual
o la diferencia de sus probabilidades.
4. lo probabilidad de A '1 B (probabili-
dad de lo intersección) es si~mpre
""""" o "'001 que lo pobob;l;dod de
3. Si AcB=> ¡ PIAI < P{BI
PIB - Al_ P{BI- PIAI
A o B lprObobilidod de la unión). 4. P(A0B):S"PlAvB) y par los
INTRODUCCIÓN A l.A PROBABILIDAD 363
)

1 Actividad 12.2. En esta actividad animamos al alumno a que sir-


viéndose de un dado, como ejemplo, compruebe que se cumplen estos
teoremas. Es decir, suponiendo que se obtienen los siguientes tres suce-
sos: A = (1; 5) Y B = (1; 2; 4; S) compruebe que se cumplen los teore-
mas anteriores.

Con el fin de asentar estos conceptos vamos a aplicar los teoremas


expuestos en el siguiente ejemplo.

Ejemplo 12.2. Tres amigos (a, b y e) y compañeros de estudios


) se presentan a un examen. Por su diferente preparación y tiempo
) dedicado al estudio de la materia, el alumno a tiene doble probabi-
lidad de aprobar que b y éste la mitad de probabilidades de aprobar
e que c. ¿Cuáles son las probabilidades, sabiendo que su suma es igual
.) al, de aprobar de los amigos a, b y c?
a
Tenemos que calcular p(a). P(b) y p(c) que son sucesos disjuntos.
Si a la probabilidad de aprobar del alumno e la designamos por X,
,1 entonces escribimos p(c)= X, Ytendremos que:
e
P(b) = 0.5X y P(a) =2 P(b) = 2· 0.5 X =x.
••
y puesto que, por el axioma segundo, la suma las probabilidades de
los sucesos dd espacio muestral tiene que ser igual a 1, tenemos que:
P(a) + P(b) + p(e) = X + 0.5 X + X = 1 de donde: 2.5 . X = I Ydespe-
jando: X = 112.5 = 0,4.
y las probabilidades pedidas son:
Pea) =X= 0.4 P(b) = 0.5 ·X= 0.5·0,4 =0.2 Y P(e) =X=O,4

Veamos ahora otro caso adicional:

Ejemplo 12.3. Calcular la probabilidad dd suceso A sabiendo que


su probabilidad es 2/5 la de su suceso contrario.
2 -
Por el enunciado sabemos que: P(A) ="5 P(A)

Ypor los teoremas que se deducen de los axiomas de la probabilidad:


364 ANÁLISIS DE DATOS EN PSrCOLOGtA r lNTRODUCcr'

y para hace
2 - -
5·P(A)+P(A)~1 yemonees: P(A)· 5+1 =1 - [2 ] rrollaremos

l~A. RES
de donde despejando:
- En este ti
P(A) ="75 =0.7143 Y P(A)
2 5
=5'"7 = 0.2857 fntimamentl
cnto. Postel
o bien: de las cuaje
P(A) = I - P(A) =1- 0,7143 =0,2857 define como
ción de un s
frecuencia n
Vistas estas LreS definiciones de probabilidad nos valdremos, en muchas caso, estas e
ocasiones, de la definjdón clásica para el cálculo de la probabiHdad aso- casos ravara
ciada a un suceso. La aplicación práctica de la definición de Laplace aparición dI
requiere, sin embargo. conocer el número de casos en que aparece el suce- medida que
so A y el número de sucesos posibles que pueden darse como resultado otra pane, h:
del experimento aleatorio, tal y como se ilustra en los siguientes ejemplos. dos procedil
malo axiollJ
meo en dos i
Ejemplo 12.4. Calcular la probabilidad de obtener- un cinco al ro positivo (
lanzar un dado de seis caras. vacío, y 1, p;
de la unión I
Sabemos que los casos posibles son el número de sucesos del
lidades indh
espacio muestral, es decir, seis casos: E ~ [1, 2. 3, 4, S, 6) de los cua-
les 8610 uno -que salga el cinco- es favorable. De modo que la pro- En el pro
babilidad de que salga un cinco es 1/6. rrencia de UI
silamos Conl
bies de apar.

I\jemplo 12.5. Calcular la probabilidad de obtener una sola cara


al lanzar una moneda al aire en dos ocasiones. 1~.5. EJEI
Intuitivamente sabemos que el espacio muestral esta fonnado Q] Enlad
por los siguientes cuatro sucesos compuestos: bies:
E ~ [(CC),(CX).(XC),(XX))
a) No~
de los cuales dos son favorables: (CX) y (XC). La probabilidad vale b) Son
en este caso 214 = 0,5. e) Son
Cinco ¡
Desgraciadamente para e1leclor temeroso de los números, no siem- hombn
pre es tan fácil contar el número de casos favorables y el de los posibles espacie
:oLOGIA I INTRODUCCiÓN A LA PROBABILIDAD 365

y para hacerlo tenemos que recurrir al cálculo combinatOl;o que desa-


ITollaremos en el tema siguiente.

11.-1. HI:Sl'\IE\
En este tema se han definido los conceptos básicos de la probabilidad,
íntimamente relacionados con la teoría de conjuntos que no hemos des-
crito. POSlenormemc se han dado las lres definiciones de probabilidad
de las cuales. en la práctica, o bien se aplica la definición clásica que la
define como el cociente entre casos favorables y casos posibles de apari·
ción de un suceso o bien, basándonos en la experiencia, recurrimos a la
frecuencia relativa de aparición de un suceso detenninado. En cualquier
muchas caso, estas definiciones no se excluyen y, de hecho, el cociente entre los
dad aso· casos favorables y los posibles no es más que una frecuencia rel;Jtiva de
Laplace aparición de un suceso que se va aproximando a un valor constante a
~ el suce-
medida que el número de ensayos aumenta (definición estadística). Por
~ultado
otra parte, la probabilidad de un suceso, obtenido por cualquiera de estos
jemplos. dos procedimientos tiene que cumplir los axiomas de la definición for-
malo axiomática de la probabilidad que hemos expuesto y que se resu-
men en dos ideas fundamentales: la probabilidad de un suceso es un núme-
<o al ro positivo comprendido entre O, para el suceso imposible o conjunto
vaefo. y 1, para el suceso segul'O o espacio muestra!. E y la probabilidad
de la unión de sucesos incompatibles, es igual a la suma de sus probabi-
del
lidades individuales.
cua-
pro- En el próximo tema veremos que para calcular la probabilidad de <>cu-
n'cncía de un suceso detemlinado rccun;endo a la definición clásica nece-
silamos contar el número de casos favorables y el número de casos posi-
bles de aparición de estos sucesos con ayuda de la combinatoria.

cara
11..;. E.lEIIClClOS
do En la definición clásica de probabilidad de Laplace, los casos posi-
bles:
a) No se conocen.
vale b) Son los que fomlan el espacio muestra!.
e) Son sucesos necesariamente elementales.

Cinco aspirantes a dos puestos de trabajo (tres mujeres, M, y dos


no siem- hombres, H) se presentan a una prueba de selección de personal. El
posibles espacio muestra} es:
366 ANÁLISIS DE DATOS EN PSICOLOGíA I INTRODUC

al [M,H] al PI
b) (MM).(HH)] bl PI
el (MM).(MH),(HH)] el PI

Con los mismos datos del ejercicio anterior. elegidos dos al azar, el
suceso .hombre o mujer.:
0 Un g
psic(
Udad
a) Es el suceso seguro. de l;
b) Son sucesos incompatibles.
al
e) Son sucesos simultáneos. j
o La zona oscura de la siguiente gráfica representa: bl
>
A
el o.
0 En e
amb
a) la probabilidad de ocurrencia de los sucesos A y B
b) la probabilidad de ocun--encia de los sucesos A o B
el el suceso imposible.
m En la siguiente representación gráfica:

En e
tes:

se cumple que:
a) P(A)~P(B)
¿qué
bl P(A r.B)'P(A-B)
e) P(A u B) < P(A r. B) a) (1
b) (2
Un gabinete psicológico cuenta con 6 terapeutas condUClistas. e, 4 e) [1
psicoanalíticos, S, y S cognitivos, G. Elegido uno al aZal~ el suceso
«que sea condllctista o cognitivo» se representa por:
a) enG 1:1.6. S(
b) CuG
e) G-C
11 ElbIes..
Un gabinete psicológico cuenta con 6 terapeutas conductisLas, C. 4 la te
psicoanalíticos. S, y 5 cognitivos, G. Elegido uno al azar, la proba-
bilidad de _que sea conductisla, C. o cognitivo, G.. la podemos cal-
cular con la siguienLe expresión:
11 pue!
El e,
Al INTRODUCCIÓN A LA PROBABILIDAD 367

a} peS) = 1 - peS)
b} P(C) . P (G)
c} P(CnG)·

el
Un gabinete psicológico cuenta con 6 terapeutas conductístas, e, 4
psicoanalíticos, S, y 5 cognitivos, G. Elegido uno al azar la probabi-
lidad de "'que sea psicoanalítico, S" aplicando la definición clásica
de Laplace vale:

a} :Ks
b} V.
, 4
el 0,5
En d aula de un colegio hay 10 niños diestros, D, 7 zurdos, Z, y 3
ambidiestros, A. Su representación gráfica es:
a} b} c}

En el lanzamiento de un dado, tenemos los tres conjuntos siguien-


tes:
A=(Lz,J:4j
B=(Z,3,S}
C=[1,3,5,6j
¿qué elementos pertenecen a la siguiente expresión: (A n C) n 13?
al [1,2J
b} (2, 3)
c} [l}

12.6. SOLl,;CIONES DE LOS EmHCICIOS

a El espado muestral o universo está fonnado por todos los casos posi-
bles que pueden producirse en un experimento aleatOlio, por lo que
la respuesta correcta es la b.

11 Elpuestos
espacio muestral está formado por una serie de sucesos com-
puesto que se trata de ocupar dos puestos de trabajo y los
368 ANÁLISIS DE DATOS EN PSICOLOGíA 1 INTROD

posibles resultados son: que sean dos hombres (HH), que sean dos
mujeres (MM) o que sean un hombre)' una mujer (HM) indistinta·
111 El an
mente del orden, por lo que la respuesta C01Tccta es la c.
a)
11 Desde luego no hay ninguna razón para pensar que. con toda segu-
ridad. los elegidos son un hombre y una mujer porque son posibles
otras soluciones y el hecho de elegir un hombre y una mujer no son,
como fácilmente entenderá. incompatibles. Por tanto, elegir un hom-
bre y una mujer son sucesos que se pueden producir simuhánea-
mente. La solución correcta es la c.
4
Pu
sin
11 decir,
La zona más oscura representa la intersección de los dos sucesos, es
la probabilidad de que se produzcan A)' B. La solución COITeC- l1li 4,(A (
la es a.
es I
11 En la siguiente representación gráfica:

el suceso A está incluido en B, por tanto se cumplirán varias condi-


ciones como que la probabilidad de A es menor o igual que la de B.
La intersección de A y B es igual a A; y la unión de A con B es igual
a B. Al ser A < B, A - B no se podría calcular, es imposible mientras
que B - A coincidiria con el anillo_ Finalmente, al ser B mayor que
A se cumple que peA u B) "" By peA ('\ B) :: A por tanto peA v B) ~
~ peA n B). La respuesta con"ecta es la c_

e, o cognitivo, G, se l-epresenta por


11 Que el terapeuta sea conductista,
e v e siendo la altemativa b la CO¡TeCla.
La probabilidad de que sea elegido e o e, P(C u e), es iguaJ a la pro-
B babilidad de que no sea elegido S. Es decir, la respuesla con-eCla es
a.

11 aplicando
Elegido uno al azar la probabilidad de «que sea psicoanalítico, S"
la definición clásica de Laplace es el cociente entre el
número de casos favorables, es decir, el número de casos que cum-
plen la condición de ser psicoanalistas, que son 4, dividido entre el
número de casos posibles, que se refiere al universo o espacio mues·
tral, en este caso al número total de terapeutas, que son 15. Por tan-
to la respuesta correcta es la a (}{s).
INTRODUCCiÓN A LA PROBABILIDAD 369

En el aula de un colegio hay 10 niños diestros. D, 7 zurdos, Z, y 3


ambidiestros, A. Su representación gráfica es:
a)

Puesto que los sucesos D YZ son compatibles y se pueden producir


simultáneamente.
(A ()C) ()8= [[1, 2, 3, 4) ()(I, 3, 5, 6)] ()8= [1, 3) ()8 =(1, 3) () (1,
4, 6} = {l}. Por tanto, el único elemento común a los dos conjuntos
es el 1 por lo que la respuesta correcta es la c.
Tema 13
Combinatoria
SUMARIO
13.1. I"T~
13.1. Introducción
13.2. Princil)io (undamental Haciendo
ción sistemál
13.3. Permutaciones
sobre el año
13.4. Variaciones combinatorio
natorio en u[
13.5. Combinaciones
editaba. denc
13.6. Permutaciones con repetición la el libro de
de se perfecci
"13.7. Vuriaciones con repetición
teóricos de la
13.8. Combinociones con repetición taciones a la
Rea, aharnen
13.9. HeslIlllen del cálculo d.
13.10. Ejercicios elementos.
13.11. Soluciones a los ejercicios La combir
rentes formo
elementos y
pamientos re
to nos permir
• ¿De cual
en la pri.
-Conunl
tes de 2:
• ¿De cuál
de un ca
1:1.1. I,\THOIlLCCIÓ\

Haciendo un poco de historia, cabe señalar que la primera aproxima-


ción sistemática de la combinatoria fue dada por Leibnitz (1646-17 J6),
sobre el año 1666. cuando presenta su libro .. Ra:oIlQmieuto sobre el arte
combillatorio». En los años siguientes perfeccionó el simbolismo combi4
natOlio en una serie de trabajos que publicó en una revista que él mismo
editaba, denominada .Acta Eroditonwl». Posteriormente en 1713 se edi-
ta el libro de Jacobo Bemouilli (1654-170S) «Arte de la suposición» don-
de se perfeccionan estas técnicas y se resuelven muchos de los problemas
teóricos de la probabilidad. Los siglos posteriores fueron sumando apor-
taciones a la tcoría general y nos ha llegado como una disciplina cientí-
fica, altamente elaborada, que nos permite resolver muchos problemas
del cálculo de probabilidades que se relacionan con la enumeración de
elementos.
La combinatOlia es una rama de las matemáticas que estudia las dife-
rentes formas de agrupamiento y combinación de un conjunto de
elementos y establece las propiedades y leyes de formación de las agru-
pamientos resultantes. Conocer estas diferentes formas de agrupamien-
to nos pemlitirá dar respuesta a preguntas como las siguientes:
• ¿De cuantas fonnas distintas pueden sentarse t."es ninos y dos niñas
en la primera fila de una clase?
• Con un banco de 100 preguntas tipo test ¿cuántas pruebas diferen-
tes de 25 preguntas puedo construir?
• ¿De cuántas formas diferentes se pueden asignar cinco empleados
de un comercio a tres secciones distintas?
374 ANÁLISIS DE DATOS EN PSICOLOGÍA I COMBINA'

Desclibiremos las técnicas básicas que se refieren a los distintos agru-


pamientos que se pueden fOlmar, según una ley dada. con los elementos E
de un conjunto finito. y que nos dará respuesta a las preguntas antelío- camin
res y otras similares como las que se plantean en las distintas actividades de irse
que iremos proponiendo. Veremos que estos agrupa miemos reciben los tintas
nombres de variaciones. permutaciones y combinaciones ordinarias,
de acue¡-do a sus distintivas leyes de formación, a los que se les puede
cambiar el adjetivo _ordinarias. por el de _con repetición" si los elementos
que los (annan pueden presentarse repelidos.
Los objetivos son los siguientes:

• Conocer la combinatoria como herramienta para contabilizar las


diferentes formas de agrupamiento de un conjunto de elementos.
• Conocer, calcular y distinguir los conceptos de permutaciones.
variaciones y combinaciones.
• Distinguir los anteriores agrupamientos a los que añadimos el cali·
ficativo de «con repetición».
A
• Conocer y calcular el valor de los números combinatorios.
de3x
• Calcular probabilidades de aparición de un suceso, aplicando la super!<
definición clásica de Laplace, cuando haya que recurrir a estos
conceptos.
Pero e
no da res;
tran en la
junto de j
I:I.~. 1'1I1"\ClI'IO Fl "\1> \ 'IF"\nl. siguiente,
Si un experimenlo puede realizarse de 1'1 1 maneras y, si continuando
el procedimiento, cada una de ellos puede realizarse de '12 maneras y, a
su vez, cada uno de ellos puede realizarse de 1"/3 maneras, etc., entonces
1:3.:3. 1'1
el número de formas en que puede realizarse el experimento es igual a:
En un
las disfu
tos de ta
La aplicación de este principio a los experimentos aleatorios pelmile,
elorde
en determinadas ocasiones, calcular el número de elementos de su espa-
cio muestral y si éste número no es muy elevado se puede representar grá- Elnú¡
ficamente median le un diagrama de árbol, lal y como se muestra en el tirde m t
siguiente ejemplo. pio de la
COMBINATORIA 375

Ejemplo 13.1. ¿De cuántas fonnas distintas puede recorrerse el


camino Logroño-Burgos-León-Santiago si de Logroño a Burgos pue-
de irse por tres rutas distintas, de BUrgQs a León por cuatro rutas dis-
tintas y de León a Santiago por dos rutas distintas?

Logroño

~

L L L L
• ~~

L L L L L L L L
AAAA 55555555
55555555
AAAA 55555S5S
AAAA
Aplicando el principio de la muJtiplicación, en total disponemos
de 3 x 4 x 2 = 24 rutas distintas que aparecen reflejadas en el árbol
superior.

Pero este principio general, que se aplica en multitud de situaciones,


no da respuesta a las preguntas planteadas en la introducción, que se cen-
tran en las diferentes formas de "permutar", "vanar" o "combinar" un con-
junto de elementos y cuyas caracteristicas distintivas se describen en los
siguientes epígrafes.

13.:3. PERMUTACIONES

En un conjunto de m elementos, se definen las pennutaciones como


las distintas agropaciones que se pueden formar con sus m elemen-
tos de tal forma que dos agrupaciones son distintas si difieren por
el orden de colocación de los mismos.
El número de pennutaciones diferentes que se pueden fonnaf a par-
tir de m elementos, se puede deducir intuitivamente a partir del princi-
pio de la ml1ltiplic:;::¡ción visto anr.enormenle. Por ejemplo, ¿Oe cuánl;::¡s
376 ANÁLISIS DE DATOS EN PSICOLOGlA 1 COMBlNATOR

formas distintas se pueden sentar tres profesores: Ángel, Enrique y Pedro


en la mesa de un tribunal de examen? Tenemos el conjunto de los profe. elección
sores -que representaremos por sus iniciales- e = {AEP]. Podemos elegir quiera d
en primer lugar cualquiera de estos tres elementos AEP. Sea este, por ejem. podemos
plo, A. Una vez elegido el primer elemento. podemos elegir a cualquiera tercera
de los dos restantes, EP, para ocupar el segundo lugar, por ejemplo E, que. gira
dando P para el tercer lugar. Aplicando el principio de la multiplicación cala
tenemos que en primer lugar podemos elegir tres elementos; para la segun. muJtip"
da extracción podemos elegir a cualquiera de los dos restantes y en la ter- de5x4
cera s610 podemos elegir uno. Por tanto el número de las distintas formas
de elección es: 3 x 2 x 1 = 6 posibles permutaciones distintas que se mues-
tran:
AEP, APE , EAP, EPA, PAE, PEA,
Obsérv~
Generalizando esta idea para el caso de ni elementos: en primer lugar ro de e1emer
podemos elegir a cualquiera de los ni elementos; en segundo lugar elegi- uno de los el
remos a cualquiera de los (m - J) elementos restantes; en tercer lugar a (oen este~
cualquiera de los (m - 2) restantes y así sucesivamente hasta que sólo nos idea.
queda un elemento por elegiI: De aquí, que el número de pClmutaciones
de 11l elementos es igual a:
P", =: m . (m - J) . (m - 2) . (111 - 3) .... 3 . 2 . 1
que se resume en la siguiente ex.presión:

P", =m!

que se lee «11/ factorial» y es igual al pmducto de los números naturales


existentes desde el 1 hasta el mI.
Con las permutaciones damos respuesta a la primera pregunta plan-
teada en la introducción que es muy similar a la que se presenta en el
siguiente ejemplo que sirve para aclarar este concepto.

Ejemplo 13.2. ¿De cuántas maneras distintas pueden sentarse


tres niños y dos niñas en la fila de un cine?
En primer lugar, podemos elegir a cualquiera de los 5 niños, sin
distinción de sexo, para la primera butaca. Una vez realizada esta

De
1 Por definición: O! = 1 den sen
m! .. //1. (m-1)!:/II' (111- 1)· (m-2)! no se sen
en gClleral:m! .. m. (11I - 1)· ... (III-m ... 2). (m -1/1 ... 1)
COMBINATORlA 377

elección y para ocupar la siguiente butaca podemos elegir a cual-


quiera de los 5 - 1 "" 4 restantes y siguiendo con el procedimiento
podemos elegir a cualquiera de los 5 - 2 = 3 restantes para ocupar la
tercera butaca. Posteriormente y para la cuarta butaca podemos ele-
gir a cualquiera de los 5 - 3 =2 restantes y finalmente la quinta buta-
ca la ocupará el 5 - 4 = 1 niño que resta. Aplicando el principio de la
multiplicación tenemos que los cinco «angelitos» se pueden sentar
de 5 x 4 x 3 x 2 x 1 = 120 fonnas diferentes.
Ps = 5·4·3·2·1"" 120 formas distintas

Obsérvese que todos los grupos están formados por el mismo núme-
I ro de elementos. Lo que diferencia a un grupo de otro no es que cambie
uno de los elementos (en este caso niños) sino el orden en que se colocan
(o en este caso, el orden de sentarse). El siguiente ejemplo profundiza esta
idea.

Ejemplo 13.3. ¿De cuántas maneras diferentes pueden sentarse


los mismos niños ,anteriores, si los niños quieren sentarse con los
niños y las niñas con las niñas?
Considerando el siguiente orden:

333~~ Los niños pueden permutarse, es decir se pue-


den sentar de 3! = 6 formas distintas y por su
parte las niñas pueden sentarse de 2! = 2 fonTIaS
distintas. En total3! x 2! = 12 formas distintas.
Pero también hay que considerar que los niños
se sienten a la izquierda de las Liñas de la
siguiente forma:
99333 Nuevamente los niños se pueden sentar de 31
formas distintas y las niñas de 21 formas dis-
tintas.

De modo que en total, sumando ambas opciones, los niños se pue-


den sentar de (3! x 20 + (31 x 2!) = 24 faunas distintas ("Posiblemente»
no se sentirian conformes con ninguna).
378 ANÁLISIS DE DATOS EN PSICOLOCtA 1 COMBINATOI

I:IA, "IU 'C10\ES

Imagine que tenemos un equipo docente con cinco profesores: Ángel.


Miguel, Enrique, Pedro y José y se tiene que fonnar un tribunal para un que son los
examen eXlraorclina¡;o de fin de carrera con dos miembros en el que el
primero actuará de Presidente y el segundo de secretario, ¿Cuántos tri- Eje
bunales diferentes de dos miembros se podJian formar? Suponga que se neacion
eligen los dos siguieme: Miguel y Enrique en el que el primero es el pre-
sidente y el segundo el secretario. Este tribunal es diferente a este otro: Consi
Enrique y Miguel porque el orden determina quién actuará de presiden- -Martine
te y quién de secretario. En situaciones como estas nos encontramos ante ya en dif
las variaciones de 111 elementos lomadas de" en 11 que se definen de la de ocho
siguiente forma. po en un
Dado un conjunto de m elementos. se denomina variaciones de orden
< m) a las distintas agrupaciones de estos n elementos que pue-
11 (11
v.
den realizarse de modo que dos agrupaciones son distintas si difie-
ren por los elementos que la componen O por el orden de colocación
de los mismos. Puede ot
Siguiendo con el mismo ejemplo de los cinco profesores: Ángel, Miguel. lar de las va
Enrique, Pedro y José que vamos a representar por sus iniciales c:= {A, M, variaciones
E. P, J}, se pueden fonnar las siguientes variaciones de orden dos o bina-
rias:
AM.M,AP,M,ME,MP.W,U.8,n
~,~.M.M,EM.m,m.ff,n,ff Por tant(
der calcuJaJ1
donde los distintos agrupamientos difieren por la 'la/l/raleza de sus ele-
co elemento
mell/Os o por el ordell de colocació/1 de los mismos. Nótese que a diferen-
entonces la
cia de las permutaciones dos grupos son distintos si cambia la identidad
ve está en qt
de alguno de sus elementos (de modo que el gnlpo AM es distinto que el
tes que se pi
AP) y, de forma similar a las permutaciones, si cambia el orden de colo-
mientras qu.
cación de los elementos (que hace que el grupo AM sea distinto al grupo
derar O T<
MA). menros(n d
El número de variaciones de orden n que se pueden formar a partir de
m elementos, viene dado por la siguiente expresión:
1:\..,. cm
vm.u :=
(111
111!
-Il)!
= 111 . (111 -l). (111 - 2) ... (111 - n + 1)
Siguiend
biar la preg¡.
que se lee «11/ factorial dividido entre 111 menos n factOlü).. En el ejem- den formar
plo que hemos desarrollado: dos: José y E
JGfA 1 COMBINATORJA 379

v. - 51 _ 5·4· A! _ S 4 =20
S.l - (5 _ 2)! - A! - .
ngeJ,
a un
que son los 20 tribunales que hemos desarrollado.
ue el
:;tri- Ejemplo 13.4. Con una plantilJa de ocho jugadores ¿cuántas ali-
le se neaciones diferentes se pueden fonnar en un equipo de baloncesto?
pre-
)tro: Considerando que dos alineaciones son distintas si el jugador
den- .Martinez» juega de pívot o de base (lo que hace que el orden influ-
anle ya en diferenciar dos grupos) estamos ante un caso de variaciones
:te la de ocho elementos tomados de cinco -número de jugadores de cam-
po en un partido de baloncesto- en cinco. es decir.
roen v. = 8! = 8! = 8·7·6·5·4·3! =8.7.6.5.4=6720
¡lue- 8.5 (8 _ 5)! 3! 3!
ifie-
ción
Puede obsen'arse que las permutaciones constituyen un caso particu-
~el, lar de las variaciones de 111 elementos tomados de 111 en m, es decir, de las
¡,M, variaciones de orden ni. ya que:
,ina-
m! _ 11I! _ 1_ P
11m .... _
- - - - 1 1 1 . - '"
(m-m)! 0\

Por tanto, a la primera pregunta planteada también podemos respon-


der calculando las diferentes variaciones que se pueden fonnar con cin-
ele- co elementos (alumnos en este caso) tomados de cinco en cinco. ¿Cuál es
ren- entonces la diferencia entre las variaciones y bs pel111utaciones? La cla-
idad ve está en que las pennutaciones considera el número de gl1.lpos diferen-
leel tes que se pueden f0l111ar con ¡TODOS! los elementos, (los 111 elementos)
010-
mientras que las variaciones añade la particula¡idad de que puede consi-
upo derar NO TODOS los elemenlos, sino también un número menor de cle-
mentos (11 de los 111 elementos, siendo /1 meno.. que 111).
rde

I:l.-;. 1:0\1111\ \C10\I:S

Siguiendo con el ejemplo de los cinco profesores, ahora vamos a cam-


bia¡'la pregunta: ¿cuántos tribunales diferentes de dos miembros se pue-
em- den fOfmar sin hacer distinción entre ellos? Supongamos que se eligen
dos: José y Emique. Este tribunal es diferente al fom1ado por José y Pedro,
380 ANÁLISIS DE DATOS EN PSICOLOGíA t COMBINATORIA

pero el mismo que el fonnado por Enrique y José. Esta distinción nos lJe- tanto, dado el
va al concepto de combinaciones que definimos de la siguiente forma: mientas EPy
dado un conjunto de 111 elementos, se denomina combinaciones de orden ción y lo miso
11 (11 < m) a las distintas agrupaciones de estos n elementos que pue- como se recog
den realizarse de modo que dos agrupaciones son distintas si se dis-
tinguen únicamente por uno o más de los elementos que la compo- Tabla 13.1.
nen. Por ejemplo. dado el conjunto e = {A,M ,E,P,l}, se pueden fonnar las lo",
siguientes combinaciones de orden dos o binarias:
AM . AE, AP ,Al. ME, MP ,MJ , EP , El • PJ
ya que a diferencia de las variaciones, al no distinguir entre presidente y
secretario el orden de colocación no influye y. en consecuencia. los siguien-
tes agrupamientos son iguales:
De fonnaq
AM = MA . AE = EA, AP = PA. Al = JA • ME = EM . distimas y en J
MP = PM • MJ = JM. EP = PE. El = JE. PJ = JP nes distintas. I
El número de combinaciones de orden tl que se pueden fonnar a par- tos, haya n! ve
tir de m elementos, viene dado por la siguiente expresión: se cumple la si

e = m!
m.n 11!.(m _ n)!
o bien, despej~

Cabe preguntarse ahora ¿en qué se diferencian las combinaciones de


las vadaciones? Si ha entendido los conceptos verá que cuando el orden
influye se trata de variaciones. Es lo que ocun'e en el ejemplo del tribu-
naJ de examen donde al actuar el primero de presideme y el segundo de Las combin
secretario, el tribunal Pedro-Enrique es distinto del tribunal Enrique-
sentan por el 11
Pedro. Lo mismo con el ejemplo 13.4 donde la alineación del equipo de
baloncesto, aún formada por los mismos cinco jugadores, es diferente
cuando cambiamos su situación en el campo. Finalmente, piense en lo
que ocurre con los números: si el número premiado de la lotería es el
78.903 Y hemos jugado al 38.709 no hay motivo de reclamación (pero sí Ejempl
de desesperación). Por el contrado, al pedir un plato «combinado .. de a)
pollo con ensaladilla y croquetas, el orden en que lo mencionemos no
cambia la naturaleza del plato. De forma similar, si no hay distinción den- b)
tro de los miembros de un t1ibunal, el fonnado por Miguel y Ángel es el
mismo que forman Ángel y Miguel.
Siendo las combinaciones y las variaciones diferemes conceptos exis-
te, sin embargo, relación entre ambas como veremos a continuación. Para
ello insistimos en lo dicho: las «;....
son el número de forolas de seleccio-
nar tn elementos de un conjunto de 111 sin tener en cuenta el orden. Por
OGfA J COMBINATORJA 381

os lIe- tanto, dado el conjunto C "" (A, M, E, P, J], las ordenaciones o agrupa-
)rma: mientos EP y PE son dos variaciones diferentes pero la misma combina-
orden ción y lo mismo para las ordenaciones AM y MA Y con AE y EA, etc., lal
~ pue- como se recoge en la tabla 13.1;
e dis-
mpo· Tabla 13.1. Diferentes agrupamientos de dos elementos que se pueden
<arIas formar con los elementos del conjunto e = (A, M, E, P, .1),

Vorioci(ll'leS de orden do~ o b¡norio~: Combinociones de orden do! o binorio~:


AM,AE.AP,AJ,ME,
MP .MJ, EP, El, PJ, AM,AE,AP.AJ~,
~nte y MA,EA,PA,JA.EM. MP ,MJ, EP, El, PJ
PM.JM,PE,JE.JP,
~en-

De fonna que cada combinación de 2 objetos da lugar a 2! variaciones


distintas y en general cada combinación de 11 objetos origina n! \'ariacio-
nes distintas. De aquí que, al elegir los agrupamientos de 11 en 11 elemen-
:l par- tos, haya Il! veces más variaciones que combinaciones y en consecuencia
se cumple la siguiente relación:

Iv""", =II!C""",
o bien, despejando las combinaciones:
les de
>rden Cm,tl "" V;"'"
1
'l.
:ribu-
io de Las combinaciones de m elementos tomadas de 11 en 11, (Cm",)' se repre-
ique-
sentan por el número combinatorio: (':,') que se lee 111 sobre 11.
po de
rente
colo
es el
~ro sí
Ejemplo 13.6. En un aula hay 12 niños y 8 niñas
011 de a) ¿cuántos grupos distintos de 3 niñas podemos fonnar?
)s no
I den-
b) ¿Cuántos grupos distintos de tres alumnos se pueden rOlmar?
es el e) ¿Cuál es la probabilidad de que escogido un grupo de tres alum-
nos, los tres sean ninas?
exis- En la primera pregunta, los distintos grupos de niñas se distin-
Para guirán, lógicamente. por las niñas que lo fonnan, no influyendo el
:ccio- orden como elijamos a las niñas, puesto que ni van a sentarse ni a
l. Por
382 ANÁLISIS DE DATOS EN PSICOLOGfA r COMBINA'

formar un equipo de baloncesto o de cualquier otra índole donde Estos n


influyese el orden. Se trata, por tanto, de las distintas combinacio~ los nún
nes que se pueden formar con las ocho niñas de la clase elegidas de rior (el
tres en tres:~

e8,3 ~_(8)_ 8! 8-7-6-5!=8_7=56


- ('~')
3 - 31(8-3)! 3!5! - Uom
En el segundo caso, los grupos pueden estar fonnado por niños
o niñas y, por la misma razón anterior, tampoco influye el orden:

e =(20)= 20! =20-19-18-17'=1140 o bien ~


20,3 3 3! (20 - 3)! 3! I 7! cal:

La tercera pregunta requiere aplicar la definición de Laplace o


cociente entre casos favorables y casos posibles. Acabamos de cal-
cular que hay 1.140 posibles grupos formados por tres alumnos y en
la primera pregunta hemos calculado que se pueden formar 56 gru-
pos distintos formados por tres niñas. de modo que la probabilidad
En el:
pedida es: ros comb

P(tres niñas) = 1~:o = 0,049


Eje
siguie

ACLARACIÓN: Como ya se ha dicho, la expresión (',~) se lee.m sobre m.,


recibe el nombre de número combinatorio y goza de caraclerísticas inlere-
Sel
santes que a continuación expondremos sin demoslración. Si m y 11 son riorse¡
números enleros y tales que O ~ 11 ~ m, entonces:
- Todo número combinatorio tiene su complementario:
y los n

Por ejemplo, el número de combinaciones de orden dos que pueden reali-


zarse con seis elementos. coincide con el número de combinaciones de orden
cuatro, ya que:
Lo vis
den fonn
se denoro
tivo de or
COMBINATORlA 383

Estos números complementarios tien~a característica de Que la suma de


los números de la parte inferior (4 Y2) es igual al número de la parte supe-
rior (eló).

-('"J- m! -~-....!..-l
O - O!(m -O)! - Olm! - 01-
yaqueO!:=1

- Un número combinalorio se puede expresar como suma de dos:

o bien si sustituimos m por m-l, tenemos la fónnula desarrollada por Pas-


<al,

En el siguiente ejemplo aplicaremos estas propiedades de los núme-


ros combinatorios.

Ejemplo 13.7: Calcúlese el valor de x para que se cumpla la


siguiente iguaJdad:

(2:~JU~2)
Se tiene que cumplir que la suma de los números de la parte infe-
rior sea igual a 20, por tanto:
2X + 7 + 3X - 2 = 20 --..?5X + 5 = 20 --..? X = 3
y los números son:

Lo visto hasta aquí trata de los diferentes agrupamientos que se pue-


den formar con m elementos, todos ellos distintos. Estos agrupamientos
se denominan permutaciones, variaciones o combinaciones con el adje-
tivo de ordinarias que se suele omitir. ¿Qué ocurre si los elementos ya no
384 ANÁLISIS DE DATOS EN PSICOLOGíA 1 COMBIN,

son todos distinlOs sino que uno o varios de ellos se pueden presentar colocac:
repetidos? Los conceptos son los mismos, pero ahora se denominan per- elemenL
mutaciones con repetición, variaciones con repetición y combinaciones orden 2.
con repetición y lógicamente cambiará la expl'C:sión que nos permite su
cálculo. Lo veremos en los apartados siguientes.

1:\.1>. 1'E1l\llT\CIO\ES eO\ HEI'ETICI()\

El número de permutaciones de ", elementos de los cuales p son Engl


iguales, q son iguaJes, r son iguales, etc., (y de tal forma que p + q -+ r prodUCll
+ ... + Z. = m) viene dado por la siguiente expresión: ción de 1
expresió

Ejemplo 13.8: Se lanza cinco veces una moneda ¿en cuantos casos
obtendremos tres caras?
Podemos escribir el espacio muestraJ que estará formado por las
permutaciones con repetición de cinco elementos. los cinco lanza-
mientos. de los cuales tres (las caras) son iguales y dos (las cruces)
también son iguales. Téngase en cuenta que el orden influye de tal
fonna que dos agrupamientos fonnados por los mismos elementos
son distintos si están situados en distinta posición.
CCCXX CCXXC CXXCC XXCCC CCXCX CXCCX XCCCX
XCCXC XCXCC CXCXC

PR),l =~= la
.s 3!.2!
1:3.8. (J

Dado
1:1::. \ \111 \C10\ES CO\ IIEI'ETIClÚ\ nes con 1
den fon
A diferencia de las variaciones ordinal;as ya tratadas, en este caso se tos y di
consideran posibles repeticiones de algún elemento a la hora de fOI-- distingu
mar las distintas agrupaciones. por lo que las variaciones con repetición ponen. ~
de orden 11 son las diferentes agrupaciones de n elementos iguales o
distintos elegidos entre los ro elementos, considerando que dos agru-
paciones son distintas si difieren en algún elemento o en el orden de
lA 1 COMBINATORIA 385

tar e
colocación de los mismos. Por ejemplo, dado el conjunto == [ebm}, cada
er· elemento del producto cartesiano CxC es una variación con repetición de
leS orden 2. Las distintas agrupaciones son:
su
I CxC e b m
e ee eb em
b be bb bm
m me mb mm
>D En general, dado un conjunto A de ro elementos, cada elemento del
.r producto cartesiano AxAxAx... xA (o veces) es una variación con repeti~
ción de orden n, en nuestro caso 3x3 = 9 y vienen dadas por la siguiente
expresión:

VR m ... = rn"

Ejemplo 13.9: Para organizar una lotería casera ¿cuántos núme~


ros distintos (que no papeletas o participaciones) de 4 cifras se pue~
den formarean Jos dígitos 0, 1,2,3,4,5,6,7,8, 9?
Aunque el lector avispado ya habrá adivinado que estos son los
diezmil números que van desde el 0000 hasta el 9999, la solución
viene de las distintas variaciones con repetición -ya que el orden
hace que, por ejemplo. la agrupación 1232 sea distinta a la 3212-
que pueden formarse con los diez dígitos tomadas de cuatro en cua-
tro, es decir:
VR I04 = lO" = 10000

13.8. COMBINACIONES CON REPETICIÓN


Dado un conjunto formado por m elementos, se llaman combinacio-
nes con repetición de orden n a las distintas agrupaciones que se pue-
den fonnar con estos n elementos que pueden ser iguales o distin-
tos y diremos que dos combinaciones son distintas cuando se
distinguen por la naturaleza de alguno de los elementos que la com-
ponen. Su número viene dado por la siguiente expresión:

CR = (m+n-l)!
m.n n!.(m -1)!
386 ANÁLlSlS DE DATOS EN PSICOLOGíA 1 COMBINATOJ

Se puede demostrar que el número de combinaciones con repetición


de 111 elementos tomados de n en n es igual al número de combinaciones ciones
ordinarias de (m + f1 - 1) elementos tomados de 11 en n, es decir: gorras y

CR m .n = C(m+"_I),,, = (m+I1-1)
11

demostración que no haremos pero que intentaremos ilustrar en el siguien- Present~


te ejemplo.

Eje
cinco
Ejemplo 13.10: De cuántas formas dislintas se pueden repartir
tos?
seis gorras iguales entre tres niños (Jaimito, Jorgito y Juanito).
Se
Se trata de repartir las seis gorras a los tres niños sin ninguna con-
rep
dición restrictiva, es decir que Juanilo se puede llevar las seis gorras
C,de
(G) y los otros ninguna o él se puede llevar cinco, Jorgito una y Jai-
queBy
mito ninguna, o dos cada uno de los niftos, etc., tal y como se ilustra
te don
en el siguiente dibujo:

GGGGGGI I
~~~
Juanito JOIl!ilO JairnllO

GGGGGI G I
Se
~~~ mentas
Juan!!ú Jorglto Jaimllo

GGIGGIGG
~~­
Juanito Jorgito JaimilO

etc.
que representas las distintas combinaciones con repetición de tres
elementos (los niños) tomados de seis en seis (las gorras). En defini- y. si consi
tiva, disponemos de ocho elementos -las seis gorras iguales (G) más nes con rep'
las dos barras de separación- que tenemos que combinar de seis en ducción y
seis, Por tanto: rente situ

CR _(3+6-1)_(8)_
3.6 - 6
8! _8! -28
- 6 - 6!(8-6)1 - 6!2! ~ U.9. RB

Con otro argumento: disponemos de ocho elementos -las seis En el te


gorras iguales (G) más las dos barras de separación- que tenemos babilidad)
que permutar de todas las fonnas posibles. Estas son las permuta- lidad. de lz
oe la misrr
.oG{AI COMBINATORIA 387

tición
;iones ciones con repetición de 8 elementos (6 G + 2 /) de los cuales hay 6
gorras y 2 barras que se repiten:

R"
8
= Jl!..
6!2!
= (8)6 = (8)2 = 28
guien- Presentamos otro ejemplo, con el fin de afianzar este concepto:

Ejemplo 13.11: ¿De cuántas fonnas diferentes se puede asignar


cinco pacientes con idéntico cuadro clínico a tres terapeutas distin-
ir tos?
Se trata de asignar los cinco casos clínicos, que son idénticos y
on· representaremos por X, a los tres terapeutas, que llamaremos A, B y
as e, de tal fOIma que A se puede quedar con los cinco casos mientras
ai· que B y e no tienen ninguno o cualquier otro reparto como el siguien-
ltra te donde el terapeuta A tiene 3 casos, B ninguno y e dos casos:

XXXI
~~~
IXX
A B e
Se trata por tanto de las combinaciones con repetición de tres ele-
mentos tomados de cinco en cinco:

_(3+5-1)_(7)_ 7!
/

CR -~-''8' ,¡ -
3,_~ - 5 - 5 - 5!(7-5)! - 512!-1@)

es
y, si com¡idera adquiridos estos conceptos, resolverá que las combinacio-
ni-
nes con repetición da respuesta a la última pregunta planteada en la intro-
nás
ducción ya que constituye el mismo planteamiento numéJico pero en dife-
·en
rente situación.

13.9. fiESlJ:\'lEN

seis En el tema anterior se han introducido los conceptos básicos de la pro-


os babilidad y posterionnente se han dado las tres definiciones de probabi-
, la· lidad, de las cuales en la práctica se aplica la definición clásica que defi-
ne la misma como el cociente entre casos favorables y casos posibles de
388 ANÁLISIS DE DATOS EN PSICOLOGÍA 1 COMBiNA

aparición de un suceso. Pero, aunque esta definición no excluye las otras el I


dos. es más frecuente aplicar la definición clásica para lo que necesita-
mos contar el número de casos favorables y el número de casos posibles
de aparición de éste suceso. Esto lo hacemos recumendo a la combina-
toria que estudia las diferentes formas de agrupar un conjunto de ele- 8] Sel
de.
mcntos dando origen a las permutaciones, variaciones y combinaciones
ordinarias o con repetición cuando se pueden repetir alguno de los ele- cue
mentos que lo forman. La diferencia fundamental entre las variaciones y 18:
las combinaciones es si el orden de los elementos hace que dos agrupa- Pal
ciones. aun estando formadas por los mismos elementos son diferentes, nes
en lanto que las pennuladones es un caso particular de las variaciones al I
cuando se consideran todos los elementos para formar los agrupamientos. bl )
(

el J
1:1.10. I:.IEHClCIOS

Como se sabe. las matrículas europeas de los vehículos matricula-


0 COI

al )
dos en España constan de cuatro números seguidas por tres de las
bl I
21 leu"3s consonantes (excepto la Q y -). ¿Cuántos vehículos se pue-
den matricular con este procedimiento?
el I
a) VR 3 1.1
b) CR 10•4 • CR 2I •3
0 Se)
sac¡
e) VR 10.4 • VR 2U al )
(
La Empresa Municipal de lranspol1es de una delerminada ciudad
dispone de 8 líneas para ir del centro urbano al campus universita- bl J
(
rio. Para calcular de cuantas formas puede un estudiante hacer el
viaje de ida y vuelta. si los autobuses de ida y vuelta tienen que ser el J
de diferente línea, calculamos (

a) Las variaciones de 8 elementos lomados de dos en dos


b) Las combinaciones de 8 elementos tomados de dos en dos m Sigo
es:
e) Las variaciones de 8 elementos tomados de uno en uno.
al •
Un gabinele de Psicología que está formado por siete mujeres y cua- bl
Iro varones desea formar una comisión pal"3 el seguimiento y estu- e) j
dio de casos clínicos. Si se desea Que dicha comisión esté fonnada
por cinco miembl"Os (tres mujeres y dos varones) tenemos que cal-
cular:
0 Si j
ra 1
dos
a) Las variaciones de 1I elementos lomados de cinco en cinco.
b) Las combinaciones de siete elementos tomados de tres en tres y, al I
por el principio fundamental. multiplicarlas por las combinacio-
nes de cuatro elementos tomados de dos en dos. bl
itA l COMBtNA.TORIA. 389

tras e) Las variaciones de siete elementos tomados de tres en tres y, po"


ita- el principio fundamental, multiplicarlas por las variaciones de
)Ies cuatm elementos lomados de dos en dos.
ina-
ele- Se desea "ealizar un experimenlo sobre el efecto que las opiniones
de un grupo tienen sobre la percepción de una persona. Para ello, se
nes
ele- cuenta con un grupo de 3D alumnos de 1. 0 de Psicología, de los que
18 son vamnes. Se selecciona aleatoriamenle 5 alumnos del grupo.
"'Y Para calcular la probabilidad de que los elegidos sean todos varo-
.pa-
les, nes, aplicando la definición clásica, los casos posibles son:
nes al Las combinaciones de 3D elementos tomados de cinco en cinco.
lOS. b) Las variaciones con repetición de 3D elementos tomados de cin-
co en cinco.
el Las pennutaciones de cinco elementos.
COnlinuando con el ejercicio antel;or, los casos favorables son:
J1a- a) Las combinaciones de 3D elementos tomados de 18 en 18.
las b) Las permutaciones de 18 elementos.
oUe- r r
el Las combinaciones de 18 elementos tomados de trc;i en tt"es.
Se lanza ci.nco veces una moneda, para calcular la probabilidad de
sacar tres caras, el número de casos posibles con'esponde a:
a) Las permutaciones con repetición de cinco elementos con tres
Jad caras y dos cruces.
ita- b) Las combinaciones con repetición de cinco elememos tomados
rel de dos en dos.
ser e) Las valiaciones oon repetición de dos dementas lomados de cin-
co en cinco.
Siguiendo con el ejercicio anterior, el número de casos favorables
es:
ai 20
ua- b) [O
¡tu· e) 25
.da
:a1· Si jugamos al az.ar una apuesta a las quinielas y queremos cak.ula-
ra la probabilidad de aeerla¡' un pleno al 15, el número de resuha-
dos posibles viene dado por:
:sy, a) Las combinaciones con repetición de 15 elementos Lomados de
:io- 15 en \5.
b) Las vaJiaciones con repetición de 15 elementos lomados de 3 en 3.

1
390 ANÁLISIS DE DATOS EN PSICOLOGlA I COMBlN

e) Las variaciones con repetición de 3 elementos lomados de 15 en


15.
¿Cómo podemos calcular. utilizando la combinatOlü, el número de
fichas del tradicional juego del dominó? fOl

a)
b) Vu
eu 11 losEl
de>
e) CR7.l cia
Un profesor ha elaborado 10 problemas de estadística descriptiva y no
otros 10 de estadística inferencia!. Para la realización de un examen too
elige cuatro de ellos. Se pregunta: ¿Cuántos exámenes distintos pue·
de realizar con dos ejercicios de cada una de las dos panes?
a) C 10..2· C 10.2
b) V 10.2 . V 10..2 la r
e) PR 10•l

1:1.11. SOI.l IIO"\I:S \ I.OS I..II.H(II\OS


• El.
sel

a Al tratarse de una serie de cuatro número y tres lerras. en que los


elementos pueden repetirse e interviene el orden, los números son
la n
las variaciones con repetición de 10 números lomados de cuatro en
cuatro y las letras las variaciones con repetición de 21 letras toma- 11 cin<
Pa.

das de tres en tres. Por tanto aplicando el principio fundamental, de,


nos queda: ces
dist
VR IO .4· VR 2U = 10 4 .21 3 = 10.000·21·21·21 = 92.610.000
ció~
la respuesta es c. lom

D Puesto que influye el orden, se trata de las variaciones de ocho ele-


mentos tomados de dos en dos y por tanto: la"
~
82 -
_ 8!
(8 - 2)1
= 8·7·6! =56
6! B Eln

la respuesta es a.
mujeres se eligen de un grupo de siele y como el orden no la r
11 influye
Las ¡res
se pueden elegir de C fOlmas distintas. Por la misma razón
7 .3
los hombres se pueden seleccionar de C42 formas distintas. Por el 111 caso
Los
principio de la multiplicación la comisión se puede seleccionar de se",
Al COMBINATORIA 391
en
c7,3e-1,2 = (37X4)2 =---=210
7! 4'
3!4! 2!2!
de
formas distintas. La respuesta es b.

a El número de casos posibles o espacio muestral está fonnado por


los distintos grupos que se pueden hacer con los 30 alumnos toma-
dos de cinco en cinco. Los distintos agrupamientos sólo se diferen-
ciarán por la naturaleza de los alumnos que lo componen y el orden
'Y no innuye. Se trata por tanto de las combinaciones de 30 alumnos
en lomados de cinco en cinco:
le-
e30.5 = (30)
5
= 30'
5!(30 S}!
= 142506

la respuesta es a.

11 seEl pueden hacer


número de casos favorables son los distintos agmpamientos que
con los 18 alumnos varones lomados de en tres:
tl"es

e18,3 -_(18)_
3 -
18! -816
3!(18-3)!-
los
la respuesta es c.
on
en
la- 11 cinco
Para detemlinar los casos posibles que se pueden obtener con los
JanzamienlOs hay que detenninar las dislintas agrupaciones
al. de cinco elementos que se pueden formar con las caras (e) y las cru-
ces (X) donde los elementos e y X se repiten y la tirada CXCXX es
distint:J que la tirada XCCXX. Por tanto el orden innuye y la solu-
ción es el número de va¡-¡aciones con repetición de dos elementos
lomados de cinco en cinco:
le-
la '-espuesla es c.
B El n Lllnero de casos favorables es:

PR3l == 5! =S·4-3! =10


s 3!.2! 3!.2!
no la respuesta es b.
6n
-el
le • Los casos favonlbles son las apueslas que jugamos que en nuestro
caso es una y los casos posibles son los distintos agrupamientos que
se pueden f0l'1l1ar con los símbolos I-X·2 tomados de 15 en 15. Como
392 ANÁLISIS DE DATOS EN PSICOLOGíA I

estos símbolos se repiten e influye el orden, nos encontramos en el


caso de las variaciones con repetición de 3 elementos tomados de 15
en 15, esto es:
VR 3 . IS = ys = 14348907

la respuesta es c.

11 Cada una de las fichas de dominó consta de dos partes, en cada una
de las cuales puede estar uno de los siete elementos posibles (blan-
ca, 1,2.3,4,5 Y6). estos elementos pucdcl);fCpetirse (fichas blanca
doble. I doble ....) y no interviene el orden./por tanlo son las Combi-
naciones con repetición de siete elementos lomados de 2 en 2. Es
decir:
8! 8·7 ·6!
CR 7 .l =C8~ = -- = =28
- 6!·2! 6!·2!

la respuesta es c.
Resuha evidente que de los 10 problemas de la plimcra parte pue-
de elegir C IO.l exámenes distintos con dos problemas y lo mismo con
los de la segunda parte y por el principio fundamental el número de
exámenes diferentes con dos ejercicios de cada parte es:
C IO. l ' ClO,l

la respuesla es 3.

,
Tema 14
Teoremas de probabilidad

,
SUMAIlJO 14.1.

En
14.1. introducción penniti
14.2. Teorema del producto dicionc
así con
14.2.1. Para sucesos independientes que ele
14.2.2. Para sucesos depe.ndientes la UNE
14.3. Teorema de la suma tes o si
14.3.1. Para sucesos mutuamente excluyentes
14.3.2. Para sucesos simultáneos • ¿e
14.4. Teorema de la probabilidad iotnl • ¿c

14.5. Teorema de Bayes
• ¿e
14.6. Resumen
• ¿o
14.7. Ejercicios co
14.8. Soluciones a los ejercicios • ¿e
• ¿o
Las
nifiea
Para l1f
cíficos:
1-1.1. I"TIIOIJL (TH)"

En los apartados que siguen veremos una serie de teoremas que nos
permiten calcular probabilidades de sucesos que reúnen una serie de con-
diciones (mutuamente excluyemes o no. dependientes o independientes)
así como los teoremas de la probabilidad lotal y de Bayes. lmaginemos
que elegimos aleatoriamente una persona entre todos los estudiantes de
la U ED. con ellos podremos dar respuesta a preguntaS como las siguien-
tes o similares:
• ¿Cuál es la probabilidad de estudiar psicología y ser mujer?
• ¿Cuál es la probabilidad de que un alumno pertenezca al Centro Aso-
ciado de Valdepeñas o de Vizcaya?
• ¿Cuál es la probabilidad de estudiar psicología O ser mujer?
• ¿Cuál es la probabilidad de que una persona esté matriculada en Psi~
cología y tClmine sus estudios?
• ¿Cuál es la probabilidad de estudiar psicología siendo mujer?
• ¿Cuál es la probabilidad de ser mujer estudiando psicología?
La.s preguntas difien~n no solo en su redacción sino también en su sig-
nificado e implican diferentes estrategias o principios de la probabilidad.
Pam llegar a su solución se requiere alcanzar los siguientes objetivos espe-
cíficos:

• Distinguir entre sucesos compatibles (o simultáneos) y sucesos


incompatibles (o excluyentes).
396 ANÁLISIS DE DATOS EN PSICOLOGlA I TEORE

Co
• Distinguir entre sucesos dependientes e independientes. dicion
• Distinguir entre aquellas situaciones que requieren aplicar el teo- Bes la
rema de la suma de las que requieren aplicar el teorema del pro- OU
ducto. con cil
• Diferenciar los conceptos de probabilidad a priori, probabilidad a los suc
posteriori y verosimilitud. probal

• Representar en un diagrama de árbol las anteriores probabilida-


des para, poslerionnente, ser capaces de identificar las situaciones
que requieren aplicar el teorema de Bayes o el teorema de la pro-
babilidad lOtal Si I
Y volvt'
las mü
bies sil
I·U. TEOIII:\I \ DEL l'II0DLCTO mos la
probal
bolas.
El teorema del producto se aplicará en aquellas situaciones que requie-
y P(R)
ren dar respuesta a preguntas que, en términos generales. se formulan de
que en
la siguiente fOlma: ¿Cuál es la probabilidad de que aparezca un suceso y
eonti
el aIro? En esle lipo de fonnuladones la letra y, como una conjunción
total d+
copulativa que es, implica la aparición simultánea de dos sucesos)' se na-
des P(,
duce como la intersección de sucesos que se calcula aplicando el teore-
ma del producto. Con este teorema daliamas respuesta a la primera pre·
gunla fonnulada en la introducción: ¿Cuál es la probabilidad de estudiar p(
psicologfa)' ser mujer?
Previamente tenemos que distinguir entre lo que se entiende por suce·
PO
sos dependientes y sucesos independientes cuya definición ya se pro-
porcionó en el tema 12 y sobre la que vamos ahora a profundi7.ar con el Si ~
fin de calcular después fa probabilidad de la aparición simultánea de dos la urna
O más sucesos. babili

Hay situaciones muy frecuentes en la vida cotidiana donde la apari-


ción de un suceso A depende de la aparición de 011'0 suceso B. Diremos
en estos casos que Jos sucesos A y B son dependientes porque la pro-
De
babilidad de A depende, o está condicionada, al suceso B .
nada q
Por ejemplo, sean los sucesos: dicio

A = (esrucliar la calTero OUE ME APETECE} En


A cone
B = [sacar en selectividad la nota QUE NECESITO] dido E
TEOREMAS DE PROBABILIDAD 397

Como el lector conoce sobradamente, la probabilidad de A está con-


dicionada o depende de la aparición de 8 y lo escribimos P (AJB) donde
B es la condición requerida.
Otro ejemplo, por el momento más ilustrativo: supongamos una urna
con cinco bolas de las cuales tres son azules y dos son rojas. Definimos
los sucesos A = {bola Al.ul) y R = {bola Roja). En la primera extracción las
probabilidades de cada suceso son respectivamente:

P(A) =",3 y P(R) =",2


Si tras la primera extracción devolvemos las bolas eXlraídas a la urna
y volvemos a repetir la experiencia, las probabilidades P (A) Y P (R) son
las mismas porque mantenemos las mismas cinco bolas como casos posi-
bles siendo tres azules y dos rojas pero, por el contrario, si no devol\'e·
mos la bola extraída a la urna y realizamos una segunda extracción las
probabilidades P(A) y P(R) ahora cambian porque ya no tenemos cinco
bolas, sino cuatro (casos posibles), y cada una de las probabilidades P(A)
y P(R) dependen de que la primera bola fuese azulo roja. Supongamos
que en la primera extracción la bola era roja (condición), enlonces la urna
contiene ahora tres bolas azules y una roja (casos favorables) sobre un
10lal de cualro casos posibles y en la segunda extracción las probabilida-
des P(A) y P(R) valen,

P(AI R) =¡
P(R I R) =2-
4

Si en la primera extracción la bola era azul (condición), entonces en


la uma quedarán dos bolas azules y dos mjas (casos favorables) y las pm-
habilidades en la segunda extracción son:

P(AI A) ="42 y P(RI A) ="42


De esla forma, hemos expuesto el concepto de probabilidad condicio-
nada que en general lo escl;bimos P(AIB) y se lee «probabilidad de A con·
dicionada a B».
Entonces, si los sucesos son dependientes, se llama probabilidad de
A condicionada a D a la probabilidad de A suponiendo que ha suce·
dido D, y es:
398 ANÁLISIS DE DATOS EN PSICOLOGÍA I TEOREMA~

P(AI B) = peA nB) siempre que P(B) *O


P(B)

de la misma forma, la probabilidad de B condicionada a A es:

P(BIA) = P(BnA)
P(A)
= P(AnB)
peA)
.
sIempre que
P(A)
'* O P
en general, la probabilidad de un suceso A dependiente de otro B, o
la probabilidad de A supuesto B, es igual a la probabilidad de la inter·
sección dividido por la probabilidad de la condición B. Este teorema
da respuesta a las dos últimas preguntas planteadas en la introducción
de este tema:
- ¿Cuál es la probabilidad de estudiar psicologfa siendo mujer?
- ¿Cuál es la probabilidad de ser mujer estudiando psicología?
1-1.2.1. l'
En el primer caso la condición es ser mujer y en el segundo la condi-
ción es estudiar psicología, de modo que llamando a los sucesos S = estu- Comas
diar psicología y M -= ser mujer. en el primer caso tendríamos que obtener de ellos de]
P(SlM) y en el segundo P(M/5) sin ningún motivo que nos lleve a pensar que se p~
que ambos resultados tengan que ser iguaJes. En el siguiente ejemplo apli- ne despeja
caremos este mismo teOrema a otra situación. nada que s

Ejemplo 14.1. De los 3.570 alumnos matriculados en una asig-


natura durante el cu.(So 1992-93, 1.428 se presentaron a la convoca-
toria de febrero en la primera semana (1) de los cuales aprobaron (A) y despejanl
1.071, mientras que, de los que se presentaron en la segunda sema- simultánea
na (2), suspendieron (5) 1.478. Elegido un alumno al azar, calcula:
a) La probabilidad de que esté aprobado, (A).
b) Estando suspendido (5), la probabilidad de que se presentase y como la ~
en la segunda semana (2). bién poden
A partir de los datos del enunciado, señalados en negrita, se cons-
truye la siguiente tabla que nos pennitirá calcular las probabilidades
pedidas: peA) y P(2/S) que se lee
dependien
t 2 la probabiJ
A 1071 644 1735 nido». Est:
S 357 1478 1835 acuerdo ca
1428 2142 3570
=P
TEOREMAS DE PROBABILlDAD 399

P(A) = !!o. = 1735 = 0.486


N 3570

P(Z"S) = 1478 =0.414}


P(ZIS) = P(Z "S) donde 3570 =>
P(S) { P(S) = 1835 =0.514
1,0 3570
:er-
=> P(ZIS) = 0.414 = 0.805
0.5 14

di-
Como se ha visto, si los sucesos son dependientes la aparición de uno
de ellos depende de la aparición del aIro en cuyo caso la probabilidad de
que se presenten simultáneamente los sucesos A y B, P (A n B), se obtie-
ne despejando el numerador de la expresión de probabilidad condicio-
nada que se expuso anterio¡'mente y nuevamente reproducimos:
P(A"B) .
P(AI S) = P(B) siempre que P(S) *O
Ydespejando el numerador obtenemos que la probabilidad de aparición
simuhánea de dos sucesos dependientes es:

P(A "S) = P(B)· P(AIS)

y como la intersección de sucesos cumple la propiedad conmutativa tam-


bién podemos escribir:
P (A " B) = P (B "A) = P (S) . P (AIB)
que se lee Olla probabilidad de ocurrencia simultánea de dos sucesos
dependientes es igual a la probabilidad del primero multiplicada por
la probabilidad del segundo condicionada a que el primero haya ocu·
rrido_. Esta propiedad se puede generalizar a n sucesos dependientes de
acuerdo con la siguiente expresión:
P(A"S"Cr. Y"Z)=
= P (A) . P (SIA) . P (CIA "B) P (l/A" B "C " ... Y)
j
400 ANÁLISIS DE DATOS EN PSICOLOGíA 1 TEO¡¡

y diremos que «la probabilidad de n sucesos dependientes es igual a


la probabilidad del primero multiplicada por la probabilidad del
segundo condicionada a que se haya presentado el primero, multi.
plicada por la probabilidad del tercero condicionada a que se hayan
presentado los dos primeros, multiplicada por la probabilidad del
cuarto condicionada a que se hayan presentado los tres primeros,
etc., hasta la probabilidad del último condicionada a que se hayan pel
presentado los 0·1 anteriores». SOl
6y

Ejemplo 14.2. Supóngase que en un determinado periodo de


tiempo un 5% de la JXlblación padece una determinada enfermedad
y que de estos enfermos un 65% se recuperan totalmente. Elegida en
una persona al azar ¿cuál es la probabilidad de que padezca esta
enfermedad y se recupere?
Llamando E a la enfermedad y R a recuperarse sabemos que
p (E) = 0,05 Yp (RiE) = 0.65. Tenemos que calcular la probabilidad
de E y R que son dos sucesos dependientes, por tanto: las
P (E "R) = P (E) . P (RlE) = 0,05 . 0.65 = 0.0325 rep

Ejemplo 14.3. Cierto profesor tiene por costumbre guardar todos


los calcetines (limpios) en un cajón y cada mañana elige consecuti- 001
vamente al azar tres de ellos. Sólo tiene tres colores de calcetines: GG
Grises (G), Azules (A) y Blancos (B). Si en las tres primeras y conse-
cutivas extracciones son de diferente color. decide no ponérselos y se
calza unas sandalias. Una mañana cualquiera tiene en el cajón 8 cal-
cetines grises, 4 azules y 6 blancos:
a) ¿Cuál es la probabilidad de que esa manana salga a la calle con per
sandalias? ~~ POI
es
b) ¿Es igual la probabilidad de que saque dos calcetine{~ses a
;; la probabilidad de que saque dos grises y uno blanco?
a) Para que salga a la calle con sandalias los calcetines elegidos
tienen que ser uno de cada color. Puesto que los calcetines los extrae
uno tTas otro y sin reposición se trata de sucesos dependientes. Si el y
orden de extracción fuese GAB. su probabilidad es: p
EOREMAS DE PROBABILIDAD 4(
402 ANÁLISIS DE DATOS EN PSICOLOGÍA 1 TEORl

Ejemplo 14.4. Para aprobar una asignatura es necesario aprobar


cada una de las dos partes de que cuenta, de tal forma que un alum-
no que suspenda la primera parte ya no puede presentarse a la segun- En
da y. por tanto, suspende la asignatura. Por la experiencia de años se pro
anteriores se sabe que la probabilidad de que un alumno que ha apro-
bado la primera parte. apruebe la segunda es 0.9 y que el examen de
la primera parte es aprobado por el 70% de los alumnos. pero (
queda
a) Si elegimos aleatoriamente un alumno ¿cuál es la probabili-
dad de que suspenda la asignatura?
b) Si el curso está formado por 1000 alumnos ¿cuántos alumnos
suspenderán la asignatura más probablemente teniendo apro- Es'
bada la primera parte?
Si Uamamos A 2 a aprobar la segunda parte, Al aprobar la prime-
Que in
ra parte y S a suspender, conocemos las siguientes probabilidades a
al pro
partir del enunciado del problema:
P (A,IA,) = 0,9 Y P (A,) = 0,7
El suceso suspender, $, es el complementario de aprobar, A, y su
probabilidad es igual a uno menos la probabilidad de aprobar que
vale: el
co
P(A)=P(A,nA,) qu
P (A) = P (A,). P (A,IA,) = 0,7·0,9.0,63 Y
P (S) = 1 - P (A) = 1 - 0,63 = 0,37
las
Para la segunda pregunta deducimos que, si: di
P (Al/Al) = 0.9 entonces P (S2IA¡) = 0, I
Como aprueban el 70% de los 1000 alumnos que son 700, sus~
penderán 700 x 0,1 = 70 alumnos.

1.J.:!.:!. 1'<lnI ~Il('('~(l~ ind('lu'IHli('lltt':-i

Dos sucesos A y B son independientes cuando la probabilidad de


que se produzca uno de ellos no depende de la aparición del otro.
En consecuencia:
P (AIS) = P (A)
,OLOGíA I TEOREMAS DE PROBABILIDAD 403

o
~robar P (BIA) • P (B)
Wum-
¡egun- En relación con el apartado anterior, vimos que la probabilidad de que
¡años se produzcan simultáneamente los sucesos dependientes A y Bes:
rapro-- P (A r> B) • P (A) . P (BIA)
ende
pero como ahora los sucesos A y B son independientes, P (BIA) = P (B).
r quedará:
..bili-
P (A r>E). P (A)· P(B)

¡:: Esta definición se puede generalizar para n sucesos independientes:

h me-
Idesa
P(Ar>Br>Cr> ... K)·f (A) .'(E) ./I(C) ... P(K)
que indica que la probabilidad de los sucesos independientes es igual
al producto de sus probabilidades.

,ysu
que Ejemplo 14.5. Un examen tipo test consta de tres preguntas todas
ellas con cuatro alternativas de respuesta de las que sólo una es la
correcta. Si un alumno responde al azar cuál es la probabilidad de
que acierte las tres preguntas?
Como acertar una pregunta no depende de que acertemos o no
las otras. aplicamos el teorema del producto para sucesos indepen-
dientes y nos queda que:

j 1 1
peA r>Br>C). P(A)· P(B)· P(C) = _._. - = 0.0156
, sus- 444

También se puede resolver aplicando la definición clásica de la


probabilidad. Los casos favorables son uno, que es la solución correc-
ta de acertar las tres preguntas del examen, y los casos posibles son
las distintas ordenaciones que se pueden realizar con las cuatro alter-
nativas de respuesta tomadas de tres en tres (las tres preguntas del
examen), éstas son las variaciones con repetición de 4 elementos
tomados de tres en tres:
"dad de
lelotro.
• p(acertar) =--=,. =
1
VR 4 •3
1
4
0.0156
404 ANÁLISIS DE DATOS EN PSICOLOGíA 1 TEOREMAS DE

Ejemplo 14.6. En un experimento de perce¡:x:ión auditiva se pre- y la probat


senta aleatoriamente uno de los dos estimulos utilizados A y B. El dente será.
estimulo A se corresponde con un tono de SO dB Yel B con un rono
de 90 dB. Si ambos estímulos son equiprobables y en cada sesión
experimental se presentan 5 estímulos aleatoriamente:
a) ¿Cuál es la probabilidad de que en las cinco ocasiones se pre- Ejemp
sente el estímulo A? enfermos:
Realizam
b) ¿Cuál es la probabilidad de que el eslÚTlulo B se presente una
cula la pro
sola vez?
e) ¿Cuál es la probabilidad de que los estimulas se presenten en a) los b
un orden ascendente en cuanto a la intensidad del tono? b) las e:
a) Por tratarse de sucesos inclependiemes, tenemos que:
a) Que
P (A "A "A "A "A) : P (A) . P (A) . P (A) . P (A) . P (A) : los tres sea
: 0,5·0,5·0,5·0,5·0,5: 0,03125 zofrénicos
b) La probabilidad de que se presente una sola vez el estúnulo B cular la Pf(
suponiendo que fuese el primero en presentarse (BAAAA) es:
P(N"
P (B "A "A "A "A): P (B)· P (A)· P (A)· P (A)· P (A): 0,03125
pero como puede presentarse en otros órdenes diferentes:
(ABAAA)
(MBAA)
(AMBA)
(AAAAB) b) Qu
que una
que se corresponde con las permutaciones con repetición de cinco ejemplo:
elementos de los cuales cuatro están repetidos, la probabilidad bus-
cada es:
5'
-'-. P(B" A" A n A n A) = 5· P(B)· P(A)· P(A)· P(A)· peA) = 0.15625
4!·1!

c) Tenemos que calcular la probabilidad de que se presente pri- pero estos


mero el estfmulo A, que es el menos intenso, una, dos tres y cuatro queco
veces, es decir: secuencia
P (A "B "B "B "B) : 0,03125
peA "A "B" B "B): 0,03125
P (A "A "A "B "B): 0,03125
P (A "A" A" A "B) : 0,03125
lAr TEOREMAS DE PROBABILIDAD 405

y la probabilidad de que los estímulos se presenten en orden ascen-


dente será, por tanto, 4 x 0.03125 = 0.125.

Ejemplo 14.7. En una saJa de un hospital psiquiátrico hay diez


enfermos: tres neuróticos, cinco psicóticos y dos esqulzofrénicos.
Realizamos al azar una extracción sucesiva de tres enfermos. Cal-
cula la probabilidad de que:
a) los tres enfermos sufran la misma enfermedad.
b) las enfermedades de los tres enfermos no coincidan.

a) Que los tres enfermos tengan la misma enfermedad, es, que


los tres sean neuróticos o psicóticos. No pueden ser los tres esqui-
zofrénicos porqu"e solamente hay dos. Por lo que tenemos que cal-
cular la probabilidad:
P(N r,N r,N)vP(Pr,pr,p) = P(N)· P(NI N)· P(N I N r,N) +
+P(p)· P(pl p). P(pl P r, p) =
32154366066
= - ~·-+-·~·_=-+-=-=O.0917
10 9 8 10 9 8 720 720 720

b) Que las enfermedades de los tres pacientes no coincidan, es,


que una sea neurótico, otro psicótico y el tercero esquizofrénico. Por
ejemplo:

P(N r,pn E) = P(N)· P(pl N)· P(EI N r, p) =


3 5 2 30
_·_·-=-=0.0417
1098720
pero estos tres enfermos se pueden presentar en distintos órdenes
que corresponden a las permutaciones de tres elementos y en con-
secuencia la probabilidad pedida es:

NpE - pNE - pEN - NEp - ENp - EpN


30
3!·P(N r, P r, El = 6· 720 = 0,25
406 ANÁLISIS DE DATOS EN PSICOLOGÍA r TEORI

1·1.:1. TLOItE\1 \ DE 1.\ Sl \1 \


El teorema de la suma se aplica en aquellas situaciones que requieren
responder preguntas genéricas como la siguiente: ¿Cuál es la probabili-
dad de que aparezca un suceso o el otro? En este tipo de preguntas la lerra
o hay que interpretarla como lo que es, es decir, una preposición disyun- este n
tiva que implica alternativa entre dos o¡x:iones y se traduce como la unión mutuo
de sucesos que calcularemos aplicando el teorema de la suma.
A. B}
Pero para ello. y antes de enunciarlo, hay que profundizar en la dis- mos~
tinción entre los conceptos, ya introducidos en el tema 12, de lo que se
entiende por sucesos excluyentes o incompatibles y los sucesos simwtá-
neos. Como ya se presentó, los sucesos excluyentes o incompatibles
son los que no pueden ocurrir simultáneamente. Por ejemplo, en el Es
lanzamiento de una moneda el suceso cara y Cruz no se pueden dar a la en la i
vez y la aparición de uno de ellos excluye la aparición del otro. Lo mismo ¿e
ocurre con los sucesos ser hombre y mujer: Por esta raron, el suceso inter- ciado
sección que, como hemos visto anteriormente, se refiere a la aparición de cerof
un suceso y el otro es un suceso imposible y su probabilidad es cero (v.gr.
y esta
«ser hombre y mujer_; obtener «cara y cruz» en un lanzamiento; «perte- a Vale
necer al centro de Valdepeñas y al de Vizcaya», etc.).
Por su parte. los sucesos simultáneos pueden aparecer a la vez. Por
ejemplo, en el lanzamiento de un dado, el suceso A = {3} y el suceso I·U.
B = {número impar] pueden darse simultáneamente, de igual forma que
Si
los sucesos «ser mujer_ y «estudiar psicología». Con esta distinción, el
A = «!
teorema de la suma distingue que los sucesos sean simultáneos o exclu-
mujel
yentes.
tamo)
de ap
bifida
)·LJ. J. Para ... IJl·I'~O.'" mUIU<lJUI'J)'I' t',dU\l'JJ'I',..
ció":
Si los sucesos son excluyentes es imposible que OCUlTan simultánea-
mente por lo que se cumple la condición de que su intersección es vacía:
A n B = 0 Y pOI" tanto la probabilidad de aparición del suceso A o B (la
unión) es igual a la suma de sus probabilidades, Lal como se indica a con-
tinuación:
E

ya qu
dame
:OLOGÍA I TEOREMAS DE PROBABILIDAD 407
~

P (A v 8) = P (A) + P (8)

:quieren
ya que:
'Obabili~
; la letra AnB=o y por tanto P(AnB)=O
disyun-
este resultado se puede generalizar a cualquier número finito de sucesos
a unión
mutuamente excluyentes. Por ejemplo y para el caso de tres sucesos: sean
A, B Y e sucesos mutuamente excluyentes (intersección vacía) y Uama~
1 [a dis- mas S a [a unión de A con B (A v B = S) entonces:
'que se
imultá-
P(A vB vC) = P (5 vC) = P(5) + P(C) = P(A v8) + P(C) =
= P (A) + P (B) + P (C)
atibJes
), en el Este teorema nos dada respuesta a una de las preguntas planteadas
lar a la en la intmducción:
mismo
¿Cufil es la probabilidad de que un alumno pertenezca al Centro Aso-
) inter-
ciado de Valdepeñas o de Vizcaya? Ya que un alumno no puede pel1ene-
:ión de
cer oficialmente a dos o más Centros, los dos sucesos son incompatibles
'o (v.gr.
y esta probabilidad se calcularía sumando la probabilidad de pel1enecer
(perte-
a Val depenas más la probabilidad de pertenecer a Vizcaya.

~z. Por
;uceso
13. que
Si los sucesos SOIl compatibles o simultáneos, como por ejemplo
ión, el
exclu-
A = «se." mujer»; B = «estudiar psicología», entonces la intersección («ser
mujer y estudiar psicología») no es el conjunto vacío (A n B *'- 0) y, por
'*
tanto, su probabHidad es distinta de cem: P (A n B) O y la probabilidad
de aparición det suceso unión de A con B. P (A u B), es igual a la proba-
bilidad de A más la probabilidad de B menos la probabilidad de la intersec-
ciól/:
ánea- E
,acía:
B (la
. con-

I P (A v 8) = P (A) + P (8) - P (A n B)

ya que al sumar A y E, la intersección se ha sumado dos veces, Con esto


damos respuesta a (a pregunta: ¿Cuál es (a probabilidad de estudiar psi-
408 ANÁLISIS DE DATOS EN PSICOLOGlA 1 TI

cología O ser mujer? Puesto que Jos dos sucesos son compatibles tendrí-
amos que sumar la probabilidad de ser mujer más la probabiHdad de estu-
diar psicología y restar la probabilidad de apal;ción simultánea de los dos
sucesos (ser mujer y estudiar psicología).
Nuevamente. este resultado se puede generalizar al caso de más suce-
sos. Para el caso de Lres sucesos A, B Y e que son compatibles, llamemos
S a la unión de A y B. es decir: S = A u 8 enlonces:
P (A v B v C) = P (S v C) = P (S) + P (C) - P (S n C) =

como: S = A u B nos queda:


1
= P (A v B) + P (C) - P [(A v B) n C] = P (A) + P (B) - P (A n B) +
+ P (C) - P [(A v B) n C) =
el
donde (A v B) (') e indica que el suceso e se produce simultáneamente pi
con A 6 B y, por la propiedad distributiva referida a las operaciones con
sucesos, es ¡tiual a: (A n e) v (8 I l e). Por lo que la probabilidad de la
intersección de estos dos sucesos S y e es:
;, P(S «= C) P[(A vE)n C] =P [(A nC) v (B n C)] =
= P(A nC) + P(BnC)-P(A nBnC)

que indu)'éndola en la expresión anterior llegamos a la solución final:


P (A v B v C) = P (A) + P (B) + P (C) - P (A n B) - P (A n C)-
E
-P(B nC) + P(A nBnC)

La generalización de esta propiedad para K sucesos simuJtáneos reba-


sa los objetivos de este curso y. por tanto. la omitimos.

Ejemplo 14.8. A los 70 años la probabilidad de ser miope es 0.3.


la de tener cataratas es 0.15 y la de ser miope y tener cataratas es 0.1
¿Cuál es la pl"Obabilidad de ser miope ~ tener cataratas a esa edad?

la
A
h

ii
Al TEOREMAS DE PROBABILIDAD 409

rí-
u- Como los sucesos: ser miope, M, y tener cataratas, e, son com~
DS patibtes, es decir. se pueden dar simultáneamente con una probabi-
lidad de 0.1. la probabilidad pedida. aplicando el teorema de la suma
e- es:
]S P(M U C) ~ P(M) + P(C)- P(M "C) ~0.3 + 0.\5-0,\ ~ 0.35

14.4. TEOREMA DE LA PROBABILIDAD TOTAL


Sea B I , B 2, •.. , Bk una partición del espacio muestral E, es decir, un
conjunto de sucesos que cumplen simultáneamente las siguientes
e propiedades:
n
• La unión de todos ellos es igual al espacio muestraI E
a
K
uB·=E
;_1 I

• La intersección de dos conjuntos cualesquiera de ellos es vacía.


B¡{\Bj =0 paratodoi-¡.j

E E

B, B,
B, B,

B, A B,
B, B,
B,

Sobre el espacio muestra! E definimos un suceso, A, y el teorema de


la probabilidad total nos permite calcular la probabilidad de este suceso
A, a partir de las «probabilidades a priori», P(B;), y de las «verosimili-
tudes», P(A/Bi). Veámoslo:
Teniendo en cuenta que la unión de las distintas zonas coLoreadas es
igual al suceso A:
410 ANÁLISIS DE DATOS EN PSICOLOGlA 1 TEOREM.

Ot
babili

es decir, la unión de cada una de las intersecciones de B; con A es igual al


suceso A, podemos escribir la siguiente expresión general:

A = (B, nA) u (B, nA) u ... u (B, nA)

y calcular su probabilidad aplicando el teorema de la suma ya visto:

P (A) = P (B, nA) + P (B, nA) + ... + P (B, n A)

aplicando ahora el teorema del producto y teniendo en cuenta que los


sucesos A y B¡ son dependientes, llegamos a:

P (A) = P (B,)· P (AlB,) + P (B,)· (AIB,) + ... + P (B,) . P (AlB,)


Ap
, P(A)-
peA) = ¿P(B;). P(A/ B;)
;=1
que
que h
tados
Ejemplo 14.9. La Jefatura de Tráfico ha estimado que la proba-
bilidad de infracción por «adelantamiento en cambio de rasante» es
0.20; por .no respetar la señal de stop» es de 0.30 y por .el resto de
las infracciones» es de 0.50. Se sabe, además. que la probabilidad de 14.5. '1'
«accidente por adelantamiento en cambio de rasante» es de 0.90; la
probabilidad de «accidente por no respetar stop» es de 0.80 y la pro+
Enl~
babilidad de «accidente por otras infracciones» es de 0.30. Calcular
la probabilidad de accidente. pleLO de:
que se c(
Tenemos que calcular la probabilidad de tener un accidente, peA), mamos ~
por cometer estas infracciones y conocemos las probabilidades a prio- partir de
ri y las «verosimilitudesJ'l de tener un accidente por cada una de estas
causas que son:
P (er) = 0,2 P (A/ec) = 0,90
P (stop) =0,3 P (Alstop) =0,80
P (resto) = 0,5 P (Alres'o) = 0,30 y como ]<
ducto al
JGfA I TEOREMAS DE PROBABILIDAD 411

Otra presentación alternativa y quizás más intuitiva de estas pro-


babilidades es el diagrama de árbol. En este caso sería:

0,90

la! a! 0,10

0,80

0.20

0.30

e los
0,70

Aplicando el teorema de la probabilidad total:


P (A) =P (cc) . P (Afcr) + P (stop) . P (A/stop) + P (resto) . P (Alresto) =
= 0,2 ·0,9 + 0,3 . 0,8 + 0,5 . 0,3 = 0,57

que es la probabilidad total de tener un accidente por estas causas,


que hemos obtenido sumando las probabilidades de los trazos pin-
...
es
tados en grueso.

a.
a. 14.,';. TEORE~lA DE RAVES

En las mismas condiciones anteriores. es decir; sea B¡ un sistema com-


pleto de sucesos, tales que P(B) > 0, y sea A un suceso cualquiera para el
que se conocen las probabilidades condicionadas P(AIB;) a las que lla-
), mamos «verosimilitudes» (zonas sombreadas de la figura). entonces, a
partir de la expresión general de los sucesos dependientes:

P(B lA): P(B, nA)


, peA)

y como los sucesos BI< y A son dependientes, aplicamos el teorema del pro-
ducto al numerador:
412 ANÁLISIS DE DATOS EN PSICOLOClA 1 TEOREMAS

P(B lA) = P(B,)· P(AI B,)


, P(A) Apa
las _ven
dode el denominador representa la probabilidad total del suceso A vista
en el punto anterior:

P(B,IA)= ;(B,).P(AIB,)
¿P(B¡).P(AIB,)
ial

donde: P(Bk) son las probabilidades a priori conocidas.


P(B/A) son las probabilidades a posteriori a calcular. quepod
P(AlBk ) son las verosimilitudes conocidas. masqu
El teorema recibe también el nombre de Teorema de la probabili-
dad de las causas porque si designamos a B k corno causas, podemos
determinar la probabilidad de que el suceso A. consecuencia, aparezca
bajo cada una de las causas B¡.. El siguiente ejemplo puede ilustrar lo que
decimos y la aplicación del Teorema de Bayes como ayuda en el diag-
nóstico clínico.

Ejemplo 14.10. En la saja de un Hospital hay tres enfermos con


la enfermedad B l ; dos enfermos con la enfermedad 8 2 y cinco enfer-
mos con la enfennedad B J • Sabernos que la probabilidad de curación
completa (C) de la enfermedad B I es 113, de la enfermedad ~ es 2/3
y de la enfermedad B J es 117.
a) ¿Cuál es la probabilidad total de curarse?
a) Al
b) Un enfermo que estaba internado en el hospital fue dado de prObabj
alta completamente sano, ¿Cuál es la probabilidad de que
sufriese la enfermedad B J ? P(¡

queco
trazo
b)
estaba
JGiA 1 TEOREMAS DE PROBABILIDAD 413

A partir del enunciado, conocemos las probabilidades a priori y


las «verosimilitudes... que son las siguientes:
vista
P(S¡) = 0.3=> P(CI S¡) = ~

P(B,) =0.2 => P(CI B,) ="2


P(B,) =0.5 => P(C lB,) ="71
que podemos representar gráficamente de cualquiera de las dos for·
mas que se muestran debajo de estas líneas.
>ni·
nos
zca
que
ag-

a) Aplicando el teorema de la probabilidad total calculamos la


probabilidad de curarse que es:

P(C) = P(S¡)· P(C I S¡) + P(B,)· P(C lB,) + P(B,)· P(C lB,) =

=0.3· -1 + 0.2· -2 + 0.5· -1 =0.305


337

que corresponde a la suma de las probabilidades representadas con


trazo grueso en el diagrama de árbol.
b) La probabilidad de que padeciese la enfermedad BJ dado que
i esta~a sano requiere la aplicación del teorema de Bayes:
414 ANÁLISIS DE DATOS EN PSICOLOGíA I TEOREMAS

P(B IC) = P(B,)· P(C lB,) En c;


, P(B¡)· P(CI B¡) + P(B¡)· P(CI B¡) + P(B,)· P(C lB,) salidas J
salidas
D.S. 1 5V con«
= __ 7 =D.234
0.305 da ByO
descalJ!'
Sienc;
carga,a
Ejemplo 14.11. La Jefatura de Tráfico ha estimado que la pro-
babilidad de infracción por «adelantamiento en cambio de rasante".
P(cr), es 0.20; _no respetar la señal de stop", P(stop), es de 0.30 y por
«el resto de las infracciones_, P(r), es de 0.50. Se sabe además que la
probabilidad de _accidente por adelantamiento en cambio de rasan-
te. es de 0.90; la probabilidad de ..accidente por no respetar stop. es
de 0.80 y la probabilidad de «accidente por otras infracciones_ es de
0.30. Ha ocurrido un accidente, calcular la probabilidad de que haya
sido debido a un adelantamiento en cambio de rasante.
Tenemos que calcular P(cr/A} para 10 cual aplicamos el teorema Por e
de Bayes, teniendo en cuenta que en el ejemplo 14.9 ya hemos cal- B dado.
culado la probabilidad total de tener un accidente por estas causas.
Por tanto: P(
P(crl A) = P(cr)· P(AI cr) = 0.2·0.9 =0.315
P(A) 0.57

Ejemplo 14.12. En un experimento de condicionamiento animal


se sitúa a una rata en el centro de un laberinto como el de la figura.
Activida
tarea que
rica del u

I-I.h. IIU
En los U
nido los COI
\l TEOREMAS DE PROBABILIDAD 415

En cada UDa de los ensayos la rata elige siempre una de las tres
salidas A,B o e con igual probabilidad. El suelo de cada una de estas
salidas tiene una rejilla eléctrica que dispensa una descarga, D, de
SV con distintas probabilidades: l para la salida A; ..!.. para la s31i-
4 4
da B y O para la C. En un detenninado ensayo la rata no recibió la
descarga ¿Cuál es la probabilidad de que haya elegido la salida B?
Siendo O la descarga y D su complementario, la ausencia de des-
carga, a partir del enunciado disponemos de Jos siguientes datos:

P(A) = P(B) = P(C) = 1


¡
P(DI A) = --> P(D I A) = ±
1 - 3
P(DI B)=- --> P(DI B) =-
4 4
P(DIC) = O --> P(D/C) = 1

Por el teorema de Bayes. la probabilidad de que haya salido por


B dado que recibió la descarga es:

P(BID)= _ P(B).P(~IB) =
prAl· P(D lA) + P(B)· P(D I B) + P(C)· P(D IC)
I 3
= 3 4 =0.375
1 1 I 3 1
---+---+--1
3 4 3 4 3

Actividad: En el ejemplo 14.12 no se ha utilizado el diagrama de árbol,


tarea que encomendamos al lector para comprobar su asimilación teó-
Iica del teorema de Bayes.

1~.6. HESUMEl\
En los temas anteriores, de introducción a la probabilidad, se han defi-
nido los conceptos básicos de la probabilidad, íntimamente relacionados
416 ANÁLISIS DE DATOS EN PSICOLOClA I TE

con la teoría de conjuntos que no hemos descrito. Posterionnente se han


proporcionado las tres definiciones de probabilidad. de las cuales en la
práctica se aplica la definición clásica. que la define como el cociente entre
casos favorables y casos posibles de aparición de un suceso. Pero esta defi·
nición no excluye las otras dos y de hecho este cociente entre los casos
favorables y los posibles no es más que una frecuencia relativa de apari·
ción de un suceso que se va aproxímando a un vaJor constante a medida
que el número de ensayos aumenta (definición estadística), Asimismo, la
probabilidad de cualquier suceso, que se cuantifica con un número com-
prendido entre Oy 1, tiene que cumplir los axiomas de la definición for-
mal o axiomática de la probabilidad que hemos expuesto.
PosteriOlmente, se requiere saber el número de casos favorables y de
casos posibles de aparición de un suceso y recurrimos a la combinatoria.
En este tema hemos introducido los teoremas más importantes de la pro-
babilidad de sucesos que exigen distinguir, previamente, entre lo que son
sucesos mutuamente excluyentes y simultáneos, por un lado, y entre los
sucesos dependientes y los independientes, por otro lado. Finalizamos
con el teorema de Bayes cuya formulación incluye la probabilidad total
de aparición de un suceso que se produce bajo una serie de condiciones.

1-1.7. E.lEHC1CIOS
Una urna consta de 4 bolas blancas, 2 negras y 3 rojas. Extraemos
una a una, y con reposición, 2 bolas. La probabilidad de que las 2
bolas sean rojas es:
a) 1/27
b) 1/9
e) 6/81
Continuando con el ejercicio anterior, la probabilidad de que nin-
guna sea negra está comprendida enll-e:
a) 0.2 y OA
b) 0.7 Y0,9
e) 0.5 y 0,7
En un colectivo profesional formado a partes iguales por ambos
sexos, el estrés afecta a un 35% de los hombres y a una de cada cua-
Iro mujeres. Elegida al a7..ar una persona, la probabilidad de que ten-
ga estrés es:
a) 0.25
OLOGIA I TEOREMAS DE PROBABILIDAD 417
.e se han b) 0,3
les en la e) 0,4
lte entre
:sla defi- Continuando con el ejercicio 3, la probabilidad de que no padeciendo
os casos estrés sea mujer está comprendida entre:
le apari- a) 0,4 y 0,6
medida b) 0,1 Y0,3
usmo,la e) 0,7 y 0,9
:ro como
:ión for- Un psicólogo sabe que un 25% de los alumnos de EGB tiene pro-
blemas de rendimiento escolar, en tanto que el 75% restante tiene.
durante esta etapa, problemas de adaptación social. También sabe
)Ies y de que este tipo de problemas se reduce cuando los alumnos comien-
matoria. zan los estudios de SUP, de tal rOlma que si el problema es de ren·
e la pro- dimiento la probabilidad de que desaparezca es 0,2 en tanto que si
que son el problema es de adaptación social la probabilidad de que desapa·
:ntre los rezca es de 0,8. Esto supuesto, el psicólogo elige aleatoriamente un
lizamos alumno de un grupo de BUP y comprueba que no presenta ningún
Iad total tipo de problema. La probabilidad de que durante su etapa de EGB
Uciones. haya padecido aJgún problema de adaptación social está compren-
dida entre:
a) 0,15 Y0,35
b) 0,45 Y0,65
traemos e) 0,75 y 0,95
[Ue las 2 Con los mismos datos del ejel'cicio anteriOl~ la probabilidad de que
haya padecido algún problema de rendimiento escolar está com-
prendida entre:
a) 0,02 y 0,05
b) 0,05 Y0,09
e) 0,09 y 0,3
lue nin-
Sabemos que el 85% de los enfermos depresivos se recupera con un
determinado tratamiento psicológico. De estos sujetos que se recu-
peran, e125% ha sido tratado médicamente con antedol·idad. De los
que no se récuperan, el 25% ha sido tratado médicamente con
antel;OI;dad. La probabilidad de que una persona depresiva que haya
"ambos sido tratada médicamente con anterioridad se recupere con el tra·
ida cua- tamiento psicológico está comprendida entre:
que ten-
a) 0,2 y 0,4
b) 0,4 y 0,6
e) 0,6 y 0,7
418 ANÁLISIS DE DATOS EN PSICOLOGíA 1 TEO

Los alumnos de los últimos cursos de Psicología cursan una espe-


cialidad detclminada. El 60% de los alumnos escogen la especiali-
dad de clínica. e1300.!cl la de escolar y el resto la especialidad de indus-
trial. Teniendo en cuenta que ellO, el 25 y el 5% de los alumnos de
las especialidades clínica. escolar e industrial, respectivamente, pro-
ceden del curso de adaptación y el resto lo hacen por el sistema habi-
11
lual de acceso, si elegimos aleatoriamente un alumno de dicha facul-
tad ¿cuál es la probabilidad de que proceda del curso de adaptación?
a) 0,24
b) 0,14
e) 0,34
Con los datos del ejemplo anterior ¿cuál es la probabilidad de que
haya iniciado sus estudios por el sistema naonal y curse la especia-
lidad de clínica?
a
a) 0,54
b) 0,35
e) 0,28
Con los mismos datos del ejercicio 8. y supuesto que el alumno pro-
cede del curso de adaptación, la probabilidad de que curse psicolo-
gía escolar está comprendida entre:
a) 0,7 Y 0,8
b) 0,2 Y 0,3
e) 0,5 y 0,6

1·1.11, ~Oll (I()\I~ \ IO~ 1..11 !I(I(lOS

11 Al ser con reposición los sucesos son independienLes. Por tanto,


P(2 bolas cojas) = P(RI)· P(R2IRI) = P(Rl)· P(R2) = (3/9)· (3/9) =
= 9/81 = 1/9
la respuesta es b.
11 Llamando R a bola roja, 8 a bola blanca y N a no ser bola negra:
tenemos que calcular:
- - - - 7 7 49
P(N nN) = P(N)· P(N) = _. - ~ - ~ 0,6049
9 9 81
la respuesta es c.
1
5ICOLOGlA I TEOREMAS DE PROBABILIDAD 419

luna espe- (NOla: También podemos calcular la probabilidad de que las dos
1 especiali- sean blancas, las dos rojas. una roja y otra blanca que es equivalen-
d de indus-- l te a ninguna bola negra).
Jumnos de
nente, pro-
,tema habi-
11 Tenemos
Llamamos cE. a padecer estrés, .. H. ser hombre y .. M. ser mujel:
los siguientes datos:
licha facul- 1 P(H) = P(M) = 0.5 P(EIH) = 0.35 Y P(E/M) = 0.25
daptación?
P (E) = P (E n H) + P (E n M) =
=P (H) . P (E/H) + P (M) - P (E/M) =
\ = 0,5·0,35 + 0,5·0,25 = 0,175 + 0,125 = 0,3

la respuesta es b.
iad de que
la especia- D Llamamos E a no padecer estrés. Debemos calcular:
P (M/E)
y sabemos que:
..
1 P(M / E) = P(M n E) = P(M) - PiE / M)
umno pro- PiE) PiE)
se psicolo-
donde:
-.
I P (E/M) = 1 - P (E/M) = 1 - 0.25 = 0,75
P (E) = I - P (E) = J - 0.3 = 0.7 (P (E) ya fue calculado en el eje,-·
cicio anteriOl:)
Por tanto:
(
P(M/E) = 0.5-0.75 =0 536
0.7 •
r tanto,

1) - (3/9) = 1 la respuesta es a.
11 Llamando:
«RE .. al suceso «presentar problemas de rendimiento escolar»
a negra: cAS .. al suceso .. presentar problemas de adaptación social-
.. D. al suceso .. desaparición de cualquier tipo de problema.
las probabilidades que conocemos son:
P(RE) = 0.25 P(DIRE) = 0.2 peAS) = 0.75 v P(D/AS) = 0.8
Aplicando el teorema de Bayes:

1
420 ANÁLISIS DE DATOS EN PSICOLOGíA T TE

P(AS)-P(DIAS) = 0,75-0,8 =0,9231


P(ASI D)
P(D) 0,25-0,2+0,75-0,8

la respuesta es c.

11 P(REID) = P(RE)-P(DIRE)
P(D)
0,25 -0,2
0,25 -0,2 + 0,75 -0,8
= 0,0769

o también:
P (REID) ~ 1 - P (ASID) = 1 - 0,9231 = 0,0769
la respuesla es b.
11 Llamando:
.. R. al suceso «recuperarse con tratamiento psicológico-
cR .. al suceso _no recuperarse con tratamiento psicológico»
.A.. al suceso «ser tratado medicamente con anterioridad.
Sabemos que:
P (R) = 0,85 o=> P (R) = 1 - P (R) = 1 - 0,85 = 0,15
P (A1R) = 0,10 P (AlR) = 0,25

Por tanto:

P(R I A) = P(R) -P(AI R) = P(R) P(Ar..R ) =


peA) P(R) -P(AI R) + P(R) -P(AI R)

= 0,85 -0,10
0,85 0,10+0,15-0,25
= 0,085
0,1225
= °
'
6939

la respuesta es c.
11 Utilizando la siguiente nomenclatura:
e = Clínica; E = Escolar; 1 = Industrial; A ::: Adaptación; N =Norrnal
P (A) = P (A ro C) + P (A ro E) + P (A n 1) =
= P (C) - P (AIC) + P (E) - P (AlE) + P (1) - P (AII) =
= 0,6 - 0,10 + 0,3 - 0,25 + 0,1 - 0,05 = 0,14

la respuesta es b.
11 Utilizando la misma terminología que en el ejercicio anterior:
P (N ro C) = P (C) - P (NIC) = 0,6 - 0,9 = 0,54
la respuesta es a.
TEOREMAS DE PROBABILIDAD 421

l1li Siguiendo
res:
con la misma tenninología de los dos ejercicios anterio-

prAl 0,14'
°
P(EI Al = P(E)· P(AI El = 0,3·0,25 = 536

Nota: P (A) ya ha sido calculada en el ejercicio 8.


la respuesta es c.
Tema 15
Distribuciones de probabilidad
de variables aleatorias

(
SUMARIO
1.;.1. I
15.1. Introducción Yasa~
15.2. Variable aleatoria: definición denomina
no se real
15.3. TIpos de variables aleatorias muestral.l
15.3.1. Variables aleatorias discretas ciendo tOO
15.3.2. Variables aleatorias continuas diente pro!
15.4. Función de probabilidad Veremc
15.4.1. Representación gráfica una, o una
15.4.2. Propiedades naturaJeza
15.5. Función de distribución tos en el tel
15.5.1. Representación gráfica bién comol
15.5.2. Propiedades función de
más proñu
15.6. Resumen creta, gene:
15.7. Ejercicios no haremo:
requiere CCl
15.8. Solución a los ejercicios el objetivo«
ceptos y de
raJizar al·
en cuenta
inforrnativ
mas. Procu
lan en este
referidos
ceptuales»
siguiente t
15.1. 1 THODVCCIÓ:'>'
Ya sabemos que un experimento cuyo resultado depende del azar se
denomina experimento aleatorio o estocástico. Si el experimento aleat().
no se realiza una sola vez se obtendrá un único resultado del espacio
muestral, pero a medida que aumenta el número de ensayos irán apare-
ciendo todos los resultados posibles, cada uno de ellos con su correspon-
diente probabilidad.
Veremos en este tema que para cada experimento podemos definir
una, o unas variables definidas por el experimentador que pueden ser de
naturaleza discreta o continua (de acuerdo a los mismos conceptos vis-
los en el tema 2, referidos a las variables estadísticas). Mostraremos tam-
bién como para esta, o estas variables aleatorias, podernos construir su
función de probabilidad y de distribución. En este tema trabajaremos con
más profundidad estos conceptos referidos a una variable aleatoria dis-
creta, generalizando los mismos a las variables continuas; pero con éstas
no haremos ningún tipo de operaciones matemáticas porque para ello se
requiere conocer y utilizar el cálculo integral que supera, ampliamente.
el objetivo de este curso. Pero ello no es obstáculo para que todos los con-
ceptos y definiciones referidas a las variables discretas se puedan gene-
ralizar a las variables continuas. Esta información es importante tenerla
en cuenta para que cuando vea símbolos de integrales las torne a titulo
informativo con la seguridad de que no tendrá que operar con las mis-
mas. Procure entender bien todos los conceptos teóricos que se presen·
tan en este tema porque en otro trabajaremos los mismos conceptos pero
referidos a dos variables aleatorias discretas y todas las «lagunas con-
ceptuales_ que ahora se generen dificultarán enonnemente el estudio del
siguiente tema.
426 ANÁLISIS DE DATOS EN PSICOLOGíA ¡ DISTR

Los objetivos son:

• Ser capaz de definir correctamente la o las v3J;ables aleatorias de


un experimento aleatorio.
• Para cualquier experimento aleatorio. determinar los valores que
toma una detenninada variable aleatoria previamente definida.
• Obtener la función de probabilidad de una variable aleatoria dis-
creta. Di)
muesl
• Obtener la función de distribución de una variable aleatoria dis- o regl
creta. ciom
• Conocer las propiedades que deben cumplir la función de proba- bies d
bilidad y de distribución de una variable aleatoria discreta y con-
tinua.
• Representar gráficamente la función de probabilidad y de distri- 1.;.:1.
bución de una variable aleatoria.
Al
lar po
letras
1.;.2. \ \111 \BU' \1 1: \1'0111 \: IlU 1\1( 10\ queto

En este momento, sabiendo ya 10 que es un experimento aleatorio, a


En
selecci
los conceptos ya conocidos de espacio muestral y probabilidad estudia-
los val
dos en los temas anteriores, vamos a añadir el de variable aleatoria que
es un conjunto de números diferentes que se asignan de foona espe- lN
cífica a cada uno de los resultados posibles del experimento aleato· cretas
no como consecuencia de aplicar una función o regla de asignación tados.
Lo ilustraremos con un ejemplo: Imaginemos que el director de un Gabi-
nete de Psicología Clínica cuenta con tres mujeres y dos hombres y desea
escoger a dos pel"sonas para un trabajo de selección. Para no introducir ).;.:l.
sesgos en su elección decide escogerlos al azat~ sucesivamente y sin repo-
sición. Si representamos por M= mujer y 1-1= hombre, el espacio muestral
está formado por los siguientes sucesos: CU¡
definic
E" (MM; HM; MH; HH] rabie I
vatia~
Si en este experimento aJeatorio definimos una variable aleatOlü, X, noexü
como el "número de mujeres seleccionadas" en cada uno de los casos la
res únl
variable alcatOl;a X, definida mediante esta regla de asignación, toma los
Pi sien
valores: 2, 1, 1 YOrespectivamente, tal y como se representa en la siguien-
te figura.
DISTRIBUCIONES DE. PROBABILIDAD DE VARIABLES ALEATORIAS 427

E x

Dicho más fonnalmente, dado un experimento aleatorio y un espacio


muestral, E, asociado a él, llamamos variable aleatoria a toda función
o regla que asigna un número real, y solo uno, a cada suceso del espa-
cio muestra!, E, o como se ha dicho, a cada uno de los resultados posi-
bles del experimento aleatorio.

15.:3. TIPOS DE \AHIABLES ALEATORIAS

A partir de este punto a las variables aleatorias las vamos a represen-


tar por letras mayúsculas de nuestro alfabeto latino y utilizaremos las
letras minúsculas, con subíndice, para referirnos a los valores concretos
que toman estan variables aleatorias.
En el ejemplo anterior, la función de asignación .número de mujeres
seleccionadas», origina la variable aleatoria, representada por X, que toma
los valores Xl = O X1 = 1 Y X3 = 2.
Las variables aleatorias, así definidas y representadas, pueden ser dis-
cretas o continuas, tal y como las describiremos en los siguientes apar-
tados.

15.:1.1. Vuriables aleatol"Ías diseretas

Cuando la variable aleatoria, X, es un conjunto de valores numéricos


definidos sobre un conjunto finito o infinito, pero en cualquier caso nume-
rable (susceptibles de ser contados) de casos posibles, decirnos que la
variable aleatoria es discreta. En este caso entre dos valores consecutivos
no existen valores intermedios, porque la variable aleatoria X toma valo-
res únicamente en los puntos XI' X2' •.• , xn • con probabilidades respectivas
Pi siendo nula la probabilidad de que tome cualquier otro valor.
Los siguientes casos:
428 ANÁLISIS DE DATOS EN PSICOLOGtA 1 DISTRIBUC

• Número de asignaturas matriculadas por los alumnos de 10 de Psi- de esta m(


cología. diezmilési

• La edad --contada en años- de estos alumnos.


ACLARJ
• El número de ítems contestados correctamente en un test. Continu~

son ejemplos de variables discretas y los son también la mayoría de pemtita


las situaciones que requieren un conteo. la malen
"
L.ala
;_1
ACLARACiÓN: Un tipo especial de variable discreta es la variable aleato· continu~
ria de BemouüH, que estudiaremos en el tema 19 y que, como Veremos, se gral no I
origina en aquellos experimentos en los que sólo se pueden dar dos valores: dientes s
hombre-mujer, cara-cruz; salud-enfermedad; acieno-Fallo. etc. El espacio ce de est
muestral es binario y los valores numéricos asignados a cada suceso del
espacio muestral suelen ser I y O. Entre las distribuciones de \'ariables dis- Por otra
cretas más importantes están la distribución binomial, binomial negati- modelos
va, multinomial, Poisson, pascal e Hipergeométrica algunas de las cua- cióo 001
les estudiaremos en los temas siguientes. decor y.
el tema I
hipótesis
Demom
1.1.:i.:!. \aria"I.'" all'alllria.. l·ul1til1ua .. aprender
nos evita
Cuando la variable aleatoria, X, loma cualquier valor numérico de un aplicació
ción yva
conjunto infinito -y por tanto no numerable- de casos posibles, decimos
que la variable aleatoria es continua. En este caso, entre dos valores cua-
lesquiera de la valiable, por muy próximos que estén, podemos encontrar
infinitos valores inlermedios. Los siguienres casos: (.,.4. F
• Tiempo que tarda una rata en recon-er un laberinto.
A partil
• El cociente intelectual. tico de las
• La longitud de unos estímulos presentados en expe¡;mentos de per- los temas i
cepción visual. se determi
cias acumt
• El tiempo de reacción ante un estimulo.
La fune
son ejemplos de variables teóricamente continuas que puede presen- de una van
lar valores como 3.7, 3.8, 3.72 o 3.721 segundos y entre dos cualesquiera lieo, lo cu~
de ellos, v.gr. 3.721 y 3.722 seg, existen infinitos valores intennedios como los posible
3.721049. 3.72119. 3.72196 etc. asociadas 1
Sin embargo, en la práctica estas variables se manifiesten como dis- nes, lIamal
cretas debido a las limitaciones del instl1.lmenlo de medida. Por ejemplo, b,bilidad-
al medir el tiempo que tarda la rata en reCOITer el laberinto, la exactitud que asignl
LOGIA I DISTRIBUCIONES DE PROBABILIDAD DE VARIABLES ALEATORIAS 429

de Psi- de esta medida dependerá de que el reloj mida en segundos, milisegundos,


diezmilésimas de segundos o cualquier otra unidad más o menos precisa.

ACLARACIÓN: El cálculo de las probabilidades asociadas a una variable


continua requiere conocer y dominar una rama de las matemáticas que nos
)na de permita manejar funciones definidas en espacios continuos. Esta pane de
la matemálica es el cálculo integral que nos posibilita pasar del sumatorio,

,.,L, a la integral, L,cuando estamos trabajando con una función, [(x),


" b

~to­ continua en un intervalo [a,b]. Pero no hay que alarmarse, el cálculo inte-
_,se gral no lo abordaremos porque las soluciones de las integrales correspon-
ores: dientes se encuentran recogidas en unas tablas que aparecen en el apéndi-
oacio ce de este libro y que aprenderemos a manejar en su momento.
> del
; dis- Por otra pane, este tipo de variables pueden distribuirse de acuerdo a unos
gati. modelos de distribución conocidos entre los que se encuentran la distribu-
rua- ción nonnal, la distribución "1" de Sludent, la distribución "P' de Sne--
decor y la distribución chi-cuadrado de Pearson, que describiremos en
el tema 18, y en las que se basa la inferencia estadística y el contraste de
hipótesis que se estudiará con más detalle y profundidad en segundo curso.
De momento solo daremos una ligera descripción de sus características,
aprenderemos a utilizar sus correspondientes tablas de probabilidad (que
nos evita aplicar el cálculo integral) y \'eremos, a modo de introducción, su
aplicación para la inferencia de los valores poblacionalcs: media, propor-
>de un
ción '! variam.a.
ecimos
es cua-
;onLrar
1,;-4_ Fl "CiÓ" DI: 1'11011 \1111.111 \11
A pal1ir de este punLO vamos a describir el comportamiento matemá-
tico de las variables aleatorias (v.a.) de forma similar a como se hizo, en
de per- los temas iniciales del temario, con las variables estadfsticas para las que
se determinó su distribución de frecuencias, de proporciones, frecuen-
cias acumuladas, proporciones acumuladas, etc.
La función de probabilidad --o función de densidad de probabilidad-
presen- de una val-iable aleatoria es la definición de su cOmpaI1imiento mat.emá-
iquiera tico, lo cuál implica detelminal~ por un lado su espacio muestral -todos
s como los posibles valores que loma la v.a- y por 011'0 lado las probabilidades
asociadas a cada elemento del espacio muestra!. Con estas consideracio-
no dis- nes, llamamos función de densidad\Óre"pI.0babilidad --o función de pro-
¡emplo, babilidad- de una variable aleatoria: X:atrt:inción, ecuación o regla
.actitud que asigna probabilidades a cada uno de los posibles valores nurné·
... ' r~).-_
430 ANÁLISIS DE DATOS EN PSICOLOGÍA 1 D1STR

ricos, Xl' que toma la variable aleatoria, X. Por tanto, nos posibilita el
de
cálculo de la probabilidad asociada a cada elemento del espacio muestral
de dicha variable aleatoria.
me
priJ
Esta función se representa por f(x) y, tanto para variables aleatorias apl
discretas como para las~~expresa:

I f(x)~P(X~x)


ein
pr

que escrito literalmente, dice que (x) es la probabilidad, P, de que la


variable aleatoria, X, tome el valor concreto x. Cuando la variable ale-
atoria es discreta su función de probabilidad puede presentarse resumi-
da en una tabla como la siguiente:

XI ((XI) = P(X = XI) = PI


Xl ((x 2 ) = P(X = Xl) = P2 En
XJ ((Xl) = P(X = Xl) = P3 tarse 1
senta I
- l
l
que desan-ollaremos en el siguiente ejemplo. - e
d
Ejemplo 15.1. Ya hemos expuesto un experimento aleatorio que El,
consistía en escoger a dos personas para un trabajo de selección y
hemos definido la variable aleatoria X: «número de mujeres selec-
cionadas», vamos a obtener su función de probabilidad.
sigL\
Hemos visto que la variable X tomará el valor Ocuando en las dos
extracciones sucesivas y sin reposición -que convierten a los sucesos
en dependientes- no se seleccione ninguna mujer y los selecciona-
dos sean dos hombres:
. 2 1 I
«O) = P(X ~ O) =P(H nH) =P(H) P(H I H) =54 =10 ~0.1 dete
, DISTRIBUCIONES DE PROBABILIDAD DE VARIABLES ALEATORIAS 431

de forma similal~ la variable X tomará el valor 1 cuando en la pri*


mera extracción salga un hombre y en la segunda una mujer o en la
primera una mujer y en la segunda un hombre, y su probabilidad,
aplicando los teoremas de la suma y el producto, es:

[O)" P{X" I)" P(H ()M)v P{M() H) ~


"P(H) -P{MI H) + P{M) -P(H I M) =
2 3 3 2 12
=---+---=-=0_6
5 4 5 4 20
el mismo razonamiento para el valor X igual a 2, que el lector com-
prenderá fácilmente, y vale:
3 2 6
[(2)~ P(X ~ 2) = P(M() M) ~ P(M)-P(MIM) ~ 5-4 ~ 20 =0_3

Estos valores se muestran resumidos en la siguiente tabla:

x O I 2
[(x) 0,1 0,6 0,3

En general, pero no siempre, la función de probabilidad puede presen-


tarse también mediante una ecuación matemática. En este caso se pre-
senta en dos partes:
- una en la que se delimitan los valores donde la función de probabi-
lidad está definida y, en consecuencia, toma un valor positivo;
- en la otra se especifican los valores donde la función de probabili-
dad es cero.
El siguiente ejemplo ayudará a aclarar esla idea:

Ejemplo 15.2. Sea una variable aleatoria cliscreta definida por la


siguiente ecuación:

3X-4
- - Parax=2, 3, 4, 5
[(xl = 26
{
O en otro caso
detenninar su función de probabilidad.
432 ANÁLISIS DE DATOS EN PSICOLOClA 1 Dl5T1l

P,
Aplicando la ecuación que define su función de probabilidad para depr
los valores 2, 3, 4 Y5 tenemos que: la rer
3·2-4 2 conti:
Parax=2=>{(2)=P(X=2)= =-
26 26
3·3-4 5
Para x = 3=> (O) = P(X = 2) = =-
26 26
3·4-4 8
Parax=4 =>(4) = P(X=4)= =-
26 26
3·5-4 II
Para x = 5 => ((S) = P(X = 5) = =-
26 26
y también podemos presentarla resumida en la siguiente tabla que o
se denomina tabla de la función de probabilidad: Fig. 1!
x {(x) "'
2 2126
3 5126
15.4.
4 8126
5 11126

Dentro de la teona de la probabilidad, todo lo mencionado respecto a


la distribución de una v.a. se puede referir tanto a la función de probabi-
lidad -si se trata de una variable aleatoria discrela- como a la función de
densidad de probabilidad -si es conLinua- aunque es frecuente no hacer
tal distinción verbal. Cuando la variable aleatoria es continua su función
de densidad de probabilidad no puede resumirse en una tabla porque el
número de valores que toma este lipo de variable es, por su propia defi·
nición, infinito. En esta situación el único procedimiento es recurrir a
una ecuación matemática que la describa como se hace para la distribu~
ción nonnal y otras distribuciones continuas que veremos en el tema t 8.

15.4.1. Hepresentación gráfica


La representación gráfica de la función de probabilidad, para una
variable aleatoria discreta, adopta la forma propia de un diagrama de
barras que representan las probabilidades asociadas a cada uno de los
valores discretos de la variable y donde la altura de cada barra repre- e
senta su probabilidad (figura 15.1 a). la de
DISTRIBUCIONES DE PROBABILiDAD DE VARIABLES ALEATORIAS 433

Por el contrario cuando la variable aleatoria es continua, la función


de probabilidad toma valores en cualquier punto del intervalo, por lo que
la representación gráfica es una función suave, sin escalones y sin dis-
continuidades, tal y como se puede ver en la figura 15.1 b.

f(X)

o 1 2 3 4 5 x
Fig. 15.1 o: Función de probabilidad de Fig.15. I b: Función de probabilidad de
u!\o variable aleatorio discreto. uno variable aleatorio c.Ol'\tinuo.

1.3.4.2. Propiedndes

Las dos propiedades fundamentales que debe cumplir la función de


probabilidad son:

- Para cualquier valor de x, siempre toma valores positivos o


nulos, es decir:
vX E X [(xi) ~ O

- La suma de todas las probabilidades correspondiente a cada


valor de x es igual a uno:
En el caso discreto:

"
2,f(x,) ~ [(x¡) + f(x,) + ... + f(x,,) = 1
;..1

yen el caso continuo:

Observará que estas propiedades no son más que una adaptación de


la definición axiomática de la probabilidad al caso de variables aleatorias.
434 ANÁLISIS DE DATOS EN PSICOLOGÍA 1 DIST

AClARACJÓN: Cuando la variable aJeatoria es continua en el intervalo [a,h],


ya se ha comentado que el número de valores que puede tomar es infinito
y los puntos eslán infinitamente próximos entre sí. Por tanto, puesto que la
suma de las probabilidades para todos los posibles valores del intervalo
(espacio muestral) tiene que ser la unidad y este intervalo esta constituido
por infinitos valores, la probabilidad asociada Q cada uno de estos i"rúlitos
valores de la variable continua es infinitamente pequeilo (nulo) y. en conse-
cuencia, la probabilidad de que la variable aleatoria continua, X. tome un
valor concreto x es cero:
da

Ejemplo 15.3. Sea la misma variable aleatoria discreta definida


anteriormente por la siguiente función de probabilidad:

3X-4
- - Parax=2, 3, 4, 5
( (x) = 26 ha
{
O en otro caso
detenninar si es una verdadera función de probabilidad. e
ne
Para ello tienen que cumplirse las propiedades mencionadas:

"
l{(Xi) ={(XI) + {(x,) + ... + {(x") =1
¡.,,\

A partir de la tabla de la función de probabilidad obtenida en la


actividad anterior y que reproducimos a continuación:

x {(x)
2 2/26 ta
3 5/26
4 8/26
5 11/26
15.,3.
vemos que las probabilidades encontradas para todos los valores de Se
la variable aleatoria discreta. X, son positivas o nulas donde la varia- de pro
ble no está definida. cumpliéndose la primera propiedad. la vac
creto
LOGiA I DISTRIBUCIONES DE PROBABlLlDAD DE VARlABLES ALEATORIAS 435

:a,b], Respecto a la segunda, la suma de las probabilidades para todos


inito los valores de X tiene que ser igual a la unidad, es decir:
uela
'valo , 2 5 8 J J 26
uido 2/(x)=-+-+-+-=-=1
,., ' 26 26 26 26 26
'litas
mse- En consecuencia, como se cumplen las dos propiedades requeri-
eun
das, se trata de una verdadera función de probabilidad.

Ejemplo 15.4. Sea la siguiente ecuación que define una posible


función de probabilidad de una variable aleatoria discreta:

oida {(x) ~ {(X' -7)· e' x ~ 3; 4; 5; 6; 7.


n para otro valor
Calcular el valor de e para que sea una auténtica función de pro-
babilidad.
Para que sea una auténtica función de probabilidad se tienen que
cumplir las dos propiedades señaladas anteriormente, es decir. se tie-
ne que cumplir que rf(x) = 1. Operando con la ecuación

I:f(x) ~ T.(x' -7)·e' =e'· T.(x' -7) =

e' ·(0' _7)+(4' -7)+(5' -7)+(6' -7)+(7' -7»)=

c"l ·100 = 1:::} el = l~O = 0.01 Y por tanto e = ~O.OI = 0.1


la
Conocido el valor de e, solo queda comprobar que:

't x e X f(x,) ~ O
tarea que dejamos allectoT.

15.5. FüNCIÓ'II VE DISTRIBUCIÓN


,de Se representa con la misma letra, pero en mayúscula, que la función
·a· , de probabilidad, es decir: F(x) y nos d i ~ a probabilidad de que
la variable aleatoria tome un valor menor o igual que un valor con-
creto x. Es decir:
436 ANÁLISIS DE DATOS EN PSICOLOGíA I DlSTRlBUCI(

F (X,) = P (X",,"x,)
LoSVl
como la.
Para variables aleatorias discretas, es:
,
F(x,) = P(X ~ x,) = I{(x,)
¡.. I

Dicho con otros palabras. seguramente menos rigurosas pero más com- De form
prensible. Si ordenarnos de menor a mayor los valores Xl de la variable de probabiJ
aleatoria discreta (Xl < X2 < X.l < ... X,,), la función de distribución se continuas.
obtiene acumulando (o sumando) los valores de la función de pro-
babilidad, de forma que para una variable aleatoria discreta aplicaremos Si la var
la siguiente expresión: (;-,21W ¡t distribució¡
~¿;
lo [a,x], es (
F(x,) = P (X '2 x,) ={(x,) + {(x,) + ... + {(x,) tome valOrE
O de forma más rigurosa, dado un espacio muestral, E. y una variable
aleatoria, X, asociada a E, se llama función de distribución de la variable
Estafun
aleatoria X a la función que atribuye a todo número real, x, la pro-
taria distrib
babilidad de que la variable aleatoria X tome un valor menor o igual
variable poI
quex.
gral Y su eX"

Ejemplo 15.5. Con los mismos datos del ejemplo 15.1, donde el
experimento aleatorio consistía en escoger a dos personas para un siendo
trabajo de selección vamos a calcular su función de distribución. tal y con
Calcularemos F(O), F(l) y F(2). Comenzamos por F(O) que es la
probabilidad de que la variable aleatoria X: «número de mujeres selec- 1.;..;. J. 11,
cionadas» tome un valor menor o igual a cero, esto es:
F (O) = P (X ~ O) = P (X = O) = 0,1 La repre
dad de una
de fonna similar F(l) es la probabilidad de que el _número de muje-
res seleccionadas,. sea menor o igual a 1, esto es, que sea cero y una
mujeres:
F(I) = P(X~ 1) = P (X = O) + P (X = 1) ={(O) + ((I) = 0,1 + 0,6 = 0,7 F(X)
Ylo mismo para calcular la probabilidad de que el ~número de muje-
res· sea menor o igual a dos:
F (2) = P (X ~ 2) = P (X = O) + P (X = I) + P (X = 2) =
= f (O) + f (1)+ {(2) = 0,1 + 0,6 + 0,3 = 1
F;g. 15.4 101'
uno voril
lAl DISTRIBUCIONES DE PROBABILIDAD DE VARIABLES ALEATORlAS 437

Los valores obtenidos se suelen presentar resumidos en una tabla


como la siguiente:
x
F (x)
°
0,1
I
0,7
2
I

n- De fOlma análoga a la definición dada para la función de distribución


,le de probabilidad para variables aleatorias discretas, lo haremos con las

..
,.
)5
continuas.
Si la variable aleatoria está definida en el inren'alo [a,b] la función de
distribución, F(x), mide la masa de probabilidad que existe en el interva-
lo [Ol,x], es decir la probabilidad de que la variable aleatoria continua, X.
tome valores menores o iguales que x, es decir:
le F(x) = P(Xsx)
.e Esta función de distribución se puede interpretar como una masa unj-
.-
~
tólria distribuida continuamente a lo largo del intervalo de variación de la
\'ariable por lo que, en lugar del sumatorio, tenemos que emplear la ínre-
grol y su expresión para variables aleatorias continuas es:

F(x)=P(X~x,)= J:f(x).d.x sia<x<b

siendo F(x)=O SiX<3 y F(x)= 1 six~b

tal y como se puede ver en la figura 15.4.

La '"epreselHación gráfica de la función de distribución de probabili-


dad de una variable discreta adopta la forma de un diagrama de barras
F(x}

F(X) f(ll,¡f---f

.....~--I~-t--x
6 4 • • b

fig.15.4 lo): función de distribución de fig 15.4 lb): Función de distribución de


uno variable aleatoria discreto. una variable aleatorio continuo.
438 ANÁLISiS DE DATOS EN PSICOLOGtA I OISTRlBl

de probabilidades acumuladas donde la altura de cada balTa correspon- - Pal


de al valor de su función de distribución o probabilidad acumulada. En val
el caso continuo la representación granea es una función continua sin CUI
aspecto quebrado. de
b,l
1.)..~.2. I'ropit·dade..

Observando las gráficas de las [iguras 15.4 (a y b) se deduce, sin nece-


sidad de recunir a demostraciones matemáticas. las propiedades funda- qUI

mentales que debe cumplir la función de distribución de probabilidad. mi>


Estas son: <as
esp
- Todos los valores que t.oma la función de distribución de pro· de:
habilidad son positivos o nulos, es decir: la i
Para lodo valor x, de X -+ F (x,) ~ O da
- F(x) es nula para todo valor de la variable inferior al menor
valor de la variable aleatoria En otras palabras. si F(x) está defi-
nida en el intervalo (a,b), la función de distribución de probabilidad
I AC~
de prol
fuera del límite infelior de ese intervalo es cero: serán (
F(x)=Osix<Q concre
nuas, f
F(x) es igual a uno para todo valor igualo superior al mayor mática
valor de la variable aleatoria. Si F(x} está definida en el intervalo probab
(a,b), la función de distribución de probabilidad fuera del límite babilid
superior de ese intervalo es uno:
F(x}=lsix>b
- La función F(x) es no decreciente ya que es una acumulación o l.',t>, H
suma de probabilidades que son siempre positivas o nuJas.
- Tanto para las variables aleatorias discretas como para las conti- En lO!
nuas, la probabilidad, P, de que la variable aleatOlia X tome valores do. El es
x comprendidos entre Xl y X2 (x 1 ~ X S x 2) es la diferencia entre los nos da u:
valores de la función de distribución correspondientes a su valor darse. Pe
superior menos su valor inferior, tal como se representa en la siguien- siendo el
te gráfica. poco mal
F(x)
de esto, J
test fom
1
P(xl<xSx,)=F(x 2 )-F(x l ) F(x~ 1 r que solo
las difere
'1',1
o / x
1 Enes

de contesta
• x, x b ción de 3 el
DISTRIBUCIONES DE PROBABIUDAD DE VARIABLES ALEATORIAS 439

- Para el caso de una variable aleatoria continua definida en el inter-


valo [a,b] como la representada en la figura IS.I (b) y teniendo en
cuenta que para valores por debajo del límite inferior, a, la función
de distribución es nula y para valores superiores al límite superior,
b, es uno, podemos escribir que;

que indica que la masa de probabilidad total es igual a uno. Es el


mismo concepto descrito para las variables discretas, donde en aquel
caso, la suma de las probabilidades asociados a todos los valores del
espacio muestral es uno. Para el caso de variables continuas, la suma
de los infinitos valores del espacio muestra! queda representada por
la integral. En ténnmos gráficos, significa que el área comprendi-
da entre la curva y el eje de abscisas es igual a la unidad.

ACLARACIÓN: Esta última exposición teórica de los conceptos de función


de probabilidad y de distribución de variables continuas y sus propiedades
serán de gran utilidad en el tema 18 que se centrará en algunos modelos
concretos de distribuciones de probabilidad de variables aleatorias conti-
nuas, en los que Sln necesidad de recurrir a complejas ecuaciones mate-
málicas con integrales podremos servimos de unas tablas para calcular las
probabilidades. Pero es necesario saber cómo y por Qué se obtienen las pro-
babilidades pedidas en cada siluadón concrela.

15.6. HESVMEI\
En los temas anteriores aprendimos lo que es un experimento aleato-
rio. El espacio muestral o universo de resultados posibles asociado a él,
nos da una desclipción exhaustiva de todos los resultados que pueden
darse. Pero en muchas situaciones de la vida cotidiana, esta descripción
siendo exhaustiva puede ser enormemente extensa y, en consecuencia,
poco manejable para describir una variable aleaLOria. Como ilusLración
de esto, piénsese en la puntuación que una persona puede obtener en un
tesL formado por 20 preguntas con tres altemativas de respuesta de las
que solo una es cOITecta, ¿sería capaz de construir el espacio muestral de
las diferentes formas de responder al test?]. Piénselo pero no lo acabe por-

1 En esta situación el espacio muestral está fonnado por las diferentes formas distintas
de contestar a este test que. como se ha visto en el tema 13, son las variaciones con repeli·
ción de 3 elementos. tomados de 2.0 en 20. Es decir. VR uo =3N =3.486.784.401.
440 ANÁLISIS DE DATOS EN P51COLOClA 1 D1STRJBUCll

que seJia una pérdida de tiempo más útil para otros objetivos. Si, como
suele ser habitual, solo estamos interesados en el número de respuestas ITJ El esF
a) 7 s
acertadas en el test, podemos recunir, como eSludiamos en este tema a
la variable aleatoria X '" «número de respuestas acertadas contestando al b) 8 s
azar», y con los conocimientos adquiridos hasta el momento, construir e) 2 s
su tabla de distribución de probabilidad, que nos proporcionarla una des·
cripción mucho más resumida, manejable e igualmente exhaustiva de esta [!] La V31

v3¡;able aleatoria. a) O; 1
b) 1;;
Habrá observado también, y así lo esperamos, que una tabla de dis· e) O; I
tribución de probabilidad de una variable aleatoria discreta es similar a
una tabla de distribución de proporciones de una variable estadística dis·
creta. El mismo paralelismo se produce entre la tabla de la función de
[I] La fUI
a)
distribución y la tabla de proporciones acumuladas, y por supuesto entre
X
sus respectivas representaciones gráficas. ¿Cuales son, entonces, las dife· -
rencias?: la variable aleatoria representa el universo (espacio muestra» o O
población de resultados posibles de un experimento aleatorio, en tanto I
que la variable estadística incluye los valores obsen'ados en una muestra, 2
pero no necesariamente todos los valores posibles. En consecuencia una
distribución de probabilidad es la distribución teórica de los valores de
una variable aleatoria, que forman el espacio muestra!. población o uni- 8] La fu,

verso de resultados posibles, mientras que la distribución de proporcio· a)


nes de una muestra es la distribución empírica de unos valores obser- X
-
vados en esa muestra y que no constituyen la población o universo de O
resultados posibles. Por otra parte, la proporción de valores obsenrados I
para una variable estadística, calculada mediante el cociente entre los 2
valores obsen'ados, n, y el IOtal, , (similar al cociente entre casos ravo· 3
rabies y casos posibles) no es más que una tosca aproximación a la defi-
nición estadística de probabilidad que, para una variable aleatoria, cal- [I] Cansie
dad de
cularíamos con los procedimientos estudiados hasta el momento.
Por último, podemos anunciar que de forma similar a como desc¡;b(- a) los
amos una va¡;able estadistica discreta -recurriendo a la obtención de dife- b) la p
rentes índices: de tendencia central; de posición; de variabilidad-lo hare- e) la f,
mos con la variable aleatOl;¡l, Pero esto lo trataremos en el próximo tema.
Antes asegúrese de haber asimilado todos los conceptos realizando los 0 ImagiJ
babilid
ejercicios que aparecen ¡l continuación, roja y
entre -4
que UIl
1.•. 7. EH.IlCIClOS
y 580 1
Se lanza sucesivamente una moneda tres veces y definimos la varia- a) f(SS
ble aleatoria X = .. numero de caras obtenidas entre la primera y la terce- b) F(S'
ra moneda •. e) F(S:
ifA 1 DISTRIBUCIONES DE PROBABILIDAD DE VARIABLES ALEATORIAS 441

mo O] El espacio muestral de este experimento aleatorio está fOlmado por:


;tas
.a a a) 7 sucesos
,al b) 8 sucesos
uir e) 2 sucesos
105- [ ) La "ariable aleatoria toma los valores:
~ta
a)0;1;2;3
b) 1; 2; 3
lis- e) O; 1; 2
ra
lis-
de
ITJ a)La función de probabilidad
b)
de esta variable aJeatoria es:
e)
.tre f(x)
X X f(x) X f(x)
ife·
1)0 O 0,25 1 0,25 O 0,25
>lo 1 0,5 2 0,25 1 0,25
Ta, 2 0,25 3 0,50 2 0,25
ma 3 0,25
de
ru- 0 La función de distribución de esta variable aleatoria es:
a) b) e)
io-
er- X F(x) X F(x) X F(x)
de O 0,25 1 0,25 O 0,25
los 1 0,50 2 0,50 1 0.75
los 2 0.75 3 1 2 1
vo- 3 1
,6-
Considerando la representación gráfica de la función de probabili-
al-
dad de una variable X, en el eje de ordenadas se recoge:

bí·
a) los valores de X
b) la probabilidad
fe-
re- 1 e) la frecuencia
:13. lmagine que conocemos la ecuación que denne la función de pro·
los babilidad del tiempo de "eacción de unos sujetos nonnales a una luz
roja y que esta función está definida en el intervalo comprendido
entre 400 mseg y 630 mseg. Si deseamos calcular la probabilidad de
que un sujeto tenga un liempo de reacción comprendido entre 500
y 580 mseg, tendríamos que realizar la siguiente operación:
ia- a) f(580) + f(500)
:e· b) F(500) - F(580)
e) F(580) - F(500)
442 ANÁLISIS DE DATOS EN PSICOLOGÍA 1 DISTRlBUC

Con Jos mismos datos del ejemplo antedor, la probabilidad de que


un sujeto cualquiera responda en 500 mseg:
11
a) se calcularía a partir de la ecuación de su función de probabi-
lidad.
b) es cero.
e) nunca se poclJia calcular.
Con los mismo datos del ejercicio 6, la probabilidad de que un suje-
to tarde más de 630 mseg en reaccionar a la luz roja, es:
a) uno
b) cero De ac:
e) depende de su función de probabilidad. los va
o La expresión [(x) representa:
mera
colurr
la es 1
a) La probabilidad de que la variable aleatoria X tome un valor con-
creto, x.
b) La probabilidad de que la variable aleatoria X tome un \'3101'
11 La fur
menor o igual que x.
e) La probabilidad de que la variable aleatoria X tome un valor
menor que x.
En un experimento aleatorio cualquiera para representar la expre-
sión .Ia probabilidad de que una variable aleatoria, X, tome valores ya que
menores o iguaJes que 4_ utilizamos:
r(O) =
a) f(4)
b) F(4)
=0,5·
e) P(4) rO) e

= 0,5·
{(2)=
\.;.H. SOU ClO\ \ I.OS 1:.II.IIC1CIOS
:: 0,5 .

11 está
Si se lanza la moneda sucesivamente tres veces, el espacio muestral
formado por las distintas variaciones con repetición de dos ele-
Por 101

mentos (cara y cruz) tomados de tres en tres, es decir por VR v = 23 =


= 8 Y son:
11 des
la funl
ap
siguiefl
CCC
CC'
C'C
'CC
Por tan
donde e indica a;cara_ y * ",cruz_. Por tanto la respuesta correcta es
la b. F(O) =
,
DISTRIBUCIONES DE PROBABILIDAD DE VARIABLES ALEATORIAS 443

• Espacio muestral
CCC
CC'
C'C
X
2
1
2
·cc 1
C" 1
'C' O
..c 1
••• O

De acuerdo con la definición que se ha dado a la variable aleatoria,


los valores que toma X = «numero de caras obtenidas enlre la pri-
mera y la tercera moneda» son los que se muestran en la segunda
columna y toma los valores: O. 1 y 2 por lo que la respuesta correc-
ta es la c.
11 La función de probabilidad de esta variable aleatoria es:

x [(x)
O 0,25
I 0,5
2 0,25
ya que:
{(O) =p (X. O). P ('C") + P (•••).
• 0,5 . 0,5 . 0,5 + 0,5 . 0,5 . 0,5 • 0,25
{(I) = P (X. 1). P (CC") + P ('CC) + P (C"') + P ("C).
• 0,5 . 0,5 . 0,5 + 0,5 .. 0,5 . 0,5 + 0,5 . 0,5 . 0,5 + 0,5 . 0,5 . 0,5 • 0,50
{(2) =P (X. 2). P (CCC) + P (C·C).
• 0,5 . 0,5 . 0,5 + 0,5 . 0,5 . 0,5 = 0,25
Por lo que la respuesta correcta es la 3.

a La función de distribución se obtiene acumulando las probabilida~


des a partir del valor menor de la variable aleatoria y aplicando la
siguiente expresión:
i
F(x;). P(X ~ Xi)· I{(x;)
¡_l

Por lánto:
;
F (O) =P (X ~ O) = {(O) =0,25
444 ANÁLISIS DE DATOS EN PSICOLOGíA 1 OISTRI:

F (1) = P (X < 1) = (O) + ((1) = 0,25 + 0,50 = 0,75 l<

F (2) = P (X < 2) = (O) + ((1) + (2) = 0,25 + 0,50 + 0,25 = l n

quedando la tabla resumen de la función de distribución igual que


la presentada en la alternativa c. )'
X ¡(x)
O 0,25
11 E FI

1 0,75 di
2 I es
d,
d,
11 Casi no merece ningún comentario la confirmación de que la res-
puesta correcta es En el eje de abscisas se recogen los vaJores de
3.
la variable. La frecuencia no se recoge en la representación.
yl
11 p (500
Lo que hay que calcular es, escrito en lenguaje formal, lo siguiente:
~ X S; 580), es decir la probabilidad de que la variable aleato- 11 unLa
ria X sea un valor comprendido entre 500 y 580 que se puede res- rel
cribir de la siguieme forma: di!
P (500 <X < 580) = P (X < 580) - P (X < 500) = F (580) - F (500) .L
por lo que la respuesta correcta es la e) que gráficamente corres-
11II m,
COI
ponclelía a algo similar a lo que se representa en la siguiente gráfica:
1.,
F(x)
1 F-----:,...,.-
F1580) I----¿
F1500) 1---,

-t---x
500 580

• Para toda variable continua la probabilidad de tomar un valor con-


creto es cero. Téngase en cuenta que el número de valores que pue·
de tomar una variable continuas es infinito por lo que los puntos
están infinitamente próximos enlre sí. Por tamo, puesto que la suma
de las probabilidades para todos los posibles valores del intervalo
(espacio muestra!) tiene que ser la unidad y este intervalo esta cons-
tituido por infinitos valores. la probabilidad asociada a cada uno de
estos infinitos valores de la variable continua es infinitamente peque·
ño (nulo) y. en consecuencia, la probabilidad de que la valiable alea-
,fA 1
I DISTRIBUCIONES DE PROBABILIDAD DE VARIABLES ALEATORIAS 445

loria continua, X, tome un valor concreto x es cero. Esto lo escribi-


mos así:

lue
y la '"cspuesta es b.

11 EsF(x)uno. Una de las propiedades de la función de distribución es que


es igual a uno para lodo valor igualo superior al mayor valor
de la \'ariable aleatoria. Como nuestra función de distribución F(x)
está definida en el intervalo (400,630), la función de distribución
de probabilidad fuera del límite superior de ese intervalo es uno, es
decir:
~es­

;de F (x) = I si x>630


y la respuesta es a.
lte:
.10-
11 lIna
La expresión f(x) se utiliza para representar la probabilidad de que
determinada variable aIC<lloria. X, tome un valor concreto que
:-es- representamos por x, es decir: [(x) = p (X =- x) tanto para variables
discretas como continuas. La respuesta es a.
1)
:"es-
lID .La p,·obabilidad de que una variable aleatoria. X. lome valores
menores o iguales que 4. lo podemos rescribir asi: P (X S 4) que
cOITesponde a la función de distribución que se representa por F(4).
lea: la respuesta es b.

:on-
lUe·
HOS
1ma
ialo
)OS-
,de
~ue­

Jea-
Terna 16
Variables Aleatorias Discretas (1):
Una Variable
16.1. 1:\Tf
SUMAIlIO
En los ter
aleal.Orio defj
16.1. Introducción lidades asoci
16.2. Momentos de la variable aleatoria probabilidad
16.2.1. La esperanza matemática o media gráfica. El sij
16.2.2. La varianza su función de
ricos que repl
16.3. Resumen y que denomi
16.4. Ejercicios ceptos son sil
16.5. Soluciones a los ejercicios han variables
tad conceptua
a describir ur
zas, también:
Todo este
variable aleato
lidad univaria
anterior. en Cl
mas variables
del director de
res y dos homl
ción. En esta:
mujeres seleo
ble Y como.n
de estudios de
De rnodoc;
ciones de pro'
contamos con
16.1. Ii\THODUCCIÓN
En los temas anteriores hemos visto que cuando en un experimento
aleatorio definimos una variable aleatoria podemos obtener las probabi-
lidades asociadas a todos sus posibles valores, presentar su función de
probabilidad resumida en Una tabla y su correspondiente representación
gráfica. El siguiente paso, que abordaremos en este tema será describir
su función de probabilidad mediante la obtención de unos valores numé-
ricos que representen su tendencia central y su dispersión o variabilidad
y que denominaremos con el nombre genérico de momentos. Estos con-
ceptos son similares a los ya vistos en los temas 4 y 5 cuando se estudia·
ban variables estadísticas. Verá que no se añade ninguna nueva dificul-
tad conceptual ni de cálculo numérico. Si en los temas anteriores aprendió
a describir una dislribución de frecuencias calculando medias y varian-
7.aS, también lo hará ahora con las mismas herramientas de entonces.

Todo este tema se referirá a la distribución de probabilidad de una


variable aleatoria discreta, también llamadas distribuciones de probabi-
lidad univariadas. Pero como se ha señalado en la introducción del tema
anterior, en cualquier experimento aleatorio se pueden definir dos, tres o
mas variables aleatorias. Por ejemplo, recuerde la situación del ejemplo
del director de un Gabinete de Psicología Clínica que cuenta con n:es muje-
res y dos hombres y desea escoger a dos personas para un trabajo de selec-
ción. En esta situación, podemos definir la variable X como «número de
mujeres seleccionadas». En otras situaciones, podemos definir la varia-
ble Y como «número de hijos en edad escolar» y la variable Z como «nivel
de estudios del cónyuge».
De modo qu~ en cualquier situación se pueden originar las distribu-
ciones de probabilidad bivariadas, o en general. multivariadas cuando
contamos con más de d~s~vana~les_aleatorias.Los conceptos que vere.-·
450 ANÁLISIS DE DATOS EN PSICOLOGíA I VARJABLES AL

mos aquí son los mismos para cada una de las situaciones anteriores aun- nición que e
que, lógicamente, varía la fonna de calcularlos y se pueden obtener nue- siguiente ron
vos índices numéricos a cada situación. Nos limitaremos al caso de una
va¡-jable en este tema, y a la distribución de probabilidad bivariada (dos
variables) en el tema siguiente al que debe pasar cuando considere alean·
zados los siguientes objetivos específicos que podrá comprobar con los ACLARACfl
ejercicios de autocomprobación que le proponemos, como siempre, al momento~
final del tema. ¡Ánimo! Verá que no es tan complicado. Los objetivos son: sumatorio Si

• Conocer las dos características más sobresalientes que describen ya que se Ita
una función de probabilidad. multiplicado
tendremosq
• Conocer el concepto genérico de momentos. lo que no ha
• Distinguir entre los momentos centrales y los momentos respecto
al origen.
En loque~
• Calcular la esperanza y varianza de cualquier distribución de pro- nuestros objet
babilidad de variables aleatorias discretas. cia central cor
media es uno
• Conocer las propiedades que deben cumplir la esperanza y la
de el punto p t'
varian7.a.
los momento!
• Entender el paralelismo existente entre estos conceptos referidos el punto p es i
a una variable estadística y a una variable aleatoria. momentos tan
no entrarem~
etre otros.
, ~

" \11.1 \11 \TOHI \


1h.~. 1. l... Ji
En Jos lemas 4,5 Y6 aprendimos a describir una distlibución de fre-
cuencias de una variable estadística mediante los índices de tendencia los momel
central, de dispersión, de simetría y de apuntamiento o curtosis. Lo mis- representareml
mo podemos hacer ahora con una val;able aleatoria cuya función de pro- nen. pam el ca
babilidad queda perfectamente descrita mediante un conjunto de índices
a los que vamos a designar con el nombre genél;co de momentos y de los
que posteriormente haremos una clasificación. De todos éstos, nos vamos
a centrar exclusivamente en los siguientes mOmentos: la media y la valian-
za (y, obviamente, su raíz cuadrada, la desviación típica) ACLARACIÓN
ce que para la!
Se definen los momentos de orden r. respecto a un punto cual- siÓn:
quiera p de una variable aleatoria X, como la esperanza matemátj·
ca de las potencias de grado r de las desviaciones de los valores de
la variable respecto a este punto p. Pero esto no es más que una defi-
Al VARIABLES ALEATORIAS DISCRETAS (1): UNA VARIABLE 451

m- nición que en lenguaje fannal se escribe, para el caso discreto, de la


.e- siguiente fonDa:
na
os "', = L (x, -p)'. f(x,)
m-
os ACLARACiÓN: Para las variables aleatorias continuas, el cO¡lceplo de
al momento es el mismo, pero por su naturaleza de continua. el sfmbolo del
m: sumatorio se cambia por el de integral:
m, = J(x, -p)' . (x,) dx
ya que se trata de la suma de los .infinitos_ valores ¡"{inilameme peqtteftos
muhiplicados ¡Xlr su probabilidad. Sin embargo a 10 largo de este curso solo
tendremos que calcular los momentos de variables aleatorias discretas. por
lo que no haremos opernciones con integrales.

En lo que sigue mencionaremos los momentos más interesantes para


nuestros objetivos de describir una función de probabilidad. Su tenden-
cia central con la media y su variabilidad o dispersión con la varianza. La
media es uno de los denominados momentos respecto al origen, don-
de el punto p es cero, que representaremos por IJ', y la varianza es uno de
los momentos respecto a la media o momentos centrales, en los que
el punto p es igual a la media y que representaremos por IJ,. Hay otros
momentos tanto respecto al origen como respecto a la media en los que
no entraremos pero que originarían los índices de asimetría y curtosis,
etre otros.

l h.:!.I. I.a 1.... pt·l'allza lII;1t('1I1.1I il'¡¡ ti 111

re-
Los momentos respecto al origen, que para las variables aleatorias
:ia
representaremos por IJ" son aquellos en los que el punto p vale cero, y tie-
is- nen, para el caso discreto, la siguiente expresión:
~o­

1. ~; =E(X') =¡:,¡ . f(x,)


~es

los
'os
m-
ACLARACiÓN: Por lo que se ha dicho en la dcfinición dc momentos se decll-
ce que para las variables continuas. la esperan;,.a tendrá la siguiente expre-
al- sión:
ti-
de
,6-
~~ = E(X'):= J': xi' {(X,)
'v
452 ANÁLISIS DE DATOS EN PSICOLOG1A I VARJABL~

,,
Las distlibuciones de probabilidad de variables aleatorias continuas que se
estudiarán en este curso en el tema 18 están perfectamente especificadas y
en ningún caso tendremos que aplicar esta expresión para obtener su media.

tal y co
Entre estos, el más sencillo y uno de los más importantes, es la espe- han obl
ranza matemática o media que corresponde al momento respecto al ori- primer.:
gen de prime¡- orden. Se representa indistintamente por E (X) o por la incluye
letra griega p (.mu.) y corresponde al valor obtenido al aplicar la expre-
sión anterior considerando que, al ser de primer orden, r = 1, es decir:

, El valo
~; = E(X) = LX,'
,., {(x,)
piedades (
se mostraJ
- La el
es decir, que la esperanza matemática de una variable aleatoria, X. es
igual a la suma de los productos de cada uno de los valores, ~, que
toma la variable aleatoria por sus respectivas probabilidades, f(x¡). -La ..
, , espel
~ = E(X) = LX,' ((x,) = LX,' P(X =x,)
.=1 ,.,
El lérmino tiene sus raíces en los juegos de azar con el fin de poder - La e!
estimar las ganancias esperadas si se repitiese el juego un elevado núme· es ig-w
ble.
ro de veces. Referido a una variable aleatoria, es sinónimo del concepto
media, estudiado en los temas previos, pero, dentro de la teoria de la pro-
babilidad, es el que se utiliza para representar el promedio teórico que - Dada
tomaría la vaI-iable aleatoria si se repitiese el experimento aleatorio infi- delp
nitas veces. ranu
E()
Ejemplo 16.1. La esperanza matemática (o momento respecto al Olro m(
origen de orden uno) de la variable aleatoria que estamos estudian- tc'-¡ores, es
do, es:

X f(x) d(x)
O 0,1 que repreSl
Xl =
X2=
Xl =
1
2
0,6
0.3
°
0,6
0,6
decir E(X 2)
t"es (r = 3),
1.2 1 Para salJ

que esperar al
ItOCíA J VARIABLES ALEATORIAS DISCRETAS (1): UNA VARIABLE 453

.ue se ,
das y ~ =E(X) =Ix,. (Xi) =x, . (x,) + x, . (X,) + x,· (x,) =
le{lia. 1=1

= 0·0.1 + 1·0.6+2 ·0.3 = 1.2


tal y como también se hace en la tercera columna de la tabla que se
3. espe· han obtenido multiplicando los valores de la variable aleatoria de la
) al ori- primera columna. Xi' por sus respectivas probabilidades, {(x¡),que se
I por la
incluyen en la segunda columna.
. expre-
!ecir:
El valor esperado de una variable aleatoria tiene las siguientes pro-
piedades que expondremos sin demostración y que son las mismas que
se mostraron en el tema 4 para la media de una variable estadística:
- La esperanza de una constante es igual a la constante.
X, es
t,
E(e) = e si c = constante
.
X¡,que
[(",). - La esperanza de una suma de variables es igual a la suma de las
esperanzas de las variables.
E(X + Y) = E(X) + E(Y)
- La esperanza del producto de una constante por una variable
: poder
es igual a la constante multiplicada por la esperanza de la varia-
núme- ble.
ncepto
la pro- E(e . X) = e . E(X)
ca que - Dadas dos variables aleatorias independientes r X e Y, la esperanza
io infi- del producto de las variables es igual al producto de sus espe-
ranzas.
E(X . Y) = E(X) . E(Y) Si y solo si X e Y son independientes.
o al Otro momento respecto al origen que nos interesa para cálculos pos-
'ao- teriores, es el momento respecto al origen de orden dos. Este es:

,,; = E(X') = !:x'.


/"'. ,
(x.)
I

que rCpt'cscnta la esperanza matemática de los cuadrados de X, es


decir E(X 2). De forma similar podríamos calcular los momentos de orden
tres (1' = 3), de orden cuatro (1' = 4). ele.

I P:uOl saber lo que significa que dos variables aleatorias. X e Y, son independientes hay
que c!>pcrar al lema siguiente donde se dt"SCliben estos \ otros conceptos.
454 ANÁLISIS DE DATOS EN PSICOLOGIA 1 VARIABLES Al

Ejercicio 16.2. Siendo X la variable aleatoria cuya función de


probabilidad viene recogida en la siguiente tabla: que ahora Vol:

X f(x)
o 0.1
1 0.6
2 0.3 que indkan.
desviacione
calcular la esperanza de la variable Y = 3X - 2. variable ale¡
Un primer procedimiento es detenninar la función de probabili.
dad de esta nueva variable aleatoria que tomaria los valores Y = -2;
ACLARACH
1; 4 al aplicar la ecuación 3X - 2 a los valores de X = O; 1 Y 2 respec· que el mom
livamente. y calcular la esperanza por el procedimiento habitual ya partimos d~
explicado: operamos el
y f(y) y. f(y)
~I
-2 0,1 -0,2
1 0,6 0,6 que es una e
4 0,3 1,2
1,6
Entre tocle
~=¡yI·r(y,)=-2·D,1 + 1·0,6+4·0,6= 1,6 tivos de descr.
Un segundo procedimiento es aplicar las propiedades vistas de la • orden dos, qt:
esperanza y sabiendo que E(X) = 1.2 entonces: ranza matem
res de la var¡
E (Y) = E (3X - 2) = E (3X) - E (2) = 3 . E (X) - E (2) =
para derivar 1,
=3·1,2-2= 1,6
lJegando, como era de esperar, al mismo resultado.

I h.:!.:!. La ,adanza
Se suele de
Cuando en la expresión general de los momentos, que volvemos a griega «sigmal
reproducir: tico se utiliza,
"', = 1 (x,-p)' . {(x,)
el valor p es igual a la media, tenemos los momentos centrales o
momentos respecto a la media y tienen la siguiente expresión para varia-
bles aleiltorias discretas 2:
l Omitiremos, a diferencia de cómo hemos hecho con la media, la c.:<prcsión de la vunan- es decir, que la
...a p3l1l variables conlinuas, con la scgulidad de que el k-clor puede deducirla cambiando cuadrados d
el símbolo del sumalorio por el de la inlegral. (E(X»'.
VARIABLES ALEATORIAS DlSCRET....S (1): UNA VARIABLE 455

que ahora vamos a representar por}.l, y es igual a:

que indican que estos momentos son la esperanza matemática de las


desviaciones respecto a la media de cada ÚDO de los valores de la
variable aleatoria, X, elevadas a la potencia r.

ACLARACIÓN: Con el fin de afianzar estos conceptos, vamos a comprobar


que el momento respecto a la media de orden uno es igual a cero. Para ello,
partimos de la expresión del momento respecto a la media de orden uno y
operamos con ella algebraicamente:

que es una de las pwpiedades de la media, vista también en el tema 4.

Entre todos estos momentos el más importante -para nuestros obje-


tivos de describir una función de probabilidad- es el momento central de
orden dos, que recibe el nombre de varianza y corresponde a la espe·
ranza matemática de los cuadrados de las diferencias entre los valo-
res de la variable y la media. Intente el lector comprender esta fTase
para derivar lógicamente que su expresión matemática es:

Se suele designar también por V(X) y más frecuentemente por la letra


griega «sigma» minúscula elevada la cuadrado (6) y para su cálculo prác~
tico se utiliza otra expresión que se deriva de la anterior y es:

a' =V(X) =E(X 2 ) - [E(X)j'

es decir, que la varianza la podemos definir como la esperanza de los


cuadrados de X, E(X 2 ) • menos el cuadrado de la esperanza de X.
(E(X»'.
456 ANÁLISIS DE DATOS EN PSICOLOGíA I VARlABL~

ACLARACIÓN: Es muy recomendable comprender la deducción


matemática de esta última expresión por cuanto requiere operar con
el símbolo del sumatorio e identificar los momentos de los que esta-
rnos tratando. Por tanto, partiendo del concepto de varianza y ope·
rando algebraicamente con su expresión y el sumatorio. tenemos
que:

0 1 = V(X) = Ef(x - ~)l] = [(x, - J.1)1 . (X,) = r.(x~ - 2x,J.1 + J.11). «X,) =
Utili
r.x: .f(x¡)- 11.1.r.X, •«X,) + J.11 • r[(x,)
y teniendo en cuenta que: y habier
a 1,2. _
r.xf·f(x¡)=J.I; to al ori
Ú¡·f(X,)-=J.11 =J.1
r[(x,)= I
que pro
llegamos a:

r.t; .{(x,) - 2 J.I' :Ex,' {(x¡)+ J.I1 . r{(x,> = 112 - 2¡.t1l + J.I1 = cuyos re
, 1 2 ' 1
Por tan1
=J.I1 -2·J.l +J.1 =J.12-J.1

donde el pdmer término representa el momento respecto al origen y su raí


de orden dos (o esperanza matemática de X2) y el segundo término
representa el cuadrado del momenlo respecto al origen de orden uno
(o cuadrado de la esperanza de X).

Entre Il
Como ya se sabe de los lemas de Estadística descriptiva, la va¡-janza
es un número positivo -o nulo cuando no hay v.u"iabilidad y todos los - La Vi

valol-es Xi son iguales-o Al se." un número positivo existe su raíz cuadrada


positiva que recibe el nombre de desviación típica y se designa, para las
variables aleatodas, por la letraEriega S'(sigmn minúscula). - Sean
¡~'-"L CT varia
cr = jV(X) =) E(X - ~)' = [E(X') - [E(Xl)' varia

si y 51

Ejemplo 16.3. Continuando con el ejemplo anterior, vamos a cal·


euJar su varianza y desviación LÍpica. J Nuevan
aleatorias, X 1
eslos y Olf'Os,
1: 1
VARIABLES ALEATORIAS DISCRETAS (1): UNA VARIABLE 457

x f(x) x,f(X) X' f(x)


O . 0,1 O O
1 0.6 0.6 0.6
2 0.3 0.6 1.2
1.2 1.8

Utilizaremos la expresión:
o' = E (X') - [E (X)J'
Yhabiendo calculado anteriormente que la esperanza o media es igual
a 1,2, sólo nos falta calcular la esperanza de X 2 , o momento respec~
to al origen de segundo orden, mediante la e.xpresión:
, , 2
~2 =E(X )=kx; ·f(x¡)
que proporciona el siguiente valor:
= 02 .0,1 + ]2. 0,6 + 22 .0,3 = 1,8
cuyos resultados también se incluyen en la cuarta columna de la tabla.
Por tanto, la varianza es:
o' = E (X)' - [E (X)]' = 1,8 - 1,2' = 9.4<
• ¡ ~ ...
y su raíz cuadrada es la desviación típica:

a =¡;;: = '/044 =0.663


. ,,)

Entre las propiedades de la varianza, debemos señalar las siguientes:


- La varianza de una constante es cero:
V(c) = O si e = constante.
- Sean X e Y dos variables aleatorias independientes, entonces la
varianza de la suma de las variables es igual a la suma de sus
varianzas:
V(X+Y) ~ V(X) + V(Y)
si y sólo si las variables X e Y son independientes!,

J NuC"vamenle, volvemos. a recordar que para saber lo que significa que dos variables

aleatorias, X e Y, son independientes hay que esperar al tema siguiente donde se describen
estos y otros conceptos.
458 ANÁLISIS DE DATOS EN PSICOLOGÍA I VARIABLES

- La VI
ACLARACIÓN: Vamos a demostrarlo con el fin de aplicar y familiarizamos iguaJ
con las propiedades de la esperanza expuestas en el epfgrafe anterior. Por de la
la definición de varianza, tenemos que:

V(X + Y). E «X + Y)')-(E(X + Y)'.

desarrollando los cuadrados de los binomios· y considerando que la espe-


ranza de la suma es igual a la suma de las esperanzas:
l/d. HE

== E (X: + 2XY+ Y:}-(E (Á') + E(YW '" Hemos


• E (X') + lE (XY) + E (Y'J - (E (X)' - lE (X) E (Y) - (E (Y))' : ría y la hen
y los mom(
y eliminando y reorganizando ténninos llegamos: les que hell
= E (X') - (E (X)' + E (Y') - (E (Y)' = V (X) + V (Y) fundament
respecto al
ya que los dos primeros lénninos constituyen la varianza de X y los dos la media d(
segundos la varianza de Y. rencia enln
dode la me
entenderJo
La varianza de la suma de una variable más una constante es
siguiente.
igual a la varianza de la variable:
Convien
V(X + e) = V(X) siendo c= conslanle. ciones de u
variable aje
ACLARACiÓN: En efecto. por definición de "alianza: ca y la espe
de cIJo, corr
V (X + e) = E (X + ef - [E (X + e)]2 '"

desarrollando Jos cuadrados de los binomios: Para tUllO

- r[.
X=-
y aplicando las propiedades de la espclOlm..a: N
ma ecuació¡
E (X Z) + leE (A') + e Z - [E (X)r _ leE (A') _ e 2
x =2<>,'
reorganizando términos y eliminando los que se anulan, llegamos a: los valores (
E (X)' - [E (Xl]' = V (X) = o' Senla el cae
número de 1
que no es más que la varianza de x. a continuaCl

Para tilla
• El cuadlOldo de un binomio (a :l: b)l es igual al cuadradQ del pI;mero mas el cuadra-
do del segundo m3!> (o menos) el doble del primero par el segundo. E (X) =1
l l
(a +b)2 :a +b + 2ab de acuerdo 1
(a _b)2: al + b l _ 2ilb entre el nún
VARIABLES ALEATORIAS DISCRETAS (l); UNA VARIABLE 459

- La varianza del producto de una constante por una variable es


igual al producto del cuadrado de la constante por la varianza
de la variable:
V(kXl ~ k' V(X)

Hemos estudiado la función de probabilidad de una variable aleato-


ria y la hemos descrito haciendo uso de los momentos respecto al origen
y los momentos respecto a la media. De estos conceptos teóricos genera-
les que hemos definido y expresado matemáticamente, hemos utilizado
fundamentalmente dos: la media y la varianza. La media es el momento
respecto al origen d_e--2.r:4en uno, y la varianza es elmomento respectO a---
la mooia de orden 2, y para su cálculo práctico hay que o tenefla-aife7
rencia entre el momento respecto al origen de orden 2 menos el cuadra-
do de la media. Y esto no es un juego de palabras, de modo que si cree no
entenderlo, es conveniente que repase este tema antes de abordar el
siguiente.
Conviene insistir en el paralelismo entre la distribución de propor-
ciones de una variable estadística y la función de probabilidad de una
variable aleatoria e igualmente entre la media de una variable estadísti-
ca y la esperanza matemática de una variable aleatoria y como muestra
de ello, compare sus correspondientes ecuaciones:

Para una variable estadística, la media es:

x= r¡~ Xi puesto que el cociente entre fy N es la proporción, esta mis-


ma ecuación se puede escribir de la siguiente forma:
X = ¿Pi· Xi donde Pi es la proporción correspondiente a cada uno de
los valores de X (x¡). Para una variable aleatoria, esta proporción repre-
senta el cociente entre el número de casos favorables al suceso Xi y el
número de casos posibles, por tanto, su probabilidad, como exponemos
a continuación.

Para una variable aleatoria, la media es:


E (X) = 'Ix . r(x) donde r(x) es la probabilidad de aparición de x, que
de acuerdo con la definición clásica de Laplace, corresponde al cociente
entre el número de casos favorables y el número de casos posibles o, de
460 ANÁLISIS DE DATOS EN PSICOLOGfA I VARIABLES Al

acuerdo con la definición estadística, frecuencia relativa o proporción de


veces que aparece un suceso si el número de ensayos tiende a infinito.
Lo mismo ocurre con la varianza, donde su fórmula, para el caso de
una variable estadística es:

al 2,7
b)7
Para una variable aleaIO!;a, el p¡;mer término corresponde a la media
de X 2, E (Xl) Y el segundo es el cuadrado de la media. (E (XW, de acuer· el 2.4
do con la siguiente expresión:
En la si
V (Xl = E (X') - [E (Xl]' siendo E (X') = LX' . ((x) X,lam!

En el siguiente tema veremos la distribución conjunta de dos varia-


bles alealOlias anunciando de antemano su paralelismo conceptual con
la distribución conjunta entre dos variables estadísticas. Antes de ello,
imente realizar los siguientes ejercicios que le indicará si está en condi·
ciones de pasar a estudiarlo o conviene un nue\'o repaso de este tema.

IhA. I:.II:IIClCIOS
al 3,15
[J] l...,;'\ esperanza de una variable aleatoria: bl 2,95
a) Siempre toma valores positivos. el 3
h) No puede tomar valores negativos.
e) Su signo depende de los valores de la variable.
En la si

o La varianza de una variable aleatoria:


X, la va¡

a) Varía de menos inrinito a más infinito.


h) No puede lomar valores negativos.
e) Su signo depende de los valores de la variable.

[O La siguiente expresión: Lx,s. ((-l.";) representa:


al 0,84
a) El momento respecto al origen de orden cinco.
b) El momento respecto a la media elevado a cinco b)7
e) La esperanza de X, elevado a la quinta potencia. el 2,4
En la siguiente tabla de la función de distribución de una variable En la sil
X. la media es: X,la Val
VARIABLES ALEATORIAS DISCRETAS ro: UNA VARIABLE 461

X
1
2
3
F (X)
0,2
0,5
0,9
fl')
• ,t
c,~
,,u
.,,.
,
", '-
"
"
,
4 1 ", "~

a) 2,7 1, '
/1ét<~

b)7
ei 2,4

o En la siguiente labIa de la función de probabilidad de una variable


X, la media es;

x {(x)
O 0,05
I 0,1
2 0,2
3 0,25
4 0,35
6 0,05
a) 3,15
b) 2,95
c)3

En la siguiente tabla de la función de distribución de una variable


X, la varianza es:

X F(x)
1 0,2
2 0,5
3 0,9
4 1
a) 0,84
b)7
e) 2,4

o .
En la siguiente tabla de la función de probabilidad de una variable
X, la varianza es:
462 ANÁUSIS DE DATOS EN PSICOLOGÍA 1 VARlABLESA

x (x)
0,05
11 euanti
La res

°21 0,1
0,2
nesde
ellos (1
0,25 de muj
3
4 0.35
6 0,05 11 orden
Laresp
(

al 3,15
bl 2,95 el valor
el 1,84 r: 5 (p
Para calcular la varianza de una variable aleatoria, podemos uüli-
r
L (X - J.1)l . (x) u otra similar que implica
'l..3r la expresión: V (X) '"
calcular:
11 viamenl
La resp
a) la media de X menos el cuadrado de la media de X. las prot
b) El cuadrado de la media menos la media de Xl, la tereel
e) La esperanza de Xl menos el cuadrado de la esperanza de X.
o Si dos variables Z e Y son independicnles. se cumple que:
n} la varianza del producto es igual al cuadrado de sus varianzas.
b) La "alianza de la suma es igual a la suma de las varianzas.
e) La varianza de la suma es igual al producto de sus varianzas.

[!Q] ¿Cuál de las siguientes propiedades es cierta?


aJ La esperanza de una constanle es uno.
b) La varianza de una constante es cero.
e) La vmianí"..a de una constante es igual a la constante por la varian-
za de la variable.
11 segunda
La respL

sanas pa

11>,;. ";Olt (10 I S \ I OS 1.11 11('1 ('1 OS

a La respuesta correcta es la c, ya que si la variable aleatoria toma


vaJor-es negativos (por ejemplo. temperatura de Moscll en el mes de
encro medida en oC) la exp"csión general de la esperanza:
E (>0: IX" (x,)
al depender de los valores de x (positivos o negativos) puede ser nega-
tivo la suma final.
"

VARIABLES ALEATORIAS DISCRETAS (1): UNA VARIABLE 463

11 cuantifica
La respuesta correcta es la b, ya que la varianza es un índice que
«variabilidades» y vale cero cuando todas las observacio-
nes de una variable toman el mismo valor y no hay variabilidad en
ellos (por ejemplo, la variable aleatoria X = «sexo- en una muestra
\ de mujeres) y va aumentando a medida que aumenta la variabilidad.

11 Laorden
respuesta correcta es la a, ya que el momento respecto al origen de
cinco requiere hacer en la expresión general de los momentos:
ni, = L (x; - py, [(x;)
el valor p = O(por ser un momento respecto al origen) y el exponente
r = 5 (por ser de orden 5) quedando:

a La respuesta correcta es la c. Vamos a comprobarlo para lo que pre-


viamente obtenemos su función de probabilidad cdesacumulando_
las probabilidades que aparecen acumuladas y que se muestran en
la tercera columna de la tabla:

X F(x) [(x) x' ((x)


¡ 0,2 0,2 0,2
2 0,5 0,3 0,6
3 0,9 0,4 1,2
4 1 0,1 0,4
2,4

E (X) = Lx· [(x) = 2,4

11 segunda
La respuesta correcta es la b. Para comprobarlo construimos la
columna de la tabla donde aparecen las operaciones nece·
sanas para calcular la E(X)
x {(x) x . {(x)
O 0,05 O
1 0,1 0,1
2 0,2 0,4
3 0,25 0,75
4 0,35 1,4
6 0,05 0,30
2,95
E (X) - Lx, {(x) _ 2,95
464 ANÁLISIS DE DATOS EN PSICOLOGÍA 1 VARIABLES

11 La respuesta correcta es la a. Para comprobarlo, obtenemos prime-


ro la función de probabilidad de X a partir de la función de distri· l1li dere
!.are

bución. Para ello, restamos a la probabilidad acumulada de X la del com¡:


valol' inmediatamente al1teliol' y formamos las dos últimas colum-
Supo
nas con los cálculos necesarios para obtener la esperanza de X y la
En e~
esperanza de X2:
vañal
tificac
X F (x) {(x) x . ((x) x'.{(x) gener
I 0,2 0,2 0,2 0,2
2 0,5 0,3 0,6 i,2
3 0,9 0,4 \ ,2 3,6 el pril
4 I 0, I 0,4 \ ,6 cero I
2,4 6,6 VO
v (X) = E (X') - [E (X)]' = 6,6 - 2,4' = 0,84
B La respuesta correcta es la c.
Para calcular la varianza realizamos los cálculos intennedios en las
dos últimas columnas de la tabla que induyen la esperanza de X y
la esperanza de X2 ,

X {(x) x . {(x) x' . {(x)

°
2
\
0,05
0, \
0,2
°
0, I
0,4
°
0,1
0,8
3 0,25 0,75 2,25
4 0,35 1,4 5.6
6 0,05 0,3 \ ,8
2,95 \0,55

v (>0 = E (X') - [E (X)]' = \0,55 - 2,95' = 1,847

11 La respuesta correcta es la e, que con'csponde a la expresión mate-


mática:
v (X) = E (X') - [E (X))'

11 olvide
La respuesta correcta es la b. Si no ha acel1ado esta pregunta. no
esta propiedad pero espere al próximo tema donde la volve-
remos a tratar con más detalle.
VARIABLES ALEATORIAS DISCRETAS (1): UNA VARIABLE 46S

l1li Laderrespuesta correcta es la b. Si no la ha acertado no pretenda apren-


estas propiedades de memoria sin entender lo que dice. Intente
comprenderlo y para ello pongamos un ejemplo:
Supongamos una variable que toma los valores: XI =5; X2 =5; X3 = 5;
En este caso .. la variable. toma siempre el mismo valor que «no
varia., es un valor constante y lógicamente su «variabilidad. (cuan-
tificado con la varianza) es nula. Su media es cinco y en la expresión
general de la varianza:
V (X) ~ L(X;-~)' . {(x;)
el primer término del sumatorio siempre tiene el valor (5 - 5) que es
cero para los tres valores de esta «variable»:
V (X) ~ L (x; - ~)' . {(x) ~ (S - 5) . {(S) + (5 - 5) . {(S) + (S - S) .
. {(S) ~ O, {(S) + O, {(S) + O, {(S) ~ O
Tema 17
Variables Aleatorias Discretas (11):
Dos Variables
SUMARlO 17.1. 1:\"

Record
17.1. Introducción ción del te
17.2. Función de probabilidad conjunta una o mas
17.3. Función de probabilidad marginal Iidad univ:
das (tres o
17.4. Función de probabilidad condicional
de probabi
17.5. Momentos dio de las l
17.5.1. Respecto al origen: La esperanza como hiciJ
17.5.2. Respecto a la media: La covarianza lidad conjl
17.6. Independencia entre variables aleatorias discretas representé
lo único q
17.7. Función de distribución conjunta
cálculo.
17.8. Función de distribución marginal
Los obj
17.9. Resumen
17.10. Ejercicios
17.11. Soluciones a los ejercicios • Ser ca
aleato!
• Consb;
atan
17.1. I :TRODUCCIÓ'\'
Recordemos antes de empezar que, como se indicaba en la introduc-
ción del lema anterior, en todo experimento aleatorio es posible definir
una o mas variables aleatorias originando las distribuciones de probabi-
lidad univariadas (una variable). bivariadas (dos variables) y rnultivaria-
das (tres o más vaJiabJes). Una vez estudiada Jo referente a la distribución
de probabilidad de una variable en el tema 16, abordaremos ahora el estu-
dio de las distribuciones de probabilidad bivariadas y, de forma similar a
como hicimos en el tema anterior. construiremos su función de probabi-
lidad conjunta, su función de distribución conjunta y sus momentos más
representativos. Estos conceptos son los mismos que ya conocemos y
lo único que cambia, obviamente. es la expresión matemática para su
cálculo.
Los objetivos son:

• Ser capaces de definir dos variables aleatorias de un experimento


aleatorio.
• Construir la función de probabilidad conjunta de dos variables ale~
atodas de un experimento aleatorio.
• Obtener las funciones de probabilidad marginales y condicionadas
de cada variable.
• Calcular la esperanza conjunta y la esperanza condicionada de cada
variable.
• Calcular la varianza de cada una de las variables aleatorias
470 ANÁLISIS DE DATOS EN PSICOLOGíA 1 VARIABLES

Tabla 17.'
• Analizar si dos variables aleatorias discretas son o no indepen-
dientes.
X\
• Conocer las características que debe cumplir la función de proba-
bilidad conjunta de dos variables aleatorias discretas indepen- x,
dientes. x,
• Calcular la esperanza matemática y la varianza de una suma (o res-
la) de dos variables aleatorias discretas.
• Cuantificar la intensidad de la relación entre dos variables aleato-
rias discretas.
• Entender el paralelismo existente entre estos conceptos referidos De esta
a dos variables estadísticas y dos vatiahles aleatorias. variable al
dentro del
lidad de ql
mea y. con
17.2. IT\CIÓ:\ DE l'ROB~BILlI)\1) CO\.Il \T.\

Vamos a considerar un experimento aleatorio cualquiera, por ejem- Por tan


plo. un experimento de aprendizaje animal en el que situamos a una rata refiere a la
de laboratorio en un laberinto en forma de T con dos salidas, A y B. Si roa similar
escoge la salida A recibe una bolita de comida y si escoge la salida B reci- que atribl
be una pequeña descarga eléctrica. Definimos en él dos variables aleato- variable a
rias discretas. X e y, de la siguiente forma: X es el "número de bolas de aleatoria ~
comida que recibe la rata», e Yel «número de descargas eléctricas que
Si calcl
recibe la rata_ en una serie de ensayos. Estas variables tomarán los valo-
valores (Xi'
res discretos: O. 1. 2, 3. etc., que genédcamente vamos a representar por:
probabilid
/vrt-- i
V; 'f
X: xr
Xl> X2' X3' •.••
Y: y,. y" y,• ... , y<
una tabla (
ejemplo iN
de probabi
y cuyos resultadO~Ogemosen una tabla (Tabla 17.1.) de doble entra- concreto.
da de dimensione p x Q\d.onde el valor genérico -que aparece en negri-
ta- en el cruce de la . a i con la columna j es "la probabilidad conjunta
de que la rata consiga Xi bolas de comida y reciba YJ descargas eléctricas». Eje
que representaremos por f (Xi' Yi)' laberin
Esto que hemos escrito literalmente con palabras lo podemos escribir B. Ca
de forma resumida utilizando un lenguaje sin palabras, de la siguiente cada ve
forma: mento
ladocle
{(x" Y,) "P [(X = x,) y (Y = y,)] atonas.
Al VARIABLES ALEATORIAS DISCRETAS (11); DOS VARIABLES 471

Tabla 17.1. Tabla genérica de una función de probabilidad conjunta de dos


variables alectorias discretas.

X\y y, y, ." y, ... y,


X, ((Xl. 11) ((XI' Y11 ." (Ix" y) ... Hx" y,l
x, '(X2' y,) f (x2, 12) ... f (X2. r,l . .. ({x" y,)
... .. ' ... .. ' ... ... ...
x, ({x"y,1 (Ix" y,1 ... IV<;. yl ... ({x" y,1
... .. ' ... ... ." . .. ...
X¡ (1", y,) 11", y,) .. ' 11", y) ... (1", y.l

De esta forma la expresión f(2,\) representa la probabilidad de que la


variable alealOria X tome el valor 2 y la variable Y tome el valor 1, que
dentro del ejemplo al que nos estamos refiriendo representa la probabi-
lidad de que la rata consiga 2 bolas de comida y reciba 1 descarga eléc·
lrica Y, concrelamenle, se representaría así:
f (2, 1) = P [(X = 2) Y (Y = 1)]
Por tanto, a partir de este momentO, la expresión genédca (x,. Y/) se r
a refiere a la función de y probabilidad conjunta que definiremos, de for.
·i ma similar a como lo hicimos para una variable, como aquella función
que atribuye a cada par de valores (x,. y,) la probabilidad de que la
variable aleatoria X tome el valor x, y simultáneamente la variable
, aleatoria Y tome el valor Yj "
, Si calculamos estas probabilidades para todos los posibles pares de
valores (x,.y¡) tenemos la función de probabilidad conjunta. o función de
probabilidad de una val;able aleatoria bidimensional, que se resume en
una tabla como la mosLrada anLerionnente (Tabla 17.1). En el siguielllc
ejemplo iremos mostrando, paso a paso, como se construye esta función
de probabilidad conjunta de dos variables para un experimento aleatorio
concreto.

Ejemplo 17.1.: En un experimento se coloca a una rata en un


laberinto en fonna de T con dos posibles salidas equiprobables. A y
B. Cada vez que se sitúa en A recibe un «pelet.. (bolita de comida) y
cada vez que lo hace en B recibe una pequeña descarga. El experi-
mento tennina cuando la rata se ha situado dos veces en un mismo
lado del laberinto. En este experimento. definimos dos variables ale·
atorias, X e Y, de la siguiente manera:
472 ANÁLISIS DE DATOS EN PSICOLOClA 1 VARIABLES ALE

X: número de pelets que recibe la rata Para la


babilidad d(
Y: número de descargas eléctricas que recibe la rata la A?
Para elaborar la función de probabilidad conjunta, tenemos que
determinar los valores numéricos que pueden tomar las variables
definidas X e Y. Para eUc. veamos todas las posibles soluciones que
se pueden dar en este experimento:
Considerando Que el experimento tennina cuando la rata se sitúa
dos veces en el mismo lado, si la rata elige las dos primeras veces la
salida A. el experimento termina por haberse cumplido la condición
impuesta de situarse dos veces en el mismo lado del laberinto. Enton-
ces, la variable X loma el valor 2 y la variable Y el valor o. Pero son
posibles otras opciones. por ejemplo BAH, donde al elegir dos veces
la salida B terminarla el experimento (con la rata habiendo conse-
guido una bola de comida y dos descargas eléctricas) por lo que la Hecho
val;able X adopta el valor 1 y la variable Y el valor 2. No terminan lenemos q
aquí todas las opciones. Intente pensar sobre ellas y vea las solucio- de la siguie
nes en la tabla siguiente que recoge en la pzimera columna todas los ((O,O) •
posibles resulLados de este experimento con los valores que toman que en nin
las variables X e Y tal Y como se han definido, y sus correspondien- queX",Oe
tes probabilidades, en la columna P, que explicamos a continuación: reciba nin
Tabla '7.2. fspocio Muestra' delexpenmemo aleatorio y voIonts ¿Sepu
que toman kas variables X e Y con sus respectivas ta y ningu
p<ObabilMlades, P que en la
situación
Espacio M~trol X Y P
te ocurre
AA
ABA
ABB
2
2
1
°
1
2
0,25
0,125
0,125
babilidad
cargas el
esta situac'
BB 2 0,25
BAA
BAB
°2
I
1
2
0,125
0,125
BAH, cuy

Para calcular la probabilidad de que la rata escoja la salida A y


después otra vez la A, hay que recun;r a los teoremas de la probabi~
lidad vistos en el tema 14. Considerando que estos sucesos son inde-
pendientes aplicaremos el teorema del producto para sucesos inde-
pendientes: que nos pe
P(A n A) = P(A) . P(A) = 0,5' 0,5 = 0,25 babilidad
1 VARIABLES ALEATORIAS DISCRETAS (Il): 005 VARIABLES 473

Para la segunda opción reflejada en la tabla ¿Cuanto valdrá la pro-


babilidad de que primero escoja la salida A, luego la B y finalmente
la A?
P(A " B "A} = prAl . P(B} . peA} = 0,5 ·0,5 . 0,5 = 0,125. Porque
son sucesos independientes. Y de la misma fonna para los siguien·
tes casos, cuya tarea dejamos al lector, insistiendo en que tiene que
basarse en los 'mismo principios que hemos indicado en los dos pri-
meros casos. Por tanto:
peA " B " B}= prAl P(B} P(B} = 0,5' 0,5' 0,5 =0,125
P(B " B} = P(B} P(B} = 0.5' 0,5 = 0,25
P(B "A" A} = P(Bl prAl prAl = 0,5' 0,5' 0,5 = 0,125
P(B "A" B) = P(B) prAl P(B} = 0,5' 0.5' 0,5 = 0,125
Hecho est.o, para obtener la función de probabilidad conjunta.
tenemos que obtener cada uno de los valores f(x.y), que se obtienen
de la siguieme forma:
f(O.O) = OEsta situación no aparece en la tabla anterior puesto
que en ningún caso simultáneamente se puede dar la situación de
que X = O e Y = O. Es decir, en ningún caso es posible que la rala no
reciba ninguna bolita de comida y ninguna descarga eJécUica.
¿Se puede dar la situación de que la rata reciba una bola de cami-
ta y ninguna descarga eléctrica?, es decir ¿cuanto vale f(LO)? Bus·
que en la tabla si es posible esta situación y cuanto valdrá. Como esta
situación no aparece en la tabla, su probabilidad es cero. Igualmen-
te ocurre con f(O,I); f(1 ,O); f(1,1). Sin embargo: ¿Cuánto vale la pro·
habilidad de que la rata coma una bola de comida y reciba dos des-
cargas eléctricas? Es decir ¿cuánto vale f{l,2)? Si obsenramos la tabla,
esta situación se produce cuando la rata elige ABE o cuando elige
BAB, CUY,3S probabilidades valen respectivamente 0,125. Entonces:
{(l, 2) = peA "B"B) uP(B "A "B) = 0,125 +0,125 = 0,25
De la misma forma obtenernos los valores de:
f (0,2) = 0,25 cuando la rata elige B y B. esto es P (B n B).
{(2,0) o 0,25 cuando la rata elige AA: P (A "A).
{(2, 1) = 0,125 + 0,125 = 0,25 cuando la rata elige AyByA 6 ByAyA
que nos permita completar la siguiente la tabla que muestra la pro-
babilidad conjunta es:
474 ANÁLISiS DE DATOS E.N PSICOLOGÍA 1 VARIABLES ALE

..
Tobla 17 3' Función de poobobtlidod ..... juta

Y-O Y-I Y-2


X-O O O 0,25
X-l O O 0,25
X-2 0,25 0,25 O

En otras situaciones la función de probabilidad puede estar definida


por una ecuación como la del siguiente ejemplo.

Ejemplo 17.2. En un determinado Centro Escolar se pasa una


prueba de razonamiento abstracto a un grupo de alumnos y alum- •
nas de Educación Primaria. Se definen las variables aleatorias:
X = .sexo del alumno_ que tom3 los valores Opara los niños y 1 para
las niñas y la variable Y = «puntuación obtenida en el test_ con valo-
res comprendidos entre 7 y 11. La función de probabilidad conjun-
ta de estas dos variables viene definida por la siguiente ecuación:

2X+Y
=,:,.:...; X = 0.1; Y = 7,8. 9, 10.11
(x,y) = 100
{
O en otro caso x
Para completar la tabla de la función de probabilidad conjunta
hay que dar valores a X e Y de acuerdo con la ecuación que la defi· La función
ne, lo que nos pennhe rellenar los valoTes de la tabla: cretas cumple 1
ble y desarroll,
Y=7 Y=8 Y=9 Y=IO Y=II
- Para tod(
(0.7) (0,8) (9.9)
valor X, e
X= 1

obteniendo los siguientes valores:

( O 7)= 2X+Y = 2·0+7 =0 07 - La suma


. 100 100 '
conjunta
( O 8) = 2X + Y = 2· O+ 8 =O08
• 100 \00 '

( 09)=2X+Y =20+9=009
, 100 100 ' Antes de pa
dos propiedadE
VARIABLES ALEATORIAS DISCRETAS (TI); DOS VARIABLES 475

2X+Y 2·0+10
(CO,IO) = = =0,10
10O 100
2X+Y 2 ·0+ 1I
{(O,IJ) = = =0,11
100 100
2X+Y 2·1 +7
{(1,7) = = 0,09
100 100
2X+Y 2·1 +8
{(1,8) = = =0,10
100 100
2X+Y 2·1 +9
(O,9) = = = 0,11
100 100
2X+Y 2·1+10
(O,lO) = = =0,12
100 100
2X+Y 2·J+11
{(l,ll) = = = 0,13
, 100 100
Yla tabla de la función de probabilidad conjunta queda:

Y=7 Y=8 Y=9 Y=10 Y= 11


X=O 0,07 0,08 0,09 0,10 0,11
X- 1 009 010 011 012 013

La función de probabilidad conjunta de dos variables aleatorias dis-


cretas cumple las mismas propiedades expuestas para el caso de una vari<l-
ble y desarrolladas en el tema anterior:
- Para todo par de valores, (x;, y¡), la probabilidad de que X tome el
valor x; e Y tome el valor y¡ es siempre mayor o igual que cero:
(Cx"y¡) = P [eX = x,) n (Y =y¡)]
I {ex"y,) , °I
- La suma de Lodas las probabilidades de la función de probabilidad
conjunta es uno:

¿¿((x" Yi) =1
; j

Antes de pasar al siguiente apartado, vamos a comprobar que estas


dos propiedades se cumplen en los dos ejemplos anteriores. De no ser así
476 ANÁUSIS DE DATOS EN PSICOLOGÍA 1 VARl

indicarla que, o bien no se trata de una verdadera función de probabili- de p


dad o que hemos cometido algún error (difícilmente perdonable dados expl
los conocimientos adquiridos hasta el momento) en nuestros cálculos. not(
volvl

Ejemplo 17.3. Comprobar las propiedades anteriores con los


datos del Ejemplo 17.1.
En la tabla de la función de probabilidad que reproducimos a con-
tinuación:

Y~O Y~I Y~2 p


X~O O O 0,25 difel
X~I O O 0,25 carg
lida(
X~2 0,25 0,25 O
las d
vemos, con una simple inspección visual. que las probabilidades reco- cribi
gidas en cada celdilla de la tabla son mayores de cero y otras nulas.
La segunda propiedad requiere sumar las probabilidades recogi-
das en todas las celdillas y comprobar que, efectivamente, suman
uno: I1
o + O + 0,25 + O + O + 0,25 + 0,25 + 0,25 + O = I sin e
obte¡
la te!
ACLARACIÓN: Esta operación la vamos a escribir con más formalidad mate-
mática, que servirá también para familiarizarnos con el símbolo del doble
sumatorio visto en el tema 2.

L L {(x¡, Yi) ~ f(xo, Yo) + f(xo. YI)+ f(xo. y,) + (XI' YO) +
; i y así
la
+{(X¡, y¡)+ {(XI' Y2)+ {(~, Yo)+ {(X2' YI)+ {(X2' h) '"
carg.
=0+0+0,25+0+0+0,25+0,25+0,25+0=1
V
X,ql
Como tarea, dejamos al lector que compruebe por su cuenta que estas nún
dos propiedades se cumplen también en el ejemplo 17.2. XI' ir
tia "r
reali
17,3. FUNCIÓN DE PROBABILIDAD MARCINAL
g
Veremos aquí como a partir de la función de probabilidad conjunta
de dos variables aleatorias discretas, X e Y, se puede obtener la función o lo
lAl VARIABLES ALEATORIAS DISCRETAS (11): DOS VARIABLES 477

ili· de probabilidad de cada una de las variables individualmente. Pa,·a su


los explicación nos serviremos nuevamente del ejemplo de la rata en ellabe~
rinto expuesto en la ejemplo J 7.1, cuya tabla de probabilidad conjunta
volvemos a reproducir a continuación:

Y"O Y"I Y"2


X"O O O 0,25
x" 1 O O 0,25
X"2 0,25 0,25 O

Puede observarse que la rata obtiene una bola de comida (X == I ) bajo


diferemes condiciones: cuando recibe cero descargas (y == O), una des-
carga (Y == 1) Y dos descargas (Y = 2). Por lo que resulta que la probabi-
lidad de que la rata coma una bola de comida, P (X = 1), sin considerar
las descargas que reciba, es O + O + 0,25 = 0.25. Por lo lamo. podemos es-
cribir:
,
g(l) " P(X " 1) " {(I,O) + {(I,n + {(I,2) " ¿ {(x"Y,)
;-0

Igualmente calculamos la probabilidad de que la rata consiga dos bolas


sin considerar las descargas que reciba, es decir, g (2) :: P (X ~ 2) que se
obtendría sumando todas las probabilidades recogidas en las celdillas de
la tercera fila. esto es:
,
g(2) " ¿(x"Y,) " P(X" 2)" (2,0) + (2,1) + (2,2)"
¡..o

:: 0,25 + 0,25 + O = 0.50


Y así sucesivamente, dejando allecto'· que obtenga la probabilidad de que
la rata no obtenga ninguna bola de comida (X = O) sin considerar las des-
cargas e1éctdcas que reciba y compruebe que el resultado es 0,25.
Visto esto podemos definir la función ele probnbilielad margitwl de
X, que se representa por g (x,), como aqueUa función que asigna a todo
número real x/ la probabilidad de que la variable aleatoria X valga
,'ti' incondicionalmente, es decir, sin tener en cuenta la variable alealO·
ria Y. Como se ha visto en el ejemplo se obtiene, en lénninos generales,
realizando la siguiente suma:
g (x,) ~ P (X " x;) " {(x" y,) + {(x" y,) + .. , + {(x" y,l + .. , + {(x" v,)
o lo que es lo mismo:
478 ANÁLISIS DE DATOS EN PSICOLOGíA I VARlABL

, la prob.
dríamo:
g(X)
1 .t.... (X./. YI )
= '<'
¡_l

Esta función de probabilidad marginal aparece al margen de la tabla,


en este caso la última columna de la derecha, que aparece sombreada y Vist(
donde cada valor se ha obtenido sumando los valores de su correspon- deXco
diente fila: de que
variabl(
Y=O y =I Y=2 g (x)
x=o O O 0,25 0,25
X- I O O 0,25 0,25
X=2 0,25 0,25 O 0.50

De fonna similar se definirla la (unción de probabilidad marginal De f(


de Y que para distinguirla de la anterior representaremos por. h (Y/). de 1'; qu

J¡ (Y,) = P IY= y,) = (x"y,) + (x"y,) + ... + (x" y,) + ... + (x"y,)
Por lanto:

r
h(y,) = P(Y = y¡) = I(x"y¡) Esta
,., al inicio
------ descargo
Se sugie¡"e al lector que obtenga por si mismo la función de probabi- segunda
lidad marginal de Y, siguiendo los mimos pasos realizados para obtener que la v
la de X y compruebe sus resultados con los que se muestran en la siguien- probab~
te fila: ble X lO
la vanal
I h (y¡) I 0,25 I 0,25 I 0,50 I
ACLAl
17.-1. 11 \( 10\ DI-. 1'1101\ \1\11.1Il \D (:O\DI( 10\ \1 go al (
quesi
Dentro del contexto que estamos desarrollando, la función de proba- enton
bilidad condicional nos sirve para dar respuesta a preguntas como las
siguientes:
- ¿Cuál es la probabilidad de que la raLa consiga una bola de comida
cuando recibe dos descargas eléctricas?
PaI-a responder recunimos a la función de probabilidad condicional
que se obtiene dividiendo, en cada caso, la probabilidad conjunta entre
:ItA 1 VARIABLES ALEATORiAS mSCRETAS (H): DOS VARlABLES 479

la probabilidad marginal, es decir, para responder a esta pregunta ten·


dJiamos que obtener:

P[(X ~ 1) y (Y ~ 2)]
P(Y ~ 2)
bla,
lay Visto esto, podemos definir la función de Probabilidad condicional
'00- de X como aquella que asigna a todo número real XI la probabilidad
de que la variable aleatoria X valga Xl bajo la condición de que la
variable aleatoria Y haya tomado el valor Yj.

.1 ) _ P(X _ . IY _ .) _ P[(X ~ x;ln(Y ~ YiJJ -


_ '--((,-;.X;-,;,Y,,-i)
g..t.y.-
( -x·_y¡- ,
, , ' p(Y - Yi) h(Yi)

De fOima similal~ definimos la (unción de probabilidad condicional


"al
de y, que escribiéndolo ahora con más detalle es:

h(y./ x) ~ P(Y ~ y IX ~ x) ~ P[(Y ~ Yi)n(X ~ Xi)] ~ ((x;'Yi)


I r I r P(X _ Xi) g(Xi)

Esta expresión daría respuesta a otra pregunta similar a la planteada


al inicio de este epígrafe ¿cuál es la probabilidad de que la rata reciba Yj
descargas eléctricas dado que ha recibido Xi bolas de comida? En esta
.bi· segunda expresión el numerador representa la probabilidad conjunta de
'er que la variable X tome el valor concreto Xi y la variable Y el valor Yj' (la
~o- probabilidad conjunta) y el denomjnador la probabilidad de que la varia~
ble X tome el valor xjcon independencia de los valores que pueda tomar
la variable Y (la probabilidad marginal).

ACLARACiÓN: La función de probabilidad conjunta es un concepto análo·


go al de probabilidad condicionada eSlUdiado en el tema 14, de w.1 forma
que si lo recordamos aquí decía que si dos sucesos A y B son dependientes.
Ja- entonces:
las
P(AnB)=P(A) p(%)
da y también:

P(BnA) = P(Bl-P(%)
lal
:re
480 ANÁUSIS DE DATOS EN PSICOLOGíA 1 VARJAE

de donde la probabilidad de A condicionada a B (o B condicionada a A) es:


no
p(B/) = P(A,-,B)
/ A peA) nin

p(A/)= P(A,-,B)
]B P(B)

De fonna similar, podemos decir ahora. dentro del contexto en el que nos
encontramos de distribuciones de probabilidad conjuntas (o bivariadas), -pe
que:

h(Y;/) = {(XiY;)
IXi g(x¡}

o similannente: la e

por lo que despejando la función de probabilidad condicionada de esta segun-


da expresión:

j X;/)= f(Yj,xi)
5l/ y¡ h(Yj)

Es decir. que la función de probabilidad condicionada se obtiene divi-


diendo para cada celdilla, Sil probabilidad conjunta entre la probabili- y
dad marginal.

Activil

Ejemplo 17.4. Calcular la probabilidad condicional de los valo·


res de X condicionados a Y del ejemplo 17.1. 17,5, n
Tenemos la siguiente Tabla: Igual
que las (
Y=O Y=1 Y=2 g (x) moment
X=O O O 0,25 0,25 ahora va
X-l O O 0,25 0,25 culando
X=2 0,25 0,25 O 0,50 parquer
variable!
h (y) 0,25 0,25 0,50
la variro
cado ve~
VARiABLES ALEATORIAS DlSCRETAS (H): DOS VAR.J..¡\BLES 481

En la primera celdilla debe aparecer la probabilidad de que la rata


no LOme ningún «pellet» bajo la condición de que tampoco reciba
ninguna descarga eléctrica, es decir:

j x=O/ )= P[(X = Oln(y = O)] = (0,0) = _0_ = O


"l /y=o P(Y=Ol h(O) 0,25

Vamos a obtener ahora la probabilidad de que la Tala tome un


.pelet» bajo la condición de que reciba cero descargas:

JYo) = P[(X = 1)f1(Y = O)] = (1,0) = _0_ = O


"\ O P(Y = O) h(O) 0,25

Por último, la probabilidad de que la rata tome dos "pelets" bajo


la condición de que reciba cero descargas, es:

J2/1= P[(X=2)f1(Y=0)] = (2,0) = 0,25 =1


·Vol P(Y = O) h(Ol 0,25

Estos dos valores son los que aparecen en la labIa siguiente:

g (x/y) Y=O Y=) Y=2


x=o O " •• {o
X= ) O O ',í q
X=2 I :l •
y así sucesivamente.

Actividad: Complete el resto de la labIa.

17,5. MOMENTOS
Igual que hicimos con las distribuciones de probabilidad univariadas
que las describíamos mediante una serie de índices que denominamos
momentos (esperanza matemática y varianza, entre los más importantes)
ahora vamos a describir las distribuciones de probabHidad bivariadas cal-
culando una serie de índices que seguiremos denominando momentos,
porque representan los mismos conceptos, solo que referidos ahora a dos
variables aleatori~s. Nos centraremos en dos: la esperanza conjunta y
la varianza conjunta 0, más habitualmente, covarianza y cuyo signifi-
cado veremos en su correspondiente apartado.
482 ANÁLISIS DE DATOS EN PSICOLOGfA 1 VARlABLES

17..). l. 'IUIJH'III(J~ r('~IH'do al ori¡.!('Il: I.a I:~p(' .. allza


Si tenemos dos variables aleatorias discretas, X e Y y su función de
probabilidad conjunta, {(x" y/l. definimos el momento respecto al origen
de orden rs, y que representaremos por ll". como:
Estas e
, , puesta a la
~~ =E[X'Y'] =¿¿(x:y;>f(x"y,) comida qu
¡_ll·¡
ca?, o ¿cUJ
Entre lodos estos momentos que se podrían obtener sin más que dar ratas que r
diferentes valores a r y a s, el más imponanle para nosotros es el de orden descargas 1
I en es cual r = I Ys :o 1 y que recibe el nombre de esperanza matemáti- da?, etc. Pf
ca conjunta de X e Y, que habitualmente se representa por E(xy), y cuya te los sigui
expresión, derivada de la anterior, es:

~;, = E (XY) = n:x,y/(x" y,l 17..).~. \1

El cono
ACLARACIÓN: Puede observarse que para el caso especial de r:: I y s = O para el case
obtenemos la esperanza matemática de X: tas, X e Y,)
momenlOfl
a la esperar
y para el caso de r = OY s "" 1 tenemos la esperan7.3 matemática (o media) respecto de
de Y: es:
~I = IJ>E(Y)

ya estudiados en el tcm¡t 16.

Una variedad que se presenta en las distribuciones b¡va¡-jadas es la


posibilidad de obtener la esperanza de una variable, por ejemplo X, bajo De todo!
cada una de las condiciones de Y, es decil-, para cada uno de los diferen- asignando (
tes valores de Y. Esto nos lleva a definir la esperanz.a condicionada, que uno que se (
como toda esperanza matemática o media es igual a la suma de los prO- una variabh
ductos de los valores de la variable (X o Y) pOr sus respectivas prO- na como ca
babilidades condicionadas, Así, la esperanza de X condicionada a los «sigma_ mil
valol'es de y es: bies X e Y:

y de fOl'ma similar obtendriamos la esperanza de Y condicionada a los Con fine!


diferenles valores de X, aplicando la expresión: sión más ser
ocIA l VARIABLES ALEATORIAS DISCRETAS (JI): DOS VARIABLES 483

6n de 1
dv/)=~Y"h(Y'/)
I L.l/ Ix,X ::; X, I
lrigen
Estas esperanzas condicionadas, o medias condicionadas, darían res-
puesta a las siguientes preguntas ¿cuál es el número medio de bolitas de
comida que lOmarán las ratas que no reciben ninguna descarga eléctri-
ca?, o ¿cuál es el número medio de bolitas de comida que tomarán las
le dar ratas que reciben dos descargas eléctricas?, ¿cuál es el número medio de
::mlen descargas eléctricas que reciben las ratas que comen dos bolitas de comi-
máti· \ da?, etc. Pero lo "eremos con un ejemplo cuando abordemos previamen-
. cuya le los siguientes conceptos.

( 1':"•.').:!. \IIHnentu .. n· .. pl'l·lu a la IIll'tlia: La Ct)\ariallza

El concepto y la definición de estos momentos es similar aJ ofrecido


I para el caso de una \'ariable: Si tenemos dos variables aleatorias discre-
-o
\ r
tas, X e Y, y su función de probabilidad conjunta, (x" Y,), definimos el
momento respecto a la media de orden rs, y que representaremos por Jlt3'
a la esperanza matemática de los productos de las desviaciones de X e Y
ja) respecto de sus medias_ Escrito formalmente, la expresión matemática
es:
l
~" =E[(X - ~.)'(y - ~'>'l =
, ,
( =I I[(x, - ~ ,)'(Y, - ~,)']. ((x, ,Y,)
es la ',,1 ;=1
bajo De todos los posibles momemos que se poddan calcular sin más que
eren· ~signando diferentes valores a 1" y a s, el más importante es el de orden
L, que uno que se obtiene cuando r = 1 Y s = I Y que, por paralelismo al caso de
pro- 1 una variable, se llamaría varianza conjunta. Habitualmente se le desig-
pro· na como covarianza y se representa por cov (XY) o por la letra griega
a los «sigl11~» minúscula y con los subíndices de sus correspondientes val-ia-
bies X e Y:
1
a xy = I I[(x, - ~ ,) .(y;- ~,.)J -(x"y,)
i=l ¡"'¡

l Con fines prácticos y aplicados, para su cálculo se utiliza otra expre-


a los
sión más sencilla que se deriva de la anterior:
484 ANÁLISIS DE OATOS EN PSICOLOG(A I VARlABLESA

~;, o ">yo E [XY]-E[X] E[Y] ]


depende de
cualquier vo

es decir, si se intenta "leer" la fórmula, dice que la covarianza es igual


a la esperanza conjunta (la media conjunta) menos el producto de Esto hac
las esperanzas (el producto de las medias). te la compa
rentes. Para
ACLARACiÓN: Conviene detenerse un momento para razonar que si en la
ción, que S<
primera expresión general que se ha escrilo de los momentos respecto a la desviacione
media, hacemos que r = 2 Ys == O tendremos la varianza de X, ya estudiada una expresj·
en c1leron 16:

)' de esta expresión se deriva matemáticamente, la que se utiliza más habi- De la cu.
tualmente y vimos en el lema anterior. de la correb

y de ronna similar. si hacemos que r = OYs = 2 tendremos la \'arianza de Y:

• AClARAC
"02 oa; oE[(X-",)o(y-",)']o ,.,
2)(y,-",)'J.{(y,) tación qUl
10con má
car, entre (
de: b que se den,';)., la ulilizada habilUalmente con nnes práclicos:
- Lacom
aJ. o E(Y')-[E(Y)]' dades di
paraciór
variable!
Por tanto, nos encontramos con que en cualquier distlibución de pro~ - Toma
habilidad bivariada podemos calcular: -1 y +1
revelan (
- Las esperanzas matemáticas, o medias, de X e Y individualmente, (o dismi
relación
- sus esperanzas condicionadas, ye) la va:
- sus varianzas y - SI dos v
ción es 1
- el nuevo índice Que hemos viSIO ahora de la covarianza, cuyo térmi-
mos afi
no nos resulta familiar debido a que ya se ha estudiado aplicado a bies. pel
dos variables estadísticas. tipo de r
Recordacdo lo que se dijo allí, la covarianza es un índice que cuanti-
rica la intensidad y el sentido de la vatiación conjunta entre dos vaI;ables. Y ahora
Con sunciellle detalle se ilustró en ese tema que la cuantía de este índice do varias ve
Al VARJABLES ALEATORiAS DISCRETAS (11): DOS VARIABLES 485

depende de la unidad de medida de las variables, por)o que puede tomar


cualquier valor, positivo o negativo:

,al
de Esto hace que sea un índice de difícil imerprelación y que no permi-
te la comparación con la covarianza obtenida con olras variables dife-
rentes. Para paliar esta dificultad recun;mos al coeficiente de correla-
ción, que se obtiene dividiendo la covarianza entre el producto de las
desviaciones típicas de las variables. Si escribimos la frase anterior con
una expresión _sin palabras»:

De la cual, a su vez, se deduce que la covarianza es igual al producID


de la correlación por las respectivas desviaciones típicas de las variables:

0 .... = P.n- . O... 0,

ACLARACiÓN: La correlación tiene las mismas propiedades e interpre-


tación que el coeficiente de correlación de Pearson, estudiado en el tema
10 con más detalle, y al cual debeliamos regresar un momento, para refres-
car, entre otras cosas que:
- La correlación entre dos variables aleatorias no depende de las uni·
dades de medida. Es un número adimensional. Como tal pennite la com-
paración entre las correlaciones que presentan diferentes conjuntos de
vadables.
'0- - Toma siempre valores positivos, negativos o nulo comprendidos entre
-1 y + 1. Valores cercanos a + 1 indican una fuene relación positiva, que
revelan que a medida que aumenta (o disminuye) la va¡;able X, aumenta
(o disminuye) la val"iable Y. Valores cercanos a -1 expresan una fuel1e
relación negativa que manifiesta que a medida que aumenta (o disminu-
ye) la val-iable X, disminuye (o aumenta) la val"iable Y.
- Si dos variables aleatorias son independientes, entonces su correla-
ción es cero, pero la inversa no es cierta. Si la correlación es cero, pode-
ni-
mos afi.-nlar que no existe relación o dependencia lineal entre las varia-
la
bles, pero esto no garantiza la independencia porque puede darse otro
tipo de relación o dependencia no lineal entre las valiables.
lti-
es. y ahora que hablarnos de independencia, concepto que hemos trata·
.ce do varias veces a lo largo de este texto, tamo para la relación entre dos
486 ANÁLISIS DE DATOS EN PSICOLOGIA I VARIABLES ALE)

variables aleatorias como al presentar la dependencia e independencia de Si dos varia


sucesos, vamos a explicarlo para dos va¡;ables aleatorias discretas. pero se cumple, resl
antes vamos a ver un ejemplo que muestra las ventajas de conocer como
se obtiene la esperanza y varianza de la suma de variables.
En esta situ
dad y el semidl
17.1>. I'IIFI'I\IIF\("I\ F\TI\F \ \1\1\111 FS \U.\TOI\I\S
IIISCI\F-nS
Ejemplo
Recordando el mismo ejemplo de las ratas ¿podríamos decir que el a obtener t
número de bolas de comida que consigue la rata depende del número de too A saber.
descargas eléctricas que recibe? o viceversa ¿el número de descargas eléc· al La
t1;cas que recibe la rolla depende del número de bolas de comida? Lo ana-
Iizal"emos en este apal1ado. bl La '-al"
el La esp
di La esp
ACLARACIÓN: Recordemos que en el tema 14 se eSludiaron lo que eran los el La COY
sucesos indcpcndicnles y se expuso que dos sucesos. A y B. son indepen-
dientes cuando la probabilidad de aparición de uno de ellos no dependía de La es
la aparición del otro y se cumplía enlonces que: en el tema t
P(4 nB) =P(4) ·P(B) X, que son
pondeo a las
Ylambién

p(%)=P(4) o p(%)=P(B) y su varian

L.'1 misma idea y definición (pues se trata del mismo concepto) se aplica en
el caso de do~ variables aleatorias. donde E (x')
lo mismo
Decimos que dos variables aleatorias son independientes cuando es:
la probabilidad de aparición de los valores de X no depende de la
aparición de los valores de Y. O dicho más formalmente: dadas dos
variables aleatorias, X e Y. con su función de probabilidad conjunta,
(Xi' Yi)' Y sus funciones de probabilidad marginales, g (x;) y J¡ (J'¡), res- donde E (Y'
pectivamente. decimos que X e Y son independientes si:
el que se ha
r (x" Y,l = g (x,l . It (Y,) --l masque u
cidir neee

Si dos variables X e Y son independientes su covatianza vale cero. pero


esto no es necesaliamenle ciel10 a la inversa, como ya se ha señalado paro E
la correlación.
VARIABLES ALEATORIAS DISCRETAS (TI): DOS VARIABLES 487

Si dos variables son dependientes, entonces la condición anterior no


se cumple, resultando que:
f (x" Yi) ~ g (x,) , h (y,l
En esta situación su coeficiente de correlación nos indica la intensi-
dad y el sentido de la relación entre ambas variables.

Ejemplo 17.5. Utilizando el mismo experimento de la rata, vamos


a obtener todos los momentos que hemos estudiado hasla el momen-
to. A saber:
a) La esperanza de X y de Y
b) LavarianzadeXydeY
e) La esperanza conjunta.
d) La esperanza de X condicionada a Y =0.
e) La covarianza y el coeficiente de correlación.
La esperanza de X se obtiene de la misma forma que se expuso
en el tema 16. Para ello, solo hay que considerar los valores que toma
X, que son O, 1 Y 2 Y sus probabilidades que, en este caso, corres-
ponden a las probabilidades marginales de X. Por tanto:
E (XF~ x' g (x) = 1 ,0,25 + 2 ,0,5 = 1,25
y su varianza es:
o; = E (X') - [E (X)]' = 2,25 - 1,25' = 0,6875
donde E (X') = ~x' , f (x) = 2,25
lo mismo para obtener la esperanza matemática y varianza de Y que
es:
E (Y) = ~y ,h (y) = 1 ,0,25 + 2 ,0,5 = 1.25
\
o; = E (y') - [E (Y)]' = 2,25 - 1,25' = 0,6875
donde E (y') =~y', f(y) =2,25
el que se haya obtenido la misma media para las dos variables no es
mas que una simple casualidad, pero en ningún caso tienen que coin·
cidir necesariamente.
La'esp~ranza conjunta, E(XY), vale:
E (XY) = lxy , f (x, y) = 1 ' 2 ' 0,25 + 2 ' 1 ' 0,5 = 1,5
-'
488 ANÁLISIS DE DATOS EN PSICOLOGÍA I VARIABLES AL

- La vari~
la esperanza de X condicionada a Y = Ocorresponde al prome- si tenerr
dio de bolas de comida que tomarán las ralas que reciben cero des- varianz;
cargas eléctricas. Para Su cálculo utilizaremos las probabilidades de tal de (
X condicionadas a Y=O que hemos obtenido en el ejemplo 17.4: menos)

~~ = y,) = De¡ {X)= 00+ 10+21 =2


y simila
Para calcular la covarianza aplicaremos la expresión:
cov (Xl') = E (Xl') -E (X). E (Y) = 1- 1,25· 1,25 =
= 1 - 1,5625 = -0,5625
¿Cómo ql
Y la correlación entre las variables es: dientes? Tóm
el ejercicio di
= 0 ...., _ -0.5625 =-0818
Pn - , / •
a.. -o.v ~O.6875· ,0.6875
Ejempl
que indica que existe una relación inversa bastante fuerte entre
la rata en
las bolas de comida que consigue la rata y las descargas que recibe.
medias, \
de tal fonna que cuantas mas bolas consigue menos descargas reci-
ra una nu
be y viceversa. cuantas menos bolas de comida consigue mas des·
ro de refu
cargas recibe.
varianza df:
La nue"
Conocidas las propiedades de la esperanza y de la varianza ya estu- la suma de
diadas en el tema 16, vamos a añadir una propiedad muy utilizada y útil, descargas
como tendremos 0p0l1unidad de ver en un ejemplo, que es la propiedad to,siZ",X
aditiva de variables aleatorias discretas. Esta propiedad nos permite
obtener" fácilmente:
y su varian
- La esperan7..a matemática de la suma o la resta de dos variables alea-
LOrias, de la siguiente fonna: Var (X + Y)

E (X + Y) = E (X) + E (Y)
De no apli
y de forma similar: este caso no e
de probabilid
E (X - Y) = E (X) - E (Y) ] esta nueva di!
procedimientl
y lo mismo, no solo para dos va¡;ables aleatorias sino para n varia· Reproduci
bies. Esta propiedad dice que la esperanza de una suma (o resta) una nueva co,
de variables es igual a la suma (o resta) de sus esperanzas. ble Z como sI!
LOGiA 1 VARIABLES ALEATORIAS DISCRETAS (11): DOS VARIABLES 489
- La varianza de la suma de dos variables aleatolias discretas dice que
me- si tenemos dos variables aleatorias, X e y, con sus respectivas medias,
des- varianzas y covarianzas, entonces, la varianza de la suma (o res-
'" de ta) de dos variables es igual a la suma de las varianzas más (o
menos) dos veces la covarianza:

li(¡r (X + Y) == a; + a; + 2 . an ·

y similarmente:

Vur (X - Y) =: a; + a; - 2 . a..,.
¿Cómo quedaría esta propiedad aplicada a dos variables indepen-
dientes? Tómese unos segundos antes de responder y mire la solución en
e! ejercicio de aUlOcomprobaci6n n° 6 al final de este tema.

Ejemplo 17.6. Con referencia al ejemplo 17.1 de! experimento de


entre la rata en el laberinto donde anteriormente se han calculado las
~ibe, medjas, varianzas y covarianzas de las dos variables, definimos aho-
reci- ra una nueva variable aleatoria Z que vamos a definir como e! cnúme-
des- ro de refuerzos que recibe la rata_o Y calcularemos la esperanza y
varianza de esta nueva variable aleatoria Z.
La nueva variable Z cnúmero de refuerzos que recibe la rata_ es
la suma de X =: «número de bolas de comida_ mas Y = _número de
ya estu-
descargas eléctricas_ que recibe]a rata en el experimento. Por tan-
::la y útil,
to, si Z = X + Y entonces, aplicando las propiedades anteriores:
lpiedad
permite E (X + Y) • E (X) + E (Y) • 1,25 + 1,25 • 2,5
y su varianza vale:
,les alea-
Vay (X + Y) =a: + a: +2 . a" =0.6875 + 0.6875 - 2· (-0.5625) = 0,25

De no aplicar esta propiedad ¿cómo obtendríamos estos valores? En


este caso no quedaría más opción que conslIuir su tabla de distribución
de probabilidad de la nueva variable Z y calcular la media y varianza de
esta llueva distlibución univaliada tal y como se explicó en el lema 16. El
procedimiento seda el siguiente:
n varia-
:l Reproducimos a continuación la tabla del pdmer ejemplo incluyendo
(o resta) una nueva columna que representa los valores que toma la nueva varia~
nas. blc Z como suma de X mas y:
490 ANÁLISIS DE DATOS EN PSICOLOGÍA I VARlABL

Espacio Mueslral X Y P Z
AA 2 O 0,25 2 A es.
ABA 2 1 0,125 3 conteste:
ABB 1 2 0,125 3 bies X e
BB O 2 0,25 2 mos qut
BAA 2 1 0,125 3 sombre.a
BAB 1 2 0,125 3 ducir a (

Construimos la función de probabilidad de Z que, como vemos solo


toma los valores 2 y 3. Para la obtención de las probabilidades asociadas
a la vadable Z se observa que toma el valor 2 cuando X vale 2 e Y vale 0,
o cuando X vale Oe Y vale 2, cada una de ellas con una probabilidad de
0,25 por lo que su suma es 0.50. De forma similar, Z vale 3 cuando:
X=2 e Y= I en dos ocasiones POrql
X= I e Y= 2 en dos ocasiones que X es
cada una de ellas con una probabilidad de O. t 25 por lo que su suma es o igual q
0,125 + 0,125 + 0,125 + 0,125 = 0.5. Con estos datos. la tabla de la función
de probabilidad de esta variable Z es:
De ro
z f(z) z· (z> z'· (z)
2 0,5 1 2
3 0,5 1.5 4,5 es decir,
comida)
2,5 6,5 las sigui«
en la que las dos últimas columnas representan las operaciones necesa-
.ias para obtener la esperanza y varianza que se muestran a continuación:
E(Z)=LZ·(z)=2·0,5+3·0,5= 1 + 1,5=2.5
cr;
= E (Z') - [E (Z)]' = 6,5 - 2.5' = 0.25
siendo:
E (Z') = LZ'· (z) = 2'.0,5 + 3'·0.5 = 2 + 4.5 = 6.5 que son I
igual a c~
lleg:'lIldo, lógicamente, al mismo resultado que el obtenido aplicando la
propiedad aditivn, aunque ahora de forma mucho más laboriosa. Iguah

17.7. 11 \( I('l\ DI DIS'llIlIIl ("lO" CO\.Il "n


¿Cuál es la probabilidad de que la rata oblenga dos o menos bolas de
comida y reciba una o menos descargas?, es decir, esclibiéndolo en len-
guaje malemático y representándolo por F(2, 1), la pregunta es:
VARIABLES ALEATORIAS DISCRETAS (TI): DOS VARIABLES 491

F (2, 1) = P [(X < 2) y (Y < 1)]


A esta pregunta y otras similares en otros experimentos aleatorios se
contesta obteniendo la función de distribución conjunta de dos varia-
bles X e Y, que la representaremos por F(x¡,Yj), y para su cálculo tendría-
mos que sumar todas las probabilidades que mostramos en las celdillas
sombreadas de su función de probabilidad conjunta que volvemos a repro-
ducir a continuación:

YI = O Y2 = I Y3 -= 2
XI = O O O 0,25
Xl = 1 O O 0,25
Xl = 2 0,25 0,25 O

Porque en esas celdillas, y no en las otras, se cumple la condición de


que X es menor o igual que 2 y, simultáneamente, la variable Y es menor
o igual que uno. Por tanto:
F (2, 1) = P [(X < 2) y (Y < 1)] = 0,50
De forma similar, para calcular:
F (0,2) = P [(X < O) y (Y < 2)J = 0,25
es decir, la probabilidad de que la rata consiga cero o menos bolas de
comida y reciba dos o menos descargas eléctricas, tendríamos que sumar
las siguientes probabilidades que aparecen sombreadas:

, YI = O Y2 = 1 Yl = 2
Xl = O O O 0,25
Xl = I O O 0,25
Xl = 2 0,25 0,25 O

que son las únicas que cumplen con la condición de que X es menor o
igual a cero y la variable Y es menor o igual que dos.
Igualmente, las celdillas sombreadas a continuación que suman cero:

YI = O Y2 = 1 Y3 = 2
XI = O O O 0,25
X2 = 1 O O 0,25
Xl = 2 0,25 0,25 O
492 ANÁUSIS DE DATOS EN PSICOLÜGlA 1 VARIABLES

representan la probabilidad de que la rata consiga una o menos bolas de F(I,I) = P


comida y. simultáneamente, reciba una o menos descargas eléctricas, que
lo escl'ibimos de la siguiente forma:
+((LO) +
F(I, 1)=P[(XS l)y(YS 1)J=O F(I,2) =P
Por tanto, por lo que hemos hecho en estos casos, la función de dis-
tribución conjunta se define como una función que asigna a todo par + ((I,O) +
de números (xuYj) la probabilidad de que conjuntamente la variable F(2,2) =¡
aleatoria X sea menor o igual que X¡ y, simultáneamente, Y sea menor
o igual que Yj' Es decir:
{(0,2) + (I

; i =0+0+0
F(x;,y¡) = P[(X S x;)n(y S Y¡)] = LL{(x;,y¡)
,,
ACLARAC
Los valores obtenidos se representan en una tabla de doble entrada, tribución,
que reEelido a nuestro ejemplo, es la siguiente: porque re

YI=O Y2"" 1 Y3=2


xl=O F(OO)=O F(OI)=O F(02)=0,25 En la la'
X2= 1 F(IO)=O F(I1)=O F(I2)=0,SO representa i
x 3 =2 F(20)=0,25 F(21)=0,50 F(22)= 1 lIa que asig¡
sea menor (
Estos valores, los hemos obtenido haciendo las sumas que se han expli- Es el mi:
cado, y de la siguienle forma:

o o
F(O,O) = P[(X S O)n(y S O)] = L L{(x;,y¡) = ((O,O) =
i i
°
F(I,O) = P[(X S I)n(y S O)] = L L(x;,y¡) = (0,0) + (1,0) =
i i
° °
+0 = LosValOl
gen derecho
F(2,0) = P[(X S 2)n(y S O)] = LL{(x;,y¡) = {(O,O) + ((1,0) + ((2,0) = De formó
i j
Y, H(y;l.
=0+0+0,25=0,25
,
F(O,I) = P(X S Oln(y SI)] = L L{(x;,y¡) = {(O,O) + ((O,I) =
i i
°°°
+ =

F(0,2) = P[(X S O)n(y S 2)] = LL{(x;,y;) = {(O,O) + (0,1) + {(0,2) =


; i Los valor
°°
= + + 0,25 = 0,25 gen inferior,
VARIABLES ALEATORIAS OTSCRETAS (TI): DOS VARIABLES 493

F(I,I) = P[(X 51)n(y 51)] = IIf(x¡,y¡) = f(O,O) + f(O, 1) +


; i
+{(l,O) + ((l,1) = O+ O+0 + O = O
F(I,2) =P[(X 5l)n(y 5 2)] = IIf(x¡,y¡) =f(O,O) + f(O, 1) + f(0,2) +
i j

+f(l,O) + {(l,n + f(!,2) = O+ O+0,25 +0 + O+0,25 = 0,50


F(2,2) = P[(X 5 2)n(y 5 2)] = IIf(x¡,y¡) = f(O,O) + f(O,I)+
i i
f(0,2) + f(l,O) + f(l,!) + f(l,2) + f(2,2) =
=0+ 0+ 0,25 +0 + O+ 0,25+ 0,25+ 0,25 '= t

ACLARACiÓN: Es importante observar que al obtener esta función de dis-


tribución, acumulando las probabilidades, la última celdilla tiene que ser 1
porque representa la probabilidad del suceso seguro.

En la tabla de la página siguiente, la última columna de la derecha


representa la Función de distribución marginal de X, G(x¡), y es aque-
lla que asigna a todo número real Xi la probabilidad de que la variable X
sea menor o igual que Xi sin tener en cuenta Y.
Es el mismo concepto tratado para una variable.

¡
G(x¡) = P(X 5 Xi) =Ig(x¡)
,
Los valores de esta columna se incluyen en una nueva columna al mar-
gen derecho de la tabla que se muestra sombreada.
De forma similar se define la Funci6n de distribución marginal de
, y, H(y¡).

¡
H(y¡) = P(Y 5 y¡) = I¡,(y¡)
,
Los valores de esta última fila se incluyen en una nueva fija en el mar-
gen inferior, de la siguiente forma:
494 ANÁLISIS DE DATOS EN PSICOLOGIA 1 VARIABLE:

y/=O y,=! Y3=2 G(.,) dislribuci


la de dos
x1=O F(O,O)=O F(O,I)=O F(O,Z)=0,Z5 0,Z5
pero reCQ
xI = J F(I,O)=O F(!.I)=O F(I,Z)=0,50 0,50 lo que ju~
x3=2 F(Z,0)=0,Z5 F(Z, I )=0,50 F(Z,Z)=I I este punt.
H(y,) ma una n
° Z5 0,50 I

Estas funciones de dislJibución margjnaJes nos dan respuestas a pre-


riada, y-:::
varianza
guntas como la siguientes: ¿Cuánto vale la probabilidad de que la rata Los e}
reciba una o menos descargas eléctricas sin tener en cuenta el número de prender e!
bolas de comida que consiga?, o ¿cuánto vale la probabilidad de que la
rata consiga una o menos bolas de comida sin considerar el número de
descargas que reciba?
A la primera pregunta se contesta calculando H (1) que vale 0,50 y a
la segunda calculando G (2) =P (X:5 2) = 0.50. El que hayamos obtenido
el mismo resultado, es una simple casualidad del ejercicio. porque no tie~ En un
Tcond~
oe que ser necesariamente así.
A recibe 1
una pequ
do dos Ve!
I;,a, III."l \11.'\ rumos do

Los mismos conceptos que se han tratado en los temas 15 y 16 para X: núl
una dist¡;buci6n de probabilidad univariada se han extendido al caso de Y: nÚI
dos variables que confonnan lo que se denomina también función de pro-
babilidad bivariada. En este tema hemos visto la función de probabilidad Obter
de dos variables aleatorias discretas presentando. en una tabla o median.
te una ecuación matemática, su función de probabilidad. las propiedades
que debe cumplir -que son las mismas que las que debe cumplir la fun.
ción de una vaTiable- sus momentos más repl'esentativos: la media o espe-
nm:t...:'\ matemática de la distJibuci6n conjunta y la covarianza, que es una
medida de la asociación entre las variables. Se ha comentado que por sus
dificultades interpretativas, es habitual recUlTir a la correlación, como
medida de asociación, que es un número comprendido entre -1 y + I sin QJ Par
unidad de medida. lo que facilita su interpl"etación y pennite la compa- (pe¡
ración entre la relación de diferentes variables. Esle concepto, junIo con
a) I
la esperanza condicionada y las distribuciones de probabilidad condi-
cionadas. son las principales diferencias añadidas en este tema respecto b) 1
al antel;or de una vaTiable, pero conceptualmente, la con'elación y la cava· e) 1
rianza entre variables estadisticas y entre variables aleatorias es lo mis-
mo. Se ha descrito también como se obtiene la esperam..a y varianza de
una suma o resta de va¡;ables. Este concepto, por hacer referencia a una
1 VARIABLES ALEATORIAS DISCRETAS (n): DOS VARIABLES 495

distribución de probabilidad univariada (que se obtiene por suma o res-


ta de dos) debería haberse incluido. quizás, en el tema de una variable,
pero recordará que en su tratamiento incluye el concepto de covarianza,
lo que justifica su inclusión en este tema. Conviene que reflexione sobre
este punto, porque una variable Z suma (o resta) de otras dos (X e Y) for-
ma una nueva distribución de probabilidad univariada pero nunca biva-
riada. y como lal pel"mite su descripción mediante su esperanza de Z,
valianza de Z, pero nunca la covarianza de Z.

Los ejemplos desarrollados a lo largo del tema deben ayudarle a com-


prender estos conceplOs.

1-.'). 1.11 I\el( I()~

En un experimento se coloca a una rala en un laberinto en forma de


T con dos posibles salidas equiprobables. A y B. Cada vez que se sitúa en
A recibe un tlpelet_ (bolita de comida) y cada vez que lo hace en B recibe
una pequeña descarga. El expel;mento termina cuando la rata se ha situa-
do dos veces en un mismo lado dellahe,;nto. En este experimento. defi-
nimos dos variables aleatorias. X e y, de la siguiente manera:
X: número de pelets que recibe la rata
,
1
Y: número de descargas eléctricas que recibe la rata
Obteniéndose la siguiente tabla de probabilidad conjunta:

Y·O Y.I Y.2


X.O O O 0.25
X·l O O 0.25
X· 2 0.25 0.25 O

Para obtener la probabilidad de que la rata no consiga ninguna bola


(pelet) de comida, tenemos que calcular:
a) La función de probabilidad marginal: g (O) =p (X =O)
) b) La función de probabilidad conjunta: (O. O) = p (X = O)
e) La función de probabilidad condicionada:

,
ANÁLISIS DE DATOS EN PSICOLOGíA I VARiABLES ALEATI
496
La probabilidad de que la rata no consiga ninguna bola de comida.
e) La esper
vale:
a) g (O) = P (X = O) = 0,25
b) G (O) = P (X < O) = 0,25
m la \'arian~
pendientes

e) g(%) = p(x = ~ = O) = 0,25 a) La resta


b) La suma
La probabilidad de que la ..ata lome una bola de comida dado que c) La suma
ha recibido una descarga eléctrica, se obtiene calculando:
[TI La probabú
a) La función de pmbabilidad conjunta:f(l; 1) = P[(X = 1) l' (Y = 1)] da y no rec:
b) La función de probabilidad condicionada: a) La espero
,,(x =/.v1/ = 1) = P[(X = I)n(y
P(Y = 1)
=1)] = ((1,1)
,,(1)
b) La fund
e) La funci
En un deterr
e) La función de probabilidad condicionada:
miento abstrael
J" = 1/ ) = P[(X = I)n(y = 1)] = ((1,1) mana. Se definel
"\ /x=1 P(=I) g(l) los valores Opar
ción obtenida er
[TI La probabiJidad de que la rata reciba una descarga eléctrica habien. ció" de probabL
do conseguido una bola de comida, se obtiene calculando: la siguiente eeu¿

ai La (unción de probabilidad conjunta;((I; l) = P[(X = 1) l' (Y = 1)]


b) La función de probabilidad condicionada:
,,(x = i/
/y = 1
)= P[(X =l)n(y -1» = ((1,1)
P(Y = 1) ),(1)
que oligina I
e) La [unción de probabilidad condicionada:

Jy=l/ )= p[(x=l)n(Y=I» = (1,1)


r:;;
6\ /x = 1 P(= 1) g(l)

El promedio de descargas eléctricas que recibirán las ralas que han


lE
La probabi
conseguido una bola de comida se obtiene calculando:
de 10 es:
a) La función de probabilidad condicionada:
a) 0,2
V = 1/ ) = P[(X = I)n(y =1» = ((1,1) b) 0,09
g( /x=1 P(=I) g(1) e} 0.155

b) La esperanza condicionada: E(% = 1) = I:y,. ~-'X)


m La puntua
a) 4,15
VARIABLES ALEATORIAS DISCRETAS (IJ): DOS VARIABLES 497

e) La esperanza condicionada: E(-){. = 1) =:Ex¡. ~)()


La varianza de la suma de dos variables aleatorias discretas ¡nde·
pendientes es igual a:
a) La resta de las varianzas mas dos veces la covarianza.
b) La suma de las varianzas menos dos veces la covarianza.
e) La suma de las varianzas.
La probabilidad de que la rata consiga dos o menos bolas de comi·
da y no reciba ninguna descarga eléctrica se obtiene calculando:
a) La esperanza condicionada de X '" 2 condicionada a que Y es cero.
b) La función de disuibución conjunta' F (2, O) = p [(x S 2) Y (Y S O)]
e) La función de disuibución marginal, G (2) = p (X S 2)
En un determinado Centro Escolar se pasa una prueba de razona-
miento abstracto a un grupo de alumnos y alumnas de Educación Pri-
maria. Se definen las variables aleatorias: X '" .sexo del alumno. que toma
los valores O para los niños y 1 para las niñas y la variable Y '" .puntua-
ción obtenida en el test» con valores comprendidos entre 7 y 11. La fun-
ción de probabilidad conjunta de estas dos variables viene deEinida por
la siguiente ecuación:

2X+Y
; X = 0,1; Y = 7, 8, 9, lO, 11
f (x,y) = { 100
O en otro caso

que origina la siguiente tabla de probabilidad conjunta:

Y=7 Y=8 Y=9 Y = 10 Y = 11


x=o 0,07 0,08 0,09 0,10 0,11
X=I 0,09 0,10 0,11 0,12 0,13

La probabilidad de que los niños obtengan en el test una puntuación


de lOes:
a) 0,2
b) 0,09
e) 0.155

o La puntuación media en el test de los niños es:


a) 4,15
498 ANÁLISIS DE DATOS EN PSICOLOG(A 1 VARIABLES ALEAr

b) 9,2 El resto de
e) 20,25

La probabilidad de que estos alumnos obtengan 9 puntos o menos ¡,(Ji) =


es:
a) 0,45
b) 0,5
¡,(%) =
e) 0,54
¡,(X) =
1"7.111. SOI.l UO'\I:S \ LOS LJLHClUOS que se reco

a La solución COITccta es la a, donde P(X=O) nos proporciona la pro-


babilidad de que la variable aleatoria X lome el valor O con inde-
pendencia de los valores que lome Y. Por tanto. en una función de
¡

probabilidad conjunta, la expresión P(X=O) corresponde a la fun-


ción de probabilidad marginal.
Por otra parte, la altemativa b está mal escrita ya que la función de
EslOS \'alor
probabilidad conjunta f(O,O) cOITesponde a la probabilidad de que
función de
la variable X tome el valor Oy. simultáneamente, la variable Y lome
des, aplicar
el valor O. y se representa de la siguiente forma:
(0, O) = P [(X = O) Y (Y = O))

D De acuerdo con la explicación anterior, la aliernativa correcta es la


a, donde:
es la que se
,
g(O) = P(X = O) = (0,0) + «0,1) + (0,2) = I (x,y,) =
1"'0

0+0+0,25=0,25
La alternativa b se refiere más concretamente a la función de dis-
tribución de probabilidad que es un concepto difel"enlc aunque se

11
obtuviese el mismo valor numérico.
La alternativa correcta es la b. Considerando las definiciones que
a La a!ternali
conseguido
de que redl
hemos dado a las variables X e y, en esta situación la condición es
que la rata ha recibido una descarga eléctlica, y lo que buscamos es
que, bajo esn condición cuál es la probabilidad de que la vnl"iable X 11 dicionada
La respuest
d
tome el valor 1. Esta probabilidad vale: condición d

¡,( 1/) = P[(X = I)n(y = 1)] =((1,1) = _0_ =° 11 La expresi6


~ "Y=I) ~) 0,25
VARIABLES ALEATORIAS DISCRETAS (IJ): DOS VARIABLES 499
El resto de los valores son:

h(O/) = f(O,l) = _0_ = ° h(721/) = f(l,I) = 0,25 = °5


11 h(l) 0,25 h(2) 0,50 '

h(O/) = f(0,2) = 0,25 = 05 h(2/) = f(2,l) = 0,25 =I


12 h(2) 0,50 ' 71 h(l) 0,25

h(X)1 = f(U)
h(l)
=_0 =°
0,25
h(2/) = f(2,l)
72 h(2)
=_0_ =
0,50
°
que se recogen en la tabla siguiente:

h (x/y) y=o Y=! Y=2


X=O h (011) = O h (0/2) = 0,5
X=1 ° h(1I1)=0 h (112) = 0,5
X=2 °1 h (VI) = 1 h (V2) = °
Estos valores no son los mismos que los que se obtendrían para la
función de probabilidad de y condicionada a X cuyas probabilida-
des, aplicando la expresión:

es la que se recoge en la siguiente tabla:

h (x/y) Y=O Y=l Y=2


X=
X=l
° ° ° 1
1
X=2 ° 0,5 0,5 °
°
a La alternativa correcta es la c, ya que la condición es que la rata ha
conseguido una bola de comida y queremos obtener la probabilidad
de que reciba una descarga eléctrica, (Y=l) .

• La respuesta COlTecta es la b, y se obtiene mediante ta esperanza con-


dicionada de los valores de Y: nLimero de descargas eléctricas, en la
condición de que la rata consigue una bola de comida.

111 La expresión generalVarde(Xla+varianza de una suma de variables es:


Y) cr; + cr; + 2 . cr.ry
=
500 ANÁLISIS DE DATOS EN PSICOLOGfA I VARIABLES ALE

donde la covarianza es igual a la con-eJación por el producto de las


desviaciones típicas. Por tanto, también lo podemos escribir de J¡).
siguiente fOlma:
g(ylx)
l' l'
Vay ( X + Y) = <JI + a,- + 2 . 0.n = (JI + o; + 2 . r:n' . <JI • O, v. g(ylx)
Si las variables son independientes entonces lanto su covarianz<l
como la cOlTelación lineal entre ambas es cero, por lo que las expre- Por lo ql
siones anteriores quedan:
Va" (X + Y) = a; + a,!
que indica que la varianza de una suma de dos variables aleatorias
discretas independientes es igual a la suma de sus varianzas. De igual
forma se deduce que la varianza de fa diferencia entre dos variables La altcrn
aleatorias discretas illdepelldiel1/es es igual a la SUI1IO de S/lS variall~ de distril
zas: que \ y'I

Var (X - Y) = o; + o; - 2 . 0t,
Si la covarianza es cero, entonces: Var (X - Y) ~ o; + o,:
La alternativa correcta es la c.

• La alternativa correcta es la b. Considerando que X representa el


número de bolas de comida e Y el número de descargas eléctricas.
si intentamos expresar sin palabras el enunciado de esta pregunta.
tendríamos que escribir: P [(X ~ 2) Y (Y ~ O)], expresión que corres-
ponde a la función de distribución de probabilidad conjunta de las
va¡;ables X e V, que también se representa por F(2,0).

11 dicionélda
La ahem:lliva con'CCta es la c. donde se obtiene la probabilidad con-
de que Y 7 bajo la condición de ser niño. y vale:
=

¡,(Y = 71 ) = P[(Y = 7) Y (X = O)] = ((0,7) = 0.07 = 0155


Ix =O P(X =O) g(O) 0.45 '

11 las
La alternativ<l correcta es la b, que se obtiene calculando primero
probabilidades condicionadas de los niños. Estas son las que
resultan de aplicar la siguiente exp.-esi6n:

p(Y = y'¡ ) = (eO,y,) = (eO,y,)


Ix = O g(O) 0,45

para cada uno de los valores de y que se muestran en la segunda fila


de la siguiente tabla:
VARIABLES ALEATORIAS DISCRETAS (TI): DOS VARIABLES 501

Y=7 Y=8 Y=9 Y=IO Y=!1 G(x)


X=O 0,Q7 0,08 0,09 . 0,10 0,11 0.45
g(y/x) 0,155 0,177 0,2 0,222 0,244
y. g(y/x) 1,085 1,416 1,8 2,22 2,684 9,2

Por lo que la media condicional, es:

E(%=O)=LY¡{YX=O)=
= 1.085 + 1.416 + 1.8 + 2.22 + 2.684 = 9.2
La alternativa correcta es la c. que se obtiene al calcuJar la función
de distribución conjunta o probabilidad de que X sea menor o igual
que 1 y Y sea menor o igual que 9. Esto es:
i ;
F(xi'Yi) =P[(X < xi)n<Y <Yi)] =I I{(Xi'Yi)
1 1

F(l,9) =P[(X<l) y (Y <9)] =


= 0.07+ 0.08 + 0.09 + 0.09 + 0.10 + 0.11 = 0,54
Tema 18
Algunos modelos de distribuciones
continuas de probabilidad
18.1. INTI
SUMARIO En los tel
referidos a I~
18.1. Introducción de distribuc
caractensticl
18.2. La distribución norm.al
ceptas para t
18.3. La distribución chi-cuadrado ex,> bies continu:
18.4. La distribución i de sludent de probabilic
18.5. La distribución F bir una funci
mos construi
18.6. Resumen
do a que el
18.7. Ejercicios definición, in
18.8. Soluciones H los ejercicios ecuación (COl
habilidades.
ciones contin
plo u otros si
ilustración ge
nonnal y la o
bilidad chi-a.
que asumime
como es el cá
ciones. Sin el
con fines apli
nas continua
alumno estud
Los mocleL
funciones de (
por ecuaciom
lar la probabi
lome unos va)
18.1. l",mODLCC¡Ú"!
En los temas anteriores se han expuesto los conceptos fundamentales
referidos a las variables aleatorias discretas: su función de probabilidad,
de distribución, sus propiedades fundamentales y los momentos más
caracteristicos (media y varianza) y se han generalizado los mismos con·
ceptos para las distt;buciones de probabilidad bivariadas y para las varia-
bles continuas. En este tema vamos a estudiar unos modelos concretos
de probabilidad de variables continuas. La dificultad a la hora de descri-
bir una función de probabilidad de una variable continua es que no pode-
mos consuuir la tabla incluyendo los valores que toma la variable debi·
do a que el número de valores que puede tomar es, por su propia
definición, infinito. De forma que solo podemos describirla mediante una
ecuación (como se hizo en el ejemplo 15.2) y utilizarla para obtener pro-
babilidades. Estas ecuaciones que caracterizan algunas de las distribu-
ciones continuas son algo más complejas que las expuestas en ese ejem-
plo u otros similares para el nivel de este curso, por lo que, a modo de
ilustración general de conceptos solo la expondremos para la distribución
normal y la omitiremos en los restantes casos (la distribución de proba-
bilidad chi-cuadrado, la distribución t de Student y la distribución F) ya
que asumimos que el alumno carece de una herramienta fundamental,
como es el cálculo integral, para la correcta manipulación de sus ecua-
ciones. Sin embargo, ello no obstaculiza que en este tema describamos,
con fines aplicados, estos modelos de probabilidad de variables aleato-
rias continuas en los que se fundamenta la inferencia estadística que el
alumno estudiará en el próximo curso.
Los modelos probabilísticos que ahora estudiaremos son aquellos cuyas
funciones de densidad de probabilidad vienen definidos, como se ha dicho,
por ecuaciones o fórmulas matemáticas concretas y nos permiten calcu-
lar la probabilidad de que una determinada variable aleatoria continua
tome unos valores determinados. Entre estos modelos de variables alea-
506 ANÁLISIS DE DATOS EN PSICOLOGlA I ALG

lodas continuas más importantes se encuentran la distribución NonnaI, oca


la distribución chi-cuadrado, la distribución t y la distribución F. de nOIT
impol1ancia fundamental para entrar con éxito en la inferencia estadís- 182'
tica y el contraste de hipótesis que es materia de estudio en «Análisis de por
Datos en Psicología JI., de segundo curso, y están relacionados con los cimi
Diseños de Experimentos que se estudian en la asignatura de .Diseiios de
Investigación en Psicología_, de primero. E
ca ql
Nos detendremos con especial detalle en la distribución normal (ya losq
estudiada como distribución de frecuencias en el lema 6) confiando en lo pr
que ello pueda facilitar la comprensión de los siguientes modelos de pro- a1eal
babilidad que describir"emos de forma más escueta. El objetivo último es modo
que se comprenda intuitivamente en qué consisten estas distribuciones y cribi
que, con ayuda de las tablas del apéndice, sepa calcular probabilidades siend
asociadas a estos modelos de probabilidad. En el último tema se expone física
una aplicación introductoria de estas distribuciones continuas como dis· sedü
tribuciones de muestreo e introducción a la inferencia estadística, que propl
como se ha señalado se estudiará con más detalle en segundo curso. mejol
Los objetivos son: deja
fica, (
la var
• Transformar una distribución normal de una variable cualquiera,
X, en la distribución normal estándar de puntuaciones úpicas, Z.
• Conocer las caracteJisticas de la distribución normal como distri·
bución de probabilidad de una variable.
• Utilizar las labias de la distribución normal para obtener probabi-
lidades.
• Definir las variables aleatorias 1, chi-cuadrado y F.
• Conocer las caracteJisticas de las distribuciones t, chi·cuadrado y
F: su media y varianza.
• Utilizar las tablas de las distribuciones t, chi·cuadrado y F, para
obtener probabilidades asociadas a unos detelminados valores e,
inversamente, obtener los valores de estas variables asociados a
tinas determinadas probabilidades.
Si 1I
panad2
mal. Si
lI\,~, 1 \ I)lSTlIllIl c:r()\ ,\011'1 \1. ximaci
La distribución normal, cuya fÓI"mula fue publicada por De Moivre Ten,
(1667-1754), es conocida también con el nombre de disllibución de Gauss tribuci
ALGUNOS MODELOS DE DISTRlBUClONES CONTINUAS DE PROBABILIDAD 507

o campana de Gauss en honor de Cad Frledrich Gauss (1777-1855), astró-


nomo y matemático alemán, que junto con Pierre Simon Laplace (l749~
1827), astrónomo y matemático francés nombrado marqués de Laplace
por Luis XVIII, hicieron importantes contribuciones para un mejor COno-
cimiento de esta distribución.

El adjetivo nonnal aplicado a este modelo de distribución, no signifi-


ca que otras distribuciones sean anormales, sino que se debe a los inten-
tos que se hicieron, durante los siglos XVIII y XIX, para convertir este mode-
lo probabilístico en ley, casi universal, a la que obedecen las variables
aleatorias continuas. Veremos que esto no fue posible y aparecieron otros
modelos probabilísticos, como la distribución F, t o X2 que más tarde des-
cribiremos. Sin embargo, es una distribución importante porque, aun
siendo una distribución teórica, se ha comprobado que muchas variables
físicas, como el peso, la altura, etc_, y psicológicas, como la inteligencia,
se distribuyen de fonna muy aproximada a la nonnal. Como muestra, le
proponemos que coja dos dados y los lance al aire cuantas más veces
mejor; pongamos que 100 veces. Considere la variable aleatoria X = .Suma
de la puntuación obtenida en los dos dados," y complete la siguiente grá-
fica, donde en el eje de abscisa se representa los valores que puede tomar
la variable X, y en el eje de ordenadas la frecuencia.

2 4 6 8 10 12

Si lo hace, observará que la distribución gráfica adopta forma acam-


panada y bastante simétrica y se va aproximando a la distribución nor-
mal. Si en lugar de realizar 100 lanzamientos 10 hiciera 1000 "-eces la apro-
ximación sería mejor, y mucho mejor cuantas más veces lance los dados.

Tenga presente que se trata sólo de un ejemplo para ilustrar que la dis·
tribución nonnal está presente en muchas situaciones de la vida coLidia-
508 ANÁLISIS DE DATOS EN PSICOLOG[A I ALGU1\

na, pero que en esta variable X del ejemplo, se trata, como bien sabe, de Nc
una variable discreta y aquí eslamos estudiando la distribución de varia- nonTI!
bles conrinuas. Jame'
pero I
Su función de densidad de probabiJjdad viene deleJminada por la
impo:
siguiente expresión:
puede
I I 'r,-,) 'I tes ca
(x) =---¡:-e-i\"- sobra
I O"v2rr

donde lt (Pi) es una constante conocida de valor 3.1416159... y e es la base


de los logaritmos nepelianos de valor constante igual a 2,71828.... J.l Ya
son, respectivamente, la media y Ja desviación típica de la distribución
que cumple las propiedades de toda función de probabilidad que vimos
en los temas anteriores, es decir:
-(x»O
- C(x). d(x) = I

De fonna similar a como ocurría con las variables discretas, la pri-


mera propiedad indica que la probabiJidad asociada a un valor de la \'a-
riable aleatoria es nula o positiva y la segunda que la suma l de las pro-
babilidades asociadas a los infinitos valores de la variable es igual a la
unidad, o en otras palabras que el área comprendida entre la curva y el
eje horizontal es igual a uno. Su gráfica es la conocida curva en forma de
campana como la que se incluye en la figura 18.1.

M~,o)

A,
• de pI
en el

Figuro 18.1: Distribución normol de medio ~ y desviación típico o.


do )(
esle n
Por Ir.llarse de una variable conlinua, la suma de esfOS valores infinilcsimales se
rep'"Cscllta por el símbolo de la integral en lugar del sfmbolo del sumatorio ulilizado para
"'ne.,
sumar valores finitos y discrelos ene! ,
ALGUNOS MODELOS DE DISTRIBUCIONES CONTINUAS DE PROBABILIDAD 509

le No se desanime el lector si no comprende la ecuación expuesta ante·


,- riormenle y que define su función de probabilidad. f(x). porque más ade-
lante veremos que no la vamos a necesitar para calcular probabilidades,
pero por el contrario si es necesario conocer las características más
a importantes de esta distribución para facilitar los cálculos. Como se
puede observar en la figura 18.1, la distribución normal tiene las siguien-
tes características. Y3 vistas en el tema 6 y que por su imponancia no
sobr<l recordarlas:
- Es simétrica en tomo a su media J.I que corresponde a la abscisa de
má",ma altura. Al ser simétrica, coincideJ'l la media, la mediana y
e
la moda.
a
n - La curva normal tiene dos puntos de inOexión, es decir, dos pun-
s lOS donde la curva pasa de ser cóncava hacia abajo ~ ser cóncava
hacia aniba 1 . Eslos puntos de inflexión están situados simétrica-
mente a una desviación típica (J . a) de la media, es decir, en Jos
puntos: Xl '= J.I - a y Xl = J.I + a.
- TIene una amplitud infinita por lo Que la curva se extiende desde-oo
hasta +- . Por tanto, la curva nunca toca al eje horizontal. En tér-
.- minos más precisos se dice Que la curva es asintótica al eje de abs-
.-
cisas.

•., - Es una distribución de probabilidad de \'ariables aleatorias conti-


nuas y en consecuencia el área total comprendida entre la curva
e y el eje de abscisas o eje horizontal de la x es igual a la unidad.
Este área se interpreta en términos de probabilidad.
- De las caractel"Ísticas anteriores se deduce que una perpendicular
tI·azada sobre la media divide a la curva en dos pal1es de igual área.
Además de estas caractclisticas, la distribución normalliene una sede
de propiedades de las cuales seiialaremos las siguientes, vistas también
en el tcma 6 como distribución de frecuencias:
- Si X es una variable con distribución n0I111<11, N (}J, a), la variable Y
función lineal de X mediante la siguienle transformación J :
y = a ± bX, es también nonnal con media: a ± bp y desviación lípi-
ca: Ibl. a (donde Ibl es el valor absoluto de b).
Z Una curva l'S cóncava hacia alriba si tiene f0l111a de un plato capaz de rctcner líqui-

do )~ y cóncava hacia abajo si la fOlma es la de un plato dcl quc se saldrla c1líquido 1(. De
este 111000. la CUl'\'a nOlma1 es cóncava hacia abajo en su zona !!>upcrior \ se va haciendo
, cónca\"a hacia aniba a medida que nos accrcamos a los extremos.
J E!!>ta es una propiedad general de la media y de la desviación típica también contada
en cltcma 4 )" 5.
510 ANÁLISIS DE DATOS EN PSICOLOGíA I ALGUNOS I

- Si XI es una variable con distribución normal N (PI' al) Y Xl es otra


variable independiente4 de la anterior y nOlmal N (pz, az) la varia-
ble Y = Xl ;t Xl es también nonnal con media py = PI + Pl y des-
\riación típica: ay = ~a¡ + O'i .
- La función de distribución de probabilidad de la distribución nor-
mal N (p; a) viene dada por la siguienle ecuación:

Figuro
norm<
y difere
y se puede calcular para cualquier valor de x siempre y cuando se
conozcan los valores de la media (ll) y la desviación típica (a) a los Cualql
que denominamos parámetros de la distribución. distribuci
cada,que
N(O,l l, tal

....

x "
Figuro 18,2: Áreo de lo distribución normol bojo lo puntuación x.

Por lanlo, existe una familia de distribuciones nonnales que difie-


Figuro
ren en cuanto a su posición (p) y dispersión (O') y que genéricamente se
simbolizan por N (p, a)como las que se muestran en las figuras 18.3 y
18.4.
Esto 54
puntuaci<
sión ya c<
• Recuerdc las propiedades de la mcdia y varianza dc la suma (o resta) de valiables.
Tenga pr~nle que aquí se habla de valiables independielllcs v POI' tan lo su cO\"anan7.a es , Recue
~ro. ca 1. Repa51
Al ALGUNOS MODELOS DE DISTRIBUCIONES CONTINUAS DE PROBABILIDAD 511

ra
ta-

/
>r-

Figuro 18.3. Dos distribuciones


normales con lo mismo medio
Lx. Figuro 18.4. Dos distribuciones
normales con diferentes medio
y diferentes desviaciones típicas. y diferentes desviaciones 'ípicas.
se
OS Cualquier distribución normal, N (}Ji 0'), puede transformarse en olra
distribución, que denominaremos distribución normal estándar o tipifi-
cada, que tiene de media cero y varianza uno que simbolizaremos por
(0,1), tal y como se muestra en la figura 18.5.

.. .. ,, ,,
,
... "/:0
,
.....
' ,
'-""" .. , ,
S,.1.'
, .. ,.,
, ''
,:

,,
""""" '
... ,
"'"

le-
se Figuro 18.5: Transformación de dos distribuciones N (IJ; al en la distribución
estándar N {O, 1).
Iy
Esto se consigue haciendo un cambio de variable y transformando las
puntuaciones, X, en puntuaciones tfpicas 5 , z, mediante la siguiente expre·
si6n ya conocida del tema 6:
0;.
, o; I Ro.:-cucrde que ya estudió que estas punwacioncs;: lienen media cero v dcsviación lípi-

ca 1. Repase cllema 6. para refrescar <:slos conceptos anles de seguir leyendo.


512 ANÁLISIS DE DATOS EN PSICOLOGíA 1 ALGUN(

x-~ (uacian
z=--
cr Z(com
Teniendo en cuenta que esta expresión corresponde al exponente de
la función de densidad de probabilidad y que su desviación típica es uno,
O' = 1, la función de densidad de probabilidad de la distribución nOlmal
estandarizada, N(O,l), es: con lo (

I z,.
f() 1
=~.e _o.'
2 I
Para
cuya gráfica se muestra en la parte inferior de la figura 18.5. ración:
Estudiamos en el tema 6, que las puntuaciones típicas tienen media
cero y varianza uno. Para calcular la probabilidad de encontrar valores Z
inferior a cualquier 01l-a Z¡, debe calcuJal'se el á'-ca comprendida a la
izquierda de la perpendicular trazada sobre dicho valor de Z¡ y la curva, acudiml
para lo cual un procedimiento sería calcular la siguiente integral: en la pr:
tramos
= P(Z < z,J =__f-=.
- I _!.. I
F(z,J e 2' encontr;
..;2· rr.

ACLARACiÓN: Af0l1unadamenle no es necesario dominal' el cálculo inte-


graJ y en consecuencia no se necesita hacer esta operación ya que el resuJ-
tado de casi todas estas posibles opemciones se encuentra consultando la
tabla A.l que se incluye en el apéndice, donde se presentan todas las pun-
tuaciones típicas desde -3.59 hasta +3.59 con intervalos de O.01.La pl'illlera
columna encabezada con la letm z consta de un número con un decimal
que cOITcsponde a la puntuación típica y la pdmera fila (a la derecha de la
letra z) cOlTesponde al segundo decimal de la plllllllación z. Todos los valo-
res interiores representan probabilidades y llevan, obviamente, un cero
delante de la coma.

Imaginemos que pasamos un test de comprensión verbal en una deter-


minada aula de un colegio a los niños de 6. 0 de Primaria, sabiendo que
las puntuaciones dc este tcst se distlibuyen normalmente con media 100
Ydesviación típica 25, y queremos calcular la probabilidad de que un niilo
obtenga en elleS! una punluación menor o igual a 131 punlos. Un pro-
cedimiento sería aplicar la ecuación que aparece en la Figura 18.2 siendo
los valol-es de la ecuación los aquí proporcionados, es decir, media 100,
desviación típica 25 y puntuación X = 131. El segundo procedimiento, que
es el que utilizal-emos siempre, es transformar esta distribución de pun-
1 ALGUNOS MODELOS DE DISTRIBUCIONES CONTINUAS DE PROBABILIDAD 513

tuaciones directas X en la distribución nonnal estándar de puntuaciones


Z (como se ilustra en la figura 18.5) mediante la transformación:
, x-x
" z=-5-'
] •
con lo que si X = J 31 entonces su puntuación tipica es:

= 131-100 =124
z 25 '
Para encontrar su probabilidad sin tener que realizar la siguiente ope-
ración:
1
a
l F(I,24) = P(Z $ 1,24) = f___ ¡:--.
1.24

v2 . rr.
e-,·12"
I
. dz = 0,8925
a
acudimos a la tabla A.I y buscamos en la primera columna el valor 1,2 Y
" en la primera fila el valor 4. En el cruce de la fila con la columna encon-
tramos .8925 que es la probabilidad buscada. es decir. que en la tabla
encontramos el valor 0.8925 como solución de la integral anterior:

,
0,0
0,1
o 1 2 ... 4.
I
"ú --c;§:>
1
FU,24) '" P(Z:,> 1,24) = J ¡:--.
1,z.I I
e-rlJ~l . d~ = 0,8925
_ .,¡z. 1t

, .
._--¡-----.;~-

, ,,
~~._----~----~-----~" .
-----:---~-
,
-._-- -----!.- ·r·
,, ,,
, --,---
----~,..-
,, ,.
e-
le
"
,
..
_- ,,
,
-~-

;
~ -'.-. - \,
,o ,
,,, .
)- ,
o
D, "--3,59 -2,89 ~2,17 -1,44 -0,72 0,00 0,72 1,44 2,17 2.89 3,59
le
,- Figura 18.6. Área de lo distribución normal bojo lo puntuación z. 1.24
514 ANÁLISIS DE DATOS EN PSICOLOGÍA 1 ALGUNOS M

Este valor significa que la probabilidad de obtener puntuaciones típi-


cas menores o iguales a 1,24 vale 0.8925. En otras palabras. la probabiJi- b)
dad de que un niño obtenga en el test pUnluaciones menores o iguales a fica por
131 es 0,8925. También es frecuente oír que el nit'io que obtenga en ese nes del
test la puntuación 131 se encontrarla en el percemil 89. Por lo t3nto, todas
las probabilidades que aparecen en esta tabla se refieren a la probabili-
dad de obtener valores mellores o igllales a una puntuación típica z
determinada.

Ejemplo 18.1. Las puntuaciones de un test se distribuyen nor-


malmente con media ISO y varianza 144. Calcular:
a) La probabilidad de obtener puntuaciones mayores o iguales a
130.
b) La probabilidad de obtener puntuaciones comprendidas entre
140 y 180.
a) Primeramente tenemos que transfonnar esta disUibución nor·
mal en la distribución normal tipificada. Para eUo, transformamos
las puntuaciones del test, X, en puntuaciones típicas, Z, mediante la
siguiente expresión:

X=130=>Z=X-X =130-150=_167
S, 12 '

x- 130 x- 1SO
z.,_1,4~ z-o que es
,

Buscamos en la tabla A. 1 F (-1,67) = P (z: S -1,67) = 0,0475 que


representa el área sombreada de la izquierda, pero como lo que piden
es la probabilidad de obtener puntuaciones mayores o iguales a 130, 111.2. I \
es decir la zona derecha de la gráfica, realizamos la siguiente opera·
ción: El ténnin
p (X ~ 130) = P (Z ~ -1 ,67) = 1 - 0,0475 = 0,9525 que es la proba- primer lugalj
bilidad pedida. lizado la letr:
da- y, en segl
ALGUNOS MODELOS DE DISTRIBUCIONES CONTINUAS DE PROBABILIDAD 515

b) La probabilidad que buscamos queda representada en la grá·


( fica por la zona central. Para ello, transfonnaremos las puntuacio·
Des del test, X, en puntuaciones típicas, z:

140-150
X=140=>Z= = -{J,83
12
180-150
X = 180 => Z = = 2,5
'z.

J =\ x= 140
z= 0,83
x .. 180
z: 2.5

Ten.iendo en cuenta que la información que nos proporciona las


tablas corresponden a las probabilidades de obtener puntuaciones
menores o iguales a un valor dado, buscamos F(--o,83) y F(2,S) para
reslar posteriormente una de la otra, y resulta:

F(2,5) = P(Z <2,5) = 0,9938 }


F(-{J,83) = P(Z <-{J,83) = 0,2033 =>
P(-{J,83 < X < 2,5) = F(2,5) - F(-O, 83) =
= 0,9938 - 0,2033 = 0,7905
que es la probabilidad pedida que aparece representada en la gráfica.

18,2. LA D1STRIllCC¡Ú:\T CHI-CI'ADH.\DO (X')

El término chi-cuadrado lo vamos a utilizar con un doble sentido: en


primer lugar, como denominación de una variable -igual que hemos uti-
lizado la letra z para denominar a la variable nonnal estándar o tipifica-
da- y, en segundo lugar, como nombre de un tipo de dislribuci6n de pro-
516 ANÁLISIS DE DATOS EN PSICOLOGÍA 1

habilidad -como hemos hecho con la distribución normal que se ha repre-


sentado por N ().l. 0)-. Veremos que conceptualmente no es más comple- A
ja que otros modelos de probabilidad, ya descritos en epígrafes anterio- p:
res, sino que muy al contrario. vamos a facilitar al máximo su comprensión a
y su utilización práctica. n
rr
Como el resto de las distribuciones de probabilidad ya estudiadas, pue- rr
de ser definida por una ecuación matemática que permite obtener pro-
babilidades para cada valor concreto de la variable. Ocurre, sin embargo.
que esta ecuación no es nada sencilla, y por eso la omitiremos6 , sin que
..
le

n:
ello sea un obstáculo para su correcto entendimiento o impida obtener le
probabilidades con ayuda de las tablas que se incluyen en el apéndice y B
de fácil uso. el
el
Puesto que omitimos la ecuación de la función de densidad de pro- 2
babilidad de la distribución chi·cuadrado, vamos a definir qué es una le
variable chi-cuadrado. Para eIJo partimos de n variables aleatorias inde· 1I
pendientes, Xl' X!, XJ' X"' con distribución normal estandarizada,
000'

(0,1); definamos ahora una nueva variable mediante la siguiente expre·


sión:
X; + xi + xi + 000 + X;
que representaremos con la letra griega chi y el exponente 2 (se escri-
be X~ y se lee chi·cuadrado), que es también una variable aleatoria conti-
(
nua que tiene una función de densidad de probabilidad conocida -<uya
expresión matemática omitimos- que es la distribución chi-cuadrado con re a
n grados de libertad. Por consiguiente, definimos la variable chi--euadra· situ
do como la suma de los cuadrados de n variables nonnales N(O,I) e inde- el nI
pendientes: lriC¡
dra,
x~ = zl + z~ + z~ + ... + ¿
La distribución X2 consiste, como ocurre con otras distribuciones, en
un conjunto de distribuciones de probabilidad que depende del número
de grados de Iibel1ad. El número de grados de Iibel1ad se representa habi-
tualmenle como subíndice del sfmbolo de chi-cuadrado, de tal forma que
cuando, por ejemplo, veamos escrito X;5 nos estamos refiriendo a una dis·
tJ'íbución chi·cuadrado con 1S grados de libel1ad.

tie~
• Es la ecuadón con la que se ha programado el CD·Rom de prácticas para calcular las
probabilidades a:«x.:iadas a los valores que introduce el usuario. El lector interesado puede ¡nel
cnconcrada en algunos de los (('Xlos que se mencionan en la bibliogrn(fa cua
ALGUNOS MODELOS DE DISTRIBUCIONES CONTINUAS DE PROBABILIDAD 517

ACLARACIÓN: El concepto de grados de libertad es un término tomado


prestado de la fisica y que puede explicarse matemáticamente recuniendo
a herramientaS matemáticas más complejas de las que se requieren para el
nivel de este curso. Por ello, intentaremos clarificar este concepto breve-
mente ilustrándolo con ayuda de algunos ejemplos. Supóngase que le per-
miten elegir cinco números ¿cuántos de ellos puede elegir Hbremente? No
lo piense mucho, indudablemente la respuesta es cinco, de modo que en
esta ocasión ha actuado con cinco grndos de libertad. Imaginemos nueva-
mente la misma situación, pero ahot'a con la condición de que la suma de
los cinco números sea igual a una cantidad determinada, por ejemplo cien.
En este caso ¿cuántos números puede elegir libremente? La respuesta ya no
es tan inmediata pero es bastante sencilla; imagine que ha elegido como
cuatro primeros números los siguientes: 54, 126,8 Y2610s cuales suman
216 y puesto Que los cinco números deben sumar cien, lógicamente el quin-
to tiene que ser. -116. En esta ocasión se ha actuado con cuatro grados de
libertad ya que al haber elegido libremente los cuatro primeros números, el
quinto queda automáticamente especificado por la condición de que la suma
de todos ellos sea cien. La condición impuesta nos ha restado un grado de
libertad. De esta forma, a medida que se vayan añadiendo más condiciones
restrictivas, disminuyen los grados de libertad.

Como se ha intentado aclarar, el concepto de grado de libertad se refie-


re al número de obsct\'aciones que pueden elegirse libremente en una
situación matemática concreta y, por lo general, es igual a n-k siendo n
el número de observaciones o de datos y k el número de condiciones res-
trictivas que se imponen a los cálculos. Las siguientes variables chi-cua-
drado, tal y como se han definido:

2 2
X¡ = Z¡
2 2 2
X2=Z¡+Z2
2 222
X3 + Z2 + Z3
= Zj
....... etc.
2 2 2 2 2
X" =Zl +Z2 +Z3+· .+Z"

tienen 1, 2-1 3, ... , 11 grados de libertad respectivamente y la figura 18.7


incluye la representación gráfica de algunas de estas distribuciones chi-
cuadrado, para 2, 8 Y20 grados de libertad.
518 ANÁLISIS DE DATOS EN PSICOLOCtA I AlGt

n.8

o'l.L.-~~~
Figura 18.7: Di$linlos distribuciones;(2 !oe9ún sus grados de libertad.
A(
La distribución l goza de importantes características que pueden as
comprenderse bien, sin necesidad de recurrir a complejas demostracio· fa.
nes matemáticas, con un atento y detenido análisis de la figura 18.7 don- u
q.
de se representan distintas distribuciones X2• Las más importantes son: m
- La variable -l definida como suma de cuadrados de n variables ale-
ro
re
atorias independienles N(O, 1) no puede tomar valores negativos
X'
(una puntuación al cuadrado siempre es positivo) pudiendo tomar fie
cualquier valor positivo en el intervalo desde cero hasta infini- d.
lo (0,<><».

- Como ya se ha mencionado. una distribución "1: queda perfectamente


".
es
determinada por sus grados de libertad, n, de tal forma que si una
variabJe, X, se distribuye según l con n grados de libertad, sus pará· 1
metros media y varianza son: repn
coilll
~=E(X)="

cr'=V(X)=2."

- La distribución X2 es asimétl;ca positiva pero a medida que aumen-


tan sus grados de libet1ad se va aproximando a la distribución
nonnal Observe en la gráfica como la distribución con 11 = 20 gra-
dos de Iibel1ad se pan~ce bastante a la distJibuci6n nomlal que hemos
descrito anteriormente. Con fines prácticos la aproximación es bas-
tante buena a partir de cien grados de libel1ad (" > 100) y las pro-
babilidades asociadas a esta distribución se pueden obtener a partir
de la normal. Entonces la va.-iable: •
ALGUNOS MODELOS DE DISTRIBUCIONES CONTINUAS DE PROBABILIDAD 519

donde n representa el número de grados de libertad, se distribuye de


acuerdo con la distribución normal estandarizada N(O,O
\
- La denominada propiedad aditiva expresa que si una variable X se
distribuye según X2 con nI grados de libertad y otra variable Y se dis-
tribuye también según X2 con n 2 grados de libertad, entonces la varia-
ble U suma de las dos anteriores (U =:: X + Y) se distribuye según X2
con nI + n 2 grados de libertad.

ACLARACIÓN: La labIa A.2 nos pennite obtener algunas probabilidades


asociadas a unos pocos valores (también llamados percentiles) de toda la
familia de distribuciones·l que van desde 1 hasta 100 grados de libertad.
La primera columna se refiere a los grados de libertad de la distribución,
que varian desde 1 hasta 100. Para valores mayores se aproxima a la nor-
mal, como se ha indicado en el párrafo anterior. Una vez enconuado el núme-
ro de grados de libertad, n, de nuestra distribución de inlerés, lodos los valo-
res a su derecha en orden creciente son los distintos valores de la variable
-,: (que se representarlan sobre el eje de abscisas o eje horizontal de la grá-
fica) que dejan por debajo la probabilidad indicada en el encabezamiento
de la columna correspondiente (que se representa como área entre la cur-
va y el eje de abscisas). Con los siguientes ejercicios se practicará el uso de
esta tabla.

Los dibujos de los siguientes ejemplos debe interpretarlos como una


representación esquemática, puesto que es más que «probable» que no
coincida con su representación real.

I Ejemplo 18.2. Dada una distribución X2 con 21 g.l y siendo A y


B las áreas rayadas del gráfico, determinar los valores de X2 tales que:
a) El área de A es 0.10
b) el área de B es 0.05

}~
'xl
l

. o ~ x¡ ~
520 ANÁLISIS DE DATOS EN PSICOLOGíA 1 ALGUNOS

Se lrata de buscar los valores de ~ yxi tales que:


P (x' ~X;) = 0,10 Y P (x' ~xi) = 0,05
Es decir, calcularemos los percentiles 10 Y98 respectivamente.
Para ello, consultando la tabla A.2, encontramos en la fila corres-
pondiente a 21 g.l una serie de percentiJes de esta distribución.

gl 0,10 0.95
1
2
3 A
21 13,24 32.67

Puesto que la tabla nos informa siempre de la probabilidad de


encontrar valores menores o iguales a uno dado, tenernos que bus-
car el valor. 111..1. 1,
P(x'Sx;) =0,10 =>x; = 13,24
A la ~
y Que seña
P(X' ~xi) = 0,05 => P (X' S xi) = I-P(X' ~xi) = 1-0,05 = 0,95 => sentido:
~"lb= 32,67 acuerdo
cia! de di
dremos.
Ahora la P,"cgunta es a la inversa:
Para
indepen<
N(O, 1). [
Ejemplo 18.3. En una distribución'l con 10 g.l. calcular sión:
P (6,74 S X' S IS,31)
Para ello tenemos que realizar la siguiente operación:
P (6,74 S X' S IS,31) = P (X' S IS,31)-P(X' ~ 6,74)
tal y como se muestra en el siguiente dibujo:
que es u
y que tie
be el nOI
0.7 maternA'
o.-f-r'-----::::",-"'_ 0-1Lr-----:::;>---_ o,-h-----::;¡::,~- dom~'
6,7~ 6,74 18,3 6,7~ 18,3 Que el n
tualmen
ALGUNOS MODELOS DE DISTRIBUCIONES CONTINUAS DE PROBABILIDAD 521

Con ayuda de las tablas buscamos los vaJores 6.74 y 18,31 en la


fila correspondiente a los 10 g.1 Ysus correspondientes probabilida·
des se encuentran en la parte superior de sus respectivas columnas.
Estas son:

P(x' "6,74) = 0,25 }


por tanto:
P{X'" 18,31) = 0,95
P(X' S 18,31) - P(x' S 6,74) =0,95 - 0,25 =0,70

A la puntuación 6,74 le corresponde el percentil 25 y a la pun·


tuación 18,31 el percentil 95 tal Y como se muestra en el gráfico, por
tanto entre ambas puntuaciones se encontrará el 95 - 25 :: 700m de
los casos que es una probabilidad de 0,70.

18.4. LA D1STRlBl;CIÓ;'; t DE STUDE1\"T

A la hora de describir este tipo de distribución de probabilidad, hay


que señalar nuevamente que el término t se utiliza también con un doble
sentido: uno para denominar a la variable aleatoria continua definida de
acuerdo a una función matemática y otro para denominar a un tipo espe-
cial de distribución de probabilidad cuya expresión matemática no expon-
dremos.
Para la definición de la variable t partimos de n variables aleatorias
independientes, XI' Xl' X 3, .. " X"' con distribución nonnal estandarizada,
N(O, 1). Definamos ahora una nueva variable mediante la siguiente expre-
sión:

\
xf +x; +... +x;'
n
que es también una variable aleatoria continua que representamos por t
y que tiene una función de densidad de probabilidad conocida que reci-
be el nombre de distribución t de Student en honor de su descubridOl~ el
matemático Gosset que publicó bajo el seudónimo de Student. Analizan-
do más detenidamente la expresión matemática de su definición, vemos
que el numerador es una variable norIllal estándar o tipificada -habi-
tualmente representada. por la letra z- y el denominador es la raiz cua-
522 ANÁLISIS DE DATOS EN PSICOLOGÍA J ALGUl

drada de un cociente, donde a su vez, el numerador es la suma de los cua-


drados de n variables aleatorias notmales e independientes -es decir una
variable X2 con n grados de Iibertad- que está dividida por n -los grados
de libertad de X2 _. Por tanto, podemos definir la variable aleatoria t
como el cociente entre una variable normal estándar, z, y la raíz cua-
drada de una variable chi-cuadrado, Xl, dividida por sus grados de
libertad, es decir:

Un breve análisis de esta expresión matemática nos permitirá dedu-


ciJ~ sin necesidad de I-ecurrir a demostraciones matemáticas, el rango de
valores que puede tomar. Vemos que el numerador es una variable con
disuibución nOlmaJ estandalizada, que ya sabemos que puede tomar cual-
quier valor del intervalo (-00,"")' Por su palte el denominador es una varia-
ble chi-cuadrado que, como vimos, solo puede tomar valores positivos;
,ACI
apll
en consecuencia, la variable t, cociente de estas dos citadas, puede
cu.
tomar cualquier valor, positivo o negativo en el intervalo (-00,00). aw
Como en el caso de la distribución l, repetir nuevamente que la V3li3- rnn
ble aleatol'ia continua, t, tiene una distribución de densidad de probabi- sie~
sie~
lidad como otra cualquiera (ni más sencilla ni más compleja) con su expre-
buc
sión matemática que asigna probabilidades, que pueden también obtenerse va (
por medio de una tabla, gracias a la cual podemos prescindir de escribir dos
su expresión matemática que elleclor interesado puede encontrarla en su
otros textos. Nos limitaremos, por tanto, a descdbir ahora sus caracte·
rísticas más sobresalientes y el manejo de su tabla (Tabla A.3).
- La variable aleatoria t tiene el mismo número de grados de libertad
(n) que la distribución de Xl incluida en el denominador de su deri-
Si 1
nición algebl'aica, por lo que su distlibución de probabilidad depen-
de del número de grados de libertad de 'l. Nuevamente, la disll-ibu-
ción t constituye una familia de disllibuciones de probabilidad cuya
CorOla depende del valor de n tal y como se ve en la figura 18.9.
- Una distribución 1 queda pelfectameme delenninada por sus grados
de Iibeliad, n, de tal forma que si una vaJiable, X, se distlibuye según
t con n grados de libeltad, sus parámetros media y varianza son: Ca
n> 1\
ta lOO
L _p_=_E_(_X)_=~ de la 4
ALGUNOS MODELOS DE DlSTRlBUClONES CONTINUAS DE PROBAB1UDAD 523

,,' = V(X) = - " -


"-2

o
Figuro 18.9: Dos distribuciones I para 1 y A grados de libertad

ACLARACiÓN; Su forma acampanada y simétrica en lorno a su media,


recuerda a la distribución normal, pero se diferencia de ésta en que es más
aplanada (platicúrtica) y dispersa. Igual que ocurre con la distribución chi-
cuadrado, la distribución t converge con la nonnal, N(O,l) a mecUda que
aumentan sus grados de libertad. Esta propiedad se manifiesta compa-
rando sus respectivos parámetros que coinciden para la media, que vale
siempre cero en las dos distribuciones, pero no para la varianza que vale
siempre uno para la djstJibuCÍón nOlmaJ y mayor de uno para esta distri-
bución. Sin embargo. analizando la expresión de la variam.a de t, se obser-
va que su valor se va aproximando a uno a medida que aumentan sus gra-
dos de libertad, de tal forma que paro una variable t con 30 grados de libertad
su media es cero 'j su varianza:

(12 == _n_ == ~== 1,07


n-2 30-2

Si los grados de tibertild son 100. la varianza de esta variable t es ahora:

(J2 ==_n_== 100 ==1,02


n-2 100-2

Con fines aplicados. esta aproximación es bastante buena a partir de


n> 100, razón por la cual, la tabla del apéndice se extiende desde 1 has-
ta 100 grados de libertad. Para valores superiores recun-iremos a la tabla
de la distribución normal, N(O,l).
524 ANÁLISIS DE DATOS EN PSICOLOclA I ALGUN(

Ejemplo 18.4. Sea X una variable que se distribuye según t con 15 g.


6 grados de libertad. Calcular la probabilidad de obtener valores esO.
menores o iguaJes a 1.943.
Tenemos Que calcular P (l S 1,943) que gráficamente correspon- E
de a la zona sombreada del dibujo inferior Que representa una dis- 98.
lribución t con 6 g.1. Para ello. consultamos la tabla A.3 la cual reco-
ge algunos valores de la distintas distribuciones t desde I hasta tOO
gol. La primera columna corresponde a los g.J . En esta columna tene-
mos que localizar el valor 6, que son los g.l de la distribución de nues-
tro ejemplo. Los valores incluidos en su fija correspondiente son dis- 19 g.
tintos valores t y la probabilidad de encontrar valores menores o
iguales a éstos se encuentra en la parte superior de la tabla. Es decir.
Por
P(' S 1.943) = 0.95 los
Por lo tanto, al valor 1,943 de la distribución t le corresponde el c
percentil 95.

•••••••••••. 0,95 ycle

/ ~
.1
1
2
3

5
5 •••••••••••• 1,943 o 1,943

Ejemplo 18,5, Sea Y una variable que se distribuye según t con


15 g.l. Calcular P (Y> 2,13) .

PlYS2,13)

PlY2: 2,13)

o 2,13
18.5.
Recurrimos a la tabla que nos proporciona siempre información
sobre la probabilidad de encontrar valores de la distribución t meno- Uol
res o iguales a un vaJor t determinado. Por tanto, en nuestro caso con vamos
definid
LGUNOS MODELOS DE DISTRIBUCIONES CONTINUAS DE PROBABILIDAD 52.

15gJla~•
.. o.~
97y
98.

• PlX:S-1,73). PlX;::>: 1,73)


lID PlX;::>: -1,73). PlX:s 1,73)

o 1,73 -1,73 O
526 ANÁLISIS DE DATOS EN PSICOLOGÍA 1 ALe

de distlihución de probabilidad. Nos ocuparemos previamente de definir


esta variable aleatoria.
Sean n variables aleatorias independientes. Xl' Xl' Xl' _'" X"' con dis-
tribución normal estandarizada, N(O,I) y otras m variables aleatorias inde-
pendientes, YI' Yb y).... , y..., con distribución normal estandarizada. N(O,);
definamos una nueva variable aleatoria mediante la siguiente expresión:
xf +xi + +X;11l
1';2 + Yl + + Y~/m
que es también una variable aleatoria continua que representamos con la
letra F y tiene una función de densidad de probabilidad conocida que reci-
be el nombre de distribución F de Fisher en honor de su descubridor, Sir
Ronald Fisher. Analizando más detenidamente esta expresión matemáti-
ca ':i recordando como se han definido las variables de los epígrafes ante·
nores, podemos descubrir que tanto el numerador como el denominador
representan la suma de cuadrados de n y m variables normales e inde-
pendientes respectivamente, divididas por sus grados de libertad, es decir,
son dos variables 'l. Este análisis nos conduce a definir la variable F
como el cociente entre dos variables "l dividida cada una de ellas
por sus respectivos grados de libertad, tal 'j como expresamos a con-
tinuación:

x~
,
F=--lL
X;"
111

Puesto que las dos variables X2 están definidas cada una de ellas en el
intervalo (0,00), es decir, siempre toman valores positivos, la variable F
también estará definida en el mismo intervalo (0,00) no pudiendo tomar
valores negativos.
Respecto a la dis\tibudón de probabilidad, la función de densidad de
probabilidad de la variable F tiene, como en el caso de las distribuciones
vistas anter"iOlmente, una compleja ecuación matemática que la define y
con la que, operando matemáticamente, se obtiene las probabilidades que
afortunadnmente se encuentran tabuladas sin necesidad de realizar aho-
m tales opemciones (el uso de estas tablas se explicará más tarde con ayu-
da de ejemplos). Por esta razón omitimos dicha fórmula y nos limitare-
mos a descr"ibir sus caracteristicas más importantes.
- Puesto que la variable F se define a partir de dos variables X2 cada
una de ellas con sus respectivos grados de libertad, no debe sor·
DLOGÍA J ALGUNOS MODELOS DE DISTRIBUCIONES CONTLNUAS DE PROBABILIDAD 527

~ definir prendemos que la distribución de probabilidad de F dependa de


estos dos valores. Por eso. esta distribución de plUbabilidad se repre-
senta por Film donde n son los grados de libertad de la variable X2 del
:on dis- numerador y In los correspondientes del denominador.
as inde-
, N(O,I); - La distribución F comprende una familia de distribuciones que
)resión: quedan determinados por sus parámetros, media y varianza, que
a su vez dependen del número de grados de libertad y tienen la
siguiente expresión:

s con la m
~=-- param>2
ue reci- 111-2
dor, Sir
temáti-
~ ante-
2 2m 2 (n+m_2)
cr = parom>4
tinador 1l(m-2)2(m_4)
e inde- '--------=
s decir. - TIenen forma acampanada y son asimétricas positivas, la! y como se
iable F observa en la figura 18.10. Su forma es muy parecida a la distribu-
e ellas ción X2•
. a con-

ISen el
iable F
tomar

dad de Figuro 18.10: Distintos distribuciones F.


.ciones
efine y - Una importante propiedad de esta distribución es la llamada pro-
les que piedad reciproca y dice que si X es una vaIiabJe con distribución F
Ir aho- con n y m grados de libertad, entonces la variable Y '" lfX es tam-
mayu- bién una distribución F con m y n grados de Iibel1ad. Esta propie-
nitare- dad la podemos también expresar de la siguiente forma:

1
lcada F --
l-p "," - F. -
Je sor- p m"
528 ANÁLISIS DE DATOS EN PSICOLOGíA 1 ALGUNO

donde p es la probabilidad asociada al valor de la variable. La figu-


ra 18.11 representa gráficamente esta propiedad. Esta propiedad es ysu v
de enonne importancia para obtener algunos percentiles O probabi-
lidades que no aparecen en la tabla, tal y como se verá en ejemplos
posteriores.
y la re
buciÓl

Ce
Figura 18.11: Relación recíproca entre Fn,m y fm.n babili
lesal
prim
EjempJo 18.7. Sea X una variable que se distribuye según chi· loca1t
cuadrado con 6 g.l. e Y otra variable que se distribuye lambién según los g
la
xl
cm-cuadrado con 15 g.l. Si definimos la variable: U:= : J'
calcular:
deja
de la
/15 caq
igu
a) La media y varianza de ti
ejerc

p[~ >2,21]
de6
b) que
valo
0,90:
e) Los valores que limitan al 90% central de esta distribución.
Por definición sabemos que el cociente entre dos variables chi-
cuadrado es una variable F con los grados de libertad de las dos varia·

bies chi-cuadrado. Por tanto: yx%% :=


. • Es decir, esta variable U se
F6 "15 1
2
15
distribuye según F con 6 y 15 g.l.
La media y varianza de U, con distribución F con 6 y 1S grados
de libertad es:
m 15 p,
~ = - - = - - = 1,154
m-2 15-2 que
ALGUNOS MODELOS DE DISTRIBUCIONES CONTINUAS DE PROBABILIDAD 529

y su varianza es:

0"' = 2m'(n+m-2) = 2-15'(6+15-2) =0766


n(m-2)'(m-4) 6-(15-2)'(15-4) ,

y la tercera pregunta se resuelve consultando la tabla: de la distri-


bución F con 6 y 15 grados de libertad:

1~ ~ 2,21] = P(F"15 ~ 2,21)


ConsuJtamos las tablas A.4 del apéndice para encontrar esta pro-
babilidad. Disponemos de 6 tablas cada una de ellas correspondien-
tes a las probabilidades: 0,05; 0,90; 0,95; 0,975; 0,99 Y0,995_ Eo la
primera fila correspondiente a los grados de Iibenad del numerador,
localizamos el valor 6, y en la primera columna, correspondiente a
los g.l del denominador localizamos el valor 15. La intersección de
la fija con la columna nos proporciona el valor de la variable F que
deja por debajo la probabilidad que se indica en el encabezamiento
de la tabla. Así, en la primera tabla A4(a) este valor es 0,254 que indi-
ca que la probabilidad de obtener valores de la variable F menores o
iguales que 0,254 es 0,05 -es decir P (F.s; 0,254) = 0,05-. Para este
ejercicio, tenemos que buscar en alguna de esas tablas, en el cruce
de 6 y 15 grados de libertad el valor 2.21 o el más próximo que es el
que aparece en Ia ta bla A4(b)- P or tan to, Ia pro babü-d
I a d d e o b tener
valores F con 6 y 1S grados de libertad menores o iguales que 2,21 es
0,90: P (F S 2,21) -= 0,90 Yen consecuencia
P (F ~ 2,21) = 1- 0,90 = 0,10

_RFS2,211·0,90
Probabilidad 0,90 ~p(n 2,21) _1_ P(F< 2,21).1-0,90.0,10
,23 6

J~.
1
2
j
15 • 2,21
0,21

Para Ja tercera pregunta, tenemos que obtener 105 dos valores de F


que limitan el 9()O,il central como se representa en el siguiente dibujo.
530 ANÁLISIS DE DATOS EN PSICOLOGíA 1 AlGUNO~

maespe
la distril
En lO
la variab
1, e iguah
bies en f
ción de (
nido en:
dislribu<
función I

Buscamos en la tabia de F con 6 y 15 grados de libertad el valor definen e


que deja por debajo una probabilidad de 0,95 y resulta ser 2,79 -tabla ellas corr
A4(c}- que corresponde a F 1" Para obtener el de f l buscamos en la Se ha
tabla F con 6 y 15 grados de Iibenad el valor que deja por debajo una de proba)
probabilidad de 0,05 yes 0,254 -tabla A4(a)-. En otros casos, es posi- tablas do
ble Que haya que aplicar la propiedad recfproca ya que las tablas solo de saberl
recogen unos pocos valores de probabilidad. Como muestra, veamos soenelq
que este segundo valor también se puede obtener aplicando la pro- terísticas
piedad recíproca. de la siguiente fanna: definida,
determin
I
o,oSF6 •IS = .. = - 9 = 0,2538 En el
0,9SI"15;6 3. 4
su aplica!
que coincide con el valor buscado directamente en la tabla A4 (a). tratarlo a
ca del ter
Por tanto podemos escribir que el 90% central de las puntuacio-
puesta a I
nes de la variable F con 6 y 15 grados de libertad se encuentra entre
tema: ¿y I
las puntuaciones 0,254 y 2,79
ra pausa<
P (0,254 ~ F S2, 79) = 0,90 mo curso
o que la probabilidad de que una variable aleatoria F con 6 y J 5
grados de libertad tome un valor comprendido entre 0.254 y 2,79 es
de 0,90. 111.:. EJ
La sigt
probabilic
11l.1>. 1I1~1 \11-." zas de die
ciones o b
Asumiendo que están claras las diferencias conceptuales entre lo que
es una variable aleatoria discreta y otra continua, hemos visto en este
lema algunas de las distribuciones de probabilidad de estas últimas: la
distJibución normal -también estudiada en el tema 6 como un paradig-
ALGUNOS MODELOS DE DISTRIBUCIONES CONTINUAS DE PROBABIUDAD 531

ma especial de disuibucíón de frecuencias-la distribución chi~cuadrado,


la distribución t de Student y la distribución F de Snedecor_
En todos casos hemos hecho especial hincapié en la diferencia entre
la valiable y la distribución, es decir, entre la variable t y la distribución
t, e igualmente para las restantes. Se han definido cada una de estas varia-
bles en función de otras. Así. la variable chi-cuadrado se define en fun-
ción de otras variables con distribución normal. La variable t se ha defi-
nido en función de otras dos: una con distribución normal y otra con
distribución chi-cuadrado y, por último, la variable F se ha definido en
función de dos variables con distribución chi-cuadrado, que a su vez se
definen en función de la normal. Por tanto, no debe sorprender que todas
ellas converjan, en algún momento, en la distribución nOlma!.
Se ha prescindido de incluir la ecuación de sus respectivas funciones
de probabilidad, por su complejidad y porque podemos servimos de unas
tablas donde se recogen estas probabilidades. Además de la conveniencia
de saber utilizar estas tablas, por su relevancia con vistas al próximo cur-
SO en el que este tema se dará por sabido, es necesario conocer sus carac-
terísticas mas importantes: el rango de valor-es en el que la función está
definida, su media, varianza y aproximación a la normal, en su caso, bajo
determinadas circunstancias_
En el último tema de este texto se abor-da, a modo de introducción,
su aplicación a la inferencia estadíslica y el contraste de hipótesis, que
tratado aquí con planteamientos introductorios ilustra el grueso teóri-
co del temario de segundo curso, y tiene como única finalidad dar res-
puesta a la pregunta que puede surgirle después de haber estudiado este
tema: ¿y esto para qué sirve? No ahorre esfuerzo en intentar una lectu-
ra pausada y comprensiva a este úhimo tema y lo agradecerá el próxi-
mo curso.

1::.- 1.11 IH 1( lOS

La siguiente tabla nos indica para cuatro distribuciones continuas de


probabilidad, si la media es igualo diferente de cero, así como las valian-
zas de dichas distribuciones_ Sabiendo que cada una de éstas distribu-
ciones o bien sigue un modelo «ch¡,. cuadrado o .et» de Studenl.
que
~ste
v, V, V, V,
la
:¡: Media ;<Q O .0 O
dig- Varianza 14 2 32 1,2
532 ANÁLISIS DE DATOS EN PSICOLOGíA I ALGUNOSMOD

[!] La variable VI se distribuye según el modelo:


a) t de Studem
0 El valor
a) b: O,
bJ chi-cuadrado b) b = 5.'
e) no se puede determinar e) b =O,,
o La variable V) se distribuye según el modelo:
[I] La varial
a) chi-cuadrado a) nonm
b) I de Student b) 1 de SI
e) no se puede determinar e) F
m Los grados de libertad de la variable V2 son:
[I] Para la Yo
a) 7 a) F (4,1~
b) 4 b) F(4,J:
e) 12 e) F(4,1'
o Los grados de libenad de la variable V4 son:
0 El percer¡
a) 12 a) no exil
b) 4 b) P5 esu
e) 16 e) P5esU

En la siguiente tabla se muestra una serie de variables y su distri·


bución: ~ El percen
a)
Variable Distribución
U N(O,I) 0,20
,
V Xi ---olIIIf
p;
W N(O,I)
X xi b)

Sobre las cuales se definen las nuevas valiables:

e)

La probabilidad de obtener valores de U mayores o iguales que 2,1


Ymenores o iguales que 0,57 es:
a) P (U ~ 2,0 u (U < O,57)J = 0,7336
b) P [(U < 2,1) u (U ~ 0,57)] = 0,7336
e) P (U ~ 2,1)· P (U < 0,57) = 0,7336
:itA 1 ALGUNOS MODELOS DE DISTRIBUCIONES CONTINUAS DE PROBABILIDAD 533

m El valor de b tal que P (A oS. b) '" 0,025


a) b = 0,506
bl b = 5,06
e) b = 0,051

CD La variable Z se distribuye según la distribución:


a) nonnal estándar.
b) t de Sludent.
el F
m Para la variable Z, F(4,lS). vale:
a) F(4,15)=P(ZS4,IS)=O,2
b) F (4,15) = P (Z S 4,15) = 0,95
el F(4,15)=P(Z=4,15)=O

[2] El percentil 5 de la distribución de la variable Z:


a) no existe.
b) Ps es un valor comprendido entre O y t.
e) P s es un valor comprendido entre 4 y 6.
i- ~ El percentil 20 de la variable e, vale:
a)

PlO '"" -0,889

b)

2Q%
0,8

2,04

e)

0.20
b.O,0506
534 ANÁLISIS DE OATOS EN PSICOLOGIA 1 ALGUNOSMOD

18.8. SOU ('IO\I:S \ I.OS E.lEHCIClOS


La respl
a V1 sigue un modelo chi-euadrado porque la media es distima de cero.
La respuesta es a. B La varia"
ble con (
11 VJ sigue un modelo chi-euadrado porque la media es distinta de cero.
La respuesta es b.
te entre
sus resp
, 11

D Para V2con distribución t de .Student.la varian7.a es: o· = - -


11
,,-2
11
Por tanto 2 = - - ::::) n = 4. La respuesta es b.
11-2

a Para V4 con distribución t de .Student. la varian7..a es:

Por lamo 1,2 = - - =>


11
11 = 12. La respuesta es 3.
,
(J.
11
=--
11-2

11-2
De acuerdo con el enunciado, la representación gráfica de esta pre-
11 gunta es:
Consult

La respl

0,57 2,1 11 5Conde a)'t


un
La variable U se distribuye normalmente, por tanto, lo que tenemos 0.279 el
que calcular es: radar.

p [(V ~ 2, 1) v (V 5 0,57)] = P (V ~ 2, 1) + P (V 5 0,57) =


= 0,0179 + 0,7157 = 0,7336

ya que:
P(U~2,1)= 1-P(U52,1)= 1-0,9821 (rabIa) =0,0179

La respuesta es a.

11 lo que
valiable A es la suma de dos valiables con disllibución nonnal, por
La
se disllibuye según chi-cuadraclo dos grados de libel1ad.
con
Tambié
oblenie

Por lan
0,975
La van:
b- 0,051
11II dislribl
ALGUNOS MODELOS DE DISTRIBUCIONES CONTINUAS DE PROBABILIDAD 535
'1
P (A <b) = 0,025 => b = 0,051
La respuesta es c.


"O.
La v31iable Z es, tal y como se ha definido en el enunciado. una varia-
ble con distribución F con 8 y 6 grados de libertad ya que es el cocien-
"O.
te entre dos variables chi-cuadrado divididas, cada una de ellas. por
sus respectivos grados de libertad. La respuesta es c.

11

~-
Consuhando en la tabla, buscamos la probabilidad pedida, que es:
F (4,15) =P(Z <4,15) =0,95
La respuesta es b.

11 Con ayuda de las tablas de la disl¡ibución F, obtenemos el percemil


5 de una variable con 8 y 6 g.1. En la labia A4(a) aparece el valor
os 0,279 en el cruce de los 8 g.1 del numerador con los 6 g.1. del nume-
rador.

0,05

"'s
También se puede aplicar la propiedad inversa de la distribución F
obteniendo, como se puede comprobar, el mismo valor:

Ps =o.osF8 :6 = O.9SF6:8 = 3.58 (tabla


1
A4(c))
=0.279
Por tanto, la respuesta con-ecta es b.
La vmiable C. por definirse como el cociente entre una variable con
distribución normal y la raíz cuadrada de una variable chi-cuadra-
536 ANÁLISIS DE DATOS EN PSICOLOGfA 1

do dividida por sus grados de Iibel1ad (8), se distribuye según la dis-


tribución t de Student con 8 grados de libertad.
La tabla de la distribución t (Tabla A3) solo recoge los valores posi~
livos, es decir los valores por encima de la media, que eS cero. Como
es una dislIibución simétrica, el percentil 20 es el mismo que el per-
centil 80 pero con signo negativo. Por tanto, buscamos el percentil
80 o valor de la variable t que deja por debajo el 800A, de los valores
de la variable t con 8 g.l Yeste valor es 0.889. Entonces el percentiJ
20 es -0.889.

P80.0.889 P20. -0.889

Por tamo. la respuesta correcta es a.

También podría gustarte