Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Sesion 4 Taller Spss
Sesion 4 Taller Spss
Ejemplo
Consideremos los datos de un estudio donde se les mide la talla en
centmetros a 20 jugadores del equipo Nacional de Handbol de EE. UU.
seleccionados al azar.
La ley que asocia a cada hombre con su talla es una variable aleatoria
(continua).
A esta funcin que
asocia a cada deportista
184.2
con su talla la
191.8 llamaremos variable
188.0 aleatoria y la
196.2 denotaremos por X.
178.4
.... etc
X: Talla
1
Ejemplo
X: Talla
2
Cmo ordenamos los datos???????????
Qu es ?????
3
Distribucin de frecuencia de ejemplo
(TALLA)
Tabla de frecuencias
Talla f F
173.5-179.5 2 2
179.5-185.5 4 6
185.5-191.5 7 13
191.5-197.5 6 19
197.5-203.5 1 20
20
= 4
Distribucin de frecuencia de ejemplo (TALLA)
8
Histograma
7
4
f
0
173.5 179.5 185.5 191.5 197.5 203.5
Talla 5
Medidas de Resumen
Necesitamos conocer:
7
Medidas de Tendencia Central
8
1.-Media Aritmtica (X) de una variable
aleatoria (o Promedio)
Es la suma de todos sus posibles valores dividida por el n total de
datos (n)
(Ejemplo: TALLA)
Datos:
184.2 191.8 188.0 196.2 178.4
184.2 195.4 189.2 186.0 194.3
190.5 190.5 198.1 188.0 184.2
176.5 184.2 193.5 195.6 186.3
_
X
184 .2 191 .8 188 .0 ... 193 .5 195 .6 186 .3 188 .75 188 .8
20 9
2.- Mediana(Med) de una variable aleatoria
Si n es el nmero de observaciones:
10
Si la variable es la talla
11
(Ejemplo: TALLA)
Datos ordenados:
50 * 20 20
50% de 20 10 datos
100 2
176.5, 178.4, 184.2, 184.2, 184.2, 184.2, 186.0, 186.3, 188.0, 188.0,
189.2, 190.5, 190.5, 191.8, 193.5, 194.3, 195.4, 195.6, 196.2, 198.1
10 datos
Datos ordenados:
50 * 21 21
50% de 21 10.5 10 datos
100 2
39, 40, 42, 49, 51, 54, 56, 57, 58, 58, 58, 59, 63, 64, 66, 68,
69, 70, 70, 71,72
n= 21 impar Med=58
Mediana
valor central nico
Deja aproximadamente
50% de los datos bajo y 13
sobre s (aprox. 10 datos)
Sea X una variable discreta con los siguientes valores:
X: 2, 5, 7, 12
X: 2, 5, 7, 125
Conclusin:
La Media es afectada por valores extremos,
no as, la Mediana 14
Ejercicio
Cul de los dos valores es ms adecuado para la distribucin de los
datos, la Media o la Mediana???
Lmite f c F
real Media X 32.75
0-10 60 5 60
Mediana 15
10-20 80 15 140
20-30 30 25 170
30-100 20 65 190
200
15
La medida de tendencia central ms adecuada para describir estos
16
3.- Moda de una variable aleatoria
17
(Ejemplo: TALLA)
Moda= 184.2
18
Medidas de Posicin
Percentiles Cuartiles
19
1.-Percentiles
PERCENTIL DE ORDEN k:
Es la observacin, Pk, que deja por debajo de s el k% de la
poblacin.
2) Calculamos el k% de n k *n
k % de n
100
k *n
100
21
(Ejemplo: TALLA)
Datos ordenados:
176.5, 178.4, 184.2, 184.2, 184.2, 184.2, 186.0, 186.3, 188.0, 188.0,
189.2, 190.5, 190.5, 191.8, 193.5, 194.3, 195.4, 195.6, 196.2, 198.1
P67
P67 191.8
Deja aproximadamente
67% de los datos bajo de s
(aprox. 13 datos), y el 33% 22
sobre s
2.-Cuartiles
P25
Primer cuartil (Q1)
23
Medidas de Dispersin
Rango(Recorrido)
Desviacin Estndard
24
1.-Rango o Recorrido
176.5, 178.4, 184.2, 184.2, 184.2, 184.2, 186.0, 186.3, 188.0, 188.0,
189.2, 190.5, 190.5, 191.8, 193.5, 194.3, 195.4, 195.6, 196.2, 198.1
Slo depende del valor mximo (198.1) y del valor Mnimo (176.5)
26
(Ejercicio: Concentracin urinaria de plomo en nios
Concentracin de (x-promedio)
plomo (mol/24hr)
0.2 0.2 - 1.2= -1
1.5 1.5 - 1.2=0.3
0.6 0.6 - 1.2= -0.6
2.0 2.0 - 1.2=0.8
0.8 0.8 - 1.2=-0.4
2.1 2.1 - 1.2=0.9
xi x 0
ix x 2
S2= i 1
i 1
i 1
n 1
28
2.-Varianza (S2) y desviacin estndar(S)
S2 i 1
n 1
Desviacin Estndar (S):
29
(Ejemplo: TALLA)
Datos:
n 20
184.2 191.8 188.0 196.2 178.4
_
184.2 195.4 189.2 186.0 194.3 X 188,8
190.5 190.5 198.1 188.0 184.2
176.5 184.2 193.5 195.6 186.3
(184.2 188.8) 2 191.8 188.8 188.0 188.8 ... 195.6 188.8 186.3 188.8
2 2 2 2
s
2
34.5
20 1
s 34.5 5.9
30
En SPSS
31
Medidas de Forma
1.- Asimetra
Moda <Mediana<Media
33
En SPSS
Distribucin leptocrtica : presenta un elevado grado de concentracin alrededor de los valores centrales de la variable.
35
En SPSS
36
En SPSS
37
Ejercicio
Datos I:
2, 3, 3, 3, 4, 4, 4, 4, 5, 5, 5, 5, 5 Promedio=
Mediana=
Datos II:
3, 3, 3, 3, 3, 4, 4, 4, 4, 5, 5, 5, 6 Promedio=
Mediana=
Datos III:
2, 3, 3, 4, 4, 4, 4, 4, 4, 4, 5, 5, 6 Promedio=
Mediana=
Datos IV:
3, 3, 3, 3, 3, 3, 4, 5, 5, 5, 5, 5, 5 Promedio=
Mediana=38
Datos x Med Moda Rango P25 P75 P75-P25 S
I 4 4 5 3 3 5 2 1
II 4 4 3 3 3 5 2 1
III 4 4 4 4 4 4 0 1
IV 4 4 3y5 2 3 5 2 1
Distribucin I Distribucin II
6 6
5 5
4 4
No of obs
No of obs
3 3
2 2
1 1
0 0
2 3 4 5 3 4 5 6
7
6
6
5
5
4
No of obs
No of obs
4
3
3
2
2
1
1
39
0
0
3 4 5
2 3 4 5 6
Importante para describir los datos!!!!!!!!!!!!......
+
Medidas de Dispersin
+
Medidas de posicin
+
Grficos:Histograma, BoxPlot 40
RESUMEN : Medidas descriptivas
Posicin
Dividen un conjunto ordenado de datos en grupos con la
misma cantidad de datos
. Percentiles, cuartiles
Centralizacin
Indican valores respecto alos cuales los datos parecen
agrupares
. Media, mediana y moda
Dispersin
Indican la mayor o menor concentracin de los datos con
respecto a las medidas de centralizacin
. Varianza, desviacin estndar, rango o recorrido
Forma
Asimetra y apuntamiento 41
Eleccin de medidas de tendencia central y de
dispersin
Moda
Variable Ordinal Mediana
Percentiles
Variable Contnua:
Mediana
Con distribucin desconocida o asimtrica
Percentiles
Media
42
Desviacin estndard