Está en la página 1de 42

Qu es una Variable Aleatoria??????????

Ejemplo
Consideremos los datos de un estudio donde se les mide la talla en
centmetros a 20 jugadores del equipo Nacional de Handbol de EE. UU.
seleccionados al azar.
La ley que asocia a cada hombre con su talla es una variable aleatoria
(continua).
A esta funcin que
asocia a cada deportista
184.2
con su talla la
191.8 llamaremos variable
188.0 aleatoria y la
196.2 denotaremos por X.

178.4
.... etc

X: Talla

1
Ejemplo

X: Talla

184.2 191.8 188.0 196.2 178.4


184.2 195.4 189.2 186.0 194.3
190.5 190.5 198.1 188.0 184.2
176.5 184.2 193.5 195.6 186.3

2
Cmo ordenamos los datos???????????

En una: Tabla de Distribucin de Frecuencia

Qu es ?????

Es un arreglo de los distintos valores que toma la variable con sus


respectivas frecuencias (n de veces que aparece cada valor de la
variable en la muestra).

3
Distribucin de frecuencia de ejemplo
(TALLA)

Tabla de frecuencias

Talla f F
173.5-179.5 2 2
179.5-185.5 4 6
185.5-191.5 7 13
191.5-197.5 6 19
197.5-203.5 1 20
20

= 4
Distribucin de frecuencia de ejemplo (TALLA)
8
Histograma
7

4
f

0
173.5 179.5 185.5 191.5 197.5 203.5
Talla 5
Medidas de Resumen

Los fenmenos biolgicos no suelen ser constantes

Necesitamos conocer:

La tendencia central de los datos

La dispersin o variacin respecto de este centro

Los datos que ocupan ciertas posiciones

La simetra de los datos

La forma en que los datos se agrupan


6
Medidas representativas de un conjunto de datos
estadsticos

7
Medidas de Tendencia Central

Son medidas alrededor de las cuales se concentran los datos

Las tres medidas ms usuales de tendencia central son:

Media Mediana Moda

8
1.-Media Aritmtica (X) de una variable
aleatoria (o Promedio)
Es la suma de todos sus posibles valores dividida por el n total de
datos (n)

(Ejemplo: TALLA)
Datos:
184.2 191.8 188.0 196.2 178.4
184.2 195.4 189.2 186.0 194.3
190.5 190.5 198.1 188.0 184.2
176.5 184.2 193.5 195.6 186.3

_
X
184 .2 191 .8 188 .0 ... 193 .5 195 .6 186 .3 188 .75 188 .8
20 9
2.- Mediana(Med) de una variable aleatoria

Es el primer valor de la variable que deja por debajo y por


sobre de s al 50 % de las observaciones.

Primero !!!!! Ordenamos los valores de menor a mayor

Si n es el nmero de observaciones:

a) n impar: mediana es el nico valor central

b) n par: mediana es el promedio de los dos valores centrales

10
Si la variable es la talla

11
(Ejemplo: TALLA)

Datos ordenados:

50 * 20 20
50% de 20 10 datos
100 2

176.5, 178.4, 184.2, 184.2, 184.2, 184.2, 186.0, 186.3, 188.0, 188.0,
189.2, 190.5, 190.5, 191.8, 193.5, 194.3, 195.4, 195.6, 196.2, 198.1

10 datos

n= 20 par Mediana 188.0 189.2


Promedio de 2 valores Med 188.6
centrales 2
Dejan aproximadamente
50% de los datos bajo y
sobre s (aprox. 10 datos)
12
(Ejemplo: PESO)

Datos ordenados:

50 * 21 21
50% de 21 10.5 10 datos
100 2

39, 40, 42, 49, 51, 54, 56, 57, 58, 58, 58, 59, 63, 64, 66, 68,
69, 70, 70, 71,72

n= 21 impar Med=58
Mediana
valor central nico
Deja aproximadamente
50% de los datos bajo y 13
sobre s (aprox. 10 datos)
Sea X una variable discreta con los siguientes valores:

X: 2, 5, 7, 12

Media= (2+5+7+12)/4=6.5 Mediana= (5+7)/2= 6

Si cambiamos la ltima observacin por otra


extraamente grande

X: 2, 5, 7, 125

Media= (2+5+7+125)/4=34.75 Mediana=(5+7)/2= 6

Conclusin:
La Media es afectada por valores extremos,
no as, la Mediana 14
Ejercicio
Cul de los dos valores es ms adecuado para la distribucin de los
datos, la Media o la Mediana???

Lmite f c F
real Media X 32.75
0-10 60 5 60
Mediana 15
10-20 80 15 140

20-30 30 25 170

30-100 20 65 190

100-500 10 300 200

200
15
La medida de tendencia central ms adecuada para describir estos
16
3.- Moda de una variable aleatoria

Es aquel valor de la variable con mayor frecuencia


absoluta.

Puede no ser nica

17
(Ejemplo: TALLA)

Como conocemos cada uno de los datos, podemos ver el que


ms se repite:

Moda= 184.2

18
Medidas de Posicin

Dividen el conjunto de datos ordenados en partes iguales

Las dos medidas de posicin ms usuales son:

Percentiles Cuartiles

19
1.-Percentiles

Son 99 valores que dividen en 100 partes iguales el conjunto de


datos ordenados. Ejemplo, el percentil de orden 67 deja por debajo de
s el 67% de las observaciones, y por encima queda el 33%

PERCENTIL DE ORDEN k:
Es la observacin, Pk, que deja por debajo de s el k% de la
poblacin.

P25 Deja debajo de s el 25% de los datos ordenados

P50 Deja debajo de s el 50% de los datos ordenados Mediana

P75= Deja debajo de s el 75% de los datos ordenados20


Si n es el nmero de observaciones:

1) Primero ordenamos las observaciones de menor a mayor

2) Calculamos el k% de n k *n
k % de n
100

3)Contando los datos desde el valor menor al mayor, el percentil de


orden k ser aquel valor de la variable ubicado en la posicin nmero:

k *n
100

21
(Ejemplo: TALLA)

Datos ordenados:

Calculemos el percentil de orden 67% n= 20


67 * 20
67% de 20 13.4 13 datos
100

176.5, 178.4, 184.2, 184.2, 184.2, 184.2, 186.0, 186.3, 188.0, 188.0,
189.2, 190.5, 190.5, 191.8, 193.5, 194.3, 195.4, 195.6, 196.2, 198.1

P67
P67 191.8
Deja aproximadamente
67% de los datos bajo de s
(aprox. 13 datos), y el 33% 22
sobre s
2.-Cuartiles

Son los 3 valores que dividen al conjunto de datos ordenados en cuatro


partes iguales

P25
Primer cuartil (Q1)

Segundo cuartil (Q2) P50=Mediana

Tercer cuartil (Q3) P75

23
Medidas de Dispersin

Cuantifican la separacin o la variabilidad de los valores de la


distribucin respecto al valor central.

Nos dicen hasta qu punto las medidas de tendencia central


son representativas como sntesis de la informacin.

Las ms usadas son:

Rango(Recorrido)
Desviacin Estndard

24
1.-Rango o Recorrido

RANGO (RECORRIDO) = Valor Mximo - Valor Mnimo.

Inconvenientes del RANGO (RECORRIDO):

No utiliza todas las observaciones (slo dos de ellas).

Se puede ver muy afectado por alguna observacin extrema.

El rango aumenta con el nmero de observaciones, o bien se


queda igual. En cualquier caso, nunca disminuye.
25
(Ejemplo: TALLA)

176.5, 178.4, 184.2, 184.2, 184.2, 184.2, 186.0, 186.3, 188.0, 188.0,
189.2, 190.5, 190.5, 191.8, 193.5, 194.3, 195.4, 195.6, 196.2, 198.1

Valor Mnimo= 176.5 Valor Mximo= 198.1

Rango o Recorrido= 198.1 176.5= 21.6

Slo depende del valor mximo (198.1) y del valor Mnimo (176.5)

26
(Ejercicio: Concentracin urinaria de plomo en nios

Concentracin de (x-promedio)
plomo (mol/24hr)
0.2 0.2 - 1.2= -1
1.5 1.5 - 1.2=0.3
0.6 0.6 - 1.2= -0.6
2.0 2.0 - 1.2=0.8
0.8 0.8 - 1.2=-0.4
2.1 2.1 - 1.2=0.9

x 1.2 x 1 0.3 0.6 0.8 0.4 0.9 0


27
solucin
n
n n
ix x 2

xi x 0
ix x 2
S2= i 1
i 1
i 1
n 1

28
2.-Varianza (S2) y desviacin estndar(S)

Es la media de las diferencias cuadrtica de n puntua-


ciones con respecto a su media aritmtica.
n

ix x 2

S2 i 1
n 1
Desviacin Estndar (S):

29
(Ejemplo: TALLA)

Datos:
n 20
184.2 191.8 188.0 196.2 178.4
_
184.2 195.4 189.2 186.0 194.3 X 188,8
190.5 190.5 198.1 188.0 184.2
176.5 184.2 193.5 195.6 186.3

(184.2 188.8) 2 191.8 188.8 188.0 188.8 ... 195.6 188.8 186.3 188.8
2 2 2 2
s
2
34.5
20 1

s 34.5 5.9
30
En SPSS

31
Medidas de Forma

1.- Asimetra

Coef. de Coef. de Coef. de 32


Asimetra <0 Asimetra =0 Asimetra >0
Ejemplo

Moda <Mediana<Media
33
En SPSS

Moda <MedianaMedia Si bien se nota una leve cola hacia la


izquierda, la asimetra es sutil por ello
34 que

los valores son cercanos


2.- Apuntamiento o curtosis

Curtosis >0 Curtosis =0 Curtosis <0

Distribucin mesocrtica : presenta un grado de concentracin medio alrededor de los valores


centrales de la variable (el mismo que presenta una distribucin normal).

Distribucin leptocrtica : presenta un elevado grado de concentracin alrededor de los valores centrales de la variable.
35
En SPSS

36
En SPSS

37
Ejercicio

Datos I:
2, 3, 3, 3, 4, 4, 4, 4, 5, 5, 5, 5, 5 Promedio=
Mediana=

Datos II:
3, 3, 3, 3, 3, 4, 4, 4, 4, 5, 5, 5, 6 Promedio=
Mediana=

Datos III:

2, 3, 3, 4, 4, 4, 4, 4, 4, 4, 5, 5, 6 Promedio=
Mediana=
Datos IV:

3, 3, 3, 3, 3, 3, 4, 5, 5, 5, 5, 5, 5 Promedio=
Mediana=38
Datos x Med Moda Rango P25 P75 P75-P25 S
I 4 4 5 3 3 5 2 1
II 4 4 3 3 3 5 2 1
III 4 4 4 4 4 4 0 1
IV 4 4 3y5 2 3 5 2 1
Distribucin I Distribucin II
6 6

5 5

4 4
No of obs

No of obs
3 3

2 2

1 1

0 0
2 3 4 5 3 4 5 6

Distribucin III Distribucin IV


8 7

7
6

6
5

5
4
No of obs
No of obs

4
3
3

2
2

1
1
39
0
0
3 4 5
2 3 4 5 6
Importante para describir los datos!!!!!!!!!!!!......

Medidas de Tendencia Central

+
Medidas de Dispersin

+
Medidas de posicin

+
Grficos:Histograma, BoxPlot 40
RESUMEN : Medidas descriptivas

Posicin
Dividen un conjunto ordenado de datos en grupos con la
misma cantidad de datos
. Percentiles, cuartiles
Centralizacin
Indican valores respecto alos cuales los datos parecen
agrupares
. Media, mediana y moda
Dispersin
Indican la mayor o menor concentracin de los datos con
respecto a las medidas de centralizacin
. Varianza, desviacin estndar, rango o recorrido
Forma
Asimetra y apuntamiento 41
Eleccin de medidas de tendencia central y de
dispersin

Variable Nominal Moda

Moda
Variable Ordinal Mediana

Percentiles

Variable Contnua:
Mediana
Con distribucin desconocida o asimtrica
Percentiles

Con distribucin simtrica y unimodal (Ej: Normal)

Media
42
Desviacin estndard

También podría gustarte