Está en la página 1de 42

Qu es una Variable Aleatoria??????????

Ejemplo
Consideremos los datos de un estudio donde se les mide la talla en centmetros a 20 jugadores del equipo Nacional de Handbol de EE. UU. seleccionados al azar. La ley que asocia a cada hombre con su talla es una variable aleatoria (continua). A esta funcin que asocia a cada deportista 184.2 con su talla la 191.8 llamaremos variable aleatoria y la 188.0 denotaremos por X. 196.2 178.4

.... etc

X: Talla

Ejemplo
X: Talla

184.2 184.2 190.5 176.5

191.8 195.4 190.5 184.2

188.0 189.2 198.1 193.5

196.2 186.0 188.0 195.6

178.4 194.3 184.2 186.3

Cmo ordenamos los datos???????????


En una: Tabla de Distribucin de Frecuencia

Qu es ?????

Es un arreglo de los distintos valores que toma la variable con sus respectivas frecuencias (n de veces que aparece cada valor de la variable en la muestra).

Distribucin de frecuencia de ejemplo (TALLA)


Tabla de frecuencias

Talla 173.5-179.5
179.5-185.5 185.5-191.5

f
2 4 7 6

F
2 6 13 19

191.5-197.5
197.5-203.5

1
20

20

Distribucin de frecuencia de ejemplo (TALLA)


8 7 6 5 4 3 2 1 0 173.5 179.5 185.5 191.5 197.5 203.5
5

Histograma

Talla

Medidas de Resumen
Los fenmenos biolgicos no suelen ser constantes
Necesitamos conocer:

La tendencia central de los datos

La dispersin o variacin respecto de este centro


Los datos que ocupan ciertas posiciones

La simetra de los datos


La forma en que los datos se agrupan
6

Medidas representativas de un conjunto de datos estadsticos

Medidas de Tendencia Central

Son medidas alrededor de las cuales se concentran los datos

Las tres medidas ms usuales de tendencia central son:

Media

Mediana

Moda
8

1.-Media Aritmtica (X) de una variable aleatoria (o Promedio)


Es la suma de todos sus posibles valores dividida por el n total de datos (n)

(Ejemplo: TALLA)
Datos:
184.2 184.2 191.8 195.4 188.0 189.2 196.2 186.0 178.4 194.3

190.5
176.5

190.5
184.2

198.1
193.5

188.0
195.6

184.2
186.3

184.2 191.8 188.0 ... 193.5 195.6 186.3 188.75 188.8


20
9

2.- Mediana(Med) de una variable aleatoria


Es el primer valor de la variable que deja por debajo y por sobre de s al 50 % de las observaciones.

Primero !!!!! Ordenamos los valores de menor a mayor


Si n es el nmero de observaciones:

a) n impar: mediana es el nico valor central

b) n par: mediana es el promedio de los dos valores centrales

10

Si la variable es la talla

11

(Ejemplo: TALLA)
Datos ordenados:

50% de 20

50 * 20 20 10 datos 100 2

176.5, 178.4, 184.2, 184.2, 184.2, 184.2, 186.0, 186.3, 188.0, 188.0, 189.2, 190.5, 190.5, 191.8, 193.5, 194.3, 195.4, 195.6, 196.2, 198.1

10 datos

n= 20

par

Mediana
Promedio de 2 valores centrales

Med

188.0 189.2 188.6 2

Dejan aproximadamente 50% de los datos bajo y sobre s (aprox. 10 datos)

12

(Ejemplo: PESO)
Datos ordenados:

50% de 21

50 * 21 21 10.5 10 datos 100 2

39, 40, 42, 49, 51, 54, 56, 57, 58, 58, 58, 59, 63, 64, 66, 68, 69, 70, 70, 71,72

n= 21

impar

Mediana
valor central nico Deja aproximadamente 50% de los datos bajo y sobre s (aprox. 10 datos)

Med=58

13

Sea X una variable discreta con los siguientes valores: X: 2, 5, 7, 12


Media= (2+5+7+12)/4=6.5 Mediana= (5+7)/2= 6

Si cambiamos la ltima observacin por otra extraamente grande

X: 2, 5, 7, 125
Media= (2+5+7+125)/4=34.75

Mediana= (5+7)/2= 6

Conclusin:
La Media es afectada por valores extremos, no as, la Mediana

14

Ejercicio
Cul de los dos valores es ms adecuado para la distribucin de los datos, la Media o la Mediana???

Lmite real
0-10 10-20 20-30 30-100 100-500

f
60 80 30 20 10 200

c
5 15 25 65 300

F
60 140 170 190 200

Media X 32.75 Mediana 15

15

La medida de tendencia central ms adecuada para describir estos 16

3.- Moda de una variable aleatoria


Es aquel valor de la variable con mayor frecuencia absoluta. Puede no ser nica

17

(Ejemplo: TALLA)

Como conocemos cada uno de los datos, podemos ver el que ms se repite:

Moda= 184.2

18

Medidas de Posicin

Dividen el conjunto de datos ordenados en partes iguales

Las dos medidas de posicin ms usuales son:

Percentiles

Cuartiles
19

1.-Percentiles
Son 99 valores que dividen en 100 partes iguales el conjunto de datos ordenados. Ejemplo, el percentil de orden 67 deja por debajo de

s el 67% de las observaciones, y por encima queda el 33%


PERCENTIL DE ORDEN k: Es la observacin, Pk, que deja por debajo de s el k% de la poblacin.

P25 P50 P75=

Deja debajo de s el 25% de los datos ordenados Deja debajo de s el 50% de los datos ordenados
Mediana

Deja debajo de s el 75% de los datos ordenados 20

Si n es el nmero de observaciones:

1) Primero ordenamos las observaciones de menor a mayor 2) Calculamos el k% de n

k % de n

k *n 100

3)Contando los datos desde el valor menor al mayor, el percentil de orden k ser aquel valor de la variable ubicado en la posicin nmero:

k *n 100
21

(Ejemplo: TALLA)
Datos ordenados: Calculemos el percentil de orden 67% n= 20

67% de 20

67 * 20 13.4 13 datos 100

176.5, 178.4, 184.2, 184.2, 184.2, 184.2, 186.0, 186.3, 188.0, 188.0, 189.2, 190.5, 190.5, 191.8, 193.5, 194.3, 195.4, 195.6, 196.2, 198.1

P67
Deja aproximadamente 67% de los datos bajo de s (aprox. 13 datos), y el 33% sobre s

P67 191 .8
22

2.-Cuartiles
Son los 3 valores que dividen al conjunto de datos ordenados en cuatro partes iguales

Primer cuartil (Q1)

P25

Segundo cuartil (Q2)

P50=Mediana

Tercer cuartil (Q3)

P75

23

Medidas de Dispersin
Cuantifican la separacin o la variabilidad de los valores de la distribucin respecto al valor central.

Nos dicen hasta qu punto las medidas de tendencia central son representativas como sntesis de la informacin. Las ms usadas son:

Rango(Recorrido)

Desviacin Estndard
24

1.-Rango o Recorrido

RANGO (RECORRIDO) = Valor Mximo - Valor Mnimo.

Inconvenientes del RANGO (RECORRIDO): No utiliza todas las observaciones (slo dos de ellas). Se puede ver muy afectado por alguna observacin extrema. El rango aumenta con el nmero de observaciones, o bien se
25

queda igual. En cualquier caso, nunca disminuye.

(Ejemplo: TALLA)
176.5, 178.4, 184.2, 184.2, 184.2, 184.2, 186.0, 186.3, 188.0, 188.0, 189.2, 190.5, 190.5, 191.8, 193.5, 194.3, 195.4, 195.6, 196.2, 198.1

Valor Mnimo= 176.5

Valor Mximo=

198.1

Rango o Recorrido=

198.1 176.5= 21.6

Slo depende del valor mximo (198.1) y del valor Mnimo (176.5)
26

(Ejercicio: Concentracin urinaria de plomo en nios

Concentracin de plomo (mol/24hr) 0.2 1.5 0.6 2.0 0.8 2.1

(x-promedio) 0.2 - 1.2= -1 1.5 - 1.2=0.3 0.6 - 1.2= -0.6 2.0 - 1.2=0.8 0.8 - 1.2=-0.4 2.1 - 1.2=0.9

x 1.2

x 1 0.3 0.6 0.8 0.4 0.9

0
27

solucin

xi x 0
i 1

2 x x i i 1

S2=

2 x x i i 1

n 1

28

2.-Varianza (S2) y desviacin estndar(S)


Es la media de las diferencias cuadrtica de n puntua-

ciones con respecto a su media aritmtica.


2 x x i i 1 n

S2
Desviacin Estndar (S):

n 1

29

(Ejemplo: TALLA)
Datos:

n 20
184.2 184.2 190.5 191.8 195.4 190.5 188.0 189.2 198.1 196.2 186.0 188.0 178.4 194.3 184.2

X 188,8

176.5

184.2

193.5

195.6
2

186.3
2 2 2

(184.2 188.8) 2 191.8 188.8 188.0 188.8 ... 195.6 188.8 186.3 188.8 s 34.5 20 1
2

s 34 .5 5.9
30

En SPSS

31

Medidas de Forma

1.- Asimetra

Coef. de Asimetra <0

Coef. de
Asimetra =0

Coef. de Asimetra >0

32

Ejemplo

Moda <Mediana<Media

33

En SPSS

Moda <MedianaMedia

Si bien se nota una leve cola hacia la izquierda, la asimetra es sutil por ello 34 que los valores son cercanos

2.- Apuntamiento o curtosis

Curtosis >0

Curtosis =0

Curtosis <0

Distribucin mesocrtica : presenta un grado de concentracin medio alrededor de los valores centrales de la variable (el mismo que presenta una distribucin normal).

Distribucin leptocrtica : presenta un elevado grado de concentracin alrededor de los valores centrales de la variable.

35

En SPSS

36

En SPSS

37

Ejercicio
Datos I: 2, 3, 3, 3, 4, 4, 4, 4, 5, 5, 5, 5, 5

Promedio= Mediana=

Datos II: 3, 3, 3, 3, 3, 4, 4, 4, 4, 5, 5, 5, 6

Promedio= Mediana=

Datos III: 2, 3, 3, 4, 4, 4, 4, 4, 4, 4, 5, 5, 6 Datos IV: 3, 3, 3, 3, 3, 3, 4, 5, 5, 5, 5, 5, 5 Promedio=


38 Mediana=

Promedio= Mediana=

Datos

Med

Moda Rango

P25

P75

P75-P25

I
II III

4
4 4

4
4 4

5
3 4

3
3 4

3
3 4

5
5 4

2
2 0

1
1 1

IV
6

4
Distribucin I

3y5

2
6

5
Distribucin II

No of obs

No of obs
2 3 4 5

0 3 4 5 6

Distribucin III
8
7

Distribucin IV
6

6
5

No of obs

No of obs

3
2

2
1

1
0

39
3 4 5

0 2 3 4 5 6

Importante para describir los datos!!!!!!!!!!!!......

Medidas de Tendencia Central

+
Medidas de Dispersin

+
Medidas de posicin

+
Grficos:Histograma, BoxPlot
40

RESUMEN : Medidas descriptivas Posicin Dividen un conjunto ordenado de datos en grupos con la misma cantidad de datos . Percentiles, cuartiles Centralizacin Indican valores respecto alos cuales los datos parecen agrupares

. Media, mediana y moda


Dispersin Indican la mayor o menor concentracin de los datos con respecto a las medidas de centralizacin . Varianza, desviacin estndar, rango o recorrido Forma Asimetra y apuntamiento
41

Eleccin de medidas de tendencia central y de dispersin


Variable Nominal Moda Variable Ordinal Variable Contnua: Moda Mediana Percentiles Mediana Percentiles

Con distribucin desconocida o asimtrica

Con distribucin simtrica y unimodal (Ej: Normal) Media

Desviacin estndard

42

También podría gustarte