Está en la página 1de 13

Tema 2: MEDIDAS DESCRIPTIVAS DE LOS DATOS 1.

MEDIDAS DE CENTRALIZACIN:
Media Mediana Moda Cuantiles Otras Desviacin tpica Varianza Rango Otras

2. MEDIDAS DE DISPERSIN:

3. MEDIDAS DE FORMA:
Asimetra Apuntamiento

4. REPRESENTACIN GRFICA:
Diagrama de caja

@Blanca Arteaga (Departamento de Estadstica)

MEDIDAS DESCRIPTIVAS
Para qu nos sirven? Se pueden calcular todas con todo tipo de variables? Cules son las ms adecuadas en cada caso? De qu forma podemos sacar partido a nuestra calculadora?

@Blanca Arteaga (Departamento de Estadstica)

MEDIDAS DE CENTRALIZACIN(1) Qu SON? LA MODA: (Cuando los datos no estn agrupados en intervalos) Es el valor que aparece con una frecuencia mayor. Puede haber ms de una: unimodal-bimodal-trimodal-plurimodal
7 11 10 7 2 2 7 11 5 5 7 3 4 5 8 11 8 7 7

Qu valor toma la moda?

@Blanca Arteaga (Departamento de Estadstica)

LA MODA: (Cuando los datos estn agrupados en intervalos)


Clases [0,5) [5,10) [10,15) [15,20) [20,25) [25,30) ni 11 13 6 2 1 3 Marca de clase

Podemos encontrar: La CLASE MODAL En la representacin grfica? Pero, y si queremos calcular exactamente el valor de la MODA?

Mo = Li 1 +

d i +1 l d i 1 + d i +1 i

Podemos calcularla para DATOS CUALITATIVOS?


@Blanca Arteaga (Departamento de Estadstica)

EJERCICIO 3: LA MODA
Intervalo Frecuencia absoluta

[0,5)

[5,10)

14

[10,15)

20

[15,20)

10

Calcular el valor exacto de la moda.

@Blanca Arteaga (Departamento de Estadstica)

EJERCICIO 4: LA MODA

Clases [0,0.30) [0.30,0.60) [0.60,1.20) [1.20,3.00) [3.00,6.00) [6.00,9.00)

ni 15 21 36 18 6 3

Marca de clase

Calcular el valor exacto de la moda.

@Blanca Arteaga (Departamento de Estadstica)

MEDIDAS DE CENTRALIZACIN(2)

LA MEDIANA: (Cuando los datos no estn agrupados en intervalos) Es la observacin que ocupa el lugar central

7 11 10

7 2 2

7 11 5

5 7

3 4

5 8

11 8

7 7

Qu valor toma la mediana? 1. 2. 3. Ordenamos los datos de menor a mayor. Tenemos en cuenta tambin los que se repiten. La mediana, es el CENTRO FSICO Cmo cambia el clculo si N es par o impar?
@Blanca Arteaga (Departamento de Estadstica)

LA MEDIANA: (Cuando los datos estn agrupados en intervalos)


Clases [0,5) [5,10) [10,15) [15,20) [20,25) [25,30) ni 13 11 6 2 1 3 Marca de clase

Podemos encontrar: El INTERVALO MEDIANO

Pero, y si queremos calcular exactamente el valor de la MEDIANA?

Me = Li 1

+ 2

Ni 1

ni

li

Podemos calcularla para DATOS CUALITATIVOS?


@Blanca Arteaga (Departamento de Estadstica)

MEDIDAS DE CENTRALIZACIN(3)
LA MEDIA ARITMTICA: (Cuando los datos no estn agrupados en intervalos) Es el PROMEDIO de los valores de la muestra
7 11 10 7 2 2 7 11 5 5 7 3 4 5 8 11 8 7 7

Qu valor toma la media? 1. 2. Sumamos los datos. Los dividimos por el nmero total de datos (N).

X =

xi i
=1

x 1+x 2 + ... + x N N

@Blanca Arteaga (Departamento de Estadstica)

LA MEDIA ARITMTICA: (Cuando los datos estn agrupados en intervalos)


Clases [0,5) [5,10) [10,15) [15,20) [20,25) [25,30) ni 13 11 6 2 1 3 Marca de clase

El valor de la media con los datos agrupados en intervalos utiliza la marca de clase.

Podemos calcularla para DATOS CUALITATIVOS?


@Blanca Arteaga (Departamento de Estadstica)

La MEDIA ARITMTICA para datos agrupados en intervalos es entonces:

X =

xi ni i
=1

, siendo "k" el n de intervalos

MEDIDAS DE CENTRALIZACIN(4)
LA MEDIA PONDERADA: (Cuando los datos no estn agrupados en intervalos) Es el PROMEDIO de los valores de la muestra, dando mayor importancia a unos datos frente a otros Para la calificacin final de una asignatura, se tendrn en cuenta: 1. Nota del examen final: 70% 2. Trabajos y ejercicios: 20% 3. Asistencia: 10% Un alumno que tuvo un 6 en el examen final; un 7 en trabajos; y, asisti todos los das a clase, por lo tanto un 10, cul ser su nota final en la asignatura?
@Blanca Arteaga (Departamento de Estadstica)

MEDIDAS DE CENTRALIZACIN(5)
LOS CUANTILES: (Cuando los datos no estn agrupados en intervalos) Nos divide en conjunto de datos en k partes. Si por EJEMPLO tenemos diez datos (N=10), y queremos hacer cuatro partes (k=4), necesitamos tres marcas (c1, c2 y c3)

Cuando k=4, se llaman CUARTILES; cuando k=10, DECILES; y cuando k=100, CENTILES. @Blanca Arteaga (Departamento de Estadstica)

CLCULO DE CUARTILES

Tenemos el siguiente conjunto de datos:

47 72
1. 2. 3. 4.

52 72

52 78

57 81

63 81

64 86

69 91

71

Ordenamos los datos de menor a mayor. Calculamos c2 , que ocupa la posicin correspondiente a la mitad, con qu parmetro visto ya coincide este segundo cuartil? Ahora calculamos, la mitad de la primera parte: c1 . Y la mitad de la segunda parte: c3 Posicin de c1 = (N+1)/4 Posicin de c2 = 2(N+1)/4 = (N+1)/2 Posicin de c3 = 3(N+1)/4

@Blanca Arteaga (Departamento de Estadstica)

REPRESENTACIN GRFICA UTILIZANDO LOS CUARTILES El diagrama de caja

Utilizando el anterior conjunto de datos:


1. Los clculos: Primer cuartil: 57 Segundo cuartil: 71 Tercer cuartil: 81 Media aritmtica: 69,0667 2. Hay datos que pueden provenir de observaciones mal tomadas: datos atpicos. Para detectarlas, calculamos: LI=c1-1,5(c3-c1) LS=c3+1,5(c3-c1)
Box-and-Whisker Plot

47

57

67

77

87

97

@Blanca Arteaga (Departamento de Estadstica)

EJERCICIO 5: DIAGRAMA DE CAJA 56 69 83 59 73 83 59 76 84 61 76 90 67 80 94

Construir el diagrama de caja para el anterior conjunto de datos.

@Blanca Arteaga (Departamento de Estadstica)

EJERCICIO 6: DIAGRAMA DE CAJA 35 64 82 97 140 45 65 84 112 143 45 73 86 116 173 55 74 92 116 214 57 74 92 123 255 62 76 92 123 277 64 78 93 124 64 80 94 128

Construir el diagrama de caja para el anterior conjunto de datos.

@Blanca Arteaga (Departamento de Estadstica)

MEDIDAS DE DISPERSIN (1) LA VARIANZA


PRIMER CONJUNTO DE DATOS (Salarios anuales en de la empresa A) 30700 32500 32900 33800 34100 34500 36000 SEGUNDO CONJUNTO DE DATOS (Salarios anuales en de la empresa B) 27500 31600 31700 33800 35300 34000 40600 Vamos a calcular: MEDIA y MEDIANA de ambos conjuntos de datos:

Observa ahora las representaciones grficas. Seala media y mediana. Tenemos suficiente informacin?

@Blanca Arteaga (Departamento de Estadstica)

Parece que la diferencia son las DISTANCIAS A LA MEDIA, vamos a calcularlas.


Empresa A 30700 32500 32900 33800 34100 34500 36000 x i- X -2800 -1000 -600 300 600 1000 2500 Empresa B 27500 31600 31700 33800 34000 35300 40600 x i- X -6000 -1900 -1800 300 500 1800 7100

Cunto suman nuestras dos nuevas columnas? NUEVA PROPIEDAD:

(x i i
N
=1

X = 0

Por qu sucede esto? Podemos solucionarlo de alguna manera?

@Blanca Arteaga (Departamento de Estadstica)

Modificamos nuestro clculo:


Empresa A 30700 32500 32900 33800 34100 34500 36000 7840000 1000000 360000 90000 360000 1000000 6250000 16900000 Empresa B 27500 31600 31700 33800 34000 35300 40600 36000000 3610000 3240000 90000 3240000 250000 50410000 96840000

Qu hacemos para poder compararlas? NUEVA DEFINICIN:

(xi i
N
=1

Qu indica este nuevo parmetro?

Qu unidades tiene este nuevo parmetro? Podemos cambiarlas?


@Blanca Arteaga (Departamento de Estadstica)

MEDIDAS DE DISPERSIN (2) EL COEFICIENTE DE VARIACIN Cuando la media sea distinta de 0, podemos calcular:

CV =

Nos permite comparar, porque no tiene unidades. Para qu nos sirve con una nica base de datos?
EJERCICIO 7:

Analizamos el volumen de consultas durante el periodo de exmenes en 10 bibliotecas universitarias, y se comparan con las anotadas el ao anterior. El % de incremento de consultas fue: 10.2 2.9 3.1 6.8 5.9 7.3 Son los datos homogneos? 7.0 8.2 3.7 4.3

@Blanca Arteaga (Departamento de Estadstica)

MEDIDAS DE DISPERSIN (3) EL RANGO O RECORRIDO Lo calculamos como la diferencia entre el mayor y el menor de los datos. MEDIDAS DE DISPERSIN (4) EL RANGO INTERCUARTLICO Lo calculamos como la diferencia entre el tercero y el primero de los cuartiles.

EJERCICIO 8: Calcula estas dos medidas para el EJERCICIO 6.

@Blanca Arteaga (Departamento de Estadstica)

MEDIDAS DE POSICIN (1) ASIMETRA Podemos verlo grficamente:


La distribucin es simtrica, la media deja por delante el mismo n de observaciones que por detrs.

Asimtrica dcha.: los valores bajos son los ms frecuentes. Asimtrica izq.: los valores mayores son los ms frecuentes.
@Blanca Arteaga (Departamento de Estadstica)

MEDIDAS DE POSICIN (2) COEFICIENTES DE ASIMETRA


Haciendo clculos: 1. COEFICIENTE DE ASIMETRA DE PEARSON:

CA =
CA=0 CA>0 CA<0 Simtrica Asimtrica dcha. Asimtrica izq.

X Mo

2. COEFICIENTE DE ASIMETRA DE FISHER (cuando existe ms de una moda):

CA =

(xi i
=1

x)
3

m3 3

@Blanca Arteaga (Departamento de Estadstica)

MEDIDAS DE POSICIN (3) APUNTAMIENTO


Podemos verlo grficamente, comparndola con la curva normal:

Un apuntamiento mayor significa una menor dispersin. COEFICIENTE DE CURTOSIS DE FISHER:

CAP =

(x i i
=1

x)

CAP = 0 (mesocrtica)

N 4

CAP > 0 (leptocrtica) CAP < 0 (platicrtica)

@Blanca Arteaga (Departamento de Estadstica)

EJERCICIO 9: Resumen de todo lo expuesto en los temas anteriores


Trabaja con la siguiente base de datos (calificaciones de un grupo de alumn@s):

100 102 100 106 105

112 87 117 117 108

88 93 97 89 104

105 93 100 83 63

100 117 83 100 81

102 100 67 109 109

98 98 76 109 100

113 92 100 93 98

@Blanca Arteaga (Departamento de Estadstica)

También podría gustarte