Está en la página 1de 49

Medidas Descriptivas

Medidas de Tendencia Central


Medidas de Variabilidad
Medidas de Posición
Medidas de Forma
Medidas Descriptivas
• Tendencia central • Variabilidad o de
– Media Dispersión
– Mediana – Rango
– Moda – Varianza
• Posición – Desviación
estándar
– Cuartiles
– Coeficiente de
– Percentiles
variación
– Puntuación Z
• Forma
– Simetría
– Apuntamiento
37
Caso 1
Interpretación física de la Media

Sistema de masas de datos

0 1 2 3 4 5 6 7 8 9 10

Calificación en la escala del uno al diez


38
Caso 2
Interpretación de la media

0 1 2 3 4 5 6 7 8 9 10

Calificación en la escala del uno al diez


39
Caso 3
Interpretación de la media

0 1 2 3 4 5 6 7 8 9 10

Calificación en la escala del uno al diez


40
Promedio o Media Aritmética
Media aritmética de una
población de tamaño N

N
0 1 2 3 4 5 6 7 8 9 10

∑x i
μX = i =1

0 1 2 3 4 5 6 7 8 9 10
N
12

∑x i

0 1 2 3 4 5 6 7 8 9 10
μX = i =1
=6
Calificación en la escala del uno al diez
12
41
Media:
Interpretación y propiedades
• Punto de equilibrio del sistema de
masas datos
• Representante del conjunto de datos
• Valor comprendido entre el mínimo y
máximo
• No siempre coincide con un valor
observado
• Es única

42
Variabilidad – Dispersión
Rango = xmáx – xmín

R=0 R = 10
0 1 2 3 4 5 6 7 8 9 10
0 1 2 3 4 5 6 7 8 9 10

R=2
0 1 2 3 4 5 6 7 8 9 10

R = 10 R = 10
0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10

43
Rango

• Diferencia entre el valor máximo y el valor


mínimo observado
• Es la más simple de las medidas de
dispersión
• Sólo para datos numéricos
• No nos cuenta sobre la distribución de los
datos dentro del mismo
• Es único

44
Medición de la dispersión
¿Cuánto se alejan los datos del
punto de equilibrio?

0 1 2 3 4 5 6 7 8 9 10

Calificación en la escala del uno al diez


45
Medición de la dispersión
La desviación respecto de la media
como medida de dispersión

( xi − μ X )

0 1 2 3 4 5 6 7 8 9 10

Calificación en la escala del uno al diez


46
Inconvenientes de la desviación

La suma de las desviaciones


respecto de la media es
0 1 2 3 4 5 6 7 8 9 10
siempre igual a cero

∑ (x − μ )=0
0 1 2 3 4 5 6 7 8 9 10

i X
i =1

0 1 2 3 4 5 6 7 8 9 10

47 Calificación en la escala del uno al diez


Varianza y Desviación Estándar
N

∑ (x − μ i X ) 2
Varianza Poblacional:
σ =
2 i =1 Promedio de las
desviaciones cuadráticas
X
N respecto de la media

∑ ( xi − μ X ) 2 Desviación Estándar
Poblacional: Surge de la
σX = i =1
necesidad de volver a la
N unidad de medida de la
48 variable en estudio
Para pensar ...
• ¿Cuál es la estatura promedio de las
personas presentes?
• ¿Cuál es la desviación estándar de las
personas presentes?
• Comparemos:
– Estatura de los adultos
– Estatura de adolescentes (13 a 17 años)
– ¿Cuál tiene mayor desviación estándar?
• Comparemos media y desviación estándar:
– Estatura de los adultos
– Estatura de las modelos de Pancho Dotto
49
Valores numéricos de σ

0 1 2 3 4 5 6 7 8 9 10
σX = 0

0 1 2 3 4 5 6 7 8 9 10
σ X = 0, 71

0 1 2 3 4 5 6 7 8 9 10
σ X = 4,32
50 Calificación en la escala del uno al diez
Tabla: valores de σ
# Grupo 1 Grupo 2 Grupo 3 Grupo 4 Grupo 5 Grupo 6 Grupo 8
1 6 5 5 5 5 5 5
2 6 6 5 5 5 5 5
3 6 6 6 5 5 5 5
4 6 6 6 6 5 5 5
5 6 6 6 6 6 5 5
6 6 6 6 6 6 6 5
7 6 6 6 6 6 6 7
8 6 6 6 6 6 7 7
9 6 6 6 6 7 7 7
10 6 6 6 7 7 7 7
11 6 6 7 7 7 7 7
12 6 7 7 7 7 7 7
Media = 6 6 6 6 6 6 6
DE Pob= 0 0,4082 0,5774 0,7071 0,8165 0,9129 1

51
Gráficos: valores de σ
σ=0 σ = 0,82
0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10

σ = 0,41 σ = 0,91
0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10

σ = 0,58 σ=1
52 0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10
Caso 4
Los datos, en promedio, ¿cuánto se
alejan a un lado y al otro de la media?

σ=1

0 1 2 3 4 5 6 7 8 9 10

53
Caso 5
Los datos, en promedio y aproximadamente,
¿cuánto se alejan a un lado y al otro de la media?

σ = 2,082
0 1 2 3 4 5 6 7 8 9 10

σ = 3,055
0 1 2 3 4 5 6 7 8 9 10

54
Interpretación de σ
Sistema real
En ambos sistemas:

μX = 7
0 1 2 3 4 5 6 7 8 9 10 σ X = 2,5
Sistema equivalente
2,5 2,5

En promedio, las
calificaciones se alejan de
la media, 2,5 puntos

55 1 2 4 5 6
0 3 7 8 9 10
Resumen de fórmulas (Población)
Población de tamaño N
N
Media
Poblacional
∑x i
μX = i =1

N
N
Desviación
Estándar
∑ (x − μ i X ) 2

Poblacional σX = i =1

N
56
Resumen de fórmulas (Muestra)
Muestra de tamaño n
n
Media Muestral ∑x i
X= i =1

n
n
Desviación
Estándar Muestral
∑ (x − X ) i
2

SX = i =1

n −1
57
Coeficiente de Variación
ƒ Medida de dispersión relativa
ƒ Permite efectuar comparaciones entre
variables medidas en la misma unidad o en
unidades de medida diferentes
ƒ Expresa la dispersión como proporción o
porcentaje respecto de la media del conjunto
de los datos
ƒ Fórmula de cálculo:
σX
Poblacional CV =
μX
SX
58
Muestral CV =
X
Capacidad estadística vs.
Pensamiento estadístico
Análisis de la Variabilidad
Caso 1: Tiempos
• Variable en estudio:
– Tiempo requerido para realizar una tarea
• Se desea comparar el tiempo empleado por
un grupo de personas para realizar una tarea
X, con el tiempo empleado por otro grupo de
personas para realizar una tarea Y.
– Desviación estándar (X): σX = 0,04 min
– Desviación estándar (Y): σY = 2880 min (dos días)
• ¿Qué tiempos están más dispersos, los de la
tarea X o los de la tarea Y?

60
Caso 2: Derrames
• Variable en estudio:
– Derrame Medio Anual (hm³)
• Se desea comparar el volumen de agua que
anualmente aportan dos ríos, denominados
genéricamente X e Y.
– Desviación estándar (Río X): σX = 546 hm³
– Desviación estándar (Río Y): σY = 113.121 hm³
• ¿Cuáles son los derrames que están más
dispersos, los del Río X o los del Río Y?

61
Caso 3: Estaturas y Pesos
• Variables en estudio:
– Estatura (X) y Peso (Y)
• Se desea comparar las estaturas con los
pesos de un grupo de personas, en términos
de variabilidad.
– Desviación estándar estaturas: σX = 8,6 cm
– Desviación estándar pesos: σY = 13,7 kg
• ¿Qué datos están más dispersos, las
estaturas o los pesos de las personas del
grupo?

62
Caso 4: Tiempos
• Variable en estudio:
– Tiempo requerido para realizar una tarea
• Se desea comparar el tiempo empleado por
los hombres (H) con el tiempo empleado por
las mujeres (M) para realizar la misma tarea.
– Desviación estándar (hombres): σH = 4,69 min
– Desviación estándar (mujeres): σM = 1,70 min
• ¿Qué tiempos están más dispersos, los de los
hombres o los de las mujeres?

63
Otras medidas de
tendencia central
Mediana (Me) y Moda (Mo)
Mediana
• Definición:
– Es un valor de la variable que ocupa la posición
central en un conjunto ordenado de datos.
• Determinación de la mediana:
– Si el número de observaciones es impar, es el
valor observado que ocupa la posición central de
los datos, una vez que éstos han sido ordenados
de manera creciente.
– Si el número de observaciones es par, se calcula
como el promedio aritmético de las dos
observaciones centrales, una vez que éstos han
sido ordenados de manera creciente.
65
Determinación de la Mediana (1)
Cuando el número de datos es IMPAR
Orden Observación
1º 200
2º 200 Mediana = x%= x n +1
3º 200 2
4º 200
Orden de la mediana: 5º
5º 400
Valor que ocupa la posición central
6º 450
7º 650 Me = 400
8º 800 Media = 1000
66
9º 5900 Moda = 200
Determinación de la Mediana (2)
Cuando el número de datos es PAR
Orden Observación
1º 200 xn + xn
+1
2º 200 x%= 2 2

3º 200
2
4º 400 Orden de la mediana:
5º 450 Entre el 4º y 5º

6º 650
Mediana = Promedio de los
7º 800 valores centrales
8º 5900 Me = (400+450)/2 = 425
67 Media = 1100
Propiedades de la Mediana

• La mediana de un conjunto de datos es única


• NO es sensible a la presencia de datos
apartados o valores extremos
• En un conjunto de datos, la mitad de ellos son
iguales o menores que la mediana y la otra
mitad son iguales o mayores que la mediana

68
Moda

• Definición:
– Es el valor de las observaciones que aparece con
mayor frecuencia
• Propiedades de la Moda:
– Se puede determinar tanto para datos numéricos
como para datos no numéricos
– No se ve afectada por datos apartados o valores
extremos
– La moda puede o no existir; cuando existe,
puede no ser única

69
Dificultades de la Moda
Conjunto pequeño de datos
Media = 5,42
Moda = 10
Mediana = 5,5
Desviación estándar = 3,3

0 1 2 3 4 5 6 7 8 9 10

Calificación en la escala del uno al diez


70
Clases Modales (datos agrupados)
Histogram for Calzado
40

30
percentage
20

10 Número de calzado
0
34 36 38 40 42 44 46
Calzado

Histogram for ANTIG


30
25
percentage

Antigüedad en la
20

15

empresa
10
5
0
0 5 10 15 20 25 30 35 40 45 50
ANTIG
71
Medidas de Posición
Cuartiles y Percentiles
Valor Z
Gráfico de caja
Interpretación de los cuartiles
Se forman cuatro grupos con igual cantidad de datos
La cuarta parte de La mitad de los datos Tres cuartas partes de
los datos asume (dos cuartos) asume los datos asume valores
valores iguales o valores iguales o iguales o inferiores a 7,8
inferiores a 2,2 inferiores a 3,6
Q2 = Me = 3,6 Q3 = 7,8
Q1 = 2,2

Rango Intercuartil: RI = Q3 – Q1
xmín = 1,1 xmáx = 9,9

0 1 2 3 4 5 6 7 8 9 10
73 Escala graduada de la variable en estudio
Interpretación de los percentiles
Se forman cien grupos con igual cantidad de datos
El 25% de los datos El 50% de los datos (la El 75% de los datos son
son iguales o mitad) son iguales o iguales o inferiores a
inferiores a 2,2 inferiores a 3,6 7,8

P50 = Me = 3,6 P75 = 7,8


P25 = 2,2

xmín = 1,1 xmáx = 9,9

0 1 2 3 4 5 6 7 8 9 10
74 Escala graduada de la variable en estudio
Para pensar ...
El cuartil inferior, ¿puede resultar igual a la mediana?

1º 2º 3º 4º 5º 6º 7º 8º 9º 10º
1 5 5 5 5 5 5 5 7 9
El percentil 20, ¿puede resultar mayor que el cuartil
superior?
1º 2º 3º 4º 5º 6º 7º 8º 9º 10º

1 9 7 5 7 7 5 5 5 5

1 5 5 5 5 5 7 7 7 9

Sofía Puertas
75
Valor Z
• Describe la posición de un valor individual de la
variable en estudio, respecto de la media del
grupo al cual pertenece.
• Indica a qué distancia de la media del grupo se
encuentra, sea por encima (signo positivo) o
por debajo de la misma (signo negativo),
medida en unidades de desviación estándar.
• Fórmula de cálculo:

x−μ
z= Valor z (población)
σ
xz == μx −+ xz ⋅ σ Valor z (muestra)
76
S
Interpretación del Valor Z

• Un valor Z negativo
– indica que la observación está por debajo de la
media
• Un valor Z positivo
– indica que la observación está por encima de la
media
• Un valor Z igual a cero x−μ
z=
– ¿qué indica?
σ
x−x
z=
77 S
Transformación X Æ Y
x L M A G

-3 -2 -1 0 1 2 3 4 5
μX = 2
y = x+1 L M A G
y = (x – Media)

L
-3 -2 -1 M
0 A1 G
2 3 4 5
μY = μX+1
-3 -2 -1 0 1 2 3σY =4σX 5
μY = 0
78
σY = σX
Transformación X Æ W
x L M A G

-3 -2 -1 0 1 2 3 4 5
μX = 2
σX = 2,16
w = (x / constante)
constante = 2
L MAG

-3 -2 -1 0 1 2 3 4 5
μW = μX / constante = 1
79
σW = σX / constante = 1,08
Transformación X Æ Z
y = (x – Media)

x L M A G
L M A G
-3 -2 -1 0 1 2 3 4 5
-3 -2 -1 0 1 μ =2 2 3 4 5
X
μY = 0 σY = σX = 2,16
σX = 2,16
z y==(x
y (x –Media)
Media)/ sigma
/–constante
constante = sigma
L L M MA G
A G
-3 -2 -1 0 1 2 3 4 5
-3 -2 -1 0 1 2 3 4 5
μYμZ==0 μ
0Y / sigma = 0
80
σσY Z==σσ
1Y / sigma = 1
X
Ilustración

Ver uso de EXCEL


Gráfico de Caja

Datos apartados: atípico y


anómalos
Construcción del Gráfico de Caja
Q1 Q3
REF1 = Q1 – 3 RI xmín xmáx
REF2 = Q1 – 1,5 RI
REF3 = Q3 + 1,5 RI
REF4 = Q3 + 3 RI
+

REF1 REF2 REF3 REF4


anómalos atípicos
Q2=Me atípicos anómalos

0 1 2 3 4 5 6 7 8 9 10 11 12
Variable Numérica
Datos No Apartados

Datos apartados Datos apartados

83
Construcción del Gráfico de Caja
Primer dato no apartado por debajo de la REF 3

Q1 Q3
REF1 = Q1 – 3 RI xmín xmáx
REF2 = Q1 – 1,5 RI
REF3 = Q3 + 1,5 RI
REF4 = Q3 + 3 RI
+ +
REF1 REF2 REF3 REF4
anómalos atípicos atípicos anómalos
Q2=Me

0 1 2 3 4 5 6 7 8 9 10 11 12
Variable Numérica
Datos No Apartados

Datos apartados Datos apartados

84

También podría gustarte