Está en la página 1de 47

Análisis descriptivo de variables numéricas

1. Cuantiles
UNIDAD 4
2. Representación gráfica: diagrama de cajas
3. Otras medidas de tendencia central
4. Medidas de dispersión
UNIDAD 5 5. Representación gráfica: Histogramas
6. Asimetría y curtosis
Cuantiles

 Son medidas de “posición”.


 Sirven para organizar y resumir la información de una
variable.
 Sirven para clasificar a un individuo dentro del conjunto
de datos.

 DIVIDEN A LA POBLACIÓN EN PARTES IGUALES.


Cuantiles

Dividen el conjunto de medidas (ordenadas) en partes


iguales.
 Mediana: en 2 partes iguales
 Cuartiles: en 4 partes iguales
 Quintiles: en 5 partes iguales
 Deciles: en 10 partes iguales
 Percentiles: en 100 partes iguales
Cuantiles: Mediana

Es el valor de la variable que divide al total de las medidas


(ordenadas) en dos partes iguales.

Por encima de la mediana se encuentra el 50% de los casos,


por debajo de la mediana se encuentra el otro 50%.
Base de datos
Nombre
Tenencia de
del/la sexo edad Salario mensual en $
trabajo
estudiante
Laura 2. Mujer 28 1.Sí 2. De 1 a 4.999
Romina 2.Mujer 21 2.No 1.Sin salario
Joaquín 1.Varón 36 1.Sí 3. De 5.000 a 9999
Susana 2. Mujer 24 1.Sí 5. Más de 30.000
Daniela 2.Mujer 52 1. Sí 5. Más de 30.000
Tania 2. Mujer 27 1.Sí 2. De 1 a 4.999
Fabiola 2.Mujer 21 2.No 1.Sin salario
Gervasio 1.Varón 36 1.Sí 3. De 5.000 a 9999
María 2. Mujer 20 1.Sí 5. Más de 30.000
Daniela 2.Mujer 42 1. Sí 5. Más de 30.000
Nombre
Tenencia de
del/la sexo edad Salario mensual en $
Para calcular
trabajo la mediana de la
estudiante
variable edad, comenzaremos
Laura 2. Mujer 28 1.Sí la 2.información
usando De 1 a 4.999tal
Romina 2.Mujer 21 2.No aparece1.Sin
como salario
en la base de
Joaquín 1.Varón 36 datos.
1.Sí 3. De 5.000 a 9999
Susana 2. Mujer 24 1.Sí 5. Más de 30.000
Daniela 2.Mujer 52 1. Sí 5. Más de 30.000
Tania 2. Mujer 27 1.Sí 2. De 1 a 4.999
Fabiola 2.Mujer 21 2.No 1.Sin salario
Gervasio 1.Varón 36 1.Sí 3. De 5.000 a 9999
María 2. Mujer 20 1.Sí 5. Más de 30.000
El primer paso es
ordenar los valores de
la variable de menor a
mayor
Mediana: Es el valor
de la variable que
divide al total de las
medidas (ordenadas)
en dos partes iguales.

4 casos
y medio
La edad mediana
de este grupo de
9 estudiantes es
27 años
4 casos
y medio
Qué ocurriría si en lugar de una base de datos con
9 casos tuviese una base de datos en que hubiese
10?
Mediana: Es el valor
de la variable que
divide al total de las
medidas (ordenadas)
en dos partes iguales.

5 casos
La edad mediana
de este grupo de
estudiantes es un
valor que está
entre los 27 y los
28 años: 27,5 años
5 casos
Cuantiles: Cuartiles

Son los 3 valores de la variable que dividen al total de las


medidas (ordenadas) en cuatro partes iguales.
Cuartiles (Q): Son los 3 valores de
la variable que dividen al total de
las medidas (ordenadas) en 4
partes iguales.

Q1: 21 años

Q2: 27,5 años

Q3: 37,5 años


Como habrán notado el Cuartil 2 y
la mediana son idénticos: 27,5
años.

Q2: 27,5 años


Cuartil 2 = mediana

27,5 años
Cuantiles: Quintiles

Son los 4 valores de la variable que dividen al total de las


medidas (ordenadas) en cinco partes iguales.
Quintiles (Q): Son los
4 valores de la variable
que dividen al total de
las medidas
(ordenadas) en 5 partes
iguales.
Quintil1: 21 años

Quintil2: 25,2 años

Quintil3: 32,8 años

Quintil4: 40,8 años


Como estamos utilizando una base de datos de ejemplo,
que es muy pequeña, puedo calcular los cuantiles “a
ojo”.

Sin embargo, cuando trabajo con grandes bases de datos,


utilizo una fórmula para calcular los cuantiles, que es la
que encuentran en la bibliografía del curso.

La lógica de ambos procedimientos es la misma: la


diferencia es que realizando el cálculo matemático,
obtengo los valor exactos de la variable que dividen al
total de las medidas (ordenadas) en partes exactamente
iguales.
20% Percentil10
25%
Quintil 1 Percentil20
50% Cuartil 1
20% Percentil30
25% Quintil 2 Percentil40
Mediana Cuartil 2 20% Percentil50
Quintil 3 Percentil60
25%
50% 20% Percentil70
Cuartil 3
Quintil 4 Percentil80
25%
20% Percentil90
Percentil10
Quintil 1 Percentil20
Cuartil 1 Percentil25
Percentil30
Quintil 2 Percentil40
Mediana Cuartil 2 Percentil50
Quintil 3 Percentil60
Percentil70
Cuartil 3 Percentil75
Quintil 4 Percentil80
Percentil90
Percentil10
Quintil 1 Percentil20
Cuartil 1
Percentil30
Quintil 2 Percentil40
Mediana Cuartil 2 Percentil50
Quintil 3 Percentil60
Percentil70
Cuartil 3
Quintil 4 Percentil80
Percentil90
Para qué se utilizan los cuantiles?

Son medidas de posición: tienen la utilidad de permitir


comparar las características de un individuo dentro de un
grupo.

Se utilizan para la elaboración de tablas de clasificación o


baremos.
Caso clínico:
M, Varón de 23 años, se presenta a la consulta mencionando tener
dificultad para respirar y problemas para dormir y concentrarse.
El paciente refiere que estos episodios se disparan de forma
recurrente y sin una causa aparente. Debido a la sintomatología
reportada en la primera consulta, se decide complementar la
información de la entrevista con la aplicación de la Escala de
Ansiedad STAI.
Informe: Los resultados de la aplicación de la evaluación
psicológica de M resultan en un valor de 30 en la escala STAI.

Sabemos que las puntuaciones posibles


en la escala STAI pueden variar entre 0
y 60 puntos.
Un valor de 30 significa mucha o poca
ansiedad?
Para qué se utilizan los cuantiles? Ejemplo

Para responder a esa pregunta, es preciso consultar el baremo de la


escala STAI.

El baremo es construido aplicando la escala a una muestra


representativa de una población determinada (por ejemplo, varones
adultos) y calculando los percentiles.
Baremo de la escala
STAI
(tomado de Cuervo, 2016)

Esta puntuación
corresponde al
percentil 80.
Representa un
nivel de ansiedad M presentó una
alto, que solo lo puntuación de
presentan el 20% 30 en la Escala
deLa
lospuntuación
varones STAI
adultos.
mediana de los
varones adultos
en la scala STAI
es 19.
Para qué se utilizan los cuantiles?

También son utilizados en análisis socioeconómicos para


conocer cómo se distribuyen los ingresos monetarios en la
población.
Para qué se utilizan los cuantiles?

Para describir ingresos, la mediana es un


mejor indicador que el promedio (o media). Por qué?

Porque la mediana es una medida robusta frente a casos


extremos, mientras que el promedio es una medida muy
sensible
Ingreso en Ingreso en
U$ grupo 1 U$ grupo 2

1.350 100 Cuánto ganan en


promedio las personas
2.200 200
del grupo 1? U$ 2.140
2.200 200
2.300 400
2.350 800 Cuánto ganan en
2.440 12.530 promedio las personas
del grupo 2? U$ 2.370

No parece haber
gran diferencia…
Ingreso en Ingreso en
U$ grupo 1 U$ grupo 2 Cuál es la mediana del
1.350 100 ingreso de las personas
2.200 200 del grupo 1? U$ 2.250
2.200 200
2.300 400 Cuál es la mediana del
2.350 800 ingreso de las personas
2.440 12.530 del grupo 2? U$ 300

La diferencia es mucha! El segundo grupo tiene una


distribución del ingreso muy desigual, la mayoría de
las personas ganan menos de U$ 1.000, pero hay
una que gana más de U$ 12.000.
Otra forma de considerar los cuantiles
Para qué se utilizan los cuantiles?

 En el sentido estadístico más estricto, los cuantiles son los


valores que dividen una variable en partes iguales.

Los cuartiles son los 3 valores de la variable que dividen al


total de las medidas (ordenadas) en cuatro partes iguales.

Los quintiles son los 4 valores de la variable que dividen al


total de las medidas (ordenadas) en cinco partes iguales.

 Sin embargo, se considera muchas veces a los cuantiles como


los grupos de puntuaciones.
Una forma alternativa de
considerar los cuantiles

Q1
Q1: 21 años

Q2
Q2: 27,5 años
Q3

Q3: 37,5 años


Q4
Una forma alternativa de
considerar los cuantiles

Q1: son todas las


personas que tienen
entre 20 y 21 años
Q2: son todas las
personas que tienen
entre 21 y 27,5 años

Q3: son todas las


personas que tienen
entre 27,5 y 37,5 años
Q4: son todas las
personas que tienen
entre 37,5 y 52 años
Para qué se utilizan los cuantiles?

En esa forma de considerar los cuantiles, no son


medidas si no que se trata de una variable categórica
construida a partir de esas medidas.
Base de datos
Nombre
Cuantiles de Tenencia de
del/la sexo edad
la edad trabajo
estudiante
Laura 2. Mujer 28 Cuartil 2 1.Sí
Romina 2.Mujer 21 Cuartil 1 2.No
Joaquín 1.Varón 36 Cuartil 3 1.Sí
Susana 2. Mujer 24 Cuartil 2 1.Sí
Daniela 2.Mujer 52 Cuartil 3 1. Sí
Tania 2. Mujer 27 Cuartil 2 1.Sí
Fabiola 2.Mujer 21 Cuartil 1 2.No
Gervasio 1.Varón 36 Cuartil 3 1.Sí
María 2. Mujer 20 Cuartil 1 1.Sí
Daniela 2.Mujer 42 Cuartil 3 1. Sí
Análisis descriptivo de variables numéricas

1. Cuantiles
UNIDAD 4
2. Representación gráfica: diagrama de cajas
3. Otras medidas de tendencia central
4. Medidas de dispersión
UNIDAD 5 5. Representación gráfica: Histogramas
6. Asimetría y curtosis
Diagrama de Cajas

También llamado Diagrama de cajas y bigotes o Box plot

Es un gráfico utilizado para representar una variable numérica

Permite visualizar tres propiedades de la variable:


Centro
Dispersión
Forma

Permite conocer:
La posición de la mediana
La posición del primer y tercer cuartil
El grado de asimetría de la distribución de la variable
El rango total de la variable y el rango intercuartil
Si existen valores extremos
Edad
Edad

Q3

Amplitud
Mediana intercuartil
Q1
Edad Casos atípicos

Amplitud
intercuartil
Edad Casos atípicos

Amplitud
intercuartil
Edad Casos atípicos

Amplitud
intercuartil
Gráfico con dos variable categóricas, una referente a
quintiles de ingreso
Datos del Censo Nacional de Psicólogos de 2014

Tomados del Panel de análisis de datos de CUANTI


Gráfico 1:Porcentaje de repetición en primaria por quintil de ingresos per
cápita del hogar. Uruguay, 2013

Fuente: Reporte Uruguay 2015. MIDES

También podría gustarte