Está en la página 1de 29

Medidas de resumen para variables

cuantitativas, de tendencia central y


dispersión
Giovanni Meneses Flores
VARIABLES

2
NOTACION
Variables Cuantitativas
Medidas de resumen para variables cuantitativas, de
tendencia central y dispersión
3
- Media Aritmética (Promedio)
- Mediana
MEDIDAS DE TENDENCIA CENTRAL
- Moda

Datos Cuantitativos Datos Cuantitativos ordenados de menor a mayor


Mediana
Media Aritmética o Promedio Si n es impar

Si n es par

Datos Moda
Cualitativos y Cuantitativos
Revisión General de la
Sesión

● Media

● Mediana

● Moda
Medidas de Tendencia Central

● Usadas principalmente en datos de


intervalos y de razones
Media

Mediana

Moda
Media
● La medida es la más común de la tendencia
central
● También conocida como “promedio”
● Es una medida que se encuentra a la “mitad”
de los datos
● Cómo calcularla:
Suma de todos los valores
M edia
Numero de observaciones
Media: Ventajas y
Desventajas


Es fácil de calcular
Ventajas:
Es más estable con observaciones de números
más grandes
● Desventajas:
Sensibilidad a valores extremos
Valores Extremos = Muy altos o Muy bajos
Ejemplo:
Calculando la Media
Estud. Punteo
Estud. 1 92
Suma de todos los punteos
Estud. 2 84
Estud. 3 100 en un examen = 902
Estud. 4 78 Total de observaciones
Estud. 5 86 =1
Estud. 6 100
1 = 902/11 = 82
Media
Estud. 7 71
Estud. 8 44 La media de los punteos es
Estud. 9 91 82
Estud. 10 75
Estud. 81
11
Suma 902
Mediana
● Es el punto a la mitad de una lista de valores
ordenados
El 50avo percentil
● ¿Cómo calcularlo?:
1. Ordene todos los valores
2. Encuentre el valor a la mitad
Si hay un número par de valores, utilice la media
entre los dos valores que se encuentren en la
mitad
Mediana: Ventajas y
Desventajas


No es sensible a los valores extremos
Ventajas:
Es fácil de interpretar

● Desventajas:
Debe ordenar los datos para calcular
Los valores extremos pueden ser importantes
Ejemplo: Encontrando la
Mediana
Punteo
Punteo Ordena-
do 1. Ponga los valores en
92 44 orden
84 71
100 75
78 78 2. Encuentre el valor a la
86 81 mitad
100 84
71 86
44 91
La mediana en el punteo de
91 92 exámenes es 84
75 100
81 100
Moda

● Es el valor más común en una distribución

● ¿Cómo encontrarla?:
1. Ponga todos los valores en orden
2. Cuente cuántas veces cada valor ocurre
El valor que ocurre con más frecuencia es la moda
Moda: Ventajas y
Desventajas

Es útil cuando hay agrupaciones con diferentes
Ventajas:
valores
Solo mide lo que puede ser usado para datos que
no son cuantitativos

● Desventajas:
Puede no existir en algunos datos
Puede estar demasiado lejos de la mitad de los
datos
Ejemplo:
Encontrando la Moda
Punteos
Ordena-
Punteos
dos 1. Ordene sus valores
92 44
84 71
2. Cuente cuantas veces cada
100 75 uno de los valores ocurre
78 78
86 81
100 84
La moda es 100.
71 86
44 91
91 92
75 100
81 100
Medidas de Dispersión --
Rango Encontrando el Rango
Punteos 1.Poner los valores en orden
Punteos
dos
2.Encontrar el valor más bajo
Ordena-
92 44 3.Encontrar el valor más alto
84 71
100 75 El rango de los punteos es de (44-
78 78 100)
86 81
100 84 La media de punteo fue 82 (44-
71 86 100).
44 91
91 92 La mediana de punteo fue 84 (44-
75 100 100).
81 100
Encuentre la media, la mediana y la moda para
los siguientes valores

Numero de frutas consumidas durante la semana


pasada:

2, 4, 0, 1, 2, 3, 1, 6, 2, 4
Respuestas
Número de frutas consumidas en la última semana:
2, 4, 0, 1, 2, 3, 1, 6, 2, 4

●Media: 25 / 10 = 2.5
●Mediana: 0, 1, 1, 2, 2, 2, 3, 4, 4,
6
(2 + 2)/
●Moda: 0, 21,=1,2 2, 2, 2, 3, 4, 4,
6
¿Qué Estadísticas Pueden ser
Usadas en Diferentes Escalas de
Medición?
Nominal Ordinal Intervalo Razón
Moda SI SI SI SI

Mediana NO SI SI SI

Media NO NO SI SI
Resumen
● Tres de las medidas más comunes para
distribución central son la media, la mediana y
la moda.
● Le medida de la media es la que se encuentra
“en medio” de los datos
● La mediana es el punto medio en una lista
ordenada de valores
● La moda es el valor más común de la
distribución.
Medidas de posición: Cuantiles

- Percentil (ejemplo: 25, 50, 75) 20


Percentiles, Deciles o Cuartiles - Decil (ejemplo: 4, 5, 8)
- Cuartil (ejemplo: 1, 2, 3)

Percentil, Decil o Cuartil: corresponde al valor que toma la variable (cuantitativa), cuando los n datos
están ordenados de Menor a Mayor
El Percentil va de 1 a 100
El percentil 25 (25/100): es el valor de la variable que reúne al menos el 25% de los datos
Ejemplo: Si N=80, el 25% de 80 es 20; por lo tanto, se busca el dato que este en la posición 20.
Si N=85, el 25% de 85 es 21,25; por lo tanto se busca el dato que este en la posición 22.

El Decil va de 1 a 10
El Decil 4 (4/10): es el valor de la variable que reúne al menos el 40% de los datos
Ejemplo: Si N=80, el 40% de 80 es 32; por lo tanto, se busca el dato que este en la posición 32.
Si N=85, el 40% de 85 es 34; por lo tanto se busca el dato que este en la posición 34.

El Cuartil va de 1 a 4
El Cuartil 3 (3/4): es el valor de la variable que reúne al menos el 75% de los datos
Ejemplo: Si N=80, el 75% de 80 es 60; por lo tanto, se busca el dato que este en la posición 60.
Si N=85, el 75% de 85 es 63,75; por lo tanto se busca el dato que este en la posición 64.
Medidas de dispersión

21
- Rango
- Varianza
MEDIDAS DE DISPERSIÓN
- Desviación Estándar

Datos Cuantitativos Varianz


a
Rango

Desviación Típica o Estándar

Comparación entre Variables


Se refiere al comportamiento de las variables cuantitativas en un Coeficiente de
grupo. Por ejemplo: Si se tiene un conjunto de personas a las que se Variación
les mide Estatura, Peso, Edad: Entre estas variables ¿cuál presenta
mayor variación?
Varianza y cuasivarianza

• En el caso de las poblaciones, el denominador es n.


• En el caso de muestras, debido a los grados de libertad y que no se
trabaja con la población completa, el denominador es n-1.
• En este último caso, se prefiere referirse a cuasivarianza o varianza
insesgada.
• La cuasivarianza muestral es un estimador centrado (no sesgado) de la
varianza poblacional. La Cuasivarianza es semejante a la Varianza,
excepto que la división es por n-1 (tamaño de la muestra) y no por N
(tamaño del grupo de datos).
• Este estadístico es apropiado para obtener estimaciones de la Varianza
de la población en el análisis inferencial de datos.
Otras medidas de distribución de los datos

23
- Asimetría
Otras medidas o Coeficientes - Kurtosis o Apuntamiento

Además de la posición y la dispersión de los datos, otra medida de interés en una distribución de frecuencias
es la simetría y el apuntamiento o kurtosis.

Si CA=0 si la distribución es simétrica alrededor de la media.


Si CA<0 si la distribución es asimétrica a la izquierda
Coeficiente de Asimetría Si CA>0 si la distribución es asimétrica a la derecha

- Si CAp=0 la distribución se dice normal (similar


a la distribución normal de Gauss) y recibe el
Coeficiente de Apuntamiento nombre de mesocúrtica.
- Si CAp>0, la distribución es más puntiaguda que
la anterior y se llama leptocúrtica, (mayor
concentración de los datos en torno a la media).
- Si CAp<0 la distribución es más plana y se
llama platicúrtica.
Ejemplos gráficos

24
- Asimetría
Otras medidas o Coeficientes - Kurtosis o Apuntamiento

Ejemplos Histogramas con distinta asimetría y apuntamiento


Ejemplos gráficos

25
- Asimetría
Otras medidas o Coeficientes - Kurtosis o Apuntamiento

Ejemplos

Datos Histograma Medidas descriptivas


1 4 4 Media 3,9

1 4 4 Mediana 4

1 4 5 Moda 4

2 4 5 Desviación estándar 1,67

2 4 6 Varianza de la muestra 2,78

2 4 6 kurtosis -0,43

2 4 6 Coeficiente de asimetría -0,02

3 4 6 Rango 6

3 4 7 Mínimo 1

4 4 7 Máximo 7
Cuenta 30
Medidas de resumen para serie agrupada

26
Media, Desviación típica, Coeficientes de Asimetría y Apuntamiento para
datos Agrupados (tabla de frecuencias)

Tabla de frecuencia (para variable cuantitativa) 2) La Desviación típica para datos


agrupados esta dada por:
n1 f1
n2 f2

nk fk 3) El Coeficiente de Asimetría para datos


agrupados esta dado por:

Sea cj la marca de clase (o centro de clase) y fj la


frecuencia relativa de la clase j, donde j=1, 2,…, k.

1) La Media para datos agrupados es igual a la


suma de los productos de las marcas de clase 4) El Coeficiente de apuntamiento para
por sus frecuencias relativas, de la forma: datos agrupados esta dada por:
Coeficiente de variación

• CV= σ x 100
μ
Indica la variabilidad de la distribución de datos.
Puede interpretarse aisladamente o en comparación.
Su fórmula expresa la desviación estándar como porcentaje de la media aritmética, mostrando una
interpretación relativa del grado de variabilidad, independiente de la escala de la variable, a diferencia de la
desviación típica o estándar.
A diferencia de la desviación típica este coeficiente es fuertemente sensible ante cambios de origen en la
variable. Por ello es importante que todos los valores sean positivos y su media dé, por tanto, un valor
positivo.
A mayor valor del coeficiente de variación mayor heterogeneidad de los valores de la variable; y a menor
C.V., mayor homogeneidad en los valores de la variable.
Por ejemplo, si el C.V es menor o igual al 80%, significa que la media aritmética es representativa del
conjunto de datos, por ende el conjunto de datos es "Homogéneo". Por el contrario, si el C.V supera al 80%,
el promedio no será representativo del conjunto de datos (por lo que resultará "Heterogéneo").
• El coeficiente de variación no posee unidades, es decir es adimensional.
• El coeficiente de variación es frecuentemente menor que uno. Sin
embargo, en ciertas distribuciones de probabilidad puede ser 1 o mayor
que 1.
• Es insensible ante cambios de escala.
• Para su interpretación se puede expresar como porcentaje, teniendo en
cuenta que puede superar el valor 100%.
• Depende de la desviación típica, también llamada "desviación estándar",
y en mayor medida de la media aritmética, dado que cuando ésta es 0 o
muy próxima a este valor el C.V. pierde significado, ya que puede dar
valores muy grandes, que no necesariamente implican una gran
dispersión de datos.
Gracias

También podría gustarte