Documentos de Académico
Documentos de Profesional
Documentos de Cultura
2
NOTACION
Variables Cuantitativas
Medidas de resumen para variables cuantitativas, de
tendencia central y dispersión
3
- Media Aritmética (Promedio)
- Mediana
MEDIDAS DE TENDENCIA CENTRAL
- Moda
Si n es par
Datos Moda
Cualitativos y Cuantitativos
Revisión General de la
Sesión
● Media
● Mediana
● Moda
Medidas de Tendencia Central
Mediana
Moda
Media
● La medida es la más común de la tendencia
central
● También conocida como “promedio”
● Es una medida que se encuentra a la “mitad”
de los datos
● Cómo calcularla:
Suma de todos los valores
M edia
Numero de observaciones
Media: Ventajas y
Desventajas
●
Es fácil de calcular
Ventajas:
Es más estable con observaciones de números
más grandes
● Desventajas:
Sensibilidad a valores extremos
Valores Extremos = Muy altos o Muy bajos
Ejemplo:
Calculando la Media
Estud. Punteo
Estud. 1 92
Suma de todos los punteos
Estud. 2 84
Estud. 3 100 en un examen = 902
Estud. 4 78 Total de observaciones
Estud. 5 86 =1
Estud. 6 100
1 = 902/11 = 82
Media
Estud. 7 71
Estud. 8 44 La media de los punteos es
Estud. 9 91 82
Estud. 10 75
Estud. 81
11
Suma 902
Mediana
● Es el punto a la mitad de una lista de valores
ordenados
El 50avo percentil
● ¿Cómo calcularlo?:
1. Ordene todos los valores
2. Encuentre el valor a la mitad
Si hay un número par de valores, utilice la media
entre los dos valores que se encuentren en la
mitad
Mediana: Ventajas y
Desventajas
●
No es sensible a los valores extremos
Ventajas:
Es fácil de interpretar
● Desventajas:
Debe ordenar los datos para calcular
Los valores extremos pueden ser importantes
Ejemplo: Encontrando la
Mediana
Punteo
Punteo Ordena-
do 1. Ponga los valores en
92 44 orden
84 71
100 75
78 78 2. Encuentre el valor a la
86 81 mitad
100 84
71 86
44 91
La mediana en el punteo de
91 92 exámenes es 84
75 100
81 100
Moda
● ¿Cómo encontrarla?:
1. Ponga todos los valores en orden
2. Cuente cuántas veces cada valor ocurre
El valor que ocurre con más frecuencia es la moda
Moda: Ventajas y
Desventajas
●
Es útil cuando hay agrupaciones con diferentes
Ventajas:
valores
Solo mide lo que puede ser usado para datos que
no son cuantitativos
● Desventajas:
Puede no existir en algunos datos
Puede estar demasiado lejos de la mitad de los
datos
Ejemplo:
Encontrando la Moda
Punteos
Ordena-
Punteos
dos 1. Ordene sus valores
92 44
84 71
2. Cuente cuantas veces cada
100 75 uno de los valores ocurre
78 78
86 81
100 84
La moda es 100.
71 86
44 91
91 92
75 100
81 100
Medidas de Dispersión --
Rango Encontrando el Rango
Punteos 1.Poner los valores en orden
Punteos
dos
2.Encontrar el valor más bajo
Ordena-
92 44 3.Encontrar el valor más alto
84 71
100 75 El rango de los punteos es de (44-
78 78 100)
86 81
100 84 La media de punteo fue 82 (44-
71 86 100).
44 91
91 92 La mediana de punteo fue 84 (44-
75 100 100).
81 100
Encuentre la media, la mediana y la moda para
los siguientes valores
2, 4, 0, 1, 2, 3, 1, 6, 2, 4
Respuestas
Número de frutas consumidas en la última semana:
2, 4, 0, 1, 2, 3, 1, 6, 2, 4
●Media: 25 / 10 = 2.5
●Mediana: 0, 1, 1, 2, 2, 2, 3, 4, 4,
6
(2 + 2)/
●Moda: 0, 21,=1,2 2, 2, 2, 3, 4, 4,
6
¿Qué Estadísticas Pueden ser
Usadas en Diferentes Escalas de
Medición?
Nominal Ordinal Intervalo Razón
Moda SI SI SI SI
Mediana NO SI SI SI
Media NO NO SI SI
Resumen
● Tres de las medidas más comunes para
distribución central son la media, la mediana y
la moda.
● Le medida de la media es la que se encuentra
“en medio” de los datos
● La mediana es el punto medio en una lista
ordenada de valores
● La moda es el valor más común de la
distribución.
Medidas de posición: Cuantiles
Percentil, Decil o Cuartil: corresponde al valor que toma la variable (cuantitativa), cuando los n datos
están ordenados de Menor a Mayor
El Percentil va de 1 a 100
El percentil 25 (25/100): es el valor de la variable que reúne al menos el 25% de los datos
Ejemplo: Si N=80, el 25% de 80 es 20; por lo tanto, se busca el dato que este en la posición 20.
Si N=85, el 25% de 85 es 21,25; por lo tanto se busca el dato que este en la posición 22.
El Decil va de 1 a 10
El Decil 4 (4/10): es el valor de la variable que reúne al menos el 40% de los datos
Ejemplo: Si N=80, el 40% de 80 es 32; por lo tanto, se busca el dato que este en la posición 32.
Si N=85, el 40% de 85 es 34; por lo tanto se busca el dato que este en la posición 34.
El Cuartil va de 1 a 4
El Cuartil 3 (3/4): es el valor de la variable que reúne al menos el 75% de los datos
Ejemplo: Si N=80, el 75% de 80 es 60; por lo tanto, se busca el dato que este en la posición 60.
Si N=85, el 75% de 85 es 63,75; por lo tanto se busca el dato que este en la posición 64.
Medidas de dispersión
21
- Rango
- Varianza
MEDIDAS DE DISPERSIÓN
- Desviación Estándar
23
- Asimetría
Otras medidas o Coeficientes - Kurtosis o Apuntamiento
Además de la posición y la dispersión de los datos, otra medida de interés en una distribución de frecuencias
es la simetría y el apuntamiento o kurtosis.
24
- Asimetría
Otras medidas o Coeficientes - Kurtosis o Apuntamiento
25
- Asimetría
Otras medidas o Coeficientes - Kurtosis o Apuntamiento
Ejemplos
1 4 4 Mediana 4
1 4 5 Moda 4
2 4 6 kurtosis -0,43
3 4 6 Rango 6
3 4 7 Mínimo 1
4 4 7 Máximo 7
Cuenta 30
Medidas de resumen para serie agrupada
26
Media, Desviación típica, Coeficientes de Asimetría y Apuntamiento para
datos Agrupados (tabla de frecuencias)
• CV= σ x 100
μ
Indica la variabilidad de la distribución de datos.
Puede interpretarse aisladamente o en comparación.
Su fórmula expresa la desviación estándar como porcentaje de la media aritmética, mostrando una
interpretación relativa del grado de variabilidad, independiente de la escala de la variable, a diferencia de la
desviación típica o estándar.
A diferencia de la desviación típica este coeficiente es fuertemente sensible ante cambios de origen en la
variable. Por ello es importante que todos los valores sean positivos y su media dé, por tanto, un valor
positivo.
A mayor valor del coeficiente de variación mayor heterogeneidad de los valores de la variable; y a menor
C.V., mayor homogeneidad en los valores de la variable.
Por ejemplo, si el C.V es menor o igual al 80%, significa que la media aritmética es representativa del
conjunto de datos, por ende el conjunto de datos es "Homogéneo". Por el contrario, si el C.V supera al 80%,
el promedio no será representativo del conjunto de datos (por lo que resultará "Heterogéneo").
• El coeficiente de variación no posee unidades, es decir es adimensional.
• El coeficiente de variación es frecuentemente menor que uno. Sin
embargo, en ciertas distribuciones de probabilidad puede ser 1 o mayor
que 1.
• Es insensible ante cambios de escala.
• Para su interpretación se puede expresar como porcentaje, teniendo en
cuenta que puede superar el valor 100%.
• Depende de la desviación típica, también llamada "desviación estándar",
y en mayor medida de la media aritmética, dado que cuando ésta es 0 o
muy próxima a este valor el C.V. pierde significado, ya que puede dar
valores muy grandes, que no necesariamente implican una gran
dispersión de datos.
Gracias