Está en la página 1de 35

Estadística sumaria:

- Medidas de Tendencia Central


- Medidas de Dispersión
- Medidas de la forma de la curva (Simetría y Curtosis)

Ms. Carmen Lucía Geldres Sánchez


ESTADÍSTICA SUMARIA

 Después de construir tablas y gráficos, a partir de una


colección de datos, se requieren medidas más exactas.

 Son medidas precisas respecto a una tabla de distribución de


frecuencias

 Existen tres tipos de medidas de resumen:


 De tendencia central.
 De dispersión.
 De la forma de la distribución.

Ms. Carmen Lucía Geldres Sánchez


1. MEDIDAS DE TENDENCIA CENTRAL
 Aquellas que nos indican cual podría ser el punto medio o
típico de un conjunto de datos analizados.
 Se conocen como medidas de posición y/o promedios
 Promedios principales:
Media aritmética simple
Media ponderada
Mediana
Moda

Ms. Carmen Lucía Geldres Sánchez


1. MEDIDAS DE TENDENCIA CENTRAL
Ejemplo:
A partir del gráfico siguiente, se observa que la posición
central de la curva B está a la derecha de la posición
central de las curvas A y C.
Obsérvese que la posición central de la curva A es la
misma que la curva C.

Ms. Carmen Lucía Geldres Sánchez


A) MEDIA ARITMÉTICA SIMPLE
 La media es un valor promedio.
 Todo conjunto de variables posee una media
 Se busca un comportamiento equivalente o único.
 La media aritmética simple es la suma de todos los datos sobre
el número de datos totales
 N= número total de datos o tamaño muestral
.

N n
 Xi  xi
i 1 i 1
 ;x 
N n

Ms. Carmen Lucía Geldres Sánchez


A) MEDIA ARITMÉTICA SIMPLE
Ejemplo 1:
La siguiente tabla muestra el número de reclamos de los
trabajadores de una obra, a lo largo de una semana, debido a la
mala calidad de las herramientas utilizadas. Calcule e interprete
la media.

Día/Semana Lun Mar Mier Jue Vier Sab


Reclamos/día 8 10 5 12 10 15

Media aritmética: 8  10  5  12  10  15 
60 = 10 reclamos
6 6
Interpretación:
Si elige al azar un día de la semana, se espera que los
trabajadores realicen 10 reclamos por día.

Ms. Carmen Lucía Geldres Sánchez


B) MEDIA PONDERADA
 Llamado media aritmética simple de datos agrupados.
 Se utiliza cuando se tiene datos de frecuencia
 La media ponderada es la relación entre la sumatoria de
cada dato Xi multiplicada por su correspondiente
frecuencia relativa sobre el tamaño muestral
 La media aritmética simple debe ser igual a la media
ponderada

N
 f i Xi
  i1
N

Ms. Carmen Lucía Geldres Sánchez


B) MEDIA PONDERADA
Ejemplo 1:
La distribución de frecuencias siguiente, representa los puntajes
obtenidos en una evaluación del desempeño, aplicado al personal
obrero de una empresa. El puntaje máximo en la prueba es 50.
Calcule e interprete la media.

Desempeño Número de
(puntos) obreros
12 - 16 4
17 - 21 8
22 - 26 15
27 - 31 23
32 - 36 10
TOTAL 60

Ms. Carmen Lucía Geldres Sánchez


B) MEDIA PONDERADA
1. Calcular las marcas de clase (xi); el valor intermedio de cada clase.
2. Sumatoria del producto de cada marca y su respectiva frecuencia (fi) .
3. Dividir entre la sumatoria de las frecuencias de clase.

Clase
Marca Frecuencia 14( 4)  19(8)  24(15)  29( 23)  34(10)
de Clase (xi) Absoluta (fi) x
4  8  15  23  10
12 -16 14 4
1575
17-21 19 8 x x  26.25 puntos
22- 26 24 15 60
27-31 29 23
32- 36 34 10
Total 60
Interpretación:
Si se elige al azar a un técnico, se espera que tenga un puntaje de
26,25 en su evaluación de desempeño.

Ms. Carmen Lucía Geldres Sánchez


MEDIA ARITMÉTICA Y MEDIA PONDERADA
Ventajas:
• Concepto familiar para muchas personas
• Es única para cada conjunto de datos
• Es posible comparar medias de diferentes muestras
Desventajas:
• Se ve afectada por los datos extremos.
• Si la muestra es grande y los datos no están agrupados, su
cálculo es tedioso.
• Si los datos están agrupados en clases con extremos
abiertos, no es posible calcular la media.

Ms. Carmen Lucía Geldres Sánchez


C) MEDIANA
 Valor que se encuentra en la mitad de la lista de valores
después de ser ordenados de acuerdo a su magnitud
 Pueden ser ordenados de mayor a menor o viceversa
 Es un promedio de posición.
 El valor N puede ser par o impar

 N 
2  fa A
L   i
M ed  X  N

 2

 0 .5 

M ed  i 
 f i 

D a to s N o A g r u p a d o s D a to s A g r u p a d o s

Ms. Carmen Lucía Geldres Sánchez


C) MEDIANA
- Cuando es impar, la mediana ocupa el lugar del valor central de
la serie previamente ordenada. Se busca en número que esta
en la posición (N+1) / 2
Ejemplo: 5, 10, 10, 12, 15, 17, 20, 21, 24

- Cuando es par, se obtiene de la semisuma de los valores


centrales de la serie previamente ordenada. Se promedia los
números que se encuentren en la posición (N/2) y (N/2 + 1)

Ejemplo: 8, 10, 14, 18, 23, 24, 32, 34

18  23
mediana   20.5
2
Ms. Carmen Lucía Geldres Sánchez
Ejemplo 1: C) MEDIANA
En una constructora hay camionetas que han sido reparadas
durante los últimos 11 meses en el área de mantenimiento.
Calcule e interprete la mediana.
12, 10, 5, 15, 8, 11, 13, 8, 10, 17, 16
Primero se ordenan lo datos:
5, 8, 8, 10, 10, 11, 12, 13, 15, 16, 17
mediana
5 datos menores 5 datos mayores

Interpretación:
Durante 5 meses se atendieron a menos de 11 camionetas, y
durante 5 meses se atendieron a más de 11 camionetas.

Ms. Carmen Lucía Geldres Sánchez


Ejemplo 2: C) MEDIANA
Una constructora tiene 17 camionetas en funcionamiento las cuales
tienes diferentes años de antigüedad, calcule e interprete la mediana
- Ordenaríamos los datos de antigüedad pero ya esta ordenado
- Contamos la cantidad de datos de frecuencia: 3+6+2+1+2+3= 17
- Al ser un número impar encontramos (N+1)/2 = (17+1)/2 = 9
- Encontramos el valor en la posición 9
Antigüedad Frecuencia
- 12 12 12 15 15 15 15 15 15 (años)
- El valor de la mediana es 15 12 3
15 6
Interpretación: 17 2
Según la mediana, la antigüedad 18 1
de las camionetas es de 15 años. 20 2
23 3
Ms. Carmen Lucía Geldres Sánchez
C) MEDIANA
Ventajas:
 Los valores extremos no afectan a la mediana como en el
caso de la media aritmética.
 Es fácil de calcular, interpretar y entender.
 Se puede determinar para datos cualitativos.

Desventajas:
 Como valor central, se debe ordenar primero la serie de
datos.
 Para una serie amplia de datos no agrupados, el proceso de
ordenamiento de los datos demanda tiempo y usualmente
provoca equivocaciones.

Ms. Carmen Lucía Geldres Sánchez


D) MODA
 Es el valor que más se repite en un conjunto de datos, es
decir el que tiene mayor frecuencia
 No es afectada por valores extremos.
 Para datos discretos es fácil de calcular.
 No puede ser calculada exactamente en una distancia de
frecuencias.

 d1 
Mo  Li   i
  
 d1 d 2 
DatosAgrupados

Ms. Carmen Lucía Geldres Sánchez


D) MODA

Ejemplo 1:

4, 5, 7, 8, 8 , 10, 12, 15

4, 7, 12,12 , 15, 16, 20, 20 , 24, 27

7, 12, 15, 18, 25, 30, 31, 38

Ms. Carmen Lucía Geldres Sánchez


D) MODA
Ejemplo 2:
Una constructora tiene 17 camionetas en funcionamiento las
cuales tienes diferentes años de antigüedad, calcule e
interprete la moda
- La mayor frecuencia es 8, el cual es 17 años.

Antigüedad Frecuencia
(años)
Interpretación:
12 3
Según la moda, la
15 6
antigüedad de las
camionetas es de 17 años. 17 8
18 1
20 2
23 3
Ms. Carmen Lucía Geldres Sánchez
D) MODA
Ventajas:
 Se puede utilizar tanto para datos cualitativos como
cuantitativos.
 No se ve afectada por los valores extremos

Desventajas:
 No tiene un uso tan frecuente como la media.

 Muchas veces no existe moda (distribución amodal).

 En otros casos la distribución tiene varias modas, lo que


dificulta su interpretación.

Ms. Carmen Lucía Geldres Sánchez


SELECCIÓN DEL PROMEDIO MÁS ADECUADO
 La más usada es la media aritmética.
 La mediana siempre es la posición central.
 La moda se puede emplear cuando se requiere una idea rápida
de la tendencia central.
 La más representativa para datos de una distribución
asimétrica es la mediana.
 Llamados:
Media: valor de equilibrio de Magnitud .
Mediana: valor de equilibrio de Cantidad.
Moda: valor con mayor frecuencia.

Ms. Carmen Lucía Geldres Sánchez


2. MEDIDAS DE DISPERSIÓN
 Llamada medidas de variabilidad, por lo que representan el
grado de variabilidad de los datos.
 Son valores numéricos que miden la dispersión o variación
entre los datos
 Variación es la cantidad en que los datos varían entre si,
esta variación puede medirse e interpretarse
 Si los valores de las medidas de dispersión son pequeños,
significa que los datos están cerca del promedio
 Menos dispersión es más homogéneo

Ms. Carmen Lucía Geldres Sánchez


2. MEDIDAS DE DISPERSIÓN
Ejemplo:
Observe que la curva A en el siguiente gráfico tiene una mayor
dispersión que la curva B, a pesar que la posición central es la
misma.

Ms. Carmen Lucía Geldres Sánchez


A) RANGO
 Es la diferencia entre el valor máximo y el valor mínimo
 No involucra todos los valores de la muestra, solo 2 valores
 Por lo que el resultado no es tan exacto

B) RANGO INTERCUARTIL
 Es la diferencia entre el tercer y primer cuartil
 No involucra todos los valores de la muestra, solo 2 valores
 Indica el intervalo de valores que abarcan el 50% del total de
datos y que están al centro

Ms. Carmen Lucía Geldres Sánchez


C) DESVIACIÓN ESTÁNDAR
 Es un tipo de desviación promedio de los valores, con respecto
a la media.
 Permite medir el % de elementos dentro de intervalos de una
curva simétrica.
N
  X i  
2
 Sumatoria de la diferencia de los cuadrados
de la diferencia del valor menos la media,   i  1
dividido entre n-1 N
Poblacion
 S= desviación estándar n

 Es la raíz cuadrada positiva de la varianza.  xi  x  2

S  i 1
 Es la más utilizada n1
Muestra

Ms. Carmen Lucía Geldres Sánchez


C) DESVIACIÓN ESTÁNDAR
Pasos para encontrar la desviación estándar:
1. Calcular la media
2. Reste la media a cada valor individual
3. Eleve al cuadrado cada una de las diferencias del paso 2
4. Suma todos los cuadrados del paso 3
5. Divida el resultado del paso 4 entre n-1
6. Calcule la raíz cuadrada

Ms. Carmen Lucía Geldres Sánchez


C) DESVIACIÓN ESTÁNDAR
Ejemplo:
Tenemos una muestra del número de renuncias de trabajadores
en una obra: 8, 10, 5, 12, 10, 15. Cual es la variabilidad de
renuncias

x X i  x X i  x  2

8 8 - 10 = 2 4 60
10 10 - 10 = 0 0 x
6
5 5 - 10 = 5 25
12 12 - 10 = 2 4
10 10 - 10 = 0 0
x  10
15 15 - 10 = 5 25
 X  60  X i  x   0  Xi  x 
2
 58

Ms. Carmen Lucía Geldres Sánchez


C) DESVIACIÓN ESTÁNDAR

 X i  x   58
2

(Xi  x)
2

2
S  n 1

2 58
S  6 1  11.6

Ms. Carmen Lucía Geldres Sánchez


C) DESVIACIÓN ESTÁNDAR
Tenemos que S2 = 11.6 artículos vendidos al cuadrado.
Entonces
S  11,6

s
2
S
S  3,4 despidos

Ms. Carmen Lucía Geldres Sánchez


4-15

INTERPRETACIÓN Y USOS DE LA
DESVIACIÓN ESTÁNDAR
Regla empírica: para una distribución de frecuencias simétrica de
campana:
 Cerca de 68% de las observaciones estará dentro de ±1σ de
la media (μ);
 Cerca de 95% de las observaciones estará dentro de ±2σ de
la media (μ);
 Casi todas (alrededor de 99.7%) las observaciones estarán
dentro de ±3σ de la media (μ).

Ms. Carmen Lucía Geldres Sánchez


D) VARIANZA
 Es el cuadrado de la desviación estándar
 Media aritmética de las desviaciones cuadráticas respecto a la
media.
 Expresada en unidades al cuadrado.
 n-1, factor de corrección.

n
xi  x 
N 2
  X    2

S 2  i 1

2 i1
 n1
N
Poblacion Muestra

Ms. Carmen Lucía Geldres Sánchez


D) VARIANZA
Ejemplo:
Tenemos una muestra del número de renuncias de trabajadores
en una obra: 8, 10, 5, 12, 10, 15. Cual es la varianza

x X i  x X i  x  2

8 8 - 10 = 2 4 60
10 10 - 10 = 0 0 x
6
5 5 - 10 = 5 25
12 12 - 10 = 2 4
10 10 - 10 = 0 0
x  10
15 15 - 10 = 5 25
 X  60  X i  x   0  Xi  x 
2
 58

Ms. Carmen Lucía Geldres Sánchez


D) VARIANZA

 X i  x   58
2

 (X i  x )
2

2
S  n 1

2 58
S  6 1  11.6 Despidos2

Nivel de variabilidad
Ms. Carmen Lucía Geldres Sánchez de despidos
3. MEDIDAS DE LA FORMA DE LA CURVA
 Las curvas que representan a un conjunto de datos, pueden
ser analizadas de acuerdo a su:
a)Simetría b)Curtósis

a) Simetría: Tenemos 2 tipos de curvas


Las curvas simétricas, llamada curva normal, tienen una forma
tal que con una línea vertical que pase por el punto más alto
de la curva, dividirá el área de esta en dos partes iguales.

Ms. Carmen Lucía Geldres Sánchez


3. MEDIDAS DE LA FORMA DE LA CURVA
Las curvas asimétricas, llamada curva sesgada, son
aquellas cuyos valores están concentrados en el extremo
inferior o superior de la escala de medición del eje
horizontal. La “cola” indica el tipo de sesgo.

Ms. Carmen Lucía Geldres Sánchez


3. MEDIDAS DE LA FORMA DE LA CURVA
b) Curtósis: Cuando medimos la curtósis nos referimos al
grado de agudeza.
Pueden ser:
a) Leptocúrtica (concentración al centro)
b) mesocúrtica (distribuidos simétricamente)
c) platicúrtica (aplanada).

Ms. Carmen Lucía Geldres Sánchez