Documentos de Académico
Documentos de Profesional
Documentos de Cultura
2020 - 1
Estadistica Descriptiva
Clasificación y
presentación de los
datos
CLASIFICACIÓN Y PRESENTACIÓN
DE LOS DATOS:
Luego de recopilar los datos, éstos
tienen que ser ordenados y clasificados
para una correcta presentación.
La presentación puede ser mediante
Tablas de Frecuencias y/o Gráficos.
La Tabla de Frecuencias tiene como
objetivo resumir los datos sin perder
ninguno de ellos.
Según el tipo de variable tenemos los
siguientes casos :
I.- Tabla de Frecuencias cuando la
Variable es Cualitativa:
En este caso de manera inmediata se
construye la tabla de frecuencias, según las
diferentes opciones que se obtenga como
respuesta.
CONTROL DE N° productos
Porcentaje
CALIDAD alimenticios
MALO 3 15 %
REGULAR 4 20 %
BUENO 4 20 %
MUY BUENO 7 35 %
EXCELENTE 2 10 %
Total 20 100 %
Gráfica de barras
Frecuencia absoluta
8
7
6
5
4
3
2
1
0
Malo Regular Bueno Muy Bueno Excelente
Diagrama Circular (Gráfico de pastel)
10%
15%
35% 20%
20%
f
i 1
i n 0 fi n
i
Fi f j
j 1
m
fi
hi
n
h
i 1
i 1
0 2 2 7% 7%
1 6 8 20% 27%
2 10 18 33% 60%
3 4 22 13% 73%
4 3 25 10% 83%
5 5 30 17% 100%
Diagrama de Líneas o Bastones
Gráfica de N° de hijos
10
8
N° de familias
0
0 1 2 3 4 5
N° de hijos
B.Tabla de Frecuencias Por Intervalos
Ejemplos:
temperatura al interior de un lugar, interés
sólo clasificar en intervalos de cinco grados
{(0; 5°), (5 ;10°), .....,(30;35°)}.
Procedimiento para construir una TDF por
intervalos:
5. Tabular
Representación de la Tabla de Frecuencias
por Intervalos de Clase
xi fi Fi hi % H i%
Gráficos
Polígono de frecuencias.
HISTOGRAMA Y POLIGONO DE
FRECUENCIAS
10 15 20 25
Unidad de medición
Ojiva
111; 112 ; 113 ; 117 ; 119 ; 120 ; 123 ; 123 ; 124 ; 108 ;
128 ; 131 ; 132 ; 132 ; 134 ; 135 ; 136 ; 160 ; 161; 137 ;
138 ; 162 ; 126 ; 160 ; 148 ; 150 ; 141 ; 142 ; 143; 144 ;
143 ; 145 ; 147 ; 148 ; 152 ; 153 ; 153 ; 158 ; 158 ; 130
Procedimiento
R= 162 – 108 = 54
Procedimiento
4to.Paso. Tabulación
Histograma
N° de productos
alimenticios
9
0
108 117 126 135 144 153 162
Peso (gramos)
Polígono de Frecuencias
N° de
productos
alimenticios
Peso (gramos)
Frecuencia Acumulada: Ojiva
40
39
38
37
36
35
34
33
32
31
30
29
28
27
26
25
24
23
22
21
20
19
18
17
16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
0
• Varianza
• Rango
• Desviación Estándar
• Rango Cuartílico
• Coeficiente de Variación
• Rango Percentil
• Desviación Media
MEDIDAS DE
TENDENCIA CENTRAL
1. Promedio o Media Aritmética
x i
x i 1
n
2do.Caso: Datos agrupados en TDF
x i fi
x i 1
n
xi : valor de la variable (o marca de
clase)
fi : frecuencia absoluta
Propiedades de la media aritmética
Si todos los datos son iguales a una constante k,
entonces la media es igual a dicha constante:
M(k) = k
Si a cada dato se le suma (ó resta) una constante
k, a la media también se le suma (ó resta) dicha
constante:
M(x + k) = M(x) + k
Si a cada dato se le multiplica (ó divide) por una
constante k, a la media también se le multiplica (
ó divide) dicha constante:
M(k x) = k M(x).
La suma de las desviaciones con
respecto a la media es igual a cero:
n m
x
i 1
i x i 0 , x
i 1
i x fi 0
Promedio de promedios
Dados r grupos con n1, n2,..., nr
observaciones y siendo
las respectivas medias de cada uno de
ellos. Entonces la media de todas las
observaciones es:
n x1 n 2 x 2 ..... n r x r
x 1
n1 n 2 .... n r
Media Ponderada
Se calcula:
x .w i i
xw i 1
m
w
i 1
i
Observación:
0 2 2 7% 7%
1 6 8 20% 27%
2 10 18 33% 60%
3 4 22 13% 73%
4 3 25 10% 83%
5 5 30 17% 100%
6
Peso (g) xi fi
5 –10 7,5 30
[10-15 12,5 70
[15-20 17,5 150
[20-25 22,5 80
[25-30 27,5 20
Total n=350
5
x f i i
7,530 12,570 17,5150 22,580 27,520
X i 1
30 350
X 17,3571 gramos
Me
50% 50%
1er. Caso: Datos No Agrupados en
Tabla de frecuencias:
Primero se ordena los datos en forma
creciente y luego se tiene en cuenta sí:
M e x n 1
2
Me = 16,5
2do.Caso: Datos Agrupados en Tabla de
frecuencias:
En este caso la mediana se calcula mediante la
siguiente fórmula:
n
Fme 1
Me x´ me 1 c me 2
f me
donde ;
x´ me1 = límite inferior de la clase mediana.
c me = tamaño del intervalo de la clase mediana.
Fme1 = frecuencia absoluta acumulada anterior a
la clase mediana.
f me = frecuencia absoluta de la clase mediana.
2do.Caso: Datos Agrupados en Tabla de
frecuencias:
Clase mediana.- Es aquél intervalo que
contiene a la mediana es decir el intervalo
cuya Fi supera por primera vez a n/2
Donde se cumple:
n
Fme 1 Fme
2
Fme= frecuencia absoluta acumulada de la
clase mediana
Ejemplo:
Calcular la mediana en la siguiente tabla
de distribución de datos:
Peso(gramos) fi Fi
5 –10 30 30
10-15 70 100
15-20 150 250
20-25 80 330
25-30 20 350
Total n=350
Solución:
n
Fi 1 Fi 100 175 250
2
n
2 Fi 1 175 100
Me Li C 15 5 17.5
fi 150
3. La Moda
12; 14; 13; 13; 14; 12; 15; 13; 13; 16; 16
Mo=13 (se repite 4 veces)
2do.Caso: Datos Agrupados en Tabla de
frecuencias:
Se debe identificar la mayor frecuencia absoluta
(clase modal), a la cual llamaremos fj, y luego aplicar
la siguiente fórmula:
d1
Mo li cmo
d1 d 2
donde :
li = límite inferior de la clase modal.
cmo = tamaño del intervalo de la clase modal.
d1 f j f j 1
d 2 f j f j 1
Ejemplo:
Calcular la moda en la siguiente tabla de
distribución de datos:
Peso (gramos) fi
[5 –10> 30
[10-15> 70
[15-20> 150
[20-25> 80
[25-30> 20
Total n=350
El tercer intervalo tiene la mayor
frecuencia absoluta, entonces ahí se
encuentra la Moda.
d1 80
Mo L j C 15 5 17.67
d1 d 2 80 70
d1 150 70 80
d 2 150 80 70
Medidas de Tendencia Central
0,5000
Mediana
Moda
0,4500
Media
0,4000 Aritmética
0,3500
0,3000
0,2500
0,2000
0,1500
0,1000 Q1 Q2 Q3 Q4
0,0500
0,0000
0 1 2 3 4 5 6 7
Rango
62
Relación entre la Media, Mediana y Moda
Moda<Mediana<Media
Curva sesgada a la
izquierda (sesgo negativo):
Media<Mediana< Moda
promedio
mediana
moda
MEDIDAS DE
DISPERSIÓN
( II ) ESTADIGRAFOS DE DISPERSIÓN
i
( X X ) 2
S² (x) i 1
n 1
X i2 nX 2
S² (x) i 1
n 1
2do. Caso: Datos agrupados .
i
( X X ) 2
fi
S2 i 1
n 1
X i2 f i nX 2
S2 i 1
n 1
Propiedades de la Varianza:
1.- V(X) 0
2.- V(K) = 0,esto es si cada Xi = K
(constante).
3.- V(X ± K) = V(X),
4.- V(K.X) = K².V(X) ,
5. - V (ax ± by) = a². V (X) + b². V(Y)
siendo a y b constantes , X e Y
variables independientes.
2.- DESVIACIÓN ESTÁNDART: S(x).
Baja variabilidad
5 %≤ CV < 10% Datos homogéneos
Alta variabilidad
CV ≥ 25% Datos muy heterogéneos
El pensamiento estadístico algún
día será parte del ciudadano
eficiente, y tan necesario como la
habilidad para leer y escribir.