Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Capitulo 2
1
Estadística Descriptiva con una Variable
2
Estadística Descriptiva con una Variable
Tabla de frecuencias de la Variable Nominal:
Atributos de la Frecuencia Frecuencia
Variable (Ai) Absoluta (ni) Para describir la tabla de frecuencias
Relativa (hi%)
A1 n1 h1 de tipo Nominal, es necesario en un
A2 n2 h2 primer paso ordenar los atributos en
A3 n3 h3 función de las frecuencias absolutas,
…,, …,, …,,
de forma ascendente o descendente,
…,, …,, …,,
de manera que el atributo con la
Ai ni hi
mayor frecuencia estará al inicio o final
Total: Σ (ni)=N Σ (hi)=100%
de la tabla de frecuencias, lo que nos
permite a simple vista entender cual es el atributo con mayor cantidad de
casos y cual el que presenta la menor cantidad de casos.
5
3
Estadística Descriptiva con una Variable
Ejercicios de Aplicación:
Al momento de realizar una construcción estos Ladrilladores / canteros 152
son los datos recogidos de proyectos anteriores Carpinteros 113
según la ocupación o participación que tuvieron Construcción 1057
los obreros. El objetivo es crear un grupo de Electricistas 548
trabajo del cual usted es el Jefe, pero solo Vidrieros 100
puede contratar 21 personas, ¿Cuál seria la Pintores y acabado 453
forma de conformar este grupo en base a estos
Plomeros 379
datos?, analice los datos.
4
Estadística Descriptiva con una Variable
Diagrama Circular: Interpretación:
De acuerdo con los resultados,
para conformar un grupo de 21
obreros en las diferentes
actividades, se deben considerar:
8 obreros para construcción, 4
obreros como electricistas; 3
obreros como pintores, 3 obreros
como plomeros, 1 obrero para
ladrilleros, 1 carpintero y 1
vidriero.
5
8/3/2021
11
12
6
Estadística Descriptiva con una Variable
Para describir la tabla de frecuencias Ordinal, debido a que la tabla ya
presenta un orden en la variable se debe hacer mención al atributo con la
mayor y menor frecuencia simple absoluta o relativa.
13 13
Ejercicios de Aplicación:
Investigadores han realizado una encuesta a los compradores sobre si los
comerciantes hacen o no emisión de las facturas. Los resultados de esta
encuesta se presenta el siguiente cuadro resumen:
Si lo hacen 16
Probablemente si 15
No esta seguro 30
Probablemente no 40
No lo hacen 60
14
7
Estadística Descriptiva con una Variable
Solución:
La tabla de frecuencias queda de la siguiente manera:
Donde la variable ordinal es el grado de cumplimiento en la emisión de
facturas,
Emisión de Facturas Frecuencia Frec. Acum. Frecuencia Frec. Acum.
(Ai) Absoluta (ni) Absoluta (Ni) Relativa (hi) Relativa (Hi)
No lo hacen 60 60 37,3% 37,3%
h1= n1 / N * 100%
Probablemente no 40 100 24,8% 62,1%
h1= 60/161*100% No esta seguro 30 130 18,6% 80,7%
h1= 37,3% Probablemente si 15 145 9,3% 90,1%
Si lo hacen 16 161 9,9% 100,0%
Total: 161 100%
15
8
Estadística Descriptiva con una Variable
Ejercicio propuesto:
Un restaurante utiliza un cuestionario para preguntar a sus clientes cómo
califican el servicio, la calidad de los alimentos, los precios y el ambiente.
Cada característica se califica en una escala de excepcional (O), muy bueno
(V), bueno (G), promedio (A) y malo (P). Use la estadística descriptiva para
resumir los datos siguientes. ¿Qué piensa sobre las calificaciones de la
calidad en el restaurante? G O V G A O V O V G O V A
V O P V O G A O O O G O V
V A G O V P V O O G O O V
O G A O V O O G V A G
Realice la Tabla de Frecuencias, su interpretación y grafica.
17
18
9
Estadística Descriptiva con una Variable
Para efectos de cálculo, para lograr intervalos de clase de igual distancia,
aunque no es una condición ya que estos intervalos puedes construirlos con
diferentes rangos, se tiene a continuación las siguientes formulas iniciales se
emplean para construir la tabla de frecuencias con intervalos constantes:
19
20
10
Estadística Descriptiva con una Variable
21
22 22
11
Estadística Descriptiva con una Variable
En cambio, la distribución de frecuencias absolutas y relativas acumuladas,
identifica el número acumulado de observaciones incluidas bajo el límite exacto de
cada intervalo de clase de la distribución.
En la interpretación se debe hacer mención aquel intervalo que contenga más del
50% de las observaciones en su frecuencia relativa acumulada, explicando que A
LO MÁS en la mayoría de las observaciones se pueden observar valores que están
por debajo del limite superior de dicho intervalo.
Para representar gráficamente a la tabla se tiene el Histograma, que es una figura
de dos ejes que representa en el eje "X" a los intervalos de clase, y el eje "Y" a las
frecuencias simples absolutas o relativas. Las barras deben dibujarse juntas ya que
la variable es continua y no existen vacios entre los intervalos.
23 23
Ejercicio de Aplicación: 8 38 15 46 35
Crear la tabla de frecuencias para los 24 19 13 38 15
datos que señalan el tiempo que tarda 35 41 31 30 40
la pizzería en entregar un pedido, 15 16 31 42 21
donde la regla es de no sobrepasar los 32 48 36 50 32
30 minutos, y por cada minuto de 22 44 22 34 23
retraso 10% de descuento, ¿Como está
26 28 28 27 24
el servicio de entrega?
33 32 16 26 13
12 12 9 37 47
50 25 34 46 49
24
12
Estadística Descriptiva con una Variable
Solución: La tabla de frecuencias debe ser construida a partir de:
- Numero de Intervalos = NI = 1 + 3,3*log (50) = 6,61 = 7 [intervalos]
- Amplitud del Intervalo = (50 – 8) / 7 = 6 [minutos]
Intervalo de Marca de Frecuencia Frec. Acum. Frecuencia Frec. Acum.
Clase (Ci) Clase (Mi) Absoluta (ni) Absoluta (Ni) Relativa (hi) Relativa (Hi)
[ 8 – 14 ( 11 6 6 12% 12%
[ 14 – 20 ( 17 6 12 12% 24%
[ 20 – 26 ( 23 7 19 14% 38%
[ 26 – 32 ( 29 8 27 16% 54%
[ 32 – 38 ( 35 10 37 20% 74%
[ 38 – 44 ( 41 5 42 10% 84%
[ 44 – 50 ] 47 8 50 16% 100%
Total: Σ (ni) = 50 Σ (hi)=100%
25
Interpretación:
- La mayor parte de los pedidos, se los entrega entre 32 a 37 minutos, ellos
son 10 casos que presentan el 20%.
- La menor parte de los pedidos, presentan un tiempo de entrega de 38 a
43 minutos, son 5 casos o el 10%.
- De acuerdo con la tabla de frecuencias, mayores a 30 minutos son 23
casos, de hasta 50 minutos, que representan aquellas ordenes con
descuento, estos son el 46% del total. El servicio es deficiente.
26
13
Estadística Descriptiva con una Variable
El Histograma:
27
28
14
Estadística Descriptiva con una Variable
Media Aritmética, es la suma de los valores del grupo de datos entre el
número de observaciones.
Media de la población:
Media de la muestra:
29
30
15
Estadística Descriptiva con una Variable
31
32
16
Estadística Descriptiva con una Variable
Solución: Respecto a la Media aritmética,
𝑋𝑖 294,08
𝑋= = = 9,803 𝑃𝑟𝑜𝑐𝑒𝑠𝑜 𝐴𝑛𝑡𝑖𝑔𝑢𝑜
𝑛 30
𝑋𝑖 282,73
𝑋= = = 9,424 𝑃𝑟𝑜𝑐𝑒𝑠𝑜 𝑁𝑢𝑒𝑣𝑜
𝑛 30
33
34
17
Estadística Descriptiva con una Variable
Interpretación:
De acuerdo con los resultados de la mediana, podemos concluir que el
valor que presenta el proceso antiguo con el 50% de los datos es 9,98[cm],
en cambio para el proceso nuevo es de 9,46 [cm].
Confirmando de esta manera que el proceso nuevo presenta valores
menores a 9,5 [cm].
35
N
Ni1
Mediana Med L i1 A. 2
Ni Ni1
para el intervalo que contiene el 50% de los datos en Hi.
36
18
Estadística Descriptiva con una Variable
Ejercicio de Aplicación: Para la tabla de frecuencias el tiempo que tarda la
pizzería en entregar, calcular la media, mediana y moda:
Me
Mo
37
25 19
Mediana Med 26 6. 30,5 31min
27 19
3. La moda:
Moda 35[min], la mayor frecuencia es : n5 10
38
19
Estadística Descriptiva con una Variable
Interpretación:
De acuerdo con la tabla de frecuencias, el tiempo medio de entrega es de
30 [min], con una mediana de 31 [min] y la moda igual 35 [min], lo cual
demuestra una asimetría negativa, es decir la mayor parte de los datos
son valores por encima de la media, concluyendo que el tiempo de
entrega es muy alto, o por encima de lo esperado.
39
40
20
Estadística Descriptiva con una Variable
Moda < Mediana < Media Media = Mediana = Moda Media < Mediana < Moda
Asimetría Positiva Simetría Asimetría Negativa
(La mayoría de los datos ( La mayoría de los datos (La mayoría de los datos
están por debajo de la media) están alrededor de la media) están por encima de la media)
41
42
21
Estadística Descriptiva con una Variable
2.5 MEDIDAS DE DISPERSIÓN
Son complementarias de las de posición en el sentido que señalan la
dispersión en conjunto de todos los datos de la distribución respecto de la
medida o medidas de localización adoptadas.
43
44
22
Estadística Descriptiva con una Variable
Varianza, Se asemeja a la desviación media absoluta en que se basa en la
diferencia entre cada valor del conjunto de datos y la media del grupo.
Pero con un aspecto importante: cada diferencia se eleva al cuadrado
antes de sumarse. En el caso de la población, la varianza se representa
con:
2 ( X )2 ó
2 X 2 N 2 , varianza de la población
N N
S 2
(X X ) 2
ó S 2
X 2
nX 2 , varianza de la muestra
n 1 n 1
Para el caso de la Desviación Estándar se tiene las siguientes expresiones:
A nivel poblacional: X 2
N 2
N
A nivel muestral:
S
X 2
nX 2
n 1
46
23
Estadística Descriptiva con una Variable
Propiedades de la Varianza:
1. La varianza de un conjunto de observaciones, es un numero no negativo.
( V(x) >= 0 )
2. La varianza de una constante es cero. Es decir, cuando las observaciones
no varían. ( V(ctte) = 0 )
3. Si a cada observación se suma o resta una constante, la varianza del
nuevo conjunto de valores es igual a la varianza original.
V(y) = V(x ± ctte) = V(x)
4. Si a cada observación se multiplica una constante, la varianza del nuevo
conjunto de valores es igual a la varianza original multiplicada por el
cuadrado de la constante. V(y) = V(x * ctte) = (ctte)^2 V(x)
47
48
24
Estadística Descriptiva con una Variable
Ejercicio de Aplicación:
De acuerdo con los datos de las vigas, se pide calcular la variación presente
en las observaciones y de esta forma medir el grado de ajuste en la
producción (menor a 9,5 [cm]):
8,05 9,73 9,87 10,01 10,15 8,51 8,83 9,37 9,6 10,05
8,72 9,8 9,95 10,02 10,15 8,65 9,14 9,39 9,63 10,05
8,72 9,8 9,97 10,03 10,26 8,68 9,19 9,43 9,64 10,05
8,8 9,84 9,98 10,05 10,26 8,78 9,27 9,48 9,7 10,09
9,55 9,84 9,98 10,05 10,26 8,82 9,35 9,49 9,75 10,10
9,7 9,87 10 10,12 10,55 8,82 9,36 9,54 9,85 10,12
49
50
25
Estadística Descriptiva con una Variable
Interpretación:
De acuerdo con los resultados, los datos de las vigas en el proceso antiguo,
respecto de sus longitudes, pueden variar de una a la otra en un máximo
de 2,5 cm (Rango). Siendo la desviación promedio entre las vigas de
0,54cm (Desviación estándar). Finalmente la variación de estas vigas es:
X ± S = 9,80 ± 0,54 (cm)
51
52
26
Estadística Descriptiva con una Variable
Interpretación:
De acuerdo con los resultados, los datos de las vigas en el proceso nuevo,
respecto de sus longitudes, pueden variar de una a la otra en un máximo
de 1,6 cm (Rango). Siendo la desviación promedio entre las vigas de
0,48cm (Desviación estándar). Finalmente la variación de estas vigas es:
X ± S = 9,42 ± 0,48 (cm)
De acuerdo con este rango, la mayoría (68%) de las longitudes en las vigas
tendrán valores que se espera estén entre: 8,94 a 9,9 cm.
53
n N i 1
Q1 Li 1 A 4 , al 25% de los casos
N i N i 1
n N i 1
Q2 Li 1 A 2 , al 50% de los casos
N i N i 1
3n N i 1
Q3 Li 1 A 4 , al 75% de los casos
N i N i 1
54
27
Estadística Descriptiva con una Variable
2
( MC i ) 2 . ni
(MC i ) 2 . ni
CV
.100%
N N
S2
( MCi X ) 2 . ni S
(MC i X ) 2 . ni CV
S
.100%
N 1 N 1 X
55
Q1
Q3
56
28
Estadística Descriptiva con una Variable
Solución: n4 N i 1 504 12
Q
1. Los cuartiles son: 1 Li 1 A 20 6.19 12 20,43 20min
N i N i 1
3n N i 1 3( 50 )
37
Q3 Li 1 A 4 38,6 39min
4
38 6.
N i N i 1 42 37
RIQ Q3 Q1 39 20 19min
2. La varianza y desviación estándar son:
S 2
(MC
i ) 2 . ni
(11 30) .6 (17 30) .6 ..... (47 30) .8 136,7min
2 2 2
2
N 50 1
S 11,7 12min
57
3 i
N. S 3 N 1
58
29
Estadística Descriptiva con una Variable
La medida del aplastamiento con relación a la curva de Gauss (normal) mide
el alejamiento de los datos, coeficiente de Kurtosis:
- Platicúrtica, con las observaciones distribuidas en forma relativamente
pareja entre las clases,
- Leptocúrtica, afilada, con las observaciones concentradas en un estrecho
rango de valores,
- Mesocúrtica, ni plana ni afilada en términos de la distribución de los
valores observados,
N ( i ) 4
4 3
2 4
N 1 .S
59
Media
Mediana
60
30