Está en la página 1de 47

Capítulo 4.

-MEDIDAS ESTADISTICAS-
Las medidas estadísticas son valores que representan y resumen en un dato el
conjunto que se estudia.

Se consideran dos grupos de medidas:

De tendencia Central y de dispersión.

De Tendencia Central.
Las medidas de tendencia Central corresponden a un valor que resume el
conjunto de datos. Son valores intermedios de los conjuntos de datos, entre ellas
encontramos:

Media aritmética o Promedio aritmético.

Es un valor que se calcula en las variables cuantitativas, discretas y continuas,


resumen y representan en un valor al conjunto de datos que se estudia.

Para su cálculo intervienen todos los datos del estudio y es un cociente entre la
suma de todos los valores y el número de ellos.

Se tiene una notación diferente entre la media aritmética para datos de una
población con la media aritmética con datos de una muestra:

El valor de la Media aritmética para datos de población se representa por la letra μ


del alfabeto griego, mientras que para las muestras utilizamos una de las letras
finales de nuestro alfabeto: Ῡ o cualquiera otra letra con la barra en la parte
superior.

∑ Yᵢ (4.1)
1
μ=
N

Para la población
Estadística Descriptiva
Donde Yᵢ representa cada uno de los valores de la variable en estudio y N es el
número de unidades estadísticas (datos) de la población que se estudian.

En el caso de muestras, entonces:


n

∑ Yᵢ (4.2)
1
Ȳ=
n

Donde Yᵢ es cada uno de los valores de la variable (datos) y n es el número de


unidades (datos) de la muestra.

Ejemplos.

1-. Un estudiante de Administración de Empresas obtiene las siguientes notas en


el semestre anterior:

Asignatura Nota
Planeación Estratégica 3,9
Matemáticas II 3,4
Estadística Aplicada 3,7
Emprendimiento 4,4
Legislación II 4,6

3,9+3,4+3,7+ 4,4+ 4,6 20


μ= 5
= 5
= 4,0

La nota promedio del estudiante en el semestre es de 4,0

2-. En un curso de matemáticas con 24 alumnos registran las siguientes notas:

3,7 4,5 3,3 4,0 3,2 3,8 3,1 3,3


4,2 3,7 2,8 2,3 3,3 2,8 3,8 4,4

1
Estadística Descriptiva
2,3 3,6 3,4 4,1 3,7 3,7 4,0 3,0

84
∑Yᵢ = 84 y n = 24 μ= = 3,5
24

La nota promedio del curso de matemáticas es de 3,5

3-. Se registra el ingreso mensual en millones de pesos de una muestra


trabajadores que laboran en el sector de la salud en la ciudad de Villavicencio
durante el segundo semestre del año 2017:

3,2 4,4 1,3 2,3 3,7 4,9 6,8 4,3 2,1 1,2
3,8 7,3 5,6 2,4 6,4 5,7 6,2 3,8 3,2 1,5
3,3 4,6 6,8 8,2 3,8 4,7 4,2 2,5 3,6 5,5

129
∑Yᵢ = 129 y n = 30 Ȳ= = 4,3 Millones de pesos
30

Este resultado interpreta que el valor promedio del ingreso mensual de los
trabajadores que laboran en el sector salud es de 4,3 millones de pesos
($4.300.000,oo).

Media Ponderada
En algunos casos se debe calcular la media ponderada que se presenta cuando
hay un factor que afecta el valor del dato.

Como ejemplo podemos considerar las notas que un estudiante obtiene durante el
semestre donde cada materia tiene un número determinado de créditos, esta
situación se describe así:

Asignatura Créditos Nota


Planeación Estratégica 2 3,9
Matemáticas II 3 3,4
Estadística Aplicada 3 3,7
Emprendimiento 4 4,4
Legislación II 3 4,6

2
Estadística Descriptiva
Total de créditos 15
El valor de la Media aritmética o Promedio ponderado, en este caso, se obtiene
multiplicando cada nota por el número de créditos y se debe dividir por el número
total de créditos:

3,9∗2+3,4∗3+3,7∗3+ 4,4∗4 +4,6∗3 60,5


μ= 15
= 15
= 4,03

La nota promedio del semestre para el estudiante es de 4,03

Media aritmética con datos agrupados


Cuando tenemos datos agrupados en una tabla de frecuencia el valor de la media
aritmética o promedio se determina de la siguiente manera:

Cuando la variable es de tipo discreta, se adiciona una columna que multiplique


el valor de la variable por el número de repeticiones y se suman los resultados, se
toma este total y se divide en el número total de los datos:

En el caso de datos de una población:


N

μ =
∑ Yᵢ∗Nᵢ (4.3)
1
¿
N

En caso de una muestra:

∑ Yᵢ∗fᵢ (4.4)
1
Ȳ=
n

3
Estadística Descriptiva
Con el ejemplo del número de retrasos por semana de los trabajadores, el valor
promedio del número de retrasos se calcula así:

Se adiciona una columna, donde se multiplica la Clase por la frecuencia simple


absoluta.
Retrasos por semana de los trabajadores de una entidad financiera
# DE
fᵢ hᵢ Fᵢ Hᵢ Yᵢ*fᵢ
RETRASOS
0 19 0,475 19 0,475 0,0
1 10 0,250 29 0,725 10,0
2 4 0,100 33 0,825 8,0
3 3 0,075 36 0,900 9,0
4 2 0,050 38 0,950 8,0
5 2 0,050 40 1.000 10,0
Total 40 1. / / / / //// 45,0
Fuente: Oficina de Talento humano

45
Ȳ= =1,125
40

Este valor determina que el número de retrasos promedio por semana es de


1,125

En el caso de la variable continua, agrupada en una tabla de frecuencia, se


calcula en una nueva columna el valor medio de cada subintervalo que se
denomina Marca de clase:

Valor Mayor+Valor menor


Yᵢ =
2
(4.5)

Este resultado en cada subintervalo en que se clasifica la variable.

Luego en una columna nueva se multiplica cada uno los valores de las marcas de
clase (Yᵢ) por el valor de la frecuencia simple absoluta (fᵢ)

4
Estadística Descriptiva
En el ejemplo del curso de matemáticas con 24 alumnos, donde se registran las
siguientes notas:

3,7 4,5 3,3 4,0 3,2 3,8 3,1 3,3


4,2 3,7 2,8 2,3 3,3 2,8 3,8 4,4
2,3 3,6 3,4 4,1 3,7 3,7 4,0 3,0

Primero elaboramos la tabla con las clases, las frecuencias simples absolutas (fᵢ),
las marcas de clase (Yᵢ) y la columna de la multiplicación de la marca de clase por
la frecuencia simple absoluta.

XMax = 4,4 XMin = 2,3

Con estos dos valores calculamos el valor del Rango de los datos:

R = XMax - XMin

R = 4,5 – 2,3 = 2,2

En segundo lugar se determina el número de clases o subintervalo en que se


clasificarán los datos, por lo general recurrimos a la fórmula de Sturges:

m = 1 + (3,3*log₁ₒ 24) = 5,5547

Como el número de clases debe ser un valor entero entonces se próxima al


entero más cercano, en este caso: m=6

Determinados el Rango y el número de subintervalos procedemos a calcular la


denominada Amplitud de Clase, valor que corresponde a la diferencia entre el
valor mayor y el valor menor en cada clase:

5
Estadística Descriptiva
2,2
A= =0,36667
6

Entonces se aproxima, en este caso al segundo decimal: A = 0,37

Calificación (Nota) fᵢ Yᵢ Yᵢ* fᵢ

2,30 2,67 2 2,485 4,97


2,67 3,04 3 2,855 8,565
3,04 3,41 6 3,225 19,35
3,41 3,78 5 3,595 17,975
3,78 4,15 5 3,965 19,825
4,15 4,52 3 4,335 13,005
Sumas 24  / / / 83,69

83,69
μ = ¿ = 3,487
24

Aproximando al segundo valor decimal, podemos interpretar este resultado como:

El valor promedio de las calificaciones (Notas) del curso de matemáticas es de


3,49

Otro ejemplo de este tipo es el relacionado con la cantidad de minutos de retraso


que registran los trabajadores de la entidad financiera y cuyas frecuencias simples
absolutas calculadas anteriormente son:

Cantidad de minutos en retraso de los trabajadores de una entidad financiera

TIEMPO DE
RETRASOS fᵢ
(Minutos)
0 6 21
6 12 7
12 18 5

6
Estadística Descriptiva
18 24 3
24 30 2
30 36 2
Total 40
Fuente: Oficina de Talento humano

Completando la tabla con la información para el cálculo de la media aritmética, con


la marca de clase y la multiplicación de la marca de clase por la frecuencia de la
clase, tenemos:

TIEMPO DE
RETRASOS fᵢ Yᵢ Yᵢ* fᵢ
(Minutos)
0 6 21 3 63
6 12 7 9 63
12 18 5 15 75
18 24 3 21 63
24 30 2 27 54
30 36 2 33 66
Total 40 //// 384

384
Ȳ= =¿9,6 minutos
40

Resultado que podemos interpretar como: el valor promedio del tiempo de retraso
de los trabajadores de la entidad financiera es de 9,6 minutos.

Para el caso del ingreso mensual (millones de $) de una muestra trabajadores que
laboran en el sector de la salud en la ciudad de Villavicencio durante el segundo
semestre del año 2017:

3,2 4,4 1,3 2,3 3,7 4,9 6,8 4,3 2,1 1,2
3,8 7,3 5,6 2,4 6,4 5,7 6,2 3,8 3,2 1,5
3,3 4,6 6,8 8,2 3,8 4,7 4,2 2,5 3,6 5,5

7
Estadística Descriptiva
Para calcular el valor de la media aritmética o promedio procedemos:

Primero a construir una tabla que tenga las columnas de las clases o subintervalos
(valor menor y valor mayor), la marca de clases, las frecuencias simples absolutas
y del producto de la marca de clase por la frecuencia:

XMáximo = 8,2 XMínimo = 1,2

Rango = 8,2 – 1,2 = 7

m = 1 + (3,3*log₁ₒ 30) = 5,8745 m=6

Y calculamos el valor de la amplitud de clase (de cada sub-intervalo)

7
A= =1,16667 Valor que se aproxima A = 1,17
6

Elaborando la tabla:

Ingreso
Yᵢ fᵢ Yᵢ * fᵢ
(Millones de $)
1,20 2,37 1,785 5 8,925
2,37 3,54 2,955 5 14,775
3,54 4,71 4,125 10 41,250
4,71 5,88 5,295 4 21,180
5,88 7,05 6,465 4 25,860
7,05 8,22 7,635 2 15,270
30 127,260

127,26
Ȳ= =¿4,242 Millones de $
30

8
Estadística Descriptiva

El valor promedio del ingreso mensual (millones de $) de los trabajadores que


laboran en el sector de la salud en la ciudad de Villavicencio durante el segundo
semestre del año 2017 es de 4,242 millones de pesos.

Mediana.
Se simboliza con Me y es un valor que resume y representa al conjunto de datos,
se determina como el valor del dato ubicado en la posición central del conjunto
ordenado de los datos.

El valor es mayor al 50% de los datos y a su vez es menor al 50% de los datos.

Sí el número de datos es impar, entonces, el valor de la mediana corresponde al


dato central del conjunto ordenado de datos.

Ejemplos.

Si tenemos un conjunto de 11 datos el valor de la Mediana corresponde al dato #


6.

Si el número de datos es par, el valor de la mediana corresponde al promedio de


los dos datos centrales.

Ejemplo.

Si el número de datos es de 18, el valor de la mediana corresponde a sumar los


datos número 9 y número 10 y dividir en dos.

En los ejemplos que se vienen trabajando, el valor de la mediana se establece de


la siguiente manera:

1-. Un estudiante de Administración de Empresas obtiene las siguientes notas en


el semestre anterior:

9
Estadística Descriptiva
Asignatura Nota
Planeación Estratégica 3,9
Matemáticas II 3,4
Estadística Aplicada 3,7
Emprendimiento 4,4
Legislación II 4,6

Primero los datos se ordenan:

Asignatura Nota
Matemáticas II 3,4
Estadística Aplicada 3,7
Planeación Estratégica 3,9
Emprendimiento 4,4
Legislación II 4,6

El valor de la mediana corresponde a:

Me = 3,9 de la asignatura de Planeación Estratégica.

2-. En un curso de matemáticas con 24 alumnos registran las siguientes notas:

3,7 4,5 3,3 4,0 3,2 3,8 3,1 3,3


4,2 3,7 2,8 2,3 3,3 2,8 3,8 4,4
2,3 3,6 3,4 4,1 3,7 3,7 4,0 3,0

Una vez ordenados los datos se tiene:

2,3 2,3 2,8 2,8 3,0 3,1 3,2 3,3


3,3 3,3 3,4 3,6 3,7 3,7 3,7 3,7
3,8 3,8 4,0 4,0 4,1 4,2 4,4 4,5

El valor de la mediana se determina: Dato # 12 = 3,6 y

Dato # 13 = 3,7

10
Estadística Descriptiva
Que corresponden a los valores de los dos datos centrales del conjunto ordenado.

3,6+3,7
Me = = 3,65
2

Valor mediana de las notas de matemática es de 3,65

Para el ejemplo 3:

3-. Se registra el ingreso mensual en millones de pesos de una muestra


trabajadores que laboran en el sector de la salud en la ciudad de Villavicencio
durante el segundo semestre del año 2017:

3,2 4,4 1,3 2,3 3,7 4,9 6,8 4,3 2,1 1,2
3,8 7,3 5,6 2,4 6,4 5,7 6,2 3,8 3,2 1,5
3,3 4,6 6,8 8,2 3,8 4,7 4,2 2,5 3,6 5,5

Ordenando los datos:

1,2 1,3 1,5 2,1 2,3 2,4 2,5 3,2 3,2 3,3
3,6 3,7 3,8 3,8 3,8 4,2 4,3 4,4 4,6 4,7
4,9 5,5 5,6 5,7 6,2 6,4 6,8 6,8 7,3 8,2

El valor de la mediana corresponde al promedio de los datos # 15 y 16:

Dato #15 = 3,8 Dato #16 = 4,2

3,8+4,2
Me = = 4,0 Millones de $
2

11
Estadística Descriptiva
Mediana en datos agrupados

Para determinar el valor de la Mediana cuando los datos se tienen agrupados se


aplica la siguiente formula:

n
A∗ −Fᵢ ₋₁
2 (4.6)
Me=Limite Inferior ᵢ+
fᵢ

Donde:

El Límite Inferiorᵢ se refiere al valor menor de la clase donde se ubica el valor


central del conjunto de datos.

Fᵢ₋ ₁ corresponde a la frecuencia absoluta acumulada anterior a la clase donde


se ubica la mediana (la del dato central).

fᵢ Es el valor de la frecuencia simple absoluta de la clase donde se ubica la


mediana.

En el ejemplo sobre el tiempo de retrasos (minutos), de los trabajadores, se


determina que la clase de la mediana es la primera (intervalo de 0 a 6 minutos)
donde se ubica el dato central (Y20)

TIEMPO DE
RETRASOS fᵢ Nᵢ
(Minutos)
0 6 21 21
6 12 7 28
12 18 5 33
18 24 3 36
24 30 2 38
30 36 2 40
Total 40 ////

12
Estadística Descriptiva
40
−0
Me = 0 + 6* 2 = 5,7 minutos.
21

De eta manera se establece que el valor de la mediana para el tiempo de retraso


de los trabajadores es de 5,7 minutos.

En el ejemplo sobre el ingreso mensual en millones de pesos de una muestra


trabajadores que laboran en el sector de la salud en la ciudad de Villavicencio:

Ingreso
Yᵢ fᵢ Nᵢ
(Millones de $)
1,20 2,37 1,785 5 5
2,37 3,54 2,955 5 10
3,54 4,71 4,125 10 20
4,71 5,88 5,295 4 24
5,88 7,05 6,465 4 28
7,05 8,22 7,635 2 30
30

La clase donde se ubica el dato central (#15) corresponde a la 3.

Por tanto:

30
−10
Me = 3,54 + 1,17* 2 = 4,115 millones de $
10

Se determina que el valor de la mediana en el ingreso mensual (millones de


pesos) de los trabajadores que laboran en el sector de la salud en la ciudad de
Villavicencio es de 4,115 millones de pesos.

Moda.

13
Estadística Descriptiva
La moda de un conjunto de datos corresponde al valor del dato que mayor
número de veces se repite, es decir el de mayor frecuencia.

En los ejemplos que se están estudiando la moda corresponde:

1-. Un estudiante de Administración de Empresas obtiene las siguientes notas en


el semestre anterior:

Asignatura Nota
Planeación Estratégica 3,9
Matemáticas II 3,4
Estadística Aplicada 3,7
Emprendimiento 4,4
Legislación II 4,6

En este caso no tenemos valor de Moda por cuanto no se presenta repetición en


las notas.

2-. En un curso de matemáticas con 24 alumnos registran las siguientes notas:

Tomando los datos del cuadro ordenado

2,3 2,3 2,8 2,8 3,0 3,1 3,2 3,3


3,3 3,3 3,4 3,6 3,7 3,7 3,7 3,7
3,8 3,8 4,0 4,0 4,1 4,2 4,4 4,5

Se aprecia que la nota que más se repite es el 3,7 por tanto el valor de Moda es la
calificación 3,7.

3-. Se registra el ingreso mensual en millones de pesos de una muestra


trabajadores que laboran en el sector de la salud en la ciudad de Villavicencio
durante el segundo semestre del año 2017.

Tomando la tabla ordenada tenemos:

14
Estadística Descriptiva
1,2 1,3 1,5 2,1 2,3 2,4 2,5 3,2 3,2 3,3
3,6 3,7 3,8 3,8 3,8 4,2 4,3 4,4 4,6 4,7
4,9 5,5 5,6 5,7 6,2 6,4 6,8 6,8 7,3 8,2

El valor del ingreso mensual que más se repite es 3,8 millones de $, por tanto este
valor representa la moda.

Moda en datos agrupados

Para establecer el valor de la moda con datos agrupados se utiliza la siguiente


formula:

(fᵢ−fᵢ ₋₁)
Mo = Límite Inferiorᵢ + A* (4.7)
( fᵢ−fᵢ ₋ ₁ )+ ¿¿

Donde:

Límite Inferiorᵢ se determina por la clase donde está el valor de la moda (la mayor
frecuencia simple absoluta de a tabla)

A Es el valor de la Amplitud de la Clase.

fᵢ Corresponde a la frecuencia absoluta de la clase de la moda (la de mayor


numero de repeticiones).

fᵢ₋ ₁ Es el valor de la frecuencia absoluta de la clase anterior a la de la moda.

fᵢ₊ ₁ Es el valor de la frecuencia absoluta de la clase siguiente a la de la moda.

En el ejemplo sobre el tiempo de retrasos (minutos) de los empleados de una


entidad financiera, se determina que la clase de la Moda es la primera (intervalo
de 0 a 6 minutos) donde se ubica la mayor frecuencia simple absoluta (21)

TIEMPO DE
RETRASOS (Minutos)
fᵢ Nᵢ

15
Estadística Descriptiva

0 6 21 21
6 12 7 28
12 18 5 33
18 24 3 36
24 30 2 38
30 36 2 40
Total 40 ////

Por tanto el valor de la Moda es:

21−0
Mo = o + 6 * = 3,6 minutos
( 21−0 ) +(21−7)

En el ejemplo sobre el ingreso mensual en millones de pesos de una muestra


trabajadores que laboran en el sector de la salud en la ciudad de Villavicencio:

Ingreso (Millones
Yᵢ fᵢ
de $)
1,20 2,37 1,785 5
2,37 3,54 2,955 5
3,54 4,71 4,125 10
4,71 5,88 5,295 4
5,88 7,05 6,465 4
7,05 8,22 7,635 2
30

Se determina que la mayor frecuencia simple absoluta (f 3 =10) se encuentra en la


tercera clase y por tanto el valor de la moda es:

(10−5)
Mo = 3,54 + 1,17 * = 4,072 Millones de $
( 10−5 ) +(10−4)

16
Estadística Descriptiva

Percentiles.

Medida de posición que determina el valor del dato que representa el porcentaje
de datos con valor máximo al establecido.

Se requiere tener ordenados los datos.

k (n+ 1)
Pk = Dato # (4.8)
100

Donde K es un número entre 1 y 100 y representa el porcentaje deseado.

Ejemplo1: si queremos el percentil 35 de un conjunto de 89 datos, este


corresponde al valor del dato a partir del cual está el 35% de datos menores,
tendríamos:

35(89+1)
P35 = Dato #: P35 = Dato # 31,5
100

Esto indica que el valor del percentil 35 se encuentra entre el valor del dato 31 y el
valor del dato 32.

En este caso se determina el valor como el promedio de los valores de los dos
datos, dado que la fracción es 0,5.

Ejemplo2: si queremos el percentil 63 de un conjunto de 89 datos, este


corresponde al valor del dato a partir del cual está el 63% de datos menores,
tendríamos:

63(89+1)
P63 = Dato #: P63 = Dato # 56,7
100

Esto indica que el valor del percentil 63 se encuentra entre el valor del dato 56 y el
dato 57.

17
Estadística Descriptiva
En este caso tomaríamos el dato # 56 y le agregamos la diferencia entre el valor
del dato 57 y valor del dato 56 multiplicada por la fracción que resulte, en este
caso 0,7.

Con los valores de los ejemplos 2 y 3 que se están trabajando, tenemos:

Del ejemplo 2, notas del curso de matemáticas con 24 alumnos.

Tomando los datos ordenados determinamos los percentiles 35 y 73:

2,3 2,3 2,8 2,8 3,0 3,1 3,2 3,3 3,3 3,3 3,4 3,6 3,7 3,7 3,7 3,7
3,8 3,8 4,0 4,0 4,1 4,2 4,4 4,5
35(24+1)
P35 = Valor del Dato #: P35 = Valor del Dato # 8,75
100

Dato # 8 = 3,3 y Dato # 9 = 3,3

En este caso como no hay diferencia entre los valores de los datos, entonces el
valor del percentil 35 corresponde a la calificación 3,3.

Se considera que el 35% de los estudiantes del curso de matemáticas tienen nota
de 3,3 o menos.

Para el percentil 73 tendríamos:

73(24+1)
P73 = Dato #: P73 = Dato # 18,25
100

Valor dato # 18 = 3,8 y Valor del dato # 19 = 4,0

Diferencia (4,0 – 3,8) = 0,2 y se multiplica por el valor de la facción, en este


caso 0,25.

P73 = Valor dato # 18 + 0,25* (4,0 – 3,8) = 3,85

18
Estadística Descriptiva
Este resultado representa el valor del percentil 73 de las 24 notas del curso de
matemáticas es 3,85 y representa que hasta este valor esta el 73% de todas las
notas (también podemos interpretar que el 73% de los estudiantes tienen notas de
3,85 o menos)

Del ejemplo 3 sobre el ingreso mensual en millones de pesos, de una muestra


trabajadores que laboran en el sector de la salud en la ciudad de Villavicencio
durante el segundo semestre del año 2017

Tomando los datos ordenados:

1,2 1,3 1,5 2,1 2,3 2,4 2,5 3,2 3,2 3,3 3,6 3,7 3,8 3,8 3,8
4,2 4,3 4,4 4,6 4,7 4,9 5,5 5,6 5,7 6,2 6,4 6,8 6,8 7,3 8,2

Se tiene un total de 30 datos y calcularemos los mismos percentiles del ejemplo


anterior.

35(30+1)
P35 = Valor del Dato #: P35 = Valor del Dato # 10,85
100

Valor del dato # 10 = 3,3 y valor del dato # 11 = 3,6

Diferencia entre los dos datos: 3,6 – 3-3 = 0,3 y se multiplica por la fracción
0,85

P35 = 3,3 + 0,3*0,85 = 3,555


El 35% de los trabajadores del sector salud tienen ingreso de 3,555 millones de $
o menos.

Para el percentil 73:

73(30+1)
P73 = Dato #: P73 = Dato # 22,63
100

19
Estadística Descriptiva

Valor dato 22 = 5,5 y Valor dato 23 = 5,6

Diferencia = 5,6 – 5,5 = 0,1 y se multiplica por la fracción 0,63

P73 = 5,5 + 0,1*0,63 = 5,563

Indica que el 73% de los ingresos mensuales de los trabajadores del sector salud
es de 5,563 millones de $ o menos.

Tenemos algunas medidas de posición que son utilizadas con frecuencia, a saber:

Deciles. División del conjunto de datos en 10 partes de 10% cada una.

Quintiles. División del conjunto de datos en 5 partes de 20% cada una.

Cuartiles. División del conjunto de datos en 4 partes de 25% cada una.

Mediana. División del conjunto de datos en 2 partes de 50% cada una.

Todas ellas tienen su equivalencia en percentiles, y el cálculo se puede realizar de


acuerdo a lo explicado anteriormente. Las equivalencias se pueden apreciar en la
siguiente tabla:

Decil 1 = Percentil 10
Decil 2 = Quintil 1 = Percentil 20
Cuartil 1 = Percentil 25
Decil 3 = Percentil 30
Decil 4 = Quintil 2 = Percentil 40
Decil = Cuartil 2 = Mediana = Percentil 50
5
Decil 6 = Quintil 3 = Percentil 60
Decil 7 = Percentil 70

20
Estadística Descriptiva
Cuartil 3 = Percentil 75
Decil 8 = Quintil 4 = Percentil 80
Decil 9 = Percentil 90

Percentiles con datos agrupados.

Para establecer el valor del Percentil k, se utiliza la siguiente formula:

k∗(n+1)
A∗ −Fᵢ ₋ ₁
100 (4.9)
P k=Limite Inferior ᵢ+
fᵢ

En el ejemplo sobre el tiempo de retrasos (minutos) de los empleados de una


entidad financiera calcularemos el percentil 67:

TIEMPO DE
RETRASOS fᵢ Fᵢ
(Minutos)
0 21 21
6
6
7 28
12
12
5 33
18
18
3 36
24
24
2 38
30
30
2 40
36
Total 40 ////

Primero determinamos la clase donde está el dato 66*(40 + 1) /100 = 27, 47 este
resultado indica que el dato está ubicado entre las posiciones 27 y 28 las cuales
están en la clase 2.

21
Estadística Descriptiva
Por tanto:

67∗(40+1)
−21
P₆₆ = 6 + 6 * 100 = 11,55 minutos.
7

Este valor nos indica que el 67% de los datos son iguales o menores de 11,55
minutos.

En el ejemplo sobre el ingreso mensual en millones de pesos de una muestra


trabajadores que laboran en el sector de la salud en la ciudad de Villavicencio,
calcularemos el valor del quintil 3 que equivale al percentil 60:

Ingreso
Yᵢ fᵢ Fᵢ
(Millones de $)
1,20 2,37 1,785 5 5
2,37 3,54 2,955 5 10
3,54 4,71 4,125 10 20
4,71 5,88 5,295 4 24
5,88 7,05 6,465 4 28
7,05 8,22 7,635 2 30
30

La clase que contiene el dato número 60* (30 + 1) / 100 = 18,6

El resultado indica que el valor está ubicado entre los datos 18 y 19; los cuales
están en la clase.

60∗(30+ 1)
−10
P₆ₒ = 3,54 +1,17 * 100 = 4,5462 millones de $
10

22
Estadística Descriptiva
Este valor indica que el quintil 3, equivalente al percentil 60 se ubica entre los
datos 18 y 19 y su valor es de 4,5462 millones de $.

Este valor nos indica que el 67% de los datos son iguales o menores de 11,55
minutos.

Medidas de dispersión.
Las medidas de dispersión complementan las medidas de tendencia central,
indican la variabilidad de los datos respecto a un valor central.

Si la dispersión es baja se tienen conjuntos de datos homogéneos y una


dispersión alta indica que se tienen conjuntos de datos heterogéneos; cuando no
hay dispersión el conjunto de datos es uniforme, es decir los datos tienen el
mismo valor.

La dispersión se determina en valores absolutos y en valores relativos.

Para el caso de la Dispersión absoluta, tenemos el Rango, la Desviación Media, la


Varianza y la Desviación Estándar o típica como las medidas de dispersión más
conocidas y utilizadas.

En esta ocasión nos centraremos el estudio en la Varianza y Desviación estándar


como las principales medidas de dispersión.

Varianza.

La varianza es la medida estadística que indica la variabilidad de los conjuntos de


datos respecto a su Media aritmética.

Para el cálculo de la Varianza se procede primero a calcular el valor de la Media


aritmética y luego se hace la diferencia de cada uno de los datos con este valor,
esta diferencia se debe elevar al cuadrado y se divide según el caso en N (#de
datos) cuando se estudia la variación de la población y en n-1 (# de datos menos
uno) cuando se estudia la variación de una muestra.

Se debe observar que la varianza es siempre un valor positivo, pues se origina en


la suma de diferencias al cuadrado y por tanto la unidad de medida resultante
debe expresarse en cuadrado.

23
Estadística Descriptiva
Como una propiedad tenemos que la suma de las diferencias entre el valor de
cada dato y la media aritmética es cero y este valor no es significativo, esta es la
principal razón para tener las diferencias al cuadrado.

La desviación estándar se calcula como la raíz cuadrada de la varianza y se toma


como la medida verdadera de dispersión absoluta, por cuanto se expresa en las
mismas unidades de la variable.

Teniendo en cuenta estas consideraciones, para calcular Varianza, tenemos las


siguientes relaciones:

Varianza de un conjunto de datos de una población.


N

σ² =
∑ (Y ¡¿−μ)² (4 10)
1
¿
N

Varianza de un conjunto de datos de una muestra.

S² =
∑ (Y ¡¿−Ȳ ) ² (4 11)
1
¿
n−1

Ejemplos: Cuando los datos son individuales (Originales).

En datos de población:

En el caso del estudiante de Administración de Empresas que obtiene las


siguientes notas en el semestre anterior:

Asignatura Nota
Planeación Estratégica 3,9
Matemáticas II 3,4
Estadística Aplicada 3,7
Emprendimiento 4,4
Legislación II 4,6

Antes se calculó el valor promedio (Media aritmética) y su resultado es de 4,0

24
Estadística Descriptiva

( 3,9−4 )2 + ( 3,4−4 )2+ ( 3,7−4 )2 + ( 4,4−4 )2+(4,6−4)² 0,98


σ² = = = 0,196
5 5

La desviación estándar

σ = √ 0,196 = 0,4427 la variación de las calificaciones del estudiante es de 0,4427


respecto al valor promedio.

En el caso de la muestra

Si tomamos aleatoriamente 8 tiempos (minutos) de atención al cliente del total


atendidos durante un día, tenemos:

Minutos 4,5 6,0 8,8 11,5 9,0 8,8 6,5 9,0

64
Valor Promedio: Ȳ= = 8 minutos
8

( 4,5−8 )2 + ( 6,0−8 )2+ ( 8,8−8 )2+ (11,5−8 )2+ ( 9,0−8 )2+ ( 8,8−8 )2 + ( 6,5−8 )2 + ( 9,0−8 )2
S² =
7

33,875
S² = = 4,8393
7

Desviación estándar: S= √ 4,8393 = 2,1998 minutos


Cuando los datos están en tablas de frecuencia (datos agrupados) se procede de
la siguiente manera:

En primer lugar calculamos las diferencias al cuadrado de cada marca de clase


con el valor promedio, luego multiplicamos ese resultado por la frecuencia de cada
clase y la suma de esta columna se divide en la cantidad de datos.

25
Estadística Descriptiva

Para datos de población.


N

σ² =
∑ (Y ¡¿−μ)²∗fᵢ (4 12)
1
¿
N

Varianza de un conjunto de datos agrupados de una muestra.

S² =
∑ (Y ¡¿−Ȳ )²∗fᵢ (4 13)
1
¿
n−1

Ejemplos:

En el curso de matemáticas 24 alumnos, según la tabla elaborada antes:

Calificación
fᵢ Yᵢ Yᵢ* fᵢ (Yᵢ - μ)² (Yᵢ - μ)²* fᵢ
(Nota)
2,30 2,67 2 2,485 4,97 1,0042 2,0083
2,67 3,04 3 2,855 8,565 0,3995 1,1986
3,04 3,41 6 3,225 19,35 0,0687 0,4121
3,41 3,78 5 3,595 17,975 0,0116 0,0582
3,78 4,15 5 3,965 19,825 0,2284 1,1420
4,15 4,52 3 4,335 13,005 0,7190 2,1569
Sumas 24  / / / / 83,69   //// 6,9762

83,69
Se determinó el valor promedio: μ = = 3,4871
24

En primer lugar calculamos las diferencias al cuadrado de cada marca de clase


con el valor promedio, luego multiplicamos ese resultado por la frecuencia de cada
clase y la suma de esta columna se divide en la cantidad de datos.

6,9762
σ² = 0,2907 y la desviación estándar σ = √ 0,2907 = 0,5392
24

En el caso de muestras:

26
Estadística Descriptiva
En el ejemplo de la variable discreta, número de retrasos, donde ya se calculó el
valor de la media aritmética: Ȳ = 1,125.

Complementando la tabla con las columnas de la diferencia al cuadrado de la


marca de clase con el valor promedio y estos resultados multiplicados por cada
una de las frecuencias simples absolutas, tenemos:

Retrasos por semana de los trabajadores de una entidad financiera

# DE
fᵢ Yᵢ*fᵢ (Yᵢ - Ȳ)² (Yᵢ -Ȳ)²* fᵢ
RETRASOS (Yᵢ)
0 19 0,0 1,2656 24,0469
1 10 10,0 0,0156 0,1563
2 4 8,0 0,7656 3,0625
3 3 9,0 3,5156 10,5469
4 2 8,0 8,2656 16,5313
5 2 10,0 15,0156 30,0313
Total 40 45,0 //// 84,3750
Fuente: Oficina de Talento humano

84,375
S² = = 2,1635 (número retrasos)²
39

Y la desviación estándar: S = √ 2,1635 = 1,4719 número de retrasos.

Se interpreta que la dispersión del número de retrasos respecto a la media es de


1,4719 retrasos.

En los ejemplos para variable continua, como es el de los minutos de retraso de


los trabajadores de la entidad financiera, se calculó la media aritmética:

Ȳ = 9,6 minutos

27
Estadística Descriptiva
Cantidad de minutos en retraso de los trabajadores de una entidad financiera

TIEMPO DE
f₁ Yᵢ Yᵢ* fᵢ (Yᵢ - Ȳ)² (Yᵢ - Ȳ)² * fᵢ
RETRASOS (Minutos)
0 6 21 3 63 43,56 914,76
6 12 7 9 63 0,36 2,52
12 18 5 15 75 29,16 145,8
18 24 3 21 63 129,96 389,88
24 30 2 27 54 302,76 605,52
30 36 2 33 66 547,56 1095,12
Total 40 / / / / 384   3153,6
Fuente: Oficina de Talento humano

 La varianza:

3153,6
S² = = 80,8615 minutos²
39

Y la deviación estándar: S = 8,9923 minutos

Medidas de Valor Relativo.


El Coeficiente de Variación es una medida de dispersión relativa que permite la
comparación de los conjuntos de datos ya que es independiente de las unidades
de medida de la variable en estudio. Se expresa en términos de porcentaje.

El Coeficiente de variación (CV) se calcula como el cociente entre la desviación


estándar y la media aritmética, resultado que se multiplica por 100.

Expresa el porcentaje que representa la desviación estándar respecto a la media


aritmética.

A menor valor porcentual del coeficiente de variación el conjunto de datos es más


homogéneo.

28
Estadística Descriptiva
Para el caso de datos de una población

σ
CV = ∗100 (4 14)
μ

Para el caso de caso de datos de muestras

s
CV = ∗100 (4 15)

Ejemplos:

En los ejercicios anteriores hemos calculado las medidas de tendencia central


Media, Mediana y Moda; igualmente la desviación estándar.

Tomaremos estas medidas para calcular el Coeficiente de Variación en cada caso.

1-. En el caso del estudiante de Administración de Empresas según sus notas en


el semestre anterior:

Se calculó el valor promedio (Media aritmética) de las notas y su resultado:

Ȳ = 4,0

Y el valor de la desviación estándar de las notas del estudiante es:

σ = 0,4427

0,4427
CV = ∗100 = 11,07%
4,0

Podemos concluir que las notas son homogéneas.

Igualmente podemos considerar que la desviación estándar de las notas


representa el 11,07% del valor promedio.

En el caso de los 8 tiempos (minutos) de atención al cliente del total atendidos


durante un día, tenemos:

Valor Promedio: Ȳ = 8 minutos

29
Estadística Descriptiva

Y Desviación Estándar: S= √ 4,8393 = 2,1998

2,1998
CV = ∗100 = 27,50%
8,0

En el ejemplo para la variable cantidad de minutos de retraso de los trabajadores


de la entidad financiera, se calculó la media aritmética:

Ȳ = 9,6 minutos

Y la Deviación Estándar: S = 8,9923 minutos

8,9923
El CV = ∗100 = 93,67%
9,6

Con este resultado se establece que los datos de la variable tiempo de retraso
(minutos) de los trabajadores es muy heterogénea, es decir tiene una alta
variación.

Otras medidas que indican la forma que tienen los datos son los coeficientes de
Asimetría o Sesgo y la Curtosis o Apuntamiento.

El primero de estos coeficientes nos indica si los datos son en su mayoría de valor
alto o sí por el contrario son en mayoría de valor bajo. Cuando los datos están
repartidos de forma equilibrada podemos considerar que tienen distribución
simétrica, es decir valores altos y bajos repartidos por igual.

La Curtosis nos muestra el alto o bajo grado de concentración de los datos en


valores centrales del conjunto de datos.

Para calcular el Coeficiente de asimetría, utilizaremos la fórmula de Pearson:

30
Estadística Descriptiva
3∗(Ȳ −Me)
As = (4 16)
S

Si el valor del Coeficiente de Asimetría es positivo indica que la mayoría de los


datos se ubican en la parte izquierda del valor promedio del conjunto de datos.

Se debe el valor positivo porque el valor promedio de los datos es mayor a el valor
de la Mediana y es Mayor al valor de la Moda (Ȳ > Me > Mo).

Cuando el valor del Coeficiente de Asimetría es negativo tenemos que la mayoría


de los datos se ubican a la parte derecha del valor promedio del conjunto de
datos.

Este valor es el resultado de tener el valor promedio menor que el valor de la


mediana y menor que el valor de la moda (Ῡ < Me < Mo)

Asimetría Negativa Simétrico Asimetría Positiva

Ejemplos

1-. En el caso del estudiante de Administración de Empresas según sus notas en


el semestre anterior:

Se calculó el valor promedio (Media aritmética) de las notas y su resultado es:

Ȳ = 4,0

El valor de la Mediana es:

Me = 3,9 de la asignatura de Planeación Estratégica.

Y el valor de la desviación estándar es:

σ = 0,4427 la variación de las calificaciones del estudiante es de 0,4427 respecto


al valor promedio

31
Estadística Descriptiva
El Valor del Coeficiente de Asimetría en este caso:

3∗(4,0−3,9)
As = = 0,6777
0,4427

Esto indica que el conjunto de notas del estudiante es ligeramente sesgado a la


izquierda del valor promedio. Hay un número mayor de notas inferiores al valor
promedio.

2-. En el caso de las notas de los estudiantes del curso de matemáticas

La nota promedio del curso de matemáticas es de 3,5

Valor mediana de las notas de matemática es de 3,65

Y la desviación estándar es σ = 0,5392

El valor del Coeficiente de Asimetría es:

3∗(3,5−3,65)
As = = - 0,8346
0,5392

En este caso tenemos un valor del Coeficiente de Asimetría negativo que indica
que hay un número mayor de datos con valor superior al promedio de las notas del
curso.

La Curtosis muestra la concentración de datos en los valores centrales de los


datos.

El valor del coeficiente de Curtosis permite identificar si hay una alta concentración
de datos alrededor de los valores centrales del conjunto de datos se denomina
Leptocúrtica; en este caso el valor del coeficiente es positivo.

Si presenta una concentración normal, se denomina Mesocúrtica y en este caso el


valor del coeficiente es cero.

32
Estadística Descriptiva
Cuando se presenta una baja concentración de valores se denomina platicúrtica y
en este caso el valor del coeficiente es negativo.

Leptocúrtica Mesocúrtica Platicúrtica

Para calcular el coeficiente de Curtosis se utiliza la ecuación:

n
1 ∑ (Yᵢ−Ȳ ) ⁴
Cu = ∗¿ 1 -3 (4 17)
n
S⁴

Como se nota, se basa en las desviaciones de los valores observados (Yᵢ)


respecto a la media aritmética (Ȳ) y compara la distribución de los datos con la
curva de la distribución Normal.

Valor denominado valor estándar, que se simboliza con la letra Z.

(Yᵢ−Ȳ )
Z= (4 18)
S

Indica el Número de valores estándar que se tienen a partir del valor promedio

Ejemplo:

Si tomamos el ejercicio de registrar aleatoriamente 8 tiempos (minutos) de


atención al cliente del total atendidos durante un día, tenemos:

33
Estadística Descriptiva
Minutos 4,5 6,0 8,8 11,5 9,0 8,8 6,5 9,0

Minutos 4,5 6,0 8,8 11,5 9,0 8,8 6,5 9,0


Valor
-1,591 -0,909 0,364 1,591 0,455 0,364 -0,682 0,455
estándar Z:

64
Valor Promedio: Ȳ= = 8 minutos
8

Y Varianza:

( 4,5−8 )2 + ( 6,0−8 )2+ ( 8,8−8 )2+ (11,5−8 )2+ ( 9,0−8 )2+ ( 8,8−8 )2 + ( 6,5−8 )2 + ( 9,0−8 )2
S² =
7

33,875
S² = = 4,8393
7

Por tanto, Desviación estándar: S = 2,1998

(Yᵢ−8)
Para este caso el valor estándar se calcula: Z=
2,1998

Minutos 4,5 6 8,8 11,5 9 8,8 6,5 9


Valor estándar Z: -1,591 -0,909 0,364 1,591 0,455 0,364 -0,682 0,455
Valor estándar 13,836
^4 6,4082 0,6833 0,0175 6,4082 0,0427 0,0175 0,2162 0,0427

34
Estadística Descriptiva

1
Cu = ∗13,8363 - 3 = - 1,2705
8

Valores de los datos no concentrados alrededor de los valores centrales.

TEOREMA DE CHEBYSHEV

Establece la Proporción (Porcentaje) de los valores de los datos que están dentro
de un determinado número de desviaciones estándar respecto a la media
aritmética.

1
Teorema: Para todo conjunto de datos, por lo menos (1 - ) de los valores de

los datos que se tienen están dentro de z desviaciones estándar de la media,
donde z es cualquier valor mayor que 1.

1
(1 - ) (4 19)

De acuerdo con el teorema para Z = 2, 3, 4 y 5 desviaciones estándar se tiene:

• Para Z = 2, por lo menos el 0.75, ó 75%, de los valores de los datos deben
estar dentro de z = 2 desviaciones estándar de la media.
• Si Z = 3, al menos 0,89, ó 89%, de los valores deben estar dentro de z = 3
desviaciones estándar de la media.
• Para Z = 4, se tiene que por lo menos 0,94, ó 94%, de los valores deben estar
dentro de z = 4 desviaciones estándar de la media.
• Cuando Z = 5, por lo menos el 0,96 ó 96,0% de los valores de los datos deben
estar dentro de Z = 5 desviaciones estándar de la media.

Se puede también, asignar un valor no entero y calcular la proporción o


porcentaje de valores que deben estar dentro de las desviaciones estándar
indicadas.
Por ejemplo:
Si Z = 1,75, entonces el 67,35% de los valores de los datos deben estar dentro de
Z = 1,75 desviaciones estándar de la media.

35
Estadística Descriptiva

O si Z = 2,6, por lo menos el 0,8521 o el 85,21% de los valores de los datos deben
estar dentro de Z = 2,6 desviaciones estándar de la media.

Ejemplo:

Si una aerolínea tiene calculado que el promedio de pasajeros que moviliza


diariamente es de 112 con una desviación estándar de 22 y quiere establecer el
porcentaje de pasajeros que a un nuevo destino puede movilizar dentro de 2,0
desviaciones estándar.

1
1- = 0,750
2, 0²

Se puede interpretar que el 75,0% de los días movilizará entre 68 y 156 pasajeros

Valores que se determinan:

112 – 2*22 = 68 y 112 + 2*22 = 156

USO DE EXCEL PARA CALCULAR VALORES ESTADISTICOS.

36
Estadística Descriptiva
El excel es una herramienta que hoy en dia se tiene a la mano y es de facil uso
para el calculo de valores Estadisticos.

Utilizaremos como ejemplo los datos del ejemplo que se refieren a la resistencia a
la ruptura (en Onzas) de muestras de hilos de cáñamo. Estos se pueden apreciar
en la imagen siguiente:

Lo primero que determinamos es la cantidad de datos n=?

Para esto nos ubicamos en una casilla de la hoja de Excel, en este caso en la
columna C fila 3 (C3) y escribimos el = y la palabra contar y debe aparecer el
siguiente mensaje:

37
Estadística Descriptiva
Una vez se tiene la instrucción señalamos las casillas donde se encuentran los
datos, en este caso desde la casilla B22 hasta la casilla M25 y se procede a
ejecutar (Enter).

En la casilla seleccionada debe aparecer el resultado, en este caso 47, que es el


número de datos que se tienen.

Finalmente se refleja el resultado:

38
Estadística Descriptiva
De igual forma podemos calcular otros valores estadísticos de interés, para ello
procedemos de la misma manera:

Por ejemplo para la Suma de todos los datos:

Ubicamos la casilla, en este caso en la casillaC4, se escribe el = y la palabra


suma y debe aparecer el siguiente mensaje:

Señalamos las casillas donde están los datos y el mensaje queda:

39
Estadística Descriptiva

Se procede a ejecutar (Enter) y aparece el resultado:

De esta manera se puede calcular cualquiera de los valores indicados en el


cuadro, que corresponden a diferentes medidas estadísticas que describen,
resumen y facilitan el análisis de los conjuntos de datos.

40
Estadística Descriptiva

Grupo 1 de Ejercicios:

Elaborar la tabla de distribución de Frecuencias, graficar y calcular las diferentes


medidas estadísticas tratadas en el documento, que aplican a cada ejercicio e
Interpretar resultados.

1-. Género de los aspirantes a un cargo directivo en una entidad gubernamental.


Se registran los siguientes datos:

F F M M M M F M F F F M M M M F
M F M F F M M F M F M M M F M M
F M M F M F M F F F M M F F M F

2-. En un estudio sobre actividad laboral se realiza una encuesta que registra la
información sobre el nivel del cargo que desempeña:

P T Op P P T Op D P Op Ad Op P T Op Ad
T Ad Op P D Ad P Op P T Op Op D Ad Ad T
D D P Op Ad D P Op D Ad Ad Ad Ad D P Op
Ad Ad T P Op Op T Op Ad D P Op Op Op T D
Op Ad Ad D P Op Ad P Op D P Op Ad Op Op Ad

41
Estadística Descriptiva
Ad Op D P Op Ad P T Ad D P Op Ad

En este caso: D = Directivo P = Profesional T = Técnico


Ad = Administrativo Op = Operativo

3-. La oficina de recursos humanos de una empresa constructora de obras civiles,


con el fin de medir el impacto que estas causan en el presupuesto de la obra,
registra el número de ausencias laborales que han tenido sus trabajadores en el
primer semestre del 2018.

1 2 4 0 2 1 3 2 3 2 2 4 3 1 2 2
0 1 2 3 1 3 2 3 0 3 1 2 2 2 0 1
0 1 2 3 4 5 6 0 1 2 3 0 1 6 2 3
2 3 2 2 3 2 2 5 0 1 2 2 3 4 5 4
1 2 1 3 4 0 1 2 3 4 5 5 4 3 5 6
3 4 3 1 4 2 3 6 1 2 3 5 6 6 0 0
1 1 4 2 3 5 4 3 3 2 2 3 2 2 5 1
0 1 2 3 4 5 6 1 2 1 3 4 0 1 2 2
4 3 1 2 2 4 5 2 4 3 1 4 2 3 6 2

4-. En un estudio sobre la productividad de la Empresa fabricante de calzado “los


Zapaticos” en los últimos 77 días, se recolectó la siguiente información sobre el
número de pares de zapatos en condiciones de comercializar:

78 34 89 33 78 55 56 98 56 87 23
78 54 45 78 98 63 56 76 45 58 78
98 78 89 90 58 34 56 45 28 44 67
45 67 34 78 66 67 89 87 45 56 37
89 60 57 79 56 34 56 90 56 70 78
45 42 24 56 89 78 34 56 77 59 80
67 45 26 44 55 67 46 65 88 63 54

5-. Para un estudio de algunas características socioeconómicas de las familias del


barrio “La Esperanza” se indaga el ingreso familiar (Millones de $).

1,2 2,3 3,4 4,5 5,6 6,7 7,8 8,9 9,0 3,3 4,2 4,7 5,5 5,9 6,5 3,8
2,1 3,2 4,3 5,4 6,5 7,6 8,7 9,8 1,0 3,8 4,0 5,5 4,8 3,3 6,6 1,0
3,3 4,2 4,7 5,5 5,9 6,5 7,7 8,2 9,6 1,0 2,1 2,5 2,9 3,2 3,5 1,1
3,8 4,0 5,5 4,8 3,3 6,6 7,8 2,8 6,9 1,1 2,1 3,2 3,4 4,1 4,5 9,6
1,0 2,1 2,5 2,9 3,2 3,5 3,8 3,1 4,4 7,8 8,9 9,0 1,2 2,3 3,4 6,9
1,1 2,1 3,2 3,4 4,1 4,5 5,2 5,6 6,3 8,7 9,8 1,0 2,1 3,2 4,3 5,5
9,6 1,0 2,1 2,5 2,9 3,2 3,5 4,2 4,7 7,7 8,2 9,6 3,3 4,2 4,7 2,5

42
Estadística Descriptiva
6,9 1,1 2,1 3,2 3,4 4,1 4,5 4,0 5,5 7,8 2,8 6,9 3,8 4,0 5,5 3,2
4,4 7,8 8,9 9,0 1,2 2,3 3,4 2,1 2,5 2,1 3,2 3,4 1,0 2,1 2,5 2,1
6,3 8,7 9,8 1,0 2,1 3,2 4,3 2,1 3,2 8,9 9,0 1,2 2,1 3,2 3,4 2,1

6-. Una Empresa cazatalentos registra el Tiempo (minutos) que demoran en


presentar un test de conocimientos los aspirantes a cargos directivos en
empresas financieras del país.

40, 55, 44, 36, 38, 70, 63, 70, 65, 38, 59, 64, 61, 54, 49, 66,
0 5 0 0 0 0 0 0 0 0 0 0 0 0 0 5
66, 64, 55, 63, 53, 67, 61, 39, 71, 53, 44, 36, 38, 70, 63, 38,
5 0 0 0 0 0 0 0 0 0 0 0 0 0 0 5
38, 72, 54, 54, 35, 62, 39, 43, 66, 33, 55, 63, 53, 67, 61, 44,
5 0 0 0 0 0 0 0 5 0 0 0 0 0 0 5
44, 68, 45, 45, 75, 53, 48, 54, 38, 75, 54, 54, 35, 62, 39, 55,
5 0 5 0 0 0 0 0 5 0 0 0 0 0 0 0
50, 60, 57, 43, 48, 51, 57, 56, 44, 48, 45, 45, 75, 53, 48, 63,
0 5 5 0 0 0 0 0 5 0 5 0 0 0 0 0

Grupo 2 de Ejercicios:

1-. Los siguientes datos representan los tipos de envases plásticos que una
empresa recicladora recolecta en un sector de la ciudad en un día:

Pipo de Cantidad
envase
A 280
B 340
C 120
D 200
E 60

Elaborar un Grafico Circular, uno de Barras y un Polígono.

Interpretar dos cifras de los resultados.

2-. Los datos representan la resistencia a la ruptura (en Onzas) de muestras de


hilos de cáñamo:

43
Estadística Descriptiva
43,6 36,8 25,9 15,2 25,0 37,5 33,5 34,6 65,1 38,6 54,9 34,8
23,5 56,9 56,8 23,6 45,8 34,7 23,5 34,8 56,8 45,7 45,8 50,8
45,8 34,9 54,9 23,6 23,7 56,8 26,0 60,8 61,0 57,8 59,9 34,7
26,9 35,8 44,2 56,8 42,4 28,7 38,9 54,5 54,8 62,9 48,7  

Elaborar una tabla de distribución de Frecuencias


Elaborar un histograma, un polígono de frecuencia y un gráfico circular.
Calcular:
a-. La media aritmética
b-. La moda.
c-. Percentiles: 44, 50 y 77
d-. La varianza y la desviación estándar.
e-. Coeficientes de asimetría, Curtosis y Variación.
Interpretar resultados

9-. Los datos corresponden a una muestra de 35 demoras en la salida (minutos)


de los vuelos de una compañía aérea de lunes a viernes de una semana y de 30
demoras de los vuelos durante un fin de semana.
En semana (lunes a viernes)
12 25 16 21 45 19 15 19 23 21 28 33 21
25 37 24 13 16 24 37 38 36 22 19 12 37
21 16 40 10 23 36 30 41 21        

Fin de semana
18 11 16 27 14 19 26 25 27 18 16 19
26 32 26 16 19 39 33 40 24 26 29 33
19 19 33 42 39 18            

a) Calcular las medidas de los dos (2) grupos de datos y analizar: los resultados.
¿Se parecen las distribuciones de las demoras en semana y del fin de
semana?
b) ¿Alrededor de que valor están los tiempos de demoras?
c) Calcular los valores de la dispersión de los tiempos de demora para los dos
grupos de datos.
d) ¿Las distribuciones de los datos de los dos grupos se consideran normal?

44
Estadística Descriptiva

REFERENCIAS BIBLIOGRAFICAS Y OTROS TEXTOS DE


CONSULTA

1-. Bernard Ostle. (1979). ESTADÍSTICA APLICADA. Técnicas de la Estadística


moderna, cuando y donde aplicarlas. México. D.F. México: Ed. Limusa.
ISBN 968-18-0734-0

2-. Willian J. Stevenson. (2006). ESTADISTICA APLICADA PARA LA


ADMINISTRACIÓN Y ECONOMÍA. Conceptos y aplicaciones. México. D.F.
México. Ed. Alfaomega. ISBN 970-15-1052-6

3-. Douglas Lind, William G. Marchal y Samuel A. Wathen. (2000). ESTADISTICA


APLICADA A LOS NEGOCIOS Y LA ECONOMIA. Bogotá Colombia Ed. Mc-Graw
Hill. ISBN 970-10-4834-2

4-. Allen L. Webster. (2008). ESTADISTICA APLICADA A LOS NEGOCIOS Y LA


ECONOMIA. Bogotá. Colombia. Ed. Mc-Graw Hill. ISBN 0-256-22554-0

45
Estadística Descriptiva
5-. David R. Anderson, Dennis J. Sweeney, Thomas A. Williams (2008).
ESTADÍSTICA PARA ADMINISTRACIÓN Y ECONOMÍA. México. D.F. México
Cengage Learning Editores, S.A. ISBN-10: 607-481-319-1

6.- Rodríguez Ojeda Luis. (2007). PROBABILIDAD Y ESTADISTICA BASICA


PARA INGENIERIAS. Escuela Superior Politécnica del Litoral, Instituto de
Ciencias Matemáticas. Guayaquil. Ecuador.
ISBN 978-9942-922-02-1

7-. Depool Rivero, Ramón y Monasterio, Dióscoro. PROBABILIDAD Y


ESTADÍSTICA. Aplicaciones a la Ingeniería. Publicado de manera gratuita por la
unexpo en la página http://www.bqto.unexpo.edu.ve/. 2013.

8-. Verdoy Pablo Juan, Beltrán M. Joaquín y Peris María José (2015).
PROBLEMAS RESUELTOS DE ESTADÍSTICA APLICADA A LAS CIENCIAS
SOCIALES. Edita: Publicacions de la Universitat Jaume I. España. ISBN: 978-84-
15444-38-1.

9-.Gladys Enríquez Mantilla. (2012). ESTADÍSTICA. Administración de Negocios


Internacionales. Unifé.

46

También podría gustarte