Está en la página 1de 13

ACTIVIDAD 6-EVALUATIVA

TALLER MEDIDAS DE DISPERSIÓN Y SIMETRÍA

Petro Martinez Martha Lia


Rivera Diaz Diana Marcela

Orellano Rebolledo Jorge Ivan

Corporación universitaria minuto de dios


Administración de empresas
IV semestre
Estadística descriptiva
Barranquilla – Atlántico
ESTADÍSTICA DESCRIPTIVA TALLER UNIDAD 4

Medidas de Dispersión

1. Las siguientes corresponden a las edades de un grupo de personas que ingresaron a la


biblioteca:
55 67 62 88 37 55 67 38 41.

A. Determine los valores del rango.


B. La varianza.
C. La desviación típica o estándar.
D. El coeficiente de variación.

Solución:
A. Rango: El rango es un valor numérico que indica la diferencia entre el valor máximo y el
mínimo de una población o muestra estadística. El rango suele ser utilizado para obtener
la dispersión total de los datos. Un rango pequeño indica que los datos están más o
menos cercanos y la dispersión es poca. En cambio, un rango mayor es indicativo que los
datos están más dispersos.

Para determinar los valores del rango lo primero que debemos hacer es ordenar nuestros
datos:

37 38 41 55 55 62 67 67 88

Luego, para calcular los valores del rango debemos restar al dato mayor el dato menor:

Rango=x máx −x min

Donde, x máx es el valor máximo de los datos y x min es el valor mínimo.

Por tanto, Rango=88−37=51

El rango es de 51 años.

B. Varianza: La varianza es una medida de dispersión que representa la variabilidad de una


serie de datos respecto a su media. Debemos tener en cuenta que la fórmula para hallar
la varianza depende si nuestros datos representan a la población o una muestra de ésta.

Para la población:
N

∑ ( x−x́)2
Varianza(σ 2)= i=1
N
Para la muestra:
n

∑ ( x− x́ )2
Varianza(s2 )= i=1
n−1
Donde x es la variable, x́ es la media, N y n el número de observaciones que este caso
sería 9, puesto que tenemos la edad de 9 personas que ingresaron a la biblioteca.
Pasemos a calcular la media:
37+38+ 41+ 55+55+62+67+67 +88 510
x́= = =56,6 ≈ 57
9 9
Luego,

37 57 -20 400
38 57 -19 361
41 57 -16 256
55 57 -2 4
55 57 -2 4
62 57 5 25
67 57 10 100
67 57 10 100
88 57 31 961
Tot
al 2211

Ahora debemos reemplazar nuestros datos en la fórmula, vamos a tomar nuestros datos
como una muestra de las edades de las personas que ingresaron a la biblioteca. Luego:
n

∑ ( x− x́ )2
Varianza(s2 )= i=1
n−1

2211 2211
2
Varianza ( s )= = =276,375 ≈ 276
9−1 8
Entonces la varianza = 276 años 2

C. Desviación estándar: La desviación estándar es un índice numérico de la dispersión de


un conjunto de datos (o población). Mientras mayor es la desviación estándar, mayor es
la dispersión de los datos. La desviación estándar es un promedio de las desviaciones
individuales de cada observación con respecto a la media de una distribución. Así, la
desviación estándar mide el grado de dispersión o variabilidad. La desviación estándar es
la raíz cuadrada de la varianza.
Para la población:
N

σ=
√ ∑ (x− x́)2
i=1

Para la muestra:
N
n

s=
√ ∑ (x − x́)2
i=1
n−1
Luego, como tomamos nuestros datos como una muestra la desviación estándar sería:

s=
√ ∑ (x − x́)2
i=1
n−1
s= √276=16,6 ≈ 17 años .

D. Coeficiente de variación: El coeficiente de variación, es una medida estadística que nos


informa acerca de la dispersión relativa de un conjunto de datos. Es decir, nos informa al
igual que otras medidas de dispersión, de si una variable se mueve mucho, poco, más o
menos que otra. Su cálculo se obtiene de dividir la desviación estándar entre el valor
absoluto de la media del conjunto de datos y por lo general se expresa en porcentaje para
su mejor comprensión.

Población Muestra
σ s
CV = CV =
|x́| |x́|

Como en nuestro caso, tomamos nuestro conjunto de datos como una muestra,
procederemos de la siguiente manera:
s
CV =
|x́|

17
CV = =0,298
|57|
Si queremos expresarlo en porcentaje,
17
CV = =0,298∗100=29,8 ≈ 30 %
|57|

2. En la siguiente tabla se refieren las edades de 100 empleados de cierta empresa:

A. Halle Q1, Q2 y Q3 y construya el diagrama de caja y bigotes.


B. Determine los valores del rango, la varianza, la desviación típica o estándar y el
coeficiente de variación.

Clase Fi
15 2
16 10
17 12
18 20
19 15
20 12
Solución:

A. Cuartiles, diagrama de caja y bigotes.

Completemos nuestra tabla:

Clase fi Fi
15 2 2
16 10 12
17 12 24
18 20 44
19 15 59
20 12 71
Total 71 N.A

Si observamos en nuestra tabla podemos notar que en nuestra frecuencia absoluta (fi) el
total de datos es de 71, por lo tanto, solo se nos muestran la edad de 71 empleados de la
empresa no de 100 empleados.

Ahora procederemos a hallar la posición de nuestros cuartiles utilizando la siguiente


fórmula:

Kn
Qk =
4
Entonces,

1 ( 71 )
Q 1= =17,75 ≈ 18
4

En nuestra frecuencia acumulada (Fi) no tenemos ese valor (18), entonces, el que le sigue
en nuestra tabla es 24, por tanto, Q1= 17

2 (71 )
Q 2= =35,5 ≈ 36
4

Q2= 18

3 ( 71 )
Q 3= =53,25≈ 53
4

Q3= 19.

Ahora debemos encontrar el límite inferior y el límite superior, la fórmula que vamos a
utilizar es la siguiente:
Liímite inferior=Q 1−1.5∗RIQ
RIQ (Rango intercuartílico) =Q3-Q1
= 19 – 17= 2
Liímite inferior=17−1.5∗2=14
Liímite superior=Q 3+1.5∗RIQ
Liímite superior=19+1.5∗2=22

Diagrama de caja y bigotes


Li 14
Q1 17
Q2 18
Q3 19
Ls 22

B. Varianza, desviación estándar y coeficiente de variación.

Para calcular la varianza utilizaremos la siguiente fórmula:


n

∑ ( x− x́ )2
Varianza(s2 )= i=1
n−1

Luego, como sabemos que el Q2 coincide con la media ( x́ ), entonces x́=18.

Clase ( x ) fi ( x− x́ )2
15 2 9
16 10 4
17 12 1
18 20 0
19 15 1
20 12 4
Total n = 71 19

Pasemos a reemplazar nuestros datos en la fórmula:


19
Varianza ( s 2 )= =0,27
71−1
Por tanto, la varianza =0,27años 2.

Desviación estándar:

s=
√ ∑ (x − x́)2
i=1
n−1

s= √0,27=0,52

Entonces, la desviación estándar es de 0,52 años.

Coeficiente de variación:

s
CV =
|x́|

0,52
CV = =0,03
|18|

Por tanto, el coeficiente de variación es del 3%.

3. Los siguientes datos corresponden a los días de vacaciones que tomaron los empleados
durante el último año.

A. Determine los valores del rango, la varianza, la desviación típica o estándar y el


coeficiente de variación. (Ejercicio para subir a la plataforma)

NUMERO DE DÍAS CANTIDAD DE


EMPLEADOS
[0 – 2) 10
[2 –4) 6
[4 – 6) 12
[6 – 8) 9
[8 – 10) 4
[10 – 12) 3
[12 –14) 1
Solución:
A. Rango para datos agrupados: Hay dos formas para determinar el rango para datos
agrupados.

1) Rango = punto medio de la clase más alta – punto medio de la más baja.
2) Rango = límite superior de la clase más alta – límite inferior de la más baja.
En nuestro caso utilizaremos la segunda forma.

Límite superior de la clase más alta: 14


Límite superior de la clase más baja: 0

Rango= 14 – 0 = 14

Varianza: para calcular la varianza primero debemos conocer la media:

x́=
∑ x. f
n
para ello debemos conocer nuestra marca de clase ( x ¿ , la cual se calcula de la
siguiente manera:

Límiteinferior + Límite superior


Marca de clase=
2

Número Marca de Cantidad de xi . fi


de días clase ( xi ) empleados ( fi)
[0 – 2) 1 10 10
[2 –4) 3 6 18
[4 – 6) 5 12 60
[6 – 8) 7 9 63
[8 – 10) 9 4 36
[10 – 12) 11 3 33
[12 –14) 13 1 13
Total N.A N= 45 233

233
Entonces, x́= =5,2
45
La fórmula que vamos a utilizar la varianza es la siguiente:

∑ fi(x− x́ )2
σ 2= i=1
N
Utilizaremos la fórmula de la varianza poblacional.

Completemos nuestra tabla:

Número Marca de Cantidad de xi . fi ( x− x́ )2 fi(x− x́)2


de días clase ( xi ) empleados ( fi)
[0 – 2) 1 10 10 17,64 176,4
[2 –4) 3 6 18 4,84 29,04
[4 – 6) 5 12 60 0,04 0,48
[6 – 8) 7 9 63 3,24 29,16
[8 – 10) 9 4 36 14,44 57,76
[10 – 12) 11 3 33 33,64 100,92
[12 –14) 13 1 13 60,84 60,84
Total N.A N=45 233 N.A 454,6

Por tanto,
454,6
σ 2= =10,10
45
2
La varianza es igual a 10,10días .

Desviación típica o estándar: ya sabemos que la desviación estándar es la raíz


cuadrada de la varianza.

σ=
√ ∑ fi( x− x́ )2
i=1
N

σ =√ 10,10=3,18

La desviación estándar es de 3,18 días.

Coeficiente de variación:
σ 3,18
CV = = =0,61
|x́| |5,2|
Es decir, el coeficiente de variación es del 61%.

4. En una competición de tiro al blanco con rifle de aire, se tienen los dos últimos participantes,
quienes tiraron a un tablero y obtuvieron el siguiente registro después de 15 disparos cada
uno.

Halle el promedio del conjunto de datos, la mediana, la moda, la desviación estándar y el


coeficiente de desviación de los datos y compare los dos conjuntos.
Realice el diagrama de caja y de bigotes para el puntaje de cada uno de los jugadores. (Nota:
hacer la tabla de frecuencias para el puntaje de cada jugador).
Solución:
Primer Jugador

Puntos ( Primer Frecuencia xi . fi ( x− x́ )2


xi ¿ jugador ( fi) acumulada
1 6 6 6 4
2 3 9 6 1
3 0 9 0 0
4 3 12 12 1
5 3 15 15 4
Total n = 15 NA 39 10

Media aritmética o promedio=


∑ x i . f i = 39 =2,6 ≈3
n 15

Desviación estándar:
10
s=
√ 15−1
=0,71

La desviación estándar es de 0,71 puntos.

Coeficiente de variación:
s 0,71
CV = = =0,24
|x́| |3|
El coeficiente de variación es del 24%.

Mediana: busquemos su posición.


n+1 15+1
Posición= = =8
2 2
Esa posición la debemos encontrar en nuestra frecuencia acumulada (tabla anterior), si no la
encontramos pasamos al número siguiente, que en nuestro caso es 9, entonces el valor de la
mediana es 2.

Moda: dato que más se repite. en nuestra tabla anterior en la frecuencia (fi) el número más
grande es 6, por lo tanto, la moda es 1.

Segundo Jugador

P Seg frecu x
u un encia i
nt do acum .
os jug ulada f
ado i
r
1 0 0 0
2 7 7 1
4
3 7 14 2
1
4 1 15 4
5 0 15 0
T 15 N.A 3
ot 9
al

Puntos Segundo frecuencia


xi∗fi
jugador acumulada
1 0 0 0 4
2 7 7 14 1
3 7 14 21 0
4 1 15 4 1
5 0 15 0 4
Total 15 N.A 39 10

39
Media aritmética o promedio= =2,6 ≈ 3
15
Mediana: busquemos su posición.
n+1 15+1
Posición= = =8
2 2
Por tanto, la mediana es 3.
Moda: 2 y 3 (Bimodal).

Desviación estándar:
10
s=
√ 15−1
=0,71

La desviación estándar es de 0,71 puntos.

Coeficiente de variación:
s 0,71
CV = = =0,93
|x́| |3|
El coeficiente de variación es del 93%.

Comparación: el coeficiente de variación del segundo jugador es muy alto (93%), lo cual nos
indica que la media no representa al conjunto de datos, es decir los datos son heterogéneos, tienen
mayor dispersión o variabilidad, mientras que el coeficiente de variación del primer jugador es tan
solo del 24%, por tanto, presenta menor variabilidad que el segundo jugador.

Diagrama de caja y bigotes:


Cuartiles:
Primer jugador

Kn
Qk =
4
1 ( 15 )
Entonces: Q 1= =3,75≈ 4
4
Por tanto, Q1 en nuestra frecuencia acumulada se encuentra en la posición 3,75, como no tenemos
esa posición en nuestra tabla, el valor que sigue es 6, por tanto, Q1= 1.

2 (15 )
Q 2= =7,5≈ 8
4
Por tanto, Q2 coincide con la mediana, Q2=3.

3 ( 15 )
Q 3= =11,25 ≈ 11
4
Luego, Q3=4.

Segundo jugador

1 ( 15 )
Q 1= =3,75≈ 4
4
por tanto, Q1= 2.

2 (15 )
Q 2= =7,5≈ 8
4
Por tanto, Q2 coincide con la mediana, Q2=3.

3 ( 15 )
Q 3= =11,25 ≈ 11
4
Luego, Q3=3.

Hallemos nuestros límites.


Primer Jugador:
RIQ (Rango intercuartílico) =Q3-Q1
= 4 – 1= 3
Liímite inferior=1−1.5∗3=−3,5
Liímite superior=Q 3+1.5∗RIQ
Liímite superior=4+1.5∗3=8,5
Segundo jugador:
RIQ (Rango intercuartílico) =Q3-Q1
= 3 – 2= 1
Liímite inferior=2−1.5∗1=0,5
Liímite superior=Q 3+1.5∗RIQ
Liímite superior=3+1.5∗3=7,5

También podría gustarte