Está en la página 1de 15

INSTITUCIÓN EDUCATIVA SAN VICENTE – SEDE CENTRAL – JORNADA TARDE

GUÍA DE APRENDIZAJE
Guía No. 5 Período: Tercero Fecha: 29 de agosto del 2022
Asignatura: Estadística Docente: John Jairo Obando Galvis
Grupos: 10.5 – 10.6 - 10.7

COMPETENCIA: Identifica las medidas de dispersión para datos agrupados y no agrupados

DESEMPEÑO: Calcular y determinar las medidas de dispersión en un grupo de datos cuantitativos

MOTIVACIÓN: Las medidas de tendencia central tienen como objetivo el sintetizar los datos en un valor
representativo, las medidas de dispersión nos dicen hasta qué punto estas medidas de tendencia central
son representativas como síntesis de la información. Las medidas de dispersión cuantifican la separación, la
dispersión, la variabilidad de los valores de la distribución respecto al valor central. Distinguimos entre
medidas de dispersión absolutas, que no son comparables entre diferentes muestras y las relativas que nos
permitirán comparar varias muestras En el caso de las variables con valores que pueden definirse en
términos de alguna escala de medida de igual intervalo, puede usarse un tipo de indicador que permite
apreciar el grado de dispersión o variabilidad existente en el grupo de variantes en estudio. A estos
indicadores les llamamos medidas de dispersión, por cuanto que están referidos a la variabilidad que
exhiben los valores de las observaciones, ya que si no hubiere variabilidad o dispersión en los datos interés,
entonces no habría necesidad de la gran mayoría de las medidas de la estadística descriptiva.

FORMULACIÓN DE ACTIVIDADES: A pesar de la gran importancia de las medidas de tendencia central y de


la cantidad de información que aportan individualmente, no hay que dejar de señalar que en muchas
ocasiones esa información, no sólo no es completa, sino que puede inducir a errores en su interpretación.
Las medidas de dispersión nos informan sobre cuánto se alejan del centro los valores de la distribución. Al
igual que sucede con cualquier conjunto de datos, la media, la mediana y la moda sólo nos revelan una
parte de la información que necesitamos acerca de las características de los datos. Para aumentar nuestro
entendimiento del patrón de los datos, debemos medir también su dispersión, extensión o variabilidad. La
dispersión es importante porque proporciona información adicional que permite juzgar la confiabilidad de
la medida de tendencia central. Si los datos se encuentran ampliamente dispersos, la posición central es
menos representativa de los datos ya que existen problemas característicos para datos ampliamente
dispersos, debemos ser capaces de distinguir que presentan esa dispersión antes de abordar esos
problemas.
ACTIVIDADES DE APROPIACIÓN DEL CONOCIMIENTO

Tomar apuntes a partir del siguiente titulo

MEDIDAS DE DISPERSIÓN

Para datos no agrupados:


Las medidas de dispersión nos informan sobre cuánto se alejan del centro los valores de la distribución. Las
medidas de dispersión son:
Rango, recorrido o amplitud: El rango es la diferencia entre el mayor y el menor de los datos de una
distribución estadística.
Desviación media: La desviación media es la media aritmética de los valores absolutos de las desviaciones
respecto a la media.
Varianza: La varianza es la media aritmética del cuadrado de las desviaciones respecto a la media.
Desviación típica: La desviación típica es la raíz cuadrada de la varianza.
Coeficiente de variación: también denominado como coeficiente de variación de Pearson, es una medida
estadística que nos informa acerca de la dispersión relativa de un conjunto de datos.

Rango, recorrido o amplitud:


Desviación media: La desviación media es la media aritmética de los valores absolutos de las desviaciones
respecto a la media. La desviación respecto a la media es la diferencia entre cada valor de la variable
estadística y la media aritmética.

Varianza:
La varianza se representa por s2. Varianza para datos agrupados Para simplificar el cálculo de la varianza
vamos o utilizar las siguientes expresiones que son equivalentes a las anteriores. Varianza para datos
agrupados

Propiedades de la varianza
1 La varianza será siempre un valor positivo o cero, en el caso de que las puntuaciones sean iguales.
2 Si a todos los valores de la variable se les suma un número la varianza no varía.
3 Si todos los valores de la variable se multiplican por un número la varianza queda multiplicada por el
cuadrado de dicho número.
4 Si tenemos varias distribuciones con la misma media y conocemos sus respectivas varianzas se puede
calcular la varianza total.

Desviación típica o desviación estándar: La desviación típica es la raíz cuadrada de la varianza. Es decir, la
raíz cuadrada de la media de los cuadrados de las puntuaciones de desviación. La desviación típica se
representa por σ.

Propiedades de la desviación típica


1 La desviación típica será siempre un valor positivo o cero, en el caso de que las puntuaciones sean iguales.
2 Si a todos los valores de la variable se les suma un número la desviación típica no varía.
3 Si todos los valores de la variable se multiplican por un número la desviación típica queda multiplicada por
dicho número.
4 Si tenemos varias distribuciones con la misma media y conocemos sus respectivas desviaciones típicas se
puede calcular la desviación típica total.
Ejemplo 1.
El coeficiente de variación: se suele expresar en porcentajes: El coeficiente de variación permite comparar
las dispersiones de dos distribuciones distintas, siempre que sus medias sean positivas.
Se calcula para cada una de las distribuciones y los valores que se obtienen se comparan entre sí. La mayor
dispersión corresponderá al valor del coeficiente de variación mayor.
MEDIDAS DE DISPERSIÓN PARA DATOS AGRUPADOS

Coeficiente de variación: Es el cociente entre la desviación típica y la media, se utiliza para comparar las dispersiones
de datos de distinta media.
MEDIDAS DE POSICIÓN NO CENTRAL
Para Datos No Agrupados
Informan de cómo se distribuye el resto de los valores de la serie. Las medidas de posición no central
(cuartiles, deciles, percentiles) son medidas de localización, su función es informar del valor de la variable
que ocupará la posición (en tanto por cien) que nos interese respecto de todo el conjunto de variables.
Podemos decir que los Las medidas de posición no central son unas medidas de posición que dividen a la
distribución en un cierto número de partes de manera que en cada una de ellas hay el mismo de valores de
la variable. Las más importantes son:
CUARTILES, dividen a la distribución en cuatro partes iguales (tres divisiones). Q1, Q2, Q3, correspondientes
a 25%, 50%,75%.
DECILES, dividen a la distribución en 10 partes iguales (9 divisiones). D1,...,D9, correspondientes a
10%,...,90%
PERCENTILES, cuando dividen a la distribución en 100 partes (99 divisiones). P1,...,P99, correspondientes a
1%,...,99%.

Existe un valor en cual coinciden los cuartiles, los deciles y percentiles es cuando son iguales a la Mediana y
así veremos: Q2 = D5 = P50

Cuartiles: Los cuartiles son los tres valores que dividen al conjunto de datos ordenados en cuatro partes
porcentualmente iguales. Hay tres cuartiles denotados usualmente Q1, Q2, Q3:
El primer cuartil Q1, es el menor valor que es mayor que una cuarta parte de los datos; es decir, aquel valor
de la variable que supera 25% de las observaciones y es superado por el 75% de las observaciones
El segundo cuartil Q2, (coincide, es idéntico o similar a la mediana, Q2 = Md), es el menor valor que es
mayor que la mitad de los datos, es decir el 50% de las observaciones son mayores que la mediana y el 50%
son menores.
El tercer cuartil Q3, es el menor valor que es mayor que tres cuartas partes de los datos, es decir aquel valor
de la variable que supera al 75% y es superado por el 25% de las observaciones.
Otro criterio para calcular el valor de los cuartiles en una distribución se basa en el resultado de la siguiente
expresión. Posición de Qk = K × N/4 donde N es el total de datos y K el número del cuartil. Para usar este criterio se
debe tener en cuenta que el resultado de la expresión K × N/4 puede ser un número entero o un número decimal.

Ejemplo 1: Observe un criterio para calcular los cuartiles en el siguiente ejemplo. A continuación, se
muestran las distancias (en kilómetros) a las que vive cada uno de los estudiantes de 9º de su colegio.

Primero se ordenan los datos de menor a mayor.


0,1; 0,5; 0,6; 0,7; 1; 1; 1; 1,6; 1,8; 2; 2; 2,6; 2,7; 2,9; 3; 4; 4; 4,2; 4,2; 4,3
Luego, se determina la posición de Q2 (que corresponde a la mediana). Como hay un número par de datos
(20) el valor de Q2 estará determinado por el promedio entre los dos valores centrales del grupo de datos,
en este caso los datos de las posiciones 10 y 11.
Para hallar Q1 se realiza un procedimiento similar al anterior, teniendo en cuenta que antes de Q2 hay un
número par de datos (10) así que Q1 será el promedio de los dos datos centrales (datos en las posiciones 5
y 6 respectivamente). De manera similar Q3 es el promedio de los datos en las posiciones 15 y 16.
Observe el siguiente esquema:

Deciles: Los deciles son ciertos números que dividen la sucesión de datos ordenados en diez partes
porcentualmente iguales. Son los nueve valores que dividen al conjunto de datos ordenados en diez partes
iguales, son también un caso particular de los percentiles, ya que podemos definir Decil como “percentil
cuyo valor que indica su proporción es un múltiplo de diez. Percentil 10 es el primer decil, percentil 20 el
segundo decil, etc”.
El primer decil D1: indica que sólo existe un 10% de probabilidad de que el valor de la variable esté por
debajo de esa cifra.
Quinto decil D5 o denominado también “Caso Base”: indica que existe igualmente un 50% de probabilidad
de que el valor esté por encima como por debajo de esa cifra. Representa la Mediana de la distribución.
Cálculo de los Deciles:
Existen varios métodos para el cálculo de deciles. Veamos uno de los más sencillos (válido para datos no
agrupados):
1. Agrupamos las muestras de menor a mayor valor
2. Calculamos la posición que ocupa el percentil buscado aplicando la siguiente fórmula: x = (N · i) / 10
siendo N el número total de muestras analizadas y la letra "i" el decil buscado
3. Si el resultado anterior (x) no tiene decimales, el decil se obtiene seleccionando el valor de la muestra
que ocupa la posición x.
4. Si el resultado (x) tiene decimales, el decil se obtiene haciendo la media de las muestras en posición x y
x+1

Ejemplo 2: Calcular el decil 6 (D6) de las siguientes muestras de notas en matemáticas de un aula (notas de
0 a 20): 16, 10, 12, 8, 15, 18, 20, 9, 11, 1, 13, 17, 9, 10, 14
Ordenamos de menor a mayor: 1, 8, 9, 9, 10, 10, 11, 12, 13, 14, 15, 16, 17, 18, 20
N = número de muestras = 15 muestras
x = (N · i) / 10 = (15 · 6) / 10 = 9
Como x = 9 es un número sin decimales, entonces el decil 6 es el valor de la muestra que ocupa la posición 9
D6 (decil 6) = 13

Ejemplo 3: En un examen muy difícil de universidad, se obliga al profesor a aprobar al menos al 10%.
Calcular la nota a partir de la cual está obligado a aprobar siendo las notas (notas de 0 a 20): 0, 4, 1, 0, 0, 7,
2, 1, 4, 0, 3, 9, 2, 0, 0, 4, 8, 1, 0, 9, 4
Necesitamos calcular el decil 9 (D9) ya que nos interesa calcular el valor a partir del cual solo hay un 10%
con mejores notas
Ordenamos de menor a mayor: 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 2, 2, 3, 4, 4, 4, 4, 7, 8, 9, 9
N = número de muestras = 21 muestras
x = (N · i) / 10 = (21· 9) / 10 = 18,9
Como x = 18,9 es un número con decimales, entonces el decil 9 es la media de los valores que ocupan la
posición 18 y 19 
D9 (decil 9) = (7 + 8) / 2 = 7,5

Percentiles o centiles: Los percentiles son, tal vez, las medidas más utilizadas para propósitos de ubicación
o clasificación de las personas cuando atienden características tales como peso, estatura, etc. Los
percentiles son ciertos números que dividen la sucesión de datos ordenados en cien partes
porcentualmente iguales. Estos son los 99 valores que dividen en cien partes iguales el conjunto de datos
ordenados. Sencillamente Percentil es el valor del recorrido de una variable, bajo el cual se encuentra una
proporción determinada de la población. Los percentiles (P1, P2,... P99), leídos primer percentil,..., percentil
99, muestran la variable que deja detrás una frecuencia acumulada igual al valor del percentil:
Primer percentil, que supera al uno por ciento de los valores y es superado por el noventa y nueve por
ciento restante.
El 60 percentil, es aquel valor de la variable que supera al 60% de las observaciones y es superado por el
40% de las observaciones.

El percentil 99 supera 99% de los datos y es superado a su vez por el 1% restante.


Cálculo de los Percentiles:

Existen varios métodos para el cálculo de percentiles. Veamos uno de los más sencillos (válido para datos
no agrupados):
1. Agrupamos las muestras de menor a mayor valor
2. Calculamos la posición que ocupa el percentil buscado aplicando la siguiente fórmula: x = (N · i) / 100
siendo N el número total de muestras analizadas y la letra "i" el percentil buscado
3. Si el resultado anterior (x) no tiene decimales, el percentil se obtiene seleccionando el valor de la muestra
que ocupa la posición x.
4. Si el resultado (x) tiene decimales, el percentil se obtiene haciendo la media de las muestras en posición x
y x+1

Ejemplo 4: Calcular el percentil 40 (P40) de las siguientes muestras de notas en matemáticas de un aula
(notas de 0 a 20): 16, 10, 12, 8, 15, 18, 20, 9, 11, 1, 13, 17, 9, 10, 14
Ordenamos de menor a mayor: 1, 8, 9, 9, 10, 10, 11, 12, 13, 14, 15, 16, 17, 18, 20
N = número de muestras = 15 muestras
x = (N · i) / 100 = (15 · 40) / 100 = 6
Como x = 6 es un número sin decimales, entonces el percentil 40 es el valor de la muestra que ocupa la
posición 6
P40 (percentil 40) = 10

Ejemplo 5: En un examen muy difícil de universidad, se obliga al profesor a aprobar al menos al 10%.
Calcular la nota a partir de la cual está obligado a aprobar siendo las notas (notas de 0 a 20): 0, 4, 1, 0, 0, 7,
2, 1, 4, 0, 3, 9, 2, 0, 0, 4, 8, 1, 0, 9, 4
Necesitamos calcular el percentil 90 (P90) ya que nos interesa calcular el valor a partir del cual solo hay un
10% con mejores notas
Ordenamos de menor a mayor: 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 2, 2, 3, 4, 4, 4, 4, 7, 8, 9, 9
N = número de muestras = 21 muestras
x = (N · i) / 100 = (21· 90) / 100 = 18,9
Como x = 18,9 es un número con decimales, entonces el percentil 90 es la media de los valores que ocupan
la posición 18 y 19 
P90 (percentil 90) = (7 + 8) / 2 = 7,5

Diagrama de cajón y bigotes:

El diagrama de cajón y bigotes es una representación que permite visualizar características de la población
a partir. Sus valores extremos, es decir, su máximo valor y su mínimo y de las medidas de posición
(𝑄1, 𝑄2, 𝑄3): los tres cuartiles. Recuerde que el segundo cuartil es coincidente con la mediana de los datos.

Para representar gráficamente los cuartiles de una distribución de datos se utiliza un diagrama de cajón que
consiste en un rectángulo, llamado cajón, y sus prolongaciones, llamadas bigotes, superpuesto en una recta
graduada, tales que:

∎ En el cajón se puede identificar el valor de los cuartiles 𝑄1,𝑄2 𝑦 𝑄3


∎ En los bigotes se pueden identificar los valores extremos de la distribución de datos (máx. Y Mín.)
∎ Dentro del cajón está la mediana o 𝑄2

Bigote cajón bigote

Mín.=2 𝑄1 = 5 𝑄2 = 7 𝑄3 = 12 Máx.=13

Objetivo 1: representar gráficamente los cuartiles en un diagrama de cajón y bigotes.

Actividad desarrollada: A partir de un conjunto de datos los representaremos gráficamente en un


diagrama de cajón y bigotes, siguiendo los pasos indicados en cada ejemplo.

Ejemplo 1: La siguiente distribución de datos representa la cantidad de veces que consumió comida
chatarra en una semana un grupo de personas.

1 3 1 4 3 1 3
2 4 3 5 1 2 1
1 3 4 1 2 3 1
4 4 3 5 1 4 3
3 5 2 4 1 3 5

Primer paso: Construimos una tabla de frecuencias.

Cantidad de veces Frecuencia Frecuencia


por semana absoluta acumulada
1 10 10
2 4 14
3 10 24
4 7 31
5 4 35

Segundo paso: Calculamos los cuartiles.

Cálculo de 𝑸𝟏 𝑄1=25% de 35= 0,25 ∙ 35 = 8,75


nos vamos a la columna donde la frecuencia acumulada sea mayor o igual a este valor, lo que
corresponde al 10, indicándonos que el 𝑸𝟏 = 𝟏 (primera fila, primera columna).

Cálculo de 𝑸𝟐 𝑄2=50% de 35= 0,5 ∙ 35 = 17,5

Nos vamos a la columna donde la frecuencia acumulada sea mayor o igual a este valor 17,5; lo que
corresponde al 24, indicándonos que el 𝑸𝟐 = 𝟑 (tercera fila, primera columna)

Cálculo de 𝑸𝟑 𝑄1=75% de 35= 0,75 ∙ 35 = 26,25

Nos vamos a la columna donde la frecuencia acumulada sea mayor o igual a este valor 26,25; lo que
corresponde al 31, indicándonos que el 𝑸𝟑 = 𝟒 (Cuarta fila, primera columna)

Tercer paso: Identificamos de todos los datos dados cuál es el que tiene valor máximo y cuál es el que
tiene valor mínimo y los ordenamos en la tabla siguiente.

Valor 𝑄1 𝑄2 𝑄3 Valor
mínimo máximo
1 1 3 4 5

Cuarto paso: Se construye el diagrama de cajón y bigotes.

Note que el diagrama no tiene bigote en el lado izquierdo del cajón, pero sí en el lado derecho.
Al menos el 25% de los encuestados consume chatarra a lo más una vez a la semana.
Al menos el50% de los encuestados consume 3 o menos veces chatarra a la semana.
Al menos el 75% de los encuestados consume 4 o menos veces chatarra a la semana.

Ejemplo 2: La tabla muestra los datos de la presión sistólica sanguínea medida a 100 mujeres
antes de comenzar un tratamiento.

Presión Sistólica Sanguínea


Presión (mm Hg) Cantidad de mujeres
(f absoluta)
105 14
107 12
125 34
138 40

Primer paso: Completar la tabla con las frecuencias acumuladas.

Presión Sistólica Sanguínea


Presión (mm Hg) Cantidad de mujeres (f absoluta) F acumulada

105 14 14
107 12 26
125 34 60
138 40 100

Segundo Paso: Calculamos los cuartiles.

Cálculo de 𝑸𝟏 𝑄1=25% de 100= 0,25 ∙ 100 = 25

nos vamos a la columna donde la frecuencia acumulada sea mayor o igual a este valor 25, lo que
corresponde al 26, indicándonos que el 𝑸𝟏 = 𝟏𝟎𝟕 (segunda fila, primera columna).

Cálculo de 𝑸𝟐 𝑄2=50% de 100= 0,5 ∙ 100 = 50

Nos vamos a la columna donde la frecuencia acumulada sea mayor o igual a este valor 50, lo que
corresponde al 60, indicándonos que el 𝑸𝟐 = 𝟏𝟐𝟓 (tercera fila, primera columna)

Cálculo de 𝑸𝟑 𝑄1=75% de 100= 0,75 ∙ 100 = 75

Nos vamos a la columna donde la frecuencia acumulada sea mayor o igual a este valor 75, lo que
corresponde al 100, indicándonos que el 𝑸𝟑 = 𝟏𝟑𝟖 (Cuarta fila, primera columna)

Valor Mínimo=105
Valor Máxima=138

Tercer paso: Identificamos de todos los datos dados cuál es el valor máximo y cuál es el mínimo y los
ordenamos en la tabla siguiente.

Valor 𝑄1 𝑄2 𝑄3 Valor
Mínimo Máxima
105 107 125 138 138

Cuarto paso: Se construye el diagrama de cajón y bigotes

Al menos el 25% de las mujeres tiene una presión menor o igual a 107 mm Hg (bigote lado izquierdo)
Al menos el 50% de las mujeres tiene una presión menor o igual a 125 mm Hg
Al menos el 75% de las mujeres tiene una presión menor o igual 138 mm Hg

1) Estructuración (Actividades de apropiación del conocimiento)

Taller de la Guía 5
ACTIVIDADES DE APLICACIÓN:
APLICACIÓN PARA LA VIDA DIARIA:
1) Complete los espacios en rojo, complete la tabla y Halle el rango, la desviación media, la varianza, la
desviación típica o estándar y el coeficiente de variación en la siguiente tabla.
Numero de Frecuencia fi|X-xi|
Marca de
pulsaciones por
Clase (xi)
Absoluta xi.fi |X-xi|
minuto (fi)
[62-65) 6
[65-68)
[68-71) 4
[71-74) 11
[74-77)
[77-80] 10
Total

2) Complete los espacios en rojo, complete la tabla y Halle el rango, la desviación media, la varianza, la
desviación típica o estándar y el coeficiente de variación en la siguiente tabla

Frecuencia |X-xi| fi|X-xi|


Tiempo de Marca de
Absoluta xi.fi
duración Clase (xi)
(fi)
[5-9) 6
[9-13)
[13-17) 7
[17-21) 11
[21-25)
Total

3) Los datos siguientes corresponden a los tiempos de reacción de una muestra de 33 sujetos, medidos en
centésimas de segundo (Inventar los dos últimos datos, reemplazando las letras en rojo por un número): nt,
51, 60, 56, 64, 56, 63, 63, 61, 57, 62, 50, 49, 70, 72, 54, 48, 53, 58, 66, 68, 45, 74, 65, 58, 61, 62, 59, 64, 57, 63,
xm, yf.
a. Calcular los cuartiles de los 33 sujetos
b. Calcular el decil 5 y el decil 7
c. Calcular el percentil 13 y el percentil 76
d. Realizar el diagrama de cajas y bigotes

TRANSFERENCIA (Actividades de aplicación para la vida)

4) Consulte a 15 compañeras ¿cuántas veces a la semana consumen frutas? Los resultados se muestran a
continuación. Determinar cuál es:
a. el cuartil 3 (Q3)
b. el decil 8 (D8)
c. el percentil 32 (P32)

EVALUACIÓN:
En esta guía se tendrá en cuenta en la valoración de la Actitudinal que es el 20% en el periodo, en los
siguientes aspectos:
 Responsabilidad en la entrega de la guía.
 Puntualidad, comportamiento y presentación personal durante el desarrollo de la clase virtual o
presencial.
 Calidad y presentación de la guía.

En la heteroevaluación del desarrollo de la guía 1 en los aspectos de la Práctica (Actividades de


aplicación) y Transferencia (Actividades de aplicación para la vida) Vale el 10% de la calificación del
periodo.

En la heteroevaluación La prueba escrita presencial o virtual de las competencias vistas en esta guía 1. Vale
el 10 % de la calificación del periodo.

También podría gustarte