Está en la página 1de 39

Estadística

Centro de Formación Técnica Cenco


UNIDAD 3: MEDIDAD DE DISPERSIÓN, MEDIDAS DE FORMA Y GRÁFICOS.

INTRODUCCIÓN A LA UNIDAD

En esta unidad denominada “Medidas de dispersión, medidas de forma y gráficos” de la Actividad


Curricular Estadística, conoceremos y analizaremos contenidos relacionados con los principios
fundamentales y conceptos claves utilizados en estadística descriptiva a través del desarrollo de tres
temas. Los cuales dicen relación con la presentación de las principales medidas de dispersión
utilizadas en estadística descriptiva. Posteriormente, conoceremos dos medidas de forma que
corresponden a la asimetría y a la curtosis. Para finalizar, estas medidas serán graficadas con el
propósito de mostrar su funcionamiento y utilidad.

Los Resultados de aprendizaje a alcanzar en esta Unidad Temática son:

1. Conocer y aprender acerca de las principales medidas de dispersión utilizadas en estadística


descriptiva.
2. Interpretar sobre las medidas de forma como la asimetría y la curtosis.
3. Graficar las medidas de dispersión y forma, para mostrar su funcionamiento.

Para desarrollar y potenciar sus aprendizajes y compartir su experiencia, desarrollaremos


actividades de reflexión, planteando dudas y consultas en el Foro de cada Unidad Temática para
llegar mejor preparados a resolver sus actividades de evaluación sumativas y la actividad de
evaluación final-examen.

ACTIVIDAD INICIAL

Las medidas de tendencia central como hemos estudiado son muy útiles para describir el
comportamiento de los datos en torno al centro de la distribución. Quizás las medidas de tendencia
central y en especial el promedio sean los conceptos que más tenemos interiorizados, pues la
mayoría de la información que recibimos se codifica bajo estos parámetros. Ejemplos de esta
situación son: el producto interno bruto (PIB) per cápita, el promedio de los sueldos, el promedio
de las notas, etc… Pero sucede que hay datos que se esconden detrás de los promedios, como
acabamos de señalar detrás de la medición en torno al promedio hay realidades subyacentes que
es necesario abordar. Para esta situación están las medidas de dispersión, con las que podremos
conocer el comportamiento de los datos, que no son reconocidos por las medidas de tendencia
central. Además, también aprenderemos sobre las medidas de forma, que sirven para mostrar la
representación que toman las distribuciones de los datos.

1. ¿Usted tiene conocimiento acerca de las medidas de dispersión en estadística descriptiva?


¿Qué sabe?

2. ¿Considera usted importante aprender sobre el uso de medidas dispersión para el análisis
de datos?
3. ¿Usted qué conoce acerca de las medidas de forma en estadística descriptiva y el uso que
les puede otorgar?

Estimado(a) estudiante:

A continuación, usted comenzará el estudio de la actividad curricular a


través de la Unidad de Medidas de Dispersión, Medidas de Forma y
Gráficos y sus Sub-Unidades. Para que usted alcance los objetivos
proyectados y que su aprendizaje sea de calidad, le entregamos algunas
recomendaciones:

1.
Tómese su tiempo para el estudio y acomódese en un lugar que le sea grato y
sin distractores.
2. Deténgase en aquellos contenidos que le sean más difíciles de entender.
Vuelva atrás toda vez que lo necesite.
3. Apóyese en el material complementario para el estudio, el cual le
permitirá profundizar y obtener mayor información sobre un tema en
particular.
4. Si se le presenta alguna duda que no pueda despejar en este documento,
diríjase al Foro de la Unidad y plantéemela.

¡Bienvenido(a) al estudio!

TUTOR ACADÉMICO

DESARROLLO DE LOS CONTENIDOS

3.1 Medidas de dispersión en distribuciones estadísticas.

Como vimos en la unidad anterior las medidas de tendencia central son útiles para señalar cómo los
datos interactúan con el centro de la distribución, pero sólo nos otorgan una aproximación parcial
acerca de la distribución de los datos. En este contexto, las medidas de dispersión juegan un rol
central para analizar la distribución de los datos, pues nos permiten saber e informar cuan alejadas
están del centro del centro de distribución nuestros valores(variables). La variabilidad, es decir, que
tan uniforme son los datos.

3.1.1 Rango

La primera medida de dispersión con la que trabajaremos corresponde al rango. El rango es la


amplitud de los valores de un conjunto de datos. En otras palabras, el rango hace referencia al
recorrido que hace la variable desde su valor más pequeño a su valor más grande. Esta medida de
dispersión, se obtiene restando el valor máximo de la variable con el valor mínimo. La fórmula del
rango es:

Rango= Xmax -Xmin

De esta forma, toda variable que pueda ser ordenada a partir de un grado de jerarquía, puede ser
estudiada en base al rango, como los son las variables ordinales, de intervalo y de razón.

Cálculo de rango en variable de ordinales.

Como recordaran en las unidades anteriores trabajamos con variables ordinales, que se
caracterizaban por ser susceptibles de ser ponderadas. Con ellas se puede establecer un orden
ascendente o descendentes entre los valores.

Sigamos el siguiente ejemplo: En un estudio, una empresa pregunta por el nivel de satisfacción de
sus clientes con un producto X ¿Cuál es el nivel de satisfacción que usted como usuario siente con
este nuevo producto? Codificado en las siguientes alternativas:

a) Muy insatisfecho

b) Insatisfecho

c) Ni satisfecho ni insatisfecho

d) Satisfecho

e) Muy satisfecho

Tabla n°1. Encuesta de nivel de satisfacción.


Codificación Nivel de satisfacción Número de personas Frecuencia
consultadas acumulada
1 Muy insatisfecho 9 9

2 Insatisfecho 8 17

3 Ni satisfecho ni insatisfecho 16 33

4 Satisfecho 18 51

5 Muy satisfecho 17 68

Total 68
Fuente: Elaboración propia.
La codificación enuncia que hay una jerarquización de las cinco posibles respuestas. De esta forma
remplazamos la fórmula Rango= Xmax -Xmin

Restamos el valor máximo que es 5 (muy satisfecho) por el valor mínimo que es 1 (muy insatisfecho),
lo que nos da un recorrido de 4. Es decir, el rango de esta variable es 4.

Siguiendo con los ejemplos, ahora utilizaremos una variable de razón para calcular el rango. Para lo
cual se empleará una serie de calificaciones obtenidas por distintos estudiantes, como se muestra
en la siguiente tabla:

Tabla n°2: Calificaciones obtenidas en un curso.


Calificaciones Frecuencia Frecuencia acumulada
1 6 6
2 4 10
3 9 19
4 10 29
5 5 34
6 6 40
7 4 44
8 6 50
9 2 52
10 1 53
53
Fuente: Elaboración propia.

En base a la tabla, es posible observar que la calificación mínima posible de obtener es 1 y la


calificación máxima es 10, por lo tanto, para obtener el rango de la variable(calificaciones) se le resta
al valor máximo el valor mínimo, que sería: 10-1=9. Entonces el rango es igual a 9.

Sin embargo, la desventaja del rango al usar un valor mínimo y un valor máximo es que su valor
(resultado) se ve afectado por valores atípicos. Es decir, el rango como medida de cálculo presenta
un alta sensibilidad a datos desviados. Lo que ejemplificaremos con los datos de la siguiente tabla:
Tabla n°3: Edades de una familia
Edades Frecuencia absoluta Frecuencia
acumulada
3 1 1
25 1 2
26 1 3
27 1 4
32 1 5
33 1 6
Fuente: Elaboración propia.
Como se muestra en la tabla n°3 las edades de una familia van de 3 años a 33 años, no obstante,
podemos observar como la edad mínima es un dato atípico, puesto que la mayoría de las edades se
concentran entre los 25 y 33 años. En consecuencia, calcularemos el rango con y sin el valor atípico.

Calculo con valor atípico: 33-3=30. El rango con valor atípico es 30.

Calculo sin valor atípico: 33-25=8. El rango sin valor atípico es 8.

Observamos una diferencia de 22 puntos en el rango en el mismo conjunto de datos, a raíz de la


influencia de un valor atípico. Lo que nos confirma que el rango es una medida muy sensible a este
tipo de valores. Se recomienda que esta medida no sea utilizada en conjuntos de datos contengan
datos atípicos, pues alteran el resultado.

3.2.2 Desviación media

La segunda medida de distribución es la desviación media, que corresponde a la diferencia en valor


absoluto entre cada uno de los valores de la variable y la media aritmética. La desviación media mide
la cantidad media respecto de la cual los valores de una población o muestra varían. Es aplicable a
variables de razón o de intervalo. La desviación media se define como la suma total de valores de
cada número menos la media de cada número, todo lo que se divide por N. Como se describe en la
siguiente fórmula:
n
[Xi- ]
i=1
Desviación Media D= --------------------------------------
N
D = Varianza poblacional.
Xi= término del conjunto de datos.
= media de la muestra.
= sumatoria.
N= tamaño de la muestra.
Trabajemos con el siguiente ejemplo para comprender el funcionamiento de la desviación media. A
continuación, tenemos la edad de cinco jóvenes:
9 10 11 12 14

El primer paso, es obtener el promedio del conjunto de datos = 9+10+11+12+14/5= 11,2

Paso siguiente es saber cuánto se alejan las edades respecto al promedio, es decir, se resta el valor
de cada uno de los valores por la media aritmética, recordar que los resultados de esta operación
deben estar en valores absolutos:

Tómenos el primer número que es el 9, le restamos el promedio, lo que sería [9-11,2]= [-2,2]=2,2
Esto quiere decir que a edad de 9 años está desviada en 2,2 años respecto al promedio. Ahora
realicemos el mismo ejercicio con cada una de las edades, lo que nos daría la siguiente tabla:
Tabla n°4: Edades de un grupo de personas.
Edad Media Edad-Media Edad-Media en Valor absoluto
9 11,2 -2,2 2,2
10 11,2 -1,2 1,2
11 11,2 -0,2 0,2
12 11,2 0,8 0,8
14 11,2 2,8 2,8
Fuente: Elaboración propia.

Siguiendo con el ejercicio, para encontrar la desviación media necesitamos encontrar la suma del
promedio de todas las desviaciones y dividirla por 5: 2,2+1,2+0,2+0,8+2,8/5=1,44. Por lo que la
desviación media es: D =1,44.

A continuación, trabajaremos la desviación media con datos agrupados en intervalos para lo cual
emplearemos la siguiente tabla:

Tabla n°4: Edades de un grupo de personas en intervalos.


Edad X F X*F [X- ] [X- ]*F
30-35 32,5 3 97,5 12,5 37,5
35-40 37,5 5 187,5 7,5 37,5
40-45 42,5 6 255 2,5 15
45-50 47,5 8 380 2,5 20
50-55 52,5 6 315 7,5 45
55-60 57,5 2 115 12,5 25
Suma 30 1350 180
Fuente: Elaboración propia.

Para empezar, es necesario señalar que la tabla con la que trabajaremos pertenece a un grupo de
personas divididas en intervalos según sus edades. En la columna F podemos observar que 3
personas tienen entre 30 y 35 años, 5 personas tienen entre 35 y 40 años, 6 personas tienen entre
40 y 45 años, 8 personas tienen entre 45 y 50 años, 6 personas tienen entre 50 y 55 años y finalmente
2 personas tienen entre 55 y 60 años. En total, nuestro conjunto de datos tiene 30 personas.

La segunda columna X de la tabla corresponde a la marca de clase de cada intervalo, recordemos


que la marca de clase se obtiene en base al promedio de los límites de cada intervalo. Que en este
caso serían el promedio de 30 y 35= 32,5; 35 y 40=37,5; 40 y 45=42,5; 45 y 50=47,5; 50 y 55= 52,5;
55 y 60= 57,5.
La columna X*F corresponde a la multiplicación de las columnas X y F: 32,5 por 3=97,5; 37,5 por 5=
187,5; 42,5 por 6=255; 47,5 por 8=380; 52,5 por 6= 315 y 57,5 por 2=115.

X F X*F
32,5 3 97,5
37,5 5 187,5
42,5 6 255
47,5 8 380
52,5 6 315
57,5 2 115
30 1350

La suma total de la columna X*F es 1350, es decir, la suma total de las edades de las personas de
nuestro conjunto de datos corresponde a 1350 años.

Para obtener el promedio de las edades de las personas del conjunto de datos, es necesario dividir
la suma total de las edades que es 1350 por el número de datos que es 30. Entonces el promedio de
las edades del conjunto de datos se obtiene al dividir 1350/30= 45. El promedio de edad de las
personas del conjunto de datos es 45 años.

Paso siguiente, necesitamos obtener los datos de la columna [X- ]:

[X- ]
12,5
7,5
2,5
2,5
7,5
12,5

La primera celda seria 32,5 menos el promedio que como vimos es 45, lo que da un total de -12,5,
pero debemos recordar que los resultados de la fila [X- ] están en números absolutos por lo que
sería 12,5. Sigamos con cada celda sucesivamente, 37,5 menos 45= 7,5; 42,5 menos 45= 2,5 ;47,5
menos 45= 2,5; 52,5 menos 45= 7,5; 57,5 menos 45= 12,5.

Para obtener la última columna [X- ]*F:


[X- ]*F
37,5
37,5
15
20
45
25
180
La primera celda sería 12,5 por 3= 37,5; la que continua 7,5 por 5=37,5; la que sigue 2,5 por 6=15;
seguimos 8 por 2,5=20; seguimos 6 por 7,5= 45 y finalmente 12,5 por 2 = 25. La suma de los datos
es 180.
Retómenos la tabla y la fórmula y remplacemos.

Tabla n°4: Edades de un grupo de personas en intervalos.


Edad X F X*F [X- ] [X- ]*F
30-35 32,5 3 97,5 12,5 37,5
35-40 37,5 5 187,5 7,5 37,5
40-45 42,5 6 255 2,5 15
45-50 47,5 8 380 2,5 20
50-55 52,5 6 315 7,5 45
55-60 57,5 2 115 12,5 25
Suma 30 1350 180
Fuente: Elaboración propia.

n
[Xi- ]*F 180
i=1
Desviación Media D= ---------------------------= ----------------- = 6
N 30

La desviación media = D = 180/30=6


La desviación media de nuestro conjunto de datos es 6.

3.2.3 Varianza

La varianza es una medición de la dispersión de las observaciones respecto a la media, es decir, es


un valor de promedio. Esta medida de dispersión es aplicable a variables de razón e intervalo. La
varianza se representa por el símbolo sigma al cuadrado. Dependiendo de la naturaleza de los datos,
ya sea por población o muestra, se aplican diferentes fórmulas.

El primer tipo de varianza con la trabajaremos corresponde a la varianza poblacional, que se


representa por la siguiente fórmula:

n
(Xi- )2
i=1
Varianza poblacional Ơ =2
------------------------------
N

Ơ2= Varianza poblacional.


Xi= término del conjunto de datos.
= media de la muestra
= sumatoria
N= tamaño de la muestra

Por su parte, la varianza de la muestra se representa por la siguiente fórmula:

n
(Xi- )2
i=1
Varianza de la muestra S 2
= --------------------------------------
N-1

S2= Varianza de la muestra.


Xi= término del conjunto de datos.
= media de la muestra =
sumatoria
N= tamaño de la muestra

Es necesario aclarar que en la fórmula de la varianza de la muestra, la división se hace por el


denominador n-1, que es un factor de corrección para intentar obtener un estimador no sesgado de
la varianza.
Para aplicar la varianza debemos saber si los datos se van a usar corresponden a una población o a
una muestra. En el caso a continuación, calcularemos la varianza para una población:

El siguiente conjunto de datos son las notas de un curso:

Tabla n°5: Calificaciones de un curso.


Nombre del alumno Calificación
Amanda 7
Roberto 6
Julián 6
Juan 5
Fabiola 7
Carlos 5
Fuente: Elaboración propia.

El primer paso, es obtener el promedio de las notas de los estudiantes. Como recordaran en la
unidad pasada vimos que el promedio se obtiene sumando el total de los valores de la variable
divididas por el número de por el número total de variables.

xi
Media aritmética = --------------
N

En este caso, la suma sería de 7+6+6+5+7+5= 36 (calificaciones obtenidas por los alumnos), cuyo
resultado debe ser dividido por 6 (número de alumnos). Esto tiene como resultado: 6.

Paso siguiente, es calcular la varianza para lo cual aplicamos la siguiente fórmula:


(Xn- )2
Varianza Ơ2 = --------------------------------------
N

Al aplicar los datos a la fórmula de la varianza nos da la siguiente fórmula:


Varianza = (7-6)2+(6-6)2+(6-6)2+(5-6)2+(7-6)2+(5-6)2
6
El primer dato es (7-6)2 que sería 1 elevado al cuadrado que es 1. Posteriormente, (6-6)2 que sería 0
elevado al cuadrado que resulta 0. De esta forma si seguimos uno a uno, nos daría lo siguiente:

Varianza = 1+0+0+1+1+1
6
De esta forma tendríamos que dividir 4 por 6, lo que nos da 0,66666667

Esto quiere decir que la varianza de los datos 0,66.

Segundo ejemplo con la tabla n°6:

Tabla n°6: Calificaciones de un curso.


Alumnos Calificaciones
1 4
2 2
3 3
4 5
5 1
6 4
7 3
8 2
9 3
10 5
Fuente: Elaboración propia.

Al igual que en el ejercicio anterior, el primer paso es obtener el promedio sería la sumatoria de las
calificaciones divididas por el número de estudiantes. Lo que en términos numéricos seria 32(suma
de calificaciones) dividido por 10(número de estudiantes), lo que resulta 3,2. Entonces nuestro
promedio es 3,2.

Paso siguiente, ordenamos las calificaciones de forma ascendente. Además, agregamos dos
columnas a nuestra tabla como lo pide la fórmula de la varianza. Una columna que muestra cada
uno de los datos trabajados menos el promedio (Xn- ) y una segunda comuna que eleve al cuadrado
cada una de las restas entre cada uno de los datos y el promedio (Xn- )2.

Tabla n°6: Calificaciones de un curso.


Alumnos Calificaciones (Xn- ) (Xn- )2
1 1 -2,2 4,84
2 2 -1,2 1,44
3 2 -1,2 1,44
4 3 -0,2 0,04
5 3 -0,2 0,04
6 3 -0,2 0,04
7 4 0,8 0,64
8 4 0,8 0,64
9 5 1,8 3,24
10 5 1,8 3,24
Fuente: Elaboración propia.

Recuerde que todos los resultados de la columna (Xn- )2 son positivos, porque cualquier número
elevado al cuadrado da positivo. Ahora debemos sumar todos los datos de la columna (Xn- )2

(Xn- )2
4,84
1,44
1,44
0,04
0,04
0,04
0,64
0,64
3,24
3,24
15,6

El resultado de la suma de la columna es 15,6.

Con estos datos remplazamos

(Xn- )2 15,6
2
Varianza Ơ = ----------------------------= ----------- = 1,56
N 10

Es decir, la varianza del conjunto de datos del ejemplo trabajado es 1,56.

3.2.4 Desviación típica o estándar.


Para resolver el tema de las unidades cuadráticas que aparecen en la varianza, podemos utilizar la
desviación típica que es la raíz cuadrada de la varianza. La pregunta central de esta medida es:
¿Cuánto se alejan los valores de las variables respecto al promedio? La desviación estándar es una
medida muy importante, ya que la inferencia estadística está determinada por la desviación
estándar.
n
√ (Xn- )2
i=1
Desviación típica poblacional Ơ= --------------------------------------
N

Ơ = Desviación estándar.
Xi= término del conjunto de datos.
= media de la muestra
= sumatoria

N= tamaño de la muestra
√= raíz aplicada

n
√ (Xn- )2
i=1
Desviación típica de la muestra S = --------------------------------------
N-1

S = Desviación estándar de la muestra.


Xi= término del conjunto de datos.
= media de la muestra
= sumatoria
N= tamaño de la muestra
√= raíz aplicada
Seguimos con el ejemplo anterior con la tabla ya utilizada:

Tabla n°6: Calificaciones de un curso.


Alumnos Calificaciones (Xn- ) (Xn- )2
1 1 -2,2 4,84

2 2 -1,2 1,44

3 2 -1,2 1,44

4 3 -0,2 0,04
5 3 -0,2 0,04

6 3 -0,2 0,04

7 4 0,8 0,64

8 4 0,8 0,64

9 5 1,8 3,24

10 5 1,8 3,24
Fuente: Elaboración propia.

Entonces para sacar la desviación estándar de estos datos que vimos en el ejemplo anterior,
debemos tomar la varianza ya obtenida que es: 1,56 y aplicar raíz cuadrada. Lo que nos da que como
resultado 1,24 para la desviación estándar.

3.2.5 Coeficiente de variación

El coeficiente de variación es una medida de dispersión relativa, que mide la proporción de la


desviación estándar respecto a la media aritmética. Qué proporción del valor de la media es la
desviación estándar, en otras palabras, que tan grande es el valor de la desviación estándar
comprándolo con el valor de la media.

Cabe destacar que esta medida se basa en términos porcentuales. Además, este coeficiente debe
ser calculado para variables positivas, asociándose a variables en escala de razón. La notación
matemática es CV, a continuación, se muestra la fórmula:

S
Coeficiente de variación CV= ---- -----
-- * 100

S = Desviación estándar de la muestra.


= media de la muestra

Siguiendo con el mismo ejemplo anterior, para lo cual insertamos la tabla que hemos ocupado a lo
largo del ejemplo, donde ya sabemos que la desviación estándar es 1,24 y que el promedio es 3,2.

A continuación, remplazamos en a formula:

1,24
Coeficiente de variación CV= ----------- * 100 = 38,75.
3,2

Es decir, con los valores del ejemplo utilizado, existe un coeficiente de variación de 38,75 por ciento.

SÍNTESIS DEL TEMA


Estimados estudiantes, hasta aquí hemos tratado y descrito las medidas de distribución
usadas en estadística descriptiva. Que nos permiten analizar la distribución de los datos,
con el objetivo de saber e informar cuan alejadas están del centro los valores de la
distribución.

La primera medida con la que se trabajó corresponde al rango, que es la medida de


dispersión más sencilla de calcular. El rango es el recorrido que hace la variable desde su
valor mínimo hasta el valor máximo. Así también hemos destacado que el rango es una
medida muy sensible a los valores atípicos. Recordemos que todas las variables que pueden
ser ordenadas son susceptibles de ser analizadas a través del rango.

La desviación media corresponde a la diferencia en términos absolutos entre cada uno de


los valores de las variables y la media aritmética. La desviación media mide la cantidad
media respecto de la cual los valores de una población o muestra varían.

Por su parte la varianza es una medida de dispersión centrada en el promedio de las


desviaciones cuadráticas de cada valor respecto a la media. Esta medida es aplicable
a rangos variables de razón e intervalo. Este tipo de medida puede ser aplicable
tanto para medir una población y una muestra.

Ahora bien, la desviación estándar es la raíz cuadrada de los de la varianza.


Mediante esta medida se busca responder la pregunta ¿Cuánto se alejan los valores
de las variables respecto al promedio? También sirve para ser aplicada tanto a
poblaciones como a muestras.

Por último, la medida de dispersión denominada coeficiente de variación, se basa en


la medición de la proporción de la desviación estándar respecto a la media, es
necesario destacar que esta medida se calcula en términos porcentuales.

-----------------------------------------------------------------------------------------------------------------------------------
---
Por favor, revise el siguiente enlace para complementar su estudio:
Medidas de dispersión

https://www.jica.go.jp/project/elsalvador/004/materials/ku57p

q00003uf5za-att/workbook_JS3_08.pdf

Medidas de dispersión

https://www.youtube.com/watch?v=2it1aEsA0Yk

Estimado(a) estudiante:

A continuación, lo invito a debatir sobre los contenidos tratados en la sub unidad


temática, con la finalidad de elaborar un argumento donde plantee su opinión y
pueda, además, conocer la opinión de sus compañeros(as) de clase en el Foro de la
Unidad que en su Aula dispone para tales efectos. De esta manera no solo logrará dar
a conocer su nuevo aprendizaje en un proceso de autoevaluación, sino y lo más
importante, podrá construir aprendizajes con otros/as.

TUTOR ACADÉMICO

3.2. Medidas estadísticas de forma.

Dentro de la estadística descriptiva es necesario abordar las medidas de forma. En esta sección
abordaremos el coeficiente de asimetría y curtosis.

3.3.1 Asimetría

La asimetría es la medida que nos da una noción sobre la uniformidad de la distribución de los datos
alrededor del punto central. La asimetría se determina alrededor de la media aritmética. A
continuación, mostraremos los principales estados de asimetría.

Distribución Simétrica.

Podemos observar que desde un lado y desde el otro la dos curvas son iguales, si pudiéramos doblar
ambas curvas por el eje de simetría ambas serían iguales. Las observaciones de la media, la mediana
y la moda son iguales o muy similares, los demás valores se dispersan uniformemente en torno a
estas medidas.
Asimetría positivamente sesgada o sesgado a la derecha.

La distribución positiva es aquella que la curva tiene una cola hacia los valores más altos de la
distribución de datos. Esto se genera cuando tenemos valores atípicos altos. En esta asimetría la
media es mayor que la mediana y a su vez estas son mayores que la moda.

Asimetría negativamente sesgada o sesgada a la izquierda.

En relación a la asimetría negativa, esta se produce por lo contario de la distribución anterior, pues
la cola de la curva se extiende hacia los valores más pequeños de los datos. Este estado de asimetría
sucede cuando tenemos valores atípicos bajos en la distribución de datos. En esta asimetría la media
es menor que la mediana y su vez estas dos son menores a moda.
3.3.2 Cálculo de Asimetría.

La estimación de la asimetría se obtiene por medio del coeficiente de Pearson, que se basa en la
relación existente entre la media y la moda en distribuciones unimodales asimétricas.

Coeficiente de Pearson Ca= 3( -Me)


S

As= Desviación estándar.


= media de la muestra Me=Mediana
S=desviación típica
Interpretación del coeficiente de Pearson.

Se sostiene que una distribución es simétrica cuando el coeficiente de asimetría sea igual a cero. La
distribución será asimétrica positiva cuando el coeficiente se asimetría sea positivo X>0. Finalmente,
la distribución será asimétrica negativa cuando el coeficiente de asimetría es negativo X<0.

3.3.3 Coeficiente de Curtosis.

La curtosis es una medida que busca describir el grado de apuntamiento de la curva de los datos, en
otras palabras, la concentración de los datos en la parte central de la distribución de los datos. No
hay un referente, sino se sustenta en la comparación en referencia al comportamiento de la
distribución. Según el grado de apuntamiento existen tres diferentes tipos de curtosis, las que
veremos a continuación.

Distribución Leptocúrtica.

En esta distribución existe un alto grado de apuntamiento de los datos a nivel central

Distribución Mesocúrtica

Existe una distribución uniforme de los datos en todo el recorrido de la variable.


Distribución Platicúrtica.

Existe una baja concentración de los datos a nivel central.

3.3.2 Calculo de Curtosis.

El cálculo de la curtosis se obtiene por medio del coeficiente se asimetría de Fisher Ck. Mediante su
cálculo se busca encontrar la división de los valores observados respeto a media. La fórmula
matemática del coeficiente de Fisher se muestra a continuación:

( Xi- )4
Coeficiente de asimetría de Fisher CK = ---------------- - 3
Ns4

CK= Coeficiente de Fisher


Xi= término del conjunto de datos.
= media de la muestra
= sumatoria
Ns4= N muestra multiplicado por desviación estándar elevado a cuatro.
El coeficiente de curtosis en relación a los diferentes estados de apuntamiento de la distribución es
la siguiente: Para el caso de las distribuciones leptocúrticas el coeficiente de Fisher es mayor que
cero CK>0. Para distribuciones mesocúrticas el coeficiente de Fisher es igual o cercano a cero CK=0.
Finalmente, en el caso de las distribuciones platicúrticas el coeficiente de Fisher es menor que cero
CK< 0.

Relación entre medidas de forma con medidas de tendencia central.


Cuando se trabaja con medidas de forma es necesario saber cómo estas medidas se relacionan con
las medidas de tendencia central, en los distintos estados de asimetría. Cuando tenemos una
distribución asimétrica positiva o hacia la derecha, ésta se produce porque tenemos valores atípicos
muy altos en la distribución de los datos, en este caso la media se mueve hacia esos valores, de esta
forma la media es mayor que la mediana y mayor que la moda. En el caso de la distribución simétrica,
la media, la moda y mediana son iguales o muy parecidas. Por último, para el caso de asimetría
negativa o hacia la izquierda tenemos valores atípicos muy bajos por lo tanto la media va a ser menor
que la mediana y estas son menores que la moda. En la siguiente imagen podemos observar la
relación entre las distribuciones y las medidas de tendencia central.

Como se puede apreciar, la Moda siempre estará en el punto que corresponde a la frecuencia más
alta, es decir la punta de la curva, desde ahí se determinan las posiciones de la media y la mediana.
En las distribuciones asimétricas positivas o hacia la derecha, la media tiende a ir a los valores
positivos altos y la mediana va a estar en medio de las dos medidas de tendencia central. En el caso
de la asimetría negativa o asimétrica hacia la izquierda, la moda se encuentra en el punto más alto
y la media tenderá a ir a los valores atípicos más bajos y a mediana estará en medio de ambas
medidas de tendencia central.
SÍNTESIS DEL TEMA

Estimados estudiantes, hasta aquí hemos tratado y descrito las medidas de


forma. Las medidas de forma permiten mostrar la uniformidad de los datos y el
grado de aglutinamiento en la región central de los datos.

La primera medida de forma corresponde a la asimetría que se basa en


uniformidad de los datos alrededor de un punto central, en este caso de la media
aritmética. En la misma línea la asimetría está relacionada fuertemente con las
medidas de tendencia central.

Para empezar, la primera distribución corresponde a la distribución simétrica,


que tiene una distribución de campana donde las dos curvas resultantes tienen
ejes de simétrica idénticos. En este caso la media, la mediana y la moda son
iguales o muy similares.

Por su parte la distribución positivamente sesgada tiene una cola hacia los
valores más altos de la distribución. En esta asimetría la media es mayor que la
mediana y a su vez esta es mayor que la moda.

En relación a la asimetría negativamente sesgada, la cola de la distribución se


mueve hacia los valores más pequeños de la distribución. En esta asimetría la
media es menor que la mediana y su vez estas dos son menores a la mediana.

Po su parte, la curtosis es una medida que busca describir el grado de


apuntamiento de la curva de los datos, en otras palabras, la concentración de
los datos en la parte central de la distribución de los datos.

Para la curtosis existen tres tipos de distribución, la leptocúrtica que tiene un alto
grado de aglutinamiento de datos a nivel central. La mesocúrtica que muestra
una distribución uniforme de los datos. Y la distribución platicúrtica, que tiene
una baja concentración de datos a nivel central.

Estimado(a) estudiante:

A continuación, lo invito a debatir sobre los contenidos tratados en la sub unidad


temática, con la finalidad de elaborar un argumento donde plantee su opinión y
pueda, además, conocer la opinión de sus compañeros(as) de clase en el Foro de la
Unidad que en su Aula dispone para tales efectos. De esta manera no solo logrará dar
a conocer su nuevo aprendizaje en un proceso de autoevaluación, sino y lo más
importante, podrá construir aprendizajes con otros/as.

TUTOR ACADÉMICO

--------------------------------------------------------------------------------------------------------------------------

Por favor, revise el siguiente enlace para complementar su

estudio:

Curtosis https://www.youtube.com/watch?v=9-nRaVKs5No

Asimetría y curtosis.

http://ri.uaemex.mx/bitstream/handle/20.500.11799/32032/secme-
21228.pdf?sequence=1&isAllowed=y

3.3 Graficando medidas de dispersión e interpretación de las medidas de posición.

Anteriormente estudiamos las medidas de dispersión y las medidas de forma para la distribución de
los datos, pero es necesario mostrar cómo se aplican estas medidas gráficamente, para que
podamos conocer su interpretación, comportamiento y aplicación con distintos datos.

3.3.1 Gráfico de Rango.

Gráfico de rango con valores atípicos.

A continuación, utilizaremos la siguiente tabla con las puntuaciones de distintas personas en una
prueba laboral, para graficar su rango y describir sus implicancias.

Alumnos Puntuación
1 66
2 55
3 65
4 99
5 43
6 13
7 70
8 68
9 55 Tabla n°7: Puntuaciones.
10 64

Fuente: Elaboración propia

De esta forma, en base a la información de la tabla se puede sostener que las calificaciones tienen
un promedio de 59,8. La distribución de los datos tiene un límite máximo de 99 puntos y un límite
mínimo de 13 puntos. Lo que genera que el rango de distribución sea de 86. Por último, podemos
sostener que la mediana tiene un valor de 55. Esto se muestra en el gráfico a continuación:

Gráfico n°1. Rango con valores atípicos.


Gráfico de rango con valores atípicos
120

100

80

60

40

20

0
1 2 3 4 5 6 7 8 9 10

Puntuación Promedio Mediana Límite máximo Límite mínimo

Fuente: Elaboración propia.

En base al grafico anterior, podemos sostener que el rango de los datos es alto en comparación con
el promedio, lo que se debe a la presencia de tres valores atípicos en la distribución, los que son los
números 99, 43 y 13, estos provocan una amplitud en el recorrido del rango. Podemos apreciar
como la calificación con una puntuación de 99 provoca que el límite máximo se aleje cerca de 40
puntos del promedio y que la calificación con una puntuación de 13 puntos provoque que el límite
mínimo se distancie 47 puntos del promedio. Es decir, mediante el grafico podemos constatar la
influencia de los valores atípicos en el cálculo del rango, tal como queda en evidencia. En
consecuencia, debido a los datos atípicos podemos sostener que los datos no tienen una distribución
uniforme por el contario tienen un recorrido elevado.

Gráfico de rango sin valores atípicos.

Siguiendo con el ejemplo anterior, en la tabla a continuación se exponen los mismos datos que se
utilizaron con anterioridad, pero de la cual fueron extraídos los valores 99, 43 y 13, los que fueron
cambiados por valores más cercanos al promedio, para aplicar la medida del rango sin valores
atípicos, con el objetivo de hacer una mejor comparación.

Tabla n°7: Puntuaciones.


Alumnos Puntuación
1 66
2 55
3 65
4 70
5 53
6 68
7 70
8 68
9 55
10 64

En base a la información de la tabla se puede sostener que las calificaciones tienen un promedio de
63,4. La distribución de los datos tiene un límite máximo de 70 puntos y un límite mínimo de 53. Lo
que genera que el rango de distribución sea sólo de 17 puntos. Por último, podemos observar como
la mediana tiene un valor de 65,5.
Gráfico n°2. Rango sin valores atípicos.

Gráfico de rango sin valores atípicos


80

70

60

50

40

30

20

10

0
1 2 3 4 5 6 7 8 9 10

Puntuación Promedio Mediana Límite máximo Límite mínimo

Fuente: Elaboración propia.

En base al grafico anterior, podemos sostener que el rango de los datos baja considerablemente en
relación a los datos anteriores, lo que se debe a la supresión de tres valores atípicos en la
distribución, que fueron los números 99, 43 y 13 cambiados por otros datos más cercanos al
promedio. Podemos apreciar como el recorrido del rango bajo desde 86 a 17, lo que estrechó la
distribución de los datos de forma considerable. Sin los datos atípicos podemos sostener que los
datos tienen una distribución mucho más uniforme, hay un recorrido menos elevado y mucho más
estrecho en comparación al gráfico anterior. Podemos ver como la línea de puntuación de los límites
del rango se mueve más cerca del promedio y la mediana. En el límite inferior, podemos observar la
puntuación n°2 con 55 puntos, la puntuación n° 5 con 53 puntos y puntuación n°9 con 55 puntos.
Mientras que, en límite superior, vemos al punto n°4 con una puntuación de 70 puntos y punto n°7
también con 70 puntos. Lo relevante de esta distribución es que ningún punto es atípico, lo que
explica un recorrido del rango mucho más uniforme que el anterior. Este nos confirma que el rango
es mucho útil cuando se analizan distribuciones sin datos atípicos, ya que el rango es muy sensible
a valores extremos.

3.3.2 Gráfico de Varianza.

La segunda medida de distribución que procederemos a graficar es la varianza, para lo cual


utilizarnos la siguiente lista de datos, que pertenecen al peso de un grupo de personas. Recuerden
que insertamos los datos para que los estudiantes puedan replicar los ejercicios en su proceso de
aprendizaje.
Tabla n°8 Pesos de un grupo de personas.
Personas Peso (Kilos)

1 65

2 83

3 90

4 56

5 53

6 68

7 66

8 74

9 99

10 64

11 75

12 69

13 75

14 76

15 65

16 62

17 71

18 78

19 76

20 100

Fuente: Elaboración propia.


De acuerdo a la información de la tabla se puede sostener que los pesos de las personas tienen en
promedio de 73, 25 kilos. La distribución de los datos tiene un límite máximo de 100 kilos y un límite
mínimo de 53 kilos. Lo que genera que el rango de distribución sea de 47 puntos, un recorrido no
menor para los datos. También podemos calcular la mediana tiene un valor de 72,5. Igualmente
calculamos la varianza que tiene una puntuación de 147,8. Por último, los datos tienen una media
de 73,5 kilos. De acuerdo a esta información se genera el siguiente grafico para observar el
comportamiento de la varianza en torno a los datos:

En base al gráfico anterior, podemos sostener que la mediana y la media mantienen valores similares
como medidas de tendencia central. En la misma línea, podemos observar como el rango tiene un
recorrido de 47 puntos. El límite máximo es de 100 kilos ubicado en el punto n°20, mientras que el
punto más bajo está en la puntuación n°5 con 53 kilos. Los datos en torno a las medidas de tendencia
central se mantienen cercanos al centro de distribución. Lo que es llamativo del gráfico, es el
comportamiento de la varianza puesto que está en un estado muy superior al límite máximo, con
una puntuación de 147,8, por lo tanto, no resulta una herramienta muy eficaz para describir la
distribución de los datos, pues no es una medida representativa de la distribución de los datos. La
sensibilidad de la varianza por los datos atípicos es una de sus debilidades.
Gráfico n°4. Cálculo de la varianza con datos modificados.

Para confirmar la sensibilidad de la varianza con datos atípicos, remplazamos de la lista de datos
anterior los dos valores más altos: los 99 kilos del punto n°9 y los 100 kilos del punto n°10 los que
fueron remplazados por datos que representan 75 kilos. Al generar el cambio es posible observar
como la varianza se acerca a la media y la mediana. Lo evidencia lo vulnerable de la varianza con
valores extremos.

3.3.3 Gráficos de desviación típica o estándar

La tercera medida de distribución que procederemos a graficar es la varianza, para lo cual utilizarnos
la siguiente lista de datos, que pertenece al peso de un grupo de personas.

Tabla n°9: Pesos de un grupo de personas


Personas Peso
1 65
2 83
3 90
4 56
5 53
6 68
7 66
8 74
9 82
10 64
11 75
12 69
13 75
14 76
15 65
16 62
17 71
18 78
19 76
20 65
Fuente: Elaboración propia.

De acuerdo a la información de la tabla se puede sostener que los pesos de las personas tienen en
promedio 70, 7 kilos. Para fijar los límites primero se obtuvo la desviación estándar que fue de 8,9,
la cual fue sumada al promedio, estableciendo un límite superior de 79,6 kilos, mientras que, para
establecer un límite mínimo, al promedio se le resto la desviación estándar con un resultado de 61,7
kilos. Lo que genera que el rango de distribución sea de 18 puntos. De acuerdo a esta información
se genera el siguiente gráfico, que sirve para observar el comportamiento de los datos en torno a
los parámetros generados por la desviación estándar.

Gráfico n°5. Datos dentro de parámetros generados por la desviación estándar.


DESVIACIÓN ESTANDAR
Peso Promedio Limite maximo Limite mínimo.

95

90

85

80

75

70

65

60

55

50
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Fuente: Elaboración propia.

De acuerdo al gráfico anterior, es posible observar como la distribución de los datos dentro de los
límites establecidos por la desviación estándar y el promedio, establece que determinados valores
que toma la variable puedan estar dentro de un rango estable en la distribución. Se puede afirmar
que los pesos entre los límites máximo de 79,6 y mínimo de 61,7 están dentro de lo que establece
nuestras medidas de dispersión, es decir las personas que tengan un peso dentro de estos límites
se comportan como el resto del curso. Mientras que los pesos altos como 90 kilos, 83 kilos y 82 kilos
se encuentran fuera de los paramentos de aceptación establecido por la desviación estándar. Así
mismo los pesos 53 y 56 kilos también se encuentran fuera, pero esta vez por ser muy bajos. En
suma, podemos establecer que la desviación estándar es una herramienta muy útil para establecer
rangos para la distribución para los datos, pues nos permite identificar eficazmente los datos
atípicos. Cabe destacar que, a diferencia de la varianza, la desviación estándar no es tan sensible a
los datos atípicos.

3.3.4 Reconociendo medidas de forma a partir de gráficos.

A continuación, se muestra un gráfico confeccionado en base a una muestra de 100 personas y sus
pesos corporales. Se generó una distribución normal con el fin pudiéramos describir las mediadas
de forma, ya estudiadas.

Gráfico n°6. Distribución de pesos de una muestra.


Distribución de pesos
0,04

0,035

0,03

0,025

0,02

0,015

0,01

0,005

0
0,00 20,00 40,00 60,00 80,00 100,00 120,00 140,00

En base a la información del gráfico anterior, podemos observar una distribución asimetría
positivamente sesgada o sesgado a la derecha, puesto que se puede apreciar que la curva tiene
una cola hacia los valores más altos de la distribución de datos. Como se ve en gráfico tenemos una
serie de valores atípicos altos. En esta asimetría, la media es de 73,6 y la mediana 74,4 que son muy
similares y a su vez son mayores que la moda que tiene una puntuación de 57,9. En consecuencia se
cumplen las puntuaciones de las medidas de tendencia central en torno a este tipo de asimetría.
Ahora, en cuanto a la curtosis, podemos observar que hay una distribución leptocúrtica, pues existe
un alto grado de apuntamiento de los datos a nivel central. De esta forma podemos destacar la
utilidad de las medidas de forma, pues no ayudan a reconocer de eficazmente el comportamiento
de la distribución de datos.

En esta línea, ahora se presenta un gráfico con la distribución de pesos corporales de las mismas 100
personas ocupadas con anterioridad, pero esta vez de forma arbitraria se modificaron algunos datos
para alterar la forma intencional la curva del gráfico.

Gráfico n°7.Distribución de datos con valores modificados.


Distribución de pesos
0,013

0,012

0,011

0,01

0,009

0,008

0,007

0,006

0,005

0,004
0,00 20,00 40,00 60,00 80,00 100,00 120,00 140,00

En base a la información del gráfico podemos observar como la distribución se mantiene de tipo
asimetría positivamente sesgada o sesgado a la derecha, puesto que se puede apreciar que la curva
tiene una cola hacia los valores más altos de la distribución de datos, lo que se profundiza respeto
al gráfico anterior, pues aquí hay datos que sobrepasan los 120 kilos por persona, lo que altera la
cola de distribución de los datos, es decir, existen muchos más valores atípicos altos. En esta
asimetría la media es de 80,29 mayor a la mediana que es 75,73 estas son mayores que la moda que
tiene una puntuación de 57,9. En consecuencia se cumplen las puntuaciones que las medidas de
tendencia central en torno a la asimetría positivamente sesgada. Ahora, en cuanto a la curtosis,
podemos observar diferencias al grafico anterior, pues consideramos que hay una distribución
mesocúrtica, debido a que existe una distribución más uniforme de los datos en todo el recorrido
de la variable.
SÍNTESIS DEL TEMA

Estimados estudiantes, hasta aquí hemos tratado y descrito distintos gráficos


para analizar medidas de distribución y forma. Las medidas de dispersión nos
permiten saber cómo se comportan los datos, en torno a la distribución.
Mientras que las medidas de forma permiten mostrar la uniformidad de los
datos y el grado de aglutinamiento en la región central de los datos.

El primer gráfico buscó representar la medida de dispersión correspondiente al


rango, donde se puedo constatar la influencia que tienen los valores atípicos
en el recorrido del rango. Mientras que el segundo gráfico se sacaron los
valores atípicos y graficamos, como se muestra el rango disminuyo
considerablemente, mantenido los datos casi en su totalidad.

Seguimos graficando, ahora la varianza con una lista de datos, lo que pudimos
observar es que mientras las medidas de tendencia central se acercaban a la
distribución de los datos, la varianza estaba muy por encima. Llegamos a la
conclusión que este se debía a la presencia de datos atípicos, constatando que
la varianza también es una medida de distribución muy sensible a la influencia
de estos datos.

En cuanto al gráfico de la desviación estándar, podemos sostener que esta


medida de dispersión es muy relevante para conocer la distribución de los
datos, pues con su ayuda podemos fijar límites, que nos permitan ver el
comportamiento de los datos. Es decir, los datos que están en el centro y los
atípicos. A diferencia de las medidas de distribución anteriores la desviación
estándar no es tan sensible a los datos desviados.

Por último, mediante la gráfica de dos distribuciones de datos, pudimos


constatar las medidas de forma donde describimos la asimetría de dos
distribuciones, que tenían una asimetría positivamente sesgada a la derecha,
pues sus colas de la distribución apuntaban hacia datos más altos. Pero se
diferenciaban en su curtosis, pues mientras el primer grafico tenía una
distribución leptocúrtica el segundo presentaba una distribución mesocúrtica.

-----------------------------------------------------------------------------------------------------------------------------------

Por favor, revise los siguientes enlaces para complementar su

estudio: Desviación estándar

https://www.youtube.com/watch?v=oZRaDwnpXkY Asimetría

http://www.mat.uda.cl/hsalinas/cursos/2011/2do/clase2.pdf

Estimado(a) estudiante:
A continuación, lo invito a debatir sobre los contenidos tratados en la sub unidad
temática, con la finalidad de elaborar un argumento donde plantee su opinión y
pueda, además, conocer la opinión de sus compañeros(as) de clase en el Foro de la
Unidad que en su Aula dispone para tales efectos. De esta manera no solo logrará dar
a conocer su nuevo aprendizaje en un proceso de autoevaluación, sino y lo más
importante, podrá construir aprendizajes con otros/as.

TUTOR ACADÉMICO
SÍNTESIS DE LA UNIDAD

Estimados estudiantes, al finalizar esta tercera unidad, hemos profundizado


nuestro conocimiento sobre estadística descriptiva, aprendiendo sobre las
medidas de dispersión, medidas de forma y el desarrollo de gráficos para
estas medidas.

En esta unidad hemos conocido y aplicado herramientas que nos permiten


describir las dispersiones una población observada. La primera medida con
la que se trabajó corresponde al rango. El rango es el recorrido que hace
una variable desde su valor mínimo hasta su valor máximo. Así también
hemos destacado que el rango es una medida muy sensible a los valores
atípicos. La desviación media corresponde a la diferencia en términos
absolutos entre cada uno de los valores de la variable y la media aritmética.
La desviación media mide la cantidad media respecto de la cual los valores
de una población o muestra varían. Por su parte, la varianza es una medida
de dispersión centrada en el promedio de las desviaciones cuadráticas de
cada valor respecto a la media. Este tipo de medidas puede ser aplicable
tanto para medir una población y una muestra. Por su parte, la desviación
estándar es la raíz cuadrada de la varianza. Mediante esta medida se busca
responder la pregunta ¿Cuánto se alejan los valores de las variables
respecto al promedio? También sirve para ser aplicada tanto a poblaciones
como a muestras. Por último, la medida de dispersión denominada
coeficiente de variación, se basa en la medición de la proporción de la
desviación estándar respecto a la media es necesario destacar que esta
medida se calcula en términos porcentuales.

Posteriormente conocimos las medidas de forma que nos permiten mostrar


la uniformidad de los datos y el grado de aglutinamiento en la región central
de los datos. La primera medida de forma corresponde a la asimetría que
se basa en uniformidad de los datos alrededor de un punto central. En la
misma línea, la asimetría está relacionada fuertemente con las medidas de
tendencia central. La primera distribución corresponde a la distribución
simétrica, que tiene una distribución de campana donde las dos curvas
resultantes tienen ejes de simétrica idénticos. En este caso la media, la
mediana y la moda son iguales o muy similares. Por su parte la asimetría
positivamente sesgada tiene una cola hacia los valores más altos de la
distribución. En esta asimetría la media es mayor que la mediana y a su vez
esta es mayor que la moda. En relación a la asimetría negativamente
sesgada, la cola de la distribución se mueve hacia los valores más pequeños
de la distribución. En esta asimetría la media es menor que la mediana y su vez estas dos
son menores moda.

La curtosis es una medida que busca describir el grado de apuntamiento de la curva de


los datos, en otras palabras, la concentración de los datos en la parte central de la
distribución de los datos. Para la curtosis existen tres tipos de distribución, la leptocúrtica
que tiene un alto grado de aglutinamiento de datos a nivel central. La mesocúrtica que
muestra una distribución uniforme de los datos. Finalmente, la distribución platicúrtica
que tiene una baja concentración de datos a nivel central.

Finalmente trabajamos con gráficos para representar medidas de distribución y forma.


El primer gráfico buscó representar la medida de dispersión correspondiente al rango,
donde se pudo constatar la influencia que tienen los valores atípicos en el recorrido del
rango. Mientras que el segundo gráfico se sacan los valores atípicos y graficamos, como
muestra el gráfico el rango disminuyó considerablemente, mantenido los datos casi en
su totalidad. Seguimos graficando, esta vez la varianza con una lista de datos, con lo que
pudimos observar es que mientras las medidas de tendencia central se acercaban a la
distribución de los datos, la varianza estaba muy por encima. Llegamos a la conclusión
que esto se debía a la presencia de datos atípicos, constatando que la varianza también
es una medida de distribución muy sensible a la influencia de estos datos. En cuanto al
gráfico de la desviación estándar, podemos sostener que esta medida de dispersión es
muy relevante para conocer la distribución de los datos, pues con su ayuda podemos fijar
límites, que nos permitan ver la distribución de los datos. Es decir, los datos que están en
el centro de los límites y los atípicos. A diferencia de las medidas de distribución
anteriores la desviación estándar no es tan sensible a los datos atípicos. Por último,
mediante la gráfica de dos distribuciones de datos, pudimos constatar las medidas de
forma, donde describimos que los gráficos mostraban distribuciones tenían una asimetría
positivamente sesgada a la derecha, pues la cola de la distribución apuntaba hacia datos
más altos. Pero se diferenciaban en su curtosis, pues mientras el primer grafico tenía una
distribución leptocúrtica el segundo presentaba una distribución mesocúrtica.

ACTIVIDAD DE EVALUACIÓN DE LA UNIDAD 3

Estimado(a) estudiante
La Actividad de Evaluación ha sido diseñada para que usted reflexione en
forma autónoma sobre los aprendizajes que ha alcanzado a través del
estudio de esta Unidad Temática de la asignatura y los visibilice. Dicha
Actividad de Evaluación se encuentra disponible en Plataforma, en la
Unidad que tratamos. Usted puede resolverla en el icono: Actividad de
Evaluación 3.

Por favor revise en detalle las instrucciones de la actividad y proceda a


realizarla.

TUTOR ACADÉMICO

También podría gustarte