Documentos de Académico
Documentos de Profesional
Documentos de Cultura
INTRODUCCIÓN A LA UNIDAD
ACTIVIDAD INICIAL
Las medidas de tendencia central como hemos estudiado son muy útiles para describir el
comportamiento de los datos en torno al centro de la distribución. Quizás las medidas de tendencia
central y en especial el promedio sean los conceptos que más tenemos interiorizados, pues la
mayoría de la información que recibimos se codifica bajo estos parámetros. Ejemplos de esta
situación son: el producto interno bruto (PIB) per cápita, el promedio de los sueldos, el promedio
de las notas, etc… Pero sucede que hay datos que se esconden detrás de los promedios, como
acabamos de señalar detrás de la medición en torno al promedio hay realidades subyacentes que
es necesario abordar. Para esta situación están las medidas de dispersión, con las que podremos
conocer el comportamiento de los datos, que no son reconocidos por las medidas de tendencia
central. Además, también aprenderemos sobre las medidas de forma, que sirven para mostrar la
representación que toman las distribuciones de los datos.
2. ¿Considera usted importante aprender sobre el uso de medidas dispersión para el análisis
de datos?
3. ¿Usted qué conoce acerca de las medidas de forma en estadística descriptiva y el uso que
les puede otorgar?
Estimado(a) estudiante:
1.
Tómese su tiempo para el estudio y acomódese en un lugar que le sea grato y
sin distractores.
2. Deténgase en aquellos contenidos que le sean más difíciles de entender.
Vuelva atrás toda vez que lo necesite.
3. Apóyese en el material complementario para el estudio, el cual le
permitirá profundizar y obtener mayor información sobre un tema en
particular.
4. Si se le presenta alguna duda que no pueda despejar en este documento,
diríjase al Foro de la Unidad y plantéemela.
¡Bienvenido(a) al estudio!
TUTOR ACADÉMICO
Como vimos en la unidad anterior las medidas de tendencia central son útiles para señalar cómo los
datos interactúan con el centro de la distribución, pero sólo nos otorgan una aproximación parcial
acerca de la distribución de los datos. En este contexto, las medidas de dispersión juegan un rol
central para analizar la distribución de los datos, pues nos permiten saber e informar cuan alejadas
están del centro del centro de distribución nuestros valores(variables). La variabilidad, es decir, que
tan uniforme son los datos.
3.1.1 Rango
De esta forma, toda variable que pueda ser ordenada a partir de un grado de jerarquía, puede ser
estudiada en base al rango, como los son las variables ordinales, de intervalo y de razón.
Como recordaran en las unidades anteriores trabajamos con variables ordinales, que se
caracterizaban por ser susceptibles de ser ponderadas. Con ellas se puede establecer un orden
ascendente o descendentes entre los valores.
Sigamos el siguiente ejemplo: En un estudio, una empresa pregunta por el nivel de satisfacción de
sus clientes con un producto X ¿Cuál es el nivel de satisfacción que usted como usuario siente con
este nuevo producto? Codificado en las siguientes alternativas:
a) Muy insatisfecho
b) Insatisfecho
c) Ni satisfecho ni insatisfecho
d) Satisfecho
e) Muy satisfecho
2 Insatisfecho 8 17
3 Ni satisfecho ni insatisfecho 16 33
4 Satisfecho 18 51
5 Muy satisfecho 17 68
Total 68
Fuente: Elaboración propia.
La codificación enuncia que hay una jerarquización de las cinco posibles respuestas. De esta forma
remplazamos la fórmula Rango= Xmax -Xmin
Restamos el valor máximo que es 5 (muy satisfecho) por el valor mínimo que es 1 (muy insatisfecho),
lo que nos da un recorrido de 4. Es decir, el rango de esta variable es 4.
Siguiendo con los ejemplos, ahora utilizaremos una variable de razón para calcular el rango. Para lo
cual se empleará una serie de calificaciones obtenidas por distintos estudiantes, como se muestra
en la siguiente tabla:
Sin embargo, la desventaja del rango al usar un valor mínimo y un valor máximo es que su valor
(resultado) se ve afectado por valores atípicos. Es decir, el rango como medida de cálculo presenta
un alta sensibilidad a datos desviados. Lo que ejemplificaremos con los datos de la siguiente tabla:
Tabla n°3: Edades de una familia
Edades Frecuencia absoluta Frecuencia
acumulada
3 1 1
25 1 2
26 1 3
27 1 4
32 1 5
33 1 6
Fuente: Elaboración propia.
Como se muestra en la tabla n°3 las edades de una familia van de 3 años a 33 años, no obstante,
podemos observar como la edad mínima es un dato atípico, puesto que la mayoría de las edades se
concentran entre los 25 y 33 años. En consecuencia, calcularemos el rango con y sin el valor atípico.
Calculo con valor atípico: 33-3=30. El rango con valor atípico es 30.
Paso siguiente es saber cuánto se alejan las edades respecto al promedio, es decir, se resta el valor
de cada uno de los valores por la media aritmética, recordar que los resultados de esta operación
deben estar en valores absolutos:
Tómenos el primer número que es el 9, le restamos el promedio, lo que sería [9-11,2]= [-2,2]=2,2
Esto quiere decir que a edad de 9 años está desviada en 2,2 años respecto al promedio. Ahora
realicemos el mismo ejercicio con cada una de las edades, lo que nos daría la siguiente tabla:
Tabla n°4: Edades de un grupo de personas.
Edad Media Edad-Media Edad-Media en Valor absoluto
9 11,2 -2,2 2,2
10 11,2 -1,2 1,2
11 11,2 -0,2 0,2
12 11,2 0,8 0,8
14 11,2 2,8 2,8
Fuente: Elaboración propia.
Siguiendo con el ejercicio, para encontrar la desviación media necesitamos encontrar la suma del
promedio de todas las desviaciones y dividirla por 5: 2,2+1,2+0,2+0,8+2,8/5=1,44. Por lo que la
desviación media es: D =1,44.
A continuación, trabajaremos la desviación media con datos agrupados en intervalos para lo cual
emplearemos la siguiente tabla:
Para empezar, es necesario señalar que la tabla con la que trabajaremos pertenece a un grupo de
personas divididas en intervalos según sus edades. En la columna F podemos observar que 3
personas tienen entre 30 y 35 años, 5 personas tienen entre 35 y 40 años, 6 personas tienen entre
40 y 45 años, 8 personas tienen entre 45 y 50 años, 6 personas tienen entre 50 y 55 años y finalmente
2 personas tienen entre 55 y 60 años. En total, nuestro conjunto de datos tiene 30 personas.
X F X*F
32,5 3 97,5
37,5 5 187,5
42,5 6 255
47,5 8 380
52,5 6 315
57,5 2 115
30 1350
La suma total de la columna X*F es 1350, es decir, la suma total de las edades de las personas de
nuestro conjunto de datos corresponde a 1350 años.
Para obtener el promedio de las edades de las personas del conjunto de datos, es necesario dividir
la suma total de las edades que es 1350 por el número de datos que es 30. Entonces el promedio de
las edades del conjunto de datos se obtiene al dividir 1350/30= 45. El promedio de edad de las
personas del conjunto de datos es 45 años.
[X- ]
12,5
7,5
2,5
2,5
7,5
12,5
La primera celda seria 32,5 menos el promedio que como vimos es 45, lo que da un total de -12,5,
pero debemos recordar que los resultados de la fila [X- ] están en números absolutos por lo que
sería 12,5. Sigamos con cada celda sucesivamente, 37,5 menos 45= 7,5; 42,5 menos 45= 2,5 ;47,5
menos 45= 2,5; 52,5 menos 45= 7,5; 57,5 menos 45= 12,5.
n
[Xi- ]*F 180
i=1
Desviación Media D= ---------------------------= ----------------- = 6
N 30
3.2.3 Varianza
n
(Xi- )2
i=1
Varianza poblacional Ơ =2
------------------------------
N
n
(Xi- )2
i=1
Varianza de la muestra S 2
= --------------------------------------
N-1
El primer paso, es obtener el promedio de las notas de los estudiantes. Como recordaran en la
unidad pasada vimos que el promedio se obtiene sumando el total de los valores de la variable
divididas por el número de por el número total de variables.
xi
Media aritmética = --------------
N
En este caso, la suma sería de 7+6+6+5+7+5= 36 (calificaciones obtenidas por los alumnos), cuyo
resultado debe ser dividido por 6 (número de alumnos). Esto tiene como resultado: 6.
Varianza = 1+0+0+1+1+1
6
De esta forma tendríamos que dividir 4 por 6, lo que nos da 0,66666667
Al igual que en el ejercicio anterior, el primer paso es obtener el promedio sería la sumatoria de las
calificaciones divididas por el número de estudiantes. Lo que en términos numéricos seria 32(suma
de calificaciones) dividido por 10(número de estudiantes), lo que resulta 3,2. Entonces nuestro
promedio es 3,2.
Paso siguiente, ordenamos las calificaciones de forma ascendente. Además, agregamos dos
columnas a nuestra tabla como lo pide la fórmula de la varianza. Una columna que muestra cada
uno de los datos trabajados menos el promedio (Xn- ) y una segunda comuna que eleve al cuadrado
cada una de las restas entre cada uno de los datos y el promedio (Xn- )2.
Recuerde que todos los resultados de la columna (Xn- )2 son positivos, porque cualquier número
elevado al cuadrado da positivo. Ahora debemos sumar todos los datos de la columna (Xn- )2
(Xn- )2
4,84
1,44
1,44
0,04
0,04
0,04
0,64
0,64
3,24
3,24
15,6
(Xn- )2 15,6
2
Varianza Ơ = ----------------------------= ----------- = 1,56
N 10
Ơ = Desviación estándar.
Xi= término del conjunto de datos.
= media de la muestra
= sumatoria
N= tamaño de la muestra
√= raíz aplicada
n
√ (Xn- )2
i=1
Desviación típica de la muestra S = --------------------------------------
N-1
2 2 -1,2 1,44
3 2 -1,2 1,44
4 3 -0,2 0,04
5 3 -0,2 0,04
6 3 -0,2 0,04
7 4 0,8 0,64
8 4 0,8 0,64
9 5 1,8 3,24
10 5 1,8 3,24
Fuente: Elaboración propia.
Entonces para sacar la desviación estándar de estos datos que vimos en el ejemplo anterior,
debemos tomar la varianza ya obtenida que es: 1,56 y aplicar raíz cuadrada. Lo que nos da que como
resultado 1,24 para la desviación estándar.
Cabe destacar que esta medida se basa en términos porcentuales. Además, este coeficiente debe
ser calculado para variables positivas, asociándose a variables en escala de razón. La notación
matemática es CV, a continuación, se muestra la fórmula:
S
Coeficiente de variación CV= ---- -----
-- * 100
Siguiendo con el mismo ejemplo anterior, para lo cual insertamos la tabla que hemos ocupado a lo
largo del ejemplo, donde ya sabemos que la desviación estándar es 1,24 y que el promedio es 3,2.
1,24
Coeficiente de variación CV= ----------- * 100 = 38,75.
3,2
Es decir, con los valores del ejemplo utilizado, existe un coeficiente de variación de 38,75 por ciento.
-----------------------------------------------------------------------------------------------------------------------------------
---
Por favor, revise el siguiente enlace para complementar su estudio:
Medidas de dispersión
https://www.jica.go.jp/project/elsalvador/004/materials/ku57p
q00003uf5za-att/workbook_JS3_08.pdf
Medidas de dispersión
https://www.youtube.com/watch?v=2it1aEsA0Yk
Estimado(a) estudiante:
TUTOR ACADÉMICO
Dentro de la estadística descriptiva es necesario abordar las medidas de forma. En esta sección
abordaremos el coeficiente de asimetría y curtosis.
3.3.1 Asimetría
La asimetría es la medida que nos da una noción sobre la uniformidad de la distribución de los datos
alrededor del punto central. La asimetría se determina alrededor de la media aritmética. A
continuación, mostraremos los principales estados de asimetría.
Distribución Simétrica.
Podemos observar que desde un lado y desde el otro la dos curvas son iguales, si pudiéramos doblar
ambas curvas por el eje de simetría ambas serían iguales. Las observaciones de la media, la mediana
y la moda son iguales o muy similares, los demás valores se dispersan uniformemente en torno a
estas medidas.
Asimetría positivamente sesgada o sesgado a la derecha.
La distribución positiva es aquella que la curva tiene una cola hacia los valores más altos de la
distribución de datos. Esto se genera cuando tenemos valores atípicos altos. En esta asimetría la
media es mayor que la mediana y a su vez estas son mayores que la moda.
En relación a la asimetría negativa, esta se produce por lo contario de la distribución anterior, pues
la cola de la curva se extiende hacia los valores más pequeños de los datos. Este estado de asimetría
sucede cuando tenemos valores atípicos bajos en la distribución de datos. En esta asimetría la media
es menor que la mediana y su vez estas dos son menores a moda.
3.3.2 Cálculo de Asimetría.
La estimación de la asimetría se obtiene por medio del coeficiente de Pearson, que se basa en la
relación existente entre la media y la moda en distribuciones unimodales asimétricas.
Se sostiene que una distribución es simétrica cuando el coeficiente de asimetría sea igual a cero. La
distribución será asimétrica positiva cuando el coeficiente se asimetría sea positivo X>0. Finalmente,
la distribución será asimétrica negativa cuando el coeficiente de asimetría es negativo X<0.
La curtosis es una medida que busca describir el grado de apuntamiento de la curva de los datos, en
otras palabras, la concentración de los datos en la parte central de la distribución de los datos. No
hay un referente, sino se sustenta en la comparación en referencia al comportamiento de la
distribución. Según el grado de apuntamiento existen tres diferentes tipos de curtosis, las que
veremos a continuación.
Distribución Leptocúrtica.
En esta distribución existe un alto grado de apuntamiento de los datos a nivel central
Distribución Mesocúrtica
El cálculo de la curtosis se obtiene por medio del coeficiente se asimetría de Fisher Ck. Mediante su
cálculo se busca encontrar la división de los valores observados respeto a media. La fórmula
matemática del coeficiente de Fisher se muestra a continuación:
( Xi- )4
Coeficiente de asimetría de Fisher CK = ---------------- - 3
Ns4
Como se puede apreciar, la Moda siempre estará en el punto que corresponde a la frecuencia más
alta, es decir la punta de la curva, desde ahí se determinan las posiciones de la media y la mediana.
En las distribuciones asimétricas positivas o hacia la derecha, la media tiende a ir a los valores
positivos altos y la mediana va a estar en medio de las dos medidas de tendencia central. En el caso
de la asimetría negativa o asimétrica hacia la izquierda, la moda se encuentra en el punto más alto
y la media tenderá a ir a los valores atípicos más bajos y a mediana estará en medio de ambas
medidas de tendencia central.
SÍNTESIS DEL TEMA
Por su parte la distribución positivamente sesgada tiene una cola hacia los
valores más altos de la distribución. En esta asimetría la media es mayor que la
mediana y a su vez esta es mayor que la moda.
Para la curtosis existen tres tipos de distribución, la leptocúrtica que tiene un alto
grado de aglutinamiento de datos a nivel central. La mesocúrtica que muestra
una distribución uniforme de los datos. Y la distribución platicúrtica, que tiene
una baja concentración de datos a nivel central.
Estimado(a) estudiante:
TUTOR ACADÉMICO
--------------------------------------------------------------------------------------------------------------------------
estudio:
Curtosis https://www.youtube.com/watch?v=9-nRaVKs5No
Asimetría y curtosis.
http://ri.uaemex.mx/bitstream/handle/20.500.11799/32032/secme-
21228.pdf?sequence=1&isAllowed=y
Anteriormente estudiamos las medidas de dispersión y las medidas de forma para la distribución de
los datos, pero es necesario mostrar cómo se aplican estas medidas gráficamente, para que
podamos conocer su interpretación, comportamiento y aplicación con distintos datos.
A continuación, utilizaremos la siguiente tabla con las puntuaciones de distintas personas en una
prueba laboral, para graficar su rango y describir sus implicancias.
Alumnos Puntuación
1 66
2 55
3 65
4 99
5 43
6 13
7 70
8 68
9 55 Tabla n°7: Puntuaciones.
10 64
De esta forma, en base a la información de la tabla se puede sostener que las calificaciones tienen
un promedio de 59,8. La distribución de los datos tiene un límite máximo de 99 puntos y un límite
mínimo de 13 puntos. Lo que genera que el rango de distribución sea de 86. Por último, podemos
sostener que la mediana tiene un valor de 55. Esto se muestra en el gráfico a continuación:
100
80
60
40
20
0
1 2 3 4 5 6 7 8 9 10
En base al grafico anterior, podemos sostener que el rango de los datos es alto en comparación con
el promedio, lo que se debe a la presencia de tres valores atípicos en la distribución, los que son los
números 99, 43 y 13, estos provocan una amplitud en el recorrido del rango. Podemos apreciar
como la calificación con una puntuación de 99 provoca que el límite máximo se aleje cerca de 40
puntos del promedio y que la calificación con una puntuación de 13 puntos provoque que el límite
mínimo se distancie 47 puntos del promedio. Es decir, mediante el grafico podemos constatar la
influencia de los valores atípicos en el cálculo del rango, tal como queda en evidencia. En
consecuencia, debido a los datos atípicos podemos sostener que los datos no tienen una distribución
uniforme por el contario tienen un recorrido elevado.
Siguiendo con el ejemplo anterior, en la tabla a continuación se exponen los mismos datos que se
utilizaron con anterioridad, pero de la cual fueron extraídos los valores 99, 43 y 13, los que fueron
cambiados por valores más cercanos al promedio, para aplicar la medida del rango sin valores
atípicos, con el objetivo de hacer una mejor comparación.
En base a la información de la tabla se puede sostener que las calificaciones tienen un promedio de
63,4. La distribución de los datos tiene un límite máximo de 70 puntos y un límite mínimo de 53. Lo
que genera que el rango de distribución sea sólo de 17 puntos. Por último, podemos observar como
la mediana tiene un valor de 65,5.
Gráfico n°2. Rango sin valores atípicos.
70
60
50
40
30
20
10
0
1 2 3 4 5 6 7 8 9 10
En base al grafico anterior, podemos sostener que el rango de los datos baja considerablemente en
relación a los datos anteriores, lo que se debe a la supresión de tres valores atípicos en la
distribución, que fueron los números 99, 43 y 13 cambiados por otros datos más cercanos al
promedio. Podemos apreciar como el recorrido del rango bajo desde 86 a 17, lo que estrechó la
distribución de los datos de forma considerable. Sin los datos atípicos podemos sostener que los
datos tienen una distribución mucho más uniforme, hay un recorrido menos elevado y mucho más
estrecho en comparación al gráfico anterior. Podemos ver como la línea de puntuación de los límites
del rango se mueve más cerca del promedio y la mediana. En el límite inferior, podemos observar la
puntuación n°2 con 55 puntos, la puntuación n° 5 con 53 puntos y puntuación n°9 con 55 puntos.
Mientras que, en límite superior, vemos al punto n°4 con una puntuación de 70 puntos y punto n°7
también con 70 puntos. Lo relevante de esta distribución es que ningún punto es atípico, lo que
explica un recorrido del rango mucho más uniforme que el anterior. Este nos confirma que el rango
es mucho útil cuando se analizan distribuciones sin datos atípicos, ya que el rango es muy sensible
a valores extremos.
1 65
2 83
3 90
4 56
5 53
6 68
7 66
8 74
9 99
10 64
11 75
12 69
13 75
14 76
15 65
16 62
17 71
18 78
19 76
20 100
En base al gráfico anterior, podemos sostener que la mediana y la media mantienen valores similares
como medidas de tendencia central. En la misma línea, podemos observar como el rango tiene un
recorrido de 47 puntos. El límite máximo es de 100 kilos ubicado en el punto n°20, mientras que el
punto más bajo está en la puntuación n°5 con 53 kilos. Los datos en torno a las medidas de tendencia
central se mantienen cercanos al centro de distribución. Lo que es llamativo del gráfico, es el
comportamiento de la varianza puesto que está en un estado muy superior al límite máximo, con
una puntuación de 147,8, por lo tanto, no resulta una herramienta muy eficaz para describir la
distribución de los datos, pues no es una medida representativa de la distribución de los datos. La
sensibilidad de la varianza por los datos atípicos es una de sus debilidades.
Gráfico n°4. Cálculo de la varianza con datos modificados.
Para confirmar la sensibilidad de la varianza con datos atípicos, remplazamos de la lista de datos
anterior los dos valores más altos: los 99 kilos del punto n°9 y los 100 kilos del punto n°10 los que
fueron remplazados por datos que representan 75 kilos. Al generar el cambio es posible observar
como la varianza se acerca a la media y la mediana. Lo evidencia lo vulnerable de la varianza con
valores extremos.
La tercera medida de distribución que procederemos a graficar es la varianza, para lo cual utilizarnos
la siguiente lista de datos, que pertenece al peso de un grupo de personas.
De acuerdo a la información de la tabla se puede sostener que los pesos de las personas tienen en
promedio 70, 7 kilos. Para fijar los límites primero se obtuvo la desviación estándar que fue de 8,9,
la cual fue sumada al promedio, estableciendo un límite superior de 79,6 kilos, mientras que, para
establecer un límite mínimo, al promedio se le resto la desviación estándar con un resultado de 61,7
kilos. Lo que genera que el rango de distribución sea de 18 puntos. De acuerdo a esta información
se genera el siguiente gráfico, que sirve para observar el comportamiento de los datos en torno a
los parámetros generados por la desviación estándar.
95
90
85
80
75
70
65
60
55
50
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
De acuerdo al gráfico anterior, es posible observar como la distribución de los datos dentro de los
límites establecidos por la desviación estándar y el promedio, establece que determinados valores
que toma la variable puedan estar dentro de un rango estable en la distribución. Se puede afirmar
que los pesos entre los límites máximo de 79,6 y mínimo de 61,7 están dentro de lo que establece
nuestras medidas de dispersión, es decir las personas que tengan un peso dentro de estos límites
se comportan como el resto del curso. Mientras que los pesos altos como 90 kilos, 83 kilos y 82 kilos
se encuentran fuera de los paramentos de aceptación establecido por la desviación estándar. Así
mismo los pesos 53 y 56 kilos también se encuentran fuera, pero esta vez por ser muy bajos. En
suma, podemos establecer que la desviación estándar es una herramienta muy útil para establecer
rangos para la distribución para los datos, pues nos permite identificar eficazmente los datos
atípicos. Cabe destacar que, a diferencia de la varianza, la desviación estándar no es tan sensible a
los datos atípicos.
A continuación, se muestra un gráfico confeccionado en base a una muestra de 100 personas y sus
pesos corporales. Se generó una distribución normal con el fin pudiéramos describir las mediadas
de forma, ya estudiadas.
0,035
0,03
0,025
0,02
0,015
0,01
0,005
0
0,00 20,00 40,00 60,00 80,00 100,00 120,00 140,00
En base a la información del gráfico anterior, podemos observar una distribución asimetría
positivamente sesgada o sesgado a la derecha, puesto que se puede apreciar que la curva tiene
una cola hacia los valores más altos de la distribución de datos. Como se ve en gráfico tenemos una
serie de valores atípicos altos. En esta asimetría, la media es de 73,6 y la mediana 74,4 que son muy
similares y a su vez son mayores que la moda que tiene una puntuación de 57,9. En consecuencia se
cumplen las puntuaciones de las medidas de tendencia central en torno a este tipo de asimetría.
Ahora, en cuanto a la curtosis, podemos observar que hay una distribución leptocúrtica, pues existe
un alto grado de apuntamiento de los datos a nivel central. De esta forma podemos destacar la
utilidad de las medidas de forma, pues no ayudan a reconocer de eficazmente el comportamiento
de la distribución de datos.
En esta línea, ahora se presenta un gráfico con la distribución de pesos corporales de las mismas 100
personas ocupadas con anterioridad, pero esta vez de forma arbitraria se modificaron algunos datos
para alterar la forma intencional la curva del gráfico.
0,012
0,011
0,01
0,009
0,008
0,007
0,006
0,005
0,004
0,00 20,00 40,00 60,00 80,00 100,00 120,00 140,00
En base a la información del gráfico podemos observar como la distribución se mantiene de tipo
asimetría positivamente sesgada o sesgado a la derecha, puesto que se puede apreciar que la curva
tiene una cola hacia los valores más altos de la distribución de datos, lo que se profundiza respeto
al gráfico anterior, pues aquí hay datos que sobrepasan los 120 kilos por persona, lo que altera la
cola de distribución de los datos, es decir, existen muchos más valores atípicos altos. En esta
asimetría la media es de 80,29 mayor a la mediana que es 75,73 estas son mayores que la moda que
tiene una puntuación de 57,9. En consecuencia se cumplen las puntuaciones que las medidas de
tendencia central en torno a la asimetría positivamente sesgada. Ahora, en cuanto a la curtosis,
podemos observar diferencias al grafico anterior, pues consideramos que hay una distribución
mesocúrtica, debido a que existe una distribución más uniforme de los datos en todo el recorrido
de la variable.
SÍNTESIS DEL TEMA
Seguimos graficando, ahora la varianza con una lista de datos, lo que pudimos
observar es que mientras las medidas de tendencia central se acercaban a la
distribución de los datos, la varianza estaba muy por encima. Llegamos a la
conclusión que este se debía a la presencia de datos atípicos, constatando que
la varianza también es una medida de distribución muy sensible a la influencia
de estos datos.
-----------------------------------------------------------------------------------------------------------------------------------
https://www.youtube.com/watch?v=oZRaDwnpXkY Asimetría
http://www.mat.uda.cl/hsalinas/cursos/2011/2do/clase2.pdf
Estimado(a) estudiante:
A continuación, lo invito a debatir sobre los contenidos tratados en la sub unidad
temática, con la finalidad de elaborar un argumento donde plantee su opinión y
pueda, además, conocer la opinión de sus compañeros(as) de clase en el Foro de la
Unidad que en su Aula dispone para tales efectos. De esta manera no solo logrará dar
a conocer su nuevo aprendizaje en un proceso de autoevaluación, sino y lo más
importante, podrá construir aprendizajes con otros/as.
TUTOR ACADÉMICO
SÍNTESIS DE LA UNIDAD
Estimado(a) estudiante
La Actividad de Evaluación ha sido diseñada para que usted reflexione en
forma autónoma sobre los aprendizajes que ha alcanzado a través del
estudio de esta Unidad Temática de la asignatura y los visibilice. Dicha
Actividad de Evaluación se encuentra disponible en Plataforma, en la
Unidad que tratamos. Usted puede resolverla en el icono: Actividad de
Evaluación 3.
TUTOR ACADÉMICO