Está en la página 1de 17

UNIVERSIDAD CENTROCCIDENTAL

“LISANDRO ALVARADO”
DECANATO DE CIENCIAS Y TECNOLOGÍAS
DEPARTAMENTO DE INVESTIGACIÓN DE OPERACIONES
BARQUISIMETO

Ing. Greiza Lucena


¿Por qué se necesitan las medidas que estudiaremos?

Las medidas de tendencia central no son suficientes para describir un conjunto


de valores de alguna variable estadística.

En primer lugar se necesita una medida del grado de dispersión o variabilidad


con respecto al centro con la finalidad de ampliar la descripción de los datos o de
comparar dos o más series de datos.

En segundo lugar se necesita una medida del grado de asimetría o deformación


en ambos lados del centro de una serie de datos, con el fin de describir la
distribución de los datos. Esta medida se denomina índice de asimetría.

En tercer lugar se necesita una medida que nos permita comparar el


apuntamiento o curtosis de distribuciones simétricas con respecto a la
Distribución simétrica Normal. Esta medida se denomina índice de apuntamiento
o curtosis.
Definición 1.

Rango o recorrido de una variable:


El Rango de una serie de datos, es la diferencia entre sus valores
máximo y mínimo.

R  X max  X min
Es una medida fácil de calcular, pero muy inestable ya que depende de los
valores extremos. Su valor puede cambiar grandemente si se añade o elimina
un solo dato. Muchas veces no da una verdadera idea de la dispersión de los
datos.
Definición 2.

Rango Intercuartil:
El RI en un conjunto de datos, es la diferencia entre los cuartiles
tercero y primero.
RI  Q3  Q1
Es una medida que excluye el 25% más alto y el 25% más bajo,
dando un rango dentro del cual se encuentra el 50% central de los datos y a
diferencia del rango total no se encuentra afectada por valores extremos.
Si RI es pequeño describe alta uniformidad o poca variabilidad en los
datos respecto a los valores centrales.
Ejemplo 1.

Imaginemos que en una distribución de frecuencias de 100 ingresos


quincenales se encuentran los cuartiles Q1 = $62 y Q3 = $70, entonces,
RI = $70 - &62 = $8. Este valor indica que el 50% de los ingresos quincenales
de los empleados varía dentro del valor de $8.

Definición 3.
Varianza:
Es el valor que cuantifica el grado de dispersión o de variación de los valores
de una variable cuantitativa con respecto a su media aritmética. La varianza
poblacional se denotara por: y la de una muestra se denotara con: S 2
Por lo tanto, la varianza se define como la media aritmética de los cuadrados
de las diferencias de los datos con respecto a su media aritmética.
Desviación estándar (s):
Es la raíz cuadrada positiva de la varianza s  s2 . Es el
índice de dispersión o variabilidad más común y de mayor confianza.

Cálculo de la varianza:
1. Varianza para datos no tabulados:
n N
 x  x   xi  x   
n

 xi
N
2 2 2 2
i i

s 2  i 1  i 1  x2   i 1
2
 i 1  2
n 1 n N N

2. Varianza para datos tabulados:

 f i xi  x  
n n
2
f i xi2
s  2 i 1
 i 1
x 2

n 1 n
3. Varianza de datos por intervalos de clases:

 f x  x
K

fx
K
2 2
i mi i mi
s 
2 i 1
 i 1
x 2

n 1 n
Definición 5.
Coeficiente de variación:
Es una medida de dispersión relativa (libre de unidades de
medidas), que se define como la desviación estándar dividido por la
media aritmética.
s
C.V  ó en %
x
El C.V se utiliza para comparar la variabilidad de dos o más datos
que tengan medias iguales o diferentes o que tengan unidades de
medidas iguales o diferentes.
Ejemplo 2.
Se tienen dos secciones A1 y A2 de Matemática I respectivamente. La
desviación estándar para las dos secciones es de 14 puntos. La media
aritmética para A1 es 16 y la media para A2 es 11.
¿Se puede concluir que las dos secciones tienen la misma variabilidad?

Recuerda que esta medida indica la dispersión respecto a la media aritmética.


Ejemplo 3.
A partir de las siguientes edades de 25 alumnos de una universidad “X”.
a) Encuentre la desviación estándar y la varianza.

16 16 15 15 14 14 14 13 12
12 12 12 12 17 17 17 18 18
18 18 18 16 14 13 15

b) ¿Existe mucha variabilidad?


c) Calcule las medidas de dispersión vistas anteriormente.
Medidas de Asimetría o de Sesgo
Una distribución de datos puede ser simétrica, asimétrica o sesgada. Es simétrica
cuando queda dividida en dos partes iguales a ambos extremos de la media
aritmética.

Es asimétrica cuando los datos se concentran en forma desproporcionada a


ambos lados de la media aritmética.

La asimetría o sesgo, es un coeficiente que indica en que medida y hacia que


extremo del promedio de los datos se concentra el mayor porcentaje de
datos.

El coeficiente o índice de asimetría se puede calcular de la siguiente forma:

3X  Me
1. Formula de Pearson:

As 
s
Medidas de Asimetría o de Sesgo
El coeficiente o índice de asimetría se puede calcular de la siguiente forma:

2. Formula usando percentiles:

X P90  2 X p50  X p10


As 
X P90  X p10
Interpretación:
 Si As = 0 la distribución de los datos es simétrica.
 Si As > 0 la distribución es asimétrica positiva o sesgada a la derecha.
 Si As < 0 la distribución es asimétrica negativa o sesgada a la izquierda.

Simétrica Asimetría positiva Asimetría negativa


Curtosis
Coeficiente de curtosis:
Es un estadístico que señala el mayor o menor grado de elevación o
aplastamiento de una distribución, en su centro, comparándola con la distribución
normal. Por lo tanto, la curtosis indica el grado de dispersión o concentración de
los datos alrededor de la mediana en cualquier distribución.
Tipos de curtosis:

1. Cuando la distribución tiene mayor punta en el centro que una curva normal
se denomina Leptocúrtica.
2. Cuando la distribución sea más aplastada que la normal se denomina
Platicúrtica.
3. Cuando la distribución de los datos tenga la misma forma que la normal, se
denomina Mesocúrtica.
Curtosis
La curtosis se puede calcular de la siguiente forma:

Formula usando percentiles:


X P75  X p 25
Cu 

2 X P90  X p10 
Esta medida sólo puede usarse cuando la distribución de los datos es
simétrica, si existe asimetría en los datos su uso carece de sentido.

Una vez encontrado el valor de la curtosis, se compara con el valor


correspondiente al de una distribución normal (0.263).

Interpretación:
 Si Cu < 0.263 la distribución es Leptocúrtica.
 Si Cu > 0.263 la distribución es Platicúrtica.
 Si Cu = 0.263 la distribución es Mesocúrtica.
 Es un gráfico representativo de las distribuciones de un conjunto de
datos en cuya construcción se usan cinco medidas descriptivas de
los mismos, a saber: mediana, primer cuartil, tercer cuartil, valor
máximo y valor mínimo.

 Esta presentación visual, asocia las cinco medidas que suelen


trabajarse de forma individual. Presenta al mismo tiempo,
información sobre la tendencia central, dispersión y simetría de
los datos de estudio. Además, permite identificar con claridad y de
forma individual, observaciones que se alejan de manera poco
usual del resto de los datos. A estas observaciones se les conoce
como valores atípicos.

 Por su facilidad de construcción e interpretación, permite también


comparar a la vez varios grupos de datos sin perder información ni
saturarse de ella. Esto ha sido particularmente importante a la hora
de escoger esta representación para mostrar la opinión de los
estudiantes respecto a la actuación docente a través de las
diversas preguntas del instrumento utilizado.
1.-Límite superior: Es el extremo superior del bigote. Las opiniones por
encima de este límite se consideran atípicas.

2.-Tercer cuartil (Q3): Por debajo de este valor se encentran como


máximo el 75% de las opiniones de los estudiantes.

3.-Mediana: Coincide con el segundo cuartil. Divide a la distribución en


dos partes iguales. De este modo, 50% de las observaciones están
por debajo de la mediana y 50% está por encima.

4.-Primer cuartil (Q1): Por debajo de este valor se encuentra como


máximo el 25% de las opiniones de los estudiantes

5.-Límite inferior: Es el extremo inferior del bigote. Las opiniones por


debajo de este valor se consideran atípicas.

6 .-Valores atípicos: Opiniones que están apartadas del cuerpo


principal de datos. Pueden representar efectos de causas extrañas,
opiniones extremas o en el caso de la tabulación manual, errores de
medición o registro.

7.-Media aritmética: Originalmente no forma parte del boxplot, sin


embargo, se consideró su inclusión para dar una idea del puntaje
general obtenido por pregunta.

También podría gustarte