Está en la página 1de 14

TEMA DE CLASE: ESCUELA PROFESIONAL DE

MEDIDAS DE CONTABILIDAD
FORMA Y
DIAGRAMA DE
CAJAS

CURSO: ESTADÍSTICA DESCRIPTIVA


DOCENTE: MG. ANNE E. ANICETO
CAPRISTÁN
SEMESTRE
ACADÉMICO
2023A
Asimetría o Sesgo
• Una distribución es simétrica si la mitad izquierda de su distribución es
la imagen de su mitad derecha.
• En las distribuciones simétricas media y mediana coinciden. Si sólo hay
una moda también coincide.
• La asimetría es positiva o negativa en función de a qué lado se
encuentra la cola de la distribución.
• La media tiende a desplazarse hacia las valores extremos (colas).
• Las discrepancias entre las medidas de centralización son indicación de
asimetría.
Apuntamiento o Kurtosis
• Este coeficiente indica la forma que tiene el conjunto de
datos con respecto a las medidas de dispersión.

C.Ap.= K= (𝑄(𝑄
3−𝑄−
3
1) 𝑄
1)
𝐶. 𝐴𝑝 = 𝐾 =2(𝑃90 −𝑃10 )
2(𝑃90 − 𝑃10 )

• Si K= 0.264 La distribución es mesocúrtica


• Si K>0.264 La distribución es lepticúrtica
• Si K<0.264 La distribución es platicúrtica
Apuntamiento o curtosis
Se puede decir también que nos indica el grado de apuntamiento
(aplastamiento) de una distribución con respecto a la distribución
normal o gaussiana. Es adimensional. Según el paquete estadístico
Platicúrtica (aplanada): curtosis < 0 Serán de especial interés las
Mesocúrtica (como la normal): curtosis = 0 mesocúrticas y simétricas
Lepticúrtica (apuntada): curtosis > 0 (parecidas a la normal).

Apuntada como la normal


0.3
0.2
0.1

xs
68 %
0.0

-3 -2 -1 0 1 2 3
Diagrama de cajas o
Box plot

En 1977, John Tukey publica un


método para representar
gráficamente cinco estadísticos
descriptivos.
• BOXPLOT: Interpretación
• En la caja central,el Boxplot contiene el 50% de los
datos.
• La línea interior marca la mediana y los límites de la
caja son el primer y tercer cuartil.
• Si la mediana no equidista de los vértices, entonces
la distribución es asimétrica.
• Los puntos que quedan fuera del diagrama son datos
atípicos (outliers).
Gráficos de cajas
• Otra manera diferente de representar gráficamente una
distribución, aparte del histograma y polígono, es
utilizando un gráfico de cajas o boxplot. Este gráfico
resulta muy útil sobre todo cuando se van a comparar dos
o más distribuciones.
• Un gráfico de este tipo consta de una cajita rectangular
vertical dividida por la mediana y límites iguales a los
percentiles 25 y 75. De esta caja salen dos bigotes.
• Para dibujar los bigotes, hay que primero identificar a los
datos atípicos. Un dato se considera atípico cuando su
valor es inferior a P25 -1.5 RI o superior a P75+1.5 RI,
siendo RI el rango intercuartil.
• Una vez definidos los datos atípicos, se buscan los últimos
valores que NO son atípicos. Estos serán los extremos de
los bigotes.
Diagrama de caja (Boxplot)
Presión sistólica Valores atípicos
superiores (más de 1.5
15.5 RI sobre P75)

Valor superior que no


llega a ser atípico
14.5 (adyacente superior) 1.5 RI

P75
Caja que contiene
13.5 al 50 % casos de Mediana RI = P75-P25
los datos centrales
P25
12.5 Valor inferior que no 1.5 RI
llega a ser atípico
(adyacente inferior)
Valores atípicos
11.5 inferiores (más de 1.5
RI bajo P25)
¿ Qué nos dicen las
cajas la compararlas ?
• Para una interpretación de las cajas en dos o
más distribuciones uno debe ver primero la
tendencia que se refleja en la mediana;
mientras más alta sea ella su tendencia en esa
distribución será mayor. Luego hay que ver el
largo de las cajas. La caja más larga (de mayor
RI) es la que tiene más dispersión. Es
importante ver también los datos atípicos
ubicados fuera de los bigotes y finalmente la
asimetría.
Mg. Anne Aniceto C. 11
Puntuación estandarizada Z
x x1, x2, … , xn de una variable x y
Dados los valores
dada la media y desviación estándar S de estos
datos, se denomina una puntuación estandarizada
zi, de una observación xi de x, a:
xi − x
zi =
S
Estas puntuaciones o también llamados puntajes z son
adimensionales y resultan útiles para comparar dos o
más valores bajo distribuciones distintas ya que
independientemente de la distribución considerada
ellas siempre tendrán media de 0 y desviación estándar
1.
Ejemplo
• Supongamos que tenemos dos grupos de 20 y
30 sujetos a los cuales se les ha tomado una
prueba de inteligencia obteniendose en el
primer grupo un CI medio de 95 con una
desviación estándar de 4; mientras que en el
segundo grupo un CI medio de 105 con una
desviación estándar de 5. Si un sujeto del
primer grupo tiene un CI de 99 y otro del
segundo grupo de 106, entonces ¿ se puede
decir que el segundo está mejor posicionado
en su grupo que el primero en cuanto a su
medida de inteligencia ?.
Ejemplo:
Se quiere dar una beca a uno de dos estudiantes de sistemas educativos diferentes y
se asignará al que tenga mejor expediente académico:
– El estudiante A tiene una calificación de 8 en un sistema donde la calificación
de los alumnos tiene una media de 6 y una desviación estándar de un punto.
– El estudiante B tiene una calificación de 80 en un sistema donde la calificación
de los alumnos tiene una media de 70 con una desviación estándar de 10.

–No podemos comparar


directamente los 8 puntos de A
frente a los 80 de B, pero si con
una distribución de referencia de
media 0 y varianza 1.

–Como zA > zB, A está mejor


posicionado en su grupo que B y
por tanto A es mejor candidato xA − x A 8 − 6
zA = = =2
para la beca. SA 1
xB − x B 80 − 70
zB = = =1
SB 10

También podría gustarte