Está en la página 1de 21

FACULTAD DE INGENIERIA INDUSTRIAL Y DE SISTEMAS

CURSO: ESTADÍSTICA Y PROBABILIDADES

Docente: Mg. Miguel Cutipa C.


LOGRO DE LA SESIÓN

Al finalizar la sesión el estudiante conoce, calcula y


aplica las medidas de forma para conocer la
distribución de los datos. Conocer la función de un
diagrama de caja.
MEDIDAS DE FORMA
Las medidas de forma permiten conocer si una distribución de frecuencias
tiene características como: simetría, asimetría , nivel de concentración de
datos y nivel de apuntamiento que la clasifiquen en un tipo particular de
distribución. Son medidas de forma la asimetría y la curtosis.
ASIMETRÍA
• Son medidas que permiten conocer la deformación horizontal de la
distribución de los datos. Esto se refiere a ver si existe simetría respecto
un eje vertical.
• En el caso de tener una distribución unimodal, la distribución es simétrica
cuando 𝑥ҧ = 𝑀𝑒 = 𝑀𝑜. Si no existe simetría, se dice que existe
Asimetria.
• Si la dispersión tiende al lado derecho, diremos que se tiene asimetría
positiva, en caso tiende al lado izquierdo diremos que tiene asimetría
negativa.
COEFICIENTE O ÍNDICE DE ASIMETRÍA DE
PEARSON
Definición.- El índice de asimetría de Pearson en frecuencias unimodales es el
número
𝒙−𝑴𝒐

𝑨𝒔 = (primer coeficiente de Pearson)
𝒔
Donde: 𝑥ҧ es la media, 𝑀𝑜 la moda 𝑦 𝑠 la desviación estandar.

Como en distribuciones asimétricas se verifica: 𝑥ҧ − 𝑀𝑜 ≅ 3 𝑥ҧ − 𝑀𝑒 . También se


puede expresar como:
𝟑(ഥ
𝒙−𝑴𝒆)
𝑨𝒔 = (segundo coeficiente de Pearson)
𝒔

NOTA: Para 𝑛 datos tabulados en 𝑘 intervalos un método alternativo es utilizar el


𝑀 /𝑛
índice de asimetría de Fisher: 𝐴𝑠 = 33 , donde 𝑀3= σ𝑛𝑖=1 𝑥𝑖 − 𝑥ҧ 3 𝑜
𝑠
COEFICIENTE O ÍNDICE DE ASIMETRÍA EN
FUNCIÓN DE CUARTILES
• El coeficiente de asimetría cuartilico o de BOWLEY, esta dado por:

• El coeficiente de asimetría en función de los percentiles esta dado por:


𝑷𝟗𝟎 − 𝟐𝑷𝟓𝟎 + 𝑷𝟏𝟎
𝑨𝒔 =
𝑷𝟗𝟎 − 𝑷𝟏𝟎

El análisis de la asimetría es similar que los otros índices.


En casos donde la asimetría no es muy marcada, es preferible usar el índice de
Fisher por momentos.
COEFICIENTE O ÍNDICE DE ASIMETRÍA DE
PEARSON
CURTOSIS
Estas medidas nos brindan información sobre el grado de deformación
vertical de una distribución de frecuencias en comparación con la curva
normal que le corresponde.

Tipos de distribuciones según su grado de curtosis:


CURTOSIS BASADO EN PERCENTILES

La curtosis es calculado
por:
𝑃75 − 𝑃25
𝐾𝑢 =
2(𝑃90 − 𝑃10 )
Donde: P75, P25, P90 y P10
son percentiles
OTRAS CURTOSIS

• Sea la curtosis en percentiles


𝑃75 − 𝑃25
𝐾𝑢 = − 0.5
𝑃90 − 𝑃10

Interpretación: Si la distribución es normal 𝐾𝑢 𝑡𝑖𝑒𝑛𝑑𝑒 𝑎 0, Si 𝐾𝑢 tiende a 0.5 es


leptocúrtica, Si 𝐾𝑢 tiende a -0.5 es platicúrtica.

• Para 𝑛 datos tabulados en 𝑘 intervalos , la curtosis se calcula por:

𝑀4 /𝑛
𝐾𝑢 = − 3, donde: 𝑀4 = σ𝑘𝑖=1 𝑓𝑖 𝑥𝑖 − 𝑥ҧ 4
𝑠4

Interpretación: Si la distribución es normal 𝐾𝑢 = 0, Si 𝐾𝑢 >0 es leptocúrtica, Si 𝐾𝑢 < 0


es platicúrtica.
Ejercicio

• Se han medido las pulsaciones de un equipo de atletas después de una carrera.


Los datos obtenidos son:

Pulsacione [70;75> [75;80> [80;85> [85;90> [90;95> [95;100>


s
N° de 3 3 7 10 12 8
atletas

a. Halle el coeficiente de Pearson


b. Diga que tipo de apuntamiento corresponde a la distribución.
DIAGRAMAS DE CAJA

• La GRAFICA DE CAJA (box plots) es un diagrama que se basa en la mediana, los


cuartiles y los valores extremos. La caja representa el rango intercuartil que
encierra al 50% de los valores y tiene a la 𝑀𝑒 dibujada dentro.
DIAGRAMAS DE CAJA
Es una representación semigráfica para mostrar características principales, como la
forma. Resulta útil si el tamaño de la muestra no es muy grande y los histogramas
no muestran bien su forma. Además se puede de la grafica, se puede observar: La
centralización (se observa la 𝑀𝑒), variabilidad (𝑅𝐼), asimetría y datos atípicos.
DIAGRAMAS DE CAJA
Construcción:
1. Se ordenan los datos en forma ascendente. Luego se obtiene: el ango, y los tres
cuartiles
2. Se dibuja un rectángulo de extremos 𝑃25 𝑦 𝑃75, e indicar la mediana 𝑀𝑒 por un
segmento vertical.
3. Se ubica el intervalo P25 − 1.5RI, P25 + 1.5RI . En este caso el extremo
inferior 𝐿 es el dato mínimo no atípico y el extremo superior 𝑈 es el dato
máximo no atípico. Aquellos datos que están fuera del intervalo son
considerados datos atípicos.
4. Se dibuja segmentos de recta que salen del rectángulo hasta 𝐿 y 𝑈.
5. Finalmente se marca los datos atípicos.

NOTA: Es recomendable usar esta grafica en caso de comparar muestras en la


misma escala.
EJEMPLO.
INDUSTRIA LINO, analiza las ventas de un nuevo aceite FINO,
correspondientes al mes de junio de 2015. Se ha recopilado la información
acerca de las ventas en miles de dólares de una sucursal. Grafique el
diagrama de caja.

3 4 4 4 4 5 5 5 5 6
7 7 7 7 7 9 9 9 10 11
11 11 12 12 12 12 15 15 17 18
EJERCICIOS
• Se tiene las tasas de retorno de dos fondos de inversiones durante 10 años.
Fondo A: 8.3, -6.2, 20.9, -2.7, 33.6, 42.9, 24.4, 5.2, 3.1, 30.05
Fondo B: 12.1, -2.8, 6.4, 12.2, 27.8, 25.3, 18.2, 10.7, -1.4, 11.4
¿Qué fondo es mas estable?

• Se dispone de la distribución de salarios semanales de ciertos trabajadores de Lima


según condición de genero.
a. Compare gráficamente la distribución de salarios según condición de genero.
Interprete.
b. Determine si la condición de genero es un discriminador de los salarios.

Salarios Varones Mujeres


De 80 a 120 36 270
De 121 a 160 42 350
De 161 a 200 51 420
De 201 a 240 66 390
De 241 a 280 57 270
De 281 a 320 48 140
EJERCICIOS
• La siguiente tabla muestra los resultados de la Potencia (en caballos de fuerza)
para los autos de origen Americano y Europeo:
a. Obtenga e interprete los coeficientes de asimetria y curtosis.
b. Si el costo de un auto está en función de la potencia según la relación
𝐶 = 1200 + 50𝑋 + 0.2𝑋 2. Obtenga el costo promedio de un auto de origen
americano.
Estadísticos Americano Japonés
N 249 79
Media 119.61 79.84
Mediana 105.00 75.00
Moda 150 65
Percentiles 10 78.00 60.00
25 88.00 67.00
75 150.00 95.00
90 175.00 100.00
Desviación 39.80 17.82
estandar
EJERCICIOS
• Se tiene los lotes de pedidos de productos por mes y año (mercado nacional e
internacional)
a. Muestre los datos usando un diagrama de cajas. Interprete.
b. ¿En que año el número de lotes de pedidos es más estable?

Año Lotes de pedidos de productos por mes y año (mercado nacional e internacional)
1 2 3 4 5 6 7 8 9 10 11 12
2013 1 16 23 28 50 60 68 139 173 202 486 582
2014 1 17 27 35 51 54 69 137 146 156 469 561

También podría gustarte