Está en la página 1de 90

ESTADÍSTICA DESCRIPTIVA

PARA
VARIABLES CUANTITATIVAS
3

 CUADROS O TABLAS
 GRÁFICOS

DR. ANA MARILÚ LEÓN SILVA


ESQUEMA PARA DATOS
5
CUANTITATIVOS CONTINUOS
CUADRO N°
1

2 1TÍTULO
Marca
N°. De N° de clientes Porcentaje
Intervalos de Porcentaje
clientes acumulado acumulado
clase
[ 𝑳𝒊 - 𝑳𝒔 > 𝑋𝑖 𝒇𝒊 𝑭𝒊 𝒉𝒊 % 𝑯𝒊 %
[ 301 – 351 > 326 𝒇𝟏 𝑭𝟏 𝒉𝟏 % 𝑯𝟏 %
3 [ 351 – 401 > 376 𝒇𝟐 𝑭𝟐 𝒉𝟐 % 𝑯𝟐 %
[ 401 – 451 > 426 𝒇𝟑 𝑭𝟑 𝒉𝟑 % 𝑯𝟑 %
[ 451 – 501 > 476 𝒇𝟒 𝑭𝟒 𝒉𝟒 % 𝑯𝟒 %
[ 501 – 551> 526 𝒇𝟓 𝑭𝟓 𝒉𝟓 % 𝑯𝟓 %
[ 551 – 𝑳𝒔 ] 576 𝒇𝟔 𝑭𝟔 𝒉𝟔 % 𝑯𝟔 %
TOTAL n 100
4 FUENTE
DR. ANA MARILÚ LEÓN SILVA
ESQUEMA PARA DATOS
6 CUANTITATIVOS DISCRETOS
1 CUADRO N°

2 1
TÍTULO

CLASES O
𝒇𝒊 𝑭𝟏 𝒉𝒊 % 𝑯𝒊 %
CATEGORÍA
𝑋1 𝒇𝟏 𝑭𝟏 𝒉𝟏 % 𝑯𝟏 %
3 𝑋2 𝒇𝟐 𝑭𝟐 𝒉𝟐 % 𝑯𝟐 %


𝑋𝐾 𝒇𝑲 𝑭𝑲 𝒉𝑲 % 𝑯𝑲 %
TOTAL n 100

4 FUENTE

DR. ANA MARILÚ LEÓN SILVA


CUADRO N° 1.2
DISTRIBUCIÓN DE LAS OBRAS EN EL DISTRITO DE
7 CASTILLA SEGÚN LA RESISTENCIA A LA
COMPRENSIÓN DEL CONCRETO
Obras
Resistencia 𝑿𝒊 𝑭𝒊 𝒉𝒊 % 𝑯𝒊 %
𝒇𝒊
4.4 - 4.6 4.5 7 7 17.5 17.5
4.6 - 4.8 4.7 9 16 22.5 40.0
4.8 - 5.0 4.9 3 19 7.5 47.5
5.0 - 5.2 5.1 5 24 12.5 60.0
5.2 - 5.4 5.3 8 32 20.0 80.0
5.4 - 5.6 5.5 8 40 20.0 100
Total 40 100.0
Fuente: Departamento de control de calidad

¿Cuántas obras tienen una resistencia a la comprensión menor a 4.8 Kg/𝑐𝑚2 ?

¿Cuántas obras tienen una resistencia a la comprensión como mínimo de 5 Kg/𝑐𝑚2 ?

¿Qué porcentaje de obras tienen una resistencia a la comprensión entre [ 4.6 - 4.8 > Kg/𝑐𝑚2 ?

DR. ANA MARILÚ LEÓN SILVA


8
ESQUEMA PARA GRÁFICOS
1 GRÁFICO N°

2 1TÍTULO

𝒉𝒊 %
𝒇𝒊

VARIABLE EN ESTUDIO

4 FUENTE

DR. ANA MARILÚ LEÓN SILVA


REPRESENTACIONES GRÁFICAS
9
Pueden ser puntos, líneas, áreas y volúmenes

DR. ANA MARILÚ LEÓN SILVA


10

DR. ANA MARILÚ LEÓN SILVA


GRÁFICO DE BARRAS
11
1 GRÁFICO N° 1

2 1INFECCION POR DIA DE COVI-19 EN EL PERÚ AL 19 DE MARZO DEL 2020


.
.
250 234 .
Número de infectados

194
200

150 136
Número de
107 Día
Infectados
3 100 87
58 6 1
50 39
21 29 7 8
8 9 12 13
1
0 8 9
6 7 8 9 10 11 12 13 14 15 16 17 18 19 9 12

Infección por día 10 13


11 21


...
4 FUENTE: Ministerio de Salud - Perú
18 194
DR. ANA MARILÚ LEÓN SILVA
19 234
HISTOGRAMA DE FRECUENCIAS
12
1 GRÁFICO N° 1

2 1GASTO SEMANAL EN PASAJES (SOLES) DE ESTUDIANTES DE ECONOMÍA DE LA


UNP

16

14
NÚMERO DE ESTUDIANTES

12

10 15
3
8
10 10
6
7 7 GASTO 𝑿𝒊 𝒇𝒊 𝑭𝒊 𝒉𝒊 % 𝑯𝒊 %
4

2 2 – 4> 7
0 2 4 6 8 10 12 4 – 6> 10
GASTO (S/ ) EN PASAJES
6 – 8> 15

4 FUENTE: Encuesta realizada en el salón de clase 8 -10> 10


DR. ANA MARILÚ LEÓN SILVA 10 -12] 7
TOTAL 49
Se construye uniendo los puntos
POLÍGONO DE medios del lado superior de las
barras del histograma
13
FRECUENCIAS:
1 GRÁFICO N° 1

2 1Edad en años de personas infectadas el 9 de mayo del 2020

EDAD EN AÑOS 𝑿𝒊 𝒇𝒊
[27 – 32> 29.5 3
29.5 34.5 39.5 44.5
[32 - 37> 34.5 6
4 FUENTE: [37 - 42> 39.5 7
DR. ANA MARILÚ LEÓN SILVA [42 – 47] 44.5 4
TOTAL 20
MEDIDAS DE RESUMEN

Medidas de Posición

V. Cuantitativas Medidas de Dispersión

Medidas de Forma
MEDIDAS ESTADISTICAS

15

DR. ANA MARILÚ LEÓN SILVA


MEDIDAS DE POSICIÓN

Medidas de
tendencia central:
Media, Mediana,
Moda
MEDIDAS DE TENDENCIA
17
CENTRAL

Son medidas estadísticas calculadas con la información de una muestra o una población
Que localizan el centro de la distribución de datos

Si se calcula con la información de una muestra es un valor


estadístico

Si se calcula con la información de una población es un


parámetro
MEDIA ARITMÉTICA
MEDIANA
MODA
DR. ANA MARILÚ LEÓN SILVA
18

DR. ANA MARILÚ LEÓN SILVA


19 DATOS NO AGRUPADOS

Media o Promedio Aritmético:


Es el cociente de todos los valores de una población o muestra y el
número de observaciones con que cuenta la población o muestra

MUESTRA POBLACIÓN

σ 𝐗𝐢 σ 𝐗𝐢
ഥ=
𝐗 𝛍=
𝐧 𝐍

DR. ANA MARILÚ LEÓN SILVA


20 EJEMPLO 1. DATOS NO AGRUPADOS

A CONTINUACIÓN SE PRESENTA LOS RESULTADOS DE LA PRACTICA


CALIFICADA DE 6 ALUMNOS DE LA UNIVERSIDAD NACIONAL de PIURA.
DETERMINAR EL PROMEDIO DE EXAMEN AL REFERIDO CURSO.

ഥ 𝒊 = 𝟏𝟖+𝟏𝟔+𝟏𝟓+𝟏𝟕+𝟗+𝟖 =
𝑿
𝟖𝟑
= 𝟏𝟑, 𝟖
𝟔 𝟔

INTERPRETACIÓN: EL PUNTAJE PROMEDIO DE LOS 6 ESTUDIANTES EN LA


PRACTICA CALIFICADA EN EL CURSO DE ESTADISTICA FUE DE 13, 8.
PUNTOS.

DR. ANA MARILÚ LEÓN SILVA


Mediana:

21 Es el valor que divide a un conjunto de datos previamente ordenados ya sea en


forma ascendente o descendente, en dos partes iguales; de manera que 50% de los
datos es menor a la mediana y el otro 50% es mayor que ésta.
Posición de la mediana

MUESTRA POBLACIÓN
𝒏+1 𝑵+1
𝐖= 𝐖=
2 2

Si n es impar Si n es par

𝑿 𝒏 +𝑿 𝒏
𝒎𝒆 = 𝑿 𝒏+1 2 2 +1
2 𝒎𝒆 =
2
DR. ANA MARILÚ LEÓN SILVA
Si n es impar
22 Encuentre la mediana para el siguiente conjunto de datos
5, 8, 10, 9, 3, 6, 12 n=7
SOLUCIÓN
Primero se ordenan los datos
3, 5, 6, 8, 9, 10, 12

Una vez ordenados, como el número de datos es impar


(7) se busca el que tiene la posición

𝒎𝒆 = 𝑿 𝒏+1 𝒎𝒆 = 𝑿 𝟕+1 𝒎𝒆 = 𝑿 𝟒
2 2

𝑿1 𝑿2 𝑿3 𝑿4 𝑿5 𝑿6 𝑿7
3 5 6 8 9 10 12

𝒎𝒆 =8
DR. ANA MARILÚ LEÓN SILVA
Si n es Par
23 Encuentre la mediana para el siguiente conjunto de datos
5, 8, 10, 9, 3, 6, 12, 2 n=8
SOLUCIÓN
Primero se ordenan los datos
2, 3, 5, 6, 8, 9, 10, 12

Una vez ordenados, como el número de datos es par


(8) se busca el que tiene la posición

𝑿 𝟖 +𝑿 𝟖 𝑿 𝟒 + 𝑿(𝟓) 6+8
+1
𝒎𝒆 = 2 2 𝒎𝒆 = 𝒎𝒆 =
2 2 2

𝑿1 𝑿2 𝑿3 𝑿4 𝑿5 𝑿6 𝑿7 𝑿8
2 3 5 6 8 9 10 12
𝒎𝒆 =7

DR. ANA MARILÚ LEÓN SILVA


24
Ejemplo: Para datos simples

Los siguientes datos se refieren al número de clientes atendidos durante los


últimos 11 días en un supermercados. Calcule e interprete la mediana.

12, 10, 5, 15, 8, 11, 13, 8, 10, 17, 16

Primero se ordenan lo datos:

5, 8, 8, 10, 10 11 12, 13, 15, 16, 17

5 datos menores 5 datos mayores

DR. ANA MARILÚ LEÓN SILVA


25
Ejemplo: Para datos simples o sin agrupar

Los siguientes datos se refieren al número de clientes atendidos durante


los últimos 10 días en un supermercados. Calcule e interprete la mediana.

12, 10, 5, 15, 8, 11, 8, 10, 17, 16

Primero se ordenan lo datos:

5, 8, 8, 10, 10,11, 12, 15, 16, 17

𝟏𝟎+𝟏𝟏
𝑴𝒆 = = 𝟏𝟎. 𝟓
𝟐

MEDIANA

INTERPRETACION: Durante 5 días se atendieron


igual o menos de 10 clientes, y durante 5 días se
DR. ANA MARILÚ LEÓN SILVA atendieron a más de 10 clientes.
26 Moda:

• Valor de la variable que se presenta con mayor frecuencia en la distribución.


• Se denota por 𝒎𝒐 , a veces llamado promedio típico.
• Para un conjunto de datos no agrupados basta con identificar cual es el valor
más repetido.
• En el caso que sean dos o tres valores se dice que hay 2 o 3 modas
(multimodales)
usos
• para datos cualitativos o nominales.
• puede no existir y a veces no es la unica, (antimoda)

DR. ANA MARILÚ LEÓN SILVA


27 DATOS AGRUPADOS

MUESTRA POBLACIÓN

σ 𝑋𝑖 𝑓𝑖 σ Xi 𝑓𝑖
ഥ=
𝐗 𝛍=
𝐧 𝐍

ഥ = ෍ 𝑋𝑖 ℎ𝑖
𝐗

σ 𝑋𝑖 𝑓𝑖
ഥ=
𝐗
𝐧
DR. ANA MARILÚ LEÓN SILVA
EJEMPLO 1.
28
SE TIENE A CONTINUACION, LOS PUNTAJES OBTENIDOS EN UNA EVALUACIÓN DEL
DESEMPEÑO, APLICADO AL PERSONAL TÉCNICO, CALCULE E INTERPRETE SU MEDIA.

DESEMPEÑO MARCA DE CLASE NUMERO DE


(PUNTOS) TECNICOS fi
12-16 14 04

16-20 18 08

20-24 22 15 σ 𝑌𝑖 𝑓𝑖
ഥ=
𝒀
24-28 26 23 n
28-32 30 10

TOTAL ----------- 60

14 4 + 18 8 + 22 15 + 26 23 + 30(10) 1428
𝑌ത = = = 23.8
4 + 8 + 15 + 23 + 10 60

SI SE ELIGE AL AZAR UN TÉCNICO SE ESPERA QUE SU


DR. ANA MARILÚ LEÓN SILVA EVALUACION DE DESEMPEÑO SEA EN PROMEDIO DE 23.8
PUNTOS.
TAREA
29
Cuadro N.º 01
Distribución de las compras (S/.) correspondientes a 40 clientes de la empresa
“Agro Visión” SAC. Piura, Junio - 2020.
Marca N° de
N°. De Porcentaje
Intervalos de clientes Porcentaje
clientes acumulado
clase acumulado
[ soles > Xi fi Fi hi % Hi%
[ 301 – 351 > 326 8 8 20.0 20
[ 351 – 401 > 376 9 17 22.5 42.5
[ 401 – 451 > 426 6 23 15.0 57.5
[ 451 – 501 > 476 7 30 17.5 75.0
[ 501 – 551> 526 4 34 10.0 85.0
[ 551 – 601] 576 6 40 15.0 100
TOTAL 40 100

Fuente: Área de administración de la Empresa.


DR. ANA MARILÚ LEÓN SILVA
RESUMEN
30

DATOS NO DATOS AGRUPADOS


AGRUPADOS

σ 𝐗 𝐢 𝒇𝒊

𝐗= 𝐧
σ 𝐗𝐢
ഥ=
𝐗
𝐧

X = Σ Xi hi

DR. ANA MARILÚ LEÓN SILVA


DATOS AGRUPADOS
31 La Mediana:

CASO I:
CUANDO EL VALOR n/2 NO COINCIDE CON NINGUNA “Fi” (FRECUENCIA ABSOLUTA
ACUMULADA).

𝑛
ES DECIR ; 𝐹𝑖−1 < < 𝐹𝑖
2

FÓRMULA:
𝒏
− 𝑭𝒊−𝟏
𝑴𝒆 = 𝑳𝒊 + 𝟐 𝑨
𝒇𝒊

Donde:
n = número de datos.
Fi -1 = Frecuencia absoluta acumuladas inmediata inferior al valor n/2.
Li = Limite inferior que corresponde al Intervalo Mediano (IME).
A = Amplitud interválica.
DR. ANA MARILÚ LEÓN SILVA
Cuadro Nº 01
32 Distribución de las compras (S/.) correspondientes a 40 clientes de la empresa
“Agro Visión” SAC. Piura, junio - 2020.

PTO. NUM. ACUM. % % ACUM.


COMPRAS EN SOLES CLIENTES
MEDIO CLIENTES CLIENTES CLIENTES

[301 351) 326 8 8 20,0% 20,0%


[351 401) 376 9 17 22,5% 42,5%
[401 451) 426 6 23 15,0% 57,5%
[451 501) 476 7 30 17,5% 75,0%
[501 551) 526 4 34 10,0% 85,0%
[551 601] 576 6 40 15,0% 100,0%
TOTAL 40 100,0%
Fuente: Área de administración de la Empresa.
DR. ANA MARILÚ LEÓN SILVA
PTO. NUM. ACUM.
𝑭𝒊−1 = 17 COMPRAS EN SOLES MEDIO CLIENTES CLIENTES
33 𝒏 40 𝑿𝒊 𝒇𝒊 𝑭𝒊
= = 20
2 2 𝑭𝒊 = 23 [301 351) 326 8 8
[351 401) 376 9 17 𝑭𝒊−𝟏
𝐧
𝐅𝐢−𝟏 < < 𝐅𝐢 𝑰𝑴𝒆 [401 451) 426 6 23 𝑭𝒊
𝟐 𝑴𝒆 = 401 − 451
[451 501) 476 7 30
𝒏
− 𝑭𝒊−𝟏 [501 551) 526 4 34
𝑴𝒆 = 𝑳𝒊 + 𝟐 𝑨
𝒇𝒊 [551 601] 576 6 40
TOTAL 40
𝟒𝟎
−𝟏𝟕
𝑴𝒆 = 𝟒𝟎𝟏 + 𝟐
𝟔
𝟓𝟎 = 426 soles semanales

INTERPRETACIÓN:
50%ሿ 50% El 50% de los clientes efectuaron
compras por un monto menor e
igual a 426 soles y el resto (50%)
DR. ANA MARILÚ LEÓN SILVA
compras mayor a s/. 426
DATOS AGRUPADOS
34 La Mediana:

CASO II:
𝐧
CUANDO EL VALOR COINCIDE CON ALGUNA
𝟐

“Fi”(FRECUENCIA ABSOLUTA ACUMULADA).


ES DECIR ;
𝐧
= 𝐅𝐢
𝟐

FÓRMULA :

𝒏
−𝑭𝒊−𝟏
𝟐
𝑴𝒆 = 𝑳𝒊 + 𝑨
𝒇𝒊

Se realiza el mismo procedimiento


DR. ANA MARILÚ LEÓN SILVA
DATOS AGRUPADOS
35
La Moda:

FÓRMULA:
d1
 Mo = Li + A
d1 +d2
Donde:
Li = Limite inferior que corresponde al IMO (mayor frecuencia).
𝒇𝒊 = Frecuencia absoluta simple más alta
𝒇𝒊+𝟏 , 𝒇𝒊−𝟏 = Frecuencia absoluta simple inmediata superior e inferior a la mayor
frecuencia fi.
𝒅𝟏 = 𝒇𝒊 − 𝒇𝒊−𝟏
𝒅𝟐 = 𝒇𝒊 − 𝒇𝒊+𝟏
A = Amplitud interválica, que corresponde al IMO.

DR. ANA MARILÚ LEÓN SILVA


EJEMPLO: RESPECTO AL EJERCICIO DE LOS 40 NUEVOS
CLIENTES (CUADRO N° 1) COMPRAS PTO.
MEDIO CLIENTES
DETERMINE E INTERPRETE LA MODA EN SOLES
36
SOLUCION [301 351) 326 8 𝒇𝒊−𝟏
𝑭𝒓𝒆𝒄𝒖𝒆𝒏𝒄𝒊𝒂 𝒎á𝒔 𝒂𝒍𝒕𝒂 = 𝟗 L i = 351 A= 50 [351 401) 376 9 𝒇𝒊

𝒅𝟏 = 𝟗 − 𝟖 = 𝟏 [401 451) 426 6 𝒇𝒊+𝟏


𝒅𝟏 = 𝒇𝒊 − 𝒇𝒊−𝟏
𝒅𝟐 = 𝒇𝒊 − 𝒇𝒊+𝟏 [451 501) 476 7
𝒅𝟐 = 𝟗 − 𝟔 = 𝟑
[501 551) 526 4
𝒅1 [551 601] 576 6
𝑴𝒐 = 𝑳𝒊 + 𝑨
𝒅1 + 𝒅2 TOTAL 40
1
𝑴𝒐 = 351 + 𝟓𝟎
1 +3 Mo =363.5
INTERPRETACIÓN: LA MAYORÍA DE LOS CLIENTES REALIZÓ COMPRAS
POR UN MONTO DE 363.5 NUEVOS SOLES.

DR. ANA MARILÚ LEÓN SILVA


RESUMEN
37

Datos agrupados σ 𝑋𝑖 𝑓𝑖
ഥ=
𝐗
𝐧
[ 𝑳𝒊 - 𝑳 𝒔 > 𝑋𝑖 𝒇𝒊 𝒉𝒊 % 𝑯𝒊 %
[𝑳𝒊𝟏 − 𝑳𝒔𝟏 > 𝑋1 𝑓1 𝐹1 ℎ1 % 𝐻1 %
n
[𝑳𝒊𝟐 − 𝑳𝒔𝟐 > 𝑋2 𝑓2 𝐹2 ℎ2 % 𝐻2 %
2 − F i−1
Me = Li + A
fi
[𝑳𝒊𝒊 − 𝑳𝒔𝒊 > 𝑋𝑖 𝑓𝑖 𝐹𝑖 ℎ𝑖 % 𝐻𝑖 %

[𝑳𝒊𝒌 − 𝑳𝒔𝒌 > 𝑋𝑘 𝑓𝑘 𝐹𝑘 ℎ𝑘 % 𝐻𝑘 % d1


TOTAL n 100 Mo = Li + A
d1 + d2

DR. ANA MARILÚ LEÓN SILVA


38 Datos discretos

σ 𝐗 𝐢 𝒇𝒊
ഥ=
𝐗
VARIABLE 𝒇𝒊 𝑭𝟏 𝒉𝒊 % 𝑯𝒊 % 𝐧
𝑋1 𝑓1 𝐹1 ℎ1 % 𝐻1 %
𝒎𝒆 = 𝑿 𝒏+1
𝑋2 𝑓2 𝐹2 ℎ2 % 𝐻2 % 2


𝑋𝐾 𝑓𝐾 𝐹𝐾 ℎ𝐾 % 𝐻𝐾 %
TOTAL n 100 𝑿 𝒏 +𝑿 𝒏
2 2 +1
𝒎𝒆 =
2

Mo = Variable con mayor frecuencia

DR. ANA MARILÚ LEÓN SILVA


MEDIDAS DE FORMA O
DISTRIBUCIÓN
40
RELACION EMPIRICA ENTRE LA MEDIA, MEDIANA Y
MODA

DR. ANA MARILÚ LEÓN SILVA


41 𝑓𝑖 +

+
Mo =363.5 Me = 426 𝑋=
ത 436

DR. ANA MARILÚ LEÓN SILVA


Medidas de tendencia
no central:
Percentiles, cuartiles, deciles
OTRAS MEDIDAS ESTADÍSTICAS

43
𝑄𝑘
➢ ESTADÍGRAFOS DE POSICIÓN QUE DIVIDEN AL TOTAL DE
OBSERVACIONES O DATOS DEBIDAMENTE ORDENADOS EN
FORMA ASCENDENTE O DESCENDENTE EN 4 PARTES
IGUALES.
➢ HAY 3 CUARTILES DENOMINADOS Q1, Q2 Y Q3

25% 25% 25% 25%

DR. ANA MARILÚ LEÓN SILVA


𝑄𝑘
44
PARA DATOS SIN AGRUPAR

𝑬 ⇒ 𝑸𝒌 = 𝑿𝑬
𝑸𝒌 = 𝑿 𝒏+𝟏 𝒔𝒊 ቐ
𝟒 𝒌 𝑬. 𝒅 ⇒ 𝑸𝒌 = 𝑿𝑬 +𝟎. 𝒅 𝑿𝑬+𝟏 − 𝑿𝑬

PARA DATOS AGRUPADOS

𝒏𝒌
− 𝑭𝒊−𝟏
𝑸 𝒌 = 𝑳𝒊 + 𝟒 𝑨
𝒇𝒊

DR. ANA MARILÚ LEÓN SILVA


45
KINTILES
➢ ESTADÍGRAFOS DE POSICIÓN QUE DIVIDEN AL
TOTAL DE LAS OBSERVACIONES O DATOS
DEBIDAMENTE ORDENADOS EN 5 PARTES
IGUALES.
➢ HAY 4 QUINTILES DENOMINADOS K1, K2, K3 Y K4.

DR. ANA MARILÚ LEÓN SILVA


kINTILES 𝐾𝑘
46
PARA DATOS SIN AGRUPAR

𝑬 ⇒ 𝑲𝒌 = 𝑿𝑬
𝒌𝒌 = 𝑿 𝒏+𝟏 𝒔𝒊 ቐ
𝒌
𝟓 𝑬. 𝒅 ⇒ 𝑲𝒌 = 𝑿𝑬 +𝟎. 𝒅 𝑿𝑬+𝟏 − 𝑿𝑬

PARA DATOS AGRUPADOS

𝒏𝒌
− 𝑭𝒊−𝟏
𝒌𝒌 = 𝑳𝒊 + 𝟓 𝑨
𝒇𝒊

DR. ANA MARILÚ LEÓN SILVA


47
DECILES 𝐷𝑘
➢ ESTADÍGRAFOS DE POSICIÓN QUE DIVIDEN AL TOTAL DE
LAS OBSERVACIONES O DATOS DEBIDAMENTE
ORDENADOS EN 10 PARTES IGUALES.
➢ HAY 9 DECILES DENOMINADOS D1, D2,…………..D9.

DR. ANA MARILÚ LEÓN SILVA


48
DECILES 𝐷𝑘
PARA DATOS SIN AGRUPAR

𝑬 ⇒ 𝑫𝒌 = 𝑿𝑬
𝑫𝒌 = 𝑿 𝒏+𝟏 𝒔𝒊 ቐ
𝒌
𝟏𝟎 𝑬. 𝒅 ⇒ 𝑫𝒌 = 𝑿𝑬 +𝟎. 𝒅 𝑿𝑬+𝟏 − 𝑿𝑬

PARA DATOS AGRUPADOS

𝒏𝒌
− 𝑭𝒊−𝟏
𝑫𝒌 = 𝑳𝒊 + 𝟏𝟎 𝑨
𝒇𝒊

DR. ANA MARILÚ LEÓN SILVA


49
PERCENTILES
➢ ESTADÍGRAFOS DE POSICIÓN QUE DIVIDEN AL TOTAL DE
LAS OBSERVACIONES DEBIDAMENTE ORDENADOS EN 100
PARTES IGUALES.
➢ HAY 99 PERCENTILES: P1, P2, P3………………….. P99.

DR. ANA MARILÚ LEÓN SILVA


PERCENTILES 𝑃𝑘
50
PARA DATOS SIN AGRUPAR

𝑬 ⇒ 𝑷𝒌 = 𝑿𝑬
𝑷𝒌 = 𝑿 𝒏+𝟏 𝒔𝒊 ቐ
𝟏𝟎𝟎 𝒌 𝑬. 𝒅 ⇒ 𝑷𝒌 = 𝑿𝑬 +𝟎. 𝒅 𝑿𝑬+𝟏 − 𝑿𝑬

PARA DATOS AGRUPADOS

𝒏𝒌
− 𝑭𝒊−𝟏
𝑷𝒌 = 𝑳𝒊 + 𝟏𝟎𝟎 𝑨
𝒇𝒊

DR. ANA MARILÚ LEÓN SILVA


EN EL SIGUIENTE CUADRO DETERMINE E INTERPRETE: Q1, Q2, Q3, K3, D5, P10, P90,

Cuadro Nº 01
51 Distribución de las compras (S/.) correspondientes a 40 clientes de la empresa “Agro Visión” SAC.
Piura, junio - 2020.

PTO. NUM. ACUM. % % ACUM.


COMPRAS EN SOLES CLIENTES
MEDIO CLIENTES CLIENTES CLIENTES

[301 351) 326 8 8 20,0% 20,0%


[351 401) 376 9 17 22,5% 42,5%
[401 451) 426 6 23 15,0% 57,5%
[451 501) 476 7 30 17,5% 75,0%
[501 551) 526 4 34 10,0% 85,0%
[551 601] 576 6 40 15,0% 100,0%
TOTAL 40 100,0%
Fuente: Área de administración de la Empresa.

DR. ANA MARILÚ LEÓN SILVA


52

Los siguientes datos se refieren al número de


clientes atendidos durante los últimos 11 días en
un supermercados. Calcule e interprete 𝑄2 , 𝑘3 ,
𝐷6 , 𝑃40

12, 10, 5, 15, 8, 11, 13, 8, 10, 17, 16

DR. ANA MARILÚ LEÓN SILVA


MEDIDAS DE DISPERSIÓN o VARIABILIDAD
53

eida de dispersión

DR. ANA MARILÚ LEÓN SILVA


54

DR. ANA MARILÚ LEÓN SILVA


DR. ANA MARILÚ LEÓN SILVA
56 Fórmula

DR. ANA MARILÚ LEÓN SILVA


57 DR. ANA MARILÚ LEÓN SILVA
58

DR. ANA MARILÚ LEÓN SILVA


59

DR. ANA MARILÚ LEÓN SILVA


Medidas de variabilidad
60 Grado de concentración de los datos con respecto al centro de la distribución
Datos sin agrupar

Varianza
σ 𝑋 2
− 𝑛( ത 2
𝑋)
σ(𝑋 −𝜇) 2 σ(𝑋𝑖 − ത 2
𝑋) 𝑆2 =
𝑖
𝜎2 = 𝑆2 = 𝑛−1
𝑁 𝑛−1

Desviación estándar

𝜎= 𝜎2 𝑆= 𝑆2

Coeficiente de variación
𝑆
𝜎 𝐶𝑉 = ∗ 100
𝐶𝑉 = ∗ 100 𝑋ത
𝜇
DR. ANA MARILÚ LEÓN SILVA
Medidas de variabilidad
61 Grado de concentración de los datos con respecto al centro de la distribución
Datos agrupados
Varianza
ത 2 𝑓𝑖 σ 𝑋 2
𝑓𝑖 − 𝑛( ത
𝑋) 2
σ(𝑋𝑖 −𝑋) 𝑆2 =
𝑆2 = 𝑛−1
𝑛−1
Desviación estándar
𝑆= 𝑆2

Coeficiente de variación
𝑆
𝐶𝑉 = ∗ 100
𝑋ത
DR. ANA MARILÚ LEÓN SILVA
EJEMPLO Los tiempos de duración de encendido de 6 tablets
62 seleccionadas al azar por parte del Departamento de Control de Calidad
son: 35 44 30 38 42 30 segundos

Calcula la varianza, así como la desviación estándar y el coeficiente de variación.

Solución: Varianza
ത 2 175.5
𝛴(𝑋𝑖 − 𝑋)
2
𝑆 = = = 35.1 𝑠𝑒𝑔2
𝑛−1 5
𝑿𝒊 ഥ )𝟐
(𝑿𝒊 − 𝑿 Promedio
35 2.25 Desviación estándar
219
44 56.25 𝑋ത = = 36.5
6
S= 𝑆 2 = 35.1 = 5.925 𝑠𝑒𝑔.
30 42.25
38 2.25
Coeficiente de variación
42 30.25
30 42.25 𝑆 5.925
𝐶𝑉% = ത ∗ 100 = ∗ 100 = 16.23 %
219 175.5 𝑋 36.5

DR. ANA MARILÚ LEÓN SILVA


CV% ≤ 30% El comportamiento de los datos es homogéneo
Tarea
63 Gasto semanal (S/) en pasajes de los estudiantes
de Economía

Se pide calcular :
a) Varianza
b) Desviación estándar
c) Coeficiente de Variación

DR. ANA MARILÚ LEÓN SILVA


64
Varianza

σ 𝑋 ത 2
2 − 𝑛(𝑋)
𝑆2 =
𝑛−1

𝑋ത =

σ 𝑋 ത 2
2 − 𝑛(𝑋)
෍ 𝑋2 = 𝑆2 =
𝑛−1
n =

DR. ANA MARILÚ LEÓN SILVA


65 Desviación Estándar

S = Raíz cuadrada de varianza

S = 𝑆2

S = 0.000

La variabilidad de los gastos semanales de los


universitarios respecto al promedio es de …. soles

DR. ANA MARILÚ LEÓN SILVA


66 Coeficiente de variación

S = S
CV= ഥ (100 )
𝑋ത = X

DR. ANA MARILÚ LEÓN SILVA


67 Coeficiente de variación

S
CV= ഥ (100 )
X

Interpretación
CV ≤ 30% El comportamiento de los datos es homogéneo

CV > 30% El comportamiento de los datos es heterogéneo

DR. ANA MARILÚ LEÓN SILVA


Ejemplo
68

Marca A 92.4 88.1 97.2 94.5 89.8 100.8


Marca B 89.5 100.0 100.5 99.3 95.6 97.2

DR. ANA MARILÚ LEÓN SILVA


69 Solución

Embotelladora Embotelladora
Marca A Marca B

Media
Desviación Estándar
Varianza

DR. ANA MARILÚ LEÓN SILVA


70

DR. ANA MARILÚ LEÓN SILVA


71

DR. ANA MARILÚ LEÓN SILVA


72 Asimetría
Fórmula

DR. ANA MARILÚ LEÓN SILVA


73

DR. ANA MARILÚ LEÓN SILVA


74

10.2 9.3 8.9 9.9 8.8 9.6


9.1 9.4 9.1 8.9 9.5 10.5
8.5 9.6 8.0 10.2 8.7 8.5
9.5 10.2 9.5 10.4 8.7 10.3
9.6 8.9 8.1 8 10.0 9.2

DR. ANA MARILÚ LEÓN SILVA


75 Coeficiente de curtosis
Es una medida del grado de apuntamiento , generalmente comparada con el
apuntamiento de la distribución normal
0 ≤ 𝐾𝑢 ≤ 0.5

𝐾𝑢 → 0.25 𝐾𝑢 → 0
𝐾𝑢 → 0.5
(𝐾𝑢 = 0.263 →Distribución normal)

Leptocúrtica Mesocúrtica Platicúrtica


DR. ANA MARILÚ LEÓN SILVA
76 Coeficiente de curtosis

1 𝑄3 −𝑄1
𝐾𝑢 =2 𝐷 −𝐷
9 1

1 𝑃75 −𝑃25
𝐾𝑢 =2 𝑃90 −𝑃10

DR. ANA MARILÚ LEÓN SILVA


Diagrama de caja y bigotes (Box – Plots)
Valor atípico extremo

Valor atípico leve


Se realiza utilizando los tres cuartiles 𝑄1 , 𝑄2 y 𝑄3 𝑙𝑜𝑠 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝑚í𝑛𝑖𝑚𝑜𝑠 𝑦 𝑚á𝑥𝑖𝑚𝑜𝑠

𝑎𝑠í 𝑡𝑎𝑚𝑏𝑖𝑒𝑛 𝑙𝑜𝑠 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝑎𝑡í𝑝𝑖𝑐𝑜𝑠 𝑦 𝑙𝑎 𝑠𝑖𝑚𝑒𝑡𝑟í𝑎 𝑑𝑒 𝑙𝑎 distribución

Es una gráfica que describe características importantes como la dispersión y la simetría

Valores extremos Valores extremos


La siguiente información muestra los gastos semanales (Soles) de los
estudiantes de la Facultad de Economía

60 102 63 110 68 98 74 82
75 65 66 94 69 100 74 92
62 87 150 70 93 85 35

Min 35

Q1 67
Q2 75

Q3 93.5

Máx 150
SPSS
1 60
2 75
3 62
4 102
5 65
6 87
7 63
8 66
9 150
10 110
máximo 11 94
12 70
13 68
14 69
𝑄3 = 93.5
15 93
16 98
17 100
𝑄2 = 75 18 85
19 74
𝑄1 = 67 20 74
21 35
22 82
23 92

mínimo
Min 35
Q1 67
Q2 75
Q3 93.5
Máx 150
Se cometería un error no evaluar los
valores extremos.
“ Falta evaluar los valores atípicos”.
SPSS
Valores atípicos
➢ Es una observación que es numéricamente distante del resto de datos
➢ Si no son tomados en cuenta a la hora de procesar información los resultados
obtenidos podrían ser engañosos
➢ La mediana refleja mejor distribución de estos datos
➢ Entra en escena términos como Rango intercuartílico (RI) y Limites extremos

Rango Intercuartílico

Es la diferencia entre el cuartil tres y el cuartil uno


Valores atípicos

Existen valores atípicos leves y extremos, en ambos casos


existen mínimos y máximos

VALORES ATÍPICOS LEVES VALORES ATÍPICOS EXTREMOS

𝑴𝒊𝒏 = 𝑸𝟏 − 𝟏. 𝟓 ∗ (𝑹𝑰) 𝑴𝒊𝒏 = 𝑸𝟏 − 𝟑 ∗ (𝑹𝑰)

𝑴𝒂𝒙 = 𝑸𝟑 + 𝟏. 𝟓 ∗ (𝑹𝑰) 𝑴𝒊𝒏 = 𝑸𝟑 + 𝟑 ∗ (𝑹𝑰)


La siguiente información muestra los gastos semanales (Soles) de los
estudiantes de la Facultad de Economía

60 102 63 110 68 98 74 82
75 65 66 94 69 100 74 92
62 87 150 70 93 85 35

Min 35

Q1 67 RI= 𝑄3 -𝑄1
Q2 75

Q3 93.5 RI= 93.50 - 67 = 26.5 𝑆𝑜𝑙𝑒𝑠


Máx 150
Valores atípicos Min 35
Q1 67
Como se conocen los valores : Q2 75
Q3 93.5
Máx 150
Se puede calcular

VALORES ATÍPICOS LEVES VALORES ATÍPICOS EXTREMOS

𝑴𝒊𝒏 = 𝟔𝟕 − 𝟏. 𝟓 ∗ 𝟐𝟔. 𝟓 = 𝟐𝟕. 𝟐𝟓 𝑴𝒊𝒏 = 𝟔𝟕 − 𝟑 ∗ 𝟐𝟔. 𝟓 = −𝟏𝟐.5 soles

Máx = 93.5 +𝟏. 𝟓 ∗ 𝟐𝟔. 𝟓 = 𝟏𝟑𝟑. 𝟐𝟓 Máx = 93.5 + 3∗ 𝟐𝟔. 𝟓 = 𝟏𝟕𝟑 𝒔𝒐𝒍𝒆𝒔
Box-plot con la información

60 102 63 110 68 98 74 82
75 65 66 94 69 100 74 92
Valores
62 87 150 70 93 85 35
ordenados
35
VALORES ATÍPICOS LEVES 60
62
Min 35 63

Q1 67
𝐌𝐢𝐧 = 𝟔𝟕 − 𝟏. 𝟓 ∗ 𝟐𝟔. 𝟓 = 𝟐𝟕. 𝟐𝟓 65
66
Q2 75
Máx = 93.5 +𝟏. 𝟓 ∗ 𝟐𝟔. 𝟓 = 𝟏𝟑𝟑. 𝟐𝟓 68
69
Q3 93.5 70
74
Máx 150 74
75
82
85

mínimo 𝑸𝟏 𝑸𝟐 𝑸 𝟑 máximo Valores extremos


87
92
93
94
o 98
100
102
110
150
Considerando valores extremos.
Valores atípicos.

SPSS

Min 35
Q1 67
Q2 75
Q3 93.5
Máx 150
Boxplots

También podría gustarte