Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Diapositivas Variables
Diapositivas Variables
PARA
VARIABLES CUANTITATIVAS
3
CUADROS O TABLAS
GRÁFICOS
2 1TÍTULO
Marca
N°. De N° de clientes Porcentaje
Intervalos de Porcentaje
clientes acumulado acumulado
clase
[ 𝑳𝒊 - 𝑳𝒔 > 𝑋𝑖 𝒇𝒊 𝑭𝒊 𝒉𝒊 % 𝑯𝒊 %
[ 301 – 351 > 326 𝒇𝟏 𝑭𝟏 𝒉𝟏 % 𝑯𝟏 %
3 [ 351 – 401 > 376 𝒇𝟐 𝑭𝟐 𝒉𝟐 % 𝑯𝟐 %
[ 401 – 451 > 426 𝒇𝟑 𝑭𝟑 𝒉𝟑 % 𝑯𝟑 %
[ 451 – 501 > 476 𝒇𝟒 𝑭𝟒 𝒉𝟒 % 𝑯𝟒 %
[ 501 – 551> 526 𝒇𝟓 𝑭𝟓 𝒉𝟓 % 𝑯𝟓 %
[ 551 – 𝑳𝒔 ] 576 𝒇𝟔 𝑭𝟔 𝒉𝟔 % 𝑯𝟔 %
TOTAL n 100
4 FUENTE
DR. ANA MARILÚ LEÓN SILVA
ESQUEMA PARA DATOS
6 CUANTITATIVOS DISCRETOS
1 CUADRO N°
2 1
TÍTULO
CLASES O
𝒇𝒊 𝑭𝟏 𝒉𝒊 % 𝑯𝒊 %
CATEGORÍA
𝑋1 𝒇𝟏 𝑭𝟏 𝒉𝟏 % 𝑯𝟏 %
3 𝑋2 𝒇𝟐 𝑭𝟐 𝒉𝟐 % 𝑯𝟐 %
…
…
𝑋𝐾 𝒇𝑲 𝑭𝑲 𝒉𝑲 % 𝑯𝑲 %
TOTAL n 100
4 FUENTE
¿Qué porcentaje de obras tienen una resistencia a la comprensión entre [ 4.6 - 4.8 > Kg/𝑐𝑚2 ?
2 1TÍTULO
𝒉𝒊 %
𝒇𝒊
VARIABLE EN ESTUDIO
4 FUENTE
194
200
150 136
Número de
107 Día
Infectados
3 100 87
58 6 1
50 39
21 29 7 8
8 9 12 13
1
0 8 9
6 7 8 9 10 11 12 13 14 15 16 17 18 19 9 12
…
...
4 FUENTE: Ministerio de Salud - Perú
18 194
DR. ANA MARILÚ LEÓN SILVA
19 234
HISTOGRAMA DE FRECUENCIAS
12
1 GRÁFICO N° 1
16
14
NÚMERO DE ESTUDIANTES
12
10 15
3
8
10 10
6
7 7 GASTO 𝑿𝒊 𝒇𝒊 𝑭𝒊 𝒉𝒊 % 𝑯𝒊 %
4
2 2 – 4> 7
0 2 4 6 8 10 12 4 – 6> 10
GASTO (S/ ) EN PASAJES
6 – 8> 15
EDAD EN AÑOS 𝑿𝒊 𝒇𝒊
[27 – 32> 29.5 3
29.5 34.5 39.5 44.5
[32 - 37> 34.5 6
4 FUENTE: [37 - 42> 39.5 7
DR. ANA MARILÚ LEÓN SILVA [42 – 47] 44.5 4
TOTAL 20
MEDIDAS DE RESUMEN
Medidas de Posición
Medidas de Forma
MEDIDAS ESTADISTICAS
15
Medidas de
tendencia central:
Media, Mediana,
Moda
MEDIDAS DE TENDENCIA
17
CENTRAL
Son medidas estadísticas calculadas con la información de una muestra o una población
Que localizan el centro de la distribución de datos
MUESTRA POBLACIÓN
σ 𝐗𝐢 σ 𝐗𝐢
ഥ=
𝐗 𝛍=
𝐧 𝐍
ഥ 𝒊 = 𝟏𝟖+𝟏𝟔+𝟏𝟓+𝟏𝟕+𝟗+𝟖 =
𝑿
𝟖𝟑
= 𝟏𝟑, 𝟖
𝟔 𝟔
MUESTRA POBLACIÓN
𝒏+1 𝑵+1
𝐖= 𝐖=
2 2
Si n es impar Si n es par
𝑿 𝒏 +𝑿 𝒏
𝒎𝒆 = 𝑿 𝒏+1 2 2 +1
2 𝒎𝒆 =
2
DR. ANA MARILÚ LEÓN SILVA
Si n es impar
22 Encuentre la mediana para el siguiente conjunto de datos
5, 8, 10, 9, 3, 6, 12 n=7
SOLUCIÓN
Primero se ordenan los datos
3, 5, 6, 8, 9, 10, 12
𝒎𝒆 = 𝑿 𝒏+1 𝒎𝒆 = 𝑿 𝟕+1 𝒎𝒆 = 𝑿 𝟒
2 2
𝑿1 𝑿2 𝑿3 𝑿4 𝑿5 𝑿6 𝑿7
3 5 6 8 9 10 12
𝒎𝒆 =8
DR. ANA MARILÚ LEÓN SILVA
Si n es Par
23 Encuentre la mediana para el siguiente conjunto de datos
5, 8, 10, 9, 3, 6, 12, 2 n=8
SOLUCIÓN
Primero se ordenan los datos
2, 3, 5, 6, 8, 9, 10, 12
𝑿 𝟖 +𝑿 𝟖 𝑿 𝟒 + 𝑿(𝟓) 6+8
+1
𝒎𝒆 = 2 2 𝒎𝒆 = 𝒎𝒆 =
2 2 2
𝑿1 𝑿2 𝑿3 𝑿4 𝑿5 𝑿6 𝑿7 𝑿8
2 3 5 6 8 9 10 12
𝒎𝒆 =7
𝟏𝟎+𝟏𝟏
𝑴𝒆 = = 𝟏𝟎. 𝟓
𝟐
MEDIANA
MUESTRA POBLACIÓN
σ 𝑋𝑖 𝑓𝑖 σ Xi 𝑓𝑖
ഥ=
𝐗 𝛍=
𝐧 𝐍
ഥ = 𝑋𝑖 ℎ𝑖
𝐗
σ 𝑋𝑖 𝑓𝑖
ഥ=
𝐗
𝐧
DR. ANA MARILÚ LEÓN SILVA
EJEMPLO 1.
28
SE TIENE A CONTINUACION, LOS PUNTAJES OBTENIDOS EN UNA EVALUACIÓN DEL
DESEMPEÑO, APLICADO AL PERSONAL TÉCNICO, CALCULE E INTERPRETE SU MEDIA.
16-20 18 08
20-24 22 15 σ 𝑌𝑖 𝑓𝑖
ഥ=
𝒀
24-28 26 23 n
28-32 30 10
TOTAL ----------- 60
14 4 + 18 8 + 22 15 + 26 23 + 30(10) 1428
𝑌ത = = = 23.8
4 + 8 + 15 + 23 + 10 60
σ 𝐗 𝐢 𝒇𝒊
ഥ
𝐗= 𝐧
σ 𝐗𝐢
ഥ=
𝐗
𝐧
ഥ
X = Σ Xi hi
CASO I:
CUANDO EL VALOR n/2 NO COINCIDE CON NINGUNA “Fi” (FRECUENCIA ABSOLUTA
ACUMULADA).
𝑛
ES DECIR ; 𝐹𝑖−1 < < 𝐹𝑖
2
FÓRMULA:
𝒏
− 𝑭𝒊−𝟏
𝑴𝒆 = 𝑳𝒊 + 𝟐 𝑨
𝒇𝒊
Donde:
n = número de datos.
Fi -1 = Frecuencia absoluta acumuladas inmediata inferior al valor n/2.
Li = Limite inferior que corresponde al Intervalo Mediano (IME).
A = Amplitud interválica.
DR. ANA MARILÚ LEÓN SILVA
Cuadro Nº 01
32 Distribución de las compras (S/.) correspondientes a 40 clientes de la empresa
“Agro Visión” SAC. Piura, junio - 2020.
INTERPRETACIÓN:
50%ሿ 50% El 50% de los clientes efectuaron
compras por un monto menor e
igual a 426 soles y el resto (50%)
DR. ANA MARILÚ LEÓN SILVA
compras mayor a s/. 426
DATOS AGRUPADOS
34 La Mediana:
CASO II:
𝐧
CUANDO EL VALOR COINCIDE CON ALGUNA
𝟐
FÓRMULA :
𝒏
−𝑭𝒊−𝟏
𝟐
𝑴𝒆 = 𝑳𝒊 + 𝑨
𝒇𝒊
FÓRMULA:
d1
Mo = Li + A
d1 +d2
Donde:
Li = Limite inferior que corresponde al IMO (mayor frecuencia).
𝒇𝒊 = Frecuencia absoluta simple más alta
𝒇𝒊+𝟏 , 𝒇𝒊−𝟏 = Frecuencia absoluta simple inmediata superior e inferior a la mayor
frecuencia fi.
𝒅𝟏 = 𝒇𝒊 − 𝒇𝒊−𝟏
𝒅𝟐 = 𝒇𝒊 − 𝒇𝒊+𝟏
A = Amplitud interválica, que corresponde al IMO.
Datos agrupados σ 𝑋𝑖 𝑓𝑖
ഥ=
𝐗
𝐧
[ 𝑳𝒊 - 𝑳 𝒔 > 𝑋𝑖 𝒇𝒊 𝒉𝒊 % 𝑯𝒊 %
[𝑳𝒊𝟏 − 𝑳𝒔𝟏 > 𝑋1 𝑓1 𝐹1 ℎ1 % 𝐻1 %
n
[𝑳𝒊𝟐 − 𝑳𝒔𝟐 > 𝑋2 𝑓2 𝐹2 ℎ2 % 𝐻2 %
2 − F i−1
Me = Li + A
fi
[𝑳𝒊𝒊 − 𝑳𝒔𝒊 > 𝑋𝑖 𝑓𝑖 𝐹𝑖 ℎ𝑖 % 𝐻𝑖 %
σ 𝐗 𝐢 𝒇𝒊
ഥ=
𝐗
VARIABLE 𝒇𝒊 𝑭𝟏 𝒉𝒊 % 𝑯𝒊 % 𝐧
𝑋1 𝑓1 𝐹1 ℎ1 % 𝐻1 %
𝒎𝒆 = 𝑿 𝒏+1
𝑋2 𝑓2 𝐹2 ℎ2 % 𝐻2 % 2
…
…
𝑋𝐾 𝑓𝐾 𝐹𝐾 ℎ𝐾 % 𝐻𝐾 %
TOTAL n 100 𝑿 𝒏 +𝑿 𝒏
2 2 +1
𝒎𝒆 =
2
+
Mo =363.5 Me = 426 𝑋=
ത 436
43
𝑄𝑘
➢ ESTADÍGRAFOS DE POSICIÓN QUE DIVIDEN AL TOTAL DE
OBSERVACIONES O DATOS DEBIDAMENTE ORDENADOS EN
FORMA ASCENDENTE O DESCENDENTE EN 4 PARTES
IGUALES.
➢ HAY 3 CUARTILES DENOMINADOS Q1, Q2 Y Q3
𝑬 ⇒ 𝑸𝒌 = 𝑿𝑬
𝑸𝒌 = 𝑿 𝒏+𝟏 𝒔𝒊 ቐ
𝟒 𝒌 𝑬. 𝒅 ⇒ 𝑸𝒌 = 𝑿𝑬 +𝟎. 𝒅 𝑿𝑬+𝟏 − 𝑿𝑬
𝒏𝒌
− 𝑭𝒊−𝟏
𝑸 𝒌 = 𝑳𝒊 + 𝟒 𝑨
𝒇𝒊
𝑬 ⇒ 𝑲𝒌 = 𝑿𝑬
𝒌𝒌 = 𝑿 𝒏+𝟏 𝒔𝒊 ቐ
𝒌
𝟓 𝑬. 𝒅 ⇒ 𝑲𝒌 = 𝑿𝑬 +𝟎. 𝒅 𝑿𝑬+𝟏 − 𝑿𝑬
𝒏𝒌
− 𝑭𝒊−𝟏
𝒌𝒌 = 𝑳𝒊 + 𝟓 𝑨
𝒇𝒊
𝑬 ⇒ 𝑫𝒌 = 𝑿𝑬
𝑫𝒌 = 𝑿 𝒏+𝟏 𝒔𝒊 ቐ
𝒌
𝟏𝟎 𝑬. 𝒅 ⇒ 𝑫𝒌 = 𝑿𝑬 +𝟎. 𝒅 𝑿𝑬+𝟏 − 𝑿𝑬
𝒏𝒌
− 𝑭𝒊−𝟏
𝑫𝒌 = 𝑳𝒊 + 𝟏𝟎 𝑨
𝒇𝒊
𝑬 ⇒ 𝑷𝒌 = 𝑿𝑬
𝑷𝒌 = 𝑿 𝒏+𝟏 𝒔𝒊 ቐ
𝟏𝟎𝟎 𝒌 𝑬. 𝒅 ⇒ 𝑷𝒌 = 𝑿𝑬 +𝟎. 𝒅 𝑿𝑬+𝟏 − 𝑿𝑬
𝒏𝒌
− 𝑭𝒊−𝟏
𝑷𝒌 = 𝑳𝒊 + 𝟏𝟎𝟎 𝑨
𝒇𝒊
Cuadro Nº 01
51 Distribución de las compras (S/.) correspondientes a 40 clientes de la empresa “Agro Visión” SAC.
Piura, junio - 2020.
eida de dispersión
Varianza
σ 𝑋 2
− 𝑛( ത 2
𝑋)
σ(𝑋 −𝜇) 2 σ(𝑋𝑖 − ത 2
𝑋) 𝑆2 =
𝑖
𝜎2 = 𝑆2 = 𝑛−1
𝑁 𝑛−1
Desviación estándar
𝜎= 𝜎2 𝑆= 𝑆2
Coeficiente de variación
𝑆
𝜎 𝐶𝑉 = ∗ 100
𝐶𝑉 = ∗ 100 𝑋ത
𝜇
DR. ANA MARILÚ LEÓN SILVA
Medidas de variabilidad
61 Grado de concentración de los datos con respecto al centro de la distribución
Datos agrupados
Varianza
ത 2 𝑓𝑖 σ 𝑋 2
𝑓𝑖 − 𝑛( ത
𝑋) 2
σ(𝑋𝑖 −𝑋) 𝑆2 =
𝑆2 = 𝑛−1
𝑛−1
Desviación estándar
𝑆= 𝑆2
Coeficiente de variación
𝑆
𝐶𝑉 = ∗ 100
𝑋ത
DR. ANA MARILÚ LEÓN SILVA
EJEMPLO Los tiempos de duración de encendido de 6 tablets
62 seleccionadas al azar por parte del Departamento de Control de Calidad
son: 35 44 30 38 42 30 segundos
Solución: Varianza
ത 2 175.5
𝛴(𝑋𝑖 − 𝑋)
2
𝑆 = = = 35.1 𝑠𝑒𝑔2
𝑛−1 5
𝑿𝒊 ഥ )𝟐
(𝑿𝒊 − 𝑿 Promedio
35 2.25 Desviación estándar
219
44 56.25 𝑋ത = = 36.5
6
S= 𝑆 2 = 35.1 = 5.925 𝑠𝑒𝑔.
30 42.25
38 2.25
Coeficiente de variación
42 30.25
30 42.25 𝑆 5.925
𝐶𝑉% = ത ∗ 100 = ∗ 100 = 16.23 %
219 175.5 𝑋 36.5
Se pide calcular :
a) Varianza
b) Desviación estándar
c) Coeficiente de Variación
σ 𝑋 ത 2
2 − 𝑛(𝑋)
𝑆2 =
𝑛−1
𝑋ത =
σ 𝑋 ത 2
2 − 𝑛(𝑋)
𝑋2 = 𝑆2 =
𝑛−1
n =
S = 𝑆2
S = 0.000
S = S
CV= ഥ (100 )
𝑋ത = X
S
CV= ഥ (100 )
X
Interpretación
CV ≤ 30% El comportamiento de los datos es homogéneo
Embotelladora Embotelladora
Marca A Marca B
Media
Desviación Estándar
Varianza
𝐾𝑢 → 0.25 𝐾𝑢 → 0
𝐾𝑢 → 0.5
(𝐾𝑢 = 0.263 →Distribución normal)
1 𝑄3 −𝑄1
𝐾𝑢 =2 𝐷 −𝐷
9 1
1 𝑃75 −𝑃25
𝐾𝑢 =2 𝑃90 −𝑃10
60 102 63 110 68 98 74 82
75 65 66 94 69 100 74 92
62 87 150 70 93 85 35
Min 35
Q1 67
Q2 75
Q3 93.5
Máx 150
SPSS
1 60
2 75
3 62
4 102
5 65
6 87
7 63
8 66
9 150
10 110
máximo 11 94
12 70
13 68
14 69
𝑄3 = 93.5
15 93
16 98
17 100
𝑄2 = 75 18 85
19 74
𝑄1 = 67 20 74
21 35
22 82
23 92
mínimo
Min 35
Q1 67
Q2 75
Q3 93.5
Máx 150
Se cometería un error no evaluar los
valores extremos.
“ Falta evaluar los valores atípicos”.
SPSS
Valores atípicos
➢ Es una observación que es numéricamente distante del resto de datos
➢ Si no son tomados en cuenta a la hora de procesar información los resultados
obtenidos podrían ser engañosos
➢ La mediana refleja mejor distribución de estos datos
➢ Entra en escena términos como Rango intercuartílico (RI) y Limites extremos
Rango Intercuartílico
60 102 63 110 68 98 74 82
75 65 66 94 69 100 74 92
62 87 150 70 93 85 35
Min 35
Q1 67 RI= 𝑄3 -𝑄1
Q2 75
Máx = 93.5 +𝟏. 𝟓 ∗ 𝟐𝟔. 𝟓 = 𝟏𝟑𝟑. 𝟐𝟓 Máx = 93.5 + 3∗ 𝟐𝟔. 𝟓 = 𝟏𝟕𝟑 𝒔𝒐𝒍𝒆𝒔
Box-plot con la información
60 102 63 110 68 98 74 82
75 65 66 94 69 100 74 92
Valores
62 87 150 70 93 85 35
ordenados
35
VALORES ATÍPICOS LEVES 60
62
Min 35 63
Q1 67
𝐌𝐢𝐧 = 𝟔𝟕 − 𝟏. 𝟓 ∗ 𝟐𝟔. 𝟓 = 𝟐𝟕. 𝟐𝟓 65
66
Q2 75
Máx = 93.5 +𝟏. 𝟓 ∗ 𝟐𝟔. 𝟓 = 𝟏𝟑𝟑. 𝟐𝟓 68
69
Q3 93.5 70
74
Máx 150 74
75
82
85
SPSS
Min 35
Q1 67
Q2 75
Q3 93.5
Máx 150
Boxplots