Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadı́stica
16 de octubre de 2021
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas
Clase 1
clase 9
clase 10
clase 11
clase 12
clase 13
clase 14
clase 15
clase 16
clase 17
clase 18
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas
Evaluación
Primer corte 33 %
Segundo corte 33 %
Tercer corte 34 %
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas
Mediana
Es el valor que ocupa la posición central de un conjunto de datos cuando estos
están ordenados de menor a mayor.
X n2 + X n2 +1
Si n es par, X̃ = .
2
Ejemplo La siguiente tabla presenta las notas obtenidas por una muestra de
estudiantes en un examen
Estudiante Nota Estudiante Nota
R. Martı́nez 4,3 L. Rueda 2,9
P. Ardila 1,7 J. Zárate 4,0
M. Castellanos 3,8 G. Torres 1,2
A. Manjarrés 4,8 Z. Benı́tez 4,7
O. León 3,5
Ordenamiento: 1,2 1,7 2,9 3,5 3.8 4,0 4,3 4,7 4,8
X̃ = X 9+1 = X5 = 3,8.
2
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas
Ordenamiento:
X1 X2 X3 X4 X5 X6 X7 X8 X9 X10
1,57 1,62 1,65 1,68 1,69 1,71 1,73 1,75 1,77 1,81
X 10 + X 10 +1 X5 + X6 1,69 + 1,71
2 2
X̃ = = = = 1,70
2 2 2
Este valor se interpreta como que la mitad de los estudiantes de esta muestra
miden menos de 1.70 metros.
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas
13 36 19 44 38 20 14 16 27 33 25 15
Determinar la mediana.
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas
Segundo caso: El cálculo del total de datos de la muestra dividido entre 2, n/2,
no coincide con el valor de la frecuencia absoluta acumulada, de ninguna de las
clases.
n/2 − Ni−1
X̃ = LIi + w
ni
LIi : Lı́mite inferior de la clase que contiene la mediana.
w : Tamaño o amplitud de las clases.
n : Cantidad total de datos de la muestra
Ni−1 : Frecuencia absoluta acumulada hasta la clase anterior a la clase que
contiene la mediana.
ni : Frecuencia absoluta de la clase que contiene la mediana.
Los Cuartiles: Son tres valores que dividen el conjunto de datos en cuatro
partes iguales cuando este conjunto está ordenado en forma ascendente.
Primer caso: Ninguna posición de los datos coincide con el valor de la operación
qi xn
100
qi : valor porcentual del cuartil que se pretende calcular, es decir: 25, 50 o 75.
n: Tamaño de la muestra.
qi xn
Qi es el valor del dato cuya posición es inmediatamente mayor a .
100
Ordenamiento: 3 5 8 10 13 15 18 20 23 28 32 38
q1 xn 25x12
= = 3, Xj = 8 y Xj+1 = 10
100 100
Xj + Xj+1 8 + 10
Q1 = = =9
2 2
Q2 =? y Q3 =?
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas
n: Tamaño de la muestra.
Ejemplo: Las utilidades por acción del portafolio de inversiones de una empresa
se presenta en la siguiente tabla:
qi xn 75x1100
= = 825
100 100
El tercer cuartil se encuentra en [1700, 1799].
qi xn/100 − Ni−1 825 − 695
Q3 = LIi + w = 1700 + 100 = $1786,6
ni 150
Q2 =?
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas
Los Percentiles
Los percentiles son valores que dividen un conjunto de datos en 100 partes
iguales, cuando este conjunto está ordenado de menor a mayor.
Ejemplo: P30 = 200 que se lee: “Percentil 30 igual a 200”, quiere decir que por
debajo del valor 200, del conjunto ordenado de datos, se encuentran el 30 % de
los datos.
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas
Primer caso: Ninguna posición de los datos coincide con el valor de la operación
pi xn
100
pi : valor porcentual del percentil que se pretende calcular.
n: Tamaño de la muestra.
pi xn
Pi es el valor del dato cuya posición es inmediatamente mayor a .
100
Ordenamiento: 3 5 8 10 13 15 18 20 23 28 32 38
p40 xn 40x12
= = 4,8,
100 100
P40 = X5 = 13
P50 =? y P80 =?
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas
Ejemplo: La siguiente tabla se refiere a una muestra, al azar, del tiempo que
duraron las llamadas telefónicas realizadas por el personal de oficina de una
empresa.
Duración llamadas No. de
en minutos Llamadas
[0.1,2.0] 46
[2.1, 4.0] 67
[4.1, 6,0] 44
[6.1, 8,0] 31
[8.1, 10,0] 25
Mas de 10,0 17
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas
pi xn 20x230
= = 46. P20 = 2.0
100 100
pi xn 70x230
= = 161. Luego, clase i =[6.1,8.0].
100 100
pi xn/100 − Ni−1 161 − 157
Pi = LIi + w = 6,1 + 2,0 = 6,36
ni 31
3) La mediana es un cuartil.
Moda
Es el valor que más se repite dentro de ese conjunto (X
b ).
25 21 19 23 22
27 21 23 22 18
20 22 21 19 21
26 28 22 25 24
22 20 19 31 22
24 30 28 22 26
X
b = 22 años
Ejemplo: Los puntajes alcanzados, en una escala de 100 puntos, en las pruebas
de ingreso, por los aspirantes a trabajar en una empresa se presentan en la
siguiente tabla:
71 68 70 55 57
36 51 57 68 40
57 85 50 49 68
68 39 45 57 25
X
b = 57 puntos y b 0 = 68 puntos.
X
Nota: Cuando un conjunto de datos tiene más de una moda, como en este
caso, se llama conjunto de dato Polimodal.
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas
6, 8 5, 5 6, 1 6, 4 6, 2
5, 7 6, 3 5, 6 5, 1 6, 9
7, 0 7, 4 6, 6 6, 0 5, 4
6, 5 6, 7 5, 8 5, 9 7, 5
Ejemplo: Una muestra del número de motocicletas que vende por semana un
distribuidor se presenta en la siguiente tabla:
No. de No. de
Motos Semanas
0 1
1 3
2 5
3 12
4 19
5 16
6 10
más de 6 4
X
b = 4 motocicletas.
Marca de No. de
Celular Profesionales
Sony 18
Motorola 32
L. G. 15
Nokia 47
Samsung 30
iPhone 10
Otras marcas 5
X
b = Nokia
X
b está en la clase con mayor frecuencia.
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas
Velocidad No. de
(Kmts / hora) Vehı́culos
Hasta 40 7
[41, 50] 36
[51, 60] 44
[61, 70] 61
[71, 80] 55
[81, 90] 19
Mas de 90 14
Ejemplo 2:La edad de los residentes de Twin Lakes Retirement Village tiene la
siguiente distribución de frecuencias:
Clase Frecuencia
[47,51.9] 4
[52,56.9] 9
[57,61.9] 13
[62,66.9] 42
[67,71.9] 39
[72,76.9] 20
[77,81.9] 9
[20,29] 6
[30,39] 16
[40,49] 21
[50,59] 29
[60,69] 25
[70,79] 22
[80,89] 11
[90,99] 7
[100,109] 4
[110,119] 0
[120,129] 2
Propiedades de la moda
4) Existen conjuntos de datos que no tienen moda o que tienen más de una
moda.
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas
Medidas de dispersión
Creaciones armany
Diseños Galaxia
Ventas mensuales No. De
Ventas mensuales No. De (millones) meses
(millones) meses [6,9] 14
[10,13] 11 [10, 13] 13
[14,17] 32 [14, 17] 16
[18,21] 19 [18, 21] 11
[22,25] 12 [22, 25] 10
[26,29] 7 [26, 29] 10
[30,33] 5 [30, 33] 7
[34, 37] 5
X = $18, 8953 millones, Y = 18, 1666 millones.
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas
Concepto de dispersión
Variabilidad: Hace referencia a qué tan diferentes son entre sı́ los datos de una
muestra o una población.
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas
X = 3, 6 es representativo.
X = 2, 9 no es representativo.
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas
1) Rango
2) Rango Intercuartı́lico
3) Desviación Media
4) Varianza
5) Desviación Estándar
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas
Rango
Ejemplo: Una muestra de las facturas que se cancelan con tarjetas de crédito
en una cadena de almacenes de modas se presenta en la siguiente tabla:
Ventas No. de
(Miles de $) Facturas
[30,35] 25
[36,41] 38
[42,47] 49
[48,53] 51
[54,59] 32
[60,65] 29
R = 65 − 30 = $35 miles
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas
Rango intercuartı́lico
Este rango muestra la dispersión de la porción más central de los datos que
abarca el 50 % del total. Se calcula la diferencia entre el primero y el tercer
cuartil.
RQ = Q3 − Q1
Ejemplo: Las distancias en kilómetros, recorrida en un dı́a por dos muestras de
vehı́culos se presentan en las siguientes tablas:
Muestra A Muestra B
Distancia No. De Distancia No. De
(Kilómetros) Vehı́culos (Kilómetros) Vehı́culos
[25,34] 3 [25,34] 3
[35,44] 7 [35,44] 7
[45,54] 12 [45,54] 11
[55,64] 15 [55,64] 19
[65,74] 10 [65,74] 7
[75,84] 6 [75,84] 6
Calcular los rangos simples e intercuartilicos de las dos muestras.
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas
Muestra A
RQ = Q1 − Q2 = 20, 05Kmts
Muestra B
Como se ve, aunque las dos muestras tienen el mismo rango, R, el rango
intercuartı́lico es diferente, lo que indica que la muestra B es menos dispersa
que la muestra A.
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas
Desviación media
3 14 24 9 7 12
X = 11,5
P
|xi − x|
DM = =
n
|3 − 11,5| + |14 − 11,5| + |24 − 11,5| + |9 − 11,5| + |7 − 11,5| + |12 − 11,5|
6
= 5,2
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas
X = 271,42
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas
P
|ci − x|ni
DM = = |209,5 − 271,42|12 + |229,5 − 271,42|15
n
+38,08x18 + 58,08x15
= 30, 69 miles
125
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas
Varianza
Población
(xi − µ)2
P
σ2 =
N
Muestra
(xi − x)2
P
s2 =
n−1
Ejemplo: Los siguientes datos corresponden a los puntajes obtenidos por los
aspirantes a un cargo en una empresa.
Puntajes
60 81 77 72 91 90
µ = 78, 5 puntos.
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas
(xi − µ)2
P
σ2 = = (60 − 78, 5)2 + (81 − 78, 5)2 + (77 − 78, 5)2
N
3, 2 5, 4 7, 2 4, 5 7, 3 5, 0 4, 6 6, 4
Calcular la varianza.
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas
Población:
(ci − µ)2 ni
P
σ2 =
N
Muestra:
(ci − X )2 ni
P
s2 =
n−1
Ejemplo: En un programa sobre riesgo cardiovascular, se registró el peso en
kilogramos de todos los empleados de una empresa.
Peso en No. de
Kilogramos Empleados
[39,48] 5
[49,58] 11
[59,68] 50
[69,78] 31
[79,88] 27
[89,98] 18
[99,108] 9
Estimar la varianza.
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas
Peso en No. de ci
Kilogramos Empleados
[39,48] 5 43,5
[49,58] 11 53,5
[59,68] 50 63,5
[69,78] 31 73,5
[79,88] 27 83,5
[89,98] 18 93,5
[99,108] 9 103,5
µ = 73, 7 kilogramos.
(ci − µ)2 ni
P
σ2 = = (43, 5 − 73, 7)2 5 + (53, 5 − 73, 7)2 11
N
Calcular la varianza.
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas
Desviación Estandar
Es la raı́z cuadrada de la varianza.
Población rP
(xi − µ)2
σ=
N
Muestra s
(xi − x)2
P
s=
n−1
Desviación estandar para datos agrupados
Población: rP
(ci − µ)2 ni
σ=
N
Muestra: s
(ci − X )2 ni
P
s=
n−1
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas
Ejemplo: Una muestra del tamaño de las fincas de una región se presenta en la
siguiente tabla:
No. de
Hectáreas / finca fincas
[2.03,2.72] 12
[2.73,3.42] 36
[3.43,4.12] 30
[4.13,4.82] 19
[4.83,5.52] 13
[5.53,6.22] 11
[6.23,6.92] 9
Calcular la desviación estandar.
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas
No. de
Hectáreas / finca fincas ci
[2.03,2.72] 12 2.375
[2.73,3.42] 36 3.075
[3.43,4.12] 30 3.775
[4.13,4.82] 19 4.475
[4.83,5.52] 13 5.175
[5.53,6.22] 11 5.875
[6.23,6.92] 9 6.575
2,375x12 + 3,075x36 + 3,775x30 + 4,475x19 + 5,175x13 + 5,875x11 + 6,575x9
X =
130
X = 4,065
+(6,575 − 4,065)2 9
= 1,42658
130 − 1
√
s= s 2 = 1,19439
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas
Ejemplo: La siguiente tabla es una muestra, en miles de pesos, del valor del
arriendo mensual de vivienda del estrato tres.
Valor arriendo No. De
(miles de pesos) viviendas
[200,219] 12
[220,239] 15
[240,259] 23
[260,279] 22
[280,299] 20
[300,319] 18
[320,339] 15
Coeficiente de variación
Ejemplo 2: Una muestra de las ventas por dı́a de un almacén de ropa de moda
y un gran distribuidor textil se presentan en la siguientes tablas. ¿Cuál de los
dos promedios de ventas por dı́a es más confiable?
Ventas No. de
Ventas No. de
(Millones de $) dı́as
(Millones de $) dı́as
[0.9,1.0] 3
[9.2,10.2] 12
[1.1,1.2] 9
[10.3,11.3] 16
[1.3,1.4] 16
[11.4,12.4] 25
[1.5,1.6] 23
[12.5,13.5] 19
[1.7,1.8] 29
[13.6,14.6] 10
[1.9,2.0] 20
[14.7,15.7] 9
[2.1,2.2] 11
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas
Ventas No. de ci
Ventas No. de ci
(Millones de $) dı́as
(Millones de $) dı́as
[0.9,1.0] 3 0.95
[9.2,10.2] 12 9.7
[1.1,1.2] 9 1.15
[10.3,11.3] 16 10.8
[1.3,1.4] 16 1.35
[11.4,12.4] 25 11.9
[1.5,1.6] 23 1.55
[12.5,13.5] 19 13.0
[1.7,1.8] 29 1.75
[13.6,14.6] 10 14.1
[1.9,2.0] 20 1.95
[14.7,15.7] 9 15.2
[2.1,2.2] 11 2.15
Jeans and Breeches
X =?, s =?
CV =?
Distrimoda
X =?, s =?
CV =?
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas
Desigualdad de Chebyshev
LI = X − K · s, LS = X + K · s
Ejemplo: Una muestra del tiempo que tienen que esperar los afiliados a una
EPS para que los atiendan en el servicio de urgencias de una clı́nica dio una
media aritmética de 32 minutos, con una desviación estándar de 8,3 minutos.
¿Entre qué intervalo de tiempo tuvieron que esperar como mı́nimo el 80 % de
los afiliados de la muestra?
Regresión y correlación
Regresión: Relación matemática que existe entre dos o mas variables que estan
conectadas.
Gráfico de dispersión
Kilómetros Galones
X Y
30 5, 95
50 8, 55
10 2, 35
40 9, 25
60 13, 85
20 6, 75
Kilómetros Galones
X Y
30 5, 95
50 8, 55
10 2, 35
40 9, 25
60 13, 85
20 6, 75
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas
Tipos de regresion
celular duración
encendido baterı́a
(segundos) (horas)
360 3, 2
270 3, 5
480 1, 9
120 3, 9
440 2, 3
230 3, 2
160 4, 1
x 0,31 0,33 0,56 0,6 0,89 0,92 0,96 0,98 1,15 1,20 1,25
y 0,1 0,2 0,15 0,25 0,3 0,35 0,5 0,6 0,55 0,65 0,68
Correlación
Es una medida estadı́stica que expresa hasta qué punto dos variables están
relacionadas linealmente.
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas
Coeficiente de correlación
celular duración
encendido baterı́a
(segundos) (horas)
360 3, 2
270 3, 5
480 1, 9
120 3, 9
440 2, 3
230 3, 2
160 4, 1
Utilizamos P
(xi − X )(yi − Y )
r = qP qP
(xi − X )2 (yi − Y )2
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas
(xi − X )2 (360 − 294, 28)2 + (270 − 294, 28)2 + (480 − 294, 28)2
P
=
Coeficiente de determinación
r 2 = (−0, 91)2 = 0, 83
Kilómetros Galones
X Y
30 5, 95
50 8, 55
10 2, 35
40 9, 25
60 13, 85
20 6, 75
Y − Y = m(X − X )
2+3+5+7+8
X = =5
5
14 + 20 + 32 + 42 + 44
Y = = 30,4
5
P
(xi − X )(yi − Y ) = (2 − 5)(14 − 30,4) + (3 − 5)(20 − 30,4) + (5 − 5)(32 − 30,4)
P
(xi − X )(yi − Y ) 134
m= = = 0,19
699,2
P
(yi − Y )2
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas
Y − Y = m(X − X )
Luego Y − 30, 4 = 0, 19(X − 5), de donde
Y = 0, 19X + 29,45