Está en la página 1de 95

Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Estadı́stica

Jose Guillermo Guerrero Mojica

Unidades Tecnológicas de Santander

16 de octubre de 2021
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Clase 1

clase 9

clase 10

clase 11

clase 12

clase 13

clase 14

clase 15

clase 16

clase 17

clase 18
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Evaluación
Primer corte 33 %

Segundo corte 33 %

Tercer corte 34 %
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Mediana
Es el valor que ocupa la posición central de un conjunto de datos cuando estos
están ordenados de menor a mayor.

Mediana para datos no agrupados: Sea n el tamaño de la muestra. Si n es impar


X̃ = X n+1 .
2

X n2 + X n2 +1
Si n es par, X̃ = .
2
Ejemplo La siguiente tabla presenta las notas obtenidas por una muestra de
estudiantes en un examen
Estudiante Nota Estudiante Nota
R. Martı́nez 4,3 L. Rueda 2,9
P. Ardila 1,7 J. Zárate 4,0
M. Castellanos 3,8 G. Torres 1,2
A. Manjarrés 4,8 Z. Benı́tez 4,7
O. León 3,5
Ordenamiento: 1,2 1,7 2,9 3,5 3.8 4,0 4,3 4,7 4,8

X̃ = X 9+1 = X5 = 3,8.
2
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Ejemplo: Una muestra de las estaturas, en metros, de 10 estudiantes de una


clase se presentan en la siguiente tabla:

Estudiante Estatura Estudiante Estatura


M. Rodrı́guez 1,75 G. López 1,69
L. Sánchez 1,68 H. Núñez 1,57
D. Rojas 1,81 T. Garcı́a 1,77
J. Acevedo 1,65 R. Orduz 1,62
F. Dı́az 1,73 P. Pinzón 1,71

Ordenamiento:
X1 X2 X3 X4 X5 X6 X7 X8 X9 X10
1,57 1,62 1,65 1,68 1,69 1,71 1,73 1,75 1,77 1,81

X 10 + X 10 +1 X5 + X6 1,69 + 1,71
2 2
X̃ = = = = 1,70
2 2 2
Este valor se interpreta como que la mitad de los estudiantes de esta muestra
miden menos de 1.70 metros.
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Ejemplo: Dados los siguientes datos:

13 36 19 44 38 20 14 16 27 33 25 15

Determinar la mediana.
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Mediana para datos agrupados

Primer Caso: La frecuencia absoluta acumulada, Ni , hasta alguna de las clases,


de la distribución de frecuencias, coincide con la cantidad total de datos
dividida entre 2.

X̃ = lı́mite superior de la clase.

Ejemplo: Los ingresos en una semana, en millones de pesos, de una muestra de


tabernas se presenta en la siguiente tabla:

Ingresos (Millones de $) No. tabernas


[1.6, 1.9] 6
[2.0, 2.3] 11
[2.4, 2.7] 18
[2.8, 3.1] 25
[3.2, 3.5] 29
[3.6, 3.9] 20
[4.0, 4.3] 11
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Clases Frecuencia F. Acumulada


[1.6, 1.9] 6 6
[2.0, 2.3] 11 17
[2.4, 2.7] 18 35
[2.8, 3.1] 25 60
[3.2, 3.5] 29 89
[3.6, 3.9] 20 109
[4.0, 4.3] 11 120
n = 120, n/2 = 60 y este valor coincide con la frecuencia absoluta acumulada,
Ni , hasta la cuarta clase.

X̃= Lı́mite superior de la clase = $3.1 millones

Interpretación: La venta mı́nima de la mitad de las tabernas de la muestra fue


de $3.1 millones.
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Segundo caso: El cálculo del total de datos de la muestra dividido entre 2, n/2,
no coincide con el valor de la frecuencia absoluta acumulada, de ninguna de las
clases.  
n/2 − Ni−1
X̃ = LIi + w
ni
LIi : Lı́mite inferior de la clase que contiene la mediana.
w : Tamaño o amplitud de las clases.
n : Cantidad total de datos de la muestra
Ni−1 : Frecuencia absoluta acumulada hasta la clase anterior a la clase que
contiene la mediana.
ni : Frecuencia absoluta de la clase que contiene la mediana.

La mediana se encuentra en la clase cuya frecuencia absoluta acumulada, Ni ,


sea inmediatamente superior a n/2.
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Ejemplo 1: Los saldos de los depósitos al finalizar un mes en las cuentas de


ahorro de un número de cuentahabientes, de los bancos locales, escogidos al
azar, se presentan en la siguiente tabla:

Saldo mensual (Miles de $) No. depósitos F. Acumulada


[1,300] 25 25
[301,600] 36 61
[601,900] 51 112 clase i - 1
[901,1200] 42 154 clase i
[1201,1500] 37 191
[1501,1800] 30 221
[1801,2100] 22 243
[2101,2400] 19 262
Mas de 2400 17 279

n = 279, n/2 = 139,5. Ni−1 = 112, ni = 42, LIi = 901 y w = 300


   
n/2 − Ni−1 139,5 − 112
X̃ = LIi + w = 901 + 300 = 1097
ni 42
La mitad de los clientes de la muestra tenı́an un saldo, al final del mes inferior
a $ 1097000.
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Ejemplo 2: Si la cantidad de reclamaciones por accidentes automovilı́sticos a


una compañı́a de seguros muestra la siguiente distribución, determine la
mediana.
Monto de reclamaciones ($) Frecuencia
menos que 250 52
[250,499] 337
[500,749] 1066
[750,999] 1776
1000 o más 1492
Ejemplo 3: La siguiente distribución de frecuencias representa los pesos en
libras de una muestra de paquetes transportados el mes pasado por una
pequeña compañı́a de carga aérea.

Clase Frecuencia Clase Frecuencia


[10.0,10.9] 1 [15.0,15.9] 11
[11,0, 11,9] 4 [16,0, 16,9] 8
[12.0,12.9] 6 [17.0,17.9] 7
[13.0,13.9] 8 [18.0,18.9] 6
[14.0,14.9] 12 [19.0,19.9] 2

Calcule la mediana de la muestra.


Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Medidas de tendencia no central o de posición

Los Cuartiles: Son tres valores que dividen el conjunto de datos en cuatro
partes iguales cuando este conjunto está ordenado en forma ascendente.

Primer cuartil o Q1 : Es el valor por debajo del cual se encuentran el 25 % de los


datos.

Segundo cuartil o Q2 : Es el valor por debajo del cual se encuentran el 50 % de


los datos, es decir, es la misma mediana.

Tercer cuartil o Q3 : Es el valor por debajo del cual se encuentran el 75 % de los


datos.
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Cuartiles para datos para datos no agrupados

Primer caso: Ninguna posición de los datos coincide con el valor de la operación
qi xn
100
qi : valor porcentual del cuartil que se pretende calcular, es decir: 25, 50 o 75.

n: Tamaño de la muestra.
qi xn
Qi es el valor del dato cuya posición es inmediatamente mayor a .
100

Segundo caso: Alguna posición de un dato Xj coincide con el valor de la


qi xn
operación . Entonces
100
Xj + Xj+1
Qi = .
2
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Ejemplo: El número de clientes que atendieron en un dı́a doce vendedores de


un centro comercial escogidos al azar se presenta en la siguiente tabla
Número de clientes atendidos por vendedor
15 5 20 10 38 23 8 3 13 18 28 32
Calcular los cuartiles.

Ordenamiento: 3 5 8 10 13 15 18 20 23 28 32 38
q1 xn 25x12
= = 3, Xj = 8 y Xj+1 = 10
100 100
Xj + Xj+1 8 + 10
Q1 = = =9
2 2
Q2 =? y Q3 =?
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Cuartiles para datos agrupados

Primer caso: La frecuencia absoluta acumulada hasta alguna de las clases


coincide con el valor de la operación
qi xn
100
qi : valor porcentual del cuartil que se pretende calcular, es decir: 25, 50 o 75.

n: Tamaño de la muestra.

En este caso el cuartil buscado es igual al lı́mite superior de la clase.


Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Ejemplo: Las utilidades por acción del portafolio de inversiones de una empresa
se presenta en la siguiente tabla:

Utilidad por acción No. de acciones


[1300,1399] 100
[1400,1499] 175
[1500,1599] 230
[1600,1699] 190
[1700,1799] 150
[1800,1899] 130
[1900,1999] 125

Cálcular el primer cuartil.


Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Utilidad por acción No. de acciones F. Acumulada


[1300,1399] 100 100
[1400,1499] 175 275
[1500,1599] 230 505
[1600,1699] 190 695
[1700,1799] 150 845
[1800,1899] 130 975
[1900,1999] 125 1100
q1 xn 25x1100
= = 275
100 100
Q1 = lı́mite superior = 1499

Interpretación: El 25 % de las acciones, de este portafolio, dan una utilidad


inferior a $1499.
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Segundo caso: La frecuencia absoluta acumulada, hasta cualquiera de las clases


qi xn
no coincide con el valor de la operación .
100
 
qi xn/100 − Ni−1
Qi = LIi + w
ni
LIi : Lı́mite inferior de la clase que contiene al cuartil.
w : Tamaño o amplitud de las clases.
n : Cantidad total de datos de la muestra
Ni−1 : Frecuencia absoluta acumulada hasta la clase anterior a la clase que
contiene al cuartil.
ni : Frecuencia absoluta de la clase que contiene al cuartil.

El cuartil se encuentra en la clase cuya frecuencia absoluta acumulada, sea


qi xn
inmediatamente superior al valor .
100
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Ejemplo: Cálcular el tercer cuartil del ejemplo anterior.

Utilidad por acción No. de acciones F. Acumulada


[1300,1399] 100 100
[1400,1499] 175 275
[1500,1599] 230 505
[1600,1699] 190 695 Clase i-1
[1700,1799] 150 845 Clase i
[1800,1899] 130 975
[1900,1999] 125 1100

qi xn 75x1100
= = 825
100 100
El tercer cuartil se encuentra en [1700, 1799].
   
qi xn/100 − Ni−1 825 − 695
Q3 = LIi + w = 1700 + 100 = $1786,6
ni 150

Interpretación: El 75 % de las acciones tienen una utilidad inferior a $1787.

Q2 =?
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Los Percentiles

Los percentiles son valores que dividen un conjunto de datos en 100 partes
iguales, cuando este conjunto está ordenado de menor a mayor.

Ejemplo: P30 = 200 que se lee: “Percentil 30 igual a 200”, quiere decir que por
debajo del valor 200, del conjunto ordenado de datos, se encuentran el 30 % de
los datos.
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Percentiles para datos para datos no agrupados

Primer caso: Ninguna posición de los datos coincide con el valor de la operación
pi xn
100
pi : valor porcentual del percentil que se pretende calcular.

n: Tamaño de la muestra.
pi xn
Pi es el valor del dato cuya posición es inmediatamente mayor a .
100

Segundo caso: Alguna posición de un dato Xj coincide con el valor de la


pi xn
operación . Entonces
100
Xj + Xj+1
Pi = .
2
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Ejemplo: El número de clientes que atendieron en un dı́a doce vendedores de


un centro comercial escogidos al azar se presenta en la siguiente tabla
Número de clientes atendidos por vendedor
15 5 20 10 38 23 8 3 13 18 28 32
Calcular el percentil 40 y el percentil 75.

Ordenamiento: 3 5 8 10 13 15 18 20 23 28 32 38
p40 xn 40x12
= = 4,8,
100 100
P40 = X5 = 13
P50 =? y P80 =?
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Percentiles para datos agrupados


Primer caso: La frecuencia absoluta acumulada hasta alguna de las clases
coincide con el valor de la operación:
pi xn
.
100
pi : Valor porcentual del percentil que se quiere calcular.
n: Tamaño de la muestra.

El percentil que se quiere calcular es igual al lı́mite superior de la clase


considerada.

Ejemplo: La siguiente tabla se refiere a una muestra, al azar, del tiempo que
duraron las llamadas telefónicas realizadas por el personal de oficina de una
empresa.
Duración llamadas No. de
en minutos Llamadas
[0.1,2.0] 46
[2.1, 4.0] 67
[4.1, 6,0] 44
[6.1, 8,0] 31
[8.1, 10,0] 25
Mas de 10,0 17
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Cálcular el percentil 20.

Duración llamadas No. de F. Acumulada


en minutos Llamadas
[0.1,2.0] 46 46
[2.1, 4.0] 67 113
[4.1, 6,0] 44 157
[6.1, 8.0] 31 188
[8.1, 10.0] 25 213
Mas de 10.0 17 230

pi xn 20x230
= = 46. P20 = 2.0
100 100

Interpretación: el 20 % de las llamadas, de la muestra, duraron menos de 2


minutos.
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Segundo caso: La frecuencia absoluta acumulada, hasta cualquiera de las clases


pi xn
no coincide con el valor de la operación .
100
 
pi xn/100 − Ni−1
Pi = LIi + w
ni
LIi : Lı́mite inferior de la clase que contiene al percentil.
w : Tamaño o amplitud de las clases.
n : Cantidad total de datos de la muestra
Ni−1 : Frecuencia absoluta acumulada hasta la clase anterior a la clase que
contiene al percentil.
ni : Frecuencia absoluta de la clase que contiene al percentil.

El percentil se encuentra en la clase cuya frecuencia absoluta acumulada, sea


pi xn
inmediatamente superior al valor .
100
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Ejemplo: Calcular el percentil 70 del ejemplo anterior.

Duración llamadas No. de F. Acumulada


en minutos Llamadas
[0.1,2.0] 46 46
[2,1 4.0] 67 113
[4,1 6,0] 44 157
[6,1 8,0] 31 188
[8,1 10,0] 25 213
Mas de 10,0 17 230

pi xn 70x230
= = 161. Luego, clase i =[6.1,8.0].
100 100
   
pi xn/100 − Ni−1 161 − 157
Pi = LIi + w = 6,1 + 2,0 = 6,36
ni 31

Interpretación: El 70 % de las llamadas, de la muestra, fue inferior a 6.26


minutos.
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Propiedades de la mediana, cuartiles y percentiles

1) A la mediana, cuartiles y percentiles no los afectan los valores extremos.

2) Para calcular la mediana, cuartiles y percentiles los datos deben estar


ordenados

3) La mediana es un cuartil.

4) Los cuartiles son casos pariculares de los percentiles.


Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Moda
Es el valor que más se repite dentro de ese conjunto (X
b ).

Moda para datos no agrupados

Cuando los datos no están agrupados la moda se establece a simple vista.

Ejemplo 1 Una muestra de las edades de la última promoción de graduados se


presenta en la siguiente tabla:

25 21 19 23 22
27 21 23 22 18
20 22 21 19 21
26 28 22 25 24
22 20 19 31 22
24 30 28 22 26

X
b = 22 años

Interpretación: la edad más común en la muestra de egresados es 22 años


Observación: En este caso hay un solo valor modal.
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Ejemplo: Los puntajes alcanzados, en una escala de 100 puntos, en las pruebas
de ingreso, por los aspirantes a trabajar en una empresa se presentan en la
siguiente tabla:
71 68 70 55 57
36 51 57 68 40
57 85 50 49 68
68 39 45 57 25

X
b = 57 puntos y b 0 = 68 puntos.
X

Nota: Cuando un conjunto de datos tiene más de una moda, como en este
caso, se llama conjunto de dato Polimodal.
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Ejemplo: El tiempo, en horas, que gastan los buses de una empresa de


transportes en realizar el viaje entre dos ciudades determinadas, en una
muestra de recorridos escogidos al azar, se presenta en la siguiente tabla:

6, 8 5, 5 6, 1 6, 4 6, 2
5, 7 6, 3 5, 6 5, 1 6, 9
7, 0 7, 4 6, 6 6, 0 5, 4
6, 5 6, 7 5, 8 5, 9 7, 5

Ninguno de los datos se repite. El conjunto de datos no tiene moda.


Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Moda para datos agrupados


Primer caso: Clases de amplitud cero. La moda es el valor de la variable que
tiene la frecuencia más alta.

Ejemplo: Una muestra del número de motocicletas que vende por semana un
distribuidor se presenta en la siguiente tabla:

No. de No. de
Motos Semanas
0 1
1 3
2 5
3 12
4 19
5 16
6 10
más de 6 4

X
b = 4 motocicletas.

Interpretación: El volumen de venta más frecuente es de 4 motos por semana.


Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Segundo caso: Datos de variable cualitativa, la moda corresponde al valor de la


variable que tiene la más alta frecuencia.

Ejemplo: Se preguntó a una muestra de profesionales, escogidos al azar, por la


marca de celular que utilizan y el resultado se presenta en la siguiente tabla:

Marca de No. de
Celular Profesionales
Sony 18
Motorola 32
L. G. 15
Nokia 47
Samsung 30
iPhone 10
Otras marcas 5

X
b = Nokia

Interpretación: La marca de celular que más utilizan los profesionales, de la


muestra, es Nokia.
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Tercer caso: Datos agrupados en clases de amplitud mayor que cero.


 
d1
Xb = LI + w
d1 + d2
LI : Lı́mite inferior de la clase que contiene la moda.
w : Tamaño o amplitud de las clases.
d1 : Diferencia entre la frecuencia absoluta de la clase que contiene la moda y la
frecuencia absoluta de la clase anterior.
d2 : Diferencia entre la frecuencia absoluta de la clase que contiene la moda y la
frecuencia absoluta de la clase posterior.

X
b está en la clase con mayor frecuencia.
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Ejemplo 1: Utilizando un radar de carretera los agentes de tránsito tomaron


una muestra de la velocidad, en kilómetros por hora, a la que se desplazan los
vehı́culos al pasar por un puente. Los resultados están en la siguiente tabla:

Velocidad No. de
(Kmts / hora) Vehı́culos
Hasta 40 7
[41, 50] 36
[51, 60] 44
[61, 70] 61
[71, 80] 55
[81, 90] 19
Mas de 90 14

b está en [61, 70], LI = 60, d1 = 61 − 44 = 17 y d2 = 61 − 55 = 6.


X
   
d1 17
X = LI + w
b = 61 + 10 = 68,39
d1 + d2 17 + 6
Interpretación: Lo más común es que los vehı́culos de la muestra se desplacen
por el puente a 67.39 Km/h.
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Ejemplo 2:La edad de los residentes de Twin Lakes Retirement Village tiene la
siguiente distribución de frecuencias:

Clase Frecuencia
[47,51.9] 4
[52,56.9] 9
[57,61.9] 13
[62,66.9] 42
[67,71.9] 39
[72,76.9] 20
[77,81.9] 9

Estime el valor modal de la distribución.


Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Ejemplo 3: La siguiente distribución de frecuencias representa el tiempo en


segundos que los cajeros de BullsEye Discount Store necesitaron para servir a
una muestra de clientes en diciembre de 2008.
Tiempo (en segundos) Frecuencia

[20,29] 6
[30,39] 16
[40,49] 21
[50,59] 29
[60,69] 25
[70,79] 22
[80,89] 11
[90,99] 7
[100,109] 4
[110,119] 0
[120,129] 2

Calcule la moda de la muestra.


Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Propiedades de la moda

1) La moda se puede calcular en situaciones de variables cualitativitas y


cuantitativas.

2) A la moda no la afectan los valores extremos.

3) La moda se puede calcular en distribuciones de frecuencias que tengan


clases de extremo abierto.

4) Existen conjuntos de datos que no tienen moda o que tienen más de una
moda.
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Medidas de dispersión

Ejemplo: Las ventas mensuales, en millones de pesos, de dos empresas se


presentan en las siguientes tablas:

Creaciones armany
Diseños Galaxia
Ventas mensuales No. De
Ventas mensuales No. De (millones) meses
(millones) meses [6,9] 14
[10,13] 11 [10, 13] 13
[14,17] 32 [14, 17] 16
[18,21] 19 [18, 21] 11
[22,25] 12 [22, 25] 10
[26,29] 7 [26, 29] 10
[30,33] 5 [30, 33] 7
[34, 37] 5
X = $18, 8953 millones, Y = 18, 1666 millones.
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Las dos muestras tienen diferente “dispersión” de sus datos alrededor de la


media. Los ventas de Diseños Galaxia son menos dispersas que las ventas de
Creaciones Armany.
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Concepto de dispersión

Son valores que se obtienen como resultado de cálculos o procesos y que


indican que tan parecidos son los datos de una población o una muestra,
usualmente, con respecto a la medida de tendencia central con la que se
describe el comportamiento de este conjunto de datos.

Variabilidad: Hace referencia a qué tan diferentes son entre sı́ los datos de una
muestra o una población.
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Notas de una muestra de 10 estudiantes


1 2 3 4 5 6 7 8 9 10
3, 8 3, 8 3, 8 3, 8 3, 8 3, 8 3, 8 3, 8 3, 8 3, 8
Notas de una muestra de 10 estudiantes
1 2 3 4 5 6 7 8 9 10
3, 8 3, 8 3, 8 3, 8 3, 8 3, 8 4, 7 3, 8 3, 8 3, 8
Notas de una muestra de 10 estudiantes
1 2 3 4 5 6 7 8 9 10
3, 0 3, 5 3, 8 2, 5 3, 8 3, 7 4, 7 3, 8 3, 9 1, 9
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Ejemplo: Muestra de baja dispersión:


Notas de una muestra de 10 estudiantes
1 2 3 4 5 6 7 8 9 10
3, 2 3, 5 3, 8 3, 5 3, 8 3, 7 3, 6 3, 8 3, 9 3, 5

X = 3, 6 es representativo.

Muestra de alta dispersión:

Notas de una muestra de 10 estudiantes


1 2 3 4 5 6 7 8 9 10
0, 1 3, 5 0, 7 5, 0 1, 0 4, 7 4, 9 3, 8 3, 9 0, 9

X = 2, 9 no es representativo.
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Clases de medidas de dispersión

1) Rango

2) Rango Intercuartı́lico

3) Desviación Media

4) Varianza

5) Desviación Estándar
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Rango

Es la diferencia o distancia entre el mayor valor, de un conjunto de datos y el


valor menor.
R = Xmax − Xmin
Ejemplo: Calcular el rango de los siguientes conjuntos de datos:
Notas de una muestra de 10 estudiantes
1 2 3 4 5 6 7 8 9 10
3, 2 3, 5 3, 8 3, 5 3, 8 3, 7 3, 6 3, 8 3, 9 3, 5
R = 3, 9 − 3, 2 = 0, 7
Notas de una muestra de 10 estudiantes
1 2 3 4 5 6 7 8 9 10
0, 1 3, 5 0, 7 5, 0 1, 0 4, 7 4, 9 3, 8 3, 9 0, 9
R = 5, 0 − 0, 1 = 4, 9

La dispersión de la primera muestra, medida por el rango, es menor que la


dispersión de la muestra de la derecha.
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Rango para datos agrupados


Se resta del valor del lı́mite superior de la clase mas alta el valor del lı́mite
inferior de la clase mas baja.

R = LS clase más alta −LI clase más baja

Ejemplo: Una muestra de las facturas que se cancelan con tarjetas de crédito
en una cadena de almacenes de modas se presenta en la siguiente tabla:

Ventas No. de
(Miles de $) Facturas
[30,35] 25
[36,41] 38
[42,47] 49
[48,53] 51
[54,59] 32
[60,65] 29

R = LS clase más alta −LI clase más baja

R = 65 − 30 = $35 miles
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Rango intercuartı́lico

Este rango muestra la dispersión de la porción más central de los datos que
abarca el 50 % del total. Se calcula la diferencia entre el primero y el tercer
cuartil.
RQ = Q3 − Q1
Ejemplo: Las distancias en kilómetros, recorrida en un dı́a por dos muestras de
vehı́culos se presentan en las siguientes tablas:
Muestra A Muestra B
Distancia No. De Distancia No. De
(Kilómetros) Vehı́culos (Kilómetros) Vehı́culos
[25,34] 3 [25,34] 3
[35,44] 7 [35,44] 7
[45,54] 12 [45,54] 11
[55,64] 15 [55,64] 19
[65,74] 10 [65,74] 7
[75,84] 6 [75,84] 6
Calcular los rangos simples e intercuartilicos de las dos muestras.
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Muestra A

R = Xmax − Xmin = 60Kmts

Q1 = 47, 7Kmts, Q3 = 67, 75Kmts

RQ = Q1 − Q2 = 20, 05Kmts

Muestra B

R = Xmax − Xmin = 60Kmts

Q1 = 48, 0Kmts, Q3 = 64, 9Kmts

RQ = Xmax − Xmin = 16, 9Kmts

Como se ve, aunque las dos muestras tienen el mismo rango, R, el rango
intercuartı́lico es diferente, lo que indica que la muestra B es menos dispersa
que la muestra A.
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Desviación media

Es la diferencia promedio, en valor absoluto, de los datos de la muestra o


población con respecto a su propia media.

Desviación media para datos no agrupados:


P
|xi − x|
DM =
n
Ejemplo: Una muestra, al azar, del tiempo, en minutos, que duran las llamadas
que se hacen desde un teléfono, se presenta en la siguiente tabla:

3 14 24 9 7 12

X = 11,5
P
|xi − x|
DM = =
n
|3 − 11,5| + |14 − 11,5| + |24 − 11,5| + |9 − 11,5| + |7 − 11,5| + |12 − 11,5|
6
= 5,2
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Desviación media para datos agrupados:


P
|ci − x|ni
DM =
n
Ejemplo: La siguiente tabla es una muestra, en miles de pesos, del valor del
arriendo mensual de vivienda del estrato tres.
Valor arriendo No. De ci
(miles de pesos) viviendas
[200,219] 12 209,5
[220,239] 15 229,5
[240,259] 23 249,5
[260,279] 22 269,5
[280,299] 20 289,5
[300,319] 18 309,5
[320,339] 15 329,5

X = 271,42
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

P
|ci − x|ni
DM = = |209,5 − 271,42|12 + |229,5 − 271,42|15
n

+|249,5 − 271,42|23 + |269,5 − 271,42|22 + |289,5 − 271,42|20

+|309,5 − 271,42|18 + |329,5 − 271,42|15


125

= 61, 92x12 + 41,92x15 + 21,92x23 + 1, 92x22 + 18, 08x20

+38,08x18 + 58,08x15
= 30, 69 miles
125
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Varianza

Es el promedio de las desviaciones con respecto a la media elevados al


cuadrado.

Varianza para datos no agrupados

Población
(xi − µ)2
P
σ2 =
N
Muestra
(xi − x)2
P
s2 =
n−1
Ejemplo: Los siguientes datos corresponden a los puntajes obtenidos por los
aspirantes a un cargo en una empresa.
Puntajes
60 81 77 72 91 90
µ = 78, 5 puntos.
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

(xi − µ)2
P
σ2 = = (60 − 78, 5)2 + (81 − 78, 5)2 + (77 − 78, 5)2
N

+(72 − 78, 5)2 + (91 − 78, 5)2 + (90 − 78, 5)2


= 113,58
6
Ejemplo 2: La medida de la dureza de una muestra de ladrillos, escogidos al
azar, en una escala continua de 1 a 10.

3, 2 5, 4 7, 2 4, 5 7, 3 5, 0 4, 6 6, 4

Calcular la varianza.
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Varianza para datos agrupados

Población:
(ci − µ)2 ni
P
σ2 =
N
Muestra:
(ci − X )2 ni
P
s2 =
n−1
Ejemplo: En un programa sobre riesgo cardiovascular, se registró el peso en
kilogramos de todos los empleados de una empresa.

Peso en No. de
Kilogramos Empleados
[39,48] 5
[49,58] 11
[59,68] 50
[69,78] 31
[79,88] 27
[89,98] 18
[99,108] 9

Estimar la varianza.
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Peso en No. de ci
Kilogramos Empleados
[39,48] 5 43,5
[49,58] 11 53,5
[59,68] 50 63,5
[69,78] 31 73,5
[79,88] 27 83,5
[89,98] 18 93,5
[99,108] 9 103,5
µ = 73, 7 kilogramos.

(ci − µ)2 ni
P
σ2 = = (43, 5 − 73, 7)2 5 + (53, 5 − 73, 7)2 11
N

+(63, 5 − 73, 7)2 50 + (73, 5 − 73, 7)2 31

+(83, 5 − 73, 7)2 27 + (93, 5 − 73, 7)2 18

+(103, 5 − 73, 7)2 9


= 211, 22
151
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Ejemplo 2: La fuerza del pico de corriente necesario para fundir la unidad de


poder de una muestra de equipos.

Fza del pico / unidad No.de


(Kilovoltios) unidades
[3.34,3.74] 4
[3.75,4.15] 4
[4.16,4.56] 13
[4.57,4.97] 23
[4.98,5.38] 32
[5.39,5.79] 17
[5.80,6.20] 5

Calcular la varianza.
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Desviación Estandar
Es la raı́z cuadrada de la varianza.

Desviación estandar para datos no agrupados

Población rP
(xi − µ)2
σ=
N
Muestra s
(xi − x)2
P
s=
n−1
Desviación estandar para datos agrupados

Población: rP
(ci − µ)2 ni
σ=
N
Muestra: s
(ci − X )2 ni
P
s=
n−1
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Ejemplo: Una muestra del tamaño de las fincas de una región se presenta en la
siguiente tabla:
No. de
Hectáreas / finca fincas
[2.03,2.72] 12
[2.73,3.42] 36
[3.43,4.12] 30
[4.13,4.82] 19
[4.83,5.52] 13
[5.53,6.22] 11
[6.23,6.92] 9
Calcular la desviación estandar.
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

No. de
Hectáreas / finca fincas ci
[2.03,2.72] 12 2.375
[2.73,3.42] 36 3.075
[3.43,4.12] 30 3.775
[4.13,4.82] 19 4.475
[4.83,5.52] 13 5.175
[5.53,6.22] 11 5.875
[6.23,6.92] 9 6.575
2,375x12 + 3,075x36 + 3,775x30 + 4,475x19 + 5,175x13 + 5,875x11 + 6,575x9
X =
130
X = 4,065

s2 = (2,375 − 4,065)2 12 + (3,075 − 4,065)2 36 + (3,775 − 4,065)2 30

+(4,475 − 4,065)2 19 + (5,175 − 4,065)2 13 + (5,875 − 4,065)2 11

+(6,575 − 4,065)2 9
= 1,42658
130 − 1

s= s 2 = 1,19439
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Ejemplo: La siguiente tabla es una muestra, en miles de pesos, del valor del
arriendo mensual de vivienda del estrato tres.
Valor arriendo No. De
(miles de pesos) viviendas
[200,219] 12
[220,239] 15
[240,259] 23
[260,279] 22
[280,299] 20
[300,319] 18
[320,339] 15

Calcular la desviación estandar.


Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Coeficiente de variación

Se utiliza para comparar la dispersión de muestras con medias muy diferentes.

Coeficiente de variación para poblaciones


σ
CV =
µ
Coeficiente de variación para muestras
s
CV =
X
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Ejemplo 1: Se tomaron muestras de las ventas diarias, en miles de pesos, de


dos vendedores de una empresa. ¿Cuál de las dos muestras es más dispersa?
Ventas del vendedor A Ventas del vendedor B
500 450 390 600 290 400 440 80 25 23 57 90 10

Ventas del vendedor A Ventas del vendedor B

X = $438, 6 miles, X = $47,5 miles


s = $96, 5 miles s = $33, 1 miles
s s
CV = = 0, 22 CV = = 0, 70
X X
Las ventas de la muestra del vendedor A son menos dispersas que las ventas de
la muestra del vendedor B.
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Ejemplo 2: Una muestra de las ventas por dı́a de un almacén de ropa de moda
y un gran distribuidor textil se presentan en la siguientes tablas. ¿Cuál de los
dos promedios de ventas por dı́a es más confiable?

Jeans and Breeches Distrimoda

Ventas No. de
Ventas No. de
(Millones de $) dı́as
(Millones de $) dı́as
[0.9,1.0] 3
[9.2,10.2] 12
[1.1,1.2] 9
[10.3,11.3] 16
[1.3,1.4] 16
[11.4,12.4] 25
[1.5,1.6] 23
[12.5,13.5] 19
[1.7,1.8] 29
[13.6,14.6] 10
[1.9,2.0] 20
[14.7,15.7] 9
[2.1,2.2] 11
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Jeans and Breeches Distrimoda

Ventas No. de ci
Ventas No. de ci
(Millones de $) dı́as
(Millones de $) dı́as
[0.9,1.0] 3 0.95
[9.2,10.2] 12 9.7
[1.1,1.2] 9 1.15
[10.3,11.3] 16 10.8
[1.3,1.4] 16 1.35
[11.4,12.4] 25 11.9
[1.5,1.6] 23 1.55
[12.5,13.5] 19 13.0
[1.7,1.8] 29 1.75
[13.6,14.6] 10 14.1
[1.9,2.0] 20 1.95
[14.7,15.7] 9 15.2
[2.1,2.2] 11 2.15
Jeans and Breeches

X =?, s =?

CV =?

Distrimoda

X =?, s =?

CV =?
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Desigualdad de Chebyshev

La porción mı́nima de datos que se encuentra en un intervalo comprendido


entre K desviaciones estándar por debajo y por encima de la media aritmética
es:
1
1− 2
K
Donde K es cualquier número mayor que 1.

LI = X − K · s, LS = X + K · s

Donde s es la desviación estándar de la distribución de frecuencias.


Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Ejemplo: Una muestra del tiempo que tienen que esperar los afiliados a una
EPS para que los atiendan en el servicio de urgencias de una clı́nica dio una
media aritmética de 32 minutos, con una desviación estándar de 8,3 minutos.
¿Entre qué intervalo de tiempo tuvieron que esperar como mı́nimo el 80 % de
los afiliados de la muestra?

0, 80 = 1 − 1/K 2 , de donde K = 2, 24.

Los lı́mites del intervalo que se pregunta son:

LI = X − Ks = 32 − 2, 24(8, 3) = 13, 4minutos

LS = X + Ks = 32 + 2, 24(8, 3) = 50, 6minutos


El 80 % de los afiliados a la EPS, de la muestra, tuvieron que esperar entre
13,4 minutos y 50,6 minutos para ser atendidos en el servicio de urgencias.
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Regresión y correlación

Regresión: Relación matemática que existe entre dos o mas variables que estan
conectadas.

Variables dependientes e independientes

A la variable que ocurre primero o que determina el comportamiento de otra se


le llama Variable Independiente y se suele representar por la letra X y a la otra
variable se le llama Variable Dependiente y se suele representar por la letra Y

Ejemplos: 1) Tasa de desempleo y ventas del comercio: La variable


independiente o variable x es la tasa de desempleo y la variable dependiente o
variable y es las ventas del comercio.

2) Accidentes de tránsito y ventas de licor.

3) El número de personas que se movilizan en bus, ventas de motocicletas y


estado del clima.
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Gráfico de dispersión

Es la representación gráfica, en el plano cartesiano, en forma simultánea, de los


valores que toman la variable independiente X y la variable dependiente ”Y”

Ejemplo: Se tomaron datos sobre el kilometraje recorrido por un vehı́culo y el


consumo de gasolina, en galones, como se presenta en la siguiente tabla:

Kilómetros Galones
X Y
30 5, 95
50 8, 55
10 2, 35
40 9, 25
60 13, 85
20 6, 75

Construya el Gráfico de Dispersión.


Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Kilómetros Galones
X Y
30 5, 95
50 8, 55
10 2, 35
40 9, 25
60 13, 85
20 6, 75
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Tipos de relación entre dos o más variables

1) Atendiendo a la cantidad de variables que se relacionan se clasifica en


Regresión Univariada o Regresión Multivariada

2) Atendiendo a la representación gráfica de la ecuación de regresión se


clasifica en Regresión Lineal o Regresión Curvilı́nea.
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Tipos de regresion

Regresión Univariada: Se presenta cuando sólo interviene una variable


independiente

Regresión Multivariada: Se presenta cuando interviene más de una variable


independiente

Regresión lineal: Se presenta cuando la representación gráfica de la ecuación de


regresión es una lı́nea recta.

Regresión Curvilı́nea: Se presenta cuando la representación gráfica de la


ecuación de regresión es una curva.
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Tanto la regresión lineal como la curvilı́nea tienen dos formas de manifestarse:


en forma directa o en forma inversa.

Regresión Lineal Directa: Ocurre cuando al aumentar el valor de la variable


independiente aumenta, proporcionalmente, el valor de la variable dependiente.
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Regresión Lineal Inversa: Ocurre cuando al aumentar el valor de la variable


independiente disminuye el valor de la variable dependiente en una proporción
similar.
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Regresión Curvilı́nea Directa


Ocurre cuando al aumentar de valor la variable independiente, la variable
dependiente aumenta mas que proporcionalmente.
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Regresión Curvilı́nea Inversa Ocurre cuando al aumentar de valor la variable


independiente, la variable dependiente disminuye de valor en forma más que
proporcional.
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Ninguna relación: Ocurre cuando la relación entre la variable dependiente e


independiente no se puede describir con ningún tipo de curva
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Ejemplo: Se comparó el tiempo total que realmente dura encendido, de forma


intermitente, un celular, con la duración de su baterı́a, obteniendo los valores
que se presentan en la siguiente tabla:

celular duración
encendido baterı́a
(segundos) (horas)
360 3, 2
270 3, 5
480 1, 9
120 3, 9
440 2, 3
230 3, 2
160 4, 1

¿Que tipo de regresión es la anterior relación?


Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Ejemplo 2 : Se realiza un estudio para investigar la relación entre el nivel de


humedad del suelo y la tasa de mortalidad en lombrices. La tasa de mortalidad,
Y, es la proporción de lombrices de tierra que mueren tras un periodo de dos
semanas; el nivel de humedad, X, viene medido en milı́metros de agua por
centı́metro cuadrado de suelo. Los datos se muestran en la siguiente tabla.

x 0,31 0,33 0,56 0,6 0,89 0,92 0,96 0,98 1,15 1,20 1,25
y 0,1 0,2 0,15 0,25 0,3 0,35 0,5 0,6 0,55 0,65 0,68

Determine el tipo de regreción.


Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Correlación

Es una medida estadı́stica que expresa hasta qué punto dos variables están
relacionadas linealmente.
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Coeficiente de correlación

Mide el grado de la relación entre dos variables (r).


P
(xi − X )(yi − Y )
r = qP qP
(xi − X )2 (yi − Y )2

r toma valores entre -1 y 1.


Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Si r = 1, existe una correlación directa perfecta.

Si 0 < r < 1 entonces existe una correlación directa.

Si r = 0 entonces no existe relación lineal.

Si −1 < r < 0, existe una correlación inversa.

Si r = −1, existe una correlación inversa perfecta.

Se suele preferir valores de coeficientes de correlación superiores al 0, 9.


Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Ejemplo: Se comparó el tiempo total que realmente dura encendido, de forma


intermitente, un celular, con la duración de su baterı́a, obteniendo los valores
que se presentan en la siguiente tabla:

celular duración
encendido baterı́a
(segundos) (horas)
360 3, 2
270 3, 5
480 1, 9
120 3, 9
440 2, 3
230 3, 2
160 4, 1

Calcular el coeficiente de correlación.

Utilizamos P
(xi − X )(yi − Y )
r = qP qP
(xi − X )2 (yi − Y )2
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

360 + 270 + 480 + 120 + 440 + 230 + 160


X = = 294,28
7
3, 2 + 3, 5 + 1, 9 + 3, 9 + 2, 3 + 3, 2 + 4, 1
Y = = 3, 16
7
P
(xi − X )(yi − Y ) = (360 − 294, 28)(3, 2 − 3, 16) + (270 − 294, 28)(3, 5 − 3, 16)

+(480 − 294, 28)(1, 9 − 3, 16) + (120 − 294, 28)(3, 9 − 3, 16)

+(440 − 294, 28)(2, 3 − 3, 16) + (230 − 294, 28)(3, 2 − 3, 16)

+(160 − 294, 28)(4, 1 − 3, 16) = −600, 5144


Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

(xi − X )2 (360 − 294, 28)2 + (270 − 294, 28)2 + (480 − 294, 28)2
P
=

+(120 − 294, 28)2 + (440 − 294, 28)2 + (230 − 294, 28)2

+(160 − 294, 28)2 = 113171, 43

(yi − Y )2 (3, 2 − 3, 16)2 + (3, 5 − 3, 16)2 + (1, 9 − 3, 16)2


P
=

+(3, 9 − 3, 16)2 + (2, 3 − 3, 16)2 + (3, 2 − 3, 16)2

+(4, 1 − 3, 16)2 = 3, 877


P
(xi − X )(yi − Y ) −600, 5144
r = qP qP = √ √ = −0, 906
(xi − X )2 (yi − Y )2 113171, 43 3, 877

r = -0,91, significa que la correlación entre las dos variables es inversa.


Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Coeficiente de determinación

Es el cuadrado del coeficiente de correlación y es el porcentaje de cambio de la


variable dependiente que se puede explicar por el cambio de la variable
independiente.

Para el ejemplo anterior r = −0, 91, luego

r 2 = (−0, 91)2 = 0, 83

El 83 % de las variaciones en la duración de la baterı́a del celular se deben a las


variaciones en el tiempo total que demora el celular prendido.
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Ejemplo: Se tomaron datos sobre el kilometraje recorrido por un vehı́culo y el


consumo de gasolina, en galones, como se presenta en la siguiente tabla:

Kilómetros Galones
X Y
30 5, 95
50 8, 55
10 2, 35
40 9, 25
60 13, 85
20 6, 75

Calcular los coeficientes de correlación y determinación.


P
(xi − X )(yi − Y )
r = qP qP
(xi − X )2 (yi − Y )2
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Ejemplo Un centro comercial sabe en función de la distancia, en kilómetros, a


la que se sitúe de un núcleo de población, acuden los clientes, en cientos, que
figuran en la tabla:

Nº de Clientes (X) Distancia (Y)


8 15
7 19
6 25
4 23
2 34
1 40

Calcular el coeficiente de determinación.


Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Ecuación de la regresión lineal

La formula de la pendiente de la recta de la regresión lineal es:


P
(xi − X )(yi − Y )
m= P
(yi − Y )2
La ecuación de la recta es de la forma:

Y − Y = m(X − X )

Ejemplo 1: Cinco niños de 2, 3, 5, 7 y 8 años de edad pesan, respectivamente,


14, 20, 32, 42 y 44 kilos. Encontrar la ecuación de la regresion lineal. Si se
mantiene el comportamiento de los datos, ¿cuanto pesaria un niño de 10 años?
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

2+3+5+7+8
X = =5
5

14 + 20 + 32 + 42 + 44
Y = = 30,4
5

P
(xi − X )(yi − Y ) = (2 − 5)(14 − 30,4) + (3 − 5)(20 − 30,4) + (5 − 5)(32 − 30,4)

+(7 − 5)(42 − 30,4) + (8 − 5)(44 − 30,4) = 134

(yi − Y )2 (14 − 30,4)2 + (20 − 30,4)2 + (32 − 30,4)2 + (42 − 30,4)2


P P
=

+(44 − 30,4)2 = 699,2

P
(xi − X )(yi − Y ) 134
m= = = 0,19
699,2
P
(yi − Y )2
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Y − Y = m(X − X )
Luego Y − 30, 4 = 0, 19(X − 5), de donde

Y = 0, 19X + 29,45

Si un niño tiene 10 años es decir X = 10, entonces su peso es de

Y = 0, 19(10) + 29, 45 = 48,45kg.


Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Ejemplo 2: Las notas obtenidas por cinco alumnos en Matemáticas y Quı́mica


son:
Matemáticas Quı́mica
6 6,5
4 4,5
8 7
5 5
3,5 4
Determinar la recta de regresión y calcular la nota esperada en Quı́mica para
un alumno que tiene 7.5 en Matemáticas.
Clase 1 clase 9 clase 10 clase 11 clase 12 clase 13 clase 14 clase 15 clase 16 clas

Ejemplo Un centro comercial sabe en función de la distancia, en kilómetros, a


la que se sitúe de un núcleo de población, acuden los clientes, en cientos, que
figuran en la tabla:

Nº de Clientes (X) Distancia (Y)


8 15
7 19
6 25
4 23
2 34
1 40

Determinar la recta de regresión.

También podría gustarte