Documentos de Académico
Documentos de Profesional
Documentos de Cultura
INTRODUCCIÓN .................................................................................................... 3
2. REGRESIONES ............................................................................................... 18
2.1 CONCEPTO ............................................................................................................................... 18
2.2 REGRESIÓN LINEAL .................................................................................................................. 18
2.2.1 Regresión lineal simple..................................................................................................... 19
2.2.2 Covarianza ........................................................................................................................ 26
2.2.3 Coeficiente de correlación ............................................................................................... 29
TALLER ................................................................................................................ 35
GLOSARIO ........................................................................................................... 37
BIBLIOGRAFÍA .................................................................................................... 37
INTRODUCCIÓN
Sin embargo, cabe aclarar que en el transcurso del proceso, se brindarán los
conceptos necesarios para abordar cada temática.
Competencias
Determinar las medidas de dispersión, tanto para datos agrupados, como para
no agrupados
Interpretar las medidas de dispersión, al relacionarlas con las medidas de
tendencia central
Identificar variables que se relacionan para ajustar sus diferentes valores a una
regresión lineal
Determinar la regresión lineal que relaciona un par de variables
Comprobar la fuerza de la relación que existe entre las variables a través del
coeficiente de correlación.
1. MEDIDAS DE DISPERSIÓN
Esta medida es la distancia que hay entre el dato mayor y el dato menor del
conjunto. Según García (s.f.), esta medida es sin duda la más fácil de obtener,
además su comprensión también es sencilla. Sin embargo, solamente considera los
valores extremos del conjunto, y no proporciona mayor información acerca de los
demás, por lo cual, para los diferentes análisis estadísticos, su utilidad es limitada.
70 63 67 68 67 66 76 64 70 66
64 58 56 68 61 67 62 61 81 64
68 77 71 59 69 65 75 67 73 62
68 63 71 74 70 63 76 66 64 64
79 83 66 77 70 66 69 69 58 67
65 67 80 59 54 52 61 71 62 69
61 67 65 57 62 78 63 67 57 67
72 70 68 66 70 65 65 67 72 73
83 − 52 = 31
Frecuenci
Frecuenci
Frecuenci
acumulad
acumulad
a relativa
Marca
Clase
de clase
a
[235,240) 237.5 5 0.08 0.08 5
TOTAL 60 ≈1
Para determinar el rango, se toma el dato mayor de la última clase (260) y el dato
menor de la primera clase (235), y se restan
260 − 235 = 25
Este valor se refiere a la diferencia que existe entre el primer y tercer cuartil. La
forma de determinarlo es diferente para datos no agrupados y agrupados.
20 49 59 18
32 32 63 24
20 32 53 48
18 20 20 24
32 32 32 48
49 53 59 63
𝑛∗𝑘
𝑄𝑖 =
100
Primer cuartil
12 ∗ 25
𝑄1 = =3
100
De aquí se dice que se toman los valores que están en la posición 3 y 4, y se dividen
entre 2
20 + 24
𝑄1 = = 22
2
Tercer cuartil
12 ∗ 75
𝑄3 = =9
100
De aquí se dice que se toman los valores de las posiciones 9 y 10, y se dividen entre
2
49 + 53
𝑄3 = = 51
2
Con estos datos se dice que a partir de los 22 años hasta los 51, se encuentra el
50% central de los datos, y al determinar el rango intercuartílico, se tiene entonces
que:
51 − 22 = 29
Por tanto, se dice que la distancia entre el 50% central de los datos, es de 29 años.
1.1.3.2 Rango intercuartílico para datos agrupados
Frecuenci
Frecuenci
a Relativa
Absoluta
Frecuencia
Frecuencia
acumulada
acumulada
Límites Marca
absoluta
Clase
relativa
Límites de
reales de de
a
clase
clase clase
𝑛∗𝑘
− 𝐹𝑎
𝑄𝑖 = 𝐿𝑟𝑖 + 4 ∗ (𝐴𝑐)
𝐹𝑖
Siendo
Para determinar el primer cuartil, primero se divide el total de datos (40, valor
obtenido al sumar las frecuencias absolutas) entre cuatro partes iguales (cuartiles)
40
= 10
4
El dato que está en la posición 10 es el 13, y este dato está contenido en la clase o
intervalo número 2; de esta forma, se procede a definir los datos necesarios para
determinar el primer cuartil.
Lri=11.5
n=40
Fa=7
𝐹𝑖 =5
Ac=3
k=1
Se reemplazan en la ecuación
40
−7 10 − 7
𝑄1 = 11.5 + 4 ∗ (3) = 11.5 + ∗ (3) = 13.3
5 5
Tercer cuartil
𝑛 ∗ 𝑘 40 ∗ 3
= = 30
4 4
Lri=17.5
n=40
Fa=19
𝐹𝑖 =11
Ac=3
k=3
Se reemplazan en la ecuación
40 ∗ 3
− 19 30 − 19
𝑄3 = 17.5 + 4 ∗ (3) = 17.5 + ∗ (3) = 20.5
11 11
Con estos datos se dice que a partir de los 13.3 kilogramos hasta los 20.5
kilogramos, se encuentra el 50% central de los datos, y al determinar el rango
intercuartílico:
Se dice que la distancia entre el 50% central de los datos, es de 7.2 kilogramos.
Ahora, en caso de que no se cuente con el conjunto de origen de los datos, sino
solamente la tabla de distribución de frecuencias, se tiene otro método para
determinar los cuartiles (Vigna, 2010), haciendo uso de la misma fórmula:
𝑛∗𝑘
− 𝐹𝑎
𝑄𝑖 = 𝐿𝑟𝑖 + 4 ∗ (𝐴𝑐)
𝐹𝑖
En el caso del primer cuartil, para identificar la clase que lo contiene, se revisa cuál
tiene una frecuencia relativa acumulada, que sea igual a 0.25 (25%), o un valor
superior cercano. Para el ejemplo, la clase número 2, tiene una frecuencia relativa
acumulada de 0.3; es el valor superior más cercano a 0.25; es decir, de esta clase
se deben extraer los datos que se van a reemplazar en la ecuación, lo cual confirma
lo que se realizó anteriormente para determinar el primer cuartil.
Y para el tercer cuartil, se revisa cuál clase tiene una frecuencia relativa acumulada,
igual a 0.75 (75%), o un valor superior cercano. En este caso, la clase número 4,
tiene exactamente una frecuencia relativa acumulada igual a 0.75; basándose en
esta clase, se deben definir los datos necesarios para reemplazar en la ecuación, y
esto confirma el procedimiento realizado anteriormente para determinar el tercer
cuartil.
Video de apoyo
https://www.youtube.com//embed/d__Ib3AsviE
1.2 VARIANZA
La Varianza es básicamente la distancia promedio que existe entre cada uno de los
datos y su media aritmética o promedio. Se puede determinar la varianza de una
población y/o de una muestra, para lo cual, se tienen las siguientes fórmulas:
∑𝑛𝑖=1(𝑋𝑖 − 𝑋̅)2
𝑆2 =
𝑛
∑𝑛𝑖=1(𝑋𝑖 − 𝑋̅)2
𝑆2 =
𝑛−1
Donde:
𝑋𝑖 : i-ésima observación del conjunto
𝑋̅: media aritmética de los datos
𝑛: tamaño de la muestra
38
𝑋̅ = = 6.33
6
2
(5 − 6.33)2 + (7 − 6.33)2 + (8 − 6.33)2 + (3 − 6.33)2 + (6 − 6.33)2 + (9 − 6.33)2
𝑆 =
5
23.33
𝑆2 = = 4.7
5
Nota: recordar que el denominador (“n” o “n-1”) depende del tipo de varianza que
se esté determinando, si de una población o de una muestra.
2
∑𝑛𝑖=1(𝑚𝑖 − 𝑋̅)2 ∗ 𝑓𝑖
𝑆 =
𝑛−1
Donde:
𝑚𝑖 : marca de clase del intervalo en la posición i
𝑋̅: media aritmética de los datos
𝑓𝑖 : frecuencia absoluta del intervalo en la posición i
𝑛: tamaño de la muestra
Temperatura N° de días
(°C)
[27,28) 4
[28,29) 8
[29,30) 7
[30,31) 12
[31,32) 15
[32,33) 11
[33,34) 2
[34,35) 2
TOTAL 61
En la unidad 2, en el tema sobre Medidas de Tendencia Central para datos
agrupados, se determinó la media aritmética basada en la tabla anterior, haciendo
uso de la siguiente fórmula:
Donde:
N : Número total de datos
𝑿𝒊 : marca de clase del intervalo en la posición i
𝒇𝒊 : frecuencia del intervalo en la posición i
k : número de clases
Se obtuvo lo siguiente:
1876.5
𝑋̅ = = 30.8
61
Marca de N° de días
Temperatura clase ( 𝒎𝒊 ) (𝒇𝒊 ) ̅ )𝟐
(𝒎𝒊 − 𝑿
∗ 𝒇𝒊
[27,28) 27.5 4 43.56
[28,29) 28.5 8 42.32
[29,30) 29.5 7 11.83
[30,31) 30.5 12 1.08
[31,32) 31.5 15 7.35
[32,33) 32.5 11 31.79
[33,34) 33.5 2 14.58
[34,35) 34.5 2 27.38
TOTAL 61 179.89
2
∑𝑛𝑖=1(𝑚𝑖 − 𝑋̅)2 ∗ 𝑓𝑖
𝑆 =
𝑛−1
179.89
𝑆2 =
60
𝑆 2 = 2.99
1.3 DESVIACIÓN TÍPICA O ESTÁNDAR
𝑆 2 = 4.7
𝑆 = 2.16
Con esto se dice que la variación de los datos respecto a la media aritmética, es
relativamente pequeña, por lo que podría confiarse en que este valor, más o menos
puede representar el conjunto de datos.
𝑆 2 = 2.99
𝑆 = 1.72
Videos de apoyo
https://www.youtube.com//embed/nHeiIR_Gaug
Video de apoyo
https://www.youtube.com//embed/vrgxWXAa9MY
Según García (s.f.), la Desviación Media (MD), mide la desviación promedio de los
valores, con respecto a la media del grupo, sin tomar en cuenta el signo de la
desviación, por lo que se hace uso del valor absoluto de la distancia entre cada dato
y la media aritmética, y se determina de manera diferente para datos agrupados y
no agrupados.
Nota: en este caso, al igual que para la desviación estándar, el denominador “n” o
“n-1”, depende del valor que se quiera determinar, es decir, si es para una población
o para una muestra respectivamente.
38
𝑋̅ = = 6.33
6
Entonces se procede a
|𝑋1 − 𝑋̅| + |𝑋2 − 𝑋̅| + |𝑋3 − 𝑋̅| + |𝑋4 − 𝑋̅| + |𝑋5 − 𝑋̅| + |𝑋6 − 𝑋̅|
𝐷𝑥 =
𝑛−1
∑𝑛𝑖=1|𝑚𝑖 − 𝑋̅| ∗ 𝑓𝑖
𝐷𝑥 =
𝑛−1
Temperatura N° de días
(°C)
[27,28) 4
[28,29) 8
[29,30) 7
[30,31) 12
[31,32) 15
[32,33) 11
[33,34) 2
[34,35) 2
TOTAL 61
1876.5
Donde se obtuvo como media aritmética: 𝑋̅ = = 30.8
61
86.3
𝐷𝑥 =
60
𝐷𝑥 = 1.43
Para este caso, también se observa que esta desviación media no difiere mucho de
la desviación estándar.
𝑆
𝐶𝑉 = ∗ 100
𝑋̅
Donde:
𝑆: Desviación estándar del conjunto de datos
𝑋̅: Media aritmética del conjunto de datos
𝑆
𝐶𝑉 =
𝑋̅
2.16
𝐶𝑉 =
6.33
𝐶𝑉 = 0.34
𝑆 = 1.72
𝑋̅ = 30.8
1.72
𝐶𝑉 =
30.8
𝐶𝑉 = 0.05
El valor obtenido es bastante cercano a 0 (cero), por lo que se dice que en esta
muestra, la variabilidad es mínima.
Video de apoyo
https://www.youtube.com//embed/UqMHmRzlOiU
Documento de Apoyo
http://www.saber.ula.ve/bitstream/123456789/34394/1/Libro_Completo.pdf
Favor dirigirse al material interactivo y desarrolle el “EJERCICIO DE REPASO 1”
2. REGRESIONES
2.1 CONCEPTO
Este término lo introdujo por primera vez Francis Galton en su libro “Natural
Inheritance” (Patrimonio natural), en 1889; el trabajo que él realizó, se basó en
describir los rasgos físicos de descendientes (hijos) basándose en los de sus
padres. Es decir, estudió por ejemplo, la estatura de los hijos (una variable) y la de
los padres (otra variable), para lograr diseñar una “fórmula” en la que, teniendo la
estatura de los padres, se podría predecir la estatura de los hijos; dicha “fórmula”
es la ecuación de una línea recta. De aquí se dice, según López (s.f.), que el sentido
de la regresión lineal, es poder predecir la medida de determinada variable,
conociendo la medida de otra con la cual se relaciona.
El proceso de ajustar los datos a una regresión lineal, se realiza con el fin de verificar
el comportamiento que estos tienen, es decir, si realmente una variable depende de
la otra.
Para esto se deben determinar los valores que son fijos en la ecuación de la recta,
de tal forma que solo sea necesario reemplazar el valor de una variable para obtener
el de la otra.
𝑦 = 𝑓(𝑥) = 𝑚𝑥 + 𝑏
𝑦 = 𝑓(𝑥)
A la variable “x” se le conoce como independiente, ya que toma valores sin depender
una de otra; se denomina también variable explicativa.
Ahora, hay que recordar que en la ecuación de la línea recta, la “m” está indicando
la pendiente, en este caso:
𝑦 = 𝑚𝑥 + 𝑏
Teniendo en cuenta que los valores de “m” y de “b” en la ecuación son fijos, se
tienen las siguientes fórmulas para determinarlos, teniendo los valores de “x” e “y”.
Una compañía de seguros considera que el número de vehículos que circulan por
determinada autopista a más de 120 km/h, puede ponerse en función del número
de accidentes (x) que ocurren en ella. Durante cinco días se obtuvieron los
siguientes datos:
Accidentes (𝒙𝒊 ) 5 7 2 1 9
Vehículos (𝒚𝒊 ) 15 18 10 8 20
SOLUCIÓN
a) Para construir la regresión lineal, se deben determinar los valores de “m”
y de “b”; para esto se hace uso de las ecuaciones dadas anteriormente.
Pero antes, con ayuda de la siguiente tabla, se hallarán los valores
necesarios para reemplazar en las fórmulas.
𝒙 𝒚 𝒙∗𝒚 𝒙𝟐
5 15 75 25
7 18 126 49
2 10 20 4
1 8 8 1
9 20 180 81
TOTAL 24 71 409 160
341
𝑚=
224
𝑚 = 1.522
Para determinar “b”, se requieren las medias aritméticas de las variables “x” e “y”
24
𝑥̅ = = 4.8
5
71
𝑦̅ = = 14.2
5
Los valores obtenidos junto con el valor de “m”, se usan para determinar “b”
𝑏 = 6.894
De esta manera, la ecuación que ajusta los datos a una regresión lineal, es:
𝑦 = 1.522 𝑥 + 6.894
𝑦 = (1.522 ∗ 6) + 6.894
𝑦 = 16.02
Así se dice que el día que hubo seis accidentes en la autopista, circularon 16 autos
a más de 120 km/h.
Para graficar se toman los valores de “x” e “y”, y se ubican en el plano cartesiano
de la misma forma que se procede para graficar una función lineal.
15
10 Vehículos
Lineal (Vehículos)
5
0
0 2 4 6 8 10
Accidentes
Para obtener la línea de color morado, se toman el valor máximo y mínimo de “x”, y
se reemplazan en la ecuación lineal que se determinó,
Finalmente, se verifica la asociación lineal positiva que existe entre las variables,
además se visualiza que los puntos de color naranja, casi están sobre la línea, por
lo que se dice que la ecuación lineal determinada se ajusta a los datos.
Video de apoyo
https://www.youtube.com//embed/7zvKWzyeB2o
Una compañía de bienes raíces residenciales en cierta ciudad, desea poder predecir
los costos mensuales de rentas para departamentos, basados en su tamaño medido
en pies cuadrados. Para esto, selecciona una muestra de 25 departamentos, de los
cuales tiene su tamaño y el valor de la respectiva renta.
SOLUCIÓN
𝒙 𝒚 𝒙∗𝒚 𝒙𝟐
850 950 807500 722500
1450 1600 2320000 2102500
1085 1200 1302000 1177225
1232 1500 1848000 1517824
718 950 682100 515524
1485 1700 2524500 2205225
1136 1650 1874400 1290496
726 935 678810 527076
700 875 612500 490000
956 1150 1099400 913936
1100 1400 1540000 1210000
1270 1650 2095500 1612900
1985 2300 4565500 3940225
1369 1800 2464200 1874161
1175 1400 1645000 1380625
1225 1450 1776250 1500625
1245 1100 1369500 1550025
1259 1700 2140300 1585081
1150 1200 1380000 1322500
896 1170 1048320 802816
1361 1600 2177600 1852321
1040 1650 1716000 1081600
785 1200 942000 616225
1010 800 808000 1020100
1210 1750 2117500 1464100
TOTAL 28418 34680 41534880 34275610
Estos totales son los que se van a usar en la fórmula para determinar
el valor de “m”
52835760
𝑚=
49307526
𝑚 = 1.071
28418
𝑥̅ = = 1136.72
25
34680
𝑦̅ = = 1387.2
25
𝑏 = 169.77
Así que la ecuación de la regresión que relaciona el tamaño de los
departamentos con el respectivo valor de la renta, es:
𝑦 = 1.071𝑥 + 169.77
2000
1500
Series1
1000
Lineal (Series1)
500
0
0 500 1000 1500 2000 2500
Tamaño del departamento
2.2.2 Covarianza
∑𝑛𝑖=1 𝑋𝑖 𝑌𝑖
𝐶𝑜𝑣(𝑥. 𝑦) = − (𝑋̅ ∗ 𝑌̅)
𝑛
Ejemplo 1
∑ 𝑋𝑖 𝑌𝑖 = 409
𝑖=1
𝑋̅ = 4.8
𝑌̅ = 14.2
𝑛=5
𝐶𝑜𝑣(𝑥. 𝑦) = 13.64
Con esto se confirma que las variables tienen una relación directa (positiva),
ya que el coeficiente de regresión, mostró la misma situación (m=1.522), y
en este caso, el valor de la covarianza según la interpretación que se debe
dar (𝐶𝑜𝑣(𝑥, 𝑦) > 0), muestra dicha relación entre las variables. Como se dijo
anteriormente, entre más accidentes se presentan, esto indica que la
circulación de autos a más de 120 km/h, también aumentó.
Ejemplo 2
∑ 𝑋𝑖 𝑌𝑖 = 41534880
𝑖=1
𝑋̅ = 1136.72
𝑌̅ = 1387.2
𝑛 = 25
41534880
𝐶𝑜𝑣(𝑥. 𝑦) = − (1136.72 ∗ 1387.2)
25
𝐶𝑜𝑣(𝑥. 𝑦) = 83537.216
Este valor oscila entre 1 y -1; entre más se acerque a estos límites, se puede decir
que existe una relación perfecta.
𝐶𝑜𝑣(𝑥. 𝑦)
𝑟(𝑥.𝑦) =
𝑆(𝑥) ∗ 𝑆(𝑦)
Siendo 𝑆(𝑥) y 𝑆(𝑦) , las desviaciones estándar de las variables “x” e “y”
respectivamente.
Ejemplo 1.
(𝑋1 − 𝑋̅)2 + (𝑋2 − 𝑋̅)2 + (𝑋3 − 𝑋̅)2 + (𝑋4 − 𝑋̅)2 + (𝑋5 − 𝑋̅)2
𝑆2 =
𝑛−1
2
(5 − 4.8)2 + (7 − 4.8)2 + (2 − 4.8)2 + (1 − 4.8)2 + (9 − 4.8)2
𝑆 =
5−1
44.8
𝑆2 =
4
𝑆 2 = 11.2
𝑆(𝑥) = 3.35
2
(𝑌1 − 𝑌̅)2 + (𝑌2 − 𝑌̅)2 + (𝑌3 − 𝑌̅)2 + (𝑌4 − 𝑌̅)2 + (𝑌5 − 𝑌̅)2
𝑆 =
𝑛−1
𝑌̅ = 14.2
𝑆 2 = 26.2
𝑆(𝑦) = 5.12
𝐶𝑜𝑣(𝑥. 𝑦) = 13.64
𝑟(𝑥.𝑦) = 0.8
Con este valor, se observa que existe una relación directa bastante fuerte entre las
variables, (se acerca a 1), lo cual se evidenció al realizar la gráfica y al determinar
la covarianza.
Ejemplo 2:
Ya se tiene el valor de la covarianza, así que hace falta hallar las desviaciones
estándar de las variables. Teniendo en cuenta que son 25 datos, en este caso no
se trabajará la fórmula directamente, sino que se realizará la siguiente tabla, la cual
proporcionará los datos necesarios para determinar las desviaciones estándar.
𝑋̅ = 1136.72
Ahora la tabla resulta:
𝒙 ̅
𝑿𝒊 − 𝑿 ̅ )𝟐
(𝑿𝒊 − 𝑿
850 -286,72 82208,3584
1450 313,28 98144,3584
1085 -51,72 2674,9584
1232 95,28 9078,2784
718 -418,72 175326,438
1485 348,28 121298,958
1136 -0,72 0,5184
726 -410,72 168690,918
700 -436,72 190724,358
956 -180,72 32659,7184
1100 -36,72 1348,3584
1270 133,28 17763,5584
1985 848,28 719578,958
1369 232,28 53953,9984
1175 38,28 1465,3584
1225 88,28 7793,3584
1245 108,28 11724,5584
1259 122,28 14952,3984
1150 13,28 176,3584
896 -240,72 57946,1184
1361 224,28 50301,5184
1040 -96,72 9354,7584
785 -351,72 123706,958
1010 -126,72 16057,9584
1210 73,28 5369,9584
TOTAL 28418 -191,44 1972301,04
Tomando los datos de la tabla, se determina la varianza y luego la desviación
estándar
1972301,04
𝑆2 =
24
𝑆(𝑥) = 286.66
𝑌̅ = 1387.2
Ahora la tabla resulta:
𝒚 ̅
𝒀𝒊 − 𝒀 ̅ )𝟐
(𝒀𝒊 − 𝒀
950 -437,2 191143,84
1600 212,8 45283,84
1200 -187,2 35043,84
1500 112,8 12723,84
950 -437,2 191143,84
1700 312,8 97843,84
1650 262,8 69063,84
935 -452,2 204484,84
875 -512,2 262348,84
1150 -237,2 56263,84
1400 12,8 163,84
1650 262,8 69063,84
2300 912,8 833203,84
1800 412,8 170403,84
1400 12,8 163,84
1450 62,8 3943,84
1100 -287,2 82483,84
1700 312,8 97843,84
1200 -187,2 35043,84
1170 -217,2 47175,84
1600 212,8 45283,84
1650 262,8 69063,84
1200 -187,2 35043,84
800 -587,2 344803,84
1750 362,8 131623,84
TOTAL 34680 -0,12 3130758,94
Tomando los datos de la tabla, se determina la varianza y luego la desviación
estándar
3130758.94
𝑆2 =
24
𝑆(𝑦) = 361.17
𝐶𝑜𝑣(𝑥. 𝑦) = 83537.216
83537.216
𝑟(𝑥.𝑦) =
286.66 ∗ 361.17
𝑟(𝑥.𝑦) = 0.6
Con este resultado, se evidencia que la relación lineal entre el tamaño del
departamento y la renta, según los datos proporcionados, no es tan fuerte como se
esperaría, lo cual se evidenció con la gráfica y con el valor de la covarianza.
Video de apoyo
https://www.youtube.com//embed/_g_hIebKlvQ
Documento de Apoyo
http://www.dcb.unam.mx/profesores/irene/Notas/Regresion.pdf
Documento de Apoyo
http://es.slideshare.net/lexoruiz/regresin-lineal-y-correlacin
Actividad 1. Taller:
“Apellido_Nombre_Actividad_1”
Ejemplo: “Castillo_Anderson_Actividad_1”
Actividad 2. Taller:
El taller debe cargarse al Aula Virtual, en formato pdf; los archivos que se envíen
en formatos diferentes, no serán revisados ni calificados.
“Apellido_Nombre_Actividad_ 2”
Ejemplo: “Castillo_Anderson_Actividad_2”
70 63 67 68 67 66 76 64 70 66
64 58 56 68 61 67 62 61 81 64
68 77 71 59 69 65 75 67 73 62
68 63 71 74 70 63 76 66 64 64
79 83 66 77 70 66 69 69 58 67
65 67 80 59 54 52 61 71 62 69
61 67 65 57 62 78 63 67 57 67
72 70 68 66 70 65 65 67 72 73
Determinar las medidas de dispersión para decidir, qué tan confiables son las
medidas de tendencia central de este conjunto de datos.
a absoluta
a relativa
a absoluta
Frecuenci
Frecuenci
Frecuenci
Frecuenci
acumulad
acumulad
a relativa
Marca
Clase
de clase
a
a
[235,245) 240 17 0.24 0.24 17
[245,255) 250 11 0.16 0.40 28
[255,265) 260 17 0.24 0.64 45
[265,275) 270 15 0.22 0.86 60
[275,285) 280 10 0.14 1 70
TOTAL 70 1
N° de Costo
páginas ($)
170 2000
290 3200
300 3500
180 2100
310 4400
240 2900
220 2600
210 2650
280 3300
250 3000
PESO
EDAD
(kg)
17 52
15 48
18 55
16 54
19 58
15 50
14 47
17 54
20 60
19 59
5.
Un granjero distribuye huevos en varias ciudades aledañas. En el transcurso del
viaje, algunos huevos se rompen, se agrietan, por lo cual, no pueden ser
vendidos. Desde hace 50 días, el granjero viene registrando el número de
huevos que no se han logrado vender.
15 10 9 11 15 16 9 10 10 10
12 14 14 15 11 11 12 16 15 17
16 16 15 14 10 11 11 11 12 12
12 11 13 14 16 15 18 19 18 10
11 12 12 11 13 13 15 13 12 14
Dispersión: característica importante del conjunto de datos que indica, qué tan
separados se encuentran respecto a una medida de tendencia central. (García, s.f.)
Correlación: indica el nivel de la relación que existe entre dos variables. Es decir,
el coeficiente de correlación muestra si realmente los datos tienden a disponerse de
forma lineal, (López, s.f.)
Efecto causal: el efecto que tiene una variable sobre otra, es decir, si una variable
influye sobre otra, el cambio en la variable influyente, necesariamente generará un
cambio en la variable influida, (Pérez, 2010)
BIBLIOGRAFÍA