Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ESTADISTICA UNIDAD
2: TAREA 6
1. Un entusiasta de las caminatas tiene una nueva aplicación para su teléfono inteligente que
resume sus caminatas usando un dispositivo GPS. Veamos la distancia recorrida (en km)
y la altitud máxima (en m) durante las últimas 10 caminatas.
Distancia 12,5 29,9 14,8 18,7 7,6 16,2 16,5 27,4 12,1 17,5
Altitud 342 1245 502 555 398 670 796 912 238 466
a) Calcule la media aritmética y la mediana tanto para la distancia como para la altitud.
Distancia 7.6 12.1 12.5 14.8 16.2 16.5 17.5 18.7 27.4 29.9
Altitud 238 342 398 466 502 555 670 796 912 1245
Distancia
Altitud
3
b) Determine el primer y tercer cuartiles para las variables de distancia y altitud.
Distancia
Q1 Q2 Q3
12.5 16.35 18.7
Altitud
Q1 Q2 Q3
398 528.5 796
La distancia cuenta con datos cuyo promedio es de 17.32 y una mediana de 16.35 mientras en la altitud
podemos decir que el valor promedio se ubica en 612.40 y la mediana 528.50, de los cuartiles
determinados concluimos que en la distancia el 25% de los datos son iguales o inferiores a 12.5, el 50%
iguales o inferiores a 16.35% y el 75% iguales o inferiores a 18.70. En lo que se refiere a la altitud el
25% igual o inferior a 398, el 50% igual o inferior a 528.5, el 75% igual o inferior a 796 y el 25% restante
es superior a 796.
De los datos expuestos nos muestran que tan dispersos se encuentran los datos unos de otros, por
lo cual podemos decir que la distancia no presenta mayor dispersión sin embargo en la altitud existe
mayor dispersión de los datos entre sí.
4
e) Un metro corresponde aproximadamente 3.28 pies. ¿Cuál la altitud promedio
cuando se mide en pies en lugar de metros?
Altitud 780.64 1121.76 1305.44 1528.48 1646.56 1820.4 2197.6 2610.88 2991.36 4083.6
Media = 2008.67
f ) Dibuje e interprete el diagrama de caja tanto para la distancia como para la altitud.
Distancia
Mínimo Q1 Q2 Q3 Máximo
7.6 12.5 16.35 18.7 27.4
IQR=Q3-Q1
IQR= 18.70-12.5
IQR = 6.2
LI = 12.50 -1.5X6.20
LI = 12.50 -1.5X6.20
LI = 3.2
0 5 10 15 20 25 30
5
Altitud
Mínimo Q1 Q2 Q3 Máximo
238 398 528.5 796 1245
IQR=Q3-Q1
IQR= 796-398
IQR = 398
LI = 398 -1.5X398
LI = 398 -1.5X398
LI = -199
2. El conjunto rankingconstruccion.csv contiene los datos del año 2018 de las empresas que
se dedican al sector de la construcción. La revista Vistazo elabora cada año un ranking
de las empresas por cada sector de la producción al que pertenecen las empresas y un
ranking general. Investigue el uso de la función top n y con la ayuda de esta función
seleccione las primeras 500 empresas de acuerdo a la utilidad, almacene estos resultados
en el un conjunto llamado rank500 construccion y de este conjunto de datos, realice los
siguientes ejercicios:
6
Cálculo de intervalos
Límite
Límite inferior superior Marca de clase fi hi Fi Hi
- 13,000,000.00
6,500,000.00 496 0.992 496 0.992
13,000,001.00 26,000,001.00 19,500,001.00 2 0.004 498 0.996
26,000,002.00 39,000,002.00 32,500,002.00 0 0 498 0.996
39,000,003.00 52,000,003.00 45,500,003.00 0 0 498 0.996
52,000,004.00 65,000,004.00 58,500,004.00 0 0 498 0.996
65,000,005.00 78,000,005.00 71,500,005.00 1 0.002 499 0.998
78,000,006.00 91,000,006.00 84,500,006.00 0 0 499 0.998
91,000,007.00 104,000,007.00 97,500,007.00 0 0 499 0.998
104,000,008.00 117,000,008.00 110,500,008.00 0 0 499 0.998
117,000,009.00 130,000,009.00 123,500,009.00 1 0.002 500 1
Total 500 1
Clase fi hi Fi Hi
Mercado de
Valores
7 0.014 7 0.014
Societario 493 0.986 500 1
Total 500 1
7
c) Elabore una tabla de frecuencia con las ventas de las empresas.
Cálculo de intervalos
8
Cuenta de TAMAÑO Etiquetas de columna
Total
Etiquetas de fila GRANDE MEDIANA MICROEMPRESA PEQUEÑA general
COSTA 40 97 6 103 246
GALAPAGOS 2 2
ORIENTE 1 12 13
SIERRA 45 93 2 99 239
Total general 85 191 8 216 500
200 216
191
150
100
85
50
8
0
GRANDE MEDIANA MICROEMPRESA PEQUEÑA
9
g) Determine las medidas de tendencia central y de dispersión de las ventas de acuerdo
a la región, almacene los resultados en una tabla llamada ‘ventas construccion‘
y guarde sus resultados en una hoja de cálculo.
Ventas Generadas
10
Costa
MEDIA 3,403,142.41
MEDIANA 1,078,182.53
MODA -
RANGO 86,200,565.83
VARIANZA 66,069,253,130,983.50
DESVIACION 8,144,871.00
Sierra
MEDIA 7,106,743.86
MEDIANA 1,097,637.93
MODA -
RANGO 540,055,203.08
VARIANZA 1,556,980,098,510,470.00
DESVIACION 39,541,396.43
Oriente
MEDIA 504,234.24
MEDIANA 322,531.52
MODA #N/A
RANGO 2,697,054.58
VARIANZA 462,561,062,428.50
DESVIACION 707,889.69
11
Galápagos
MEDIA 390,445.87
MEDIANA 390,445.87
MODA -
RANGO 38,796.75
VARIANZA 376,296,952.64
DESVIACION 27,433.45
Q1 Q2 Q3
35.832,93 58.652,82 149.498,69
Qn = K.n/4
Q1= 1(500) /4
Q1=125 posición que ubica a 35.832,93
Q2 = Media = 58.652,82
Q3 = 3(500) /4 = 1500/4 = 375 posición que ubica a 149.498,69
Q1 Q2 Q3
37.654,85 60.137,90 152.706,65
Tipo: Consorcio
Q1 Q2 Q3
145,261.79 1,604,638.56 129,057,228.00
Responsabilidad Limitada
Q1 Q2 Q3
31.920,43 46.837,85 108.587,11
12
Sucursal Extranjera
Q1 Q2 Q3
147,720.58 214,748.78 539,223.86
Cálculo de intervalos
Límite
Límite inferior superior Marca de clase fi fi hi Fi Hi
- 13,000,000.00 6,500,000.00 471 496 0.992 496 0.996
13,000,001.00 26,000,001.00
19,500,001.00 19 2 0.004 498 0.004
26,000,002.00 39,000,002.00 32,500,002.00 2 0 0 498 0
39,000,003.00 52,000,003.00
45,500,003.00 0 0 0 498 0
52,000,004.00 65,000,004.00 58,500,004.00 2 0 0 498 0.002
65,000,005.00 78,000,005.00 71,500,005.00 1 1 0.002 499 0.002
78,000,006.00 91,000,006.00
84,500,006.00 3 0 0 499 0
91,000,007.00 104,000,007.00
97,500,007.00 0 0 0 499 0
104,000,008.00 117,000,008.00 110,500,008.00 0 0 0 499 0.002
117,000,009.00 130,000,009.00 123,500,009.00 0 1 0.002 500 0.002
Total 498 500 1.0
13
Cajas y Bigotes Utilidades
Sociedad Anónima
Responsabilidad Limitada
14
Sociedad Extranjera
- 100.000,02
000.000,03000.000,04000.000,00
500.000,06000.000,07
000.000,00
Suma de
Etiquetas de fila UTILIDAD
ANÓNIMA 152,892,838.90
ASOCIACIÓN O CONSORCIO 130,807,128.35
ECONOMÍA MIXTA 964,706.72
RESPONSABILIDAD LIMITADA 22,070,098.62
SUCURSAL EXTRANJERA 26,650,463.99
Total general 333,385,236.58
a) Cargar cada conjunto de datos por separado, almacenando cada conjunto en una
variable que usted decida.
b) Unir los conjuntos de datos en un solo conjunto, para esto debe utilizar la función
rbind( ). Investigue el uso de esta función y utilı́cela para formar un único conjunto
de datos.
c) Con ayuda de la función top n( ) seleccione las primeras 500 empresas de acuerdo
a la utilidad. Guarde este ranking en un conjunto llamado ranking2018todos. Con el
conjunto ranking2018todos se pide:
15
Etiquetas de fila Suma de UTILIDAD
AGRICULTURA 163,602,533.12
COMERCIO 1,022,814,718.00
CONSTRUCCIÓN 283,151,556.52
INMOBILIARIA 90,234,107.46
MANUFACTURA 870,167,286.19
Total general 2,429,970,201.29
Media 2,921,473.81
Mediana 1,168,744.58
Moda #N/A
Rango 22,001,909.55
Varianza 1.860574654074E+13
Desviación 4313437.903
• Sector Comercio
Media 4,757,277.76
Mediana 1,729,237.37
Moda #N/A
Rango 153,234,719.64
Varianza 1.478996696219E+14
Desviación 12,161,400.81
• Sector Construcción
Media 8,327,986.96
Mediana 1,480,333.61
Moda #N/A
Rango 128,281,384.94
Varianza 5.870180933627E+14
Desviación 24,228,456.27
• Sector Inmobiliario
Media 2,200,831.89
Mediana 1,455,948.38
Moda #N/A
Rango 6,619,590.91
16
Varianza 3.035695071593E+12
Desviación 1,742,324.62
• Sector Manufactura
Media 5,650,436.92
Mediana 1,841,113.13
Moda #N/A
Rango 113,700,137.37
Varianza 1.949504571647
Desviación 13,962,466.01
D1 D2 D3 D4 D5
876,186.94 991,855.07 1,163,799.63 1,327,944.84 1,623,890.14
D6 D7 D8 D9
2,184,742.13 2,904,030.92 4,490,390.77 7,573,358.79
Kn/10
Sector Agricultura
D1 D2 D3 D4 D5
Sector comercio
D1 D2 D3 D4 D5
17
Sector Construcción
D1 D2 D3 D4 D5
Sector Inmobiliario
D1 D2 D3 D4 D5
843,201.21 954,278.02 1,084,775.39 1,218,821.60 1,455,948.38
D6 D7 D8 D9
2,088,599.25 2,896,978.84 3,231,422.32 5,152,411.39
Sector Manufacturero
D1 D2 D3 D4 D5
5) ¿De qué ciudad son la mayorı́a de empresas del ranking? Elabore una tabla
de frecuencia de las empresas por ciudad.
18
Ciudad fi hi Fi Hi
AMBATO 11 0.022 11 0.022
AZOGUES 1 0.002 12 0.024
BABAHOYO 2 0.004 14 0.028
BAHÍA DE CARAQUEZ 1 0.002 15 0.03
CALDERÓN (CARAPUNGO) 1 0.002 16 0.032
CAYAMBE 2 0.004 18 0.036
CRNEL. MARCELINO MARIDUEÑA (SAN CARLOS) 2 0.004 20 0.04
CUENCA 27 0.054 47 0.094
DAULE 4 0.008 51 0.102
EL GUABO 1 0.002 52 0.104
ELOY ALFARO (DURAN) 15 0.03 67 0.134
GENERAL VILLAMIL (PLAYAS) 1 0.002 68 0.136
GUAYAQUIL 156 0.312 224 0.448
IBARRA 1 0.002 225 0.45
JARAMIJÓ 3 0.006 228 0.456
JUNÍN 1 0.002 229 0.458
LASSO 1 0.002 230 0.46
LOJA 1 0.002 231 0.462
MACHACHI 4 0.008 235 0.47
MACHALA 10 0.02 245 0.49
MANTA 7 0.014 252 0.504
MONTECRISTI 1 0.002 253 0.506
OTAVALO 1 0.002 254 0.508
POMASQUI 1 0.002 255 0.51
PORTOVIEJO 1 0.002 256 0.512
QUEVEDO 2 0.004 258 0.516
QUITO 213 0.426 471 0.942
SAMBORONDÓN 15 0.03 486 0.972
SAN JACINTO DE YAGUACHI 1 0.002 487 0.974
SANGOLQUÍ 9 0.018 496 0.992
SANTO DOMINGO DE LOS COLORADOS 1 0.002 497 0.994
TABACUNDO 1 0.002 498 0.996
URCUQUI 1 0.002 499 0.998
VELASCO IBARRA 1 0.002 500 1
TOTAL 500 1
19
6) ¿A qué sector productivo pertenecen la mayorı́a de empresas del ranking?
Cuenta de
Etiquetas de fila SECTOR_PROD
AGRICULTURA 56
COMERCIO 215
CONSTRUCCIÓN 34
INMOBILIARIA 41
MANUFACTURA 154
Total general 500
El sector productivo al que pertenecen en su mayoría las empresas del ranking pertenecen al sector de
comercio.
4. Los datos de entrega de pizzas (pizza delivery.csv) son un conjunto de datos simulados.
Los datos se refieren a un restaurante que ofrece pizza a domicilio. Contiene los pedidos
recibidos durante un perı́odo de un mes: mayo de 2014. Hay tres sucursales del restaurante.
La entrega de pizzas se gestiona de forma centralizada: un operador recibe una llamada
telefónica y reenvı́a el pedido a la sucursal más cercana a la dirección del cliente. Uno
de los cinco conductores (dos de los cuales solo trabajan a tiempo parcial los fines de
semana) entrega el pedido. El conjunto de datos captura la cantidad de pizzas
ordenadas,ası́ como la factura final, que también puede incluir bebidas, ensaladas y
platos de pasta. El dueño del negocio observó un mayor número de quejas,
principalmente porque las pizzas llegan demasiado tarde y demasiado fr´ıas. Para
mejorar la calidad del servicio de su negocio, el propietario quiere medir (i) el tiempo
desde la llamada hasta la entrega (ii) la temperatura de la pizza a la llegada (lo que se puede
hacer con un dispositivo especial). Idealmente, una pizza llega dentro de los 30 minutos
posteriores a la llamada; si tarda más de 40 minutos, se promete a los clientes una botella de
vino gratis (aunque no siempre se entrega). La temperatura de la pizza debe estar por encima
de los 65◦ en el momento de la entrega. El análisis de los datos tiene como objetivo determinar
los factores que influyen en el tiempo de entrega y la temperatura de las pizzas.
20