Está en la página 1de 8

TRABAJO PRÁCTICO 3: INDICADORES DE POSICIÓN Y DISPERSIÓN

1) Para los Ejercicios 1 y 2 del Trabajo Práctico 2, calcular todos los indicadores de posición y de dispersión
que sean posibles e interpretar cada uno de ellos.
Respecto del ejercicio 1 del TP2, la variable es cualitativa nominal. Por esta razón entre los indicadores
de posición solamente corresponde indicar la moda que en este caso es: mo= Contabilidad. Por el mismo
motivo no corresponde el cálculo de ningún indicador de dispersión.
Respecto del ejercicio 2 del TP2, la variable es cualitativa nominal. Por esta razón entre los indicadores
de posición solamente corresponde indicar la moda que en este caso es: m o= Industria. Por el mismo
motivo no corresponde el cálculo de ningún indicador de dispersión.
2) A continuación se dan las edades en años de los automóviles con que trabajó una empresa transportista
la última semana:

5 6 3 6 15 7 9 10 2 4 10 6 2 1 1 5

Calcular los indicadores de posición y dispersión posibles e interpretarlos.


Indicadores de posición:
5+6+3+6+15+7+9+10+2+4+10+6+2+1+1+5
Media aritmética: μ = = 5,75 años.
16
Interpretación: Los autos de la empresa transportista tienen en promedio 5,75 años cada uno.

Mediana: Para calcularla primeramente se deben ordenar los datos.


1 1 2 2 3 4 5 5 6 6 6 7 9 10 10 15

Posteriormente identificar la posición de la mediana. En este caso como son 16 datos (N = 16) la mediana
se ubicará en la posición (16 + 1) /2 = 8,5. Esto significa que la mediana se encuentra entre la octava y
novena observación. Por lo tanto, en este caso será el promedio entre 5 y 6. me = 5,5 años.
Interpretación: La mitad de los autos de la empresa tienen 5,5 años o menos y la otra mitad 5,5 años o más.

Cuartil 1: identificamos la posición del Q1. (16 + 1) /4 = 4,25.


Opción 1: Esto significa que el cuartil 1 se encuentra entre la cuarta y quinta observación. Por lo tanto, en
este caso será el promedio entre 2 y 3. Q1 = 2,5 años.
Interpretación: El 25 % de los autos de la empresa tienen 2,5 años o menos y el 75 % tiene 2,5 años o más.
Opción 2: Se puede redondear el valor de la posición a 4. Por lo tanto, el cuartil 1 es la cuarta observación.
Q1 = 2 años.
Interpretación: El 25 % de los autos de la empresa tienen 2 años o menos y el 75 % tiene 2 años o más.
AMBAS OPCIONES SON CORRECTAS.

Cuartil 3: identificamos la posición del Q3. (16 + 1). 3 /4 = 12,75.


Opción 1: Esto significa que el cuartil 3 se encuentra entre la décimo segunda y décimo tercera observación.
Por lo tanto en este caso será el promedio entre 7 y 9. Q3 = 8 años.
Interpretación: El 75 % de los autos de la empresa tienen 8 años o menos y el 25 % tiene 8 años o más.
Opción 2: Se puede redondear el valor de la posición a 13. Por lo tanto el cuartil 3 es la observación número
13. Q3 = 9 años.
Interpretación: El 75 % de los autos de la empresa tienen 9 años o menos y el 25 % tiene 9 años o más.
AMBAS OPCIONES SON CORRECTAS.
Moda: mo= 6 años.
Interpretación: El grupo más numeroso es el de autos que tienen 6 años (OJO!!! No es la mayoría ya que
para usar ese término el grupo debería contar con más de la mitad de los autos)

Indicadores de dispersión:
Recorrido: 15 – 1 = 14 años
Recorrido Intercuartílico: 8 – 2,5 = 5,5 años (usando las opciones 1 para los cuartiles)
(1−5,75)2 𝑥2+ (2−5,75)2 .𝑥2+ (3−5,75)2 +(4−5,75)2 +(5−5,75)2 .𝑥2 + (6−5,75)2 .𝑥3+⋯.
Varianza: = 13,6875 años al
16
cuadrado
(los datos para calcular la varianza fueron tomados de los datos ordenados para facilitar el cálculo. Noten
que hay puntos suspensivos. Completen ustedes y corroboren el resultado.
Desvío estándar: √𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 = √13,6875 ≅ 3,7 años. Interpretación: En promedio los valores de la
variable se alejan 3,7 años de la media aritmética.
𝟑,𝟕
Coeficiente de variación: 𝒙 𝟏𝟎𝟎 = 64,34 %. Debido a que es un valor alto se dice que la media
𝟓,𝟕𝟓
aritmética NO ES REPRESENTATIVA del conjunto de datos.

3) Calcular (sin utilizar ningún software) todos los indicadores de posición y de dispersión para el Ejercicio
3 del Trabajo Práctico 2 e interpretar cada uno de ellos. Además, realizar el box-plot y obtener
conclusiones.
INDICADORES DE POSICIÓN:
μ = 2,06 clientes por local
me = 2 clientes
Q1= 0,5 clientes (procediendo como la Opción 1 del ejercicio anterior)
Q3= 3,5 clientes (procediendo como la Opción 1 del ejercicio anterior)
mo = 0 clientes

INDICADORES DE DISPERSIÓN:
Recorrido : 6 clientes
Recorrido intercuartílico: 3 clientes
Varianza: 3,128
Desvío estándar: 1,77
Coeficiente de variación: 85,92%

BOX-PLOT:

A partir de los indicadores calculados responder las siguientes preguntas indicando con qué indicador
obtuvo la respuesta.
a) ¿Cuál es la cantidad promedio de clientes que entran? A cada local entran en promedio 2,06
clientes.
b) En la mitad de los locales entran ¿2 ? clientes como máximo.
c) El 25% de los locales con mayor cantidad de clientes, tienen ¿3,5 clientes? como mínimo.
d) ¿Cuál es la cantidad de clientes que más se repite? 0 clientes
e) ¿El promedio de la cantidad de clientes por local es representativo del conjunto de datos? Justificar.
La media no es representativa ya que el coeficiente de variación es muy alto (85,92%)
Corroborar los cálculos realizados con los obtenidos mediante el software InfoStat.

IMPORTANTE: El uso del programa InfoStat lo vamos a ver más adelante. De todos los que
quieran ir probando cómo se instala y cómo funciona tienen un Manual de uso básico subido al
sitio. Está en el material de Cátedra para todos los cursos.

4) Calcular (utilizando el software InfoStat) todos los indicadores de posición y de dispersión para el
Ejercicio 5 del Trabajo Práctico 2 e interpretar cada uno de ellos. Los cálculos deben realizarse para los
datos sin agrupar.
A partir de los indicadores calculados responder las siguientes preguntas indicando con qué indicador
obtuvo la respuesta.
a) ¿Cuál es el tiempo promedio de atención al cliente?
b) El 50% de los casos con menores tiempos de atención, requieren ¿.......? minutos como máximo
para ser atendidos.
c) El 50% central de los casos son atendidos entre ¿.......? minutos (como mínimo) y ¿.......? minutos
(como máximo).
d) El 25% de los casos que requieren mayor tiempo de atención, son atendidos en un tiempo mayor o
igual a ¿.......? minutos.
e) El 25% de los casos con menores tiempos de atención, son atendidos en un tiempo mayor o igual a
¿.......? minutos y menor o igual a ¿.......? minutos.
f) Realizar un box-plot para analizar la forma de la distribución. Sacar conclusiones.
g) Calcular el recorrido y el recorrido intercuartílico. ¿Qué significa?
h) ¿Cuál es la desviación de los tiempos? ¿Qué indica?
i) ¿El promedio es representativo del conjunto de datos?
j) Verificar gráficamente (mediante una ojiva) los valores hallados en los incisos b), c), d) y e).
k) En base a los gráficos y a los indicadores calculados en los incisos anteriores, brindar conclusiones
generales sobre los datos.
l) Responder los incisos a), b) y h) teniendo en cuenta los datos agrupados. ¿Existen diferencias con
los cálculos realizados para los datos sin agrupar? ¿Qué cálculo es el más exacto? Justificar.

5) El siguiente cuadro muestra la distribución de ingresos de obreros en la ciudad A:

Ingresos Cantidad de obreros Fa↑


menos de 500 10 10
500 ≤ x < 1000 40 50
1000 ≤ x < 2000 50 100
2000 ≤ x < 2500 30 130
2500 o más 20 150

a) Graficar la distribución de los ingresos. Como la distribución tiene intervalos abiertos no se puede
realizar el histograma ni el polígono de frecuencias.
b) ¿Con qué indicador de posición podría representarla? Hallar y justificar. Por el mismo motivo no es
posible calcular la media aritmética ya que no tenemos l marca de clase del primero y el último
intervalo. Solamente podríamos señalar que la mediana pertenece al intervalo 1000 ≤ x < 2000 ya
que en él se encuentran los datos de posición 75 y 76.
También es posible calcular a qué intervalos pertenecen Q1 y Q3. El Q1 se encuentra en el
intervalo 500 ≤ x < 1000 (posición 37,75) y el Q3 pertenece al intervalo 2000 ≤ x < 2500 (posición
113,25)

c) Ídem para la dispersión. No es posible calcularlos.


d) Entre los intervalos presentados para la variable Ingreso, dos de ellos son intervalos abiertos.
¿Cuáles son? menos de 500 y 2500 o más ¿Cuáles son las ventajas y desventajas de trabajar con
intervalos de este tipo? La única ventaja es que el relevamiento es sencillo ya que el último intervalo
engloba las respuestas de muchos individuos aún sin conocer los límites reales de la variable. Las
desventajas se han visto en la imposibilidad de realizar el análisis de datos.

6) La siguiente tabla muestra distintas tasas de interés, en las últimas 5 semanas, de tres financieras
diferentes (A, B y C). Si se busca aquélla en la cual la tasa de interés fluctúe lo menos posible, ¿qué
financiera elegiría?
Financiera
Semana
A B C
1 0,05 0,35 0,05
2 0,12 0,24 0,08
3 0,60 0,12 0,09
4 0,55 0,65 0,15
5 0,25 0,39 0,01

Cálculo de indicadores de cada financiera:


Media Varianza Desvío estándar CV
Financiera A 0,314 0,049784 0,22312328 71,058%
Financiera B 0,35 0,03132 0,17697457 50,56%
Financiera C 0,076 0,002144 0,04630334 60,92%
La financiera B es la presenta menor fluctuación.
7) En una ciudad existen 3 grandes plantas de fabricación de automóviles (A, B y C) con 50 empleados cada
una. En cada una de estas plantas se registró el salario de cada uno de los empleados. En la tabla
siguiente, se muestran los valores de los indicadores de posición y dispersión calculados para cada
conjunto de datos:

Valor Valor Desviación


Media Mediana Cuartil 1 Cuartil 3 N
mínimo máximo estándar
A $ 550 $ 510 $ 505 $ 515 $ 500 $ 2500 $ 280 50
B $ 1200 $ 1000 $ 800 $ 1500 $ 500 $ 2500 $ 500 50
C $ 1300 $ 600 $ 550 $ 2400 $ 500 $ 2500 $ 900 50

a) Realizar un box-plot para los ingresos de cada una de las plantas de automóviles. Compararlos y
sacar conclusiones.
b) Realizar un polígono de frecuencias aproximado para los ingresos en cada una de las plantas de
automóviles. Compararlos y sacar conclusiones.
Para resolver este inciso tengan presente que con los datos no van a poder reconstruir en forma
perfecta la distribución de frecuencias. Y, por lo tanto, no se van a poder realizar polígonos de
frecuencias perfectos. La idea es pensar en qué “forma” tendría el polígono para que sea coherente
con su correspondiente box-plot. Consideren que si la caja del box-plot está hacia la izquierda, el
punto máximo del polígono también debería ubicarse en esa zona.
c) Si recibieras una propuesta para trabajar en alguna de estas 3 plantas y te aseguraran que vas a
estar entre el 50% de los que menos cobran, ¿en qué planta elegirías trabajar y por qué?
d) Si recibieras una propuesta para trabajar en alguna de estas 3 plantas y te aseguraran que vas a
estar entre el 25% de los que más cobran, ¿en qué planta elegirías trabajar y por qué?
e) ¿En cuál de las 3 plantas se observa una menor variabilidad de salarios (con respecto a la media)?
Justificar.
f) ¿En cuál o cuáles de las 3 plantas de fabricación de automóviles el salario promedio no es
representativo de los salarios de los 50 empleados? En ese caso, ¿con qué indicadores resumirías
la información? Justificar.
8) Teniendo en cuenta la variable “Antigüedad” del Ejercicio 10 d) del Trabajo Práctico 2:
a) Calcular todos los indicadores de posición y de dispersión que conoce.
Media aritmética = 13,33 años
Mediana = 12,5 años. Q1 = 10 años. Q3 = 15 años.
Moda = 10 años
Recorrido = 20 años
Recorrido intercuartílico = 5 años.
Varianza = 35,14 años 2
Desvío = 5,93 años
Coeficiente de variación = 44,46%
b) ¿Cuál es la antigüedad más frecuente? 10 años
c) ¿Cuál es la antigüedad promedio? ¿Qué representa? 13,33 años
d) ¿Entre qué años se encuentra el 50% de los empleados con menor antigüedad? Entre 5 y 12,5 años.
e) Si ordenamos a los empleados de forma creciente según su antigüedad ¿entre que años se
encuentra el 50% central? Entre Q1 = 10 años y Q3 = 15 años.
9) Teniendo en cuenta la variable “Edad” del Ejercicio 10 e) del Trabajo Práctico 2:
a) Calcular todos los indicadores de posición y de dispersión que conoce.
Media aritmética = 38,19 años
Mediana = 36,5 años. Q1 = 32 años. Q3 = 44 años.
Moda = 36 años
Recorrido = 32 años
Recorrido intercuartílico = 12 años.
Varianza = 61,89 años 2
Desvío = 7,87 años
Coeficiente de variación = 20,6 %
b) ¿Cuál es la edad más frecuente?
c) ¿Cuál es la edad promedio?
d) ¿Cuál es la desviación estándar de la edad? ¿Qué podría decirse si se la comparara con la media?
e) ¿Entre qué valores se encuentra el primer 50% de las edades?
f) ¿Entre qué valores se encuentra el 50% central de las edades?
g) Realizar un box-plot y describirlo. ¿Qué conclusiones pueden obtenerse?
h) Determinar gráficamente los indicadores calculados en los incisos e) y f).

10) Los siguientes indicadores corresponden a la variable “Sueldo por horas extras” del Ejercicio 10 g) del
Trabajo Práctico 2:

µ = 257,5$ σ = 55,39$ Q1 = 220$ me = 264,28 $ Q3 = 300$


a) ¿Cuál es el sueldo por horas extras promedio de los empleados? µ = 257,5$
b) Dicho valor, ¿es representativo del conjunto de datos? Justificar. CV = 21,51 %. Es representativo ya
que el CV es chico.
c) Realizar un box-plot y describirlo. ¿Qué conclusiones pueden obtenerse del mismo?

11) El gerente de una empresa tiene asignado un sueldo de $18700 mensuales. Los salarios de los
empleados son los que figuran en la siguiente tabla: Trabajen con este y nos preguntan en el foro.

1800 1950 3090 3710 3690 1890 1920 4920 4290


5250 3660 1830 2160 4010 3990 7950 8850 2270

a) Indicar la variable y el tipo de la misma.


b) ¿Cuál es el salario promedio de todos los que trabajan en la empresa?
c) Calcular los cuartiles e interpretar el resultado.
d) Realizar el box-plot y extraer conclusiones.
e) Calcular la desviación estándar e interpretar el resultado.
f) ¿Es el promedio representativo del conjunto de datos? Justificar.
g) En las situaciones que se presentan en los incisos siguientes indicar cómo varían la media, la mediana
y el desvío.
i) Si se decide aumentar el salario de cada uno en 700 pesos.
ii) Si se disminuye el sueldo del gerente en $1000.
iii) Si no se tuviera en cuenta el salario del gerente.
iv) Si los sueldos aumentan un 10%.

12) Caso Bienes Raíces: A continuación se detallan datos correspondientes a las casas vendidas en Florida
(EE.UU.) durante 1990. Este ejercicio lo dejamos para cuando les podamos explicar el manejo de
InfoStat.
Variables:
X1 = Precio de venta (en miles de pesos)
X2 = Número de habitaciones
X3 = Extensión de la casa (en metros cuadrados)
X4 = Piscina (1 = sí, 0 = no)
X5 = Distancia desde el centro de la ciudad (en kilómetros)
X6 = Distrito
X7 = Garaje (1 = sí, 0 = no)
X8 = Número de baños

X1 X2 X3 X4 X5 X6 X7 X8
1949 4 2349 0 17 5 1 2
1351 4 2102 1 19 4 0 2
1793 3 2271 1 12 3 0 2
1582 2 2188 1 16 2 0 3
1036 2 2148 1 28 1 0 1
1818 2 2117 0 12 1 1 2
2424 6 2484 1 15 3 1 2
2013 2 2130 1 9 2 1 3
1638 3 2254 0 18 1 0 1
1975 4 2385 1 13 4 1 2
2166 4 2108 1 14 3 1 2
1548 2 1715 1 8 4 1 1
2006 6 2495 1 7 4 1 2
1823 4 2073 1 18 3 1 2
1440 2 2283 1 11 3 0 2
2084 3 2119 1 16 2 1 2
1279 4 2189 0 16 3 0 2
1537 5 2316 0 21 4 0 2
1473 3 2220 0 10 4 1 2
1550 6 1901 0 15 4 1 2
1869 4 2624 1 8 4 1 2
1429 4 1938 0 14 2 1 2
1550 5 2101 1 20 5 0 1
2558 8 2644 1 9 4 1 2
2417 6 2141 1 11 5 1 3
1282 2 2198 0 21 5 1 1
1385 2 1912 1 26 4 0 2
1905 2 2117 1 9 4 1 2
1726 3 2162 1 14 3 1 1
1336 2 2041 1 11 5 0 2
1733 2 1712 1 19 3 1 2
1534 2 1974 1 11 5 1 2
1835 5 2438 1 16 2 1 2
1231 3 2019 0 16 2 1 2

X1 X2 X3 X4 X5 X6 X7 X8
1312 2 1919 1 10 5 1 2
1353 4 2023 0 14 4 0 2
1600 4 2310 1 19 2 0 2
2312 6 2639 1 7 5 1 2
1480 3 2069 1 19 3 1 2
2024 5 2182 1 16 2 1 3
1526 3 2090 0 9 3 0 1
1720 3 1928 0 16 1 1 1
1469 4 2056 0 19 1 1 1
1519 3 2012 0 20 4 0 2
1301 4 2262 0 24 4 1 2
2280 3 2431 0 21 2 1 3
1994 5 2217 1 8 5 1 3
1665 3 2157 1 17 1 1 2
1271 3 2014 0 16 4 0 2
1606 3 2221 1 15 1 1 2
1427 6 2236 0 14 1 0 2
1751 5 2189 1 20 3 1 2
1277 3 2218 1 23 3 0 2
1862 3 1937 1 12 2 1 2
1822 6 2296 1 7 3 1 3
1092 6 1749 0 12 1 0 2
1304 4 2230 1 15 1 1 2
1692 3 2263 1 17 5 1 1
1233 3 1593 0 19 3 0 2
1403 4 2221 1 24 1 1 2
2312 7 2403 1 13 3 1 3
2147 6 2036 1 21 3 1 3
1999 5 2170 0 11 4 1 2
1143 2 2007 1 13 2 0 2
1645 2 2054 1 9 5 1 2
1553 5 2247 0 13 2 1 2
1414 3 2190 0 18 3 1 2
1884 4 2495 0 15 3 1 2
1537 3 2080 0 10 2 0 2
1553 4 2210 0 19 2 1 2
2178 2 2133 1 13 2 1 2
1306 2 2037 0 17 3 0 2
2180 7 2448 1 8 4 1 2
1659 3 1900 0 6 1 1 2
926 2 1871 1 18 4 0 1

Teniendo en cuenta todos los conceptos vistos hasta el momento (población, tipos de variables,
frecuencias, indicadores, etc.) realizar una descripción estadística de la situación, analizando cada
variable por separado y comparándolas entre sí cuando sea posible.

También podría gustarte