Documentos de Académico
Documentos de Profesional
Documentos de Cultura
.C
DD
LA
FI
Estadística I
Tomo I (cap. 1, 2 y 3)
OM
Cr. FACUNDO QUIROGA MARTÍNEZ
Secretario Técnico
.C
Mgter. GERARDO HECKMANN
Secretaria de Asuntos Académicos
DD
Lic. JUAN SAFFE
Secretario de Extensión
Coordinación Académica
Secretaría de Asuntos Académicos
Mgter. Gerardo Heckmann
OM
Coordinación Organizativa de Divisiones a Distancia
Lic. David Taborda
.C
Coordinador General
Oscar Margaría
DD
Asesora pedagógica
Dra. Adela Coria
Equipo de producción en tecnología educativa y comunicación
Mgter. Gabriela Sabulsky
LA
OM
AUTORES
Norma Patricia Caro
Rosana Beatriz Casini
Margarita Díaz
.C
Fernando García
Mariana González
Martín Saino
DD
María Inés Stímolo
Roberto Infante
Adrian Moneta Pizarro
Olga Padro
Andrea Righetti
Julio Rosales
OM
Maquetación de materiales
Lic. Víctor R. Cacciagiú y Lic. Ismael Rodríguez
.C
Asesoramiento y diseño pedagógico - didáctico
Esp. Verónica Pacheco y Lic. Vanesa Partepilo
DD
Asesoramiento y diseño comunicacional
Lic. Cecilia Botino y Lic. María Florencia Scidá
LA
FI
Capítulo 2:
Parámetros y estadísticos de las distribuciones de frecuencias
Introducción 75
1. Medidas de posición 75
1.1 Media aritmética 76
1.1.1 Propiedades de la media aritmética 80
1.2 Mediana 87
OM
1.2.1 Propiedad de la Mediana 88
1.3 Modo 90
1.4 Medida Geométrica 93
1.4.1 Propiedades de la Medida Geométrica 94
1.5 Medidas de posición no central 94
1.5.1 Cuartiles 95
2. Medidas de dispersión 97
2.1 Varianza
.C
2.1.1 Fórmula de cálculo
2.1.2 Varianza de la muestra
2.1.3 Propiedades de la varianza
97
98
99
101
DD
2.2 Desviación estándar 102
2.3 Coeficiente de variación 103
2.4 Recorrido y Recorrido Intercuartil 104
3. Diagrama de caja y brazos 105
4. Otras medidas 109
4.1 Momentos naturales 109
LA
Parámetros y estadísticos
de las distribuciones de frecuencias
FI
Introducción
OM
miento del problema, diseño, recopilación y organización de datos; se aborda-
ron conceptos y aplicaciones inherentes al tema y se desarrollaron actividades
mediante las cuales se ordenan los valores de una variable y se describe su
comportamiento de una manera visual en gráficos o bien de una forma ordena-
da en tablas.
Ahora veremos la cuarta etapa, la de análisis, donde también se descri-
ben las variables calculando medidas que permiten resumir los valores de éstas
.C
y explicar su comportamiento en un aspecto o característica de la distribución.
Cuando hablamos de aspecto o característica de la distribución nos estamos
refiriendo a posición, dispersión y forma, criterio de clasificación utilizado para
definir las medidas descriptivas.
DD
De esta manera tendremos algunos valores que describen la posición,
unos la dispersión y otros la forma del conjunto de valores de la variable.
Además, explicaremos métodos de cálculo para obtener esas medidas
como así también las ventajas y desventajas de su aplicación en cada caso.
Utilizaremos bases de datos procesadas con el software Infostat para
conectarnos con esta forma rápida de procesar y analizar información, lo que en
LA
Las Medidas de posición son aquellas que permiten describir los datos de medidas descriptivas, se sugie-
una serie en cuanto a su ubicación en el eje de las abscisas. Se clasifican como re a ingresar a la sección Mate-
de tendencia central y no central. Las medidas de tendencia central se localizan riales Recursos del aula virtual
para ver la producción audiovi-
en el centro de la distribución, mientras que las que no lo son se localizan en
sual “Serie Horizontes” de
otras partes de la distribución. Las medidas de tendencia central que estudia- Canal Encuentro llamada Esta-
remos son: media aritmética, media geométrica, mediana y modo. dística.
La importancia de marcar la
diferencia radica en el signifi- Para aclarar la idea observe la siguiente tabla.
cado de la medida y su aplica-
ción para describir el compor- A modo de ejemplo, si se cuenta con la estatura de 11 personas y, se pre-
tamiento de la variable. tende caracterizar al grupo por la estatura media, se aplicará la definición con lo
OM
que concluiremos que en promedio estas personas miden 1,62 m. Es decir, una
Cuando se utilizan las medidas
de posición central se analiza el altura intermedia entre los más altos y los más bajos.
punto de equilibrio entre los
valores y se busca representar ESTATURA
el conjunto por la medida, 1,6
mientras que cuando nos refe- 1,52
rimos a cuartiles por ejemplo, 1,66 Media 1,62
se pretende destacar cuatro 1,68 17,82/11
partes de la distribución mar-
cadas por el 25% de las obser-
vaciones.
.C 1,69
1,66
1,64
1,48
DD
1,61
1,66
1,62
∑x i
Parámetro µ= i =1
N
FI
∑x i
Estadístico x= i =1
Oprimiendo el
OM
menú
Estadísticas
1.Alimentos y Bebidas
2.Textiles, Con-
.C
fecc.Calzado
3.Madera y Muebles
4.Papel e Impresiones
5.Química, Caucho y Plás-
DD
ticos
8.Maquinaria y Equipos
6. Vidrio y Minerales. no
Metálicos
LA
7.Productos Metálicos
77
OM
.C Actividad 1
Trabaje con la base “industrias.idb” y consultando el punto 3.21 del instructivo
de infostat, asigne el nombre de cada rama en la base de datos
DD
En la Tabla 1 se puede observar que la rama 2 (textil) es la que tiene mayor
promedio de la variable porcentaje de costo laboral sobre total. Sin embargo las
demás ramas que le siguen en orden de magnitud, no difieren demasiado, pre-
sentando el menor valor la rama 4 (papel e impresiones)
Ejemplo 1
Los datos siguientes representan los valores del porcentaje del costo labo-
FI
25
Aplicando la fórmula de media
7
aritmética de la muestra, el valor del
40 promedio, será:
15 n
20 ∑x i
202
20 x= i =1
= = 18,36
10 n 11
22
30
78 10
3
Suma: 202
Gráfico1:
Histograma de porcentaje de costos laboral
OM
La media 18,36
.C
DD
El porcentaje promedio de los costos laborales en esta rama es 18,36%.
Observando los datos vemos que hay valores del porcentaje del costo laboral
inferiores y superiores a este valor. En un punto de equilibrio se puede repre-
sentar a todos los valores, en cuanto a su posición, mediante la cifra llamada
media aritmética que en el ejemplo se refiere al porcentaje medio del costo
laboral por empresa y cuyo valor es 18,36.
LA
25
7 La media aritmética de la mues-
98 tra será:
15
20 n
20 ∑x
i =1
i
260
10 x= = = 23,64
n 11
22
30
10 79
3
Suma: 260
• Otro aspecto de la Media Aritmética es que, al igual que todas las me-
didas de posición, se expresa en la misma unidad de medida que la va-
riable. En este ejemplo tanto la variable x como la M(x) se expresan en
porcentaje.
OM
la cantidad de veces que el mismo se repite, de la siguiente forma:
∑xn i i
x= i =1
.C
1.1.1 Propiedades de la media aritmética
M (c ) = c
n
M (=
x ) c= c
FI
3
constante, será el resultado de la media aritmética de la variable x.
M ( c.x ) = c.M ( x )
80
Aplicando la definición de media aritmética:
k k
i i ∑c x n ∑x n i i
M ( c.x )
=
=i 1=i 1
= c=
. c.M ( x )
n n
Verificación: x asume los valores: 10, 20, 30, 40, su media es: x = 25
Si multiplicamos x por 2, surge x’ con los valores: 20, 40, 60, 80; siendo su me-
dia: x ’ = 50, pero al aplicar la propiedad no será necesario recalcular todos los
valores de x, sólo haremos:
M(=
x`) 2.M(=
x ) 2=
.25 50
) M (x) + c
M ( x + c=
OM
Aplicando la definición de media aritmética:
∑(x i + c ) ni
M (x + c)= i =1
.C
Distribuyendo el sumatorio:
M ( x +=
c)
i i
=i 1=i 1
k
∑ x n ∑c n
n
+
k
n
i
DD
k
“c” es constante por lo que puede extraerse del sumatorio y ∑n i = n , con lo
i =1
cual se arriba a:
k
∑x n i i
n
M ( x + c=) + c = M (x) + c
LA
i =1
n n
Verificación: x asume los valores: 10, 20, 30, 40, su media es: x = 25
Si a x le sumamos la constante 3, sus nuevos valores serán: x’: 13, 23, 33,
FI
∑(x
i =1
i − M ( x ) ) ni =
0
i i∑ x n − ∑M (x)n
=i 1=i 1
i =
0
i i
=i 1=i 1
∑x n − M ( x ) ∑ ni =
0
k ∑x n i i
Dado que ∑ ni = n y que M (x)= i =1 , tenemos que:
i =1 n
n M (x) − n M (x) =
0
Por lo tanto:
OM
0=0
.C Σ (xi - x ) = (2-4) + (4 - 4) + (6 - 4) = 0
i =1
82 f´ (w ) = 0
Despejamos “w”:
k
∑ 2(x
i =1
i − w )( −1) ni =
0
Extraemos (–2) del sumatorio, dividimos ambos miembros por (-2) y distribui-
mos el sumatorio de forma tal que:
k k
=i 1=i 1
∑ xi ni − ∑ w ni =
0
k
Dado que ∑n
i =1
i = n y como “w” es constante con respecto al sumatorio:
∑x
i =1
i ni − w n =
0
∑xi ni
OM
=w = M (x)
i =1
n
Este es un punto crítico de la función. Para determinar si ese punto es un míni-
mo debemos verificar si la derivada segunda es positiva. La derivada segunda es
igual a:
k
−2 ∑ ( −1) ni
f´´ (w ) =
.C
i =1
n1.M ( x1 ) + n2 .M ( x2 ) + ... + nh .M ( xh )
M (x) =
n
83
Donde, n1, n2,..., nh son los tamaños de las h submuestras en las que se divide la
muestra de tamaño “n”.
n n1 n2 nh
∑ x=i
=i 1=i 1 =i 1
∑ x1i +∑ x2i + ... +∑ xhi =i 1
OM
n n1 n2 nh
i 1i∑x 2i ∑x ∑x ∑x hi
n = n
=i 1=i 1 =i 1
1 2 +n +=
... + nh i 1
1 n 2 n n nh
n n1
∑x i ∑x 1i
Dado que M ( x ) = i =1 y que M ( x1 ) = i =1 y así sucesivamente, reemplazando
n n1
en (4) por sus iguales:
.C =
n.M ( x ) n1.M ( x1 ) + n2 .M ( x2 ) + ... + nh .M ( xh )
DD
Despejando M(x):
n1.M ( x1 ) + n2 .M ( x2 ) + ... + nh .M ( xh )
M (x) =
n
LA
Ejemplo 2
El ingreso medio de 500 varones es igual a $ 3200 y el ingreso medio de
385 mujeres es de $ 2250, ambos pertenecientes a la misma población,
la media general será.
FI
(3200.500) + (2250.385)
X= = 2786.72
885
El promedio es de $ 2786.72.
OM
dos presentados en Tabla 1 para cada rama de actividad se llegará al mismo
resultado: 30,56%
.C
muestra. El cálculo correcto se muestra en la siguiente tabla.
5 14 32,86 460,04 ∑n x i i
4309,17
6 10 27,1 271 x= i =1
= = 30,56
7 15 29,33 439,95 n 141
FI
8 17 28,9 491,3
9 16 32,31 516,96
10 12 33,58 402,96
Suma 4309,17
Actividad 2
Se ha seleccionado una muestra de pedidos de clientes, realizados en febre-
ro/2015, a una empresa que fabrica un bien “X” y se ha registrado la cantidad
de unidades solicitadas de dicho bien:
12 10 14 25 16 25 16 27 18 30 20 30 50 35
85
a) Determinar el valor de la media aritmética (M) y de la mediana (Me) y
escriba una interpretación de sus resultados (sin decimales).
c) Si para el mes de marzo se espera que todos los clientes soliciten 4 uni-
dades más del bien “X” con respecto a los pedidos de febrero, ¿cuál se-
ría el valor de la media aritmética en el mes de marzo?
d) En otra situación, si para el mes de marzo se espera que todos los clien-
tes reduzcan en un 15 % el número de unidades del bien “X” solicitadas
con respecto a febrero, ¿cuál sería el valor de la media aritmética en el
mes de marzo?
OM
Actividad 3
La Encuesta Permanente de Hogares, ha permitido relevar información respecto
de múltiples aspectos económicos y sociales de los habitantes del país.
.C
didácticos, supongamos que Afip pretende analizar los salarios de trabajado-
res por tipo de actividad.
Tomando las categorías patrón o empleador y cuenta propia, los valores regis-
DD
trados para una muestra de individuos en categoría patrón o empleador y cuen-
ta propia. Recordemos que en la EPH se registra el sueldo de cada jefe de hogar,
considerando como tal el ingreso mensual y por otra parte se consulta al indivi-
duo, la categoría ocupacional a la que pertenece, es decir patrón o empleador,
empleado en relación de dependencia, cuenta propia, etc. En la Tabla 3 se pre-
sentan los sueldos de los entrevistados con categorías patrón y cuenta propia.
LA
SUELDO
SUELDO
Patrón o
FI
Cuenta propia
empleador
1200 780 890
480 870 240
1300 760 650
2200 1200 900
86
Se le solicita a UD, que:
OM
1.2 Mediana Para obtener la mediana:
.C
de la mitad de las observaciones de la variable. - Se ubica dicho punto y el
valor de la variable correspon-
diente al mismo, que simboli-
zamos como xo, es la Mediana,
DD
Visualizando en la siguiente imagen los datos de la estatura de 11 personas es decir: xo = Me(x).
comprenderás mejor el significado de la definición.
Además debemos considerar
las siguientes situaciones:
ESTATURA
1,6 - Si la cantidad de datos de la
LA
1,48 1,52 1,6 1,61 1,62 1,64 1,66 1,66 1,66 1,68 1,69
¿Por qué la media es de 1,62 y la mediana es de 1,64? ¿A qué se debe esta dife-
rencia?
La suma del valor absoluto de las diferencias entre los valores de la variable y su
Mediana, es mínima.
OM
una medida de distancia entre los valores de la variable y su valor central, de
ver el mínimo relativo de la
función suma del valor absolu-
modo que podamos analizar la dispersión de esos valores en situaciones donde
to de los desvíos, que se detalla la media aritmética no es representativa.
a continuación y cuya demos-
tración obviaremos.
Ejemplo 3
En columna se observan los valores de la variable porcentaje del costo
laboral ordenados de menor a mayor.
10
15
20
20
22
25
FI
30
40
OM
.C
DD
LA
FI
89
OM
Consideremos ahora el cálculo de la Mediana a partir de una tabla de fre-
cuencias. Volviendo a nuestro ejemplo Encuesta a alumnos (base alumnos.idb)
en la tabla siguiente se presentan las frecuencias de la variable materias aproba-
das. La mediana será el valor que ocupe el lugar 83,5, es decir el promedio sim-
.C
ple entre los valores que ocupan el lugar 83º y 84º. Para determinar qué valores
son, necesitamos las frecuencias absolutas acumuladas.
DD
Tabla 5. Frecuencias de variable materias aprobadas.
MATERIAS
ni Ni
APROBADAS
0 22 22
1 32 54
LA
2 48 102
3 37 139
4 21 160
5 6 166
Total 166
FI
1.3 Modo
tiene un solo valor modal, las bimodales tienen dos valores que se repiten más
veces que los demás y las multimodales tienen más de dos valores modales.
OM
Otro criterio para calcular el modo en distribuciones de intervalos
se basa en definir el intervalo que corresponde a la mayor frecuencia,
llamado intervalo modal, y considerar que la marca de clase representa
el valor de la variable que se presenta más veces.
.C
Por último, podemos determinar el modo gráficamente con el his-
tograma de frecuencias, marcando en el rectángulo más alto el valor
modal por interpolación.
DD
Ahora le proponemos observar en el archivo “industria.idb” la va-
riable rama de actividad codificada de uno a diez. El valor modal será el
código de variable uno, al que le corresponde una frecuencia de 19 ob-
servaciones, la mayor de las frecuencias que se presentan en Tabla 6.
LA
Frecuencias absolutas
rama Total Porcentaje
1,00 19 12,84
2,00 16 10,81
FI
3,00 14 9,46
4,00 11 7,43
5,00 15 10,14
6,00 10 6,76
7,00 17 11,49
8,00 17 11,49
9,00 16 10,81
10,00 13 8,78
Total 148 100,00
91
Actividad 4
Con los datos de la Tabla 7, correspondientes a la producción en unidades de 7
máquinas de una empresa observadas en dos turnos:
Turno 1 12 14 16 16 18 20 50
Turno 2 10 25 25 27 30 30 35
OM
Actividad 5
Examinando los registros de cuentas mensuales de una empresa que vende
libros por correo, el auditor toma una muestra de 12 de esas cuentas no paga-
das. Los montos de deudas registradas se muestran en tabla 8:
.C
Tabla 8. Valor monetario de cuentas no pagadas
Gráfico 2
Variable valor de cuentas no pagas
FI
0,44
0,33
frecuencia relativa
0,22
0,11
0,00
92 7 15 22 30 37
Mg( x ) = n ( x1 )( x2 )...( xn )
OM
Mg( y ) = n
y1n1 .y 2n2 ...y knk
Ejemplo 4
Los rendimientos anuales, en porcentaje, de cuatro acciones de empre-
sas multinacionales son: 4.91, 5.75, 9.13, 20.86.
.C
La media geométrica es:
Ejemplo 5
Se quiere calcular la tasa promedio de crecimiento del PBI contando con
información de los últimos 5 años:
Mg(=
x) n ( x1 )( x2 )...( =
xn ) 4 245
( 200 )( 279
245
)( 300
279
)( =
326
300
) = 1.129
4 326
200
Valor final 93
r =n
valor inicial
−1
OM
Aplicando la propiedad que establece que el logaritmo de un producto de
números, es igual a la suma de los logaritmos de los números, queda:
n
Log Mg(x) = log(n (x 1 )(x 2 )...(x n ) ) = 1
n ∑ log x
i =1
i = M(log x)
.C
1.5 Medidas de posición no central
DD
Las medidas de posición no central son llamadas fractiles o cuantiles dentro de
los que encontramos, como los más utilizados:
• cuartiles
• deciles
• percentiles
LA
tes.
Por ejemplo la fractila de orden tres en un total de diez partes, es el valor
de la variable que supera a no más del 3/10 del total de las observaciones y es
superado por no más del 7/10 del total de las observaciones y la simbolizamos
como P(3/10). No obstante lo mencionado, para los casos en que la distribución
se divide en cuatro, diez y/o cien partes, las fractilas se denominan cuartiles,
deciles y/o percentiles respectivamente, en consecuencia para el ejemplo dado
el valor P(3/10) equivale al Decil de orden 3 que se simboliza como: D3.
94
1.5.1 Cuartiles
OM
su recorrido en cuatro partes y obtener los cuartiles.
.C
o1 = 1/4 (n + 1)
o2 = 2/4 (n + 1)
->
->
Q1 =
Q2 =
x o1
xo2
Me
DD
o3 = 3/4 (n + 1) -> Q3 = x o 3
Q1, será el valor de la variable que supera a no más del 25% de las obser-
vaciones y es superado por no más del 75% de las observaciones de la variable.
De igual modo con los otros dos cuartiles.
LA
Ejemplo 6
Para obtener los cuartiles se ordenan de menor a mayor los valores de
la variable porcentaje del costo laboral para la rama 4:
OM
Utilizando Infostat, se procesaron los datos de la variable porcentaje
del costo laboral/costo total obteniendo las medidas de posición y
los cuartiles.
.C
DD
LA
FI
96
Actividad 6
Retomando la actividad 2, en la que se ha seleccionado una muestra de pedidos
de clientes, realizados en febrero/2015, a una empresa que fabrica un bien “X”
y se ha registrado la cantidad de unidades solicitadas de dicho bien.
OM
a) Calcule la mediana y compare el valor de esa medida con el valor calcu-
lado de la media aritmética, de haber diferencia explique brevemente
cual puede ser la causa de la misma.
.C
la muestra. Interprete cada valor calculado
2. Medidas de dispersión
97
2.1 Varianza
Media aritmética del cuadrado de los desvíos entre los valores de la variable y
OM
su media.
N
Parámetro ∑ (x i − μ) 2
σ2 = i =1
N
N N
− µ]∑ [x
∑ (xi2 − 2µ ∑ xi + µ 2 )
2
i
=
=
σ 2
=
i 1 =i 1=i 1
N N
2µ∑ x i = 2 Nµµ = 2 Nµ 2 N
∑x i
µ= i =1
⇒ Nµ = ∑ x i
N
∑ [x i − μ ] ∑x − 2 Nµ 2 + Nµ 2
2 2
i
σ =
2 i =1
= i =1
N N
σ 2 = μx 2 − (μx )2
Su fórmula es:
nn
Estadístico i
2
∑ (x− x) ∑x 2
i − nx 2
=s=2 i 1 =i 1
=
n −1 n −1
OM
Para la variable porcentaje del costo laboral que fue utilizada en ejemplos
anteriores utilizando el software Infostat, se calcularon las medidas de
dispersión.
Nuevamente con el menú estadísticas se abre una ventana en la que se
debe asignar la variable y se solicita el cálculo de las medidas necesarias.
.C
DD
LA
FI
99
OM
.C Ejemplo 7
Consideremos una rama de actividad, papel e impresiones, para el
cálculo de la varianza mediante hoja de cálculo Excel, de la variable por-
centaje del costo laboral:
DD
Para una mejor comprensión X (x-M(x)) (x-M(x))^2
del significado del término
25 6,64 44,04
dispersión en el entorno de las
medidas descriptivas, se sugie- 7 -11,36 129,13
re a ingresar a la sección Mate- 40 21,64 468,13
LA
30 11,64 135,40
10 -8,36 69,95
3 -15,36 236,04
202 1182,55
∑ (x
i =1
i − x) 2
1182.55
s2 = = = 118,25
n −1 10
V(x) ≥ 0
V(c) = 0
c: constante
Si xi = c y M(x) = c, entonces:
OM
k
∑ (c − c )
2
ni
=V( x ) = 0
i =1
Verificación:
.C
Si x: 4, 4. 4
La media es 4 y la varianza:
3
∑ (x − x)2
DD
i
i =1 (4 − 4) 2 + (4 − 4) 2 + (4 − 4) 2
= =0
2 2
V(c . x) = c2 V(x)
c: constante
∑ c.x − c.M ( x ) ni
2
i
V( c.x ) = i =1
n
k
∑ c ( x − M ( x ) ) ni
2
i
= i =1
n
k
∑c xi − M ( x ) ni
2 2
= i =1
n
k
∑ x − M ( x ) ni
2
i
=c . 2 i =1
Verificación 101
Si x: 4, 5.6
La media es 5 y la varianza:
3
∑ (x
i =1
i − x)2
(4 − 5) 2 + (5 − 5) 2 + (6 − 5) 2
= =1
2 2
∑ (x
i =1
i − x)2
(8 − 10) 2 + (10 − 10) 2 + (12 − 10) 2
= =4
2 2
Lo que equivale a:
V(c. x) = c2 V(x) 22 .1 = 4
OM
V(c + x) = V(x)
c: constante
.C
en caso de restarla):
k
∑ ( x + c ) − ( M( x ) + c ) ni
2
DD
i
V( x + c ) =i =1
∑(x + c − M( x ) − c ) ni
2
i
V( x + c ) =i =1
n
k
∑(x − M( x ) ) ni
2
i
V( x + c ) =i =1
FI
n
V (x)
V( x + c ) =
Actividad 8
Verifique la propiedad para un aumento constante de 3 unidades en una varia-
ble x con valores 4,5 y 6.
N n
∑ (x − μ)
i=1
i
2
∑ (x − x)
i
2
DS(x) = σ = DS(x) = s = i =1
N n −1
Para la variable porcentaje del costo laboral de las 141 empresas la des-
viación estándar es:
OM
Considerando a la Media Aritmética con un valor de 30,56 %, podemos
concluir que en este caso y atendiendo a la naturaleza del problema hay baja
dispersión o, en otros términos, los datos están concentrados en torno a la me-
dia, se hallan a poca distancia de ésta, lo que indicaría que son homogéneos.
.C
2.3 Coeficiente de variación
DS( x )
CV( x ) =
M( x )
s 14,63
CV= = = 0.4786
y 30,56
El valor del coeficiente de variación puede multiplicarse por 100 para ex-
presarlo en porcentajes e interpretar que la dispersión relativa del porcentaje
del costo laboral en torno a la media es 47.86%, lo que refleja una dispersión
inferior al 100%. Además de este análisis, la relevancia de la medida radica en
que es abstracta lo que la hace prescindir de unidad de medición, permite com-
parar variables expresadas en distintas unidades de medición, indicando cuál es
la variable que presenta datos más homogéneos para el caso en el CV sea me- 103
nor.
OM
d) En otra situación, si para el mes de marzo se espera que todos los clien-
tes reduzcan en un 15 % el número de unidades del bien “X” solicitadas
con respecto a febrero, ¿cuál sería el valor de la varianza en el mes de
marzo?
Actividad 10
.C
En relación a la actividad 3, en la que se ha relevado el sueldo del entrevistado
de la encuesta permanente de hogares para las categorías patrón y cuenta pro-
pia, se le solicita a Ud. que:
R = VM - Vm
OM
3. Diagrama de caja y brazos ducto y no está en riesgo de
producir defectuosos.
Esta representación es confeccionada con la mediana y los cuartiles. Con-
siste en marcar sobre un eje real los valores de la variable, el que puede ser po- Es el caso donde mediante una
sicionado en forma horizontal o vertical (Infostat hace diagramas de caja y bra- muestra de 5 unidades, en las
zos verticales). que tomamos el diámetro de
cada pieza, la diferencia entre
el mayor y menor diámetro
Con los cuartiles se forma una caja cuyos lados son el cuartil 1 y 3 y la
.C
mediana se marca en el interior de la caja, la que representa la distribución del
50 % central de los datos. A ambos lados de la caja quedan los brazos, los que
determinan en definitiva si hay deformaciones horizontales.
Para construir los brazos se utiliza una regla empírica utilizando el Reco-
será el rango, tomando una
determinada cantidad
muestras podremos ver en qué
forma se modifica el rango y
de
DD
habrá un indicio de la variabili-
rrido Intercuartílico, definiendo dos límites: límites internos y externos. Estas dad del proceso, obviamente
barreras permiten establecer un criterio para decidir si los valores extremos de mientras mayor valor asume el
una variable son atípicos o extremadamente atípicos en relación a los demás. rango, más riesgo habrá de
producir fuera de los estánda-
Los Límites Internos, al interior del cual se consideran valores normales res establecidos.
de la variable, son determinados a una distancia de 1.5 veces el recorrido inter-
LA
Cuando existen valores de la variable que están fuera de las barreras in-
FI
ternas significa que esos valores son alejados de los más homogéneos y se pue-
den considerar como atípicos, comúnmente identificados en las salidas de los
software con una letra O, por su designación en inglés, Outliers.
105
Cuando esos valores están muy alejados son considerados extremos, los
que se identifican calculando los llamados límites externos.
OM
.C
DD
Los valores de la variable que quedan entre los límites internos y externos
se consideran valores atípicos. Cuando existen valores de la variable que están
fuera de las barreras externas significa que esos valores son muy alejados de
los más homogéneos y se pueden considerar como extremadamente atípicos.
Generalmente en las salidas de computación estos valores son marcados con
un asterico o con la letra E.
LA
Por lo tanto, si la caja es más ancha indicará que ese conjunto central de
observaciones de la variable es más disperso. La línea que se ubica dentro de la
caja indica la posición de la Mediana.
OM
.C
DD
LA
FI
107
Actividad 12
OM
En relación a la actividad 3, en la que se ha relevado el sueldo de dos muestras
de la encuesta permanente de hogares referidas a categorías, patrón y cuenta
propia. Se le solicita a Ud. Que:
.C
b) Explique cómo analiza la existencia de valores atípicos, que significa eso
para la distribución y determine si para la variable cantidad de pedidos
hay valores extremos o atípicos de la variable sueldo en cada muestra.
DD
Actividad 13
El siguiente Gráfico muestra los resultados del procesamiento con Infostat, de
la variable peso expresado en kg. de 100 personas adultas:
LA
MEDIDAS DESCRIPTIVAS
---!---------!---------!---------!---------!---------! peso
50 60 70 80 90 100
108 c) Considera que hay personas con peso atípico en la serie analizada. Jus-
tifique su respuesta.
4. Otras medidas
Bajo esta denominación se incluyen los momentos, medidas de posición
útiles para calcular las demás medidas de posición, dispersión y forma antes
mencionadas.
OM
La media aritmética de la potencia e-résima de la variable.
µr' ( x ) = M( x r )
.Cµ0' ( x ) M(
=
µ= '
1( x )
= x0 ) 1
=
M( =
x1 ) M( x) µ
DD
µ2 ( x ) = M( x )
' 2
µ2' − ( µ1' )2 =
σ2
LA
µ=
r (x) M( x − µ )r
µ0 ( x )= M( x − µ )0 = 1
µ 1 ( x ) = M( x − µ)1 = 0 por propiedad de Media Aritmética
µ2 ( x )= M( x − µ )2 = σ 2 Varianza
109
5. Medidas de forma
Las medidas de forma, al igual que las medidas de posición y dispersión,
determinan el comportamiento general de la variable.
OM
La siguiente imagen muestra la forma para diferentes distribuciones:
a. ASIMETRÍA b. CURTOSIS
0,24
.C
Frecuencia Relativa
0,09
0,18
Frecuencia Relativa
0,07
0,12
0,05
DD
0,06
0,02
0,00
0,00 3,81 7,62 11,44 15,25 0,00
Variable 3,00 12,25 21,50 30,75 40,00
Variable
0,09
2,46
Frecuencia Relativa
f recuencia relativa
0,07
1,85
0,05
FI
1,23
0,02
0,62
0,00 0,00
0,00 0,25 0,50 0,75 1,00 3,00 12,25 21,50 30,75 40,00
Variable
Variable
0,09
0,16
Frecuencia Relativa
Frecuencia Relativa
0,07
0,12
0,08 0,05
110
0,04
0,02
0,00
-2,25 3,88 10,00 16,12 22,25
0,00
Variable 3,00 12,25 21,50 30,75 40,00
Variable
En lo atinente a la curtosis, se define como el grado de concentración de Para una mejor comprensión
los valores de la variable en torno al modo, mientras mayor concentración más del significado del término
puntiaguda se muestra la distribución tal como se ve en la imagen b1, llamándo- dispersión en el entorno de las
se en este caso Leptocúrtica, es Mesocúrtica cuando está menos concentrada medidas descriptivas, se su-
giere a ingresar a la sección
alcanzando una altura media como muestra la imagen b2 y es Platicúrtica en el
Materiales Recursos del aula
caso en que los valores de la variable se dispersan hasta alcanzar una forma virtual para ver la producción
aplanada en la distribución como se observa en b3 . audiovisual llamada “Medidas
de Simetría y Curtosis” que
OM
explican el término.
5.1 Coeficientes de asimetría
.C
entre las medidas de posición central, permite determinar una medida
relativa de la distancia que se presenta entre ellas cuando la distribu-
ción es asimétrica. Su valor es cero cuando la distribución es simétrica
en virtud de que las tres medidas son idénticas en este tipo de distribu-
DD
ciones.
x − Mo 3( x − Me )
=Ca =
s s
FI
∑( x
i =1
i − µ )3
µ3
= g=
Ca N =
σ
1
( µ 22 )3
3
∑( xi =1
i − x )3
= g=
Ca n
1
s3
111
El coeficiente de asimetría puede asumir valores mayores, iguales o me-
nores que cero. Si es cero la distribución es perfectamente simétrica pero si es
positivo es asimétrica positiva o si es negativo asimétrica negativa.
∑( x − µ )4
OM
i
i =1
N µ4
=
Ck =
−3 −3
σ 4
( µ22 )4
∑( x − x )4
.C
i
i =1
=Ck n −3
s4
DD
Estos coeficientes pueden asumir valor mayor, igual o menor que cero,
indicando que la distribución es alta (leptocúrtica), media (mesocúrtica) y baja
(platicúrtica), respectivamente.
112
3(189.91 − 135 )
=Ca = 0, 67
245.25
OM
ra sea el coeficiente que utilicemos.
.C
Gráficamente las dos medidas de forma pueden verse reflejadas en el
histograma de la Gráfico 3, donde la ubicación de las medidas de posición res-
DD
ponde a la marcada asimetría que la variable presenta. Esto nos lleva a relacio-
nar las medidas de posición central y las de forma.
Gráfico 3
Histograma de la variable gasto en movilidad mensual
LA
FI
113
La distancia entre las medidas de posición central media, mediana y mo-
do permite establecer si la distribución es simétrica o asimétrica. En las simétri-
cas las tres medidas coinciden aproximadamente, mientras que en distribucio-
nes asimétricas son diferentes. Estas relaciones se ilustran en las siguientes
imágenes.
Frecuencia Relativa
0,18
0,12
0,06
0,00
OM
0,00 3,81 7,62 11,44 15,25
Variable
.C
Frecuencia Relativa
1,73
1,15
DD
0,58
0,00
0,00 0,25 0,50 0,75 1,00
Variable
Distribución simétrica
0,10
Frecuencia Relativa
0,08
FI
0,05
0,03
0,00
0,64 10,32 20,00 29,68 39,37
Variable
M(X) = Me = Mo
Actividad 14
Es importante para diagramar actividades, los gastos que las mismas pueden
ocasionar en los bolsillos de los estudiantes, es por eso que se analiza el gasto
en libros y movilidad, utilizando información de la base de datos de “alumnos.
Idb”. Relacione las medidas descriptivas de cada variable y los gráficos de caja y
brazos e histogramas para responder lo que se solicita:
OM
b) Relacione su opinión con el diagrama de caja y brazo e indique qué ob-
serva en ese gráfico en relación a la opinión emitida.
Medidas descriptivas
.C
DD
LA
FI
115
OM
.C 6. Distribuciones bidimensionales
DD
En las secciones anteriores presentamos el cálculo de medidas para des-
cribir una variable. Ahora introducimos medidas que permiten describir numé-
ricamente la relación lineal entre dos variables cuantitativas.
116
Es una medida de dispersión conjunta entre dos variables cuantitativas que
indica la presencia de asociación lineal directa o inversa entre las mismas.
OM
Se define como:
M [( x − M( x ))( y − M( y ))]
Cov( x,y ) =
.C ∑( x i − M( x ))( y i − M( y ))
Cov( x,y ) = i =1
n
DD
Realizando el producto de los binomios y operando se llega finalmente a
que:
n n n
∑ xi y i=∑ xi ∑ y i
Cov( x,y ) =
=i 1
− i 1 =i 1
=
M( xy ) − M( x )M( y )
n n n
LA
COV ( X ,Y )
r =
DS( x ).DS( y )
OM
.C
DD
Para aclarar este concepto, consideraremos la tasa de desempleo (x) y la
tasa de renuncia (y) para 13 regiones en un momento determinado del tiempo.
Se calculará la covarianza y el coeficiente de correlación de Pearson y se inter-
LA
pretará su resultado.
118
OM
.C
DD
LA
Covarianza (x,y)
FI
Coeficiente de
correlación (x,y)
∑ ( x + y i ) − ( M ( x ) + M( y ) )
2
i
V( x + y ) =i =1
n
n
∑ ( x − M ( x ) ) + ( y i − M( y ) )
2
i
i =1
∑ (( x )
n
− M ( x ) ) + 2 ( xi − M ( x ) ) ( y i − M( y ) ) + ( y i − M( y ) )
2 2
i
V( x + y ) =
i =1
OM
Distribuyendo el sumatorio y n:
n n n
.C Por lo que:
V ( x + y )= V ( x ) + V ( y ) + 2.Cov ( x,y )
DD
Observemos que, si la covarianza es cero, indica que hay indepen-
dencia entre las variables "x" e "y" con lo que la varianza de la suma o
diferencia de las variables "x" e "y" será igual a la suma de las varianzas
de cada una de ellas.
V( x ± y) = V(x) + V(y)
LA
Actividad 15
Considerando los datos de la base EPH.idb, un aspecto importante es la relación
entre las horas trabajadas y la antigüedad en el empleo del jefe de hogar. A par-
tir de los siguientes resultados, responda:
FI
120
7. Actividades de aprendizaje
Actividad 16
Con los datos de la base EPH, se ha analizado la variable sueldo, que representa
el ingreso de las personas consultadas en la muestra. Se ha considerado para el
análisis descriptivo el ingreso de Empleadores y trabajadores por su cuenta, las
medidas descriptivas para el ingreso de cada una de esas categorías, se mues-
tra en tabla 12:
Medidas
Cuenta
variable Empleador
propista
OM
ingreso
n 9 21
Media 1280 737,14
Var(n-1) 394075 237401,43
Mín 370 240
Máx 2200 2100
Mediana 1300 650
.C
Q1 970 320
Q3 1500 870
Asimetría 0,03 1,53
DD
a) Calcule la media general (varones y mujeres) del ingreso de ambas ca-
tegorías.
b) Calcule la desviación estándar del ingreso de cada categoría.
c) Calcule el coeficiente de variación, para cada grupo, interprete y com-
pare.
LA
(Aplique propiedades).
Actividad 17
Retomando la actividad 20 de la Unidad 1, se le solicita que analice la variable
mediante un análisis descriptivo: medidas de posición, dispersión y forma, in-
Actividad 18
Conforme a la actividad 23 de la Unidad 1, en la que para 15 empresas se relevó
el precio y el margen de utilidad de un producto.
Actividad 19
Conforme a la actividad 24 de Unidad 1, referida a una heladería que cuenta con
dos sucursales en la Ciudad de Córdoba, una ubicada en la zona Norte y otra
Zona
4 6 7 5 5 6 7 4 8 6 8 5 7 6 7 5 6 6 7 4
Norte
Zona
4 6 5 3 6 3 5 6 5 6 4 4 5 6 6 2 3 4 5 6
Sur
b) Efectúe comparaciones
Actividad 20
OM
A continuación se presentan los precios de venta (en miles de $) de 30 casas de
dos zonas residenciales de la Ciudad de Córdoba que fueron utilizados en la
actividad 25 de la Unidad 1.
B
.C
Zona
100
134
121
148
116
145
130
131
128
118
109
117
135
126
136
125
112
122
110
126
119
132
105
130
125
150
125
115
119
133
DD
Para cada zona:
Calcule las medidas de posición dispersión y forma y analice cada distribución
emitiendo una opinión en relación a las características estadísticas de los pre-
cios de venta de las viviendas en cada zona, es decir, los precios más altos, los
más variables, la zona que presenta valores muy diferentes al promedio, etc.
LA
Relacione las interpretaciones que Ud. Realiza en esta actividad con las que
realizó en la unidad 1.
Actividad 21
Un aspecto relevante para las empresas es la cantidad de personal que ocupan,
FI
PRODUCTOS
DE ORIGEN PRODUCTOS OTRAS IN-
MEDIDA NO METÁLI-
AGROPECUARIO METÁLICOS DUSTRIAS
COS
n 49 36 50 13
Media 33,63 27,67 35,36 58,38
D.E. 40,81 41,19 47,61 83,7
CV 121,33 148,88 134,65 143,35
122 Mín 3 3 4 6
Máx 191 168 214 280
Q1 10 6 11 17
Asimetría 2,35 2,62 2,56 2,2
Kurtosis 4,78 5,23 5,5 2,23
OM
costos lab/costo total -82,87 201,06
.C
Analice la información y emita una opinión sobre la relación lineal que puede
existir entre las variables.
DD
8. Referencias Bibliográficas
LA
- Díaz Margarita ….[et.al.] (2004) Estadística I: Guía de Estudio. -1ra Ed. Córdo-
ba Asociación Cooperadora de la Fac. de Cs. de la U.N.C., 2009.338 páginas
27x21 cm ISBN 978-987-1436-21-7.
FI
123
Actividad 1:
Actividad 2:
OM
a) Medidas resumen con Infostat
.C
Interpretación:
El promedio de unidades solicitadas de él bien analizado es de 23 unidades,
para la muestra de 14 clientes.
Hay 7 clientes (50%) que solicitaron menos de 23 unidades.
DD
Hay dos valores modales, correspondientes a los valores más frecuentes que
son de 16 y 25 unidades, respectivamente.
b) ∑ (x i − M(x )) = 0
xi (xi- promedio)
10 -13,43
12 -11,43
FI
14 -9,43
16 -7,43
16 -7,43
18 -5,43
20 -3,43
25 1,57
25 1,57
27 3,57
30 6,57
30 6,57
35 11,57
124
50 26,57
Total 0,00
Y=x+4
M(y) = M( x +4 )
= M(x) + M(4)
= 23,43 + 4
M(y) = 27,43
OM
M( Y) = M( x. 0,85 )
= 0,85. M( x)
= 0,85 . 23,43
M(y) = 19,92
Actividad 3
a)
.C
Muestra tamaño: 9 personas (patrones).
Muestra tamaño: 21 personas (Cuenta propia).
DD
b) Monto total
Monto total de sueldo de los 9 patrones analizados es de $11520.
Monto total de sueldo de los 21 cuentapropistas analizados es de $15480.
c) Promedios
LA
M (Y) = M (0,80. x)
=0,80. M(x)
Entonces para cada muestra los nuevos valores de promedio bajo el efecto in-
flacionario serán:
W= 50+ 1,18 x
M(W) = M ( 50 + 1,18 . x)
= M(50) + M( 1,18 . x)
= 50 + 1,18. M( x)
Reemplazando ahora por las medias de cada grupo analizado tendremos
OM
Patrón Cuenta Propia
Promedio 1280 737,14
Nueva media 1560 919,83
.C
g) Promedio total = (Media grupo 1) . n1 + (media grupo 2).n2
n1 +n2
Actividad 4
Media 21 26
Mediana 16 27
Modo 16 25
Modo ---------- 30
Interpretaciones:
Turno 1 una distribución levemente asimétrica derecha; mientras que los datos
del Turno 2 presentan una forma asimétrica izquierda.
Turno 1 Turno 2
Asimetría 2,43 -1,55
Turno 1 Turno 2
OM
CV 62,84 30,28
Como puede verse el CV del turno 2 es más pequeño por lo tanto podemos con-
cluir que para este turno los datos son más homogéneos, están menos disper-
sos y por lo tanto el promedio para este Turno es más representativo.
c) Para verificar estas igualdades realizaremos una tabla en Excel con los datos
del Turno 1
Turno 1
.C
( xi - media ) ( xi-media)2 ( xi-mediana)2 (xi- modo)2
DD
12 -9 78,45 16 16
14 -7 47,02 4 4
16 -5 23,59 0 0
16 -5 23,59 0 0
18 -3 8,16 4 4
LA
20 -1 0,73 16 16
50 29 849,31 1156 1156
Total 0 1030,86 1196 1196
mo.
Actividad 5
Media 19,1
Mediana 17,5
Modo 10
127
0,44
0,33
frecuencia relativa
0,22
0,11
0,00
7 15 22 30 37
OM
Mo=10 Me = 17,5 M(x)= 19,1
Actividad 6
Q1
.C
a) Para analizar esto debemos calcular los cuartiles:
15,5
DD
Mediana = Q2 22,5
Q3 28,5
Q1: la cantidad máxima de pedidos del 25% de los clientes que menos deman-
dan es de 15,5 pedidos (aproximadamente 16 pedidos).
LA
Q3: la cantidad mínima demandada del 25% de los clientes que más cantidad
demandan es de 28,5 pedidos (aproximadamente 29 pedidos).
Medidas resumen
FI
Resumen Xi
n 14,00
Media 23,43
Mín 10,00
Máx 50,00
Mediana 22,50
Q1 16,00
Q3 30,00
Actividad 7
a)
Medidas resumen
OM
b)
HISTOGRAMA VALOR DE CUENTAS NO PAGAS
0,44
0,33
frecuencia relativa
0,22
0,11
.C
DD
0,00
7 15 22 30 37
Q2=17,
LA
Q1=105 Q3=26
Actividad 8
Aplicando propiedad.
129
Actividad 9
Y = x +4
V (y) = V(x + 4)
= V(x) + V (4)
OM
= 115 + 0
V (y) = 115 unidades2.
Por lo tanto la desviación estándar para el mes de marzo será DS (y) = 11 unida-
des, la misma que para febrero porque el incremento es constante (Vza de una
constante es igual a 0).
.C w =x (1 – 0,15)
w = 0,85. X
V (w ) = 83 unidades2..
LA
Actividad 10
FI
El grupo de los Patrones muestra un menor CV con lo que puede concluirse que
en este conjunto de datos los valores son más homogéneos, menos dispersos y
por tanto el promedio para este grupo es más representativo.
Y aplicamos propiedades:
OM
V (y) = V(x + 50)
= V(x) + V (50)
V (y) = V(x) + 0
V (y) = V(x).
Con lo que podemos concluir que si el incremento es de $50 los valores de va-
rianza y de desvío estándar no se modificaran.
.C Varianza
Patrón
394075
Cuenta propia
237401
DD
Desv. Est. 628 487
W= x + 0,18 x
W= x.(1+0,18)
LA
W= 1,18 x
V (w) = V (1,18. X)
= (1,18)2 V(x)
Entonces los nuevos valores de varianza y de desvío estándar para cada una de
las muestras será de:
f) Volvemos a calcular los CV% para los supuestos de los puntos d) y e) pero
para ello deberemos calcular la nueva media en cada caso.
OM
Si hay un incremento (porcentual) del 18% observamos que el CV% no variara.
Actividad 11
Medidas resumen
.C
Resumen VALOR MON CNP
n 12,00
Mín 7,00
Máx 37,00
Mediana 17,50
DD
Q1 10,00
Q3 26,00
38,50
30,25
VALOR MON CNP
22,00
FI
13,75
5,50
132 Actividad 12
Medidas resumen
2291,50
1788,25
SUELDO P
1285,00
781,75
OM
278,50
.C
con lo cual podemos concluir que no hay valores outliers ni extremos dentro de
la distribución (son los valores 1800 y 2100 respectivamente).
DD
DIAGRAMA DE CAJA Y BRAZOS
2193,00
1681,50
LA
SUELDO CP
1170,00
FI
658,50
147,00
Actividad 13 133
Me 65,35
Q1 57
Q3 72
RI 15
LIO 34,5
FI
LSO 94,5
LIE 12
LSE 117
VMIN 47
VMAX 100
Como puede observarse que el valor mínimo caen dentro de las barreras inter-
nas (Izquierda) pero el valor máximo supera a la BID y está ubicado antes de la
BED por lo tanto podemos concluir que hay presencia de valores outliers (atípi-
cos) dentro de la distribución.
134 Actividad 14
a) Analizando las medidas de posición para cada variable podemos concluir que
ambas variables presentan una forma asimétrica derecha, pero que para el caso
de la variable “gasto de movilidad” esta asimetría es más marcada. Esto puede
verse también analizando ambos coeficientes de asimetría, que como se obser-
va para el caso de la segunda variable es mayor su valor.
El mayor valor obtenido para la variable “gasto de movilidad” nos permite con-
cluir que para esta variable los datos están más dispersos , son menos homogé-
neos y que la media es menos representativa.
OM
cantidad de estos valores que se presentan.
Actividad 15
.C
DD
LA
FI
a) Covarianza = 19,09 indica una asociación directa o positiva entre las “horas
trabajadas” y la “antigüedad”
MEDIDAS VARIABLE
EMPLEADOR CUENTA PROPISTA
INGRESO
n 9 21
Media 1280 737,14
Var(n-1) 394075 237401,43
Mín 370 240
Máx 2200 2100
Mediana 1300 650
Q1 970 320
Q3 1500 870
OM
Asimetría 0,03 1,53
a) Media general
.C
b) Desvío estándar para cada una de las categorías.
DD
Empleador Cuenta propista
c) Coeficiente de variación.
LA
CV % 49,04 66,10
FI
Se observa que los datos para el grupo de Empleadores son más homogéneos,
es decir están menos dispersos y por ende su media es más representativa,
que la del grupo de los trabajadores por Cuenta Propia.
d) Recorrido Intercuartílico.
RI 530,00 550,00
f) Para calcular la media y la varianza si hay una disminución del 20% definimos
136 una nueva variable ( que será nuestra variable original menos el descuento)
Ahora:
M(W) = M( 0,80 . X)
= 0,80. M(X)
= 0,80 . 1280
OM
= 0,64 . 394075
V(W) = 252208 $2 Para los Empleadores.
V (W) = 151936,92 $2 Para los Cuenta Propistas
Actividad 17
.C
Variable: cotizaciones de acciones en la Bolsa de Comercio n=22 días
Utilizando Infostat obtenemos la siguiente tabla de resumen de medidas
DD
Medidas resumen
Resumen cotización de acciones
n 22,00
Media 9,30
D.E. 1,82
LA
Var(n-1) 3,32
CV 19,61
Mín 3,00
Máx 11,70
Mediana 9,65
FI
Q1 8,40
Q3 10,40
Asimetría -1,91
Kurtosis 4,51
Actividad 18
Covarianza 0,37
Coef. Correlación 0,546
.C
Actividad 19
Q3 7 6
Rango Intercuartilico 2 2
Vmin 4 2
Vmax 8 6
Coef. Asim -0,08 -0,59
Rango 4 4
Por otro lado comparando ambos CV podemos ver que como para la muestra
de la Zona Norte el coeficiente de variación es menor, entonces se puede con-
cluir que para estos los datos son más homogéneos, están menos dispersos y la
media es más representativa (lo cual ya se afirmó por otra vía de análisis)
Los rangos son iguales para ambas distribuciones.
Actividad 20
Variable analizada: precio de venta (en miles de $)
Zona A Zona B
Promedio 105,03 124,73
Mediana 103,00 125,00
Modo 100,00 125,00
Varianza 114,10 142,41
OM
Desv Est 10,68 11,93
N 30 30
Q1 96,00 116,75
Q3 113,25 132,25
Rango Intercuartilico 17,25 15,50
Vmin 90,00 100,00
Vmax
Coef. Asim
Rango .C 129,00
0,58
39,00
150,00
0,15
50,00
DD
CV% 10,17 9,57
Por otro lado comparando ambos CV podemos ver que como para la muestra
de la Zona A el coeficiente de variación es mayor, entonces se puede concluir
que para estos los datos son menos homogéneos (mas heterogéneos), están
más dispersos y la media es menos representativa que los de la zona B (lo
Actividad 21:
A cargo del alumno
139