Documentos de Académico
Documentos de Profesional
Documentos de Cultura
CURSO
ESTADSTICA GENERAL
PRIMERA GUA DE TRABAJ0
Periodo Acadmico 2015 - 2
Agosto - 2015
1
Estadstica Descriptiva
Parte I:
Conceptos bsicos; poblacin, muestra, unidad de anlisis, unidad reportante, tipo de
variable, estadgrafo, parmetro.
1
Clasifique cada una de las siguientes variables: nominal (N), ordinal (O), discreta (D), continua
(C).
Fue evaluada la capacidad de los administradores de comunicarse con los dems, la nota
promedio en esta prueba fue de 75 puntos.
Poblacin:
Muestra:
Variable
Tipo de
variable
Parmetro
Estadgrafo
En una empresa distribuidora se ha obtenido que el monto promedio por factura pagada es
de 750 soles; este valor se obtuvo de una muestra de tamao 100.
Poblacin :
Unidad de anlisis :
Variable-tipo:
Parmetro:
Estadgrafo:
La prueba de producto es una forma de investigacin comercial que tiene como objetivo
conocer las bondades del producto en base a la opinin de una muestra de consumidores.
ALFA S.A es una empresa de investigacin comercial que realizara una prueba de producto
sobre un detergente para ropa. Para la investigacin seleccionar una muestra de 500
hogares de los 47 distritos de Lima y Callao y se entrevist al ama de casa. Entre las
preguntas consideradas las principales son: Ha probado usted el detergente de ropa XX?,
Cuntas veces en el ltimo mes us el detergente XX?, Cunto gast usted en la ltima
compra de detergente?, Qu tan satisfecho se encuentra usted con este producto?
a Relacione usted los trminos de la izquierda con los de la derecha, colocando las letras
correspondientes en la columna del centro.
i
ii)
Dato
Poblacin
Recopilacin
poblacin.
iv) Muestra
v)
Censo
de
informacin
de
toda
la
Parmetro
Estadgrafo
Variable 2 (cuantitativa)
Parmetro
Estadgrafo
Muestra
Variable
Alumnos de la
Universidad
de
Lima.
400
alumnos
elegidos al azar
de la U. Lima
Edad
de
un
alumnos de la U.
Lima.
Viviendas de la
urbanizacin Los
Rosales.
Condicin
150
viviendas
externa de la
seleccionadas al
vivienda
(Muy
azar en toda la
buena,
buena,
urbanizacin.
mala) .
Boletas de venta
del Restaurante
Delicias. Marzo
2015.
60 boletas de
venta elegidas de
todo el mes de
marzo.
Parmetro
Estadgrafo
Valor de la venta
registrada en la
boleta (soles)
Parte II:
4. Haga lo mismo que el tem3 con los datos de las columnas 2, 5, 6, 7 y 8. Guarde los nuevos
datos en su respectiva columna.
5. Con Data>Code>Numeric to Text utilice la columna 9 (llmela: Nivel de sueldo) para guardar
los datos de la columna 3 clasificados en 3 niveles de sueldo como sigue:
Bajo
: sueldos menores que 2500 soles.
Moderado: sueldos de 2500 o ms pero inferiores a 7000 soles.
Alto
: sueldos de 7000 soles a ms.
6. Utilizando Stat >Tables>Tally Individual Variables, construya la tabla de distribucin de
frecuencias para la variable Estado civil, (realice el conteo de los datos de la columna 5 y
luego complete los datos de la siguiente tabla):
Tabla N 1
Distribucin del personal segn estado civil
Industrial Tools reas Administracin y Operaciones
Porcentaje (hj
Estado civil
Conteo (fj)
%)
Soltero
Casado
Divorciado
Viudo
Total
Fuente: Datos gua de laboratorio 2015-0
7. Interprete en trminos del problema las frecuencias f2 y h2. Muestre el grfico de barras para
este caso.
8. Con los datos de la Variable Estado Civil construya un grfico circular. (Graph>Pie chart).
9. Utilice los datos de la variable Estados Cvil para construir un grfico circular desagregado por
gnero (Graph>Pie chart>Multiple graph).
10. Utilice los datos de la variable Estado Civil para construir un grfico circular desagregado por
gnero.
11. De manera similar construya la tabla de distribucin de frecuencias para la variable AFP a la que
est inscrita el trabajador y para la variable Nivel de Sueldo.
Tabla N 2
Tabla N 3
Conteo
(fj)
Porcentaje
(hj%)
AFP
HORIZONTE
BAJO
INTEGRA
MODERADO
PRIMA
ALTO
PROFUTURO
Conteo
(fj)
Porcentaje
(hj%)
Total
Fuente: gua de laboratorio 1 2015-0
Total
Fuente: gua de laboratorio 1 2015-0
afiliados
la
mayora
de
trabajadores
de
estas
reas?
Intervalos
Variable
Sueldo
hi%
Fi
Hi%
1150 - 5036
199
89.24
199
89.24
5036 - 8922
12
5.38
211
94.62
8922 - 12808
11
4.93
222
99.55
12808 - 16694
222
99.55
16694 - 20580
0.45
223
100
Total
223
100
Minimum
1150
Count
199
12
11
1
223
Percent
89.24
5.38
4.93
0.45
Maximum
20580
CumCnt
199
211
222
223
Range
19430
CumPct
89.24
94.62
99.55
100.00
Histogram of Sueldo
89.2377
90
80
70
60
Percent
C10
f1
f2
f3
f5
N=
fi
50
40
30
20
10
0
5.38117
4.93274
0.44843
1150
5036
8922
12808
16694
20580
Sueldo
Histogram of Sueldo
250
222
223
222
211
199
Cumulative Frequency
200
150
100
50
1150
5036
8922
12808
16694
20580
Sueldo
15. Empleando Stat>Tables>Cross Tabulation and Chi Square, haga la tabulacin cruzada de
los datos de las columnas 1 (filas) y 2 (columnas), y luego complete el siguiente cuadro:
Tabla N 4
Distribucin del personal segn gnero y rea de trabajo
Industrial Tools reas Administracin y Operaciones
rea
Hombres
Mujeres
Total
Administraci
n
Operaciones
27
21
48
106
69
175
Total
133
90
223
Masculino
All
21
69
90
27
106
133
48
175
223
Administraicn
Operaciones
All
Cell Contents:
Count
Femenino
Masculino
All
Administraicn
21
23.33
27
20.30
48
21.52
Operaciones
69
76.67
106
79.70
175
78.48
90
100.00
133
100.00
223
100.00
Femenino
Masculino
All
All
10
Administraicn
21
43.75
27
56.25
48
100.00
Operaciones
69
39.43
106
60.57
175
100.00
All
90
40.36
133
59.64
223
100.00
Femenino
Administraicn
Masculino
All
21
9.42
27
12.11
48
21.52
Operaciones
69
30.94
106
47.53
175
78.48
All
90
40.36
133
59.64
223
100.00
Columns: Gnero
Femenino
Masculino
All
10
29
39
5
42
47
15
71
86
Administraicn
Operaciones
All
Cell Contents:
Count
Columns: Gnero
Femenino
Masculino
All
11
40
51
22
64
86
33
104
137
Femenino
Masculino
All
4
10
14
7
19
26
11
29
40
Administraicn
Operaciones
All
Cell Contents:
Count
Columns: Gnero
Administraicn
Operaciones
All
Cell Contents:
Count
Rows: Area
Columns: Gnero
Femenino
Masculino
All
10
30
40
9
29
38
19
59
78
Femenino
Masculino
All
5
20
25
7
38
45
12
58
70
Femenino
Masculino
All
2
9
11
4
20
24
6
29
35
Administraicn
Operaciones
All
Cell Contents:
Count
Columns: Gnero
Administraicn
Operaciones
All
Cell Contents:
Count
Columns: Gnero
Administraicn
Operaciones
All
Cell Contents:
Count
16. Empleando el mismo comando del punto anterior, haga la tabulacin cruzada de los datos de
las columnas 1 y 5, luego complete el siguiente cuadro:
Tabla N5
Distribucin del personal segn gnero y estado civil
Industrial Tools reas Administracin y Operaciones
Estado civil
Hombres
Mujeres
Total
Soltero
Casado
Divorciado
Viudo
Total
19. Utilizando tabulaciones cruzadas complete las frecuencias simples de las siguientes tablas
cruzadas:
Tabla N 6
Distribucin del personal segn gnero, nivel de sueldo y rea de trabajo
Industrial Tools reas Administracin y Operaciones
Hombres
Administrac Operacion
in
es
Tota
l
Nivel de
sueldo
Mujeres
Admistraci Operacion
n
es
Alto
10
10
Alto
Moderad
o
106
106
Moderad
o
69
69
Bajo
17
17
Bajo
14
14
27
106
21
69
90
Nivel de
sueldo
Total
133
Total
13
Parte III:
Medidas estadsticas de tendencia central (promedio, mediana, moda y percentiles).
Medidas estadsticas de variabilidad (rango, rango intercuartil, varianza, desviacin
estndar, coeficiente de variacin).
Medidas de forma: coeficiente de asimetra y coeficiente de curtosis.
Diagrama de cajas.
Caso 2: Parque Automotor de servicio de transporte pblico en Lima Metropolitana
Una entidad de gobierno est interesada en conocer la antigedad del parque automotor de servicio
de transporte pblico en Lima Metropolitana con la finalidad de lanzar el proyecto de Chatarreo; en
la actualidad se han inscrito 8 empresas para acogerse a tal proyecto. Se ha elegido aleatoriamente
3 empresas inscritas para la verificacin de la informacin presentada. Las variables que se han
evaluado son:
Marca: Es la marca del vehculo.
Antigedad: Es la antigedad del vehculo (en aos).
Tipo: Es el tipo de vehculo (microbs, combi, bus).
Nro. de asientos: Nmero de asientos por cada unidad automotriz.
Tipo de combustible: tipo de combustible utilizado por el vehculo (petrleo, gasolina).
Los datos se encuentran en el archivo de Minitab Chatarreo.MTW
1. Utilice el comando Stat>Basic Stat>Display Descriptive Statistics para procesar la
informacin de la variable antigedad del vehculo, a continuacin complete las siguientes
tablas de indicadores:
Tipo de
vehculo
Buses
Promedi
o
Mediana
Moda
Combis
Microbuses
2. Utilice el comando anterior para procesar la informacin de la variable antigedad
desagregado por tipo de combustible utilizado por el vehculo.
Vehculos gasolineros
Marca
Promedio Mediana
Vehculos petroleros
Marca
Promedio Mediana
Dodge
Dodge
Mercedes Benz
Mercedes Benz
Scania
Scania
3. En que marca o marcas de vehculos se tiene que ms del 50% de unidades tienen una
antigedad mayor a su promedio?
4. Cul es el promedio de asientos en los buses que utilizan petroleo?
5. Suponer que el costo mensual de mantenimiento de un bus es, en promedio, 150 soles; de una
combi es, en promedio, 90 soles; y de un microbs es, en promedio, 120 soles. Calcule el costo
promedio mensual de mantenimiento de un vehculo. Detalle el procedimiento.
14
Tipo de
vehculo
Costo promedio
N de
Vehculos
Buses
Combis
Microbuses
El costo promedio mensual de mantenimiento de un vehculo es: _______________________
6. Procese la informacin de la variable nmero de asientos para determinar los siguientes
indicadores:
Q1
Mediana
Q3
Tipo de
Vehculo
Buses
Q1
Mediana
Q3
Combis
Microbuses
7. De las tablas del inciso anterior, interprete:
El valor de Q1 en la primera tabla
8. Utilice la calculadora de Minitab para calcular e interpretar el valor del percentil 20 con los datos
de la columna 2.
9. Empleando previamente el comando Data>splitworksheet; utilice la calculadora del Minitab
para determinar el valor del percentil 90 con los datos de la columna 4 desagregado por tipo de
combustible.
10. En cul de las marcas se observa menor dispersin relativa en la distribucin de la
antigedad?
11. En qu tipo de vehculos la distribucin del nmero de asientos es ms asimtrica?
12. Con el comando Graph>boxplot>simple construya un diagrama de cajas para la variable
antigedad del vehculo.
13. Al construir un diagrama de cajas para los datos de la variables antigedad desagregado por
marca del vehculo, responda las siguientes preguntas:
a) observa usted valores atpicos (outliers)?
b) En qu marca de vehculo se observa mayor asimetra con respecto a la antigedad?
c) Si consideramos en cada caso el cuarto superior de datos en cul de las marcas se
observa mayor homogeneidad?
15
12. Construya una tabla de distribucin de frecuencias con 7 intervalos para la variable gasto
mensual en telefona mvil.
Intervalos
Punto medio
Xi
Total
-----
fi
hi%
100.00
Con la informacin obtenida en la pregunta anterior (es decir en base a los resultados de la
tabla) responda lo siguiente:
a) Cul es el promedio y la desviacin estndar del gasto mensual en telefona mvil?
b) Considerando la empresa de telefona a la que pertenece el usuario y construyendo un grfico
de cajas en cul de las empresas de telefona el gasto promedio de sus usuarios no es una
medida de resumen representativa de los gastos?, Indique porqu.
c) supongamos que la Telefnica reduce su tarifa en un 5%. En base a esta informacin
responda las siguientes preguntas:
i.
Cul sera el nuevo gasto promedio mensual en telefona mvil?
ii.
Cul sera el nuevo valor de la varianza del gasto mensual en telefona mvil luego de
la reduccin de la tarifa?
17
10. Desde hace dos aos las compaas gastan en proteccin de la informacin. Estos gastos
incluyen los costos de personal, hardware, software, servicios externos y seguridad fsica.
18
16.8
i 1
2
i
58.99
i 1
Empresa 1:
Me = 3.0
6
13.2
i 1
2
i
36.88
i 1
Empresa 2:
Me = 2.5
a) Cul de las dos empresas ha tenidos gastos mensuales ms homogneos en los
ltimos seis meses?; Cul de ellas ha tenido gastos ms asimtricos?
b) Si como resultado de la inseguridad actual, el directorio de la empresa 2 acord
aumentar sus gastos en proteccin en un 5% ms 800 dlares, cul ser el
coeficiente de variacin de los gastos en proteccin para esta empresa el prximo
mes?.
x
11. De una distribucin se conoce la siguiente informacin: tamao (n = 20); media ( = 400);
mediana (me = 450); menor valor (X(1) = 100) y rango (R = 900). Al introducir los datos en la
computadora se ha cometido un error tipogrfico sustituyendo el valor (nico) X = 1000, por
el de X = 10000. Cmo afectar este error en el clculo de la media, mediana y rango?
Calcula los nuevos valores.
12. Responda como verdadero (V) o falso (F) cada uno de los siguientes enunciados:
a) En todo conjunto de datos, la varianza siempre es mayor que su desviacin estndar ( ).
b) En una distribucin sesgada a la derecha, la mediana es menor que la media ( ).
c) La nota promedio de los 40 alumnos que rindieron un examen de Clculo II fue
11.75. Los 25 aprobados obtuvieron una nota promedio de 14, luego la nota
promedio de los desaprobados fue 08 ( ).
13. Nueve expertos clasificaron una galleta con trozos de chocolate en una escala de 1 a 50.
Sus calificaciones fueron: 34, 35, 41, 28, 26, 29, 32, 38 y 40.
a) Cul es la amplitud de las calificaciones?
b) Cul es la media aritmtica?
c) Cul es su desviacin estndar?
d) Un segundo grupo de expertos calific el mismo producto. La amplitud total fue 8, la
media 33.9 y la desviacin estndar 1.9. Compare la dispersin en estas
calificaciones con las del primer grupo.
14. Gonzalo Muoz, encargado de compras de un gran centro comercial ha obtenido muestras
de lmparas elctricas de dos empresas proveedoras. Prob ambas muestras con respecto
tiempo de vida til de la lmpara, y obtuvo los siguentes resultados:
Duracin
(horas)
Punt
o
medi
o
Empresa
A
900
18
22
26
22
700 ---
19
20