Documentos de Académico
Documentos de Profesional
Documentos de Cultura
EE1 - Primera Guía de Trabajo - 2022-2f
EE1 - Primera Guía de Trabajo - 2022-2f
CURSO
ESTADÍSTICA EMPRESARIAL 1
GUÍA DE PRÁCTICA Nº 1
Periodo Académico 2022-2
CASOS DE APLICACIÓN
Profesora Responsable:
Agosto-Diciembre 2022
1
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en concordancia con lo
dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
CAPÍTULO 1
2
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en concordancia con lo
dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
TÉRMINOS BÁSICOS DE LA ESTADÍSTICA
Población.- Conjunto de elementos que conforman el universo a ser investigado, claramente definidos en el
espacio y el tiempo. Pueden ser personas, hogares, distritos, empresas, estudiantes universitarios, otros.
Muestra.- Es un subconjunto o una parte del universo, la que se ha seleccionado con el fin de estudiar una o
más características y obtener información acerca de la población de la cual proviene.
Unidad de análisis.- Es el elemento o unidad base de la población o de la muestra del cual se obtendrá datos
referidos a ciertas características o variables, que nos interesan para explicar un determinado fenómeno.
Unidad Reportante.- Es aquella persona que nos brinda la información que se le solicita.
Estadígrafo.- Es el valor calculado en base a los datos que se obtienen en la muestra y por lo tanto; es una
estimación o aproximación al parámetro.
Parámetro.- Es una medida de resumen de toda la población que, se expresa por ejemplo como total,
promedio, proporción, razón, etc.
Variable.- Es una característica de la unidad de análisis cuya medida puede cambiar de valor. Se representa
simbólicamente mediante las letras del alfabeto (X, Y, Z).
3
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en concordancia con lo
dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
REPASO DE POBLACIÓN, MUESTRA, UNIDAD DE ANÁLISIS, PARÁMETRO,
ESTADÍGRAFO Y VARIABLE
CASOS DE APLICACIÓN
1. Clasifique cada una de las siguientes variables: nominal (N), ordinal (O), discreta (D), continua (C).
2. La gerencia de marketing de una empresa de galletas desea estimar el promedio de cajas de galletas que
se venden por bodega, durante un mes, en el Cercado de Lima. En base al resultado, la empresa debe
decidir si implementa una campaña publicitaria por medios radiales. Se seleccionó una muestra aleatoria
de 150 bodegas y se recolectó información aplicando una encuesta.
Responder las siguientes preguntas :
a. Para realizar un estudio sobre el grado de satisfacción laboral de la empresa ALFA (alto,
medio, bajo) se entrevista a 50 de sus trabajadores que vienen laborando por lo menos tres
años en la empresa.
Población: Todos los trabajadores de la empresa ALFA que vienen laborando por lo menos tres
Muestra: 150 trabajadores de la empresa ALFA que vienen laborando por lo menos tres años en la
empresa (n).
Unidad de análisis: Un trabajador de la empresa ALFA que viene laborando por lo menos tres
años en la empresa.
Variable: Grado de satisfacción laboral de la empresa ALFA (alto, medio, bajo) de un trabajador
Estadígrafo: Monto PROMEDIO de las factura pagada en la empresa distribuidora que conforman
5
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en concordancia con lo
dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
4. En el siguiente cuadro defina un parámetro y un estadígrafo para cada población y muestra
respectivamente según la variable de interés.
Población Muestra Variable Parámetro Estadígrafo
400 alumnos
Alumnos de la Edad de los alumnos
elegidos al azar de
Universidad de de la Universidad de
la Universidad de
Lima. Lima.
Lima
Condición externa
150 viviendas
Viviendas de la de la vivienda (muy
seleccionadas al
urbanización “Los buena, buena,
azar en toda la
Rosales”. mala).
urbanización.
6
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en concordancia con lo
dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
CAPÍTULO 2
TABLAS DE DISTRIBUCIÓN DE
FRECUENCIAS Y GRÁFICOS
SEGÚN TIPO DE VARIABLES
7
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en concordancia con lo
dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
R Studio es un software estadístico de libre distribución que abarca todos los aspectos necesarios para el
aprendizaje y la aplicación de la Estadística en general. El programa incorpora opciones vinculadas a las
principales técnicas de análisis estadístico (análisis descriptivo, contrastes de hipótesis, regresión lineal y no
lineal, series temporales, análisis de tiempos de fallo, control de calidad, análisis factorial, ANOVA, análisis
cluster, etc.), además de proporcionar un potente entorno gráfico y de ofrecer total compatibilidad con los
editores de texto, hojas de cálculo y bases de datos más usuales.
Tablas de distribución de frecuencia. - Una tabla de frecuencias (también conocida como distribución de
frecuencias) es una tabla en la que se organizan los datos en categorías o clases, es decir, en grupos de valores
que describen una característica de los datos y muestran el número de observaciones del conjunto de datos que
caen en cada una de las clases.
Cuadro Nº1
Medios de
Comunicación
utilizados fi hi hi%
Internet 15 0.30 30%
Periódicos 12 0.24 24%
Radio 8 0.16 16%
Revistas 5 0.10 10%
Televisión 5 0.10 10%
No respondió 5 0.10 10%
Total 50 1 100%
Fuente: Encuesta realizada por IKKF Marketing - Mayo
2015
Gráficos estadísticos. - Los gráficos estadísticos presentan los datos en forma de dibujo de tal modo que se
pueda percibir fácilmente los hechos esenciales y compararlos con otros.
Gráfico Nº 1
Escuela de Negocios: Distribución de estudiantes se gún núme ro
de cursos de saprobados - Semestre ante rior
10
10
0 1 2 3 4 5 6
Número de cursos desaprobados
Fuente: Archivo de notas de la Escuela de Negocios
Tablas de doble entrada.- son aquellas tablas de datos referentes a dos variables, estas tablas se forman por
filas y columnas y en la primera fila o primera columna, se ubican las categorías de las variables y en las
casillas la frecuencia o el número de elementos de las categorías de las variables en conjunto.
8
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en concordancia con lo
dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
CASO 1: INDUSTRIAL TOOLS
9
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
AFP a la que está inscrito el Cualitativa nominal
trabajador en el momento de
la investigación:
C8 AFP 1: Habitat
2: Integra
3: Prima
4: Profuturo
Indique cuáles son las variables cualitativas: Género, Area, Estado Civil, Condición Laboral,
AFP.
Indique cuáles son las variables cuantitativas: Sueldo, Edad, Tiempo de servicio.
10
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
Datos / Importar datos / desde un archivo en Excel /
Luego en la ventana: Importar un conjunto de datos Excel ingrese:
Nombre del conjunto de datos (archivo en Excel): herramientas
Aceptar
Seleccionar el archivo que desea cargar
Ahora podrá ver la base de datos en la opción visualizar conjunto de datos que se encuentra
debajo de las opciones de R Comander.
Adicionalmente podrá observar en la consola de R Studio (ventana No. 3) el siguiente mensaje:
El conjunto de datos herramientas tiene 223 filas y 8 columnas.
# IMPORTANTE: No se deben usar tildes para nombrar los archivos, las variables, ni los niveles de
las variables categóricas.
Datos / Modificar variables del conjunto de datos activo / convertir variable numérica en
factor
Aparece Ventana Valor numérico Nombre del nivel: Aquí debemos ingresar la denominación de
cada valor numérico conforme la codificación proporcionada en el caso de estudio:
1: Masculino
2: Femenino
Aceptar
5. Haga lo mismo que el ítem 4 con los datos de las columnas 2, 5, 6 y 8. Guarde los nuevos datos
en su respectiva columna.
11
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
6. Utilice los datos de la variable cuantitativa sueldo (columna 3) y genere la variable cualitativa
nivel de sueldo guardando los datos en la columna 9. Para la recodificación considere la siguiente
clasificación:
Nivel 1 : sueldos menores que 2500 soles.
Nivel 2 : sueldos de 2500 o más pero inferiores a 7000 soles.
Nivel 3 : sueldos de 7000 soles a más.
Ahora vamos a generar una variable CUALITATIVA que denominaremos NIVEL_ SUELDO a partir de
una variable CUANTITATIVA (SUELDO). Esto se hará con una recodificación por RANGOS.
lo:2499.99="Nivel 1"
2500:6999.99="Nivel 2"
7000:hi="Nivel 3"
Aceptar
De esta manera aparecerá en la base de datos una columna adicional con la nueva variable
cualitativa (FACTOR) NIVEL_SUELDO.
Divorciado 57 25.56
Para saber el número total de filas de la base de datos, escribir en el R Script del R Comander:
12
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
nrow(herramientas)
De manera similar construya la tabla de distribución de frecuencias para la variable AFP a la que esté
inscrita el trabajador y para la variable nivel de sueldo.
Tabla No. 2:
Estadísticos / Resúmenes / Distribución de frecuencias / seleccionar la variable: AFP / Aceptar
Tabla No. 3:
Estadísticos / Resúmenes / Distribución de frecuencias / seleccionar la variable: NIVEL_SUELDO /
Aceptar
Observación: La variable NIVEL_SUELDO se obtuvo recodificando la variable cuantitativa SUELDO.
a. De los 223 trabajadores ……… son casados; es decir, el…….. % del total de
trabajadores son casados.
c. De los 223 trabajadores ………de ellos tienen un Nivel de Sueldo 2 o 3 lo cual representa el
…………%
Elegir la variable cuantitativa a recodificar. En este caso: TSERVICIO que se recodificará para
generar la variabla cualitativa (FACTOR) que denominaremos: CATEGORÍA_TSERVICIO.
lo:9.99="menos de 10 años"
Aceptar
De esta manera aparecerá en la base de datos una columna adicional con la nueva variable
cualitativa (FACTOR) CATEGORÍA_TSERVICIO.
.
Después de la recodificación:
10. Complete la tabla No. 4 y los espacios en blanco del siguiente enunciado:
……… de los 48 trabajadores del área de administración son mujeres; es decir el …….. % de los
trabajadores del área de administración son mujeres.
Tabla No. 10
Distribución del personal según género y área de trabajo
Industrial Tools – Áreas Administración y Operaciones
GÉNERO
ÁREA TOTAL
Femenino Masculino
Administración 21 27 48
14
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
Total 90 133 223
Estadísticos / Tablas de contingencia / Tabla de doble entrada / ingresar la variable que va en la fila:
AREA y en la columna: GENERO
11. Complete la tabla No. 11 y los espacios en blanco del siguiente enunciado:
De los trabajadores varones ……….. son casados o divorciados; es decir el ………….
%
Del total de trabajadores en general, el número de trabajadores hombres que son
casados o divorciados es igual a…………; lo cual representa el ………….%
Tabla No. 11
Distribución del personal según género y estado civil
Industrial Tools – Áreas Administración y Operaciones
GÉNERO
ESTADO CIVIL TOTAL
Femenino Masculino
Casado 2 6 8
Divorciado 27 30 57
Soltero 60 94 154
Viudo 1 3 4
Total 90 133 223
Estadísticos / Tablas de contingencia / Tabla de doble entrada / ingresar la variable que va en la fila:
ECIVIL y en la columna: GENERO
12. Genere las tablas de doble entrada que considere conveniente para completar los espacios en
blanco de los siguientes enunciados:
a. De los trabajadores del área de administración, ……. tienen nivel de sueldo 2; lo cual
representa el ……….%
b. Del total de trabajadores, ……. son del área de administración y tienen nivel de sueldo 3; lo
cual representa el ……….%
Estadísticos / Tablas de contingencia / Tabla de doble entrada / ingresar la variable que va en la fila:
AREA y en la columna: NIVEL_SUELDO
c. De los trabajadores solteros, ……. tienen 10 o más años de servicio; lo cual representa el
……….%
Estadísticos / Tablas de contingencia / Tabla de doble entrada / ingresar la variable que va en la fila:
ECIVILy en la columna: CATEGORÍA_TSERVICIO.
15
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
OBSERVACIÓN: La variable CATEGORÍA_TSERVICIO se obtuvo mediante una recodificación.
13. Complete la tabla No. 6 y los espacios en blanco del siguiente enunciado:
16
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
14. Genere las tablas de doble entrada que considere conveniente para completar los espacios en
blanco de los siguientes enunciados:
a. De los trabajadores del área de administración, …7…….. tienen nivel de sueldo 3 y
son mujeres; lo cual representa el …14.58%…….%
Se tiene 3 variables de clasificación:
Estadísticos / Tablas de contingencia / Tabla de entradas múltiples / ingresar las variables:
Variable de fila: NIVEL_SUELDO
Variable de columna: GENERO
Variable de control: AREA
(marcar opción: sin porcentajes)
Respuesta:
De los trabajadores contratados 7 tienen sueldo alto y presentan una edad de 30 o más años; es
decir el 8.139 %
OBSERVACIÓN: Guardar el archivo Recodificado que podrá ser usado en otra sesión.
Datos / Conjunto de datos activo / Guardar el conjunto de datos activo (elegir el directorio donde se
guardara el archivo y ponerle un nuevo nombre Ejemplo: herramientasR
El archivo herramientasR será guardado en formato R y para usarlo en una próxima sesión deberá
cargarse de la siguiente manera:
17
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
Datos / Cargar conjunto de datos / seleccionar el archivo herramientasR
18
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
CAPÍTULO 3
19
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
Medidas de Tendencia Central, dispersión, de cuantía y de asimetría
Las medidas estadísticas son aquellas que permiten resumir información proveniente de una muestra o
población y tienen por objeto, obtener un valor que resuma en sí todas las mediciones. Estas medidas
aplicadas a las características de las unidades de una muestra se denominan estadísticos o estadígrafos;
mientras que aplicadas a poblaciones se les denomina parámetros de la población.
- Medidas de tendencia central: Media aritmética, mediana y moda
- Medidas de posición: Cuartiles, percentiles
- Medidas estadísticas de variabilidad: Rango, rango intercuartil, varianza, desviación Estándar,
coeficiente de variación. medidas de forma: coeficiente de asimetría
ESTADIGRAFO DATOS NO AGRUPADOS
n
Media
∑ xi
i=1
Aritmética X̄ =
n
K (n+1)
W=
100
Y : parte entera
Mediana
Z : parte decimal
K (n+1)
W=
100
Y : parte entera
Percentiles
Z : parte decimal
P K = X(Y ) + Z [X Y +1−X ( Y ) ]
n
∑ x 2i − n x̄ 2
i=1
Varianza S2 = =
n−1
Coeficiente de S
CV X = × 100 %
| X|
variación
20
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
3( X −M e )
Coeficiente de asimetría de Pearson : A Pearson=
S
X −Mo
A Pearson=
S
Una entidad de gobierno está interesada en conocer la antigüedad del parque automotor de servicio de
transporte público en Lima Metropolitana con la finalidad de lanzar el proyecto de Chatarreo; en la
actualidad se han inscrito 8 empresas para acogerse a tal proyecto. Se ha elegido aleatoriamente 3
empresas inscritas para la verificación de la información presentada. Las variables que se han
evaluado son:
Column Notación de la Descripción de la Indique el tipo de variable
a variable variable (cuantitativa / cualitativa)
C1 MARCA Marca del vehículo Cualitativa nominal
antigüedad del
C2 ANTIGÜEDAD vehículo (en años). Cuanitativa
Tipo de vehículo:
C3 TIPO Cualitativa nominal
microbús, combi, bus
Número de asientos
C4 N_ASIENTOS por cada unidad Cuanitativa
automotriz
Tipo de combustible
utilizado por el
C5 T_COMBUSTIBLE Cualitativa nominal
vehículo (petróleo,
gasolina).
Los datos se encuentran en el archivo en Excel denominado chatarreo disponible en su aula
virtual.
library(Rcmdr)
OBSERVACION: poner library todo en minúscula.
21
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
A continuación:
En la barra inferior de su PC aparecerá el ícono del R Comander junto al ícono del RStudio.
Ingrese al ícono del R Comander y visualizará una ventana con las opciones que ofrece el R
Comander.
En la ventana del R Comander se muestran los códigos que se han utilizado para obtener los
reportes solicitados.
Tenga en cuenta que todas los reportes generados a través del R Comander aparecerán en la
ventana 3 del R Studio.
Ahora podrá ver la base de datos en la opción visualizar conjunto de datos que se encuentra
debajo de las opciones de R Comander.
Adicionalmente podrá observar en la consola de R Studio (ventana No. 3) el siguiente mensaje:
El conjunto de datos herramientas tiene 200 filas y 5 columnas.
# IMPORTANTE: No se deben usar tildes para nombrar los archivos, las variables, ni los niveles de
las variables categóricas.
ESTADÍSTICOS DE TENDENCIA
TIPO DE VEHÍCULO CENTRAL Número de datos
Promedio (media) Mediana
20.861 21.000 79
Buses
22.517 23.000 60
Combis
21.377 21.000 61
Microbuses
200
TOTAL
Estadísticos / Resúmenes / Resúmenes numéricos / elegir la variable cuantitativa:
ANTIGÜEDAD / Resumir por grupos / elegir la variable cualitativa: TIPO /
Estadísticos / elegir las estadísticas que se desean obtener (en este caso Media y la
mediana que es igual al cuantil 2 o Percentil 50)
22
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
a. La antigüedad promedio de los buses es igual a …20.061……… años.
b. Considerando la antigüedad de las combis, el valor que deja a su izquierda y a su
derecha el 50% de los datos es igual a……23……años.
c. Más del 50% de los datos tienen una antigüedad mayor a su promedio en los vehículos de
tipo ……buses …… y …combi……….
Observación: Más del 50% de los datos son mayores a la media cuando la media (promedio)
es menor que la mediana.
50% 50%
Mediana
Media
d. Menos del 50% de los datos tienen una antigüedad mayor a su promedio en los vehículos de
tipo …………
Observación: Menos del 50% de los datos son mayores a la media cuando la media
(promedio) es mayor que la mediana.
50% 50%
Mediana
Media
Tabla No. 2A
Tabla No. 2B
23
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
TIPO DE VEHÍCULO Moda Número de veces que se repite el valor
Buses 25 9
Combis 26 9
16; 19; 5
Microbuses 1616,
22; 26
Hallaremos la moda con RStudio.
Instalar el paquete DescTools (en la ventana 4: Packges / Install / DescTools / Install)
En la ventana No. 1 digitar:
# Para llamar al paquete antes instalado:
library(DescTools)
# Para hallar la moda para todos los vehículos (sin clasificar por grupos):
Mode(chatarreo$ANTIGÜEDAD)
# Para hallar la moda clasificando por grupos:
tapply(chatarreo$ANTIGÜEDAD,chatarreo$TIPO,Mode)
24
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
DIVT_COMBUSTIBLE=split(chatarreo,chatarreo$`T_COMBUSTIBLE`)
# Ahora con la función tapply se obtiene la media y la mediana de la variable antigüedad por
marca para los vehículos gasolineros y petroleros.
En la ventana No. 1 digitar:
tapply(DIVT_COMBUSTIBLE$gasolina$ANTIGÜEDAD,DIVT_COMBUSTIBLE$gasolina$MARCA,mean)
tapply(DIVT_COMBUSTIBLE$gasolina$ANTIGÜEDAD,DIVT_COMBUSTIBLE$gasolina$MARCA,median)
tapply(DIVT_COMBUSTIBLE$petroleo$ANTIGÜEDAD,DIVT_COMBUSTIBLE$petroleo$MARCA,mean)
tapply(DIVT_COMBUSTIBLE$petroleo$ANTIGÜEDAD,DIVT_COMBUSTIBLE$petroleo$MARCA,median)
# IMPORTANTE: No se debe escribir con tildes para nombrar los archivos, las variables, ni los niveles
de las variables categóricas.
Mediana
Media
e. En los vehículos petroleros de la marca…D………se tiene que menos del 50%
de unidades tienen una antigüedad mayor a su promedio.
Observación: Esto ocurre cuando la media es mayor que la mediana.
25
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
50% 50%
Mediana
Media
4. Suponer que el costo mensual de mantenimiento de un bus es, en promedio, 150 soles;
de una combi es, en promedio, 90 soles; y de un microbús es, en promedio, 120 soles..
Complete la tabla y los espacios en blanco del enunciado que se presentan a
continuación:
El costo promedio mensual GLOBAL mensual de mantenimiento de un vehículo es igual a :
……………… Soles.
TABLA No. 4
Números Hi Costo por Costo
Costo número de ponderado
de
TIPO DE VEHÍCULO
promedio vehículos (con (con hi)
vehículos
(datos) fi)
(fi: ni)
79 39.5 150 * 79 = 150 * 0.395 =
Buses 150 11850 59.25
60 30.0 90 * 60 = 90 * 0.30 =
Combis 90 5400 27
MEDIA TOTAL O
GLOBAL 24570 / 200 = 122.85 Soles
Para hallar las frecuencias absolutas y relativas: Estadísticos / Resúmenes / Distribución de
frecuencias / seleccionar la variable: TIPO / Aceptar
MEDIA GLOBAL:
Forma 1: Con las frecuencias absolutas (ni)
MEDIA GLOBAL: (Costo promedio buses*n1 +Costo promedio combis*n2 + Costo promedio
microbuses*n3 ) / (n1 + n2 + n3 )
= 24570 / 200 = 122.85 Soles
TABLA No. 5A
MEDIDAS DE POSICIÓN
TIPO DE
VEHÍCULO Q2 = Mediana =
Q1 = P25 Q3=P753
P50
Buses 40.000 42.000 44.000
27
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
tapply(chatarreo$N_ASIENTOS,chatarreo$TIPO,quantile,type=6)
# Si sólo quisiéramos el percentil 25 por grupos.
tapply(chatarreo$N_ASIENTOS,chatarreo$TIPO,quantile,0.25,type=6)
28
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
a. El Percentil 10 de la variable antigüedad es igual a ………… años; representa el
valor máximo del ……….% inferior y es equivalente al valor mínimo del ……..% superior.
10% 90%
P10
quantile(chatarreo$ ANTIGÜEDAD,0.10,type=6)
P20
quantile(chatarreo$ ANTIGÜEDAD,0.20,type=6)
P90
quantile(chatarreo$ ANTIGÜEDAD,0.90,type=6)
d. El 70% central de los datos de la variable antigüedad se encuentran entre ………… años y
………… años. Estos valores representan los percentiles ………… y …………
respectivamente.
15% 70% 15%
P15 P85
quantile(chatarreo$ ANTIGÜEDAD,0.15,type=6)
quantile(chatarreo$ ANTIGÜEDAD,0.85,type=6)
a. Para la variable antigüedad, en el caso de los vehículos gasolineros el valor mínimo del
10 % superior es equivalente al valor máximo del 90% inferior y es igual a …………
29
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
años; mientras que para los vehículos petroleros es igual a …………. años. Este valor
representa el Percentil……..…..
90% 10%
P90
tapply(chatarreo$ANTIGÜEDAD,chatarreo$T_COMBUSTIBLE,quantile,0.90,type=6)
b. Para la variable antigüedad de las combis el valor máximo del 20% inferior es
equivalente al valor mínimo del 80% superior y es igual a …………años. Este valor
representa el Percentil…………
20%
P20
tapply(chatarreo$ANTIGÜEDAD,chatarreo$TIPO,quantile,0.20,type=6)
30
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
a. En todas las marcas de vehículos se observa para la variable antigüedad un CV
menor a 30% con lo cual podemos afirmar que existe ………….. en dichas
distribuciones.
b. Se observa mayor homogeneidad en la distribución de la variable antigüedad en la
marca …………. con un CV igual a ………… %.
Tabla No. 9A
mean(chatarreo$N_ASIENTOS)
median(chatarreo$N_ASIENTOS,tipe=6)
sd(chatarreo$N_ASIENTOS)
3*(mean(chatarreo$N_ASIENTOS)-median(chatarreo$N_ASIENTOS))/sd(chatarreo$N_ASIENTOS)
# observación: escribir mean, median y sd en minúscula.
Tabla No. 9B
31
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
Tipo de
Desviación Coeficient asimetría
TIPO DE estándar e de
Media Mediana
VEHÍCULO asimetría
(Pearson)
tapply(chatarreo$N_ASIENTOS,chatarreo$TIPO,mean)
tapply(chatarreo$N_ASIENTOS,chatarreo$TIPO,median)
tapply(chatarreo$N_ASIENTOS,chatarreo$TIPO,sd)
3*(tapply(chatarreo$N_ASIENTOS,chatarreo$TIPO,mean)-
tapply(chatarreo$N_ASIENTOS,chatarreo$TIPO,median))/
tapply(chatarreo$N_ASIENTOS,chatarreo$TIPO,sd)
# observación: escribir mean, median y sd en minúscula.
33
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
Con RStudio:
11. Con la información de la variable antigüedad, desagregada por marca, realice los
diagramas de cajas y complete los espacios en blanco de los enunciados que se
presentan a continuación:
a. Para la variable antigüedad, se observa mayor asimetría en la marca…………
(existe mayor distancia entre la media y la mediana).
b. Para la variable antigüedad en la marca …………se observa la mayor asimetría
negativa (la media es menor que la mediana).
c. Para la variable antigüedad, si consideramos en cada marca el cuarto (25%)
superior, se observa mayor homogeneidad en la marca …………
Con RStudio:
34
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
20.
NA:
Para usar el archivo chatarreoR en una próxima sesión deberá cargarse de la siguiente manera:
Datos / Cargar conjunto de datos / seleccionar el archivo chatarreoR
35
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
CASO 3: EMPRESA T_APOYO
Los datos recogidos se muestran en el archivo en Excel telefonia disponible en su aula virtual.
Inicie una sesión del programa R-Studio.
library(Rcmdr)
OBSERVACION: poner library todo en minúscula.
A continuación:
En la barra inferior de su PC aparecerá el ícono del R Comander junto al ícono del RStudio.
Ingrese al ícono del R Comander y visualizará una ventana con las opciones que ofrece el R
Comander.
36
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
En la ventana del R Comander se muestran los códigos que se han utilizado para obtener los
reportes solicitados.
Tenga en cuenta que todas los reportes generados a través del R Comander aparecerán en la
ventana 3 del R Studio.
Ahora podrá ver la base de datos en la opción visualizar conjunto de datos que se encuentra
debajo de las opciones de R Comander.
Adicionalmente podrá observar en la consola de R Studio (ventana No. 3) el siguiente mensaje:
El conjunto de datos herramientas tiene 300 filas y 6 columnas.
CATEGORÍA DE GÉNERO
TOTAL
GASTO
Femenino Masculino
A1 15 15 30
A2 73 80 153
A3 56 61 117
37
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
De esta manera aparecerá en la base de datos una columna adicional con la nueva variable
cualitativa (FACTOR) C_GASTO.
Después:
Estadísticos / Tablas de contingencia / Tabla de doble entrada / ingresar la variable que va en la
fila: C_GASTO y en la columna: GENERO
EMPRESA TOTAL
RANGO DE EDAD
Claro Nextell Telefónica Total
a. De entre los clientes que tienen menos de 25 años de edad se encuentra que ,
……….. de ellos usan teléfonos de la empresa Claro, lo cual representa el ,………..
%
b. Del total de clientes se encuentra que ……………de ellos tienen menos de 25 años
de edad y usan teléfonos de la empresa Claro; lo cual representa el ,……….. %
38
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
3. Considerando la información sobre las variables de estudio, halle el valor de las
medidas estadísticas para completar la tabla y los espacios en blanco de los
enunciados que se presentan a continuación:
Tabla No. 3
GASTO
Medidas de tendencia central
EMPRESA
Promedio (media) Mediana
Promedio
(media) Mediana
a. Considerando a los residentes del distrito de San Isidro, el gasto promedio de los
usuarios de telefonía de género masculino es igual a…………. mientras que el gasto
promedio de los usuarios de telefonía de género femenino es igual a ………….
Entonces podemos afirmar que el gasto de telefonía en mayor en los clientes de
género ………….
GASTO
Medidas diversas de tendencia central, posición y
DISTRITO dispersión
DE No. de
RESIDENCI datos
A Promedio Mediana Desviación Coeficient
CV (media) =Q2 = estándar e de
(%) P50 asimetría
(Pearson)
Jesús María 31.63 100.20 96.00 31.70 0.3975 45
Miraflores 43.37 92.82 87.00 40.25 0.4335 60
San Isidro 36.03 90.00 87.00 32.43 0.2775 58
San Miguel 37.48 87.96 92.00 32.96 -0.3679 71
Santiago de 35.95 91.97 87.50 33.06 66
Surco 0.4056
Se requiere desagregar por grupos considerando la variable TIPO
Procedimiento alternativo: Hallar las estadísticas con RStudio: CV, media, mediana, desviación
estándar y coeficiente de asimetría de Pearson.
f. Si comparamos el gasto de los usuarios de telefonía residentes en los distritos de San Miguel
y Santiago de Surco podemos afirmar que el gasto de telefonía en el distrito de San Miguel
tiene una asimetría …………. (menor /igual/ mayor) a la asimetría que se observa en el
Santiago de Surco.
42
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
6. Con la información de la variable edad, realice un diagrama de cajas y complete los
espacios en blanco de los enunciados que se presentan a continuación:
a. La mejor medida de tendencia central representativa de las edades en los usuarios
de la Empresa Claro es la …………..(media / moda / mediana / varianza / cv)
porque ……… (si / no) se observan valores extremos (outliers).
b. La distribución de las edades de los usuarios de la Empresa Nextell presenta
asimetría ………….. (positiva / negativa) mientras que en los usuarios de la
Empresa Telefónica se observa una asimetría……………. (positiva / negativa)
c. En la distribución de las edades de los usuarios de la Empresa Telefónica se
observa mayor heterogeneidad en el 25% ………….. (inferior / superior) de los
datos en comparación con el 25% ………….. (inferior / superior). En el diagrama
de cajas se observa que el bigote inferior es más ………..(pequeño / grande / del
mismo tamaño) que el bigote superior.
Con RStudio:
MEDIA:
5.93711 24.60000 27.03448
MEDIANA:
Claro Nextell Telefónica
26 23 28
7. Considerando el gasto de los usuarios de telefonía, halle el valor de los percentiles
para completar los espacios en blanco de los enunciados que se presentan a
continuación:
Hallamos los percentiles con RStudio.
# Para hallar un percentil en particular de una variable cuantitativa (sin clasificar por
grupos):
43
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
quantile(telefonía$GASTO,valor del percentil,type=6)
# Para hallar el Rango Intercuartil de una variable cuantitativa (sin clasificar por
grupos):
IQR(telefonia$variable cuantitativa,type=6)
a. El gasto máximo del 10% de usuarios de telefonía que presentan el menor gasto es el
Percentil…………..y su valor es igual a ……………Soles.
10% 90%
P10
quantile(telefonia$GASTO,0.10,type=6)
b. El gasto mínimo del 20% de usuarios de telefonía que presentan el mayor gasto es el
Percentil………….. y su valor es igual a ……………Soles.
80% 20%
P80
quantile(telefonia$GASTO,0.80,type=6)
c. El gasto mínimo del 20% de usuarios de telefonía hombres que presentan el mayor
gasto es el Percentil…………..y su valor es igual a ……………Soles.
80% 20%
usuarios hombres
P80
tapply(telefonia$GASTO,telefonia$GENERO,quantile,0.80,type=6)
44
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
d. Los valores del gasto entre los cuales se encuentran el 60% central de los usuarios de
telefonía son el Percentil ………….y el Percentil ………….. El valor de estas
medidas de posición son …………..Soles y ………….Soles, respectivamente.
P20 P80
quantile(telefonia$GASTO,0.20,type=6)
quantile(telefonia$GASTO,0.80,type=6)
P25 P75
quantile(telefonia$GASTO,0.25,type=6)
quantile(telefonia$GASTO,0.75,type=6)
IQR(telefonia$GASTO,type=6)
f. El valor del Rango Intercuatil para el gasto en telefonía de las usuarias mujeres es
igual a ………….. y se encuentra entre el Percentil ………..y el Percentil…………
tapply(telefonia$GASTO,telefonia$GENERO,IQR,type=6)
Para usar el archivo telefoniaR en una próxima sesión deberá cargarse de la siguiente manera:
Datos / Cargar conjunto de datos / seleccionar el archivo telefoniaR
45
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
CASO 4: EMPRESA DATA SERVIS
La empresa “Data-Servis” realizó un estudio para una empresa automotriz con la finalidad de conocer
algunas características de los vehículos que utilizan los jefes de hogar tales como su categoría y
precio; el estudio se llevó a cabo en Lima Metropolitana.
1. ¿Se puede afirmar que la edad máxima de la mitad (50%) de los jefes del hogar que
tienen categoría de vehículo estándar es mayor que la de los jefes de hogar que tienen
categoría de vehículo lujoso? La mediana es mayor en los jefes del hogar que tienen
categoría de vehículo Lujoso (49.50).
2. ¿En qué categoría de los vehículos los precios son más heterogéneos? (justifique su
respuesta con la medida estadística que corresponda). En la categoría Lujoso porque el
CV es el mayor (36.36 %).
Categoría de Vehículo Coeficiente Variación
variable : Precio del vehículo
Económico 23.10
Estándar 21.09
46
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
Lujoso 36.36
3. ¿Es la distribución de los precios de los automóviles más asimétrica en los clientes que tienen
vehículos de categoría estándar que los que tienen categoría lujosa? Si, porque el AS –
Pearson es mayor en la categoría Estándar (- 0.60).
Categoría de Vehículo Coeficiente Pearson
variable : Precio del vehículo
Económico 0.04 (asimetría positiva)
Estándar -0.60 (asimetría negativa)
Lujoso 0.49 (asimetría positiva)
5. ¿Entre que valores se encuentra el 70% central de datos de la distribución de la variable edad?
¨
15% 70% 15%
P15 P85
P15: 27 años.
P85: 56 años.
6. Comente el diagrama de cajas de la variable precio del vehículo según categoría y responda:
¿En qué categorías de los vehículos, el precio promedio es mayor a los demás? Categoría
Lujoso.
47
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
Boxplot of Precio vehiculo
100
80
Precio vehiculo
60
40
20
0
económico estándar lujoso
Categoria _vehic
7. Presentan los datos de la variable precio del vehículo, según categorías, valores atípicos u
outliers. Si es así, indique en qué categoría. ¿En este caso, qué medida de tendencia central
sería conveniente utilizar, la media o la mediana? No hay valores atípicos entonces mejor
medida de tendencia central es la media.
8. ¿En qué categoría de los vehículos la variable precio presenta mayor dispersión en el 50%
central de los datos? Justifique su respuesta. En la categoría Lujoso (el ancho de la caja es
mayor).
9. ¿En qué categoría de los vehículos la variable precio presenta menor dispersión en el 25%
superior de los datos? Justifique su respuesta. En la categoría económico (el bigote superior es
el más pequeño).
10. ¿En qué categoría de los vehículos la variable precio presenta mayor dispersión en el 25%
inferior de los datos? Justifique su respuesta. En la categoría lujoso (el bigote inferior es el
más grande).
48
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
CASO 5: LOS PRACTICANTES
library(Rcmdr)
OBSERVACION: poner library todo en minúscula.
49
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
A continuación:
En la barra inferior de su PC aparecerá el ícono del R Comander junto al ícono del RStudio.
Ingrese al ícono del R Comander y visualizará una ventana con las opciones que ofrece el R
Comander.
En la ventana del R Comander se muestran los códigos que se han utilizado para obtener los
reportes solicitados.
Tenga en cuenta que todas los reportes generados a través del R Comander aparecerán en la
ventana 3 del R Studio.
Ahora podrá ver la base de datos en la opción visualizar conjunto de datos que se encuentra
debajo de las opciones de R Comander.
Adicionalmente podrá observar en la consola de R Studio (ventana No. 3) el siguiente mensaje:
El conjunto de datos herramientas tiene 180 filas y 6 columnas.
1. Con las variables de estudio que considere conveniente genere las tablas de
frecuencias y complete los espacios en blanco de los enunciados que se presentan a
continuación:
Estadísticos / Tablas de contingencia / Tabla de doble entrada / ingresar la variable que va en la fila:
LINEA y en la columna: RENDIMIENTO
2. Se sabe que los practicantes que elaboraron menos de 6 informes se les asignó la
categoría B y al resto de los practicantes a la categoría A.
Con las variables de estudio que considere conveniente genere las tablas de
frecuencias y complete los espacios en blanco de los enunciados que se presentan a
continuación:
Primero: Recodificamos:
50
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
Datos / Modificar variables del conjunto de datos activo / Recodificar variables
Aparece la ventana: Recodificar Variables. En esta ventana aparece la lista de variables:
Elegir la variable cuantitativa a recodificar. En este caso: INFORMES que se recodificará para
generar la variabla cualitativa (FACTOR) que denominaremos: CATEGORIA.
Después:
Estadísticos / Tablas de contingencia / Tabla de doble entrada / ingresar la variable que va en la fila:
CATEGORIA y en la columna: CARRERA
3. Con las variables de estudio que considere conveniente halle las medidas estadísticas
que le permitan completar los espacios en blanco de los enunciados que se presentan
a continuación:
tapply(practicantes$PPA,practicantes$LINEA,mean)
51
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
que se les denominó Grupo A . El tiempo mínimo de dedicación de un practicante de
este grupo es igual a ………….. horas y representa el Percentil…………
80% 20%
P80
Con RStudio:
quantile(practicantes$HORAS,0.80,type=6)
P90
Con RStudio:
tapply(practicantes$PPA,practicantes$CARRERA,quantile,0.90,type=6)
tapply(practicantes$HORAS, practicantes$CARRERA,cv)
# las iniciales del Coeficiente de Variación se escriben en minúscula
52
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
a………….% y evidencia …………..(homogeneidad / heterogeneidad / variabilidad)
en la distribución de la variable de estudio.
# Para llamar el CV instalar el paquete raster:
Instalar el paquete raster (en la ventana 4: Packges / Install / raster / Install)
En la ventana No. 1 digitar:
# Para llamar al paquete antes instalado:
library(raster)
Con RStudio:
DIV_LINEA =split(practicantes,practicantes$`LINEA`)
Para usar el archivo practicantesR en una próxima sesión deberá cargarse de la siguiente manera:
Datos / Cargar conjunto de datos / seleccionar el archivo practicantesR
53
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
CASO 6: EVALUACIÓN DE PRACTICANTES
En un estudio realizado en la Empresa Alfa SRL para evaluar el desempeño de sus practicantes
(estudiantes universitarios y recién egresados) en las áreas operativas de las empresas del grupo
(Calidad, Compra, Logística, Producción) que operan a nivel nacional, se recabaron datos de una
muestra, considerándose las siguientes variables para el análisis:
Indique el tipo
Notación de la de variable
Columna Descripción de la variable
variable (cuantitativa /
cualitativa)
Área operativa de la empresa: Calidad,
C1 AREA Compras, Logística y Producción.
NOTA: Los niveles de pago a los practicantes corresponden a los siguientes rangos:
library(Rcmdr)
OBSERVACION: poner library todo en minúscula.
A continuación:
En la barra inferior de su PC aparecerá el ícono del R Comander junto al ícono del RStudio.
Ingrese al ícono del R Comander y visualizará una ventana con las opciones que ofrece el R
Comander.
En la ventana del R Comander se muestran los códigos que se han utilizado para obtener los
reportes solicitados.
Tenga en cuenta que todas los reportes generados a través del R Comander aparecerán en la
ventana 3 del R Studio.
1. Con las variables que considere conveniente genere las tablas de frecuencias y
complete los espacios en blanco de los enunciados que se presentan a continuación:
Primero: Realizamos dos recodificaciones:
Primera recodificación:
Datos / Modificar variables del conjunto de datos activo / Recodificar variables
Aparece la ventana: Recodificar Variables. En esta ventana aparece la lista de variables:
Elegir la variable cuantitativa a recodificar. En este caso: PAGO que se recodificará para generar
la variabla cualitativa Nivel de Pago (FACTOR) que denominaremos: N_PAGO.
55
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
De esta manera aparecerá en la base de datos una columna adicional con la nueva variable
cualitativa (FACTOR) N_PAGO.
Segunda recodificación:
Datos / Modificar variables del conjunto de datos activo / Recodificar variables
Aparece la ventana: Recodificar Variables. En esta ventana aparece la lista de variables:
Elegir la variable cuantitativa a recodificar. En este caso: EDAD que se recodificará para generar
la variabla cualitativa (FACTOR) que denominaremos: R_EDAD.
Estadísticos / Tablas de contingencia / Tabla de doble entrada / ingresar la variable que va en la fila:
N_PAGO y en la columna: R_EDAD
b. Del total de practicantes con un nivel de pago 2, el número de practicantes que tienen
menos de 24 años es igual a………..; lo cual representa el ……….%
2. Con las variables de estudio que considere conveniente calcule las medidas de
tendencia central y de posición para completar los espacios en blanco de los
enunciados que se presentan a continuación:
Mediana
Media
56
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
Estadísticos / Resúmenes / Resúmenes numéricos / elegir la variable cuantitativa:
PAGO / Estadísticos / elegir las estadísticas que se desean obtener (en este caso:
Media y mediana)
Procedimiento alternativo con RStudio:
mean(evaluac$PAGO)
median(evaluac$PAGO)
b. Para los practicantes del área de calidad el pago promedio es igual a ………..Soles
y la mediana es igual a …………Soles. Con estos resultados podemos afirmar que
…………..(menos / más) del 50% de los datos correspondientes al pago son menores
que la media. Esta situación ocurre cuando la media es ………….. (menor / igual /
mayor) que la mediana.
50% 50%
Area:
calidad Mediana
Media
Estadísticos / Resúmenes / Resúmenes numéricos / elegir la variable cuantitativa: PAGO /
Resumir por grupos / elegir la variable cualitativa: AREA / Estadísticos / elegir las estadísticas
que se desean obtener (en este caso: media y mediana)
c. Para los practicantes en general, el pago (sin distinguir el nivel de pago), el 80%
central de los datos se encuentra entre …………Soles y ………..Soles; estas medidas
de posición representan el Percentil…………..y el Percentil…………...
P10 P90
Con RStudio:
quantile(evaluac$PAGO,0.10,type=6)
quantile(evaluac$PAGO,0.90,type=6)
d. De las practicantes mujeres, el tiempo de práctica mínimo por encima del cual se
encuentra el 25% de practicantes con mayor tiempo de práctica (25% superior) es
igual a……………años.
75% 25%
Mujeres
P75=Q3
57
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
Con RStudio:
tapply(evaluac$TIEMPO,evaluac$GENERO,quantile,0.75,type=6)
3. Con las variables de estudio que considere conveniente calcule las medidas de
dispersión para completar los espacios en blanco de los enunciados que se presentan
a continuación:
c. Supongamos que el grupo empresarial decide aumentar el pago a todos los practicantes en
general en 10% y otorgarles un bono por movilidad de S/. 100 soles. Entonces, la nueva
58
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
media y la nueva varianza del pago a los practicantes después de dicho aumento son iguales
a………………Soles y …………………Soles2, respectivamente.
d. Supongamos que el grupo empresarial decide aumentar el pago a todos los practicantes del
área de calidad en 10% y otorgarles un bono por movilidad de S/. 100 soles. Entonces, la
nueva media y la nueva varianza del pago a los practicantes del área de calidad después de
dicho aumento son iguales a………………Soles y …………………Soles 2, respectivamente.
Y = Nuevo pago a los practicantes del Área de Calidad después del incremento salarial.
Y = X + 0.10X + 100 = 1.10X + 100
M(X)= ………………….. Soles
V(X) =……………. Soles2
Estadísticos / Resúmenes / Resúmenes numéricos / elegir la variable cuantitativa:
PAGO / Resumir por grupos / elegir la variable cualitativa: AREA / Estadísticos /
elegir las estadísticas que se desean obtener (en este caso: cv)
59
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
Hallar la nueva media y varianza después del incremento salarial (Area de Calidad).
4. Con la información de la variable pago a los practicantes, generando grupos con la variable
cualitativa que considere conveniente, realice un diagrama de cajas y complete los espacios
en blanco de los enunciados que se presentan a continuación:
Para usar el archivo evaluacR en una próxima sesión deberá cargarse de la siguiente manera:
Datos / Cargar conjunto de datos / seleccionar el archivo evaluacR
60
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
61
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
CASO 7: PYMES
La importancia que tienen actualmente en la economía, tanto las pequeñas y medianas empresas
(PYMES) como los emprendedores, es fundamental, ya que su aporte en la generación de riqueza para
cualquier país es innegable, particularmente en la contribución a la apertura de puestos de trabajo, así
lo afirma la Organización para la Cooperación y el Desarrollo Económicos (OCDE). De acuerdo con
el reporte “Financiamiento de pymes y emprendedores 2018”, realizado por la OCDE, en sus países
miembros las pymes y los emprendedores constituyen la columna vertebral de las economías de esos
países y son fundamentales para fortalecer la productividad, generar un crecimiento más inclusivo y
adaptarse a mega tendencias como la nueva revolución industrial y un perfil cambiante del trabajo. A
continuación, se describe las variables de estudio correspondientes a una muestra de pequeñas y
medianas empresas (PYMES) dedicadas al sector construcción:
Indique el
Descripción de la variable tipo de
Column Notación de la
variable
a variable
(cuantitativa /
cualitativa)
Vigilancia de la salud: actividad preventiva que toda empresa.
C1 ESTADO Inspección de la estructura de la empresa.
1: vigilancia 2: inspección
El activo no corriente es una parte del activo y aparece dentro del
C2 ACTIVO_NO balance de situación de una empresa (maquinaria, construcciones,
CORRIENTE vehículos o terrenos). En soles.
El activo son los bienes, derechos y otros recursos de los que
C3 ACTIVO dispone una empresa (muebles). En soles.
El pasivo corriente o pasivo circulante es la parte del pasivo que
PASIVO_ contiene las obligaciones a corto plazo de una empresa, es decir, las
C4
CORRIENTE deudas y obligaciones que tienen una duración menor a un año. En
soles.
library(Rcmdr)
OBSERVACION: poner library todo en minúscula.
A continuación:
En la barra inferior de su PC aparecerá el ícono del R Comander junto al ícono del RStudio.
Ingrese al ícono del R Comander y visualizará una ventana con las opciones que ofrece el R
Comander.
En la ventana del R Comander se muestran los códigos que se han utilizado para obtener los
reportes solicitados.
Tenga en cuenta que todas los reportes generados a través del R Comander aparecerán en la
ventana 3 del R Studio.
1. Con las variables de estudio que considere conveniente genere las tablas de
frecuencias y complete los espacios en blanco de los enunciados que se presentan a
continuación:
2. Elabore la gráfica y elija las variables que considere conveniente para completar los
espacios en blanco en los enunciados que se presentan a continuación:
63
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
Con RStudio.
# Para generar el Diagrama de Cajas e identificar los datos atípicos:
gpymes=boxplot(pymes$UTILIDAD~pymes$ESTADO)
gpymes$out
Media:
inspeccion vigilancia
177192.2 171704.1
Mediana:
inspeccion vigilancia
169290.5 155102.0
64
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
3. Con las variables de estudio que considere conveniente halle el valor de las
estadísticas para completar los espacios en blanco de los enunciados que se presentan
a continuación:
tapply(pymes$PATRIMONIO,pymes$TAMAÑO,mean)
tapply(pymes$PATRIMONIO,pymes$TAMAÑO,median)
50% 50%
PATRIMONIO:
Pequeñas Empresas Mediana
Media
65
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
d. La distribución de la variable patrimonio presenta menor heterogeneidad en las
empresas de tamaño ……………(pequeñas / medianas) con un coeficiente de
variación igual a……………..
Estadísticos / Resúmenes / Resúmenes numéricos / elegir la variable cuantitativa:
PATRIMONIO / Resumir por grupos / elegir la variable cualitativa: TAMAÑO /
Estadísticos / elegir las estadísticas que se desean obtener (en este caso
Coeficiente de variación)
e. La utilidad operacional mínima del 10% de las empresas que presentan mayor
utilidad es igual a …………….Soles. Este valor es el Percentil…………
90% 10%
Todas las empresas
P90
Con RStudio:
quantile(pymes$UTILIDAD,0.90,type=6)
Para usar el archivo pymesR en una próxima sesión deberá cargarse de la siguiente manera:
Datos / Cargar conjunto de datos / seleccionar el archivo pymesR
66
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
CASO 8: ALFA
En la fábrica ALFA se seleccionaron a 200 operarios que fueron divididos en 2 grupos para participar
en un curso de capacitación; los operarios del grupo 1 fueron capacitados con la técnica A y los
operarios del grupo 2 con la técnica B. El objetivo de la capacitación fue disminuir el tiempo que
emplean los operarios para realizar una actividad considerada de gran importancia en el proceso de
producción. Terminada la capacitación, se le pidió a cada operario de cada grupo que procediese a
realizar la actividad y se registró el tiempo correspondiente. A continuación se indican las variables
de este estudio:
Indique el tipo
Notación de Descripción de la variable de variable
Columna
la variable (cuantitativa /
cualitativa)
67
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
Utilizando la base de datos en Excel alfa disponible en el aula virtual, responda las siguientes
preguntas, justificando su respuesta numéricamente con las medidas estadísticas correspondientes.
library(Rcmdr)
OBSERVACION: poner library todo en minúscula.
A continuación:
En la barra inferior de su PC aparecerá el ícono del R Comander junto al ícono del RStudio.
Ingrese al ícono del R Comander y visualizará una ventana con las opciones que ofrece el R
Comander.
En la ventana del R Comander se muestran los códigos que se han utilizado para obtener los
reportes solicitados.
Tenga en cuenta que todas los reportes generados a través del R Comander aparecerán en la
ventana 3 del R Studio.
68
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
Estadísticos / Resúmenes / Resúmenes numéricos / elegir la variable cuantitativa: TIEMPO / Resumir
por grupos / elegir la variable cualitativa:TECNICA / Estadísticos / elegir las estadísticas que se
desean obtener (en este caso CV, Media, mediana y desviación estándar)
Procedimiento alternativo: Hallar las estadísticas con RStudio: CV, media, mediana, desviación
estándar y coeficiente de asimetría de Pearson.
# Para hallar el coeficiente de variación, la media, mediana y desviación estándar por grupos:
tapply(alfa$TIEMPO,alfa$TECNICA,cv)
tapply(alfa$TIEMPO,alfa$TECNICA,mean)
tapply(alfa$TIEMPO,alfa$TECNICA,median)
tapply(alfa$TIEMPO,alfa$TECNICA,sd)
69
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
b. La distribución del tiempo correspondiente a los operarios capacitados con la técnica
A es ………….. (más, menos, igual de) asimétrica que la distribución del tiempo
correspondiente a los operarios capacitados con la técnica B.
d. Los operarios que corresponden al 50% central de los datos, emplearon un tiempo de entre
…………… y ……………. minutos para realizar la actividad asignada. Estos valores
representan el Percentil……………..y el Percentil………….., respectivamente.
e. Más del 50% de los operarios capacitados con la técnica A registraron un tiempo para
realizar la actividad……………. (menor / mayor / igual) a la media muestral. Esta
situación ocurre cuando la media es mayor que la …………..(mediana / desviación
estánar / cv)
50% 50%
Mediana
Media
3. Con la variable tiempo que demoró el operario en realizar la actividad asignada, halle
los percentiles que correspondan y complete los espacios en blanco que se presentan
a continuación:
70
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
# Para hallar un percentil en particular de una variable cuantitativa por grupos:
tapply(alfa$TIEMPO,alfa$TECNICA,quantile, valor del percentil,type=6)
# El valor del percentil se debe escribir en decimales.
71
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
4. Realizando un diagrama de cajas del tiempo que demoraron los operarios en
realizar la tarea asignada, clasificando según la variable cualitativa GENERO,
complete los espacios en blanco que se presentan a continuación:
MEDIA:
Hombre Mujer
35.078 35.106
MEDIANA:
Hombre Mujer
35 34
Para usar el archivo alfaR en una próxima sesión deberá cargarse de la siguiente manera:
Datos / Cargar conjunto de datos / seleccionar el archivo alfaR
72
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
CASO 9: EJERCICIOS DE APLICACIÓN DIVERSOS
1. La nota promedio general en un examen fue 12.6. Los aprobados obtuvieron un promedio de 14.4
y los desaprobados, en promedio, obtuvieron 8.4. Si son 50 los alumnos que rindieron el examen.
Determine el porcentaje de desaprobados.
R: desaprobados= 30 % y aprobados= 70 %
2. En la empresa industrial REX. S.A. el personal de planta tiene un salario promedio mensual de
1800 soles con una varianza de 90000 soles 2. En una negociación laboral con el sindicato se
acordó un incremento de un 20% en los salarios más una bonificación adicional de 80 soles por
concepto de movilidad. Calcule el salario promedio, la varianza y el coeficiente de variabilidad
R: M(Y)= 2,240 Soles, V(Y)= 129,600 Soles2,, Sy=360 Soles, CV(Y)= 16.07 %
3. En una empresa de servicios generales, el salario promedio de sus trabajadores es 2360 soles, el
salario promedio del personal masculino es de 2500 soles y el salario promedio del personal
femenino es de 2100 soles. ¿Qué porcentaje del personal de esta empresa es masculino y que
porcentaje es femenino?
R: personal femenino= 35 % ; personal masculino= 65 %
4. En una empresa los pagos diarios a proveedores se pueden representar mediante una
distribución simétrica; se sabe que el monto pagado con mayor frecuencia es 500 soles y
uno de los cuartiles es 650. También se sabe que lo mínimo que se paga en un día es 200 soles y
la desviación estándar es 100 soles. Se pide:
a. Indique el valor de los cuartiles inferior, central y superior. R: Q1= 350, Q2=500, Q3=650
73
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
b. Se sabe que últimamente los pagos diarios se ha incrementado en un 10% más 25 soles. ¿Cuál
es el coeficiente de variación de los pagos diarios con el incremento?
R: CV= 19.13 %
5. En una empresa, 400 trabajadores forman el Grupo 1 y lo conforman: Operarios (sub grupo 1A)
y técnicos (subgrupo 1B). la cantidad de trabajadores del grupo 1 es el 80% del total de
trabajadores de la empresa, y tienen un sueldo mensual promedio de 2730.5 soles. El otro 20%
de trabajadores de la empresa lo conforman los ejecutivos y trabajadores administrativos (grupo
2), y tienen un sueldo mensual promedio de 6500 soles.
a. Si se conoce que el sueldo mensual promedio de los operarios es 2270 soles y el sueldo
mensual promedio de los técnicos es 3498 soles; halle el número de operarios y técnicos que
tiene la empresa.
R: 250 operarios y 150 técnicos.
b. Si la dirección de la empresa establece una bonificación de 50 soles para los operarios, una
bonificación del 8% del sueldo mensual para los técnicos, y una bonificación de 200 soles
para los trabajadores del grupo 2; halle el sueldo promedio para todos los trabajadores de la
empresa.
R: 3,633.352
6. En una empresa de servicios generales, el salario promedio de sus trabajadores es 3360 soles, el
salario promedio del personal masculino es de 3500 soles y el salario promedio del personal
femenino es de 3100 soles.
a. ¿Qué porcentaje del personal de esta empresa es masculino y que porcentaje es femenino?
R: personal femenino= 35 % ; personal masculino= 65 %
b. Para el próximo mes la empresa acordó aumentar 10% del salario al personal masculino y
7.5% más una bonificación de 80 soles al salario del personal femenino, ¿Cuál es la nueva
media global, después del incremento salarial?
R: Nueva media global= S/. 3,696.88
c. ¿De qué monto debe disponer la empresa a fin de mes para hacer efectivo el pago a los 200
trabajadores de la empresa?
R: S/. 739,375
7. Desde hace dos años las compañías gastan en protección de la información. Estos gastos incluyen
los costos de personal, hardware, software, servicios externos y seguridad física. Se eligieron dos
empresas transnacionales y se registraron sus gastos mensuales, en miles de dólares,
74
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
correspondientes a la protección de la información de los últimos 6 meses. Luego de procesar los
datos se obtuvieron los siguientes resultados parciales.
6 6
∑ xi = 16 .8 ∑ x2i = 58.99
Empresa 1: i=1 i=1 Me = 3.0
6 6
∑ xi = 13. 2 ∑ x2i = 36 . 88
Empresa 2: i=1 i=1 Me = 2.5
a. ¿Cuál de las dos empresas ha tenidos gastos mensuales más homogéneos en los últimos seis
meses?;
R: CV de la empresa 1= 55.2129 %; CV de la empresa 2= 56.9182 %. La empresa 2 ha
tenido gastos mensuales en protección de la información más homogéneos.
11. En una ciudad existen 3 grandes plantas de ensamblaje de artefactos eléctricos que llamaremos
A, B y C. La primera emplea a 54 personas y su salario medio es de 1,080 soles. En la segunda
trabajan 84 empleados y su ingreso medio es de 860 soles. Finalmente, la paga media de los 153
trabajadores de la planta C es de 815 soles. ¿Cuál es el salario medio de los empleados en la
industria ensambladora de artefactos de dicha ciudad? R: S/. 877.16
Desarrollado en el PPT Medidas de tendencia central y posición / Página 23
12. Sea X: el sueldo de los trabajadores de planta de una empresa. El sueldo promedio de una
muestra de trabajadores es de S/. 1,000 mensuales. Calcule el nuevo sueldo promedio para los
siguientes casos:
i. Propuesta 1: Se otorga un aumento de S/. 100 a todos los trabajadores.
ii. Propuesta 2: Se otorga un aumento de 20% a todos los trabajadores.
iii. Propuesta 3: Se otorga un aumento del 10% más una bonificación adicional de S/. 50 a todos
los trabajadores.
¿Cuál de las tres propuestas es la más conveniente para los trabajadores? R: Propuesta dos.
76
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
Medidas estadísticas
∑ xi
Media aritmética X=
i=1
n
Varianza ∑ x 2i −n ( x )2
2 i=1
S=
n−1
Coeficiente de variación S
CV X = × 100 %
| X|
3( X−Me)
AS=
S
Coeficiente de asimetría
X −Mo
AS=
S
77
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
RESUMEN : APLICACIONES DE ESTADISTICA DESCRIPTIVA CON EL SOFTWARE R
Utilizaremos como ejemplo las siguientes notaciones:
NOMBRE DE BASE DE DATOS: empresas
VARIABLES PARA EL EJEMPLO:
CUANTITATIVA: VENTAS
CUALITATIVAS:
TIPO: T1, T2, T3.
SECTOR: industria, comercio, servicios.
TAMAÑO: grandes, medianas, pequeñas
RCOMANDER (Rcmdr)
No OBJETIVO EJEMPLO COMANDOS OBSERVACIÓN
1 Realizar una Recodificar la Variable Género para Datos / Modificar variables del conjunto de datos activo / Observación:
recodificación puntual reemplazar cada número por el texto convertir variable numérica en factor
correspondiente, de acuerdo a lo Factor = Variable
(de número a texto)
siguiente: Aparece la ventana: Convertir variables numéricas en cualitativa
1 = Masculino factores.
En esta ventana aparece la lista de variables:
2 = Femenino
Elegir la variable a recodificar. Por ejemplo: GENERO
Aceptar
Mensaje: Variable Género ya existe ¿Sobrescribir variable? Si
Aparece Ventana Valor numérico Nombre del nivel: Ingresar la
denominación (texto) de cada valor numérico:
1: Masculino 2: Femenino
Aceptar
78
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en concordancia con lo dispuesto por la legislación sobre los derechos de autor:
Decreto Legislativo 822.
2 Recodificar una Con la variable VENTAS generar Datos / Modificar variables del conjunto de datos activo /
variable cuantitativa la variable categoría de las ventas Recodificar variables
para generar una que denotaremos como
Aparece la ventana: Recodificar Variables con la lista de
variable cualitativa. CATEGORIA: variables:
A: Ventas menores a 1000 Soles Elegir la variable cuantitativa a recodificar. En este caso:
VENTAS que nos permitirá generar la variable cualitativa
B: Ventas iguales o mayores a categoría de ventas que nombraremos: CATEGORIA.
1000 Soles pero menores a 2000
Escribir el nombre o prefijo para la variable recodificada:
Soles. CATEGORIA.
C: Ventas de 2000 Soles a más Introducir directrices de recofificación:
lo:999.99="CI"
1000:1999.99="CII"
2000:hi="CIII"
Aceptar
7 Calcular la media, Calcular la media de la variable ventas Estadísticos / Resúmenes / Tabla de estadísticas/ elegir factores
mediana, y otras de las empresas pequeñas del sector (VARIABLES CUALITATIVAS: con Ctrl + ⇑ (flecha que está encima
estadísticas para una servicios. de Ctrl) elegir las variables: TAMAÑO y SECTOR) / elegir la
variable cuantitativa variable explicada (CUANTITATIVA): VENTAS
generando grupos con
# Elegir el estadístico (primero la Media y después la
dos variables Mediana)
cualitativas.
80
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en concordancia con lo dispuesto por la legislación sobre los derechos de autor:
Decreto Legislativo 822.
8 Calcular el CV para Calcular el CV de la variable ventas de Estadísticos / Resúmenes / Tabla de estadísticas/ elegir Para hallar el CV se
una variable las empresas pequeñas del sector factores (VARIABLES CUALITATIVAS: con Ctrl + ⇑ (flecha que requiere instalar el
cuantitativa generando servicios. está encima de Ctrl) elegir las variables: TAMAÑO y SECTOR) / paquete raster (en la
grupos con dos ventana 4: Packges /
elegir la variable explicada (CUANTITATIVA): VENTAS
Install / raster / Install)
variables cualitativas. Elegir en estadísticas la opción otros: ingresar cv
# ingresar cv en minúscula
9* Hallar un diagrama de Generar un diagrama de cajas para Gráficas / diagrama de cajas / seleccionar la variable La media y la mediana
cajas sin generar la variable ventas. cuantitativa (en este caso: VENTAS) / opciones / Aceptar complementan la
grupos información
Para hallar el valor de la media y la mediana utilizaremos proporcionada en el
RStudio: diagrama de cajas.
# Para obtener la media:
mean(alfa$VENTAS)
# Para obtener la mediana:
median(alfa$VENTAS)
10 Hallar un diagrama de Generar un diagrama de cajas para Gráficas / diagrama de cajas / seleccionar la variable La media y la mediana
cajas generando la variable ventas del sector cuantitativa (en este caso: VENTAS) / Gráfica por grupos / complementan la
grupos servicios. seleccionar la variable grupo (cualitativa, en este caso: información y se
SECTOR) / opciones / Aceptar obtienen con Rstudio.
Para hallar el valor de la media y la mediana utilizaremos
proporcionada en el
RStudio: diagrama de cajas.
# Para obtener la media:
tapply(alfa$VENTAS,alfa$SECTOR,mean)
# Para obtener la mediana:
tapply(alfa$VENTAS,alfa$SECTOR,median)
81
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en concordancia con lo dispuesto por la legislación sobre los derechos de autor:
Decreto Legislativo 822.
RSTUDIO
No OBJETIVO EJEMPLO COMANDOS OBSERVACIÓN
En la ventana No. 1 digitar:
Para hallar la Calcular la media, mediana, # media Escribir en
media, la desviación estándar y/o varianza mean(empresas$VENTAS) minúsculas cv, mean,
mediana, la de la variable ventas median, sd, mean
desviación # mediana
estándar y la median(empresas$VENTAS)
1 varianza de una
variable # desviación estándar
cuantitativa sin sd(empresas $VENTAS)
generar grupos.
# desviación estándar
var(empresas $VENTAS)
Para hallar la Hallar la asimetría de las ventas # Para calcular el AS de Pearson hallar la media, mediana y desviación
asimetría sin estándar.
82
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en concordancia con lo dispuesto por la legislación sobre los derechos de autor:
Decreto Legislativo 822.
generar grupos. en general. # Escribir en minúsculas mean, median, sd
# media
mean(empresas$VENTAS)
# mediana
median(empresas $VENTAS)
3
# desviación estándar
sd(empresas $VENTAS)
Para hallar la Hallar la asimetría de las ventas # Para calcular el AS de Pearson hallar la media, mediana y desviación
asimetría por de las empresas pequeñas. estándar.
grupos con una # Escribir en minúsculas mean, median, sd
variable
cuanlitativa. # media
tapply(empresas$VENTAS,empresas$TAMAÑO,mean)
4 # mediana
tapply(empresas$VENTAS,empresas$TAMAÑO,median)
# desviación estándar
tapply(empresas$VENTAS,empresas$TAMAÑO,sd)
cv(empresas$VENTAS)
CASO B: # Para llamar al paquete raster:
library(raster)
Calcular el cv de la variable
ventas de las empresas # Para hallar el cv clasificando por grupos:
grandes. # Escribir en cv en minúscula
tapply(empresas$VENTAS,empresas$TAMAÑO,cv)
Para hallar a la Calcular el valor mínimo,
vez el valor máximo , Q1, Q2 y Q3 de la quantile(empresas$VENTAS,type=6)
minimo, todos los
84
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en concordancia con lo dispuesto por la legislación sobre los derechos de autor:
Decreto Legislativo 822.
7 cuartiles y el variable ventas.
valor máximo de
una variable
cuantitativa.
Para hallar un Calcular el valor mínimo, del quantile(empresas$VENTAS,0.90, type=6) Ingresar el valor del
percentil de una 10% superior (equivalente al percentil en
variable valor máximo del 90% inferior) decimales.
8 cuantitativa. de las ventas; es decir el
Escribir type=6 para
percentil 90.
que R realice el
cálculo del Percentil
utilizando la fórmula
(algoritmo) que
emplearemos en el
curso.
Para hallar un Calcular el valor mínimo, del tapply(empresas$VENTAS,empresas$TAMAÑO,quantile,0.90,type=6) Ingresar el valor del
percentil de una 10% superior (equivalente al percentil en
variable valor máximo del 90% inferior) decimales.
9 cuantitativa de las ventas de las empresas
Escribir type=6 para
generando grupos grandes; es decir el percentil
que R realice el
con una variable 90.
cálculo del Prcentil
cualitativa.
utilizando la fórmula
(algoritmo) que
emplearemos en el
curso.
El software estadístico R es un entorno informático estadístico que incluye herramientas de análisis
de datos y generación de gráficas. Es un software libre y funciona bajo Windows, MAC OS y
Linux. Es una herramienta ideal para docencia, ya que permite que los alumnos la descarguen y la
utilicen en sus casas con toda libertad y sin costo alguno. R es un conjunto de módulos estadísticos
R que mediante cualquiera de sus interfaces, permite realizar análisis de datos y representación de los
mismos.
86
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en concordancia con lo dispuesto por la legislación sobre los derechos de autor:
Decreto Legislativo 822.
DescTools DescTools es una colección extensa de diversas funciones estadísticas básicas , es una caja
de herramientas que permite calcular estadísticas descriptivas, dibujar resúmenes gráficos y
reportar los resultados.
87
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en concordancia con lo dispuesto por la legislación sobre los derechos de autor:
Decreto Legislativo 822.