Está en la página 1de 87

FACULTAD DE CIENCIAS EMPRESARIALES Y ECONÓMICAS

CARRERA DE NEGOCIOS INTERNACIONALES


CARRERA DE ADMINISTRACIÓN
CARRERA DE CONTABILIDAD
CARRERA DE MARKETING

CURSO
ESTADÍSTICA EMPRESARIAL 1

GUÍA DE PRÁCTICA Nº 1
Periodo Académico 2022-2

CASOS DE APLICACIÓN

Profesora Responsable:

Olga Lidia Solano Dávila

Agosto-Diciembre 2022

1
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en concordancia con lo
dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
CAPÍTULO 1

TÉRMINOS BÁSICOS DE LA ESTADÍSTICA

2
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en concordancia con lo
dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
TÉRMINOS BÁSICOS DE LA ESTADÍSTICA

Población.- Conjunto de elementos que conforman el universo a ser investigado, claramente definidos en el
espacio y el tiempo. Pueden ser personas, hogares, distritos, empresas, estudiantes universitarios, otros.

Muestra.- Es un subconjunto o una parte del universo, la que se ha seleccionado con el fin de estudiar una o
más características y obtener información acerca de la población de la cual proviene.

Unidad de análisis.- Es el elemento o unidad base de la población o de la muestra del cual se obtendrá datos
referidos a ciertas características o variables, que nos interesan para explicar un determinado fenómeno.

Unidad Reportante.- Es aquella persona que nos brinda la información que se le solicita.

Estadígrafo.- Es el valor calculado en base a los datos que se obtienen en la muestra y por lo tanto; es una
estimación o aproximación al parámetro.

Parámetro.- Es una medida de resumen de toda la población que, se expresa por ejemplo como total,
promedio, proporción, razón, etc.

Variable.- Es una característica de la unidad de análisis cuya medida puede cambiar de valor. Se representa
simbólicamente mediante las letras del alfabeto (X, Y, Z).

3
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en concordancia con lo
dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
REPASO DE POBLACIÓN, MUESTRA, UNIDAD DE ANÁLISIS, PARÁMETRO,
ESTADÍGRAFO Y VARIABLE
CASOS DE APLICACIÓN

1. Clasifique cada una de las siguientes variables: nominal (N), ordinal (O), discreta (D), continua (C).

i) La comida favorita de una persona. N

ii) Edad del jefe de hogar (en años cumplidos). D

iii) Nivel socioeconómico del elector. O

iv) Suma de puntos obtenidos en el lanzamiento de un par de dados. D

v) Número de hijos de los trabajadores de una empresa. D

vi) Grado de satisfacción del servicio de los contribuyentes de SUNAT. O

vii) Saldo en el depósito de ahorro de los clientes de una institución bancaria. C

2. La gerencia de marketing de una empresa de galletas desea estimar el promedio de cajas de galletas que
se venden por bodega, durante un mes, en el Cercado de Lima. En base al resultado, la empresa debe
decidir si implementa una campaña publicitaria por medios radiales. Se seleccionó una muestra aleatoria
de 150 bodegas y se recolectó información aplicando una encuesta.
Responder las siguientes preguntas :

a. a. ¿Cuál es la población de estudio? N= Todas las bodegas ubicadas en el cercado de Lima.


b. ¿Cuál es la muestra? n= 150 bodegas ubicadas en el cercado de Lima.
c. ¿Cuál sería el marco muestral para el estudio? Relación o base de datos de las bocercado de
d. ¿Cuál es la unidad de análisis o elemental? Una bodega ubicada en el cercado de Lima.
e. Determine y clasifique la variable de interés en el estudio:
Variable: X: Número de cajas de galletas vendidas en una bodega del cercado de Lima en us.
f. Defina el parámetro de interés en el estudio: Media poblacional: promedio de cajas de galletas
g. Defina el estadístico de interés en el estudio: Media muestral: promedio de cajas de galletas
vendidas por las 150 bodegas ubicadas en el cercado de Lima que conforman la muestra.
4
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en concordancia con lo
dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
3. En cada uno de los siguientes enunciados, complete los espacios en blanco:

a. Para realizar un estudio sobre el grado de satisfacción laboral de la empresa ALFA (alto,
medio, bajo) se entrevista a 50 de sus trabajadores que vienen laborando por lo menos tres
años en la empresa.

Población: Todos los trabajadores de la empresa ALFA que vienen laborando por lo menos tres

años en la empresa (N).

Muestra: 150 trabajadores de la empresa ALFA que vienen laborando por lo menos tres años en la

empresa (n).

Unidad de análisis: Un trabajador de la empresa ALFA que viene laborando por lo menos tres

años en la empresa.

Variable: Grado de satisfacción laboral de la empresa ALFA (alto, medio, bajo) de un trabajador

que viene laborando por lo menos tres años en la empresa..

Tipo de variable: Cualitativa ordinal.

b. En una empresa distribuidora se ha obtenido que el monto promedio por factura


pagada es de 750 soles; este valor se obtuvo de una muestra de tamaño 100.
Población: Todas las facturas pagadas en la empresa distribuidora (N).

Muestra: 100 facturas pagadas en la empresa distribuidora (n=100).

Unidad de análisis: Una factura pagada en la empresa distribuidora.

Variable: Monto de una factura pagada en la empresa distribuidora.

Tipo de variable: Cuantitativa continua.

Estadígrafo: Monto PROMEDIO de las factura pagada en la empresa distribuidora que conforman

la muestra (n=100)….MEDIA MUESTRAL = 750 soles.

5
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en concordancia con lo
dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
4. En el siguiente cuadro defina un parámetro y un estadígrafo para cada población y muestra
respectivamente según la variable de interés.
Población Muestra Variable Parámetro Estadígrafo
400 alumnos
Alumnos de la Edad de los alumnos
elegidos al azar de
Universidad de de la Universidad de
la Universidad de
Lima. Lima.
Lima
Condición externa
150 viviendas
Viviendas de la de la vivienda (muy
seleccionadas al
urbanización “Los buena, buena,
azar en toda la
Rosales”. mala).
urbanización.

Boletas de venta 60 boletas de Valor de la venta


del “Restaurante ventas elegidas de registrada en la
Delicias” en todo el mes de boleta (Soles).
Marzo 2018. marzo.

6
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en concordancia con lo
dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
CAPÍTULO 2

TABLAS DE DISTRIBUCIÓN DE
FRECUENCIAS Y GRÁFICOS
SEGÚN TIPO DE VARIABLES

Uso del software R Studio

7
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en concordancia con lo
dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
R Studio es un software estadístico de libre distribución que abarca todos los aspectos necesarios para el
aprendizaje y la aplicación de la Estadística en general. El programa incorpora opciones vinculadas a las
principales técnicas de análisis estadístico (análisis descriptivo, contrastes de hipótesis, regresión lineal y no
lineal, series temporales, análisis de tiempos de fallo, control de calidad, análisis factorial, ANOVA, análisis
cluster, etc.), además de proporcionar un potente entorno gráfico y de ofrecer total compatibilidad con los
editores de texto, hojas de cálculo y bases de datos más usuales.

Tablas de distribución de frecuencia. - Una tabla de frecuencias (también conocida como distribución de
frecuencias) es una tabla en la que se organizan los datos en categorías o clases, es decir, en grupos de valores
que describen una característica de los datos y muestran el número de observaciones del conjunto de datos que
caen en cada una de las clases.
Cuadro Nº1

Arequipa: Distribución de personas según medios de


comunicación utilizados - Mayo 2015

Medios de
Comunicación
utilizados fi hi hi%
Internet 15 0.30 30%
Periódicos 12 0.24 24%
Radio 8 0.16 16%
Revistas 5 0.10 10%
Televisión 5 0.10 10%
No respondió 5 0.10 10%
Total 50 1 100%
Fuente: Encuesta realizada por IKKF Marketing - Mayo
2015

Gráficos estadísticos. - Los gráficos estadísticos presentan los datos en forma de dibujo de tal modo que se
pueda percibir fácilmente los hechos esenciales y compararlos con otros.
Gráfico Nº 1
Escuela de Negocios: Distribución de estudiantes se gún núme ro
de cursos de saprobados - Semestre ante rior

10
10

N ú m ero de estu dia ntes


9
8 7
7 6 6
6 5
5 4
4
3 2
2
1

0 1 2 3 4 5 6
Número de cursos desaprobados
Fuente: Archivo de notas de la Escuela de Negocios

Tablas de doble entrada.- son aquellas tablas de datos referentes a dos variables, estas tablas se forman por
filas y columnas y en la primera fila o primera columna, se ubican las categorías de las variables y en las
casillas la frecuencia o el número de elementos de las categorías de las variables en conjunto.

8
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en concordancia con lo
dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
CASO 1: INDUSTRIAL TOOLS

Industrial Tools es una empresa peruana dedicada a la producción de herramientas utilizadas en la


industria metal-mecánica, el gerente de Recursos Humanos le ha entregado los siguientes datos que
corresponden al personal que labora en las áreas de administración y operaciones con el propósito que
usted la procese y obtenga algunos resultados que serán de interés para la empresa. Los datos se

presentan en el archivo en Excel disponible en su aula virtual denominado: herramientas.

. La descripción de las variables se muestra a continuación:

Notación de la Indique el tipo de variable


Columna Descripción de la variable
variable (cuantitativa / cualitativa)
GENERO Género del trabajador:
C1 Cualitativa nominal
1: Masculino, 2: Femenino
Área de trabajo:
AREA
C2 1: Administración, Cualitativa nominal
2: Operaciones
Sueldo mensual en soles del
C3 SUELDO trabajador al momento de Cuantitativa continua
registrar los datos.
EDAD Edad del trabajador: edad del
C4 Cuantitativa discreta
trabajador en años cumplidos.
Estado Civil del trabajador:
1: Soltero
C5 ECIVIL 2: Casado Cualitativa nominal
3: Divorciado
4: Viudo
Condición laboral del
trabajador:
C6 CLABORAL Cualitativa nominal
1: Contratado
2: Estable
C7 TSERVICIO Permanencia, en años Cuantitativa discreta
cumplidos, del trabajador en
la empresa.

9
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
AFP a la que está inscrito el Cualitativa nominal
trabajador en el momento de
la investigación:
C8 AFP 1: Habitat
2: Integra
3: Prima
4: Profuturo

1. En el contexto del caso presentado, identifique y defina lo siguiente:


Población: N = Todos los trabajadores de las de administración y operaciones de Industrial
Tools.

Muestra: n = 223 trabajadores de las de administración y operaciones de Industrial Tools.

Unidad de análisis: ¿De quien recabo información? Un trabajador de las de administración u


operaciones de Industrial Tools.

Indique cuáles son las variables cualitativas: Género, Area, Estado Civil, Condición Laboral,
AFP.

Indique cuáles son las variables cuantitativas: Sueldo, Edad, Tiempo de servicio.

2. Inicie una sesión del programa R-Studio.

POR UNICA VEZ: Si aún no ha instalado el R Commander siga los


pasos del manual de instalación (que se encuentra en el aula virtual en
la sección de material del curso) o de manera alternativa siga la
siguiente secuencia para realizar la instalación desde el R Studio:
Ir a la ventana 4 / Install / Packages: Rcmdr / Install
Otra alternativa: digitar en la venta 1:
install.packages(¨Rcmdr¨)
Luego de instalado el R Comander (Rcmdr) llamarlo en el R Studio escribiendo en la ventana 1
lo siguiente:
library(Rcmdr)
A continuación:
 En la barra inferior de su PC aparecerá el ícono del R Comander junto al ícono del RStudio.
 Ingrese al ícono del R Comander y visualizará una ventana con las opciones que ofrece el R
Comander.
 En la ventana del R Comander se muestran los códigos que se han utilizado para obtener los
reportes solicitados.
 Tenga en cuenta que todos los reportes generados a través del R Comander aparecerán en la
ventana 3 del R Studio.

3. Cargue en el R Comander el archivo en Excel herramientas de la siguiente forma:

10
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
Datos / Importar datos / desde un archivo en Excel /
Luego en la ventana: Importar un conjunto de datos Excel ingrese:
 Nombre del conjunto de datos (archivo en Excel): herramientas
 Aceptar
 Seleccionar el archivo que desea cargar

Ahora podrá ver la base de datos en la opción visualizar conjunto de datos que se encuentra
debajo de las opciones de R Comander.
Adicionalmente podrá observar en la consola de R Studio (ventana No. 3) el siguiente mensaje:
El conjunto de datos herramientas tiene 223 filas y 8 columnas.
# IMPORTANTE: No se deben usar tildes para nombrar los archivos, las variables, ni los niveles de
las variables categóricas.

4. Transforme los códigos numéricos de la columna 1 (variable: género) a sus nombres


respectivos y almacénelos en la misma columna.

Datos / Modificar variables del conjunto de datos activo / convertir variable numérica en
factor

Observación: Factor = Variable cualitativa

Aparece la ventana: Convertir variables numéricas en factores.


En esta ventana aparece la lista de variables:
Elegir la variable a recodificar. Por ejemplo: GENERO que tiene dos niveles:
1. Masculino
2. Femenino
Aceptar

Aparece mensaje: Variable Género ya existe ¿Sobrescribir variable? Si

Aparece Ventana Valor numérico Nombre del nivel: Aquí debemos ingresar la denominación de
cada valor numérico conforme la codificación proporcionada en el caso de estudio:

1: Masculino
2: Femenino

Aceptar

5. Haga lo mismo que el ítem 4 con los datos de las columnas 2, 5, 6 y 8. Guarde los nuevos datos
en su respectiva columna.

11
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
6. Utilice los datos de la variable cuantitativa sueldo (columna 3) y genere la variable cualitativa
nivel de sueldo guardando los datos en la columna 9. Para la recodificación considere la siguiente
clasificación:
 Nivel 1 : sueldos menores que 2500 soles.
 Nivel 2 : sueldos de 2500 o más pero inferiores a 7000 soles.
 Nivel 3 : sueldos de 7000 soles a más.

Ahora vamos a generar una variable CUALITATIVA que denominaremos NIVEL_ SUELDO a partir de
una variable CUANTITATIVA (SUELDO). Esto se hará con una recodificación por RANGOS.

Datos / Modificar variables del conjunto de datos activo / Recodificar variables

Aparece la ventana: Recodificar Variables.


En esta ventana aparece la lista de variables:
Elegir la variable cuantitativa a recodificar. En este caso: SUELDO que se recodificará para
generar la variabla cualitativa (FACTOR) que denominaremos: NIVEL_SUELDO.

Nuevo nombre o prefijo para variables múltiples recodificadas: NIVEL_SUELDO.


Introducir directrices de recofificación:

lo:2499.99="Nivel 1"

2500:6999.99="Nivel 2"

7000:hi="Nivel 3"

Aceptar

De esta manera aparecerá en la base de datos una columna adicional con la nueva variable
cualitativa (FACTOR) NIVEL_SUELDO.

7. Construya la tabla de distribución de frecuencias para la variable estado civil (columna 5) y


complete los datos de la siguiente tabla:
Tabla No. 7A
Distribución del personal según estado civil
Industrial Tools – Áreas Administración y Operaciones
ESTADO CIVIL CONTEO( f i) PORCENTAJE (hi %)
Casado 8 3.59

Divorciado 57 25.56

Soltero 154 69.06


Viudo 4 1.79

Total 223 100.00 

Estadísticos / Resúmenes / Distribución de frecuencias / seleccionar la variable: ECIVIL / Aceptar

Para saber el número total de filas de la base de datos, escribir en el R Script del R Comander:
12
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
nrow(herramientas)

En la consola del R Studio aparecerá el número total de filas (DATOS): 223

De manera similar construya la tabla de distribución de frecuencias para la variable AFP a la que esté
inscrita el trabajador y para la variable nivel de sueldo.

Tabla No. 7B Tabla No. 7C


Distribución del personal según Distribución del personal según el Nivel de
afiliación a la AFP Sueldo
Industrial Tools – Áreas Administración y Industrial Tools – Áreas Administración y
Operaciones Operaciones
CONTEO PORCENTAJE NIVEL DE CONTEO PORCENTAJE
AFP
(fj) (hj%) SUELDO (fj) (hj%)
Habitat 40 17.94
Nivel 1 175 78.48
Integra 78 34.98
Nivel 2 31 13.90
Prima 70 31.39
Nivel 3 17 7.62
Profuturo 35 15.70
Total 223  100
Total 223 100 

Tabla No. 2:
Estadísticos / Resúmenes / Distribución de frecuencias / seleccionar la variable: AFP / Aceptar

Tabla No. 3:
Estadísticos / Resúmenes / Distribución de frecuencias / seleccionar la variable: NIVEL_SUELDO /
Aceptar
Observación: La variable NIVEL_SUELDO se obtuvo recodificando la variable cuantitativa SUELDO.

8. En base a los resultados mostrados en las tablas de distribución de frecuencias 1, 2 y 3,


Complete los siguientes enunciados empleando dos decimales:

a. De los 223 trabajadores ……… son casados; es decir, el…….. % del total de
trabajadores son casados.

b. De los 223 trabajadores, el …………..% de ellos están afiliados a la afiliados a la


AFP Profuturo.Asimismo, la mayoría de los trabajadores están afiliados a la AFP
…………

c. De los 223 trabajadores ………de ellos tienen un Nivel de Sueldo 2 o 3 lo cual representa el
…………%

9. Recodifique convenientemente los datos de la columna años de servicio y luego complete el


siguiente enunciado:
13
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
De los 223 trabajadores el número de trabajadores que tienen 10 o más años de servicio en
la empresa es igual a………..lo cual representa el …..…..%
.
Se observan dos grupos según los años de servicio:
GRUPO 1: Menos de 10 años de servicio: [0 – 10 >
Grupo 2: 10 o más años de servicio: [10 – a más.

Primero recodificamos y creamos la variable cualitativa denominada


Ahora vamos a generar una variable CUALITATIVA que denominaremos CATEGORÍA_TSERVICIO a
partir de una variable CUANTITATIVA (TSERVICIO). Esto se hará con una recodificación por
RANGOS.

Datos / Modificar variables del conjunto de datos activo / Recodificar variables

Elegir la variable cuantitativa a recodificar. En este caso: TSERVICIO que se recodificará para
generar la variabla cualitativa (FACTOR) que denominaremos: CATEGORÍA_TSERVICIO.

Nuevo nombre o prefijo para variables múltiples recodificadas:


CATEGORÍA_TSERVICIO.
Introducir directrices de recofificación:

lo:9.99="menos de 10 años"

10:hi="10 a más años"

Aceptar

De esta manera aparecerá en la base de datos una columna adicional con la nueva variable
cualitativa (FACTOR) CATEGORÍA_TSERVICIO.
.
Después de la recodificación:

Estadísticos / Resúmenes / Distribución de frecuencias / seleccionar la variable: CATEGORÍA_TSERVICIO


/ Aceptar

10. Complete la tabla No. 4 y los espacios en blanco del siguiente enunciado:
……… de los 48 trabajadores del área de administración son mujeres; es decir el …….. % de los
trabajadores del área de administración son mujeres.

Tabla No. 10
Distribución del personal según género y área de trabajo
Industrial Tools – Áreas Administración y Operaciones

GÉNERO
ÁREA TOTAL
Femenino Masculino

Administración 21 27 48

Operaciones 69 106 175

14
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
Total 90 133 223
Estadísticos / Tablas de contingencia / Tabla de doble entrada / ingresar la variable que va en la fila:
AREA y en la columna: GENERO

11. Complete la tabla No. 11 y los espacios en blanco del siguiente enunciado:
 De los trabajadores varones ……….. son casados o divorciados; es decir el ………….
%
 Del total de trabajadores en general, el número de trabajadores hombres que son
casados o divorciados es igual a…………; lo cual representa el ………….%

Tabla No. 11
Distribución del personal según género y estado civil
Industrial Tools – Áreas Administración y Operaciones

GÉNERO
ESTADO CIVIL TOTAL
Femenino Masculino
Casado 2 6 8

Divorciado 27 30 57
Soltero 60 94 154
Viudo 1 3 4
Total 90 133 223
Estadísticos / Tablas de contingencia / Tabla de doble entrada / ingresar la variable que va en la fila:
ECIVIL y en la columna: GENERO

12. Genere las tablas de doble entrada que considere conveniente para completar los espacios en
blanco de los siguientes enunciados:
a. De los trabajadores del área de administración, ……. tienen nivel de sueldo 2; lo cual
representa el ……….%
b. Del total de trabajadores, ……. son del área de administración y tienen nivel de sueldo 3; lo
cual representa el ……….%

Estadísticos / Tablas de contingencia / Tabla de doble entrada / ingresar la variable que va en la fila:
AREA y en la columna: NIVEL_SUELDO

c. De los trabajadores solteros, ……. tienen 10 o más años de servicio; lo cual representa el
……….%

Estadísticos / Tablas de contingencia / Tabla de doble entrada / ingresar la variable que va en la fila:
ECIVILy en la columna: CATEGORÍA_TSERVICIO.

15
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
OBSERVACIÓN: La variable CATEGORÍA_TSERVICIO se obtuvo mediante una recodificación.

13. Complete la tabla No. 6 y los espacios en blanco del siguiente enunciado:

a. De las trabajadoras mujeres, ……….. tienen nivel de sueldo 3 y laboran en el área de


administración; lo cual representa el ……….%

b. De las trabajadores hombres, ……….. tienen nivel de sueldo 1 y laboran en el área de


operaciones; lo cual representa el ……….%

Distribución del personal según género, nivel de sueldo y área de trabajo


Industrial Tools – Áreas Administración y Operaciones

Tabla No. 13A Tabla No. 13B

NIVEL DE FEMENINO MASCULINO


NIVEL DE
SUELDO Total
SUELDO
Total
||||| Admistración Operaciones Administración Operaciones
69 0 69 106 0 106
Nivel 1 Nivel 1
0 14 14 0 17 17
Nivel 2 Nivel 2
0 7 7 0 10 10
Nivel 3 Nivel 3
69 21 90 106 27 133
Total Total
Se tiene 3 variables de clasificación:
Estadísticos / Tablas de cont
ingencia / Tabla de entradas múltiples / ingresar las variables:
Variable de fila: NIVEL_SUELDO
Variable de columna: AREA
Variable de control: GÉNERO
(marcar opción: sin porcentajes)

16
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
14. Genere las tablas de doble entrada que considere conveniente para completar los espacios en
blanco de los siguientes enunciados:
a. De los trabajadores del área de administración, …7…….. tienen nivel de sueldo 3 y
son mujeres; lo cual representa el …14.58%…….%
Se tiene 3 variables de clasificación:
Estadísticos / Tablas de contingencia / Tabla de entradas múltiples / ingresar las variables:
Variable de fila: NIVEL_SUELDO
Variable de columna: GENERO
Variable de control: AREA
(marcar opción: sin porcentajes)

AREA = Administración

GENERO
NIVEL_SUELDO Masculino Femenino
Nivel 1 0 0
Nivel 2 17 14
Nivel 3 10 7

, , AREA = Operaciones

GENERO
NIVEL_SUELDO Masculino Femenino
Nivel 1 106 69
Nivel 2 0 0
Nivel 3 0 0

b. TAREA: De los trabajadores contratados, …7…….. tienen nivel de sueldo 3 y una


edad de 30 o más años; lo cual representa el …8.14…….%

Observación: Primero recodifique convenientemente la variable edad para generar la variable


cualitativa (FACTOR) que denominaremos: RANGO_EDAD.
Directrices de recodificación:
lo:29.99="menos de 30 años"
30:hi="30 a más años"
17
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
Se tiene 3 variables de clasificación:
Estadísticos / Tablas de contingencia / Tabla de entradas múltiples / ingresar las variables:
Variable de fila: NIVEL_SUELDO
Variable de columna: RANGO_EDAD.
Variable de control: CLABORAL
(marcar opción: sin porcentajes)

Respuesta:
De los trabajadores contratados 7 tienen sueldo alto y presentan una edad de 30 o más años; es
decir el 8.139 %

OBSERVACIÓN: Guardar el archivo Recodificado que podrá ser usado en otra sesión.
Datos / Conjunto de datos activo / Guardar el conjunto de datos activo (elegir el directorio donde se
guardara el archivo y ponerle un nuevo nombre Ejemplo: herramientasR

El archivo herramientasR será guardado en formato R y para usarlo en una próxima sesión deberá
cargarse de la siguiente manera:
Datos / Cargar conjunto de datos / seleccionar el archivo herramientasR

18
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
CAPÍTULO 3

MEDIDAS DE TENDENCIA CENTRAL


MEDIDAS DE DISPERSIÓN
MEDIDAS DE CUANTÍA
MEDIDAS DE ASIMETRÍA

19
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
Medidas de Tendencia Central, dispersión, de cuantía y de asimetría

Las medidas estadísticas son aquellas que permiten resumir información proveniente de una muestra o
población y tienen por objeto, obtener un valor que resuma en sí todas las mediciones. Estas medidas
aplicadas a las características de las unidades de una muestra se denominan estadísticos o estadígrafos;
mientras que aplicadas a poblaciones se les denomina parámetros de la población.
- Medidas de tendencia central: Media aritmética, mediana y moda
- Medidas de posición: Cuartiles, percentiles
- Medidas estadísticas de variabilidad: Rango, rango intercuartil, varianza, desviación Estándar,
coeficiente de variación. medidas de forma: coeficiente de asimetría
ESTADIGRAFO DATOS NO AGRUPADOS

n
Media
∑ xi
i=1
Aritmética X̄ =
n
K (n+1)
W=
100

Y : parte entera
Mediana
Z : parte decimal

Me= X(Y ) +Z [ X Y +1−X ( Y )]

Moda El valor que más se repite de los datos

K (n+1)
W=
100

Y : parte entera
Percentiles
Z : parte decimal

P K = X(Y ) + Z [X Y +1−X ( Y ) ]

n
∑ x 2i − n x̄2
Varianza S2 = = i = 1
n−1
Coeficiente de S
CV X = × 100 %
| X|
variación

20
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
3( X −M e )
Coeficiente de asimetría de Pearson : A Pearson=
S
X −Mo
A Pearson=
S

CASO 2: PARQUE AUTOMOTOR

Una entidad de gobierno está interesada en conocer la antigüedad del parque automotor de servicio de
transporte público en Lima Metropolitana con la finalidad de lanzar el proyecto de Chatarreo; en la
actualidad se han inscrito 8 empresas para acogerse a tal proyecto. Se ha elegido aleatoriamente 3
empresas inscritas para la verificación de la información presentada. Las variables que se han
evaluado son:
Column Notación de la Descripción de la Indique el tipo de variable
a variable variable (cuantitativa / cualitativa)
C1 MARCA Marca del vehículo Cualitativa nominal
antigüedad del
C2 ANTIGÜEDAD vehículo (en años). Cuanitativa

Tipo de vehículo:
C3 TIPO Cualitativa nominal
microbús, combi, bus
Número de asientos
C4 N_ASIENTOS por cada unidad Cuanitativa
automotriz
Tipo de combustible
utilizado por el
C5 T_COMBUSTIBLE Cualitativa nominal
vehículo (petróleo,
gasolina).
Los datos se encuentran en el archivo en Excel denominado chatarreo disponible en su aula
virtual.

 Inicie una sesión del programa R-Studio.

library(Rcmdr)
OBSERVACION: poner library todo en minúscula.
21
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
A continuación:
 En la barra inferior de su PC aparecerá el ícono del R Comander junto al ícono del RStudio.
 Ingrese al ícono del R Comander y visualizará una ventana con las opciones que ofrece el R
Comander.
 En la ventana del R Comander se muestran los códigos que se han utilizado para obtener los
reportes solicitados.
 Tenga en cuenta que todas los reportes generados a través del R Comander aparecerán en la
ventana 3 del R Studio.

Cargue en el R Comander el archivo en Excel de la siguiente forma:


Datos / Importar datos / desde un archivo en Excel /
Luego en la ventana: Importar un conjunto de datos Excel ingrese:
 Nombre del conjunto de datos (archivo en Excel): chatarreo
 Aceptar
 Seleccionar el archivo que desea cargar

Ahora podrá ver la base de datos en la opción visualizar conjunto de datos que se encuentra
debajo de las opciones de R Comander.
Adicionalmente podrá observar en la consola de R Studio (ventana No. 3) el siguiente mensaje:
El conjunto de datos herramientas tiene 200 filas y 5 columnas.
# IMPORTANTE: No se deben usar tildes para nombrar los archivos, las variables, ni los niveles de
las variables categóricas.

PARTE 1: Medidas de tendencia central y posición


1. Con la información de la variable antigüedad, desagregada por tipo de vehículo,
complete la tabla y los espacios en blanco de los enunciados que se presentan a
continuación:
Tabla No. 1

ESTADÍSTICOS DE TENDENCIA
TIPO DE VEHÍCULO CENTRAL Número de datos
Promedio (media) Mediana
20.861 21.000 79
Buses
22.517 23.000 60
Combis
21.377 21.000 61
Microbuses
200
TOTAL
Estadísticos / Resúmenes / Resúmenes numéricos / elegir la variable cuantitativa:
ANTIGÜEDAD / Resumir por grupos / elegir la variable cualitativa: TIPO /
Estadísticos / elegir las estadísticas que se desean obtener (en este caso Media y la
mediana que es igual al cuantil 2 o Percentil 50)
22
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
a. La antigüedad promedio de los buses es igual a …20.061……… años.
b. Considerando la antigüedad de las combis, el valor que deja a su izquierda y a su
derecha el 50% de los datos es igual a……23……años.
c. Más del 50% de los datos tienen una antigüedad mayor a su promedio en los vehículos de
tipo ……buses …… y …combi……….
Observación: Más del 50% de los datos son mayores a la media cuando la media (promedio)
es menor que la mediana.

50% 50%

Mediana
Media
d. Menos del 50% de los datos tienen una antigüedad mayor a su promedio en los vehículos de
tipo …………
Observación: Menos del 50% de los datos son mayores a la media cuando la media
(promedio) es mayor que la mediana.

50% 50%

Mediana
Media

2. Con la información de la variable antigüedad complete la tabla y los espacios en


blanco de los enunciados que se presentan a continuación:
a. El valor más frecuente es ………… y se repite ………… veces.
b. En las combis el valor más frecuente es ………… y se repite ………… veces.

Tabla No. 2A

ANTIGUEDAD Moda Número de veces que se repite el valor

Para todos los vehículos 226266 1919

Tabla No. 2B

23
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
TIPO DE VEHÍCULO Moda Número de veces que se repite el valor

Buses 25 9
Combis 26 9
16; 19; 5
Microbuses 1616,
22; 26
Hallaremos la moda con RStudio.
Instalar el paquete DescTools (en la ventana 4: Packges / Install / DescTools / Install)
En la ventana No. 1 digitar:
# Para llamar al paquete antes instalado:
library(DescTools)
# Para hallar la moda para todos los vehículos (sin clasificar por grupos):
Mode(chatarreo$ANTIGÜEDAD)
# Para hallar la moda clasificando por grupos:
tapply(chatarreo$ANTIGÜEDAD,chatarreo$TIPO,Mode)

3. Con la información de la variable antigüedad, desagregando por tipo de


combustible y marca, complete las tablas y los espacios en blanco de los enunciados
que se presentan a continuación:
TABLA No. 3A TABLA No. 3B
VEHÍCULOS GASOLINEROS VEHÍCULOS PETROLEROS
Medidas de tendencia central Medidas de tendencia central
MARCA MARCA
Promedio (media) Mediana Promedio (media) Mediana

Dodge 20.455 21.000 Dodge 20.607 20.000


Mercedes 20.519 21.000 Mercedes 22.641 24.000
Benz Benz
Scania 21.759 23.000 Scania 22.97 24.00
Estadísticos / Resúmenes / Tabla de estadísticas/ elegir factores (VARIABLES
CUALITATIVAS: con Ctrl + ⇑ (flecha que está encima de Ctrl) elegir las variables:
T_COMBUSTIBLE y MARCA) / elegir la variable explicada (CUANTITATIVA):
ANTIGÜEDAD

# Elegir el estadístico (primero la Media y después la Mediana)


# Hallaremos la media y la mediana con RStudio.
# Con la función split se divide la base de datos de acuerdo a la variable T_COMBUSTIBLE.
# Asi creamos la nueva base de datos que ponemos denominar DIVT_COMBUSTIBLE
En la ventana No. 1 digitar: chat

24
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
DIVT_COMBUSTIBLE=split(chatarreo,chatarreo$`T_COMBUSTIBLE`)
# Ahora con la función tapply se obtiene la media y la mediana de la variable antigüedad por
marca para los vehículos gasolineros y petroleros.
En la ventana No. 1 digitar:

tapply(DIVT_COMBUSTIBLE$gasolina$ANTIGÜEDAD,DIVT_COMBUSTIBLE$gasolina$MARCA,mean)
tapply(DIVT_COMBUSTIBLE$gasolina$ANTIGÜEDAD,DIVT_COMBUSTIBLE$gasolina$MARCA,median)
tapply(DIVT_COMBUSTIBLE$petroleo$ANTIGÜEDAD,DIVT_COMBUSTIBLE$petroleo$MARCA,mean)
tapply(DIVT_COMBUSTIBLE$petroleo$ANTIGÜEDAD,DIVT_COMBUSTIBLE$petroleo$MARCA,median)

# IMPORTANTE: No se debe escribir con tildes para nombrar los archivos, las variables, ni los niveles
de las variables categóricas.

a. La antigüedad promedio de los vehículos gasolineros de la marca Scania es igual a……


21.759……años.
b. La antigüedad promedio de los vehículos petroleros de la marca Dodge es igual a…
20.607………años.
c. Para la variable antigüedad de los vehículos gasolineros de la marca Dodge, el
valor que deja a su izquierda y a su derecha el 50% de los datos es igual a …
21………años.

d. En los vehículos petroleros de las marcas……MB……………..…… y …………


S……………. se tiene que más del 50% de unidades tienen una antigüedad mayor a su
promedio.
Observación: Esto ocurre cuando la media es menor que la mediana.
50% 50%

Mediana
Media
e. En los vehículos petroleros de la marca…D………se tiene que menos del 50%
de unidades tienen una antigüedad mayor a su promedio.
Observación: Esto ocurre cuando la media es mayor que la mediana.

25
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
50% 50%

Mediana
Media

4. Suponer que el costo mensual de mantenimiento de un bus es, en promedio, 150 soles;
de una combi es, en promedio, 90 soles; y de un microbús es, en promedio, 120 soles..
Complete la tabla y los espacios en blanco del enunciado que se presentan a
continuación:
El costo promedio mensual GLOBAL mensual de mantenimiento de un vehículo es igual a :
……………… Soles.

TABLA No. 4
Números Hi Costo por Costo
Costo número de ponderado
de
TIPO DE VEHÍCULO
promedio vehículos (con (con hi)
vehículos
(datos) fi)
(fi: ni)
79 39.5 150 * 79 = 150 * 0.395 =
Buses 150 11850 59.25

60 30.0 90 * 60 = 90 * 0.30 =
Combis 90 5400 27

61 30.5 120 * 61 = 120 * 0.305 =


Microbuses 120 7320 36.6

200 100 24570 122.85


TOTAL O
GLOBAL

MEDIA TOTAL O
GLOBAL 24570 / 200 = 122.85 Soles
Para hallar las frecuencias absolutas y relativas: Estadísticos / Resúmenes / Distribución de
frecuencias / seleccionar la variable: TIPO / Aceptar

MEDIA GLOBAL:
Forma 1: Con las frecuencias absolutas (ni)
MEDIA GLOBAL: (Costo promedio buses*n1 +Costo promedio combis*n2 + Costo promedio
microbuses*n3 ) / (n1 + n2 + n3 )
= 24570 / 200 = 122.85 Soles

Forma 2: Con las frecuencias relativas (hi)


26
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
MEDIA GLOBAL: (Costo promedio buses*h1 + Costo promedio combis*h2 + Costo
promedio microbuses*h3 )
= 150*0.3950 + 90*0.30 + 120*0.305 = 122.85 Soles

5. Con la información de la variable número de asientos complete las tablas y los


espacios en blanco de los enunciados que se presentan a continuación:
TABLA No. 5ª

VARIABLE MEDIDAS DE POSICIÓN


Q2 = Mediana =
NÚMERO DE ASIENTOS Q1 = P25 Q3 = P75
P50

Todos los vehículos 17.250 31.000 42.000

Importante: No usaremos el Rcomander para hallar los percentiles porque


realiza el cálculo con una fórmula distinta a la que usamos en el curso.

Hallaremos los percentiles con RStudio.


# El software R tiene 9 fórmulas diferentes para calcular los percentiles; utilizaremos
el algoritmo tipo 6
# Para calcular los percentiles: P25, P50, P75 sin generar grupos: incluimos sólo a la
variable cuantitativa; en este caso: N_ASIENTOS.
quantile(chatarreo$N_ASIENTOS,type=6)
# Si sólo quisiéramos calcular un percentil; por ejemplo el P25:
quantile(chatarreo$N_ASIENTOS,0.25,type=6)

TABLA No. 5A
MEDIDAS DE POSICIÓN
TIPO DE
VEHÍCULO Q2 = Mediana =
Q1 = P25 Q3=P753
P50
Buses 40.000 42.000 44.000

Combis 14.000 15.000 16.000

Microbuses 26.500 30.000 32.000


Importante: No usaremos el Rcomander para hallar los percentiles porque
realiza el cálculo con una fórmula distinta a la que usamos en el curso.

Hallaremos los percentiles con RStudio.


# Para calcular los percentiles: P25, P50, P75 generando grupos: incluimos a la
variable cuantitativa y a la variable cualitativa (que definirá los grupos); en este caso:
N_ASIENTOS y TIPO

27
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
tapply(chatarreo$N_ASIENTOS,chatarreo$TIPO,quantile,type=6)
# Si sólo quisiéramos el percentil 25 por grupos.
tapply(chatarreo$N_ASIENTOS,chatarreo$TIPO,quantile,0.25,type=6)

a. Para todos los vehículos: Analizando la variable número de asientos


 El valor de Q1 (Percentil 25) es igual a ………… y representa el valor
máximo del 25% inferior (vehículos con el menor número de asientos) y
también es equivalente al valor mínimo del 75% superior (vehículos con el
mayor número de asientos).

 El valor de Q3 (Percentil 75) es igual a ………… y representa el valor


mínimo del 25% superior (vehículos con el mayor número de asientos) y
también es equivalente al valor máximo del 75% inferior (vehículos con el
menor número de asientos).

b. Por tipo de vehículos: Analizando la variable número de asientos


 El valor de Q1 (Percentil 25) para los buses es igual a ………… y
representa el valor máximo del 25% inferior (buses con el menor número de
asientos) y también es equivalente al valor mínimo del 75% superior (buses
con el mayor número de asientos).

 El valor de Q3 (Percentil 75) para las combis es igual a ………… y


representa el valor mínimo del 25% superior (combis con el mayor número
de asientos) y también es equivalente al valor máximo del 75% inferior
(combis con el menor número de asientos).

6. Con la información de la variable antiguedad complete los enunciados que se


presentan a continuación:
Hallaremos los percentiles con RStudio.
# Para hallar un percentil en particular de una variable cuantitativa sin clasificar por
grupos:

28
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
quantile(chatarreo$ANTIGÜEDAD,valor del percentil,type=6)

a. El Percentil 10 de la variable antigüedad es igual a ………… años; representa el


valor máximo del ……….% inferior y es equivalente al valor mínimo del ……..% superior.
10% 90%

P10
quantile(chatarreo$ ANTIGÜEDAD,0.10,type=6)

b. El Percentil 20 de la variable antigüedad es igual a ………… años; representa el


valor máximo del ……….% inferior y es equivalente al valor mínimo del ……..% superior.
20% 80%

P20
quantile(chatarreo$ ANTIGÜEDAD,0.20,type=6)

c. El Percentil 90 de la variable antigüedad es igual a ………… años; representa el


valor máximo del ……….% inferior y es equivalente al valor mínimo del ……..% superior.
90% 10%

P90
quantile(chatarreo$ ANTIGÜEDAD,0.90,type=6)

d. El 70% central de los datos de la variable antigüedad se encuentran entre ………… años y
………… años. Estos valores representan los percentiles ………… y …………
respectivamente.
15% 70% 15%

P15 P85
quantile(chatarreo$ ANTIGÜEDAD,0.15,type=6)
quantile(chatarreo$ ANTIGÜEDAD,0.85,type=6)

7. Con la información de la variable antigüedad, desagregando con la variable cualitativa


que corresponda, complete los enunciados que se presentan a continuación:
Hallaremos los percentiles con RStudio.
# Para hallar un percentil en particular de una variable cuantitativa clasificando por
grupos:
tapply(chatarreo$ANTIGÜEDAD,chatarreo$T_COMBUSTIBLE, valor del percentil,type=6)

29
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
a. Para la variable antigüedad, en el caso de los vehículos gasolineros el valor mínimo del
10 % superior es equivalente al valor máximo del 90% inferior y es igual a …………
años; mientras que para los vehículos petroleros es igual a …………. años. Este valor
representa el Percentil……..…..
90% 10%

P90
tapply(chatarreo$ANTIGÜEDAD,chatarreo$T_COMBUSTIBLE,quantile,0.90,type=6)

b. Para la variable antigüedad de las combis el valor máximo del 20% inferior es
equivalente al valor mínimo del 80% superior y es igual a …………años. Este valor
representa el Percentil…………
20%

P20
tapply(chatarreo$ANTIGÜEDAD,chatarreo$TIPO,quantile,0.20,type=6)

PARTE 2: sobre medidas de dispersión y diagrama de cajas

8. Con la información de la variable antigüedad, desagregando por marca de


combustible, complete la tabla y los espacios en blanco de los enunciados que se
presentan a continuación:
Tabla No. 8
MARCA DE VEHÍCULO Coeficiente de Variación (CV)
Dodge 24.50
Mercedes Benz 25.95
Scania 24.57

Estadísticos / Resúmenes / Resúmenes numéricos / elegir la variable cuantitativa:


ANTIGÜEDAD / Resumir por grupos / elegir la variable cualitativa: TIPO /
Estadísticos / elegir las estadísticas que se desean obtener (en este caso Coeficiente de
variación)

Otra forma: Hallar el CV con RStudio.


Instalar el paquete raster (en la ventana 4: Packges / Install / raster / Install)
En la ventana No. 1 digitar:
# Para llamar al paquete antes instalado:
library(raster)
# Para hallar el cv para todos los vehículos (sin clasificar por grupos):
cv(chatarreo$ANTIGÜEDAD)
# Para hallar el cv para todos los vehículos (por grupos):
tapply(chatarreo$ANTIGÜEDAD,chatarreo$MARCA,cv)
30
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
#observación: escribir cv en minúscula

a. En todas las marcas de vehículos se observa para la variable antigüedad un CV


menor a 30% con lo cual podemos afirmar que existe ………….. en dichas
distribuciones.
b. Se observa mayor homogeneidad en la distribución de la variable antigüedad en la
marca …………. con un CV igual a ………… %.

9. Con la información de la variable número de asientos complete la tabla y los


espacios en blanco de los enunciados que se presentan a continuación:

Tabla No. 9A

VARIABLE Desviación Coeficiente de Tipo de


NÚMERO DE Media Mediana estándar asimetría asimetría
ASIENTOS (Pearson)

Todos los vehículos 30.16 31 11.24217 -0.2241561 negativa

# No se requiere desagregar por grupos


Estadísticos / Resúmenes / Resúmenes numéricos / elegir la variable cuantitativa: N_ ASIENTOS /
Estadísticos / elegir las estadísticas que se desean obtener (en este caso Media, mediana y desviación
estándar)

Luego de haber hallado los estadísticos: X , M e, S , calculamos el Coeficiente de Asimetría de Pearson


3 ( X −M e )
con la siguiente fórmula: ASPearson =
S

Otra forma: Hallar el coeficiente de asimetría de Pearson con RStudio.

mean(chatarreo$N_ASIENTOS)
median(chatarreo$N_ASIENTOS,tipe=6)
sd(chatarreo$N_ASIENTOS)
3*(mean(chatarreo$N_ASIENTOS)-median(chatarreo$N_ASIENTOS))/sd(chatarreo$N_ASIENTOS)
# observación: escribir mean, median y sd en minúscula.

31
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
Tabla No. 9B
Tipo de
Desviación Coeficient asimetría
TIPO DE estándar e de
Media Mediana
VEHÍCULO asimetría
(Pearson)

Buses 41.747 42.000 3.032 -0.25 negativa


Combis 15.733 15.000 2.393 0.92 positiva
Microbuses 29.344 30.000 4.004 -0.49 negativa

# Se requiere desagregar la variable cuantitativa número de asientos por tipo de vehículo.

Estadísticos / Resúmenes / Resúmenes numéricos / elegir la variable cuantitativa: N_ ASIENTOS /


Resumir por grupos / elegir la variable cualitativa: TIPO / Estadísticos / elegir las estadísticas que se
desean obtener (en este caso Media, mediana y desviación estándar)

Luego de haber hallado los estadísticos: X , M e, S , calculamos el Coeficiente de Asimetría de Pearson


3 ( X −M e )
con la siguiente fórmula: ASPearson =
S

Otra forma: Hallar el coeficiente de asimetría de Pearson con RStudio.

tapply(chatarreo$N_ASIENTOS,chatarreo$TIPO,mean)
tapply(chatarreo$N_ASIENTOS,chatarreo$TIPO,median)
tapply(chatarreo$N_ASIENTOS,chatarreo$TIPO,sd)
3*(tapply(chatarreo$N_ASIENTOS,chatarreo$TIPO,mean)-
tapply(chatarreo$N_ASIENTOS,chatarreo$TIPO,median))/
tapply(chatarreo$N_ASIENTOS,chatarreo$TIPO,sd)
# observación: escribir mean, median y sd en minúscula.

a. La distribución del número de asientos es más asimétrica en el tipo de


vehículo…………….. con un coeficiente de asimetría de Pearson igual
a……………..
b. La distribución del número de asientos es menos asimétrica en el tipo de
vehículo…………….. con un coeficiente de asimetría de Pearson igual
a……………..
c. En la distribución del número de asientos de los Microbuses se observa una
asimetría ……………..con un coeficiente de asimetría de Pearson igual
a……………..

32
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
10. Con la información de la variable antigüedad realice un diagrama de cajas y
complete los espacios en blanco de los enunciados que se presentan a continuación:
a. En la distribución de la variable antigüedad ………. (si / no) se observan valores
atípicos.
b. En la distribución de la variable antigüedad se observa asimetría ………. (negativa /
positiva) porque la media es ………. (menor / igual / mayor) que la mediana.
c. En la distribución de la variable antigüedad, se observa ………..(menor / igual /
mayor) variabilidad en el 25% superior de los datos en comparación con el 25%
inferior.

33
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
Con RStudio:

# Para generar el Diagrama de Cajas e identificar los datos atípicos:


gchatarreo=boxplot(chatarreo$ANTIGÜEDAD)
gchatarreo$out
#Para dibujar la media en el gráfico de cajas
points(mean(chatarreo$ANTIGÜEDAD),col="Red",pch=19)

# Para obtener la media:


mean(chatarreo$ANTIGÜEDAD)
# Para obtener la mediana:
median(chatarreo$ ANTIGÜEDAD)
MEDIA: 21.515
MEDIANA: 22
Media < Mediana: Se observa asimetría negativa

11. Con la información de la variable antigüedad, desagregada por marca, realice los
diagramas de cajas y complete los espacios en blanco de los enunciados que se
presentan a continuación:
a. Para la variable antigüedad, se observa mayor asimetría en la marca…………
(existe mayor distancia entre la media y la mediana).
b. Para la variable antigüedad en la marca …………se observa la mayor asimetría
negativa (la media es menor que la mediana).
c. Para la variable antigüedad, si consideramos en cada marca el cuarto (25%)
superior, se observa mayor homogeneidad en la marca …………

Con RStudio:

# Para generar el Diagrama de Cajas e identificar los datos atípicos:


gchatarreo=boxplot(chatarreo$ANTIGÜEDAD~chatarreo$MARCA)
gchatarreo$out
# Para dibujar la media en el gráfico de cajas
points(tapply(chatarreo$ANTIGÜEDAD,chatarreo$MARCA,mean),col="Red",pch=19)

# Para obtener la media:


tapply(chatarreo$ANTIGÜEDAD,chatarreo$MARCA,mean)
# Para obtener la mediana:
tapply(chatarreo$ANTIGÜEDAD,chatarreo$MARCA,median)

MEDIAge Mercedes Benz Scania

34
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
20.
NA:

OBSERVACIÓN: Guardar el archivo en R que podrá ser usado en otra sesión.


Datos / Conjunto de datos activo / Guardar el conjunto de datos activo (elegir el directorio donde
se guardara el archivo y ponerle un nuevo nombre Ejemplo: chatarreoR

Para usar el archivo chatarreoR en una próxima sesión deberá cargarse de la siguiente manera:
Datos / Cargar conjunto de datos / seleccionar el archivo chatarreoR

35
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
CASO 3: EMPRESA T_APOYO

La empresa de investigación de mercados “T_Apoyo” quiere evaluar algunas características de


usuarios de telefonía en la ciudad de Lima. Por esta razón se tomó información de una muestra de 300
usuarios de la ciudad de Lima. Las variables que se consideraron en el estudio son las siguientes:

Notación de Indique el tipo de variable


Columna Descripción de la variable
la variable (cuantitativa / cualitativa)
Género del usuario de
C1 GENERO Cualitativa
telefonía celular.
Edad (en años cumplidos)
C2 EDAD del usuario de telefonía Cuantitativa
celular.
Distrito de residencia del
usuario de telefonía celular
C3 DISTRITO (Jesús María, Miraflores, Cualitativa
San Isidro, San Miguel,
Santiago de Surco).
Empresa a la que pertenece
el usuario de telefonía
C4 EMPRESA
celular (Claro, Nextell,
Cualitativa
Telefónica).
Gasto mensual en telefonía
C5 GASTO Cuantitativa
móvil del usuario (en soles).
Quejas sobre el servicio del
C6 QUEJAS Cualitativa
usuario de telefonía celular.
UNIDAD DE ANÁLISIS: Un usuario de telefonía en la Ciudad de Lima.

Los datos recogidos se muestran en el archivo en Excel telefonia disponible en su aula virtual.
 Inicie una sesión del programa R-Studio.

library(Rcmdr)
OBSERVACION: poner library todo en minúscula.

A continuación:
 En la barra inferior de su PC aparecerá el ícono del R Comander junto al ícono del RStudio.
 Ingrese al ícono del R Comander y visualizará una ventana con las opciones que ofrece el R
Comander.

36
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
 En la ventana del R Comander se muestran los códigos que se han utilizado para obtener los
reportes solicitados.
 Tenga en cuenta que todas los reportes generados a través del R Comander aparecerán en la
ventana 3 del R Studio.

Cargue en el R Comander el archivo en Excel de la siguiente forma:


Datos / Importar datos / desde un archivo en Excel /
Luego en la ventana: Importar un conjunto de datos Excel ingrese:
 Nombre del conjunto de datos (archivo en Excel): telefonia
 Aceptar
 Seleccionar el archivo que desea cargar

Ahora podrá ver la base de datos en la opción visualizar conjunto de datos que se encuentra
debajo de las opciones de R Comander.
Adicionalmente podrá observar en la consola de R Studio (ventana No. 3) el siguiente mensaje:
El conjunto de datos herramientas tiene 300 filas y 6 columnas.

1. La empresa de investigación de mercados “T_Apoyo” señala que el gasto en telefonía


de los usuarios se clasifica en las siguientes tres categorías:
 A1: usuarios con gastos inferiores a 50 soles
 A2: usuarios con gastos de 50 o más y menos de 100 soles
 A3: usuarios con gastos de 100 soles a más
Considerando la información de las variables que correspondan, complete la tabla y los espacios
en blanco de los enunciados que se presentan a continuación:
Tabla No. 1

CATEGORÍA DE GÉNERO
TOTAL
GASTO
Femenino Masculino
A1 15 15 30

A2 73 80 153

A3 56 61 117

Total 144 156 300


Primero: Recodificamos:
Datos / Modificar variables del conjunto de datos activo / Recodificar variables
Aparece la ventana: Recodificar Variables. En esta ventana aparece la lista de variables:
Elegir la variable cuantitativa a recodificar. En este caso: GASTO que se recodificará para
generar la variabla cualitativa (FACTOR) que denominaremos: C_GASTO.

Nuevo nombre o prefijo para variables múltiples recodificadas: C_GASTO.


Introducir directrices de recofificación:
lo:49.99="bajo" 50:99.99="moderado" 100:hi="alto"
Aceptar

37
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
De esta manera aparecerá en la base de datos una columna adicional con la nueva variable
cualitativa (FACTOR) C_GASTO.

Después:
Estadísticos / Tablas de contingencia / Tabla de doble entrada / ingresar la variable que va en la
fila: C_GASTO y en la columna: GENERO

a. De los clientes de género masculino se encuentra que ……….. de ellos tienen


categoría de gasto A1 o A2; lo cual representa el……….. %
b. Del total de clientes se encuentra que ……….. de ellos son de género masculino y
tienen categoría de gasto A1 o A2; lo cual representa el ……….. %

2. Considerando la información de las variables que correspondan, complete la tabla y


los espacios en blanco de los enunciados que se presentan a continuación:
Tabla No. 2

EMPRESA TOTAL
RANGO DE EDAD
Claro Nextell Telefónica Total

25 años a más años 91 10 82 183

Menos de 25 años 68 15 34 117

159 25 116 300


Total

Primero: Recodificamos la variable EDAD para generar la variabla cualitativa (FACTOR)


Rango de edad que denominaremos: R_EDAD.
Directrices de recofificación:
lo:24.99="menos de 25 años" 25:hi="25 a más años"
Después:
Estadísticos / Tablas de contingencia / Tabla de doble entrada / ingresar la variable que va en la
fila: R_EDAD y en la columna: GENERO

a. De entre los clientes que tienen menos de 25 años de edad se encuentra que ,
……….. de ellos usan teléfonos de la empresa Claro, lo cual representa el ,………..
%
b. Del total de clientes se encuentra que ……………de ellos tienen menos de 25 años
de edad y usan teléfonos de la empresa Claro; lo cual representa el ,……….. %

38
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
3. Considerando la información sobre las variables de estudio, halle el valor de las
medidas estadísticas para completar la tabla y los espacios en blanco de los
enunciados que se presentan a continuación:
Tabla No. 3
GASTO
Medidas de tendencia central
EMPRESA
Promedio (media) Mediana

Claro 84.94 85.00

Nextell 82.12 82.00

Telefónica 103.92 101.50


Estadísticos / Resúmenes / Resúmenes numéricos / elegir la variable cuantitativa:
GASTO / Resumir por grupos / elegir la variable cualitativa: EMPRESA /
Estadísticos / elegir las estadísticas que se desean obtener (en este caso: media,
mediana o percentil 50)

Otra forma alternativa: hallar el valor de la media y la mediana con RStudio:


# Para hallar la media:
tapply(telefonia$GASTO,telefonia$EMPRESA,mean)
# Para hallar la mediana:
tapply(telefonia$GASTO,telefonia$EMPRESA,median)

a. El gasto promedio mensual de los usuarios de celular de la marca Telefónica es igual


a……………..Soles, mientras que el gasto promedio mensual de los usuarios de celular
de la marca Claro es igual a……………..Soles. Entonces, se puede afirmar que el gasto
promedio mensual de los usuarios de celular de la marca Telefónica es ……………..
(menor / igual / mayor) que el gasto promedio mensual de los usuarios de celular de la
marca Claro.

b. Teniendo en cuenta la variable gasto mensual de los usuarios de celular de la marca


Nextell ; la media es igual a …………….. Soles y la mediana igual a ……………..
Soles; es decir la media es …………….. (menor / igual / mayor) que la mediana.
Entonces podemos afirmar que …………….. (más / menos) del 50% de los datos son
mayores que la media.
50% 50%
NEXTEL:
Mediana
39
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
Media

4. Considerando la información el gasto de los usuarios de telefonía, halle el valor de


las medidas estadísticas para completar la tabla y los espacios en blanco de los
enunciados que se presentan a continuación:
Tabla No. 4
GASTO EN TELEFONÍA
DISTRITO: SAN ISIDRO
Medidas de tendencia
GENERO central

Promedio
(media) Mediana

Femenino 89.41 82.00

Masculino 90.24 89.00

Estadísticos / Resúmenes / Tabla de estadísticas/ elegir factores (VARIABLES


CUALITATIVAS: con Ctrl + ⇑ (flecha que está encima de Ctrl) elegir las variables:
DISTRITO y GENERO) / elegir la variable explicada (CUANTITATIVA): GASTO

# Elegir el estadístico (primero la Media y después la Mediana)

a. Considerando a los residentes del distrito de San Isidro, el gasto promedio de los
usuarios de telefonía de género masculino es igual a…………. mientras que el gasto
promedio de los usuarios de telefonía de género femenino es igual a ………….
Entonces podemos afirmar que el gasto de telefonía en mayor en los clientes de
género ………….

b. Considerando a los usuarios de telefonía hombres que residen en el distrito de San


Isidro, el valor que deja a su izquierda el 50% de los datos y a su derecha el otro 50%
de los datos es igual a …………. y corresponde a la estadística denominada
………….(media / mediana / moda / varianza); su valor coincide con el percentil …………
y con el cuartil …………

c. Considerando a las usuarias de telefonía mujeres que residen en el distrito de San


Isidro, el gasto promedio de telefonía es igual a…………. mientras que la mediana
del gasto de telefonía es igual a …………. Entonces podemos afirmar que ………….
(menos / más) del 50% de los datos son mayores que la media.
40
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
50% 50%
SAN ISIDRO:
MUJERES Mediana
Media

5. Considerando la información del gasto de los usuarios de telefonía, halle el valor de


las medidas estadísticas para completar la tabla y los espacios en blanco de los
enunciados que se presentan a continuación:
Tabla No. 4

GASTO
Medidas diversas de tendencia central, posición y
DISTRITO dispersión
DE No. de
RESIDENCI datos
A Promedio Mediana Desviación Coeficient
CV (media) =Q2 = estándar e de
(%) P50 asimetría
(Pearson)
Jesús María 31.63 100.20 96.00 31.70 0.3975 45
Miraflores 43.37 92.82 87.00 40.25 0.4335 60
San Isidro 36.03 90.00 87.00 32.43 0.2775 58
San Miguel 37.48 87.96 92.00 32.96 -0.3679 71
Santiago de 35.95 91.97 87.50 33.06 66
Surco 0.4056
Se requiere desagregar por grupos considerando la variable TIPO

Estadísticos / Resúmenes / Resúmenes numéricos / elegir la variable cuantitativa: GASTO / Resumir


por grupos / elegir la variable cualitativa: DISTRITO / Estadísticos / elegir las estadísticas que se
desean obtener (en este caso CV, Media, mediana y desviación estándar)

Luego de haber hallado los estadísticos: X , M e, S , calculamos el Coeficiente de Asimetría de Pearson


3 ( X −M e )
con la siguiente fórmula: ASPearson =
S

Procedimiento alternativo: Hallar las estadísticas con RStudio: CV, media, mediana, desviación
estándar y coeficiente de asimetría de Pearson.

# Para hallar el CV instalar el paquete raster:


Instalar el paquete raster (en la ventana 4: Packges / Install / raster / Install)
En la ventana No. 1 digitar:
41
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
# Para llamar al paquete antes instalado:
library(raster)
# Para hallar el CV, la media, la mediana y la desviación estándar
# Escribir en minúsculas cv, mean, median, sd, mean
tapply(telefonia$GASTO,telefonia$DISTRITO,cv)
tapply(telefonia$GASTO,telefonia$DISTRITO,mean)
tapply(telefonia$GASTO,telefonia$DISTRITO,median)
tapply(telefonia$GASTO,telefonia$DISTRITO,sd)
# Calcular el coeficiente de asimetría de Paerson
3*(tapply(telefonia$GASTO,telefonia$DISTRITO,mean)-
tapply(telefonia$GASTO,telefonia$DISTRITO,median))/
tapply(telefonia$GASTO,telefonia$DISTRITO,sd)
a. Para la variable gasto de los usuarios de telefonía en el distrito de ………. se encuentra que
el promedio es igual a ………..Soles y es menor que la mediana.

b. El CV del gasto de los usuarios de telefonía residentes en el distrito de Miraflores es igual


a …………. y evidencia una distribución …………. (homogénea / asimétrica / heterogénea).

c. Si comparamos el gasto de los usuarios de telefonía residentes en los distritos de Miraflores


y Jesús María podemos afirmar que el gasto de telefonía en el distrito de Miraflores es
…………. (más / menos / igual de) heterogéneo que el gasto de telefonía en el distrito de
Jesús María.

d. El coeficiente de asimetría de Pearson para el gasto de los usuarios de telefonía residentes


en el distrito de San Miguel es igual a …………. y evidencia una distribución ………….
(simetrica / asimetrica negativa / asimetrica positiva).

e. Analizando el coeficiente de asimetría de Pearson del gasto de los usuarios de telefonía,


desagregado por distrito, la mayor asimetría se observa en el distrito de …………. y la
menor asimetría en el distrito de ………….

f. Si comparamos el gasto de los usuarios de telefonía residentes en los distritos de San Miguel
y Santiago de Surco podemos afirmar que el gasto de telefonía en el distrito de San Miguel
tiene una asimetría …………. (menor /igual/ mayor) a la asimetría que se observa en el
Santiago de Surco.

42
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
6. Con la información de la variable edad, realice un diagrama de cajas y complete los
espacios en blanco de los enunciados que se presentan a continuación:
a. La mejor medida de tendencia central representativa de las edades en los usuarios
de la Empresa Claro es la …………..(media / moda / mediana / varianza / cv)
porque ……… (si / no) se observan valores extremos (outliers).
b. La distribución de las edades de los usuarios de la Empresa Nextell presenta
asimetría ………….. (positiva / negativa) mientras que en los usuarios de la
Empresa Telefónica se observa una asimetría……………. (positiva / negativa)
c. En la distribución de las edades de los usuarios de la Empresa Telefónica se
observa mayor heterogeneidad en el 25% ………….. (inferior / superior) de los
datos en comparación con el 25% ………….. (inferior / superior). En el diagrama
de cajas se observa que el bigote inferior es más ………..(pequeño / grande / del
mismo tamaño) que el bigote superior.
Con RStudio:

# Para generar el Diagrama de Cajas e identificar los datos atípicos:


gtelefonia=boxplot(telefonia$EDAD~ telefonia$EMPRESA)
gtelefonia$out
# Para colocar la media en el gráfico de cajas realizamos los siguiente
points(tapply(telefonia$EDAD,telefonia$EMPRESA,mean),col="Red",pch=19)

# Para obtener la media:


tapply(telefonia$EDAD,telefonia$EMPRESA,mean)
# Para obtener la mediana:
tapply(telefonia$EDAD,telefonia$EMPRESA,median)

MEDIA:
5.93711 24.60000 27.03448
MEDIANA:
Claro Nextell Telefónica
26 23 28
7. Considerando el gasto de los usuarios de telefonía, halle el valor de los percentiles
para completar los espacios en blanco de los enunciados que se presentan a
continuación:
Hallamos los percentiles con RStudio.
# Para hallar un percentil en particular de una variable cuantitativa (sin clasificar por
grupos):

43
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
quantile(telefonía$GASTO,valor del percentil,type=6)

# Para hallar un percentil en particular de una variable cuantitativa por grupos:


tapply(telefonia$GASTO,telefonia$GENERO,quantile, valor del percentil,type=6)

# El valor del percentil se debe escribir con decimales.

# Para hallar el Rango Intercuartil de una variable cuantitativa (sin clasificar por
grupos):
IQR(telefonia$variable cuantitativa,type=6)

# Para hallar Rango Intercuartil de una variable cuantitativa por grupos:


tapply(telefonia$variable cuantitativa,telefonia$GENERO,IQR,type=6)

a. El gasto máximo del 10% de usuarios de telefonía que presentan el menor gasto es el
Percentil…………..y su valor es igual a ……………Soles.
10% 90%

P10
quantile(telefonia$GASTO,0.10,type=6)

b. El gasto mínimo del 20% de usuarios de telefonía que presentan el mayor gasto es el
Percentil………….. y su valor es igual a ……………Soles.
80% 20%

P80
quantile(telefonia$GASTO,0.80,type=6)

c. El gasto mínimo del 20% de usuarios de telefonía hombres que presentan el mayor
gasto es el Percentil…………..y su valor es igual a ……………Soles.
80% 20%
usuarios hombres
P80
tapply(telefonia$GASTO,telefonia$GENERO,quantile,0.80,type=6)

44
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
d. Los valores del gasto entre los cuales se encuentran el 60% central de los usuarios de
telefonía son el Percentil ………….y el Percentil ………….. El valor de estas
medidas de posición son …………..Soles y ………….Soles, respectivamente.

20% 60% 20%

P20 P80
quantile(telefonia$GASTO,0.20,type=6)
quantile(telefonia$GASTO,0.80,type=6)

e. El valor del Rango Intercuartil para el gasto en telefonía es igual a ………….. y se


encuentra entre el Percentil ………..y el Percentil………..El valor de estas medidas
de posición son …………..Soles y ………….Soles, respectivamente.

25% 50% 25%

P25 P75
quantile(telefonia$GASTO,0.25,type=6)
quantile(telefonia$GASTO,0.75,type=6)
IQR(telefonia$GASTO,type=6)

f. El valor del Rango Intercuatil para el gasto en telefonía de las usuarias mujeres es
igual a ………….. y se encuentra entre el Percentil ………..y el Percentil…………
tapply(telefonia$GASTO,telefonia$GENERO,IQR,type=6)

OBSERVACIÓN: Guardar el archivo en R que podrá ser usado en otra sesión.


Datos / Conjunto de datos activo / Guardar el conjunto de datos activo (elegir el directorio donde se
guardara el archivo y ponerle un nuevo nombre Ejemplo: telefoniaR

Para usar el archivo telefoniaR en una próxima sesión deberá cargarse de la siguiente manera:
Datos / Cargar conjunto de datos / seleccionar el archivo telefoniaR

45
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
CASO 4: EMPRESA DATA SERVIS

* No requiere base de datos

La empresa “Data-Servis” realizó un estudio para una empresa automotriz con la finalidad de conocer
algunas características de los vehículos que utilizan los jefes de hogar tales como su categoría y
precio; el estudio se llevó a cabo en Lima Metropolitana.

1. ¿Se puede afirmar que la edad máxima de la mitad (50%) de los jefes del hogar que
tienen categoría de vehículo estándar es mayor que la de los jefes de hogar que tienen
categoría de vehículo lujoso? La mediana es mayor en los jefes del hogar que tienen
categoría de vehículo Lujoso (49.50).

Categoría de Vehículo Valor Mediana


variable :edad del jefe de hogar
Económico 29.50
Estándar 40.50
Lujoso 49.50

2. ¿En qué categoría de los vehículos los precios son más heterogéneos? (justifique su
respuesta con la medida estadística que corresponda). En la categoría Lujoso porque el
CV es el mayor (36.36 %).
Categoría de Vehículo Coeficiente Variación
variable : Precio del vehículo
Económico 23.10
Estándar 21.09
46
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
Lujoso 36.36

3. ¿Es la distribución de los precios de los automóviles más asimétrica en los clientes que tienen
vehículos de categoría estándar que los que tienen categoría lujosa? Si, porque el AS –
Pearson es mayor en la categoría Estándar (- 0.60).
Categoría de Vehículo Coeficiente Pearson
variable : Precio del vehículo
Económico 0.04 (asimetría positiva)
Estándar -0.60 (asimetría negativa)
Lujoso 0.49 (asimetría positiva)

4. Interprete los percentiles (P15, P85) de la variable edad de los clientes.


P 15=27 Es el valor máximo del 15 % inferior (27 años es la edad máxima del 15% de
clientes de menor edad).
P 85=56 Es el valor mínimo del 15 % superior (56 años es la edad mínima del 15% de
clientes de mayor edad).

5. ¿Entre que valores se encuentra el 70% central de datos de la distribución de la variable edad?
¨
15% 70% 15%

P15 P85
P15: 27 años.
P85: 56 años.

6. Comente el diagrama de cajas de la variable precio del vehículo según categoría y responda:
¿En qué categorías de los vehículos, el precio promedio es mayor a los demás? Categoría
Lujoso.

47
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
Boxplot of Precio vehiculo
100

80

Precio vehiculo
60

40

20

0
económico estándar lujoso
Categoria _vehic

7. Presentan los datos de la variable precio del vehículo, según categorías, valores atípicos u
outliers. Si es así, indique en qué categoría. ¿En este caso, qué medida de tendencia central
sería conveniente utilizar, la media o la mediana? No hay valores atípicos entonces mejor
medida de tendencia central es la media.

8. ¿En qué categoría de los vehículos la variable precio presenta mayor dispersión en el 50%
central de los datos? Justifique su respuesta. En la categoría Lujoso (el ancho de la caja es
mayor).

9. ¿En qué categoría de los vehículos la variable precio presenta menor dispersión en el 25%
superior de los datos? Justifique su respuesta. En la categoría económico (el bigote superior es
el más pequeño).

10. ¿En qué categoría de los vehículos la variable precio presenta mayor dispersión en el 25%
inferior de los datos? Justifique su respuesta. En la categoría lujoso (el bigote inferior es el
más grande).

48
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
CASO 5: LOS PRACTICANTES

En una Escuela de Negocios Internacionales los estudiantes tienen la oportunidad de realizar


prácticas brindando soporte a los proyectos de investigación que realizan los profesores
investigadores. La coordinación académica ha recabado datos asociados a un conjunto de

variables relacionadas a los mencionados practicantes en el archivoen Excel practicantes


disponible en su aula virtual. Las variables de estudio se detallan a continuación:
Notación de la Indique el tipo de variable
Columna Descripción de la variable
variable (cuantitativa / cualitativa)
Línea de investigación a la que
C1 LINEA corresponde el proyecto al cual
ha sido asignado el practicante.
Carrera a la que pertenece el
C2 CARRERA
practicante.
Evaluación del desempeño del
C3 RENDIMIENTO
practicante.
Horas de dedicación durante la
C4 HORAS
duración del proyecto.
Promedio ponderado
C5 PPA
acumulado del practicante.
Cantidad de informes
C6 INFORMES presentados por el practicante
durante el proyecto.
UNIDAD DE ANÁLISIS: Un practicante.

 Inicie una sesión del programa R.

library(Rcmdr)
OBSERVACION: poner library todo en minúscula.

49
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
A continuación:
 En la barra inferior de su PC aparecerá el ícono del R Comander junto al ícono del RStudio.
 Ingrese al ícono del R Comander y visualizará una ventana con las opciones que ofrece el R
Comander.
 En la ventana del R Comander se muestran los códigos que se han utilizado para obtener los
reportes solicitados.
 Tenga en cuenta que todas los reportes generados a través del R Comander aparecerán en la
ventana 3 del R Studio.

Cargue en el R Comander el archivo en Excel de la siguiente forma:

Datos / Importar datos / desde un archivo en Excel /


Luego en la ventana: Importar un conjunto de datos Excel ingrese:
 Nombre del conjunto de datos (archivo en Excel): practicantes
 Aceptar
 Seleccionar el archivo que desea cargar

Ahora podrá ver la base de datos en la opción visualizar conjunto de datos que se encuentra
debajo de las opciones de R Comander.
Adicionalmente podrá observar en la consola de R Studio (ventana No. 3) el siguiente mensaje:
El conjunto de datos herramientas tiene 180 filas y 6 columnas.

1. Con las variables de estudio que considere conveniente genere las tablas de
frecuencias y complete los espacios en blanco de los enunciados que se presentan a
continuación:
Estadísticos / Tablas de contingencia / Tabla de doble entrada / ingresar la variable que va en la fila:
LINEA y en la columna: RENDIMIENTO

a. En la línea de investigación dos (L2) el número de practicantes con rendimiento


bueno es igual a ……………; lo cual representa el ………..%
b. De los practicantes con rendimiento bajo, ………..de ellos corresponden a la línea
de investigación 1 (L1); lo cual representa el ………..%
c. Del total de practicantes ………..de ellos corresponden a la línea de investigación 1
(L1) y tienen rendimiento regular; lo cual representa el ………..%

2. Se sabe que los practicantes que elaboraron menos de 6 informes se les asignó la
categoría B y al resto de los practicantes a la categoría A.
Con las variables de estudio que considere conveniente genere las tablas de
frecuencias y complete los espacios en blanco de los enunciados que se presentan a
continuación:
Primero: Recodificamos:

50
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
Datos / Modificar variables del conjunto de datos activo / Recodificar variables
Aparece la ventana: Recodificar Variables. En esta ventana aparece la lista de variables:
Elegir la variable cuantitativa a recodificar. En este caso: INFORMES que se recodificará para
generar la variabla cualitativa (FACTOR) que denominaremos: CATEGORIA.

Nuevo nombre o prefijo para variables múltiples recodificadas: CATEGORIA


Introducir directrices de recofificación:
lo:5.99="categoría B" 6:hi="categoría A"
Aceptar
De esta manera aparecerá en la base de datos una columna adicional con la nueva variable
cualitativa (FACTOR) : CATEGORIA.

Después:
Estadísticos / Tablas de contingencia / Tabla de doble entrada / ingresar la variable que va en la fila:
CATEGORIA y en la columna: CARRERA

a. Del total de practicantes, se encuentra que ,……….. de ellos pertenecen a la


categoría A y son de la carrera de Negocios Internacionales; lo cual representa el
………%

b. Del total de practicantes de la Carrera de Negocios Internacionales, se encuentra


que ……….. de ellos pertenecen a la categoría A; lo cual representa el ………….%

3. Con las variables de estudio que considere conveniente halle las medidas estadísticas
que le permitan completar los espacios en blanco de los enunciados que se presentan
a continuación:

a. El menor PPA promedio corresponde a los practicantes asignados a un proyecto de la


Línea de investigación ……………. ; este promedio es igual a ……………
Estadísticos / Resúmenes / Resúmenes numéricos / elegir la variable cuantitativa: PPA / Resumir
por grupos / elegir la variable cualitativa: LINEA / Estadísticos / elegir las estadísticas que se
desean obtener (en este caso: media)

Procedimiento alternative con Rstudio.

# Media del PPA por grupos (con la variable cualitativa LINEA)

tapply(practicantes$PPA,practicantes$LINEA,mean)

b. Analizando la variable horas de dedicación, hay un 20% de practicantes que


dedicaron más horas a los proyectos en los que fueron asignados (20% superior) a los

51
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
que se les denominó Grupo A . El tiempo mínimo de dedicación de un practicante de
este grupo es igual a ………….. horas y representa el Percentil…………
80% 20%

P80
Con RStudio:
quantile(practicantes$HORAS,0.80,type=6)

c. De los practicantes de la carrera de Negocios Internacionales, el PPA que debe


tener como mínimo un practicante para ser parte del décimo superior (10% de
practicantes con mayor PPA) es igual a ………….. y representa el Percentil…………
90% 10%

P90

Con RStudio:
tapply(practicantes$PPA,practicantes$CARRERA,quantile,0.90,type=6)

d. La variación relativa de las horas de dedicación de los practicantes de la Carrrea


de Negocios Internacionales es igual a………….% y para los practicantes de la
Carrera de Administración es igual a……………..%. Por tanto, se puede afirmar
que en la distribución de los datos de la variable horas dedicación existe ……………
(menor / igual / mayor) homogeneidad en los practicantes de la Carrera de Negocios
Internacionales en comparación los practicantes de la Carrera de Administración.
Estadísticos / Resúmenes / Resúmenes numéricos / elegir la variable cuantitativa:
HORAS / Resumir por grupos / elegir la variable cualitativa: CARRERA /
Estadísticos / elegir las estadísticas que se desean obtener (en este caso: cv)

Procedimiento alternativo con RStudio:


library(raster)
# Coeficiente de Variación del PPA por grupos (con la variable cualitativa CARRERA)

tapply(practicantes$HORAS, practicantes$CARRERA,cv)
# las iniciales del Coeficiente de Variación se escriben en minúscula

e. En la Línea de Investigación uno (L1), la variación relativa de las horas de


dedicación de los practicantes de la Carrrea de Negocios Internacionales es igual

52
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
a………….% y evidencia …………..(homogeneidad / heterogeneidad / variabilidad)
en la distribución de la variable de estudio.
# Para llamar el CV instalar el paquete raster:
Instalar el paquete raster (en la ventana 4: Packges / Install / raster / Install)
En la ventana No. 1 digitar:
# Para llamar al paquete antes instalado:
library(raster)

Estadísticos / Resúmenes / Tabla de estadísticas/ elegir factores (VARIABLES


CUALITATIVAS: con Ctrl + Alt elegir dos variables: LINEA y CARRERA) / elegir
la variable explicada (CUANTITATIVA): HORAS
Elegir el estadístico : en este caso:Otro (especificar): cv
Observación: escribir cv (en minúscula)

Con RStudio:
DIV_LINEA =split(practicantes,practicantes$`LINEA`)

# Para llamar al paquete antes instalado:


library(raster)
tapply(DIV_LINEA$L1$HORAS,DIV_LINEA$L1$CARRERA,cv)

OBSERVACIÓN: Guardar el archivo en R que podrá ser usado en otra sesión.


Datos / Conjunto de datos activo / Guardar el conjunto de datos activo (elegir el directorio donde se
guardara el archivo y ponerle un nuevo nombre Ejemplo: practicantesR

Para usar el archivo practicantesR en una próxima sesión deberá cargarse de la siguiente manera:
Datos / Cargar conjunto de datos / seleccionar el archivo practicantesR

53
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
CASO 6: EVALUACIÓN DE PRACTICANTES

En un estudio realizado en la Empresa Alfa SRL para evaluar el desempeño de sus practicantes
(estudiantes universitarios y recién egresados) en las áreas operativas de las empresas del grupo
(Calidad, Compra, Logística, Producción) que operan a nivel nacional, se recabaron datos de una
muestra, considerándose las siguientes variables para el análisis:

Indique el tipo
Notación de la de variable
Columna Descripción de la variable
variable (cuantitativa /
cualitativa)
Área operativa de la empresa: Calidad,
C1 AREA Compras, Logística y Producción.

Tipo de universidad donde estudia el


TIPO
C2 practicante: nacional, privada.

Calificación del cumplimiento, asignado por el


responsable del área de recursos humanos, al
desempeño del practicante:
A: Muy por encima de las expectativas.
C3 EVALUACION
B: Por encima de las expectativas.
C: Por debajo de las expectativas.
D: Muy por debajo de las expectativas.

Tiempo (meses) de realización de las


C4 TIEMPO prácticas.

Monto de pago (nuevos soles) que brinda la


C5 PAGO empresa al practicante.

Género del practicante: Hombre, mujer.


C6 GENERO
Edad de practicante en años cumplidos.
C7 EDAD
Experiencia laboral previa del practicante: si,
C8 EXPERIENCIA
no.
Los datos recopilados se presentan en el archivo en Excel evaluac disponible en su aula virtual.
54
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
UNIDAD DE ANÁLISIS: Un practicante.

NOTA: Los niveles de pago a los practicantes corresponden a los siguientes rangos:

Pago Nivel pago


Menor a 1200 Soles Nivel 1
Mayor o igual a 1200 Soles y
Nivel 2
menor a 1260 Soles
Mayor o igual a 1260 Nivel 3

 Inicie una sesión del programa R-Studio.

library(Rcmdr)
OBSERVACION: poner library todo en minúscula.

A continuación:
 En la barra inferior de su PC aparecerá el ícono del R Comander junto al ícono del RStudio.
 Ingrese al ícono del R Comander y visualizará una ventana con las opciones que ofrece el R
Comander.
 En la ventana del R Comander se muestran los códigos que se han utilizado para obtener los
reportes solicitados.
 Tenga en cuenta que todas los reportes generados a través del R Comander aparecerán en la
ventana 3 del R Studio.

Cargue en el R Comander el archivo en Excel de la siguiente forma:


Datos / Importar datos / desde un archivo en Excel /
Luego en la ventana: Importar un conjunto de datos Excel ingrese:
 Nombre del conjunto de datos (archivo en Excel): evaluac
 Aceptar
 Seleccionar el archivo que desea cargar
Ahora podrá ver la base de datos en la opción visualizar conjunto de datos que se encuentra
debajo de las opciones de R Comander.
Adicionalmente podrá observar en la consola de R Studio (ventana No. 3) el siguiente mensaje:
El conjunto de datos herramientas tiene 200 filas y 8 columnas.

1. Con las variables que considere conveniente genere las tablas de frecuencias y
complete los espacios en blanco de los enunciados que se presentan a continuación:
Primero: Realizamos dos recodificaciones:
Primera recodificación:
Datos / Modificar variables del conjunto de datos activo / Recodificar variables
Aparece la ventana: Recodificar Variables. En esta ventana aparece la lista de variables:
Elegir la variable cuantitativa a recodificar. En este caso: PAGO que se recodificará para generar
la variabla cualitativa Nivel de Pago (FACTOR) que denominaremos: N_PAGO.

Nuevo nombre o prefijo para variables múltiples recodificadas: N_PAGO.


Introducir directrices de recofificación:
lo:1199.99="Nivel 1" 1200:1259.999="Nivel 2" 1260:hi="Nivel 3"
Aceptar

55
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
De esta manera aparecerá en la base de datos una columna adicional con la nueva variable
cualitativa (FACTOR) N_PAGO.

Segunda recodificación:
Datos / Modificar variables del conjunto de datos activo / Recodificar variables
Aparece la ventana: Recodificar Variables. En esta ventana aparece la lista de variables:
Elegir la variable cuantitativa a recodificar. En este caso: EDAD que se recodificará para generar
la variabla cualitativa (FACTOR) que denominaremos: R_EDAD.

Nuevo nombre o prefijo para variables múltiples recodificadas: R_EDAD.


Introducir directrices de recofificación:
lo:23.99="menos de 24 años" 24:hi="24 años o más"
Aceptar
De esta manera aparecerá en la base de datos una columna adicional con la nueva variable
cualitativa (FACTOR) R_EDAD.

Estadísticos / Tablas de contingencia / Tabla de doble entrada / ingresar la variable que va en la fila:
N_PAGO y en la columna: R_EDAD

a. Del total de practicantes que conforman la muestra el número de practicantes que


tienen nivel de pago 3 y son menores a 24 años es igual a………..; lo cual
representa el ……….%

b. Del total de practicantes con un nivel de pago 2, el número de practicantes que tienen
menos de 24 años es igual a………..; lo cual representa el ……….%

2. Con las variables de estudio que considere conveniente calcule las medidas de
tendencia central y de posición para completar los espacios en blanco de los
enunciados que se presentan a continuación:

a. Para los practicantes en general, el pago promedio es igual a ………..Soles y la


mediana es igual a …………Soles. Con estos resultados podemos afirmar que
…………..(menos / más) del 50% de los datos correspondientes al pago son menores
que la media. Esta situación ocurre cuando la media es menor que la …………...
(mediana / varianza / desviación estándar).
50% 50%

Mediana
Media

56
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
Estadísticos / Resúmenes / Resúmenes numéricos / elegir la variable cuantitativa:
PAGO / Estadísticos / elegir las estadísticas que se desean obtener (en este caso:
Media y mediana)
Procedimiento alternativo con RStudio:
mean(evaluac$PAGO)
median(evaluac$PAGO)

b. Para los practicantes del área de calidad el pago promedio es igual a ………..Soles
y la mediana es igual a …………Soles. Con estos resultados podemos afirmar que
…………..(menos / más) del 50% de los datos correspondientes al pago son menores
que la media. Esta situación ocurre cuando la media es ………….. (menor / igual /
mayor) que la mediana.
50% 50%
Area:
calidad Mediana
Media
Estadísticos / Resúmenes / Resúmenes numéricos / elegir la variable cuantitativa: PAGO /
Resumir por grupos / elegir la variable cualitativa: AREA / Estadísticos / elegir las estadísticas
que se desean obtener (en este caso: media y mediana)

Procedimiento alternativo con RStudio:


tapply(evaluac$PAGO,evaluac$AREA,mean)
tapply(evaluac$PAGO,evaluac$AREA,median)

c. Para los practicantes en general, el pago (sin distinguir el nivel de pago), el 80%
central de los datos se encuentra entre …………Soles y ………..Soles; estas medidas
de posición representan el Percentil…………..y el Percentil…………...

10% 80% 10%

P10 P90
Con RStudio:
quantile(evaluac$PAGO,0.10,type=6)
quantile(evaluac$PAGO,0.90,type=6)

d. De las practicantes mujeres, el tiempo de práctica mínimo por encima del cual se
encuentra el 25% de practicantes con mayor tiempo de práctica (25% superior) es
igual a……………años.
75% 25%
Mujeres
P75=Q3

57
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
Con RStudio:
tapply(evaluac$TIEMPO,evaluac$GENERO,quantile,0.75,type=6)

3. Con las variables de estudio que considere conveniente calcule las medidas de
dispersión para completar los espacios en blanco de los enunciados que se presentan
a continuación:

a. En el área de …………. se observa mayor homogeneidad en la distribución de la


variable pago a los practicantes con un Coeficiente de Variación igual a
……………..%.
Estadísticos / Resúmenes / Resúmenes numéricos / elegir la variable cuantitativa:
PAGO / Resumir por grupos / elegir la variable cualitativa: AREA / Estadísticos /
elegir las estadísticas que se desean obtener (en este caso: cv)

Procedimiento alternativo con RStudio:


library(raster)
tapply(evaluac$PAGO,evaluac$AREA,cv)

b. Para las practicantes mujeres. En el área de ………….……. se observa mayor


homogeneidad en la distribución de la variable pago a los practicantes con un
Coeficiente de Variación igual a ………..……..%.
Estadísticos / Resúmenes / Tabla de estadísticas/ elegir factores (VARIABLES
CUALITATIVAS: con Ctrl + Alt elegir dos variables: GENERO y AREA) / elegir la
variable explicada (CUANTITATIVA): PAGO
Elegir el estadístico : en este caso:Otro (especificar): cv
# Escribir cv (en minúscula)
# para obtener el cv primero fue necesario instalar el paquete raster y llamarlo:
library(raster)

Procedimiento alternativo con RStudio:


DIV_GENERO=split(evaluac,evaluac$`GENERO`)
library(raster)
tapply(DIV_GENERO$mujer$PAGO, DIV_GENERO$mujer$AREA, cv)

c. Supongamos que el grupo empresarial decide aumentar el pago a todos los practicantes en
general en 10% y otorgarles un bono por movilidad de S/. 100 soles. Entonces, la nueva

58
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
media y la nueva varianza del pago a los practicantes después de dicho aumento son iguales
a………………Soles y …………………Soles2, respectivamente.

Y = Nuevo pago a los practicantes después del incremento salarial.


Y = X + 0.10X + 100 = 1.10X + 100
Hallar la media y la varianza antes del incremento salarial.

Estadísticos / Resúmenes / Resúmenes numéricos / elegir la variable cuantitativa:


PAGO / Estadísticos / elegir las estadísticas que se desean obtener (en este caso:
Media y desviación estándar). Para hallar la varianza se elava al cuadrado la
desviación estándar.
Procedimiento alternativo con RStudio:
mean(evaluac$PAGO)
library(raster)
var(evaluac$PAGO)

M(X)= ………………….. Soles


V(X) =……………. Soles2

Para hallar la nueva media y varianza después del incremento salarial.

M (Y) = M ( 1.10 X + 100) = 1.10M(X) + M(100) =

V (Y) = M ( 1.10 X + 100) = 1.102 V(X) + 0 =

d. Supongamos que el grupo empresarial decide aumentar el pago a todos los practicantes del
área de calidad en 10% y otorgarles un bono por movilidad de S/. 100 soles. Entonces, la
nueva media y la nueva varianza del pago a los practicantes del área de calidad después de
dicho aumento son iguales a………………Soles y …………………Soles 2, respectivamente.

Y = Nuevo pago a los practicantes del Área de Calidad después del incremento salarial.
Y = X + 0.10X + 100 = 1.10X + 100
M(X)= ………………….. Soles
V(X) =……………. Soles2
Estadísticos / Resúmenes / Resúmenes numéricos / elegir la variable cuantitativa:
PAGO / Resumir por grupos / elegir la variable cualitativa: AREA / Estadísticos /
elegir las estadísticas que se desean obtener (en este caso: cv)

Procedimiento alternativo con RStudio:


# Para obtener la media y la varianza de la variable PAGO por AREA.
tapply(evaluac$PAGO,evaluac$AREA,mean)
library(raster)
tapply(evaluac$PAGO,evaluac$AREA,var)

59
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
Hallar la nueva media y varianza después del incremento salarial (Area de Calidad).

M (Y) = M ( 1.10 X + 100) = 1.10M(X) + M(100) =

V (Y) = M ( 1.10 X + 100) = 1.102 V(X) + 0 =

4. Con la información de la variable pago a los practicantes, generando grupos con la variable
cualitativa que considere conveniente, realice un diagrama de cajas y complete los espacios
en blanco de los enunciados que se presentan a continuación:

a. En la distribución del pago a los practicantes hombres …………..(si / no) se observan


datos atpipicos (outliers). Asimismo, se evidencia menor dispersión en el 25% ………….
(superior / inferior) de los datos.

b. En la distribución del pago a los practicantes mujeres …………..(si / no) se observan


datos atpipicos (ortliers). Asimismo, se evidencia mayor dispersión en el 25% ………….
(superior / inferior) de los datos.
Con RStudio:

# Para generar el Diagrama de Cajas e identificar los datos atípicos:


gevaluac=boxplot(evaluac$PAGO~evaluac$GENERO)
gevaluac$out
# Para colocar el punto con el valor de la media en el gráfico
points(tapply(evaluac$PAGO, evaluac$GENERO,mean),col="Red",pch=19)

# Para hallar la media y la mediana


tapply(evaluac$PAGO,evaluac$GENERO,mean)
tapply(evaluac$PAGO,evaluac$GENERO,median)
MEDIA:
Hombres: 1405.407
Mujeres: 1383.220
MEDIANA:
Hombre: 1415
Mujer: 1415

OBSERVACIÓN: Guardar el archivo en R que podrá ser usado en otra sesión.


Datos / Conjunto de datos activo / Guardar el conjunto de datos activo (elegir el directorio donde se
guardara el archivo y ponerle un nuevo nombre Ejemplo: evaluacR

Para usar el archivo evaluacR en una próxima sesión deberá cargarse de la siguiente manera:
Datos / Cargar conjunto de datos / seleccionar el archivo evaluacR

60
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
61
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
CASO 7: PYMES

La importancia que tienen actualmente en la economía, tanto las pequeñas y medianas empresas
(PYMES) como los emprendedores, es fundamental, ya que su aporte en la generación de riqueza para
cualquier país es innegable, particularmente en la contribución a la apertura de puestos de trabajo, así
lo afirma la Organización para la Cooperación y el Desarrollo Económicos (OCDE). De acuerdo con
el reporte “Financiamiento de pymes y emprendedores 2018”, realizado por la OCDE, en sus países
miembros las pymes y los emprendedores constituyen la columna vertebral de las economías de esos
países y son fundamentales para fortalecer la productividad, generar un crecimiento más inclusivo y
adaptarse a mega tendencias como la nueva revolución industrial y un perfil cambiante del trabajo. A
continuación, se describe las variables de estudio correspondientes a una muestra de pequeñas y
medianas empresas (PYMES) dedicadas al sector construcción:

Indique el
Descripción de la variable tipo de
Column Notación de la
variable
a variable
(cuantitativa /
cualitativa)
Vigilancia de la salud: actividad preventiva que toda empresa.
C1 ESTADO Inspección de la estructura de la empresa.
1: vigilancia 2: inspección
El activo no corriente es una parte del activo y aparece dentro del
C2 ACTIVO_NO balance de situación de una empresa (maquinaria, construcciones,
CORRIENTE vehículos o terrenos). En soles.
El activo son los bienes, derechos y otros recursos de los que
C3 ACTIVO dispone una empresa (muebles). En soles.
El pasivo corriente o pasivo circulante es la parte del pasivo que
PASIVO_ contiene las obligaciones a corto plazo de una empresa, es decir, las
C4
CORRIENTE deudas y obligaciones que tienen una duración menor a un año. En
soles.

El pasivo está compuesto por la financiación de la empresa y las


C5 PASIVO obligaciones de pago frente a terceros. En soles.
El patrimonio es el conjunto de bienes y derechos, cargas y
C6 PATRIMONIO obligaciones, pertenecientes a una persona, física o jurídica. En
soles.
PASIVO_Y_ El Pasivo y patrimonio son las fuentes de financiación de la
C7
PATRIMONIO empresa. En soles.
La utilidad operacional es el resultado de tomar los
C8 ingresos operacionales y restarle los costos y gastos operacionales.
UTILIDAD En soles.
62
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
Tamaño de la PYME:
C9 TAMAÑO 1: Pequeña empresa 2: Mediana empresa
Los datos recopilados se presentan en el archivo en Excel PYMES disponible en su aula virtual.

UNIDAD DE ANÁLISIS:Una Pyme.

 Inicie una sesión del programa R-Studio.

library(Rcmdr)
OBSERVACION: poner library todo en minúscula.

A continuación:
 En la barra inferior de su PC aparecerá el ícono del R Comander junto al ícono del RStudio.
 Ingrese al ícono del R Comander y visualizará una ventana con las opciones que ofrece el R
Comander.
 En la ventana del R Comander se muestran los códigos que se han utilizado para obtener los
reportes solicitados.
 Tenga en cuenta que todas los reportes generados a través del R Comander aparecerán en la
ventana 3 del R Studio.

Cargue en el R Comander el archivo en Excel de la siguiente forma:


Datos / Importar datos / desde un archivo en Excel /
Luego en la ventana: Importar un conjunto de datos Excel ingrese:
 Nombre del conjunto de datos (archivo en Excel): pymes
 Aceptar
 Seleccionar el archivo que desea cargar
Ahora podrá ver la base de datos en la opción visualizar conjunto de datos que se encuentra
debajo de las opciones de R Comander.
Adicionalmente podrá observar en la consola de R Studio (ventana No. 3) el siguiente mensaje:
El conjunto de datos herramientas tiene 136 filas y 9 columnas.

1. Con las variables de estudio que considere conveniente genere las tablas de
frecuencias y complete los espacios en blanco de los enunciados que se presentan a
continuación:

Estadísticos / Tablas de contingencia / Tabla de doble entrada / ingresar la variable que va en


la fila: TAMAÑO y en la columna: ESTADO

a. De las empresas medianas, ……………de ellas se encuentran en estado de vigilancia;


lo cual representa el …………….%

b. Considerando solo a las empresas que se encuentran en estado de inspección,


………….de ellas son empresas pequeñas; lo cual representa el …………….%

2. Elabore la gráfica y elija las variables que considere conveniente para completar los
espacios en blanco en los enunciados que se presentan a continuación:

63
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
Con RStudio.
# Para generar el Diagrama de Cajas e identificar los datos atípicos:
gpymes=boxplot(pymes$UTILIDAD~pymes$ESTADO)
gpymes$out

# Para obtener la media por ESTADO de la pyme:


tapply(pymes$UTILIDAD,pymes$ESTADO,mean)
# Para obtener la mediana por ESTADO de la pyme:
tapply(pymes$UTILIDAD,pymes$ESTADO,median)

Media:
inspeccion vigilancia
177192.2 171704.1
Mediana:
inspeccion vigilancia
169290.5 155102.0

a. En la distribución de la variable utilidad operacional de las empresas que presentan


el estado de vigilancia …………..(si / no) se observan valores atípicos u outliers por
lo cual la medida adecuada de tendencia central es la…………….(media, mediana,
moda). Asimismo se observa una asimetría…………….(mediana, moda, moderada).

b. En la distribución de la variable utilidad operacional de las empresas que presentan


el estado de inspección …………..(si / no) se observan valores atípicos u outliers por
lo cual la medida adecuada de tendencia central es la…………….(media, mediana,
moda). Asimismo se observa una asimetría…………….(mediana, moda, moderada).

64
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
3. Con las variables de estudio que considere conveniente halle el valor de las
estadísticas para completar los espacios en blanco de los enunciados que se presentan
a continuación:

a. Se tiene conocimiento que el patrimonio de las medianas empresas se ha incrementado en


un 15 % más 10000 Soles, Entonces después de este incremento del patrimonio de las
medianas empresas la nueva media es igual a ……….……….Soles y la nueva varianza es
igual a………………………..Soles2
Y = Nuevo Patrimonio de las medianas empresas después del incremento.
Y = 1.15X + 10000.
M(X)= ………………….. Soles
V(X) =……………. Soles2

Estadísticos / Resúmenes / Resúmenes numéricos / elegir la variable cuantitativa:


PATRIMONIO / Resumir por grupos / elegir la variable cualitativa: TAMAÑO /
Estadísticos / elegir las estadísticas que se desean obtener (en este caso: media y
mediana)

Procedimiento alternativo con RStudio.


# Para obtener la media y la mediana de la variable PATRIMONIO por TAMAÑO de
la pyme

tapply(pymes$PATRIMONIO,pymes$TAMAÑO,mean)
tapply(pymes$PATRIMONIO,pymes$TAMAÑO,median)

b. Para las empresas pequeñas, el patrimonio promedio es igual a……………Soles y


la mediana es igual a …………….Soles. Entonces podemos afirmar que …………
(más, menos) del 50% de los datos son mayores que la media.

50% 50%
PATRIMONIO:
Pequeñas Empresas Mediana
Media

c. El patrimonio promedio de las empresas pequeñas que se encuentran en estado


de vigilancia es igual a……………………..Soles.
Estadísticos / Resúmenes / Tabla de estadísticas/ elegir factores (VARIABLES
CUALITATIVAS: con Ctrl + Alt elegir dos variables: TAMAÑO y ESTADO) /
elegir la variable explicada (CUANTITATIVA): PATRIMONIO
Elegir el estadístico : en este caso: Media

65
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
d. La distribución de la variable patrimonio presenta menor heterogeneidad en las
empresas de tamaño ……………(pequeñas / medianas) con un coeficiente de
variación igual a……………..
Estadísticos / Resúmenes / Resúmenes numéricos / elegir la variable cuantitativa:
PATRIMONIO / Resumir por grupos / elegir la variable cualitativa: TAMAÑO /
Estadísticos / elegir las estadísticas que se desean obtener (en este caso
Coeficiente de variación)

Procedimiento alternative con RStudio


Instalar el paquete raster (en la ventana 4: Packges / Install / raster / Install)
En la ventana No. 1 digitar:
# Para llamar al paquete antes instalado:
library(raster)
# Para hallar la moda clasificando por grupos:
tapply(pymes$PATRIMONIO,pymes$TAMAÑO,cv)
#observación: escribir cv en minúscula

e. La utilidad operacional mínima del 10% de las empresas que presentan mayor
utilidad es igual a …………….Soles. Este valor es el Percentil…………
90% 10%
Todas las empresas
P90
Con RStudio:
quantile(pymes$UTILIDAD,0.90,type=6)

f. La utilidad operacional mínima del 15% de las empresas medianas que


presentan mayor utilidad es igual a …………….Soles. Este valor es el
Percentil…………
85% 15%
Mediana empresas
P85
Con RStudio:
tapply(pymes$ UTILIDAD, pymes$TAMAÑO,quantile,0.85,type=6)

OBSERVACIÓN: Guardar el archivo en R que podrá ser usado en otra sesión.


Datos / Conjunto de datos activo / Guardar el conjunto de datos activo (elegir el directorio donde
se guardara el archivo y ponerle un nuevo nombre Ejemplo: pymesR

Para usar el archivo pymesR en una próxima sesión deberá cargarse de la siguiente manera:
Datos / Cargar conjunto de datos / seleccionar el archivo pymesR

66
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
CASO 8: ALFA

En la fábrica ALFA se seleccionaron a 200 operarios que fueron divididos en 2 grupos para participar
en un curso de capacitación; los operarios del grupo 1 fueron capacitados con la técnica A y los
operarios del grupo 2 con la técnica B. El objetivo de la capacitación fue disminuir el tiempo que
emplean los operarios para realizar una actividad considerada de gran importancia en el proceso de
producción. Terminada la capacitación, se le pidió a cada operario de cada grupo que procediese a
realizar la actividad y se registró el tiempo correspondiente. A continuación se indican las variables
de este estudio:

Indique el tipo
Notación de Descripción de la variable de variable
Columna
la variable (cuantitativa /
cualitativa)

C1 GENERO Género del operario: hombre, mujer.

Técnica con la que fue capacitado el


C2 operario: A, B.
TECNICA

Tiempo que demoró el operario en realizar la


C3 TIEMPO actividad (en minutos).

67
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
Utilizando la base de datos en Excel alfa disponible en el aula virtual, responda las siguientes
preguntas, justificando su respuesta numéricamente con las medidas estadísticas correspondientes.

 Inicie una sesión del programa R-Studio.

library(Rcmdr)
OBSERVACION: poner library todo en minúscula.

A continuación:
 En la barra inferior de su PC aparecerá el ícono del R Comander junto al ícono del RStudio.
 Ingrese al ícono del R Comander y visualizará una ventana con las opciones que ofrece el R
Comander.
 En la ventana del R Comander se muestran los códigos que se han utilizado para obtener los
reportes solicitados.
 Tenga en cuenta que todas los reportes generados a través del R Comander aparecerán en la
ventana 3 del R Studio.

Cargue en el R Comander el archivo en Excel de la siguiente forma:


Datos / Importar datos / desde un archivo en Excel /
Luego en la ventana: Importar un conjunto de datos Excel ingrese:
 Nombre del conjunto de datos (archivo en Excel): alfa
 Aceptar
 Seleccionar el archivo que desea cargar
Ahora podrá ver la base de datos en la opción visualizar conjunto de datos que se encuentra
debajo de las opciones de R Comander.
Adicionalmente podrá observar en la consola de R Studio (ventana No. 3) el siguiente mensaje:
El conjunto de datos herramientas tiene 200 filas y 3 columnas.

1. Identifique la población, la muestra y la unidad de análisis que corresponden a este


caso.
a. Población (N): Todos los operarios de la Fábrica Alfa.
b. Muestra (n): 200 operarios de la Fábrica Alfa.
c. Unidad de análisis: Un operario de la Fábrica Alfa.

2. Con la variable Tiempo que demoró el operario en realizar la actividad asignada,


complete la tabla y los espacios en blanco que se presentan a continuación:
Coeficiente Desviación Coeficiente
TECNICA de Moda Media Mediana Estándar de
de variación asimetría
Capacitació de Pearson
n

A 17.81 11 35.575 34.500 6.335 0.5092992

B 16.31 8 34.543 34.000 5.633 0.2889324

68
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
Estadísticos / Resúmenes / Resúmenes numéricos / elegir la variable cuantitativa: TIEMPO / Resumir
por grupos / elegir la variable cualitativa:TECNICA / Estadísticos / elegir las estadísticas que se
desean obtener (en este caso CV, Media, mediana y desviación estándar)

Luego de haber hallado los estadísticos: X , M e, S , calculamos el Coeficiente de Asimetría de Pearson


3 ( X −M e )
con la siguiente fórmula: ASPearson =
S

Procedimiento alternativo: Hallar las estadísticas con RStudio: CV, media, mediana, desviación
estándar y coeficiente de asimetría de Pearson.

# Para calcular la Moda instalar el paquete DescTools:


Instalar el paquete DescTools (en la ventana 4: Packges / Install / DescTools / Install)
# Para llamar al paquete antes instalado:
library(DescTools)
# Para hallar la moda por grupos:
tapply(alfa$TIEMPO,alfa$TECNICA,Mode)
# Escribir en mayúscula la primera letra de Mode

# Para calcular el CV instalar el paquete raster:


Instalar el paquete raster (en la ventana 4: Packges / Install / raster / Install)
En la ventana No. 1 digitar:
# Para llamar al paquete antes instalado:
library(raster)

# Para hallar el coeficiente de variación, la media, la mediana y la desviación estándar


# Escribir en minúsculas cv, mean, median, sd

# Para hallar el coeficiente de variación, la media, mediana y desviación estándar por grupos:
tapply(alfa$TIEMPO,alfa$TECNICA,cv)
tapply(alfa$TIEMPO,alfa$TECNICA,mean)
tapply(alfa$TIEMPO,alfa$TECNICA,median)
tapply(alfa$TIEMPO,alfa$TECNICA,sd)

# Para calcular el coeficiente de asimetría de Paerson


3*(tapply(alfa$TIEMPO,alfa$TECNICA,mean)-
tapply(alfa$TIEMPO,alfa$TECNICA,median))/
tapply(alfa$TIEMPO,alfa$TECNICA,sd)
a. La distribución del tiempo correspondiente a los operarios capacitados con la técnica A es
………….. (más, menos, igual de) homogénea que la distribución del tiempo
correspondiente a los operarios capacitados con la técnica B, con un coeficiente de
variación igual a ………….%.

69
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
b. La distribución del tiempo correspondiente a los operarios capacitados con la técnica
A es ………….. (más, menos, igual de) asimétrica que la distribución del tiempo
correspondiente a los operarios capacitados con la técnica B.

c. La distribución del tiempo correspondiente a los operarios capacitados con la técnica A


presenta una asimetría ………….. (negativa / positiva) con un coeficiente de asimetría de
Parson igual a………………

d. Los operarios que corresponden al 50% central de los datos, emplearon un tiempo de entre
…………… y ……………. minutos para realizar la actividad asignada. Estos valores
representan el Percentil……………..y el Percentil………….., respectivamente.

25% 25% 25% 25%


Todas los operarios
P25=Q1 P50=Q2=Me P75=Q3
Con RStudio:
quantile(alfa$TIEMPO,0.25,type=6)
quantile(alfa$TIEMPO,0.75,type=6)

e. Más del 50% de los operarios capacitados con la técnica A registraron un tiempo para
realizar la actividad……………. (menor / mayor / igual) a la media muestral. Esta
situación ocurre cuando la media es mayor que la …………..(mediana / desviación
estánar / cv)
50% 50%

Mediana
Media

3. Con la variable tiempo que demoró el operario en realizar la actividad asignada, halle
los percentiles que correspondan y complete los espacios en blanco que se presentan
a continuación:

Hallamos los percentiles con RStudio.


# Para hallar un percentil en particular de una variable cuantitativa (sin clasificar por
grupos):
quantile(alfa$TIEMPO,valor del percentil,type=6)

70
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
# Para hallar un percentil en particular de una variable cuantitativa por grupos:
tapply(alfa$TIEMPO,alfa$TECNICA,quantile, valor del percentil,type=6)
# El valor del percentil se debe escribir en decimales.

a. El tiempo máximo que demoraron el 10 % de los operarios considerados más


eficientes en realizar la tarea asignada fue igual a …………minutos. Este valor
representa el Percentil……………
quantile(alfa$TIEMPO,0.10,type=6)
10% 90%
Todos los
operarios P10

b. El tiempo máximo que demoraron el 10 % de los operarios hombres considerados


más eficientes en realizar la tarea asignada fue igual a …………minutos. Este valor
representa el Percentil……………
tapply(alfa$TIEMPO,alfa$GENERO,quantile,0.10 ,type=6)

Operarios 10% 90%


hombres
P10

c. El 70% central de los operarios hombres demoraron un tiempo de entre


…………..minutos y ……………minutos en realizar la tarea asignada. Estos valores
representan el Percentil…………… y el Percentil……………,, respectivamente.
Operarios 15% 70% 15%
hombres
P15 P85
tapply(alfa$TIEMPO,alfa$GENERO,quantile,0.15,type=6)
tapply(alfa$TIEMPO,alfa$GENERO,quantile,0.85 ,type=6)

71
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
4. Realizando un diagrama de cajas del tiempo que demoraron los operarios en
realizar la tarea asignada, clasificando según la variable cualitativa GENERO,
complete los espacios en blanco que se presentan a continuación:

a. En la distribución del tiempo que demoraron los operarios hombres en realizar la


tarea asignada …………(si / no) se observa la presencia de valores atípicos (outliers).

b. En la distribución del tiempo que demoraron las operarias mujeres en realizar la


tarea asignada …………(si / no) se observa la presencia de valores atípicos (outliers).
En este grupo se observa asimetría………….(negativa / positiva)
Con RStudio.
# Para generar el Diagrama de Cajas e identificar los datos atípicos:
galfa=boxplot(alfa$TIEMPO~alfa$GENERO)
galfa$out
# Para mostrar la media en el diagrama de caja
points(tapply(alfa$TIEMPO,alfa$GENERO,mean),col="Red",pch=19)

# Para obtener la media por GENERO del operario:


tapply(alfa$TIEMPO,alfa$GENERO,mean)
# Para obtener la mediana por GENERO del operario:
tapply(alfa$TIEMPO,alfa$GENERO,median)

MEDIA:
Hombre Mujer
35.078 35.106
MEDIANA:
Hombre Mujer
35 34

OBSERVACIÓN: Guardar el archivo en R que podrá ser usado en otra sesión.


Datos / Conjunto de datos activo / Guardar el conjunto de datos activo (elegir el directorio donde
se guardara el archivo y ponerle un nuevo nombre Ejemplo: alfaR

Para usar el archivo alfaR en una próxima sesión deberá cargarse de la siguiente manera:
Datos / Cargar conjunto de datos / seleccionar el archivo alfaR

72
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
CASO 9: EJERCICIOS DE APLICACIÓN DIVERSOS

1. La nota promedio general en un examen fue 12.6. Los aprobados obtuvieron un promedio de 14.4
y los desaprobados, en promedio, obtuvieron 8.4. Si son 50 los alumnos que rindieron el examen.
Determine el porcentaje de desaprobados.
R: desaprobados= 30 % y aprobados= 70 %

2. En la empresa industrial REX. S.A. el personal de planta tiene un salario promedio mensual de
1800 soles con una varianza de 90000 soles 2. En una negociación laboral con el sindicato se
acordó un incremento de un 20% en los salarios más una bonificación adicional de 80 soles por
concepto de movilidad. Calcule el salario promedio, la varianza y el coeficiente de variabilidad

luego de aplicadas las modificaciones.

R: M(Y)= 2,240 Soles, V(Y)= 129,600 Soles2,, Sy=360 Soles, CV(Y)= 16.07 %
3. En una empresa de servicios generales, el salario promedio de sus trabajadores es 2360 soles, el
salario promedio del personal masculino es de 2500 soles y el salario promedio del personal
femenino es de 2100 soles. ¿Qué porcentaje del personal de esta empresa es masculino y que
porcentaje es femenino?
R: personal femenino= 35 % ; personal masculino= 65 %
4. En una empresa los pagos diarios a proveedores se pueden representar mediante una

distribución simétrica; se sabe que el monto pagado con mayor frecuencia es 500 soles y
uno de los cuartiles es 650. También se sabe que lo mínimo que se paga en un día es 200 soles y
la desviación estándar es 100 soles. Se pide:

a. Indique el valor de los cuartiles inferior, central y superior. R: Q1= 350, Q2=500, Q3=650
73
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
b. Se sabe que últimamente los pagos diarios se ha incrementado en un 10% más 25 soles. ¿Cuál
es el coeficiente de variación de los pagos diarios con el incremento?
R: CV= 19.13 %
5. En una empresa, 400 trabajadores forman el Grupo 1 y lo conforman: Operarios (sub grupo 1A)
y técnicos (subgrupo 1B). la cantidad de trabajadores del grupo 1 es el 80% del total de
trabajadores de la empresa, y tienen un sueldo mensual promedio de 2730.5 soles. El otro 20%
de trabajadores de la empresa lo conforman los ejecutivos y trabajadores administrativos (grupo
2), y tienen un sueldo mensual promedio de 6500 soles.
a. Si se conoce que el sueldo mensual promedio de los operarios es 2270 soles y el sueldo
mensual promedio de los técnicos es 3498 soles; halle el número de operarios y técnicos que
tiene la empresa.
R: 250 operarios y 150 técnicos.
b. Si la dirección de la empresa establece una bonificación de 50 soles para los operarios, una
bonificación del 8% del sueldo mensual para los técnicos, y una bonificación de 200 soles
para los trabajadores del grupo 2; halle el sueldo promedio para todos los trabajadores de la
empresa.
R: 3,633.352
6. En una empresa de servicios generales, el salario promedio de sus trabajadores es 3360 soles, el
salario promedio del personal masculino es de 3500 soles y el salario promedio del personal
femenino es de 3100 soles.

a. ¿Qué porcentaje del personal de esta empresa es masculino y que porcentaje es femenino?
R: personal femenino= 35 % ; personal masculino= 65 %

b. Para el próximo mes la empresa acordó aumentar 10% del salario al personal masculino y
7.5% más una bonificación de 80 soles al salario del personal femenino, ¿Cuál es la nueva
media global, después del incremento salarial?
R: Nueva media global= S/. 3,696.88
c. ¿De qué monto debe disponer la empresa a fin de mes para hacer efectivo el pago a los 200
trabajadores de la empresa?
R: S/. 739,375
7. Desde hace dos años las compañías gastan en protección de la información. Estos gastos incluyen
los costos de personal, hardware, software, servicios externos y seguridad física. Se eligieron dos
empresas transnacionales y se registraron sus gastos mensuales, en miles de dólares,

74
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
correspondientes a la protección de la información de los últimos 6 meses. Luego de procesar los
datos se obtuvieron los siguientes resultados parciales.
6 6
∑ x i = 16 .8 ∑ x2i = 58.99
Empresa 1: i=1 i=1 Me = 3.0
6 6
∑ xi = 13. 2 ∑ x 2i = 36 .88
Empresa 2: i=1 i=1 Me = 2.5
a. ¿Cuál de las dos empresas ha tenidos gastos mensuales más homogéneos en los últimos seis
meses?;
R: CV de la empresa 1= 55.2129 %; CV de la empresa 2= 56.9182 %. La empresa 2 ha
tenido gastos mensuales en protección de la información más homogéneos.

b. ¿Cuál de ellas ha tenido gastos más asimétricos?


R: AS de la empresa 1= -0.39; AS de la empresa 2= -0.72. La empresa 2 presenta mayor
asimetría negativa en la distribución de sus gastos mensuales en protección de la
información.

c. Si como resultado de la inseguridad actual, el directorio de la empresa 2 acordó aumentar sus


gastos en protección en un 5% más 800 dólares, ¿cuál será el coeficiente de variación de los
gastos en protección para esta empresa el próximo mes?
R: CV= 42.2768 %
8. De una distribución se conoce la siguiente información: tamaño (n = 20); media ( x̄ = 400);
mediana (me = 450); min valor (X (1) = 100) y rango (R = 900). Al introducir los datos en la
computadora se ha cometido un error tipográfico sustituyendo el valor (único) X = 1000, por el
de X = 10000. ¿Cómo afectará este error en el cálculo de la media, mediana y rango? Calcule los
nuevos valores. R: Rango: 9900; Me=450; Media=850

9. Complete los espacios según corresponda:


a. En una distribución sesgada a la derecha, la mediana es …………. que la media. R: Menor
b. Cuando un conjunto se datos hay datos atípicos u outliers entonces no resulta adecuado
trabajar con la ……………………………porque ésta se ve afectada por dichos valores; una
mejor medida de tendencia central sería la ……………………… .R: media / mediana.
c. En una distribución sesgada a la derecha, la mediana es …………. que la media. R: Menor
d. La nota promedio de los 40 alumnos que rindieron un examen de Cálculo II fue 11.75. Los 25
aprobados obtuvieron una nota promedio de 14, luego la nota promedio de los desaprobados
fue …………. R: 08
75
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
10. En una compañía los trabajadores están considerados en tres categorías, A, B y C. El ingreso
promedio de los 300 trabajadores de la categoría B es de S/. 6000 y de los 150 trabajadores de la
categoría C es de S/. 8000. A los trabajadores de la categoría A se les hace un aumento del 20%
más una bonificación de S/. 600, a los de la categoría B se les aumenta un 25% más una
bonificación de S/. 800 y a los de la categoría C se les hace un aumento del 35% más una
bonificación de S/. 500. Si el ingreso promedio de los 650 trabajadores de la compañía después
del aumento es de S/. 8100, ¿cuál era el ingreso promedio de los trabajadores de la categoría A
antes de los aumentos? R: S/.
4,000

11. En una ciudad existen 3 grandes plantas de ensamblaje de artefactos eléctricos que llamaremos
A, B y C. La primera emplea a 54 personas y su salario medio es de 1,080 soles. En la segunda
trabajan 84 empleados y su ingreso medio es de 860 soles. Finalmente, la paga media de los 153
trabajadores de la planta C es de 815 soles. ¿Cuál es el salario medio de los empleados en la
industria ensambladora de artefactos de dicha ciudad? R: S/. 877.16
Desarrollado en el PPT Medidas de tendencia central y posición / Página 23

12. Sea X: el sueldo de los trabajadores de planta de una empresa. El sueldo promedio de una
muestra de trabajadores es de S/. 1,000 mensuales. Calcule el nuevo sueldo promedio para los
siguientes casos:
i. Propuesta 1: Se otorga un aumento de S/. 100 a todos los trabajadores.
ii. Propuesta 2: Se otorga un aumento de 20% a todos los trabajadores.
iii. Propuesta 3: Se otorga un aumento del 10% más una bonificación adicional de S/. 50 a todos
los trabajadores.
¿Cuál de las tres propuestas es la más conveniente para los trabajadores? R: Propuesta dos.

76
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
Medidas estadísticas

∑ xi
Media aritmética X=
i=1
n

Varianza ∑ x 2i −n ( x )2
2 i=1
S=
n−1

Coeficiente de variación S
CV X = × 100 %
| X|

3( X−Me)
AS=
S
Coeficiente de asimetría
X −Mo
AS=
S

77
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en
concordancia con lo dispuesto por la legislación sobre los derechos de autor: Decreto Legislativo 822.
RESUMEN : APLICACIONES DE ESTADISTICA DESCRIPTIVA CON EL SOFTWARE R
Utilizaremos como ejemplo las siguientes notaciones:
NOMBRE DE BASE DE DATOS: empresas
VARIABLES PARA EL EJEMPLO:

 CUANTITATIVA: VENTAS
 CUALITATIVAS:
 TIPO: T1, T2, T3.
 SECTOR: industria, comercio, servicios.
 TAMAÑO: grandes, medianas, pequeñas

RCOMANDER (Rcmdr)
No OBJETIVO EJEMPLO COMANDOS OBSERVACIÓN

1 Realizar una Recodificar la Variable Género para Datos / Modificar variables del conjunto de datos activo / Observación:
recodificación puntual reemplazar cada número por el texto convertir variable numérica en factor
correspondiente, de acuerdo a lo Factor = Variable
(de número a texto)
siguiente: Aparece la ventana: Convertir variables numéricas en cualitativa
1 = Masculino factores.
En esta ventana aparece la lista de variables:
2 = Femenino
Elegir la variable a recodificar. Por ejemplo: GENERO
Aceptar
Mensaje: Variable Género ya existe ¿Sobrescribir variable? Si
Aparece Ventana Valor numérico Nombre del nivel: Ingresar la
denominación (texto) de cada valor numérico:
1: Masculino 2: Femenino
Aceptar

78
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en concordancia con lo dispuesto por la legislación sobre los derechos de autor:
Decreto Legislativo 822.
2 Recodificar una Con la variable VENTAS generar Datos / Modificar variables del conjunto de datos activo /
variable cuantitativa la variable categoría de las ventas Recodificar variables
para generar una que denotaremos como
Aparece la ventana: Recodificar Variables con la lista de
variable cualitativa. CATEGORIA: variables:
A: Ventas menores a 1000 Soles Elegir la variable cuantitativa a recodificar. En este caso:
VENTAS que nos permitirá generar la variable cualitativa
B: Ventas iguales o mayores a categoría de ventas que nombraremos: CATEGORIA.
1000 Soles pero menores a 2000
Escribir el nombre o prefijo para la variable recodificada:
Soles. CATEGORIA.
C: Ventas de 2000 Soles a más Introducir directrices de recofificación:
lo:999.99="CI"
1000:1999.99="CII"
2000:hi="CIII"
Aceptar

De esta manera aparecerá en la base de datos una columna


adicional con la nueva variable cualitativa (FACTOR):
CATEGORIA.
3 Generar una tabla de Del total de empresas, calcular el Estadísticos / Resúmenes / Distribución de frecuencias /
frecuencias para una número y % de empresas seleccionar la variable: TAMAÑO / Aceptar
variable cualitativa (fi, pequeñas.
hi)
4 Generar una tabla de Del total de empresas del sector Estadísticos / Tablas de contingencia / Tabla de doble entrada /
frecuencias cruzada servicios, calcular cuántas y que % ingresar la variable que va en la fila: SECTOR y en la
con dos variables de empresas son pequeñas. columna: TAMAÑO
cualitativas (fi)
5 Generar una tabla de Del total de empresas de tipo A, Estadísticos / Tablas de contingencia / Tabla de entradas
frecuencias cruzada calcular cuántas y que % de
79
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en concordancia con lo dispuesto por la legislación sobre los derechos de autor:
Decreto Legislativo 822.
con tres variables empresas pequeñas son del sector múltiples / ingresar las variables:
cualitativas (fi) servicios. Variable de fila: SECTOR
Variable de columna: AREA
Variable de control: TIPO
(marcar opción: sin porcentajes)
TIPO corresponde ala principal variable de clasificación
CASO A: Estadísticos / Resúmenes / Resúmenes numéricos / elegir la
variable cuantitativa: VENTAS / Resumir por grupos / En
Calcular la media, Calcular la media, mediana,
resumir por grupos: no se elige ninguna variable cualitativa /
mediana, desviación desviación estándar y/o el cv de la
Estadísticos / elegir las estadísticas que se desean obtener (en
estándar y/o el cv para variable ventas de las empresas.
este caso: media, mediana, desviación estándar, cv
una variable
6 cuantitativa:
CASO B: Estadísticos / Resúmenes / Resúmenes numéricos / elegir la
Caso A: Sin clasificar variable cuantitativa: VENTAS / Resumir por grupos / en
por grupos. Calcular
la media, mediana, resumir por grupos: elegir la variable cualitativa: TAMAÑO /
desviación estándar y/o el cv de la Estadísticos / elegir las estadísticas que se desean obtener (en
Caso B: Por grupos variable ventas de las empresas
este caso: media, mediana, desviación estándar, cv)
con una variable grandes.
cualitativa.

7 Calcular la media, Calcular la media de la variable ventas Estadísticos / Resúmenes / Tabla de estadísticas/ elegir factores
mediana, y otras de las empresas pequeñas del sector (VARIABLES CUALITATIVAS: con Ctrl + ⇑ (flecha que está encima
estadísticas para una servicios. de Ctrl) elegir las variables: TAMAÑO y SECTOR) / elegir la
variable cuantitativa variable explicada (CUANTITATIVA): VENTAS
generando grupos con
# Elegir el estadístico (primero la Media y después la
dos variables Mediana)
cualitativas.

80
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en concordancia con lo dispuesto por la legislación sobre los derechos de autor:
Decreto Legislativo 822.
8 Calcular el CV para Calcular el CV de la variable ventas de Estadísticos / Resúmenes / Tabla de estadísticas/ elegir Para hallar el CV se
una variable las empresas pequeñas del sector factores (VARIABLES CUALITATIVAS: con Ctrl + ⇑ (flecha que requiere instalar el
cuantitativa generando servicios. está encima de Ctrl) elegir las variables: TAMAÑO y SECTOR) / paquete raster (en la
grupos con dos ventana 4: Packges /
elegir la variable explicada (CUANTITATIVA): VENTAS
Install / raster / Install)
variables cualitativas. Elegir en estadísticas la opción otros: ingresar cv
# ingresar cv en minúscula

9* Hallar un diagrama de Generar un diagrama de cajas para Gráficas / diagrama de cajas / seleccionar la variable La media y la mediana
cajas sin generar la variable ventas. cuantitativa (en este caso: VENTAS) / opciones / Aceptar complementan la
grupos información
Para hallar el valor de la media y la mediana utilizaremos proporcionada en el
RStudio: diagrama de cajas.
# Para obtener la media:
mean(alfa$VENTAS)
# Para obtener la mediana:
median(alfa$VENTAS)
10 Hallar un diagrama de Generar un diagrama de cajas para Gráficas / diagrama de cajas / seleccionar la variable La media y la mediana
cajas generando la variable ventas del sector cuantitativa (en este caso: VENTAS) / Gráfica por grupos / complementan la
grupos servicios. seleccionar la variable grupo (cualitativa, en este caso: información y se
SECTOR) / opciones / Aceptar obtienen con Rstudio.
Para hallar el valor de la media y la mediana utilizaremos
proporcionada en el
RStudio: diagrama de cajas.
# Para obtener la media:
tapply(alfa$VENTAS,alfa$SECTOR,mean)
# Para obtener la mediana:
tapply(alfa$VENTAS,alfa$SECTOR,median)

81
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en concordancia con lo dispuesto por la legislación sobre los derechos de autor:
Decreto Legislativo 822.
RSTUDIO
No OBJETIVO EJEMPLO COMANDOS OBSERVACIÓN
En la ventana No. 1 digitar:
Para hallar la Calcular la media, mediana, # media Escribir en
media, la desviación estándar y/o varianza mean(empresas$VENTAS) minúsculas cv, mean,
mediana, la de la variable ventas median, sd, mean
desviación # mediana
estándar y la median(empresas$VENTAS)
1 varianza de una
variable # desviación estándar
cuantitativa sin sd(empresas $VENTAS)
generar grupos.
# desviación estándar
var(empresas $VENTAS)

Para hallar la Calcular la media, mediana, # media Escribir en


media, mediana, desviación estándar y/o la tapply(empresas$VENTAS,empresas$TAMAÑO,mean) minúsculas cv, mean,
desviación varianza de la variable ventas de median, sd, mean
estándar y la las empresas grandes. # mediana
varianza de una tapply(empresas$VENTAS,empresas$TAMAÑO,median)
2 variable
# desviación estándar
cuantitativa por
tapply(empresas$VENTAS,empresas$TAMAÑO,sd)
grupos con una
variable # varianza
cualitativa. tapply(empresas$VENTAS,empresas$TAMAÑO,var)

Para hallar la Hallar la asimetría de las ventas # Para calcular el AS de Pearson hallar la media, mediana y desviación
asimetría sin estándar.
82
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en concordancia con lo dispuesto por la legislación sobre los derechos de autor:
Decreto Legislativo 822.
generar grupos. en general. # Escribir en minúsculas mean, median, sd

# media
mean(empresas$VENTAS)

# mediana
median(empresas $VENTAS)
3
# desviación estándar
sd(empresas $VENTAS)

# Para calcular el coeficiente de asimetría de Paerson


3*(mean(empresas$VENTAS)-median(empresas$VENTAS))/
sd(empresas$VENTAS)

Para hallar la Hallar la asimetría de las ventas # Para calcular el AS de Pearson hallar la media, mediana y desviación
asimetría por de las empresas pequeñas. estándar.
grupos con una # Escribir en minúsculas mean, median, sd
variable
cuanlitativa. # media
tapply(empresas$VENTAS,empresas$TAMAÑO,mean)

4 # mediana
tapply(empresas$VENTAS,empresas$TAMAÑO,median)

# desviación estándar
tapply(empresas$VENTAS,empresas$TAMAÑO,sd)

# Para calcular el coeficiente de asimetría de Paerson


3*(tapply(empresas$VENTAS,empresas$TAMAÑO,mean)-
tapply(empresas$VENTAS,empresas$TAMAÑO,median))/
tapply(empresas$VENTAS,empresas$TAMAÑO,sd)
83
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en concordancia con lo dispuesto por la legislación sobre los derechos de autor:
Decreto Legislativo 822.
Para Hallar la CASO A:
Calcular la moda de la variable # Para llamar al paquete DescTools. Para hallar la Moda
moda
ventas de las empresas en se requiere instalar
general. library(DescTools) el paquete
# Para hallar la moda para todas las empresas (sin clasificar por grupos): DescTools (en la
Mode(empresas$VENTAS) ventana 4: Packges /
Install / DescTools /
5 CASO B: # Para llamar al paquete DescTools. Install)

Calcular la moda de la variable library(DescTools)


ventas de las empresas # Para hallar la moda clasificando por grupos: Escribir en
grandes. mayúscula la
tapply(empresas$VENTAS,empresas$TAMAÑO,Mode) primera letra de
Mode

Para hallar el CV CASO A: # Para llamar al paquete raster: Para hallar el CV se


de una variable Calcular el cv de la variable requiere instalar el
cuantitativa ventas de las empresas en paquete raster (en la
library(raster)
generando grupos general. ventana 4: Packges /
con una variable # Para hallar el cv para todas las empresas (sin clasificar por grupos): Install / raster /
6 cualitativa. # Escribir en cv en minúscula Install)

cv(empresas$VENTAS)
CASO B: # Para llamar al paquete raster:
library(raster)
Calcular el cv de la variable
ventas de las empresas # Para hallar el cv clasificando por grupos:
grandes. # Escribir en cv en minúscula
tapply(empresas$VENTAS,empresas$TAMAÑO,cv)
Para hallar a la Calcular el valor mínimo,
vez el valor máximo , Q1, Q2 y Q3 de la quantile(empresas$VENTAS,type=6)
minimo, todos los
84
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en concordancia con lo dispuesto por la legislación sobre los derechos de autor:
Decreto Legislativo 822.
7 cuartiles y el variable ventas.
valor máximo de
una variable
cuantitativa.

Para hallar un Calcular el valor mínimo, del quantile(empresas$VENTAS,0.90, type=6) Ingresar el valor del
percentil de una 10% superior (equivalente al percentil en
variable valor máximo del 90% inferior) decimales.
8 cuantitativa. de las ventas; es decir el
Escribir type=6 para
percentil 90.
que R realice el
cálculo del Percentil
utilizando la fórmula
(algoritmo) que
emplearemos en el
curso.

Para hallar un Calcular el valor mínimo, del tapply(empresas$VENTAS,empresas$TAMAÑO,quantile,0.90,type=6) Ingresar el valor del
percentil de una 10% superior (equivalente al percentil en
variable valor máximo del 90% inferior) decimales.
9 cuantitativa de las ventas de las empresas
Escribir type=6 para
generando grupos grandes; es decir el percentil
que R realice el
con una variable 90.
cálculo del Prcentil
cualitativa.
utilizando la fórmula
(algoritmo) que
emplearemos en el
curso.

Generar un diagrama de caja gempresas=boxplot(empresas$VENTAS)


(boxplot) de una variable gempresas$out
cuantitativa e identificar outliers 89 21.77273
(observaciones atípicaa)
85
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en concordancia con lo dispuesto por la legislación sobre los derechos de autor:
Decreto Legislativo 822.
10 Generar un diagrama de caja gempresas=boxplot(empresas$VENTAS~ empresas$TAMAÑO)
(boxplot) de una variable gempresas$out
Para generar un points(tapply(telefonia$EDAD,telefonia$EMPRESA,mean),col="Red",pch
cuantitativa por grupos
diagrama de cajas
(variable cualitativa) e =19)
identificar outliers
(observaciones atípicaa)

El software estadístico R es un entorno informático estadístico que incluye herramientas de análisis
de datos y generación de gráficas. Es un software libre y funciona bajo Windows, MAC OS y
Linux. Es una herramienta ideal para docencia, ya que permite que los alumnos la descarguen y la
utilicen en sus casas con toda libertad y sin costo alguno. R es un conjunto de módulos estadísticos
R que mediante cualquiera de sus interfaces, permite realizar análisis de datos y representación de los
mismos.

RStudio es un entorno de desarrollo integrado (IDE) para el lenguaje de programación R, dedicado


a la computación estadística y gráficos.
RStudio
R-Commander es una Interfaz Gráfica de Usuario (GUI en inglés), creada por John Fox,
que permite acceder a muchas capacidades del entorno estadístico R sin que el usuario
R-Commander: Rcmdr tenga que conocer el lenguaje de comandos propio de este entorno.

86
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en concordancia con lo dispuesto por la legislación sobre los derechos de autor:
Decreto Legislativo 822.
DescTools DescTools es una colección extensa de diversas funciones estadísticas básicas , es una caja
de herramientas que permite calcular estadísticas descriptivas, dibujar resúmenes gráficos y
reportar los resultados.

raster El paquete raster permite la lectura, escritura, manipulación, análisis y modelado de datos


espaciales raster. El paquete implementa funciones básicas y de alto nivel. Además soporta
el procesamiento de archivos muy grandes. También hay soporte para operaciones de datos
vectoriales como intersecciones.

87
Este material de apoyo académico se reproduce para uso exclusivo de los alumnos de la Universidad de Lima y en concordancia con lo dispuesto por la legislación sobre los derechos de autor:
Decreto Legislativo 822.

También podría gustarte