Está en la página 1de 10

.

ANALITICA DE NEGOCIOS NRC 2976


PRUEBA SOLEMNE N°1

DOCENTE: ITALO A.OLIVARES S.


ESTUDIANTE: Leonardo Arias O. RUT:12.491.366-7

PUNTUACION: ______________________________________ NOTA: _________________

INFORMACIÓN GENERAL

- Las preguntas realizadas sólo pueden ser referidas al enunciado y no a los contenidos a
evaluar.
- La Solemne es individual
- No podrán existir respuestas iguales entre diferentes pruebas, ya que esto
demostrará copia y no se asignará puntos.
- La prueba deberá ser enviada a: iolivaress@docente.uss.cl y deberá asignar el siguiente
nombre al archivo:
S1_AN_IT_”NOMBREAPELLIDO”.

- Deberá enviar la Solemne a más tardar el viernes 22 de abril del 2022 hasta las 19:00
hrs. de la noche.
_________________________________________________________________________
La siguiente prueba, tiene principalmente un fin práctico, es decir, se evaluará su capacidad de
analizar información a partir de lo que hemos visto en las diferentes clases donde se muestran
los diferentes códigos en el software Rstudio.
Se envía junto a esta prueba una base de datos, la cual ya se encuentra depurada y lista para
ser procesada “DatosComidaRapida.xlsx”.
Para cada pregunta deberá dejar la evidencia (pantallazo) del resultado obtenido en
Rstudio y luego deberá concluir a partir de la pregunta en cada sección.

Contextualización de la Base de Datos

La base de datos contiene información de la venta de productos en una cadena de comida. La


información proporcionada muestra las siguientes variables:

CATEGORIA: Corresponde a las diferentes categorizaciones de los productos en venta. La


codificación de esta variable viene dada por:

1. Carnes
2. Bebidas&Jugos
3. Desayunos
4. Pollos&Pescado
5. Caffe&Tea&Dulces
6. Postres
7. Ensaladas
8. Batidos
9. Snacks

1
CALORIAS: Calorías de algún producto asociadas a las categorías descritas más arriba.

GRASAS_CALORICAS: Cantidad de grasas calóricas asociadas a las categorías descritas más


arriba.

GRASAS_TOTALES: Cantidad de grasas totales asociadas a las categorías descritas más arriba.

GRASAS_SATURADAS: Cantidad de grasas saturadas asociadas a las categorías descritas más


arriba.

CARBOHIDRATOS: Carbohidratos de los alimentos.

PROTEINAS: Carbohidratos de los alimentos.

CALORIAS_CAT: Categorización de la variable CALORIAS, la codificación viene dada por:

1. [0,210) : De 0 a 209 Calorías


2. [210,340) : De 210 a 339 Calorías
3. [340,490) : De 340 a 489 Calorías
4. De 490 Calorías y más

GRASAS_CALORICAS_CAT: Categorización de la variable GRASAS_CALORICAS, la


codificación viene dada por:

1. [0,20) : De 0 a 19 Grasas Calóricas


2. [20,100) : De 20 a 99 Grasas Calóricas
3. [100,200) : De 100 a 199 Grasas Calóricas
4. De 200 Grasas Calóricas

GRASAS_SATURADAS_CAT: Categorización de la variable GRASAS_SATURADAS, la


codificación viene dada por:

1. [0,1) : De 0 a 1 Grasa Saturada


2. (1,5] : De 2 a 5 Grasas Saturadas
3. (5,10] : De 6 a 10 Grasas Saturadas
4. De 11 y Grasas Saturadas

Con esta información se pide lo siguiente:

Sección N°1

Cargue la base de datos a Rstudio

commando utilizado: data=read_excel(file.choose())

2
Estadística Descriptiva

1. Describa la Base de Datos, es decir: Para cada una de los campos o columnas indique
que tipo de variable es (Categórica dummy, categórica ordinal, numérica continua, etc).
También debe indicar cuantos registros (filas) tiene la base de datos. (apoyarse con el
Excel nombres_var)(10 Puntos)

Variables Clasificación
CATEGORIA Categórica Nominal
CALORIAS Numérica
GRASAS_CALORICAS Numérica
GRASAS_TOTALES Contínua
GRASAS_SATURADAS Contínua
CARBOHIDRATOS Numérica
PROTEINAS Numérica
CALORIAS_CAT Categórica Ordinal
GRASAS_CALORICAS_CAT Categórica Ordinal
GRASAS_SATURADAS_CAT Categórica Ordinal

Nuestra base de datos contiene información sobre la venta de productos de una cadena de
comida. Las variables están clasificadas por la esta tabla. La descripción de cada campo se
encuentra precisada en el enunciado de la BBDD.
Hay un total de 10 variables y una data de 259 observaciones.

2. Utilice el paquete dplyr y aplique las siguientes sentencias (20 Puntos)

a. Filtro = filter(data, CALORIAS>300 & CATEGORIA==3) ¿Qué hace la anterior


línea de comandos?
Se crea un filtro sobre la base, donde se muestran solamente con la variable calorías iguales a
300 y que pertenecen a la categoría igual a 3. Para este ejemplo, quedan solo 2 observaciones
y 10 variables.

b. Crea = data %>% mutate( P = GRASAS_CALORICAS *10/GRASAS_TOTALES)


¿Qué hace la anterior línea de comandos?

3
Se genera una nueva variable (P), que corresponde a la proporción de grasas calóricas
multiplicada por 10 sobre las grasas totales. Las variables aumentan a 11 y se conserva el total
de registros.

c. Sel = data %>% select(CALORIAS,GRASAS_TOTALES) ¿Qué hace la anterior


línea de comandos?
Del archivo de datos se seleccionan los campos Calorías y grasas totales.

d. Sel = data %>% select( CATEGORIA, CALORIAS , GRASAS_CALORICAS)


%>% mutate(GRASA_DIS = GRASAS_CALORICAS*0.5-100) %>%
arrange(CATEGORIA)

¿Qué hace la anterior línea de comandos?

Del archivo datos se seleccionan los campos categorías, calorías y grasas calóricas.
Así y con la tabla con las dos variables seleccionadas se crea una tercera variable llamada
grasa_dis y representa el 50% de la variable original grasa calórica menos 100. Por último, la
información en la tabla final se ordena de menor a mayor por la variable categoría.
Se mantiene el total de observaciones de la tabla original.

4
3. Realizar un resumen de información para cada una de las siguientes variables, ¿Qué
podría decir de las estadísticas obtenidas? (10 Puntos)

a. CALORIAS
b. GRASAS_CALORICAS
c. GRASAS_TOTALES
d. CARBOHIDRATOS
e. PROTEINAS

Min 1st Qu. Median Mean 3rdQu. Max.


Calorías 0.0 210.0 340.0 362.4 490.0 1150.0
Grasas calóricas 0.0 20.0 100.0 123.5 200.0 540.0
Grasas Totales 0.00 2.25 11.0 13.76 22.00 60.00
Carbohidratos 0.00 30.00 44.00 47.07 60.00 141.00
Proteinas 0.00 4.00 12.00 13.05 18.50 48.00

Calorías: El valor mínimo valor de la variable calorías es 0. La media en calorías en


cambio por todos los productos es 340, valor muy cercano a la mediana. También
tenemos valores extremos, como el caso de algún producto que presenta 1150 calorías.

Grasas Calóricas: En este caso el mínimo es 0. Observando el comportamiento de la


media y la mediana nos hace sostener que la distribución de esta variable no es simétrica.
Acá también encontramos valores extremos en esta variable (540 grasas calóricas).

Grasas totales: Se aprecia un valor mínimo de 100 y valor máximo de 60. También
pareciera que la distribución de esta variable no es simétrica, considerando los valores de
la media y la mediana.

Carbohidratos y proteínas: En ambos casos el valor mínimo de las variables es cero.


En este caso se observa mayor simetría en los datos.

4. Crear gráfica de dispersión para las variables CALORIAS y GRASAS_CALORICAS.


Además debe interpretar los gráficos, por ejemplo deberá responder ¿Tienen algún tipo
de asociación las variables?, ¿Se observa algún tipo de tendencia cuando se grafican el
par de variables? (15 Puntos).

5
Podemos observar la existencia o no de algún tipo de correlación en este gráfico. Para el caso
particular, el comportamiento de la nube de puntos nos hace inferir que existe una forma con
tendencia positiva. Esto quiere decir que a medida que aumenta una variable, aumenta también
la otra. Posiblemente exista una correlación lineal entre ambas.

5. Deberá crear Histogramas para las siguientes variables. ¿Qué puede concluir respecto a
la información que muestra este tipo de gráfico para cada una de las variables? (10
Puntos).

a. CALORIAS
b. GRASAS_CALORICAS
c. GRASAS_SATURADAS
d. CARBOHIDRATOS
e. PROTEINAS

6
Distribución asimétrica. La mayor parte de los datos se ubican entre las 100 y 400 calorías.

7
8
Sección N°2.

6. Obtenga una tabla de contingencia entre las variables CATEGORIA y CALORIAS_CAT.


Responda lo siguiente:
6.1. ¿Cuál es la categoría de alimentos que presenta más calorías? (5 Puntos).
La categoría 5.
6.2. ¿Cuál es la categoría de alimentos que presenta más calorías en la siguiente
categoría [210,340) de calorías_Cat?. (5 Puntos).
La Categoría 3.
6.3. ¿Cuál es el porcentaje de la categoría que tiene menos calorías? 5 Puntos).
La categoría 7, con un 2,3% del total.

6.4. ¿Cuáles son las categorías de alimentos que representan un 50% o más del total
de calorías?. 5 Puntos).
Al ordenar la tabla y acumular las frecuencias relativas marginales, tenemos que entre la
categoría 3 y 5, acumulan entre ambas mas de un 50% del total de calorías.

6.5. Si tuviera que escoger comer sano, que categorías de alimentos escogería en función
de la cantidad de calorías. 5 Puntos).
Optaríamos por la categoría 7, 2 y 6, que son aquellas que poseen la menor cantidad de
calorías.

9
Correlación de Pearson
7. Obtenga la correlación de Pearson entre las variables CALORIAS y
GRASAS_CALORICAS ¿Qué tipo de correlación tienen las variables CALORIAS y
GRASAS_CALORICAS? (10 Puntos).

Correlación de Pearson= 0,8865037. Al estar próximo a 1 quiere decir que existe una correlación
lineal fuerte. Es directamente proporcional.

10

También podría gustarte