Documentos de Académico
Documentos de Profesional
Documentos de Cultura
INFORMACIÓN GENERAL
- Las preguntas realizadas sólo pueden ser referidas al enunciado y no a los contenidos a
evaluar.
- La Solemne es individual
- No podrán existir respuestas iguales entre diferentes pruebas, ya que esto
demostrará copia y no se asignará puntos.
- La prueba deberá ser enviada a: iolivaress@docente.uss.cl y deberá asignar el siguiente
nombre al archivo:
S1_AN_IT_”NOMBREAPELLIDO”.
- Deberá enviar la Solemne a más tardar el viernes 22 de abril del 2022 hasta las 19:00
hrs. de la noche.
_________________________________________________________________________
La siguiente prueba, tiene principalmente un fin práctico, es decir, se evaluará su capacidad de
analizar información a partir de lo que hemos visto en las diferentes clases donde se muestran
los diferentes códigos en el software Rstudio.
Se envía junto a esta prueba una base de datos, la cual ya se encuentra depurada y lista para
ser procesada “DatosComidaRapida.xlsx”.
Para cada pregunta deberá dejar la evidencia (pantallazo) del resultado obtenido en
Rstudio y luego deberá concluir a partir de la pregunta en cada sección.
1. Carnes
2. Bebidas&Jugos
3. Desayunos
4. Pollos&Pescado
5. Caffe&Tea&Dulces
6. Postres
7. Ensaladas
8. Batidos
9. Snacks
1
CALORIAS: Calorías de algún producto asociadas a las categorías descritas más arriba.
GRASAS_TOTALES: Cantidad de grasas totales asociadas a las categorías descritas más arriba.
Sección N°1
2
Estadística Descriptiva
1. Describa la Base de Datos, es decir: Para cada una de los campos o columnas indique
que tipo de variable es (Categórica dummy, categórica ordinal, numérica continua, etc).
También debe indicar cuantos registros (filas) tiene la base de datos. (apoyarse con el
Excel nombres_var)(10 Puntos)
Variables Clasificación
CATEGORIA Categórica Nominal
CALORIAS Numérica
GRASAS_CALORICAS Numérica
GRASAS_TOTALES Contínua
GRASAS_SATURADAS Contínua
CARBOHIDRATOS Numérica
PROTEINAS Numérica
CALORIAS_CAT Categórica Ordinal
GRASAS_CALORICAS_CAT Categórica Ordinal
GRASAS_SATURADAS_CAT Categórica Ordinal
Nuestra base de datos contiene información sobre la venta de productos de una cadena de
comida. Las variables están clasificadas por la esta tabla. La descripción de cada campo se
encuentra precisada en el enunciado de la BBDD.
Hay un total de 10 variables y una data de 259 observaciones.
3
Se genera una nueva variable (P), que corresponde a la proporción de grasas calóricas
multiplicada por 10 sobre las grasas totales. Las variables aumentan a 11 y se conserva el total
de registros.
Del archivo datos se seleccionan los campos categorías, calorías y grasas calóricas.
Así y con la tabla con las dos variables seleccionadas se crea una tercera variable llamada
grasa_dis y representa el 50% de la variable original grasa calórica menos 100. Por último, la
información en la tabla final se ordena de menor a mayor por la variable categoría.
Se mantiene el total de observaciones de la tabla original.
4
3. Realizar un resumen de información para cada una de las siguientes variables, ¿Qué
podría decir de las estadísticas obtenidas? (10 Puntos)
a. CALORIAS
b. GRASAS_CALORICAS
c. GRASAS_TOTALES
d. CARBOHIDRATOS
e. PROTEINAS
Grasas totales: Se aprecia un valor mínimo de 100 y valor máximo de 60. También
pareciera que la distribución de esta variable no es simétrica, considerando los valores de
la media y la mediana.
5
Podemos observar la existencia o no de algún tipo de correlación en este gráfico. Para el caso
particular, el comportamiento de la nube de puntos nos hace inferir que existe una forma con
tendencia positiva. Esto quiere decir que a medida que aumenta una variable, aumenta también
la otra. Posiblemente exista una correlación lineal entre ambas.
5. Deberá crear Histogramas para las siguientes variables. ¿Qué puede concluir respecto a
la información que muestra este tipo de gráfico para cada una de las variables? (10
Puntos).
a. CALORIAS
b. GRASAS_CALORICAS
c. GRASAS_SATURADAS
d. CARBOHIDRATOS
e. PROTEINAS
6
Distribución asimétrica. La mayor parte de los datos se ubican entre las 100 y 400 calorías.
7
8
Sección N°2.
6.4. ¿Cuáles son las categorías de alimentos que representan un 50% o más del total
de calorías?. 5 Puntos).
Al ordenar la tabla y acumular las frecuencias relativas marginales, tenemos que entre la
categoría 3 y 5, acumulan entre ambas mas de un 50% del total de calorías.
6.5. Si tuviera que escoger comer sano, que categorías de alimentos escogería en función
de la cantidad de calorías. 5 Puntos).
Optaríamos por la categoría 7, 2 y 6, que son aquellas que poseen la menor cantidad de
calorías.
9
Correlación de Pearson
7. Obtenga la correlación de Pearson entre las variables CALORIAS y
GRASAS_CALORICAS ¿Qué tipo de correlación tienen las variables CALORIAS y
GRASAS_CALORICAS? (10 Puntos).
Correlación de Pearson= 0,8865037. Al estar próximo a 1 quiere decir que existe una correlación
lineal fuerte. Es directamente proporcional.
10