Está en la página 1de 1

ESTADÍSTICA UNIVARIADA Y CONTROL DE FLUJO

1. Importe pandas y numpy.


2. Posteriormente importe el archivo flights.csv
3. Solicite las primeras y últimas 5 observaciones de la tabla de datos.
4. Utilice describe para obtener las medidas univariadas de la columna year.
5. Utilice value_counts para obtener la frecuencia de meses y años de la tabla.
6. Guarde en variables las primeras y últimas 15 observaciones de la tabla.
7. Solicite la media, mediana y desviación estándar de la cantidad de
pasajeros utilizando los métodos de numpy. Replique el procedimiento para
las últimas y primeras 15 observaciones. Comente brevemente los
resultados
8. Utilizando la misma base flights.csv hacer un loop y clasificar los meses con
una cantidad de pasajeros menor a la media.
9. Para ello, generen un nuevo objeto que represente la media de passengers.
10. Generen una columna en la base de datos que se llame underperforming y
asígnele 0.
11. Ejecuten un loop que recorra cada observación de passengers, donde si la
observación es menor a la media de passengers se le asigne a
underperforming un 1.
12. Para asignar unos en la columna underperforming ya creada, utilice la
función at.
13. Hacer un loop que clasifique los meses donde la cantidad de pasajeros se
escapa de la tendencia.
a. Para ello, genere dos objetos que guarden la media general y la
desviación estándar general de passengers.
b. Genere una nueva columna en la tabla de datos que se llame outlier
y asignele 0.
c. Ejecuten un loop que recorra cada observación de passengers,
donde si la observación se escapa de la tendencia sea 1, de lo
contrario 0.
d. Para clasificar los casos que se escapen la tendencia, la observación
debe satisfacer una de las siguientes condiciones:
i. La observación debe ser menor a la media menos la
desviación estándar, o
ii. La observación debe ser mayor a la media más la desviación
estándar.
iii. ¿Cuántas observaciones se pueden clasificar como casos
extremos?

También podría gustarte