Está en la página 1de 8

Explorando the Flights Dataset

Table of Contents
Explorando los datos del aeropuerto...................................................................................................................... 1
Importar el archivo de aeropuertos..................................................................................................................... 1
Ubicaciones del aeropuerto................................................................................................................................. 1
Explorando the Flight data...................................................................................................................................... 2
Importando the flights files...............................................................................................................................2
Elapsed time.................................................................................................................................................... 3
Defininiendo the duration difference................................................................................................................3
Correlaciones de diferencia de duración.........................................................................................................4
Missing data..................................................................................................................................................... 6

Explorando los datos del aeropuerto


Importar el archivo de aeropuertos
Para importar el archivo airports.csv, use la herramienta Importar datos que se encuentra en la pestaña de
inicio.

Aquí está la tabla resultante usando la configuración de importación predeterminada

airports

airports = 322×5 table


AIRPORT DISPLAY_AIRPORT... DISPLAY_AIRPORT_CITY_N... LATITUDE LONGITUDE

1 "ABE" "Lehigh Valley Inter... "Allentown/Bethlehem/Easton, PA" 40.6547 -75.4383


2 "ABI" "Abilene Regional" "Abilene, TX" 32.4094 -99.6797
3 "ABQ" "Albuquerque Interna... "Albuquerque, NM" 35.0417 -106.6064
4 "ABR" "Aberdeen Regional" "Aberdeen, SD" 45.4497 -98.4217
5 "ABY" "Southwest Georgia R... "Albany, GA" 31.5322 -84.1961
6 "ACT" "Waco Regional" "Waco, TX" 31.6114 -97.2286
7 "ACV" "Arcata" "Arcata/Eureka, CA" 40.9792 -124.1075
8 "ACY" "Nafec Atlantic City" "Atlantic City, NJ" 39.4561 -74.5781
9 "ADK" "Adak NS" "Adak Island, AK" 51.8828 -176.6447
10 "ADQ" "Kodiak Airport" "Kodiak, AK" 57.7500 -152.4939

Ubicaciones del aeropuerto


Grafica de las ubicaciones del aeropuerto en los Estados Unidos.

geoscatter(airports.LATITUDE,airports.LONGITUDE,'xk');
geobasemap colorterrain
geolimits([10.7 53.7],[-129.3 -61.8])

1
Explorando the Flight data
Importando the flights files
Para importar el archivo flightsFeb.csv use la función de importación personalizada proporcionada,
importFlightsData.

flights = importFlightsData("flightsFeb.csv")

flights = 429191×20 table

AIRLINE TAIL_NUMBER FLIGHT_NUMBER ORIGIN DESTINATION

1 American ... N3JKAA 2400 LAX DFW


2 Alaska Ai... N794AS 98 ANC SEA
3 American ... N3FEAA 258 LAX MIA
4 Delta Air... N962DN 806 SFO MSP
5 Spirit Ai... N604NK 612 LAS MSP
6 American ... N3KRAA 1112 SFO DFW
7 Delta Air... N137DL 1434 LAX MSP
8 US Airways N558UW 1832 LAX CLT
9 United Ai... N69826 1010 LAX IAH
10 United Ai... N66803 1200 SFO IAH

2
Elapsed time
Histograma del tiempo transcurrido programado para todos los vuelos.

histogram(flights.SCHEDULED_ELAPSED_TIME,30)
xlabel("Scheduled elapsed time (min)")
ylabel("Number of flights")

Defininiendo the duration difference


Cree una nueva variable, DURATION_DIFF, que captura cuánto tiempo más de lo esperado tomó cada vuelo.

Un número negativo significa que el vuelo fue más corto de lo programado, mientras que un número positivo
significa que el vuelo fue más largo de lo programado.

flights.DURATION_DIFF = flights.ACTUAL_ELAPSED_TIME - flights.SCHEDULED_ELAPSED_TIME;


histogram(flights.DURATION_DIFF,50)
xlabel("Duration difference (min)")
ylabel("Numero de vuelos")

3
Correlaciones de diferencia de duración
La siguiente gráfica sugiere que la diferencia de duración no parece estar muy correlacionada con el tiempo de
emisión. ¿Qué más podría estar causando tiempos de vuelo más largos de lo esperado?

scatter(flights.AIR_TIME, flights.DURATION_DIFF,'.')
xlabel('Air time (min)')
ylabel('Duration difference (min)')

4
¿Qué pasa con el tiempo Total_Taxi, que es la suma de los tiempos de Taxi_Out y Taxi_In?

flights.TAXI_TOTAL = flights.TAXI_OUT + flights.TAXI_IN;


scatter(flights.TAXI_TOTAL, flights.DURATION_DIFF)
xlabel('Total time taxiing (min)')
ylabel('Duration difference (min)')

5
Definitivamente hay una clara correlación allí. Cuantifíquelo usando la función de correlación, corr.

The name-value pair "rows", "complete" specifies that the function should only consider rows without
missing values.

taxiCorrelation = corr(flights.TAXI_TOTAL, flights.DURATION_DIFF,"rows","complete")

taxiCorrelation = 0.6976

Missing data
Los vuelos cancelados están marcados con un 1 en la columna CANCELLED. De lo contrario, están marcados
con un 0.

¿Cuántos vuelos cancelados hubo este mes?

cancelledFlights = flights(flights.CANCELLED == 1,:);


numberCancelled = height(cancelledFlights)

numberCancelled = 20517

percentCancelled = height(cancelledFlights)/height(flights) * 100

percentCancelled = 4.7804

¿Qué aeropuertos tuvieron la mayor cantidad de vuelos cancelados?

6
cancelledSummary = groupsummary(cancelledFlights,"ORIGIN");
cancelledSummary = sortrows(cancelledSummary,"GroupCount","descend")

cancelledSummary = 292×2 table


ORIGIN GroupCount

1 DFW 2000
2 ORD 1699
3 BOS 1145
4 LGA 1068
5 ATL 932
6 EWR 616
7 DCA 561
8 JFK 483
9 CLT 469
10 MDW 461

Para un aeropuerto en particular, ¿cómo se distribuyeron estas cancelaciones durante todo el mes?

cancelledAirport = cancelledFlights(cancelledFlights.ORIGIN == "BOS",:);


cancelledAirportSummary = groupsummary(cancelledAirport,'SCHEDULED_DEPARTURE_TIME','day');
bar(cancelledAirportSummary.day_SCHEDULED_DEPARTURE_TIME, cancelledAirportSummary.GroupCount)
xlabel("Scheduled departure date")
ylabel("Number of cancelled flights")

7
8

También podría gustarte