Está en la página 1de 2

25/6/2021 04CalculoCuartiles - Jupyter Notebook

Calculo de los Cuartiles a las edades por clase en el problema del


Titanic
In [1]: 1 import pandas as pd
2 import numpy as np
3 import matplotlib.pyplot as plt
4 import seaborn as sns
5 %matplotlib inline

In [2]: 1 datos = pd.read_csv('titanic_train.csv')

In [3]: 1 sns.boxplot(x='Pclass',y='Age',data=datos,palette='winter')

Out[3]: <AxesSubplot:xlabel='Pclass', ylabel='Age'>

In [4]: 1 pasaj_c1 = datos[(datos['Pclass']==3) & (datos['Age'].isnull()==False)]


2 pasaj_c2 = datos[datos['Pclass']==2]
3 pasaj_c3 = datos[datos['Pclass']==3]

In [5]: 1 edades_c1 = pasaj_c1['Age']


2 edades_c2 = pasaj_c2['Age'].dropna()
3 edades_c3 = pasaj_c3['Age'].dropna()

In [6]: 1 Cuartiles_c1=pd.DataFrame(edades_c1.quantile([0.25,0.50,0.75]))
2 Cuartiles_c1.columns = ["Edad"]
3 Cuartiles_c1.index = ["Q1","Q2","Q3"]
4 Cuartiles_c2=pd.DataFrame(edades_c2.quantile([0.25,0.50,0.75]))
5 Cuartiles_c2.columns = ["Edad"]
6 Cuartiles_c2.index = ["Q1","Q2","Q3"]
7 Cuartiles_c3=pd.DataFrame(edades_c3.quantile([0.25,0.50,0.75]))
8 Cuartiles_c3.columns = ["Edad"]
9 Cuartiles_c3.index = ["Q1","Q2","Q3"]

In [7]: 1 print("Primera Clase")


2 print(Cuartiles_c1)
3 print("Segunda Clase")
4 print(Cuartiles_c2)
5 print("Tercera Clase")
6 print(Cuartiles_c3)

Primera Clase

Edad

Q1 18.0

Q2 24.0

Q3 32.0

Segunda Clase

Edad

Q1 23.0

Q2 29.0

Q3 36.0

Tercera Clase

Edad

Q1 18.0

Q2 24.0

Q3 32.0

localhost:8888/notebooks/03RegresionLogistica/04CalculoCuartiles.ipynb 1/2
25/6/2021 04CalculoCuartiles - Jupyter Notebook

In [8]: 1 print("Promedio edad 1ra Clase: ",np.round(edades_c1.mean(),2))


2 print("Promedio edad 2da Clase: ",np.round(edades_c2.mean(),2))
3 print("Promedio edad 3ra clase: ",np.round(edades_c3.mean(),2))

Promedio edad 1ra Clase: 25.14

Promedio edad 2da Clase: 29.88

Promedio edad 3ra clase: 25.14

In [9]: 1 psj_por_clase = datos.groupby(['Pclass'])

In [11]: 1 psj_por_clase['Age'].quantile([0.25,0.50,0.75])

Out[11]: Pclass

1 0.25 27.0

0.50 37.0

0.75 49.0

2 0.25 23.0

0.50 29.0

0.75 36.0

3 0.25 18.0

0.50 24.0

0.75 32.0

Name: Age, dtype: float64

localhost:8888/notebooks/03RegresionLogistica/04CalculoCuartiles.ipynb 2/2

También podría gustarte