Está en la página 1de 1

- En un jupyter Notebook,

Hacer un analisis descriptivo y exploratorio


de Los datos al interior del data set asignado.

- Describir cuantos datos faltantes tuvo cada variable.

- Describir que se hizo con las variables que tenian bastantes datos faltantes ( mas del 20 %
dentro de la columna)

- Si se debio hacer limpieza de datos


se debe explicar que metodologia se
uso para transformar las variables
y dejar las datos listos. Ademas de
resumir el estado original de las variables
(cantidad de atipicos, cantidad de datos faltantes etc).

- Calcular promedios y correlaciones de las variables especialmente con respecto a la variable


SalePrice.
- Utilizar PCA es un plus sin embargo debe ser interpretado.

El resultado debe ser colgado en un Repositorio publico de GitHub.

Data set:

https://www.kaggle.com/c/house-prices-advanced-regression-techniques/data

- train.

También podría gustarte