Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Predicción de Precios de
Viviendas en Boston con
Regresión
Victor Roman
Introducción
En este proyecto desarrollaremos y evaluaremos el rendimiento y la
potencia predictiva de un modelo entrenado y probado sobre datos
referentes al mercado inmobiliario residencial en barrios de Boston.
Un modelo así sería muy valioso para una agencia inmobiliaria que
pudiera hacer uso de la información proporcionada diariamente.
https://github.com/rromanss23/
Machine_Leaning_Engineer_Udacity_NanoDegree/tree/master/
projects/boston_housing
Obtención De Datos y Preprocesamiento Previo
El conjunto de datos de este modelo proviene del repositorio “UCI
Machine Learning”. Estos datos se recopilaron en in 1978, y cada una
de las 506 entradas representan datos agregados de 14 características
de casas en diversos barrios de Boston.
# Success
print("Boston housing dataset has {} data points with {}
variables each.".format(*data.shape))
Exploración de Datos
En la primera sección del proyecto, realizaremos un análisis
exploratorio del conjunto de datos y obtendremos algunas
observaciones.
Cálculos estadísticos
# Minimum price of the data
minimum_price = np.amin(prices)
Observación de Características
La Ciencia de Datos es el proceso de realizar algunas suposiciones e
hipótesis sobre los datos, y probarlos realizando algunas tareas.
Inicialmente realizaremos las siguientes suposiciones intuitivas para
cada característica:
Desarrollando un Modelo
En esta segunda sección del proyecto, desarrollaremos las herramientas
y técnicas necesarias para que el modelo pueda realizar una predicción.
El hecho de realizar evaluaciones exactas del rendimiento de cada
modelo a través del uso de estas herramientas y técnicas ayuda a
reforzar de forma notable la confianza en las predicciones.
# Success
print("Training and testing split was successful.")
¡Error! Nombre de archivo no especificado.
Entrenamiento y Pruebas
Curvas de aprendizaje
Curvas de complejidad
Compromiso Sesgo-Varianza
Validación Cruzada
La validación cruzada K-fold es una técnica usada para asegurar que
nuestro modelo ha sido bien entrenado, sin usar el set de pueba.
Consiste en:
Para resolver este problema, otra sección del set de pruebas puede ser
escogido y designado como “set de validación”: después de realizar el
entrenamiento con el conjunto de datos para este propósito, la
evaluación se realiza en el conjunto de validación, y cuando este proceso
aparente arrojar resultados positivos, la evaluación final se puede
realizar en el set de pruebas.
Ajustando un modelo
Realizando Predicciones
Modelo Óptimo
# Show predictions
for i, price in enumerate(reg.predict(client_data)):
print("Predicted selling price for Client {}'s home: $
{:,.2f}".format(i+1, price))
Conclusión
A lo largo de este artículo, hicimos un proyecto de regresión de
aprendizaje automático de extremo a extremo y aprendimos y
obtuvimos varias ideas sobre los modelos de regresión y cómo se
desarrollan.
Regresion
Aprendizaje Automático
Ciencia De Datos
Programación
Data Science
75
1
WRITTEN BY
Victor Roman
Follow
Industrial Engineer and passionate about 4.0 Industry. My goal is to encourage people to
learn and explore its technologies and their infinite posibilites.
Ciencia y Datos
Follow
Publicación de Ciencia de Datos, Machine Learning, Deep Learning, Inteligencia Artificial y
mucho más en Español. Compartiendo conocimiento para hacer de este mundo un lugar
mejor :)
About
Help
Legal
Get the Medium app