En el presente proyecto exploramos un dataset que contiene una colección de propiedades inmobiliarias del sitio web Properati para el año 2017, más aún, implementamos un regresor para realizar inferencias sobre el precio de las propiedades utilizando datos cerrados y texto que contienen las publicaciones en el dataset.
El scaffolding se encuentra dispuesto de la siguiente manera:
- 0_Exploratory_Data_Analysis.ipynb: muestra el analisis y exploracion de los datos.
- 1_Regresion_Properati_Final.ipynb: implementa un regresor realizando tuneo de hiperparámetros.
- properati.zip: tiene de forma comprimida el archivo
properati.csv
, el cual es necesario para ejecutar las notebooks. - Exploracion: contiene notebooks explorando y graficando desde distintos puntos el dataset, estas notebooks fueron unidas utilizando nbmerge para crear la primer notebook que contiene toda la exploracion.
El dataset de Properati año 2017 al que accedimos para realizar este proyecto se encontraba con muchos errores. Algunas estrategias para subvertirlos fueron:
- Imputación
- Limpieza de nulos
- Se acudió al registro de conversión para poder realizar la misma desde monedas regionales a USD teniendo en cuenta su fecha de publicación
- Algunas propiedades fueron relocalizadas teniendo en cuenta los límites comunales de la Capital Federal