Skip to content

cdgn-coding/properati-price-inference

Repository files navigation

Properati price inference

En el presente proyecto exploramos un dataset que contiene una colección de propiedades inmobiliarias del sitio web Properati para el año 2017, más aún, implementamos un regresor para realizar inferencias sobre el precio de las propiedades utilizando datos cerrados y texto que contienen las publicaciones en el dataset.

Estructura del repositorio

El scaffolding se encuentra dispuesto de la siguiente manera:

  • 0_Exploratory_Data_Analysis.ipynb: muestra el analisis y exploracion de los datos.
  • 1_Regresion_Properati_Final.ipynb: implementa un regresor realizando tuneo de hiperparámetros.
  • properati.zip: tiene de forma comprimida el archivo properati.csv, el cual es necesario para ejecutar las notebooks.
  • Exploracion: contiene notebooks explorando y graficando desde distintos puntos el dataset, estas notebooks fueron unidas utilizando nbmerge para crear la primer notebook que contiene toda la exploracion.

Resultados de la exploración de datos

Distribución 1

Distribución ciudades

Tasa de conversión

Outliers superficie

Precio por tipo de propiedad

Superficie cubierta por tipo

Wordcloud de comentarios de propietario

Algunas consideraciones sobre el tratamiento de datos

El dataset de Properati año 2017 al que accedimos para realizar este proyecto se encontraba con muchos errores. Algunas estrategias para subvertirlos fueron:

  • Imputación
  • Limpieza de nulos
  • Se acudió al registro de conversión para poder realizar la misma desde monedas regionales a USD teniendo en cuenta su fecha de publicación
  • Algunas propiedades fueron relocalizadas teniendo en cuenta los límites comunales de la Capital Federal

Equipo

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published