Este es mi perfil de Github, donde iré subiendo ideas y proyectos sobre Ingeniería de Datos y Ciencia de Datos. 🔥🔥🔥
Pinned Loading
-
Streaming-data-with-Kafka-Spark-and-S3
Streaming-data-with-Kafka-Spark-and-S3 PublicCanalización de datos en tiempo real con Apache Kafka, procesamiento con Spark Streaming y storage en un bucket de Amazon S3.
Python
-
Data-Lakehouse-with-Amazon-S3-and-Redshift
Data-Lakehouse-with-Amazon-S3-and-Redshift PublicCanalización desde MongoDB hacia un Data Lake de Amazon S3, creación de Data Warehouse en Amazon Redshift y visualización en Tableau.
Python
-
API-REST-with-Python-and-FastAPI
API-REST-with-Python-and-FastAPI PublicAPI REST construída con framework FastAPI y web server Uvicorn, usando esquemas de validación Pydantic y testeando con VSCode Thunder Client.
Python
-
Big-Data-with-Spark-MLlib-and-Databricks-
Big-Data-with-Spark-MLlib-and-Databricks- PublicPredicción de incumplimiento crediticio con algoritmo de Spark MLlib Gradient Boosting Trees, usando cluster de procesamiento de Databricks.
Jupyter Notebook
-
ETL-with-Airflow-and-Docker
ETL-with-Airflow-and-Docker PublicProceso ETL desde CSV, orquestado con Apache Airflow en contenedores Docker, almacenamiento en PostgeSQL y visualización en Power BI.
Python
-
Random-scripts
Random-scripts PublicRepositorio donde iré alojando scripts random que he ido creando en Python (varias librerías), SQL (funciones de ventana), Visual Basic, etc.
Jupyter Notebook
If the problem persists, check the GitHub status page or contact support.