Skip to content

Introducción al modelado, inferencia y análisis de modelos Bayesianos

License

Notifications You must be signed in to change notification settings

rosgori/Modelado_Bayesiano

 
 

Repository files navigation

Prefacio

La estadística trata sobre la recolección, organización, análisis e interpretación de datos, es por ello que la estadística es esencial para el correcto análisis de datos.

Existen dos grandes conjuntos de herramientas para analizar datos:

Análisis Exploratorio de Datos (EDA): Consiste en resúmenes numéricos como la media, moda, desviación estándar, rangos intercuartiles, etc (esto se conoce también como estadística descriptiva). Además hace énfasis en el uso de métodos visuales para inspeccionar los datos, como por ejemplo histogramas y gráficos de dispersión.

Estadística Inferencial: Consiste en usar datos para generar enunciados que exceden los propios datos. A veces esto implica realizar predicciones, a veces entender los detalles de algún fenómeno en particular o elegir entre varias explicaciones plausibles.

El foco de este curso está en aprender a realizar inferencias Bayesiana y luego usar métodos del análisis exploratorio de datos para resumir, interpretar, evaluar y comunicar los resultados de tales inferencias.

Muchos de los cursos y libros sobre estadística, al menos los dirigidos a no-estadísticos, enseñan una serie de recetas que más o menos tienen la siguiente forma.

  1. Diríjase a la alacena estadística
  2. Elija una lata y ábrala
  3. Agregue datos a gusto
  4. Revuelva hasta que los p-valores estén a punto, es decir por debajo de 0.05

La principal meta de estos cursos es la de enseñar a usar la lata adecuada y con suerte alguna que otra discusión sobre el emplatado. Personalmente nunca me gustó esta aproximación, la razón principal es que por lo general tiene como resultado gente confundida he incapaz de percibir o entender conceptualmente la unidad de los diferentes métodos enseñados.

En este curso se intenta una aproximación totalmente diferente. También aprenderemos recetas, pero intentaremos que los platos tengan un sabor más casero y menos enlatado, aprenderemos a mezclar ingredientes frescos que se acomoden a diferentes situaciones gastronómicas.

Este enfoque es posible por dos razones:

  • Una es ontológica: la estadística es una forma de modelado unificada bajo el marco de la teoría de probabilidad.
  • La otra es técnica: Software moderno como PyMC3 permite que a los practicantes definir resolver modelos de forma sencilla.

A quienes está dirijido?

Este es un curso introductorio para personas sin conocimiento previo de estadística o ciencia de datos. Se asume familiaridad con Python y librerías de Python usadas en análisis de datos como Numpy, matplotlib, Pandas, etc

Cómo usar este material

  • Versión estática: Al hacer click en los archivos que se muestran arriba (los que terminan en ipynb) podrás leer una versión estática del material. Es decir podrás ver el texto y las figuras pero no podrás modificarlos, ni interactuar con el material.

  • Versión interactiva online Binder.

  • Versión interactiva local. También es posible descargar el material y ejecutarlo en tu propia computadora. Para ello has click acá y sigue las instrucciones de la próxima sección (Instalación).

Instalación

Para usar este material es necesario tener instalado Python. Se recomienda la versión 3.6 o superior. Además es necesario instalar los siguientes paquetes:

  • PyMC3 3.7
  • NumPy 1.15
  • SciPy 1.1
  • Matplotlib 3.0.2
  • Ipython 7.2
  • Jupyter 1.0.0
  • ArviZ 0.4.1

Se recomienda instalar primero Anaconda. Luego instalar el resto de los paquetes con los comandos:

  • conda install -c conda-forge pymc3 arviz

Contribuciones

Todo el contenido de este repositorio es abierto, esto quiere decir que cualquier persona interesada puede contribuir al mismo. Todas las contribuciones serán bien recibidas incluyendo:

  • Correcciones ortográficas
  • Nuevas figuras
  • Correcciones en el código Python, incluidas mejoras de estilo
  • Mejores ejemplos
  • Mejores explicaciones
  • Correcciones de errores conceptuales

La forma de contribuir es vía Github, es decir los cambios deberán ser hechos en forma de pull requests y los problemas/bugs deberán reportarse como Issues.

About

Introducción al modelado, inferencia y análisis de modelos Bayesianos

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Jupyter Notebook 99.0%
  • Other 1.0%