Impartido por:
Manuel J. Parra Royón (manuelparra@decsai.ugr.es) PhD Student. BigData Time Series Data Mining
Soft Computing and Intelligent Information Systems / Distributed Computational Intelligence and Time Series Lab
Universidad de Granada
Taller realizado en Departamento de Estadística e Investigación Operativa de la Universidad Pública de Navarra.
- Introducción al procesamiento masivo de datos
- R + Spark + BigData
- Análisis Interactivo
- Datasets para el taller de Spark
- Entorno de trabajo del taller
- Inicio del entorno de trabajo del taller
- Toma de contacto con Spark + R
- Lectura y escritura de datos en Spark +R
- Operaciones con SparkDataFrames
- Uso de pipes para flujos de datos
- Procesamiento de datos con SparkSQL
- Machine Learning con SparkR
- Biblioteca SparklyR
- MachineLearning con SparkylR
- Envío de trabajos con spark-submit
- Visualización de datos (beta)
- Uso avanzado de Spark: Scala, Streaming, etc. Amazon AWS
- Soluciones a los problemas