layout | menu | title | title-menu |
---|---|---|---|
page |
yes |
Kurzy R |
Úvod |
Vyučuji jazyk R a jeho aplikace v data science. Kurzy jsou určené pro studenty, kteří chtejí začít s datovou analytikou, i pro profesionály, kteří si chtějí rozšířit své možnosti o další nástroj. Učím zejména moderní metody jazyka R pomocí tidyverse, čímž jsou mé kurzy unikátní.
- Datová analýza a vizualizace
- Statistika
- Machine learning
- Programování v R
Tidyverse je soubor knihoven v R speciálně uzpůsobených pro práci s daty. Práce s daty je díky němu intuitivní a výsledný kód velmi snadno čitelný. Začátečník pomocí něj dokáže na pár řádcích kódu udělat takovou úpravu dat, která by v základním R vyžadovala zkušeného programátora.
Mezi nejpoužívanější knihovny patří dplyr pro úpravu dat, ggplot2 pro vizualizaci a purrr pro funkcionální programování. Patří sem však i specifické balíky pro jednoduché načítání dat, práci s textem, nebo i stahování dat z webových stránek. Kompletní seznam knihoven naleznete na oficiálních stránkách tidyverse{:target="_blank"}.
Vystudoval jsem statistiku a optimalizaci na Matematicko-fyzikální fakultě Univerzity Karlovy. Během studia jsem pracoval jako analytik v bankovnictví a denně jsem tak využíval nástroje jako SQL, Excel a R. Po studiu jsem se začal věnovat vývoji predikčních modelů v R a Pythonu. Mimo klasického zaměstnání se věnuji také výuce - jak individuální, tak skupinové. Začal jsem jako doučující matematiky a statistiky pro vysokoškoláky a nyní vedu skupinové workshopy zaměřené na programování a machine learning.
Protože R je dle mého názoru nejlepší nástroj pro práci s daty a zaslouží si mnohem více pozornosti. Když mluvím o R, tak tím nemyslím samotný jazyk, ale také nespočetné množství užitečných knihoven a širokou komunitu kolem tohoto jazyka. Spoustu uživatelů odradí už na začátku. Chyba však není na straně samotného jazyka, ale u způsobu, jakým je často vyučován.
Na všech vysokých školách a ve většině soukromých kurzech se učí "základní" R. Ten je vhodný v situaci, kdy máme data připravená a chceme pouze provádět statistické výpočty. Což funguje právě jen v kurzech statistiky. V reálném světě je většina práce (60 - 80 %) právě příprava a čištění dat. A právě na tuto část existuje spousta užitečných knihoven, o kterých mluvím na svých kurzech.