Skip to content

Latest commit

 

History

History
49 lines (35 loc) · 2.59 KB

index.md

File metadata and controls

49 lines (35 loc) · 2.59 KB
layout menu title title-menu
page
yes
Kurzy R
Úvod

Vyučuji jazyk R a jeho aplikace v data science. Kurzy jsou určené pro studenty, kteří chtejí začít s datovou analytikou, i pro profesionály, kteří si chtějí rozšířit své možnosti o další nástroj. Učím zejména moderní metody jazyka R pomocí tidyverse, čímž jsou mé kurzy unikátní.

  • Datová analýza a vizualizace
  • Statistika
  • Machine learning
  • Programování v R

Co je tidyverse?

Tidyverse je soubor knihoven v R speciálně uzpůsobených pro práci s daty. Práce s daty je díky němu intuitivní a výsledný kód velmi snadno čitelný. Začátečník pomocí něj dokáže na pár řádcích kódu udělat takovou úpravu dat, která by v základním R vyžadovala zkušeného programátora.

Mezi nejpoužívanější knihovny patří dplyr pro úpravu dat, ggplot2 pro vizualizaci a purrr pro funkcionální programování. Patří sem však i specifické balíky pro jednoduché načítání dat, práci s textem, nebo i stahování dat z webových stránek. Kompletní seznam knihoven naleznete na oficiálních stránkách tidyverse{:target="_blank"}.

O lektorovi

Vystudoval jsem statistiku a optimalizaci na Matematicko-fyzikální fakultě Univerzity Karlovy. Během studia jsem pracoval jako analytik v bankovnictví a denně jsem tak využíval nástroje jako SQL, Excel a R. Po studiu jsem se začal věnovat vývoji predikčních modelů v R a Pythonu. Mimo klasického zaměstnání se věnuji také výuce - jak individuální, tak skupinové. Začal jsem jako doučující matematiky a statistiky pro vysokoškoláky a nyní vedu skupinové workshopy zaměřené na programování a machine learning.

Proč to dělám

Protože R je dle mého názoru nejlepší nástroj pro práci s daty a zaslouží si mnohem více pozornosti. Když mluvím o R, tak tím nemyslím samotný jazyk, ale také nespočetné množství užitečných knihoven a širokou komunitu kolem tohoto jazyka. Spoustu uživatelů odradí už na začátku. Chyba však není na straně samotného jazyka, ale u způsobu, jakým je často vyučován.

Na všech vysokých školách a ve většině soukromých kurzech se učí "základní" R. Ten je vhodný v situaci, kdy máme data připravená a chceme pouze provádět statistické výpočty. Což funguje právě jen v kurzech statistiky. V reálném světě je většina práce (60 - 80 %) právě příprava a čištění dat. A právě na tuto část existuje spousta užitečných knihoven, o kterých mluvím na svých kurzech.