Skip to content

Latest commit

 

History

History
101 lines (73 loc) · 2.98 KB

joshuaBE.md

File metadata and controls

101 lines (73 loc) · 2.98 KB

Pomniki przyrody w Raciborzu

Jan Pawlukiewicz

Źródło danych

Wikipedia

Co zostało zrobione?

  • Pobranie surowych danych ze strony: Wikipedia - raw data
  • Import danych do Google-Refine
  • Oczyszczenie danych w licznych krokach (wybranie interesujacych nas danych)
  • Eksport danych do postaci JSON

Fragment danych wyeksportowanych do JSON-a:

    {
      "nazwa" : "Dąb biały",
      "inna_nazwa" : "Quercus alba, odmiana łyżkowata Elongata",
      "wysokosc" : 24,
      "korona_drzewa" : 22,
      "piersnica" : 107,
      "obwod" : 336,
      "wiek" : "ok. 120 lat",
      "ustanowiono" : "17 grudnia 1992",
      "opis" : "Jest to najprawdopodobniej najgrubszy dąb biały w Polsce. 
                Znajduje się w dobrym stanie zdrowotnym. Objęto go ochroną w celach 
                naukowo-dydaktycznych, ze względu na atrakcyjny pokrój drzewa oraz 
                budowę morfologiczną liści i kory drzewa, a także ze względu na pokaźne 
                rozmiary. Jest to również egzotyczny gatunek pochodzący z 
                Ameryki Północnej, rzadko spotykany w Polsce."
    }

Więcej: Tutaj

Import danych do bazy (z katalogu projektu)

mongoimport --db test --collection pomniki --file data/json/pomniki_przyrody_w_raciborzu.json

Agregacje na bazie danych census1881

Link to skryptu: Tutaj.

Ilość wyznawców 10 najpopularniejszych religii

religion =  census.aggregate([ 
  {'$group' => { _id: '$religion', count: {'$sum' => 1}}},
  {'$project' => {_id: 0, religion: '$_id', count: '$count'}},
  {'$sort' => { count: -1 }},
  {'$limit' => 10}
])

Wynik Google Chart:

W innej formie:

Średnia wieku w 10 najpopularniejszych religiach

religion2 =  census.aggregate([ 
  {'$group' => { _id: '$religion', avg_age: {'$avg' => '$age'}, 
    count: {'$sum' => 1}}},
  {'$project' => {_id: 0, religion: '$_id', avg_age: '$avg_age', count: '$count'}},
  {'$sort' => { count: -1, avg_age: -1 }},
  {'$limit' => 10}
])

Wynik Google Chart:

Religie o najstarszych wyznawcach (100 lub więcej wiernych)

religion3 =  census.aggregate([ 
  {'$group' => { _id: '$religion', avg_age: {'$avg' => '$age'}, 
    count: {'$sum' => 1}}} ,
  {'$project' => {_id: 0, religion: '$_id', avg_age: '$avg_age', count: '$count'}},
  {'$match' => {count: {'$gte' => 100}}},
  {'$sort' => { avg_age: -1 }},
  {'$limit' => 10}
])

Wynik: