- Pobranie surowych danych ze strony: Wikipedia - raw data
- Import danych do Google-Refine
- Oczyszczenie danych w licznych krokach (wybranie interesujacych nas danych)
- Eksport danych do postaci JSON
{
"nazwa" : "Dąb biały",
"inna_nazwa" : "Quercus alba, odmiana łyżkowata Elongata",
"wysokosc" : 24,
"korona_drzewa" : 22,
"piersnica" : 107,
"obwod" : 336,
"wiek" : "ok. 120 lat",
"ustanowiono" : "17 grudnia 1992",
"opis" : "Jest to najprawdopodobniej najgrubszy dąb biały w Polsce.
Znajduje się w dobrym stanie zdrowotnym. Objęto go ochroną w celach
naukowo-dydaktycznych, ze względu na atrakcyjny pokrój drzewa oraz
budowę morfologiczną liści i kory drzewa, a także ze względu na pokaźne
rozmiary. Jest to również egzotyczny gatunek pochodzący z
Ameryki Północnej, rzadko spotykany w Polsce."
}
Więcej: Tutaj
mongoimport --db test --collection pomniki --file data/json/pomniki_przyrody_w_raciborzu.json
Link to skryptu: Tutaj.
religion = census.aggregate([
{'$group' => { _id: '$religion', count: {'$sum' => 1}}},
{'$project' => {_id: 0, religion: '$_id', count: '$count'}},
{'$sort' => { count: -1 }},
{'$limit' => 10}
])
Wynik Google Chart:
W innej formie:
religion2 = census.aggregate([
{'$group' => { _id: '$religion', avg_age: {'$avg' => '$age'},
count: {'$sum' => 1}}},
{'$project' => {_id: 0, religion: '$_id', avg_age: '$avg_age', count: '$count'}},
{'$sort' => { count: -1, avg_age: -1 }},
{'$limit' => 10}
])
Wynik Google Chart:
religion3 = census.aggregate([
{'$group' => { _id: '$religion', avg_age: {'$avg' => '$age'},
count: {'$sum' => 1}}} ,
{'$project' => {_id: 0, religion: '$_id', avg_age: '$avg_age', count: '$count'}},
{'$match' => {count: {'$gte' => 100}}},
{'$sort' => { avg_age: -1 }},
{'$limit' => 10}
])
Wynik: