-
Notifications
You must be signed in to change notification settings - Fork 59
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Split collections into separate entries #589
Comments
It seems that mostly the issue is, when HTML is given as resource and then you click on it and it has multiple excel etc linked. @keeganmcbride can you filter resources out, what then @tkutsar can go through? |
aadressiandmed.md: aegviiduvallavalitsus.md: ahhaateaduskeskus-avalikinfo.md: ajaloolised-vaatlusandmed.md: avaliku-korra-vastased-ja-avalikus-kohas-toime-pandud-syyteod.md: basseinid.md: basseinide-veeproovid.md: dea.md: digar.md: eesti-hariduse-infos-steemi-avaandmed.md: eesti-kirjandusmuuseumi-arhiivide-avaandmed.md: eesti-kirjandusmuuseumi-keeleressursid.md: eesti-looduse-infos-steem.md: eesti-patendiameti-kaubam-rkide-avalikud-andmed.md: eesti-spordiregistri-avaandmed.md: eesti-teadusinfos-steem.md: eesti-topgraafia-andmekogu.md: ehitisregister.md: ehitusgeoloogia_andmekogu.md: eksamite-infos-steemi-avaandmed.md: erb.md: esthub-teenused.md: eumetsat-satelliitandmed.md: fidek2015.md: geoloogilised-andmed.md: h-droloogiline-andmebaas-wiski.md: haldus-ja-asustus-ksuste-piirid.md: haridus-ja-teadusministeeriumi-avalik-dokumendiregister.md: harku-vallavalitsus.md: histranspordiregistri-avaandmed.md: ilmapank.md: ilmavaatluste-andmekogu.md: j--tmearuandluse-infos-steem.md: joogiveeallikad.md: joogiveeallikate-veeproovid.md: keskkonnaseireinfos-steem.md: kinnisvararegister.md: kitsenduste-kaardi-andmed.md: kohanimeregister.md: kollektiivlepingute-andmekogu.md: koolide-infos-steemi-avaandmed.md: kutseregister.md: liiklusjarelevalve-alased-syyteod.md: loodusliku-mineraalvee-ja-allikavee-allikad.md: loodusliku-mineraalvee-ja-allikavee-allikate-veeproovid.md: loodusliku-mineraalvee-ja-allikavee-andmed.md: loodusliku-mineraalvee-ja-allikavee-k-itlejad.md: loodusliku-mineraalvee-ja-allikavee-veeproovid.md: maa-ameti-avaandmete-portaal.md: maaamet-korgusandmed.md: maaamet-ortofotod.md: maakataster.md: majandustegevuse-register.md: mem-kalapuuk.md: mem-mahe.md: mem-mater.md: mem-msr.md: mem-riiklik-alkoholiregister.md: mem-soodakaitlejad.md: mem-sordiregister.md: mem-taimekaitsevahendite-register.md: mem-taimetervise-register.md: mem-toidukaitlejad.md: mem-tuulekaer.md: mem-vaetiseregister.md: mem-veterinaararstid.md: metsaseire-andmekogu.md: mullastiku-kaart.md: muuseumide-infos-steemi-avaandmed.md: oppeinfosusteem-tahvel.md: p-llumajandusloomade-register.md: p-llumassiivide-register.md: posti-sihtnumbrid-postiindeksid.md: pria-niitmisetuvastamine.md: probleemtooteregister.md: rahvusarhiivi-arhiivikirjeldused.md: riha-brief.md: riigieelarvega-seotud-materjalid.md: riigihangete-register.md: riigikogu-kantselei-erjk.md: riigikogu-veebi-avaandmed.md: sotsiaalministeerium-aveeb.md: spordikoolitus-esbl.md: statistika-andmebaas.md: statistilise-metsainventuuri-andmekogu.md: supluskohad.md: tallinna-andmekogud.md: tallinna-geoportaal.md: tartu-linna-avaandmed.md: tartu-linnavalitsuse-dokumendihaldussusteemis-avaldatud-oigusaktid.md: toetuste-saajad.md: ujulad.md: valimiste-avaandmed.md: varavastased-syyteod.md: veek-itlejad.md: |
Having only one filtering condition, namely format HTML will produce a lot of false positives. I don't have that many great suggestions for solving that issue, but what I've noticed is that usually the title of the dataset is "Avaandmed". Following the same logic, keywords to use to filter out these pages could also be "Andmekogud" or other Estonian words for datasets etc. |
https://opendata.riik.ee/andmehulgad/eesti-topgraafia-andmekogu/ |
another possible keyword "Infosüsteem" https://opendata.riik.ee/andmehulgad/keskkonnaseireinfos-steem/ |
Or "Portaal" https://opendata.riik.ee/andmehulgad/tallinna-geoportaal/ this one also has many apps that have not been added to Raknedused. |
All existing datasets should be gone over and checked whether they are correctly linked to the portal (at dataset level, description sufficient etc). At the same time, links should be double-checked for open data that isn't already linked to ODP.
The text was updated successfully, but these errors were encountered: