Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Uitleg reinforcement learning #408

Closed
jaap-vink opened this issue Nov 21, 2024 · 1 comment
Closed

Uitleg reinforcement learning #408

jaap-vink opened this issue Nov 21, 2024 · 1 comment
Assignees
Milestone

Comments

@jaap-vink
Copy link

Beschrijf je suggestie

Op https://minbzk.github.io/Algoritmekader/overhetalgoritmekader/soorten-algoritmes/#zelflerende-algoritmes staat een uitleg van reinforcement leaning die enigszins beperkt is. Misschien dat dit een beter beeld geeft?

“Reinforcement Learning” leert continu op basis wat er in het verleden is om het in de toekomst beter te doen. Zo worden ze elke keer een beetje slimmer!
Robotstofzuigers gebruiken bijvoorbeeld reinforcement learning. Ze proberen dingen uit, kijken wat goed of slecht gaat, en leren daarvan om het de volgende keer beter te doen. Stel je voor dat je een nieuwe robotstofzuiger in je huis hebt. In het begin kent de stofzuiger je huis niet. Hij weet niet waar de meubels staan, waar de deuren zijn of waar hij vaak moet schoonmaken. Elke keer als de robotstofzuiger aan het werk gaat, probeert hij verschillende routes in je huis. Soms botst hij tegen een stoel of raakt hij vast onder de bank. Maar elke keer als dit gebeurt, onthoudt hij het en denkt: "Oké, dat was niet goed. Laten we dat de volgende keer anders doen."
Aan de andere kant, als hij een plek heel goed schoonmaakt en snel klaar is, denkt hij: "Dat ging goed! Ik moet dat vaker zo doen."
Dit is hoe reinforcement learning werkt. De robotstofzuiger “probeert” dingen uit, kijkt wat “goed” of “slecht” gaat, en “leert” daarvan.

Leg uit waarom dit een goede toevoeging is aan het Algoritmekader

Belangrijk om uit te leggen wat RI anders maakt. Dat is met name het continu autonoom leren en zo, ook autonoom, het AI-model aanpassen.

@BartdeVisser
Copy link
Collaborator

@noutvandeijck : Bespreken met Corine in hoeverre deze tekst kan worden aangepast, afgezet tegen leesbaarheid van de website.

noutvandeijck added a commit that referenced this issue Dec 18, 2024
uitleg reinforcement learning aangescherpt obv comments Jaap Vink (#408)
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

3 participants