NeuralMAB #102

maypink · 2023-05-22T13:57:09Z

Implementation of Contextual Bandits and Neural Contextual Bandits from the article.
SyntheticExperimentHelper to compare bandits with each other

…e_drop_mutation-fails-to-remove-node

aim-pep8-bot · 2023-05-22T13:57:18Z

Hello @maypink! Thanks for updating this PR. We checked the lines you've touched for PEP 8 issues, and found:

There are currently no PEP 8 issues detected in this Pull Request. Cheers! 🍻

Comment last updated at 2023-06-09 11:06:35 UTC

maypink · 2023-05-25T13:10:20Z

Получается как-то так. Работает медленно, но сейчас:

я запускаюсь на cpu
эмбеддинги получаются достаточно большие (500 до подачи в сеть. Я пыталась условно их порезать до 20, по времени кратно быстрее не становится)

Например, для выращивания нод:

gkirgizov

Все выглядит разумно, вопросов по реализации нет, есть вопросы и комментарии по логике.

Сориентируй, как долго работает энкодер на графах? Сколько занимает итерация обучения нейронки?
Тестировала ли ты реализацию бандита на какой-то простой задаче? Бенчмарк из статьи, например. Можно без энкодера графов обойтись.
Нужно поставить эксперимент, где для разных графов (разных эмбеддингов) наилучшими будут различные действия. Например, если это оптимизация размера графов до N , то маленькие графы надо растить, а большие обрезать. Вот надо бы хотя бы такой тривиальный случай поймать, чтобы проверить , что контекст вообще работает. И затем что-то менее тривиальное надо придумать.

golem/core/optimisers/adaptive/neural_contextual_mab_agent.py

golem/core/adapter/nx_adapter.py

golem/core/optimisers/adaptive/neural_mab.py

gkirgizov · 2023-05-26T06:19:59Z

golem/core/optimisers/adaptive/neural_mab.py

+        deep_context = self._get_deep_context(context=context)
+        self._mab.fit(decisions=self._indices, rewards=uniform_rewards, contexts=n * [deep_context])


Предлагаю убрать этот обман бедного бандита с произвольным контекстом. Вместо этого использовать флаг is_fitted внутри partial_fit для первого фита

не совсем поняла, при чем тут первый фит. проблема же в том, что predict вызывается первее, чем partial_fit, так что нужен какой-то warm start

может, тогда в predict добавить проверку на is_fitted? и выдавать дефолтные вероятности, что-то такое

да будто бы это оно и есть. мы же одинаковый контекст с одинаковыми наградами передаем для всех рук, то есть вероятности не сдвинутся после такого

Мы вносим bias , давая бандиту ложные данные. Это не очень корректно, больше на хак похоже.
Если можем обойтись без этого, то лучше обойтись.

да вроде не можем: у бандитов есть warm_start, но он предназначен не для этого, а для того, чтобы просто задать начальное представление перед первым фитом. без фита все равно не обойтись

golem/core/optimisers/adaptive/neural_mab.py

maypink · 2023-06-05T13:49:32Z

добавлю сюда тоже
теперь можно смотреть вероятности мутаций в зависимости от контекста. контексы делятся по кластерам онлайн с помощью k-means. для задачи, где целей граф имеет размер 50, а изначальные графы находятся либо в промежутке 5-10, либо в 90-95, получается так:

Пик на втором графике объясняется тем, что граф за ~20 итераций уже уменьшился до размера 50.

codecov-commenter · 2023-06-06T12:53:42Z

Codecov Report

Merging #102 (ec61d3a) into main (3dc2a9b) will increase coverage by 1.25%.
The diff coverage is 24.59%.

@@            Coverage Diff             @@
##             main     #102      +/-   ##
==========================================
+ Coverage   71.30%   72.55%   +1.25%     
==========================================
  Files         120      126       +6     
  Lines        6691     7208     +517     
==========================================
+ Hits         4771     5230     +459     
- Misses       1920     1978      +58

Impacted Files	Coverage Δ
...m/core/optimisers/adaptive/mab_agents/mab_agent.py	`40.54% <ø> (ø)`
golem/core/optimisers/adaptive/neural_mab.py	`15.50% <15.50%> (ø)`
golem/core/adapter/nx_adapter.py	`80.00% <16.66%> (-17.73%)`	⬇️
golem/visualisation/opt_history/fitness_line.py	`33.78% <20.37%> (-5.04%)`	⬇️
...misers/adaptive/mab_agents/contextual_mab_agent.py	`31.03% <31.03%> (ø)`
...olem/core/optimisers/genetic/operators/mutation.py	`90.62% <42.85%> (-1.77%)`	⬇️
golem/core/optimisers/adaptive/context_agents.py	`63.63% <63.63%> (ø)`
...adaptive/mab_agents/neural_contextual_mab_agent.py	`77.77% <77.77%> (ø)`
golem/core/optimisers/adaptive/operator_agent.py	`92.15% <100.00%> (+0.07%)`	⬆️
golem/core/optimisers/genetic/gp_params.py	`100.00% <100.00%> (ø)`
... and 1 more

... and 13 files with indirect coverage changes

examples/adaptive_optimizer/experiment_setup.py

examples/adaptive_optimizer/mab_experiment_different_targets.py

examples/synthetic_graph_evolution/graph_search.py

experiments/mab/mab_synthetic_experiment_helper.py

requirements.txt

* fix * fix#2 * minor * initial neural mab * add context agents enum * add experiments * launch * minor * add contextual mab to pull arms * put NN in a separate class & add docstrings * adjust settings * change places of mutations * fixes after review * minors * minors * add contextual bandits * add experimenter & multiple fitness lines visualizer * experiments * probabilities for contexts * minors & docstrings * fix pep8 * fix requirements * minor * minor * add average visualizatio * fixes after review * minors * update requirements * Update unit-build.yml * Update unit-build.yml * fix pep8 * Update unit-build.yml

maypink added 9 commits March 17, 2023 11:52

fix

ff02744

fix#2

987cce0

minor

022363c

Merge branch 'main' of https://github.com/aimclub/GOLEM into 66-singl…

d24dfa2

…e_drop_mutation-fails-to-remove-node

Merge branch 'main' of https://github.com/aimclub/GOLEM

4900e5f

Merge branch 'main' of https://github.com/aimclub/GOLEM

cc8729f

Merge branch 'main' of https://github.com/aimclub/GOLEM

f320cfa

Merge branch 'main' of https://github.com/aimclub/GOLEM

f3ca604

Merge branch 'main' of https://github.com/aimclub/GOLEM

b76b1c3

gkirgizov requested changes May 26, 2023

View reviewed changes

Merge branch 'main' of https://github.com/aimclub/GOLEM

13a76bf

maypink requested a review from gkirgizov June 5, 2023 15:01

gkirgizov requested changes Jun 7, 2023

View reviewed changes

gkirgizov linked an issue Jun 8, 2023 that may be closed by this pull request

Implement state embedding of nodes/graphs #77

Closed

3 tasks

gkirgizov approved these changes Jun 9, 2023

View reviewed changes

maypink added 11 commits June 9, 2023 13:59

Merge branch 'main' of https://github.com/aimclub/GOLEM

df115e3

initial neural mab

919bf83

add context agents enum

4b65e14

add experiments

1b2f487

launch

1b2a59d

minor

1a2b467

add contextual mab to pull arms

f25c04e

put NN in a separate class & add docstrings

d08c2fa

adjust settings

474ed33

change places of mutations

4e9c43b

fixes after review

7e8a9c0

maypink and others added 17 commits June 9, 2023 13:59

minors

1d892f5

minors

c6718ec

add contextual bandits

37a7513

add experimenter & multiple fitness lines visualizer

0d973dc

experiments

309a86e

probabilities for contexts

00d30a6

minors & docstrings

7348202

fix pep8

e4ff484

fix requirements

076a2ab

minor

e5ca14c

minor

8a1dd21

add average visualizatio

b01fe96

fixes after review

2d6613b

minors

5faf93d

update requirements

717a466

Update unit-build.yml

b03c538

Update unit-build.yml

fa8973a

maypink force-pushed the contextual_bandits branch from dbf3521 to fa8973a Compare June 9, 2023 11:00

maypink and others added 2 commits June 9, 2023 14:01

fix pep8

225a4b2

Update unit-build.yml

0e9389d

maypink merged commit 072f027 into main Jun 9, 2023

maypink deleted the contextual_bandits branch June 9, 2023 11:14

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

NeuralMAB #102

NeuralMAB #102

maypink commented May 22, 2023 •

edited

Loading

aim-pep8-bot commented May 22, 2023 •

edited

Loading

maypink commented May 25, 2023 •

edited

Loading

gkirgizov left a comment

gkirgizov May 26, 2023

maypink May 29, 2023

gkirgizov May 29, 2023

maypink May 29, 2023

gkirgizov Jun 7, 2023 •

edited

Loading

maypink Jun 9, 2023

maypink commented Jun 5, 2023

codecov-commenter commented Jun 6, 2023

		deep_context = self._get_deep_context(context=context)
		self._mab.fit(decisions=self._indices, rewards=uniform_rewards, contexts=n * [deep_context])

NeuralMAB #102

NeuralMAB #102

Conversation

maypink commented May 22, 2023 • edited Loading

aim-pep8-bot commented May 22, 2023 • edited Loading

Comment last updated at 2023-06-09 11:06:35 UTC

maypink commented May 25, 2023 • edited Loading

gkirgizov left a comment

Choose a reason for hiding this comment

gkirgizov May 26, 2023

Choose a reason for hiding this comment

maypink May 29, 2023

Choose a reason for hiding this comment

gkirgizov May 29, 2023

Choose a reason for hiding this comment

maypink May 29, 2023

Choose a reason for hiding this comment

gkirgizov Jun 7, 2023 • edited Loading

Choose a reason for hiding this comment

maypink Jun 9, 2023

Choose a reason for hiding this comment

maypink commented Jun 5, 2023

codecov-commenter commented Jun 6, 2023

Codecov Report

maypink commented May 22, 2023 •

edited

Loading

aim-pep8-bot commented May 22, 2023 •

edited

Loading

maypink commented May 25, 2023 •

edited

Loading

gkirgizov Jun 7, 2023 •

edited

Loading