Skip to content

Latest commit

 

History

History
4 lines (2 loc) · 733 Bytes

File metadata and controls

4 lines (2 loc) · 733 Bytes

7.2 Setting

이 section에서의 실험은 partially observable, cooperative multi-agent상황을 가정합니다. 이 때, Markov state(실제 state)$$ s_t$$로 부터, discrete feature의 집합 $$f_t$$는 모든 agent가 common knowledge로 알고 있는 $$f^{\mathrm{pub}}_t$$와 agent 전체가 알고있지는 않더라도 한 agent 이상이 알고 있는 정보(전부는 아닌) $$ f^\mathrm{{pri}}_t$$로 이루어져 있습니다. 예를 들면, 테이블에 있는 모든 정보는 $$f^{\mathrm{pub}}_t$$에 속하지만, 한 agent가 각자가 들고 있는 패는 $$ f^\mathrm{{pri}}_t$$에 속합니다. 여기서는 이러한 state feature의 분리가 모두에게 알려져있다는 것을 가정합니다.