Multiagent systems; Models; Learning; Artificial intelligence; Marl(multi-agent reinforcement learning); Dec-pomdp(decentralized partially observable markov decision process);
機譯:基于多功能系統(tǒng)的微電網(wǎng)順序能量管理策略,使用最優(yōu)加權正規(guī)讀取機器和決策樹
機譯:D-環(huán)絲氨酸有助于健康人的程序學習,而不是聲明式學習:D-環(huán)絲氨酸和丙戊酸對非情感性記憶任務執(zhí)行過程中過夜特性影響的隨機對照試驗。
機譯:具有初始狀態(tài)學習的自適應模糊迭代學習控制,用于領導者跟隨多主體系統(tǒng)的協(xié)調控制
機譯:決策空間中任務和注意力控制的并發(fā)學習
機譯:狀態(tài)和動作抽象對并發(fā),干擾,非突發(fā)性任務的控制器開發(fā)的影響。
機譯:來自聚電解質多層的DNA釋放使用電荷移位陽離子聚合物制造的多層:可調時間控制和順序多蛋白酶釋放
機譯:共享的問題使學習倍增:雙向學習處理提高了復雜的動態(tài)決策任務的學習效率。