沈陽自動化所“機器人行為智能”研究取得進展
中國科學院沈陽自動化研究所研究人員近期提出了一種可提升機器人行為智能的新方法,相關成果發(fā)表于IEEE Transactions on Cognitive and Developmental Systems。
人類在日常生活中處理復雜任務時表現(xiàn)出驚人的適應性,這種適應性是個體學習能力的直接體現(xiàn),使人類可以自主、增量地提升自身的行為能力。
研究人員以 Q 學習與自適應核線性(Adaptive Kernel Linear,AKL)模型等網絡化模型為基礎,構建了機器人增量式學習方法的新框架,賦予機器人根據數(shù)據與案例的實時獲取自發(fā)產生新的行為模式,以提升機器人的行為智能能力。新的算法可通過自主、示教等不同方式,使機器人對自我行為進行評估,并實時改變自身行為產生的網絡結構和參數(shù),實現(xiàn)行為知識的在線學習和增量學習。
該成果目前已應用在機器人自主導航中,并且通過大量的仿真和試驗使機器人可以以一個空網絡為起點,增量式學習并形成新的行為以適應新的場景,同時不會遺忘之前所學習的行為。
該研究得到國家自然科學基金和機器人學重點實驗室的支持。

行為智能學習方法原理(左圖)、在移動機器人上的實驗(右圖)
來源: 沈陽自動化研究所