DeepMind發(fā)表博客文章,提出一種稱為SAC-X(計劃輔助控制)的新學(xué)習(xí)范式,旨在解決讓AI以最少的先驗知識,從頭開始學(xué)習(xí)復(fù)雜控制問題的挑戰(zhàn)。

這在真實環(huán)境中成功讓機械臂從頭開始學(xué)習(xí)拾放物體。SAC-X 是基于從頭開始學(xué)習(xí)復(fù)雜的任務(wù)這種想法,即一個智能體首先應(yīng)該學(xué)習(xí)并掌握一套基本技能。就像嬰兒在爬行或走路前必須具有協(xié)調(diào)能力和平衡能力,為智能體提供與簡單技能相對應(yīng)的內(nèi)在目標(biāo)(具有輔助作用),這會增加它理解和執(zhí)行更復(fù)雜任務(wù)的可能性。研究者認為,SAC-X是一種通用的強化學(xué)習(xí)方法,未來可以應(yīng)用于機器人以外的更廣泛領(lǐng)域。
責(zé)任編輯:吳一波