- 相關(guān)推薦
基于Sarsa算法的無人直升機懸停控制
無人直升機懸?刂,利用Sarsa增強學(xué)習(xí)算法設(shè)計.將Sarsa增強學(xué)習(xí)算法與多層前饋神經(jīng)網(wǎng)絡(luò)相結(jié)合,對控制器參數(shù)進行在線調(diào)整,實現(xiàn)對微小型無人直升機懸?刂菩阅艿脑诰優(yōu)化.增強學(xué)習(xí)的值函數(shù)逼近器采用N10-12-16結(jié)構(gòu)的多層前饋神經(jīng)網(wǎng)絡(luò),權(quán)值學(xué)習(xí)采用直接梯度下降的近似梯度迭代算法,用ε-Greed策略進行行為選擇.
作 者: 蔡文瀾 王俊生 稅海濤 馬宏緒 CAI Wen-lan WANG Jun-sheng SHUI Hai-tao MA Hong-xu 作者單位: 蔡文瀾,CAI Wen-lan(國防科技大學(xué),機電工程與自動化學(xué)院,湖南,長沙,410073;空軍航空大學(xué),航空控制工程系,吉林,長春,130022)王俊生,稅海濤,馬宏緒,WANG Jun-sheng,SHUI Hai-tao,MA Hong-xu(國防科技大學(xué),機電工程與自動化學(xué)院,湖南,長沙,410073)
刊 名: 兵工自動化 ISTIC 英文刊名: ORDNANCE INDUSTRY AUTOMATION 年,卷(期): 2007 26(7) 分類號: V249.1 TP273 關(guān)鍵詞: 無人直升機 懸停控制 Sarsa增強學(xué)習(xí)算法 多層前饋神經(jīng)網(wǎng)絡(luò)【基于Sarsa算法的無人直升機懸?刂啤肯嚓P(guān)文章:
小型無人直升機控制方法探討04-30
基于平面控制格網(wǎng)的相機標(biāo)定算法研究04-28
基于蟻群算法的無人機航路規(guī)劃04-29
無人直升機欠驅(qū)動飛行控制系統(tǒng)設(shè)計與仿真04-27
基于Bellman-Ford算法的無人機路徑規(guī)劃研究04-30
基于改進A*算法的無人機航路規(guī)劃方法研究04-30