融合動(dòng)作退出和軟獎(jiǎng)勵(lì)的強(qiáng)化學(xué)習(xí)知識(shí)推理方法
摘要: 針對(duì)深度強(qiáng)化學(xué)習(xí)推理方法中存在的過(guò)擬合以及稀疏獎(jiǎng)勵(lì)的問(wèn)題,提出了一種融合動(dòng)作退出和軟獎(jiǎng)勵(lì)的強(qiáng)化學(xué)習(xí)知識(shí)推理方法(knowledge reasoning method of reinforcement learning integrating action withdrawal and soft reward,AS-KRL)。AS-KRL使用門(mén)控循環(huán)神經(jīng)網(wǎng)絡(luò)(GRU)對(duì)歷史路徑信... (共8頁(yè))
開(kāi)通會(huì)員,享受整站包年服務(wù)