必威(betway·官方网站)西汉姆联-EURO CUP

在线办公系统

编辑部公告

·	new《太原理工大学学报》征稿函

·	《太原理工大学学报》编辑部招募启事

·	编辑部关于缴费的温馨提示

作者缴纳版面费说明

期刊在线

高级检索

专题阅读

当期目录

过刊浏览

主管单位：山西省教育厅
主办单位：太原理工大学
出版单位：《太原理工大
　　　　学学报》编辑部
主　　编：孙宏斌
执行主编：冯国瑞
常务副主编：刘旭光
副主编：郝晓刚董宪姝
董晓强强　彦
熊晓燕　贾丽红
编辑部主任：贾丽红
国内发行：太原市邮政局
　　　　　报刊发行局
国外发行：中国国际图书
　　　　　贸易总公司
邮发代号：22-27
CN：14-1220/N
ISSN：1007-9432

您当前的位置：首页 > 论文 > 优先出版

引用本文:

史腾飞1,王莉 , 臧嵘.深度强化学习局部策略迁移方法[J/OL].太原理工大学学报,DOI:10.16355／j.tyut.1007-9432.20230016

PDF点击下载大小：1010KB浏览：次下载：次

深度强化学习局部策略迁移方法

DOI:

10.16355／j.tyut.1007-9432.20230016

摘要:

强化学习策略迁移是一条降低深度强化学习训练消耗的有效途径，其中，局部策略迁移是在较小粒度上实现策略的迁移，它对整体策略性能的提升和策略灵活组合形成新整体策略有重要意义。但当今大多策略迁移研究聚焦于研究整体策略迁移，研究局部策略迁移的相对较少，对此本文提出了深度强化学习局部策略迁移方法。该方法借鉴了软件工程中“高内聚，低耦合”的思想，通过对作为策略载体的神经网络进行划分，使得不同子神经网络承载不同局部策略，然后通过对子神经网络的迁移，实现局部策略迁移，该方法支持局部策略灵活替换和组合，形成性能更优秀和适应新环境的新总策略。本文选取经典深度强化学习算法DQN作为实验算法，对比DQN算法使用本文方法前后的迁移能力和表现性能。结果表明，DQN算法使用本文方法后实现了局部策略迁移的同时还提升了约27.5%表现性能。

关键字:

深度强化学习；局部策略迁移；DQN