强化学习中格子世界问题分析与研究开题报告
2022-09-09 14:49:36
1. 研究目的与意义
1.1背景
强化学习(reinforcementlearning,rl)有着相当长的历史,但直到80年代末90年代初,强化学习技术才在人工智能,机器学习中得到广泛应用。强化学习是一种从环境状态到行为映射的学习技术,强化学习的思想来自于条件反射理论和动物学习理论,它是受到动物学习过程启发而得到的一种仿生算法,是一种重要的机器学习方法。agent通过对感知到的环境状态采取各种试探动作,获得环境状态的适合度评价值(通常是一个奖励或惩罚信号),从而修改自身的动作策略以获得较大的奖励或较小的惩罚,强化学习就是这样一种赋予agent学习自适应性能力的方法。
1.2目的
2. 研究内容和预期目标
2.1 研究内容
2.1.1强化学习(reinforcementlearning,rl)
(1)基本原理
3. 研究的方法与步骤
第一步,需要对格子世界系统进行需求分析,掌握其大致的功能需求。然后进行资源搜索,了解一些现有的课程管理系统的功能、界面等,与我的需求分析进行比较,查漏补缺,并对功能进行优化。然后进行功能定义,角色功能描述。
第二步,在对需求进行了大致分析后,进行概要设计,包括对总体功能的设计,主要功能的设计。与此同时,也可参考其他成熟的软件系统,以完善自己的设计。
第四步,进行详细设计,对各个功能的流程进行设计,达到简化流程,操作方便的目的。
4. 参考文献
[1]singhs.agentsandreinforcementlearning[m].sanmatco,ca,usa:millerfreemanpublishinc,1997.
[2]张汝波,顾国昌,刘照德.强化学习理论、算法及应用[j].控制理论与控制应用,2000,17(5):637-642.
[3]suttons,bartog.reinforcementlearning:anintroduction[m].cambridge,ma,usa:mitpress,1998.
5. 计划与进度安排
(1)2022.2.1 ----2022.3.10查阅资料,撰写开题报告
(2)2022.3.11 ----2022.3.18 需求分析,熟悉开发工具
(3)2022.3.19 ----2022.3.31 概要设计


