文章详情_毕业论文网

登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 文章详情

强化学习中格子世界问题分析与研究开题报告

 2022-09-09 14:49:36  

1. 研究目的与意义

1.1背景

强化学习(reinforcementlearning,rl)有着相当长的历史,但直到80年代末90年代初,强化学习技术才在人工智能,机器学习中得到广泛应用。强化学习是一种从环境状态到行为映射的学习技术,强化学习的思想来自于条件反射理论和动物学习理论,它是受到动物学习过程启发而得到的一种仿生算法,是一种重要的机器学习方法。agent通过对感知到的环境状态采取各种试探动作,获得环境状态的适合度评价值(通常是一个奖励或惩罚信号),从而修改自身的动作策略以获得较大的奖励或较小的惩罚,强化学习就是这样一种赋予agent学习自适应性能力的方法。

1.2目的

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究内容和预期目标

2.1 研究内容

2.1.1强化学习(reinforcementlearning,rl)

(1)基本原理

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 研究的方法与步骤

第一步,需要对格子世界系统进行需求分析,掌握其大致的功能需求。然后进行资源搜索,了解一些现有的课程管理系统的功能、界面等,与我的需求分析进行比较,查漏补缺,并对功能进行优化。然后进行功能定义,角色功能描述。

第二步,在对需求进行了大致分析后,进行概要设计,包括对总体功能的设计,主要功能的设计。与此同时,也可参考其他成熟的软件系统,以完善自己的设计。

第四步,进行详细设计,对各个功能的流程进行设计,达到简化流程,操作方便的目的。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 参考文献

[1]singhs.agentsandreinforcementlearning[m].sanmatco,ca,usa:millerfreemanpublishinc,1997.

[2]张汝波,顾国昌,刘照德.强化学习理论、算法及应用[j].控制理论与控制应用,2000,17(5):637-642.

[3]suttons,bartog.reinforcementlearning:anintroduction[m].cambridge,ma,usa:mitpress,1998.

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

5. 计划与进度安排

(1)2022.2.1 ----2022.3.10查阅资料,撰写开题报告

(2)2022.3.11 ----2022.3.18 需求分析,熟悉开发工具

(3)2022.3.19 ----2022.3.31 概要设计

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

企业微信

Copyright © 2010-2022 毕业论文网 站点地图