登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 开题报告 > 电子信息类 > 信息工程 > 正文

基于强化学习的游戏赛车控制算法的实践开题报告

 2022-01-25 11:01  

全文总字数:3249字

1. 研究目的与意义及国内外研究现状

强化学习(reinforcement learning),是机器学习的一个重要分支,也是当下机器学习最火热的研究领域。强化学习的本质是解决决策问题,针对一个具体问题得到一个最优的策略,使得在该策略下获得的奖励最大。强化学习的思想与人类的学习过程有很大的相似性,因此被认为是迈向通用人工智能的重要途径。

随着数据处理能力的逐步提升以及深度学习的发展,强化学习解决复杂问题的能力也得到了较大的提高,除应用于机器人控制、无人驾驶、游戏博弈,还应用于制造业、电商广告推荐等与我们生活息息相关的领域中。

在无人驾驶的决策过程中,模拟器起着非常重要的作用。决策模拟器负责对环境中常见的场景进行模拟,例如车道情况、路面情况、障碍物分布等。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究的基本内容

一、了解课题研究的背景与意义、国内外研究现状。

二、熟悉torcs模拟器的使用。

三、学习并掌握q-learning 等常用的强化学习算法原理即实现。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 实施方案、进度安排及预期效果

实施方案:一、去图书馆或网络上查阅相关的资料,了解该项目的研究价值。

二、通过查阅的资料确定研究方向及研究的可行性。

三、学习基于基于强化学习的控制算法的原理,了解模拟器系统如何工作与运行。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 参考文献

[1]richard sutton.reinforcement learning: an introduction 2017,second edition

[2]morganclaypool.algorithm for reinforcement learning

[3]anschel, o., baram, n., and shimkin, n. (2017). averaged-dqn: variance reduction and stabilization for deep reinforcement learning. in the international conference on machine learning (icml).

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

企业微信

Copyright © 2010-2022 毕业论文网 站点地图