基于判别树的重复囚徒困境博弈模型与仿真开题报告

2021-03-15 22:31:15

1. 研究目的与意义（文献综述）

囚徒困境（prisoner's dilemma ）：两个被捕的囚徒之间的一种特殊博弈，说明为什么甚至在合作对双方都有利时，保持合作也是困难的。囚徒困境是博弈论的非零和博弈中具代表性的例子，反映个人最佳选择并非团体最佳选择。虽然困境本身只属模型性质，但现实中的价格竞争、环境保护等方面，也会频繁出现类似情况。

重复博弈是一种特殊的博弈，在博弈中，相同结构的博弈重复多次，甚至无限次。其中，每次博弈称为“阶段博弈”。在每个阶段博弈中，参与人同时行动。因为其他参与人过去的行动的历史是可以观测的，因此在重复博弈中，每个参与人可以使自己在每个阶段选择的策略依赖于其他参与人过去的行为。

在重复的囚徒困境中，博弈被反复地进行。因而每个参与者都有机会去“惩罚”另一个参与者前一回合的不合作行为。这时，合作可能会作为均衡的结果出现。欺骗的动机这时可能被惩罚的威胁所克服，从而可能导向一个较好的、合作的结果。作为反复接近无限的数量，纳什均衡趋向于帕累托最优。

剩余内容已隐藏，您需要先支付后才能查看该篇文章全部内容！

2. 研究的基本内容与方案

基本内容：采用多智能体仿真平台repast对有限理性的个体在规则网络环境中进行囚徒困境博弈，在博弈过程中引入决策树进行局域的学习不断更新策略。

目标：在重复博弈的过程中找到最优策略，通过仿真结果分析网络个体间协作关系的演化过程、网络收益和个体收益的分布状况。

拟采用的技术方案及措施：基于repast仿真平台，采用java开发语言设计与开发囚徒困境博弈模型以及相应的学习机制，并完成相关的分析。

剩余内容已隐藏，您需要先支付后才能查看该篇文章全部内容！

3. 研究计划与安排

第1周——第4周搜集资料，学习java编程语言，做到能独立使用java编写软件；学习博弈论中有关决策树的相关知识，了解决策树算法的基本原理及特点，撰写开题报告；
第5周——第6周对整个毕业设计有一个初步的整体认识，完成大致构想，论文开题；
第7周——第12周在repast平台上进行基于决策树的重复囚徒困境的建模及仿真，完善毕业设计，在达到预期要求后，进行论文初稿的撰写；
剩余内容已隐藏，您需要先支付后才能查看该篇文章全部内容！
4. 参考文献（12篇以上）
[1]谢逢洁, 复杂网络上的博弈，清华大学出版社，2016年；
[2]明日科技,《java从入门到精通》（第三版）,清华大学出版社,2012年;
[3]王宇宾，基于repastsimphony平台的建模与仿真技术，计算机系统应用，2015年10期;
剩余内容已隐藏，您需要先支付 10元 才能查看该篇文章全部内容！立即支付

注册

找回密码