基于统计的对手模型及在规划中的应用.doc
约42页DOC格式手机打开展开
基于统计的对手模型及在规划中的应用,全文42页约20000字论述翔实 目录目录2摘要4abstract5第一章 绪论6第二章 对手建模92.1 对手模型的起源和研究意义92.1.1 经典博奕92.1.2 敌对搜索中的应用102.1.3 多主体环境中的应用112.2 多主体环境中的对手建模112.2.1 bdi模型112....
内容介绍
此文档由会员 棉花糖糖 发布
基于统计的对手模型及在规划中的应用
全文42页 约20000字 论述翔实
目 录
目 录 2
摘 要 4
ABSTRACT 5
第一章 绪论 6
第二章 对手建模 9
2.1 对手模型的起源和研究意义 9
2.1.1 经典博奕 9
2.1.2 敌对搜索中的应用 10
2.1.3 多主体环境中的应用 11
2.2 多主体环境中的对手建模 11
2.2.1 BDI模型 11
2.2.2 利用信念网络从观察到的情况识别主体的行为 12
2.2.3 DFA学习MAS的对手建模 13
第三章 ROBOCUP中的对手模型 14
3.1 ROBOCUP环境介绍 14
3.1.1 RoboCup 14
3.1.2 仿真机器人足球 15
3.1.3 对手建模挑战 18
3.1.4 在线教练比赛 18
3.2 现有的对手建模手段 19
3.2.1 理想模型 19
3.2.2 位置概率模型 19
3.2.3 基于特征的模型 20
3.2.4 总结 21
第四章 基于统计的对手模型 22
4.1 思想来源 22
4.1.1跟踪多个主体的思想 22
4.1.2自动建模的思想 22
4.1.3将主体行为与环境结合形成事件的思想 22
4.1.4非马尔可夫的思想和统计方法 23
4.2 模型描述 23
4.2.1主体行为的定义 23
4.2.2事件的定义 23
4.2.3对手模型的定义 24
4.3 建立对手模型 24
4.3.1主体行为和事件的识别 24
4.3.2利用字符树(Trie)统计观察到的事件序列 25
4.3.3对手模型预测函数 26
4.3.4和其他相关工作的比较 30
第五章 在ROBOCUP中的统计对手模型建立 31
5.1 球员行为的定义和识别 31
5.2 具体模型建立过程算法 33
5.2.1主导行为和辅助行为的区别 33
5.2.2解决辅助行为在预测冲突 34
第六章 ROBOCUP规划中的应用及实验结果 35
6.1 防守盯人规划 35
6.2 实验结果 36
第七章 总结 38
参考文献 39
致 谢 42
摘 要
多主体系统(Multi-Agent Systems)是当前人工智能研究的主要方向之一,主体和多主体系统在动态、不可预测的环境中的适应性将在很大程度上决定其的研究能否满足实际应用的基本要求。研究在动态的、有竞争和合作的多主体的环境中其他主体的建模,以及基于对手模型的规划是提高主体和多主体系统适应性的重要手段,因而对其他主体的建模和基于该模型的规划的研究越来越受到国内外研究者的重视。
笔者在文中介绍并分析以往研究者相关工作的优点和不足(必须事先假定主体内部结构,或者需要事先根据人的经验手工编码的方式建立可能的模式库,和不能跟踪多个主体的合作行为),然后在基于统计的外部建模方法和笔者自己前一阶段工作[20][21][22]的基础上综合改进,提出了一种基于统计方法的对手模型(包括模型表示方式、建模算法和用于预测时的算法)。该模型能够(1)不需事先定义模式库,通过分析观察输入在线建模;(2)跟踪、描述和预测多个主体的合作行为。从而增加了模型的灵活性与可信度,使得分析并预测主体的意图和团队的策略以及针对对手的规划成为可能,弥补以往对手模型的不足。笔者还在RoboCup仿真机器人足球比赛(一个近年来已成检验多智能系统研究成果的一个公共平台)中实现了该模型,并将该模型用于球队的防守规划中,本文介绍了这些工作。
关键字:多主体系统,对手建模,卡方相关性检测,机器人足球
ABSTRACT
Multi-Agent Systems (MAS) is now one of the main directions in international Artificial Intelligence research. Whether research on agents and MAS can satisfy the basic requirements of the practical applications depends, to a great extent, on the adaptability of agents and Multi-Agent Systems in dynamic and unexpected environments. It is an effective approach to improve agents’ or MAS’s adaptability to model other agents in dynamic and unexpected Multi-Agent environment in which agents compete or cooperate with each other, and then carry out planning based on the opponent model. Hence, more and more researchers put emphases upon the study of opponent modeling and planning based on opponent model.
Author analyzed both advantages and deficiency (opponent’s reasoning architecture and pattern library have to be defined beforehand or unable to track the cooperative actions of multiple agents) of former researchers’ related works. And then basing on the statistical external modeling method and author’s previous work [20][21][22], this paper present a statistical opponent model, which is composed by the model representation, the model constructing algorithm and the predicting algorithm. Comparing to previous models, this model is more flexible and reliable, and can trace multiple agents’ cooperative actions to make analyzing agent’s intention and team’s strategy and adversarial planning possible. Author implemented this model in RoboCup Simulation Soccer domain, and used it in the defending planning. This thesis will describe above work in details.
Keywords: Multi-Agent Systems, Opponent Modeling, Robot Soccer, Chi-Square Dependency Test
部分参考文献
[15] D. Carmel and S. Markovitch. Opponent modeling in multi-agent systems. In G. Weiss and S. Sen, editors, Adaptation and Learning in Multi-Agent Systems, Lecture Notes in Artificial Intelligence. IJCAI’95 Workshop, Springer, 1995.
[16] G. A. Kaminka, M. Fidanboylu, A. Chang, and M. Veloso, Learning the Sequential Behavior of Teams from Observations. In Proceedings of the 2002 RoboCup Symposium.
[17] R. L. Kurse, A. J. Ryba. Data Structures and Program Design in C++. Chapter 11, Apr. 2001 published.
[18] 陈小平. 关于慎思式适应. 计算机科学, Vol.29, No.9(S), 49-51
[19] H. Kitano, M. Tambe, P. Stone, M. Veloso, S. Coradeschi, E. Osawa, H. Matsubara, I. Noda, and M. Asada. The RoboCup synthetic agent challenge 97. In Proceedings of the Fifteenth International Joint Conference on Artificial Intelligence, pages 24–29, San Francisco, CA, 1997. Morgan Kaufmann.
[20] Zhanxiang Huang, Y. Yang, X. Chen, An Approach to Plan Recognition and Retrieval for Multi-agent Systems, accepted by the Workshop on Adaptability in Multi-Agent Systems, Jan.27-Feb.1, 2003, University of New South Wales, Sydney, Australia.
全文42页 约20000字 论述翔实
目 录
目 录 2
摘 要 4
ABSTRACT 5
第一章 绪论 6
第二章 对手建模 9
2.1 对手模型的起源和研究意义 9
2.1.1 经典博奕 9
2.1.2 敌对搜索中的应用 10
2.1.3 多主体环境中的应用 11
2.2 多主体环境中的对手建模 11
2.2.1 BDI模型 11
2.2.2 利用信念网络从观察到的情况识别主体的行为 12
2.2.3 DFA学习MAS的对手建模 13
第三章 ROBOCUP中的对手模型 14
3.1 ROBOCUP环境介绍 14
3.1.1 RoboCup 14
3.1.2 仿真机器人足球 15
3.1.3 对手建模挑战 18
3.1.4 在线教练比赛 18
3.2 现有的对手建模手段 19
3.2.1 理想模型 19
3.2.2 位置概率模型 19
3.2.3 基于特征的模型 20
3.2.4 总结 21
第四章 基于统计的对手模型 22
4.1 思想来源 22
4.1.1跟踪多个主体的思想 22
4.1.2自动建模的思想 22
4.1.3将主体行为与环境结合形成事件的思想 22
4.1.4非马尔可夫的思想和统计方法 23
4.2 模型描述 23
4.2.1主体行为的定义 23
4.2.2事件的定义 23
4.2.3对手模型的定义 24
4.3 建立对手模型 24
4.3.1主体行为和事件的识别 24
4.3.2利用字符树(Trie)统计观察到的事件序列 25
4.3.3对手模型预测函数 26
4.3.4和其他相关工作的比较 30
第五章 在ROBOCUP中的统计对手模型建立 31
5.1 球员行为的定义和识别 31
5.2 具体模型建立过程算法 33
5.2.1主导行为和辅助行为的区别 33
5.2.2解决辅助行为在预测冲突 34
第六章 ROBOCUP规划中的应用及实验结果 35
6.1 防守盯人规划 35
6.2 实验结果 36
第七章 总结 38
参考文献 39
致 谢 42
摘 要
多主体系统(Multi-Agent Systems)是当前人工智能研究的主要方向之一,主体和多主体系统在动态、不可预测的环境中的适应性将在很大程度上决定其的研究能否满足实际应用的基本要求。研究在动态的、有竞争和合作的多主体的环境中其他主体的建模,以及基于对手模型的规划是提高主体和多主体系统适应性的重要手段,因而对其他主体的建模和基于该模型的规划的研究越来越受到国内外研究者的重视。
笔者在文中介绍并分析以往研究者相关工作的优点和不足(必须事先假定主体内部结构,或者需要事先根据人的经验手工编码的方式建立可能的模式库,和不能跟踪多个主体的合作行为),然后在基于统计的外部建模方法和笔者自己前一阶段工作[20][21][22]的基础上综合改进,提出了一种基于统计方法的对手模型(包括模型表示方式、建模算法和用于预测时的算法)。该模型能够(1)不需事先定义模式库,通过分析观察输入在线建模;(2)跟踪、描述和预测多个主体的合作行为。从而增加了模型的灵活性与可信度,使得分析并预测主体的意图和团队的策略以及针对对手的规划成为可能,弥补以往对手模型的不足。笔者还在RoboCup仿真机器人足球比赛(一个近年来已成检验多智能系统研究成果的一个公共平台)中实现了该模型,并将该模型用于球队的防守规划中,本文介绍了这些工作。
关键字:多主体系统,对手建模,卡方相关性检测,机器人足球
ABSTRACT
Multi-Agent Systems (MAS) is now one of the main directions in international Artificial Intelligence research. Whether research on agents and MAS can satisfy the basic requirements of the practical applications depends, to a great extent, on the adaptability of agents and Multi-Agent Systems in dynamic and unexpected environments. It is an effective approach to improve agents’ or MAS’s adaptability to model other agents in dynamic and unexpected Multi-Agent environment in which agents compete or cooperate with each other, and then carry out planning based on the opponent model. Hence, more and more researchers put emphases upon the study of opponent modeling and planning based on opponent model.
Author analyzed both advantages and deficiency (opponent’s reasoning architecture and pattern library have to be defined beforehand or unable to track the cooperative actions of multiple agents) of former researchers’ related works. And then basing on the statistical external modeling method and author’s previous work [20][21][22], this paper present a statistical opponent model, which is composed by the model representation, the model constructing algorithm and the predicting algorithm. Comparing to previous models, this model is more flexible and reliable, and can trace multiple agents’ cooperative actions to make analyzing agent’s intention and team’s strategy and adversarial planning possible. Author implemented this model in RoboCup Simulation Soccer domain, and used it in the defending planning. This thesis will describe above work in details.
Keywords: Multi-Agent Systems, Opponent Modeling, Robot Soccer, Chi-Square Dependency Test
部分参考文献
[15] D. Carmel and S. Markovitch. Opponent modeling in multi-agent systems. In G. Weiss and S. Sen, editors, Adaptation and Learning in Multi-Agent Systems, Lecture Notes in Artificial Intelligence. IJCAI’95 Workshop, Springer, 1995.
[16] G. A. Kaminka, M. Fidanboylu, A. Chang, and M. Veloso, Learning the Sequential Behavior of Teams from Observations. In Proceedings of the 2002 RoboCup Symposium.
[17] R. L. Kurse, A. J. Ryba. Data Structures and Program Design in C++. Chapter 11, Apr. 2001 published.
[18] 陈小平. 关于慎思式适应. 计算机科学, Vol.29, No.9(S), 49-51
[19] H. Kitano, M. Tambe, P. Stone, M. Veloso, S. Coradeschi, E. Osawa, H. Matsubara, I. Noda, and M. Asada. The RoboCup synthetic agent challenge 97. In Proceedings of the Fifteenth International Joint Conference on Artificial Intelligence, pages 24–29, San Francisco, CA, 1997. Morgan Kaufmann.
[20] Zhanxiang Huang, Y. Yang, X. Chen, An Approach to Plan Recognition and Retrieval for Multi-agent Systems, accepted by the Workshop on Adaptability in Multi-Agent Systems, Jan.27-Feb.1, 2003, University of New South Wales, Sydney, Australia.