TY -的A2 Cacace菲利普AU -焦,彭盟——徐,凯盟——悦Shiguang AU -魏,翔宇盟——太阳,林PY - 2017 DA - 2017/07/16 TI -分散的部分可观测马尔可夫决策模型与行动持续时间为目标识别实时策略游戏SP - 4580206六世- 2017 AB -可替换主体目标识别是一个艰辛而又重要的问题在许多实时战略游戏或模拟系统。传统建模方法的需求详细的代理政策评估的领域知识和训练数据集或缺乏清晰定义的行动持续时间。解决上述问题,我们提出一个新颖的Dec-POMDM-T模型,结合经典Dec-POMDP识别器的观测模型,与终止指标,共同目标和时间变量与行动终止行为变量。在这篇文章中,一个模范自由算法命名为合作生物的共同进化行为基于用撒尔沙。考虑到Dec-POMDM-T通常遇到可替换主体目标识别不同类型的噪声问题,部分缺失的数据,和未知的行动时间,本文利用了SIS PF与重采样推理Dec-POMDM-T动态贝叶斯网络结构下的。在实验中,采用改性捕食的场景来研究可替换主体共同目标识别问题,即识别共同的目标合作捕食者之间共享。实验结果表明,(a) Dec-POMDM-T工作目标的有效识别和调整剂组内动态变化的目标;(b) Dec-POMDM-T优于传统Dec-MDP-based方法在精度方面,回忆,和
F
测量。SN - 1026 - 0226 UR - https://doi.org/10.1155/2017/4580206 - 10.1155 / 2017/4580206摩根富林明离散动力学自然界和社会中PB - Hindawi KW - ER