AI逻辑实现-取舍行为树还是状态机

发表于2018-08-03
评论0 1.52w浏览
AI逻辑实现-选择行为树还是状态机? 

关注AI的朋友可能会看过赖勇浩翻译的《有限状态机时代终结的10大理由》,里面谈到了状态机的诸多弊端。同时在ppt(附上下载地址)中述说了行为树的诸多优点,这里就不在赘述了。更多得是想总结一下自己玩了一阵子行为树后的一些实践体会。

个人体会:  
状态机来实现AI更符合我们思维的朴素表达,我想任何一个有经验的coder都能直观得去写一个自己的AI状态机。它用于一些简单的ai其实是没有大问题的,(搜索敌人,靠近,攻击,死亡)用状态机其实更加便捷。但是面对一些复杂的ai逻辑实现就会显得比较繁杂。同时,当需要对现有行为逻辑进行扩展的时候,代码上就会显得比较吃力,因为要维护的状态量会成倍增加。


行为树,实现AI的过程更加得有技巧,框架设计者较为全面考虑了我们可能会遇到的种种情况,把每种情况都抽象成了一个类型的节点,而我们要做的就是按照规范去写节点,然后把节点连接成一颗行为树。更加得具有面向对象的味道,行为模块间的藕合度相对较低。

举个粗糙的例子来比较一下两者的不同:
AI行为:吃饭睡觉打豆豆(很消耗体力和脑力的;)  
  1. 打豆豆HP-=5/秒MP-=3/秒
  2. 吃饭HP+=10/秒MP-=1/秒
  3. 睡觉MP+=15/秒HP-=2/秒
  4. 吃饭和睡觉是不可打断的动作(pending),必须执行到吃饱(HP=100)or睡饱(MP=100) 
  5. 打豆豆是瞬发动作,每帧都可以执行一次

状态机的实现逻辑图:

行为树的实现逻辑图:

其实不管你知不知道什么是selector,condition都不要紧,至少从上图,应该可以看出来,行为树节点间的联系并不像状态机那样得“紧密”。  

选择两种不同的ai实现方法,也决定了具体行为的实现逻辑。
比如对于sleep动作的实现,如果是状态机:  
functionsleep()=  
ifY==100then  
AwakeEvent()  
return  
end  
HP-=X  
MP+=Y  
end  
然后每一帧执行sleep()  

如果是选择行为树:
functionsleep()  
localsleepTime=(100/15)  
–不好意思乱入了一段cocos2dx的代码  
self:runAction(cc.Sequence:create(cc.DelayTime:create(sleepTime),cc.CallFunc:create(cancelPending))) 
localcancelPending=function()
pending=false
end  
end

罗列一下行为树的概念:
对于有限状态机而言,必须明确状态的转换方式;对于行为树,必须明确状态前提:前提条件  
每一个行为必须有“前提条件”,这决定了该行为是否被选择。  
行为树的运算也是通过帧循环的update来驱动,不一定是每帧都update,但是要周期性update。  
每一次run从根节点(root)开始,每一运行都会选择一个可行的子节点运行,这种选择可以是随机方式,也可以是预设好优先条件  
行为树由叶子节点和中间节点组成,叶子节点是最基本的行为(如跑动,攻击),中间节点代表逻辑单元(巡逻,逃跑)。  
当一个叶子节点被选择后,就会激活其对应的基本的行为  
最基本的行为可能执行成功也可能失败。  
高等级的行为(中间节点)是否执行成功依赖于他们的孩子节点是否执行成功。  
一个子节点失败可能导致父母节点选择另外一个孩子。  
除了选择(selector)一个单独的子节点行为,一个节点还可能顺序(sequence)or并行(concurrent)得运行他的所有子节点。  
一个行为除了有前提条件,可能还有上下文条件(父节点or孩子节点可能存储一定的状态变量)。  
高优先级的行为可能抢占低优先级的行为

转载一段akara的行为树实现方案:
  • CompositeNode组合节点
  • DecoratorNode装饰节点
  • ConditionNode条件节点
  • ActionNode行为节点  
各种节点的详细描述:
*SelectorNode选择节点
描述:从头到尾,按顺序选择第一个执行条件为真的子节点,遇到True停止。
处理流程:当执行本类型Node时,它将从begin到end迭代执行自己的ChildNode:如遇到一个ChildNode执行后返回True,那停止迭代,本Node向自己的ParentNode也返回True;否则所有ChildNode都返回False,那本Node向自己的ParentNode返回False。

SequenceNode序列节点  
描述:从头到尾,按顺序执行每一个子节点,遇到False停止。
处理流程:当执行本类型Node时,它将从begin到end迭代执行自己的ChildNode:如遇到一个ChildNode执行后返回False,那停止迭代,本Node向自己的ParentNode也返回False;否则所有ChildNode都返回True,那本Node向自己的ParentNode返回True。

ParallelNode并行节点
描述:从头到尾,平行执行它的所有子节点。
ParallelSelectorNode:有一个子节点True返回True,否则返回False。
ParallelSequenceNode:有一个子节点False返回False,否则返回True。 
ParallelFallOnAllNode:所有子节点False才返回False,否则返回True。 
ParallelSucceedOnAllNode:所有子节点True才返回True,否则返回False。 
ParallelHybirdNode:指定数量的子节点返回True或False后,才决定结果。 

DecoratorNode装饰节点
描述:装饰节点一般用来作为额外的附加条件。例如,时间间隔控制,次数控制,频率控制,结果取反,错误处理等。

ConditionNode条件节点  
描述:顾名思义,就是对应条件的节点。

ActionNode行为节点 
描述:顾名思义,就是用于完成某种动作的节点。  
从代码实现的角度来谈下优缺点

优点:  
1.行为逻辑和状态数据分离,任何节点写好以后可以反复利用  
2.重用性高,可用通过重组不同的节点来实现不同的行为树  
3.呈线性的方式扩展,易于扩展  
4.可配置,把工作交给designer  
5.能够胜任”AI”“掉宝”等等场景。
  
缺点:  
1.每一帧都从root开始,有可能会访问到所以的节点,相对StateMachine消耗更多的cpu  
2.任何一个简单的操作都必须要使用节点
来自:https://blog.csdn.net/u011484013/article/details/52369313

如社区发表内容存在侵权行为,您可以点击这里查看侵权投诉指引