一种面向未知环境的多放射源在线探寻方法
技术领域
本发明属于未知空间内多放射源位置和强度信息在线探寻
技术领域
。背景技术
放射源为通过放射性物质构成的辐射源的通称,其强度呈在空间中按照距离二次方递减的规律。由于放射源具有携带能量高、场叠加现象明显、存在统计波动性等特点,在数量和强度未知的情况下对其进行采样和预测已成为探索辐射环境的难点。与人工探测方式相比,由机器人在线完成辐射探测和预测具有显著的安全性优势。此外,相对于利用传感器阵列或特种传感器组合(γ相机、辐射频谱仪)的传统辨识方法,基于机器人携带的全向辐射传感器进行稀疏采样、在线预测和数目非参估计等问题具有更高的智能度和实用价值。仅凭借机器人携带的传感器数据对可疑环境进行多点放射源状态估计和制定有效探索策略为机器人自主探寻多放射源任务的关键问题。
与已知环境单放射源探寻相比,目前在线探寻多点放射源的研究包含以下难点:
(1)由于多峰辐射场中的累积辐射效应和GM计数器的测量特性,机载传感器只能获得当前位置包含本底辐射的累积辐射剂量率,但基于这种耦合辐射数据,传统的非参数预测算法易得出错误估计结果。
(2)由于任务场景是存在多放射源的未知环境,仅依赖单放射源搜索的方法将无法对叠加场完成高效采样。
(3)考虑到局部疑似区域中的放射源数目未知,在源邻域需重点采样,因此单纯通过已探索区域的面积占比来作为结束探索的依据已不再适用。
综上所述,现有单纯通过已探索区域的面积占比来作为结束探索的依据对未知空间多放射源检测存在准确性差,效率低的问题。
发明内容
本发明目的是为了解决现有未知空间内多放射源检测存在准确性差,效率低的问题,提供了一种面向未知环境的多放射源在线探寻方法。
本发明所述一种面向未知环境的多放射源在线探寻方法,该方法包括:
该方法包括:
步骤一、根据待测未知区域的范围对机器人的位置及转角姿态进行初始设置,根据先验知识对待测未知区域放射源个数进行估计,对多层粒子群的层数进行设定;
步骤二、根据当前机器人的位置,对RRT搜索树进行初始化;
步骤三、在待测未知区域内进行随机采样,通过基于代价地图的障碍检测方法,对初始化后的RRT搜索树在待测未知区域内进行扩展,获得扩展后的RRT搜索树的子节点集合和分支;
步骤四、采用全向辐射传感器对当前机器人位置的辐射强度进行采样,结合自适应差分进化-峰值抑制粒子滤波算法对待测未知区域内的放射源状态进行预测,同时计算所有层粒子群状态对应的最优置信概率;
步骤五、判断步骤四计算的置信概率是否大于或等于终止置信概率阈值THRconf,且已探索面积Sexp占待测未知区域面积Ssus的比例Sexp/Ssus是否大于或等于终止探索面积占比THRexp,若是,则完成未知环境的多放射源的在线探寻,否则,执行步骤六;
步骤六、根据步骤四所述的待测未知区域的放射源状态的预测值,计算步骤三获得的子节点集合中每个子节点的辐射场信息增益Gainsrc;
步骤七、通过辐射增益修正项和重复探索修正项对每个子节点的辐射场信息增益Gainsrc进行修正;
步骤八、根据子节点增益最大化准则,对步骤七修正后的所有子节点的辐射场信息增益进行筛选,获得子节点辐射场信息增益最大的分支,将所述辐射场信息增益最大分支的第一个子节点作为该次探索的目标采样点;
步骤九、利用DWA算法对机器人进行导航,使机器人移动到步骤八所述的探索的目标采样点;返回执行步骤二。
进一步地,本发明中,步骤二中,根据当前机器人的位置,对RRT搜索树进行初始化的具体方法为:
以机器人位置为中心,沿周向均匀向外延伸q个分支,对RRT搜索树进行扩展,获得q个分支及q个子节点;完成RRT搜索树初始化;其中,q为大于或等于12的正整数。
进一步地,本发明中,步骤三中,在未知区域中进行随机采样,通过障碍检测方法,对初始化后的RRT搜索树进行扩展,获得扩展后的RRT搜索树的子节点集合的具体方法为:
步骤三一、在待测未知区域中进行随机采样,在RRT搜索树中寻找与采样点最邻近的子节点,将采样点与最近邻的子节点连接,获得一条分支路径;
步骤三二、采用基于代价地图的障碍检测方法,判断所述分支路径上是否有障碍物,若有,则放弃该采样点,返回执行步骤三一;否则,执行步骤三三;
步骤三三、在所述分支路径上截取固定步长,将截取点作为子节点,实现RRT搜索树的一步扩展,并判断当前子节点个数是否达到子节点数量阈值,若是,获得子节点集合,否则,返回执行步骤三一。
进一步地,本发明中,步骤四中,采用全向辐射传感器对当前机器人位置的辐射强度进行采样,结合自适应差分进化-峰值抑制粒子滤波算法对未知区域的放射源状态进行预测的具体方法为:
利用当前机器人位置的辐射强度,分别对每层粒子群同时进行粒子更新,并通过均值偏移聚类算法,对每层粒子群分别进行中心聚类,并判断每层粒子群中的聚类中心是否满足中心强度限定条件,将满足中心强度限定条件的聚类中心的状态作为预测的放射源的状态;
其中,获取第k层粒子群的放射源状态预测的具体方法为:
步骤四一、利用当前机器人位置的辐射强度,根据差分进化算法,建立适应度函数,利用适应度函数计算第K层初始粒子群中每个初始粒子的适应度;
步骤四二、通过变异策略,对第K层的粒子群中每个初始粒子作变异处理,获得对应的变异粒子;
步骤四三、对每个变异粒子作交叉操作,获得对应的试验粒子:
步骤四四、计算每个试验粒子的适应度,判断每个试验粒子的适应度是否大于其对应的初始粒子的适应度,若是,则将该层粒子群中的初始粒子更新为对应的试验粒子;完成对该层粒子群状态的一次更新;
步骤四五、判断粒子群状态该次更新的次数是否达到迭代次数阈值,若是,执行步骤四六,否则,将步骤四四更新后的粒子群作为初始粒子群,返回执行步骤四一;
步骤四六、对更新后的粒子群进行均值偏移聚类,判断聚类中心是否满足中心强度限定条件;若是,则将所述聚类中心的位置及该位置的辐射强度作为辐射源状态的预测值;否则,第K层粒子群中无放射源。
进一步地,本发明中,步骤四一中,适应度函数为:
w(pi)=wobs(m(Sh),pi,C-k)·wps(pi,θps)·wdist(pi,C-k)公式一
其中,w(pi)为粒子pi对应的综合粒子权重,即为初始粒子pi的适应度,
wobs(m(Sh),pi,C-k)为粒子的观测权重项,wps(pi,θps)为粒子的峰值抑制修正项,wdist(pi,C-k)为粒子的群间距离修正项,m(Sh)为第h次采样的辐射强度、pi为粒子群中的第i个初始粒子、C-k为不含第k层粒子群的聚类中心、θps为峰值抑制中心;
粒子的观测权重项:
其中,p(·)代表泊松观测模型的概率函数,I′(pi,C-k)为根据初始粒子pi和C-k计算的累积预测辐射强度,为取整运算。
进一步地,本发明中,步骤四二中,获得变异粒子通过以下公式计算实现:
其中,为第g+1更新次迭代过程中,当前层粒子群的变异粒子;k为粒子层数,是第g次迭代当前层粒子群中的初始粒子,为第g次迭代当前层粒子群中最大适应度粒子,为当前层粒子群中的随机粒子; F1和F2均为自适应变异率,α为精英移动尺度,向最优粒子移动的距离,为对应的粒子权重,β为随机移动尺度,向随机粒子移动的距离,为粒子权重均值。
进一步地,本发明中,步骤四三中,对每个变异粒子作交叉操作,获得试验粒子通过以下公式计算实现:
其中,第g+1次迭代过程中第k层粒子群的试验粒子;
CR为基于粒子权重自适应调整的交叉率,σi为均值为0的高斯白噪声,CRbase为交叉率基础值,CRscale为基于粒子权重的交叉率系数,为粒子权重均值。
进一步地,本发明中,步骤四中,当前粒子群状态对应的最优置信概率为:
式中,为当前粒子群状态对应的最优置信概率,为所有层粒子群的聚类中心,为聚类中心在采样点Sh处的置信概率,Nk为粒子层总数,Nh为机器人对辐射采样的总次数,p(·)代表泊松观测模型的概率函数,为在处叠加的预测辐射强度,由多层聚类中心确定,为第h个采样点Sh对应的位置,为取整运算。
进一步地,本发明中,步骤六中,子节点集合中每个子节点的辐射场信息增益Gainsrc为:
其中,为节点对第j个放射源的单点辐射增益函数,Nj为未知区域的放射源状态的预测值中放射源的总数,为节点对第j个放射源的源间修正因子,用于缓解多源效益叠加造成的影响;
其中,为RRT树中第m个节点nm到第j个放射源Aj的归一化距离;
其中,为RRT搜索树中节点nm的位置信息,包括x和y轴坐标(m);为预测放射源Aj的位置信息,包括x和y轴坐标(m);为辐射增益归一化距离尺度因子,根据探索区域范围和放射源定位精度决定;Hsrc为辐射增益归一化距离偏移量,防止因距离过小而出现数值无穷大的情况;
增益叠加效应修正因子
其中,为第m个节点到第n个和第j个放射源间最大距离比例,最小值为1;λ2为用于调节多源效益叠加效应的尺度因子;
其中,为RRT搜索树中第m个子节点到第n个放射源的归一化距离。
进一步地,本发明中,步骤七中,通过辐射增益修正项Crad和重复探索修正项Codom对每个子节点的辐射场信息增益Gainsrc进行修正的方法为:
计算重复探索修正项Codom:
其中,Nodom为机器人历史采样点总数,nm为RRT扩展树中第m个节点,为第m个节点nm到第l个采样点的归一化距离;
其中,nm为RRT扩展树中第m个节点,为第l个采样点的位置,ξodom为重复探索修正归一化距离的尺度因子,Hodom为重复探索修正归一化距离的偏移量;
计算辐射增益修正项Crad;
其中,为与nm节点最邻近采样点处的辐射采样值,为环境本底辐射,θrad为辐射增益修正曲线的水平偏移量,brad为辐射增益修正的尺度参数,用于控制修正效果的变化速度,η为辐射增益修正后本底值,控制修正后的下限值;
修正后的辐射信息增益为:
与现有放射源参数估计的方法相比,由于本发明在每次测量集迭代中,消耗的时间与粒子群数目呈线性关系,因此不会随放射源数目的增加而陷入维度灾难困境,体现了本发明所述在线预测方法的高效性。此外,由于在原始PSPF算法基础上引入了自适应差分进化思想,使得本发明方法不仅减少了各个群的粒子数,还提高了预测的准确性。而且,由于机器人的便携辐射传感器采用质量轻、成本低、体积小、效率高、使用广的盖格-穆勒管作为气体电离探测器,易于应用在小型无人化探索平台,可广泛应用于各类针多对放射源的移动探测任务。
附图说明
图1(a)第1次探索采样后各层粒子群的状态和已采样位置示意图;
图1(b)第5次探索采样后各层粒子群的状态和已采样位置示意图;
图1(c)第15次探索采样后各层粒子群的状态和已采样位置示意图;
图1(d)第25次探索采样后各层粒子群的状态和已采样位置示意图;
图1(e)第35次探索采样后各层粒子群的状态和已采样位置示意图;
图1(f)第45次探索采样后各层粒子群的状态和已采样位置示意图;
图1(g)第55次探索采样后各层粒子群的状态和已采样位置示意图;
图1(h)第65次探索采样后各层粒子群的状态和已采样位置示意图;
图1(i)第75次探索采样后各层粒子群的状态和已采样位置示意图;
图1(j)第85次探索采样后各层粒子群的状态和已采样位置示意图;
图1(k)第95次探索采样后各层粒子群的状态和已采样位置示意图;
图1(l)第105次探索采样后各层粒子群的状态和已采样位置示意图;
图2(a)第1次探索后机器人的轨迹和所构建的地图;
图2(b)第5次探索后机器人的轨迹和所构建的地图;
图2(c)第15次探索后机器人的轨迹和所构建的地图;
图2(d)第25次探索后机器人的轨迹和所构建的地图;
图2(e)第35次探索后机器人的轨迹和所构建的地图;
图2(f)第45次探索后机器人的轨迹和所构建的地图;
图2(g)第55次探索后机器人的轨迹和所构建的地图;
图2(h)第65次探索后机器人的轨迹和所构建的地图;
图2(i)第75次探索后机器人的轨迹和所构建的地图;
图2(j)第85次探索后机器人的轨迹和所构建的地图;
图2(k)第95次探索后机器人的轨迹和所构建的地图;
图2(l)第105次探索后机器人的轨迹和所构建的地图;
图3是机器人探索轨迹及多源预测结果示意图;
图4是四点放射源场景下,放射源预测位置误差曲线图;
图5是四点放射源场景下,放射源预测强度误差曲线图;
图6是四点放射源场景下,寻源搜索过程的运行时间分布曲线图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
具体实施方式一:本实施方式所述一种面向未知环境的多放射源在线探寻方法,该方法包括:
步骤一、根据待测未知区域的范围对机器人的位置及转角姿态进行初始设置,根据先验知识对待测未知区域放射源个数进行估计,对多层粒子群的层数进行设定;
步骤二、根据当前机器人的位置,对RRT搜索树进行初始化;
步骤三、在待测未知区域内进行随机采样,通过基于代价地图的障碍检测方法,对初始化后的RRT搜索树在待测未知区域内进行扩展,获得扩展后的RRT搜索树的子节点集合和分支;
步骤四、采用全向辐射传感器对当前机器人位置的辐射强度进行采样,结合自适应差分进化-峰值抑制粒子滤波算法对待测未知区域内的放射源状态进行预测,同时计算所有层粒子群状态对应的最优置信概率;
步骤五、判断步骤四计算的置信概率是否大于或等于终止置信概率阈值THRconf,且已探索面积Sexp占待测未知区域面积Ssus的比例Sexp/Ssus是否大于或等于终止探索面积占比THRexp,若是,则完成未知环境的多放射源的在线探寻,否则,执行步骤六;
其中,终止置信概率阈值THRconf的范围为:0.85-0.95,面积比例阈值THRexp的范围为:0.9-0.95。
步骤六、根据步骤四所述的待测未知区域的放射源状态的预测值,计算步骤三获得的子节点集合中每个子节点的辐射场信息增益Gainsrc;
步骤七、通过辐射增益修正项和重复探索修正项对每个子节点的辐射场信息增益Gainsrc进行修正;
步骤八、根据子节点增益最大化准则,对步骤七修正后的所有子节点的辐射场信息增益进行筛选,获得子节点辐射场信息增益最大的分支,将所述辐射场信息增益最大分支的第一个子节点作为该次探索的目标采样点;
步骤九、利用DWA算法对机器人进行导航,使机器人移动到步骤八所述的探索的目标采样点;返回执行步骤二。
本实施方中,已经探索的面积是根据探索目标采集点的位置及传感器的采集范围确定的。本实施方式中,步骤二中,所述固定步长根据疑似区域的面积来确定,通常范围在0.5米至1.5米间。
步骤一中,对多层粒子群的层数进行设定的方法为:
将多层粒子群的层数设定为大于或等于未知区域放射源个数的估计值。根据先验知识如:放射源丢失数目或疑似区域面积,推断放射源可能的数目,然后令粒子群的数目大于该数目即可。
进一步地,本实施方式中,步骤二中,根据当前机器人的位置,对RRT搜索树进行初始化的具体方法为:
以机器人位置为中心,沿周向均匀向外延伸q个分支,对RRT搜索树进行扩展,获得q个分支及q个子节点;完成RRT搜索树初始化;其中,q为大于或等于12的正整数。
进一步地,本实施方式中,步骤三中,在未知区域中进行随机采样,通过障碍检测方法,对初始化后的RRT搜索树进行扩展,获得扩展后的RRT搜索树的子节点集合的具体方法为:
步骤三一、在待测未知区域中进行随机采样,在RRT搜索树中寻找与采样点最邻近的子节点,将采样点与最近邻的子节点连接,获得一条分支路径;
步骤三二、采用基于代价地图的障碍检测方法,判断所述分支路径上是否有障碍物,若有,则放弃该采样点,返回执行步骤三一;否则,执行步骤三三;
步骤三三、在所述分支路径上截取固定步长,将截取点作为子节点,实现RRT搜索树的一步扩展,并判断当前子节点个数是否达到子节点数量阈值,若是,获得子节点集合,否则,返回执行步骤三一。
本实施方式中,在待测未知区域中进行随机采样的过程为,先通过机器人上的全向辐射传感器为待测的位置区域进行探索,在探索获知的区域内进行随机采样,在通过上述截取固定步长的方式对搜索出进行扩展。
进一步地,本实施方式中,步骤四中,采用全向辐射传感器对当前机器人位置的辐射强度进行采样,结合自适应差分进化-峰值抑制粒子滤波算法对所有层粒子群内的放射源状态进行预测的具体方法为:
利用当前机器人位置的辐射强度,对每层粒子群分别进行粒子更新,并通过均值偏移聚类算法,对每层粒子群分别进行中心聚类,并判断每层粒子群中的聚类中心是否满足中心强度限定条件,将满足中心强度限定条件的聚类中心的状态作为预测的放射源的状态;
其中,获取第k层粒子群的放射源状态预测的具体方法为:
步骤四一、利用当前机器人位置的辐射强度,根据差分进化算法,建立适应度函数,利用适应度函数计算第k层粒子群中每个初始粒子的适应度;
步骤四二、通过变异策略,对第K层的粒子群中每个初始粒子作变异处理,获得对应的变异粒子;
步骤四三、对每个变异粒子作交叉操作,获得对应的试验粒子:
步骤四四、计算每个试验粒子的适应度,判断每个试验粒子的适应度是否大于其对应的初始粒子的适应度,若是,则将该层粒子群中的初始粒子更新为对应的试验粒子;完成对该层粒子群状态的一次更新;
步骤四五、判断粒子群状态该次更新的次数是否达到迭代次数阈值,,若是,执行步骤四六,否则,将步骤四四更新后的粒子群作为初始粒子群,返回执行步骤四一;所述更新迭代的次数阈值通常为5-10次;
步骤四六、对更新后的粒子群进行均值偏移聚类,判断聚类中心是否满足中心强度限定条件;若是,则将所述聚类中心的位置及该位置的辐射强度作为辐射源状态的预测值;否则,第K层粒子群中无放射源。
进一步地,本实施方式中,步骤四一中,适应度函数为:
w(pi)=wobs(m(Sh),pi,C-k)·wps(pi,θps)·wdist(pi,C-k)公式一
其中,w(pi)为粒子pi对应的综合粒子权重,即为初始粒子pi的适应度,
wobs(m(Sh),pi,C-k)为粒子的观测权重项,wps(pi,θps)为粒子的峰值抑制修正项,wdist(pi,C-k)为粒子的群间距离修正项,m(Sh)为第h次采样的辐射强度、pi为粒子群中的第i个初始粒子、C-k为不含第k层粒子群的聚类中心,θps为峰值抑制中心;
粒子的观测权重项:
其中,p(·)代表泊松观测模型的概率函数,I′(Sh,pi,C-k)为在第h个采样点Sh处叠加的预测辐射强度,由粒子pi和聚类中心C-k确定,为取整运算。
进一步地,本实施方式中,步骤四二中,获得变异粒子通过以下公式计算实现:
其中,为第g+1更新次迭代过程中,当前层粒子群的变异粒子;k为粒子层数,是第g次迭代当前层粒子群中的初始粒子,为第g次迭代当前层粒子群中最大适应度粒子,为当前层粒子群中的随机粒子; F1和F2均为自适应变异率,α为精英移动尺度,向最优粒子移动的距离,为对应的粒子权重,β为随机移动尺度,向随机粒子移动的距离,为粒子权重均值。
进一步地,本实施方式中,步骤四三中,对每个变异粒子作交叉操作,获得试验粒子通过以下公式计算实现:
其中,第g+1次迭代过程中第k层粒子群的试验粒子;
其中,CR为基于粒子权重自适应调整的交叉率,σi为均值为0的高斯白噪声,CRbase为交叉率基础值,CRscale为基于粒子权重的交叉率系数,为粒子权重均值。
进一步地,本实施方式中,步骤四中,当前粒子群状态对应的最优置信概率为:
式中,为当前粒子群状态对应的最优置信概率,为所有层粒子群的聚类中心,为聚类中心在采样点Sh处的置信概率,Nk为粒子层总数,Nh为机器人对辐射采样的总次数,p(·)代表泊松观测模型的概率函数,为在处叠加的预测辐射强度,由多层聚类中心确定,为第h个采样点Sh对应的位置,为取整运算。
进一步地,本实施方式中,步骤六中,子节点集合中每个子节点的辐射场信息增益Gainsrc为:
其中,为子节点对第j个放射源的单点辐射增益函数,Nj为未知区域的放射源状态的预测值中放射源的总数,为子节点对第j个放射源的源间修正因子,用于缓解多源效益叠加造成的影响;
其中,为RRT搜索树中第m个子节点nm到第j个放射源Aj的归一化距离;
其中,为RRT搜索树中子节点nm的位置信息,为预测放射源Aj的位置信息;为辐射增益归一化距离尺度因子,Hsrc为辐射增益归一化距离偏移量,所述偏移量通常为微小偏移量防止因距离过小而出现数值无穷大的情况;
增益叠加效应修正因子
其中,为第m个子节点到第n个和第j个放射源间最大距离比例,最小值为1;λ2为用于调节多源效益叠加效应的尺度因子;
其中,RRT搜索树中第m个子节点到第n个放射源的归一化距离。
进一步地,本实施方式中,步骤七中,通过辐射增益修正项Crad和重复探索修正项Codom对每个子节点的辐射场信息增益Gainsrc进行修正的方法为:
计算重复探索修正项Codom:
其中,Nodom为机器人历史采样点总数,nm为RRT搜索树中第m个子节点,为第m个子节点nm到第l个采样点的归一化距离;
其中,nm为RRT搜索树中第m个节点,为第l个采样点的位置,ξodom为重复探索修正归一化距离的尺度因子,Hodom为重复探索修正的归一化距离偏移量;
计算辐射增益修正项Crad;
其中,为与nm点最邻近采样点处的辐射采样值,为环境本底辐射,θrad为辐射增益修正曲线的水平偏移量,brad为辐射增益修正的尺度参数,用于控制修正效果的变化速度,η为辐射增益修正后本底值,控制修正后的下限值;
修正后的辐射信息增益为:
首先,全向电离辐射传感器无法获得多源叠加辐射场梯度方向信息,其次,单纯的未知区域探索策略对于多放射源在线预测与采样的问题已不再适用,最后,由于放射源数量未知,探索过程只能通过预测-采样的方式迭代进行,若无终止探索准则机器人将做冗余采样。因此,本发明仅利用稀疏的全向伽马射线的累积辐射数据,提出一种未知环境下在线多放射源预测及高效采样的一体化探索框架。
具体实施例:
本实验对应的放射源搜索场景特点如下:1.全局可疑区域探索面积为21m*21m,2.辐射剂量率范围:0~1500nGy/h,3.扩展树节点数目:50,4.粒子群数目:5,5.单粒子群中粒子数目:150,6.真实放射源数目:4,7.初始探索位姿:(-3.0m,1.8m,57°)。四点源场景以两个放射源为一组构建多峰辐射场,如图3所示。本发明所述的方法流程图如图1所示,下面详细阐述实施过程:
步骤一、根据移动平台当前位姿状态初始化扩展树(RRT搜索树),其中扩展树的构型空间包含机器人的平面位置及转角姿态。在此过程中,除了将上次规划中的最优路径加入到当前扩展树,还需将从当前位置的周向均匀延伸出的向量节点添加到扩展树中;
步骤二、在未知区域中,机器人探索的获得的无障碍空间中进行随机采样,寻找采样点在搜索树中的最近邻点,然后确定节点之间的构型关系,通过障碍检测和最大距离阈值选取出合适的状态点,在初始化状态基础上构建扩展树。
步骤三、根据已有辐射采样集,结合ADE-PSPF算法对疑似区域的放射源状态进行预测。ADE-PSPF算法是以PSPF算法为基准的改进算法。主要区别为在重采样环节,ADE-PSPF算法将各群中的粒子作为差分进化的初始种群。
(1)适应度函数如公式(1)所示。其中,wobs为粒子的观测权重,wps为粒子的峰值抑制修正项,wdist为粒子的群间距离修正项。
w(pi)=wobs(m(Sh),pi,C-k)·wps(pi,θps)·wdist(pi,C-k) (1)
其中,w(pi)为粒子pi对应的综合粒子权重,即为初始粒子pi的适应度,
wobs(m(Sh),pi,C-k)为粒子的观测权重项,wps(pi,θps)为粒子的峰值抑制修正项,wdist(pi,C-k)为粒子的群间距离修正项,m(Sh)为第h次采样的辐射强度、pi为粒子群中的第i个初始粒子、C-k为不含第k层粒子群的聚类中心,θps为峰值抑制中心;
(2)通过公式(2)的变异策略,对各群中的粒子变异处理,获得变异个体。其中,为初始粒子,为当前种群中最大适应度粒子,为随机粒子。和为自适应变异率,α为精英移动尺度,控制向最优粒子移动的距离,为对应的粒子权重,β为随机移动尺度,控制向随机粒子移动的距离,为粒子权重均值。
(3)通过公式(3),获得经交叉操作生成的试验个体。
其中,为基于粒子权重自适应调整的交叉率,变异操作的影响会随粒子权重的增加而增大。为避免粒子贫化,在目标个体基础上叠加均值为0的高斯噪声σi。
(4)根据公式(4),对比初始粒子的适应度和对应的试验个体的适应度,选择适应度更高的个体作为粒子群中的粒子;
(5)根据公式(5),重新计算粒子权重并归一化,获得粒子权重均值。
Pn为单层粒子群中的粒子数;
步骤四一、通过Mean-Shift聚类(均值偏移聚类)算法和判断准则,识别各层粒子群中呈聚集状态的粒子中心,实现对当前状态分布的参数估计。
其中根据各层粒子群的聚类中心及相应粒子比例,选取最大比例的聚类状态用于筛选,设计筛选准则判断各层粒子群的预测状态,筛选准则可表述为:
上式中,为聚类程度,为相应粒子聚类比例,THRstr和THRpr分别表示筛选强度阈值和粒子聚类比例阈值;
步骤四二、利用步骤四一所述的放射源的估计参数,计算当前辐射场整体置信概率,以当前预测状态相对实际测量集的泊松观测均值作为探索区域的置信概率计算公式如下:
式中,p(·)代表泊松观测模型,I'cum(·)表示多点预测状态在处的累积辐射剂量,评价模型还以各测量位置的最大权值作为分母,解决泊松评价模型权值范围的归一化问题,基于上述置信概率,预测框架判断是否保存最优预测配置;
步骤五、判断步骤四计算得到的置信概率是否大于历史最优置信概率若是,则更新历史最优置信概率并保存对应的粒子群状态和聚类中心的状态;否则,各粒子群和聚类中心状态恢复至历史最优的配置。
步骤六、将当前放射源预测状态和步骤二获得的采样点集结合,利用公式(6)计算各点对应的辐射场增益Gainsrc。
其中,β为辐射效益比例系数,用于协调与几何效益的比例。为单点效益函数,利用公式(7)计算,为源间修正因子,通过公式(9)计算。
其中,为节点到各放射源的归一化距离,通过公式(8)计算。
其中为运动规划节点nk的全局位置信息,包括x和y轴坐标(m);为预测放射源的全局位置信息,包括x和y轴坐标(m);为距离尺度因子,根据探索区域范围和放射源定位精度决定;Hsrc为微小偏移量,防止因距离过小而出现数值无穷大的情况。
效益叠加效应修正因子用于缓解多源效益叠加造成的影响。
其中,
为第m个子节点到第n个和第j个放射源间最大距离比例,最小值为1;λ2为用于调节多源效益叠加效应的尺度因子;
步骤七、在各点已有辐射场增益Gainsrc的基础上,分别通过辐射增益修正项Crad和重复探索修正项Codom对原始增益进行修正,进而在保证探索的效率的前提下提高辐射场采样多样性。通过公式(11)计算重复探索修正项Codom,而其获得过程需要依赖归一化距离 通过公式(12)计算。通过公式(13)计算辐射增益修正项Crad,。
其中,Ppos为规划目标点的位置,包括x和y轴坐标(m);为已采样点的位置,包括x和y轴坐标(m);为距离尺度因子,根据重复探索区域限制范围决定;Hodom为微小偏移量,防止因距离过小而出现数值无穷大的情况。
其中,为规划目标点Ppos最近邻处的辐射采样值,为环境本底辐射,θrad为辐射增益修正曲线的水平偏移量,brad为辐射偏差的尺度参数,用于控制修正效果的变化速度,η为辐射增益修正后本底值,控制修正后的下限值。
步骤八、根据增益最大化准则,对生成的扩展树进行状态筛选,选择叶子节点增益最大的第一分支作为探索策略的目标点。结合DWA算法进行局部导航,实现机器人从当前位姿到期望位姿的实时避障驱动。
步骤九、重复迭代步骤一至步骤八,直至最优置信概率和终止置信概率阈值THRconf满足且已探索面积Sexp占可疑区域面积Ssus的比例Sexp/Ssus≥THRexp时,结束探索。
四点源场景下的环境探索及状态预测过程和分别如图1至图3所示。图1展示了机器人探索的过程中不同阶段对应的各层粒子群分布状态和机器人已对辐射强度采样的位置。图2展示了机器人探索的过程中不同阶段对应的机器人位置和轨迹及对场景中障碍物构建的地图模型。图3展示了机器人结束探索时的已采样位置、真实放射源位置和本方法预测的位置。算法在未知多源辐射环境中可以有效识别放射源状态和数量,并且随着采样点数目的增多能够逐步提升预测精度,每一步探索对应15次迭代估计的方法仍能满足在线预测需求。
四点放射源场景下的预测统计结果如图4-6所示,图4展示了不同探索阶段对应的各放射源预测位置误差和最优置信概率。图5展示了不同探索阶段对应的各放射源的预测强度误差和最优置信概率。图6展示了不同探索阶段对应的本方法不同模块的运行时间分布。同时也验证了基于多源辐射增益的路径规划器和峰值抑制粒子滤波算法的未知环境寻源策略的可行性。该策略不仅可以自主搜索疑似辐射区域,通过环绕采样的方式对状态进行确认,有效解决源数目非参估计和伪源识别的问题;同时融合多模态传感器数据的方式兼顾了对环境几何障碍的建图和辐射场的有效采样探索。
虽然在本文中参照了特定的实施方式来描述本发明,但是应该理解的是,这些实施例仅仅是本发明的原理和应用的示例。因此应该理解的是,可以对示例性的实施例进行许多修改,并且可以设计出其他的布置,只要不偏离所附权利要求所限定的本发明的精神和范围。应该理解的是,可以通过不同于原始权利要求所描述的方式来结合不同的从属权利要求和本文中所述的特征。还可以理解的是,结合单独实施例所描述的特征可以使用在其他所述实施例中。
- 上一篇:石墨接头机器人自动装卡簧、装栓机
- 下一篇:多智能体标注场景下标注任务的真值发现方法