3.1 生物群智涌现机理
群体智能起源于生物学、生态学、人类行为学等领域[7-8]。同类群体,如鱼、鸟、蚂蚁和蜜蜂等群体,其个体拥有的智慧有限,但通过群体合作能够实现超越个体行为的集体智慧。本节将分别从生物集群行为以及细胞层调节机制两个层面讨论生物集群中蕴含的群体智能涌现机理。
“生物集群行为”是社会学、生物学、神经科学、行为生态学等多个领域广泛研究的重要问题。牛津大学的Sumpter指出[9]群体行为可以由简单个体通过简单规则进行重复交互而产生,Vicsek等人[10]也通过实验证明单个智能体仅通过与近邻和局部环境的局部交互就可以产生全局性的群体行为。这种个体-个体间或者个体-环境间的交互行为在生物群体中有多种表现形式。例如蚂蚁信息素的分泌、与同伴触角的接触,蜜蜂飞舞的不同规律、翅膀震动的频率高低等,都是种群内部传递消息的不同机制。在此通信机制下,个体感知全局环境并据此部署行动,进行集群避险、组队捕猎等活动。较为经典且常见的生物集群行为有椋鸟群的聚集飞行、鱼群的大规模游行、白蚁协作筑巢和狼群合作捕食等。研究者们从这些生物集群行为里总结出形式多样的协作机制,并将其成功应用于人工集群协作任务,提升了人工集群的协作效率。如表3.1所示,在对前人研究进行总结和分析的基础上,我们将生物群智涌现行为归纳为八个类别,分别是集体行进、群体聚集、群体避险、协作筑巢、分工捕食、社会组织、交互通信和形态发生。本节将分别介绍不同集群行为中的群智协同机理,并进一步阐述相关机理在人工集群系统中的典型应用。
3.1.1 集体行进
集体行进任务指在某些生物集群中观察到的很多生物个体以某种机制同时行进的现象,如表3.1所示。例如成千上万只欧椋鸟在大规模“特技飞行”中,可以摆出球形、椭圆、圆柱和波状线条等各种形状。鸟群自发完成这样协同动作的原理很简单,每只鸟和左右队友协调行动即可保持鸟群聚而不散。欧椋鸟之间的交互主要是通过相互观察实现的,如果两只欧椋鸟之间的视线被遮挡,则无法进行信息交互。
表3.1 生物集群群智涌现机理——集体行进
大雁在集体行进中则体现出了不同的组织机制。大雁每年迁徙时会汇聚在一起,由强壮而有经验的大雁带队,其余跟在后面列队飞行。飞在队伍最前面的大雁被称为“头雁”,它的翅膀在空气中划过时,会在两翅翅尖后各产生一股细小的上升气流。跟着头雁飞行的其他大雁为利用同伴产生的上升气流,就会自然而然地一只跟着一只地飞,从而排成整齐的“人”字形或“一”字形。Weimerskirch等人[15]首先提出,以此形式飞行,领航者后面的跟随者所受升力会大大增加,可有效节省飞行体力。研究者们将这种机制命名为领航者-跟随者模式。也可在羊群中观察到同样的领导现象[13],队伍行进时领头羊固定在队伍前发挥领导作用,领头羊强壮且有威望,但也需承担踩陷阱、走岔路等风险。图3.1展示了欧椋鸟群与雁群的自组织、有序的集体行进现象。
图3.1 欧椋鸟的集群飞行(左)和大雁的列队飞行(右)
生物群体所呈现出的各种协调有序的集体运动模式启发了人工集群的协同方式。为了模仿鸟类等生物的集群行为,Reynolds等人在1987年提出了Boid模型[1],总结出如图3.2所示的三条行为规则:凝聚——群聚中心,试图靠近附近的群伴;分离——避免与附近的群伴碰撞;对齐——速度对齐,使速度与附近的群伴相匹配。之后Vicsek等人[10]对其进行了简化,从统计力学的角度研究了集群中个体运动方向达成一致的条件,为个体运动建立了动力学方程。Couzin等人[16]则用数学模型对Boid模型进行了更精确的描述,将凝聚、分离、对齐三个规则对应为三个由内到外的不重叠区域:排斥区、一致区和吸引区。关于这两种模型会在3.3.2节中进行更详细的介绍。
图3.2 Reynolds行为规则:速度矢量的对齐、相邻智能体之间的分离以及与相邻群伙伴中心的凝聚力;深灰色箭头表示要移动的方向[1]
以“领航者-跟随者”模式为基础(如图3.3所示),Gautam等人[17]在实验中通过领航者机器人引导其他机器人形成圆周编队。该方法首先根据初始分布情况确定能够包含所有机器人的圆形区域,并选择距离圆心最近的个体作为领航者,跟随者基于均匀分布计算与圆周的相对距离以及在圆周上的位置。Alur等人[14]还基于此结构开发了用于多机器人协同操作的系统架构,用于在非结构化和未知的环境中部署多个自主机器人。其中领航者遵循期望的轨迹,跟随者保持规定的间隔并支撑相邻的机器人。该工作使用两个带有全向摄像机的车形机器人来执行真实实验,以局部获取距离和角度信息。
图3.3 领航者-跟随者结构,ρd和θd分别表示和原有期望的相对距离和角度[18]
3.1.2 群体聚集
群体聚集是生物群体为维持生存,在“物竞天择”的自然选择下进化出的自主聚集性行为,如表3.2所示。例如蟑螂这种有群居习性的昆虫,通常会聚集在阴暗潮湿的地方,便于生存繁衍,而这种聚集的形成是由于蟑螂能分泌一种聚集信息素[20]。信息素一词于1959年由科学家彼得·卡森(Peter Karlson)与马林·路丘(Martin Luscher)共同提出,用来形容动物利用化学分子传递信息的沟通方式。1976年Nordlund等人[19]指出昆虫信息素可以引起其他个体或同类昆虫群体产生行为和生理反应,是昆虫间通信的重要手段。
表3.2 生物集群群智涌现机理——群体聚集
具体来说,蟑螂的聚集是通过味觉感知到聚集信息素浓度高的地方并向之前进,而聚集蟑螂较多的区域信息素浓度会更高,进而吸引更多蟑螂,通过这一正反馈机制产生聚集性栖息[20]。蜜蜂是变温动物,无法维持必要体温,它们可以通过身上的绒毛感知温度变化,聚集在温度适宜地区[21]。细菌寻找食物(如葡萄糖)时,会趋向于有较高食物分子浓度的地方,远离有毒(比如苯酚)的地方[22]。上述几种生物聚集现象的产生都可总结为趋化性(Chemotaxis)。趋化性是一种引导细胞运动的机制,细胞向周围环境释放化学物质,而其他细胞则据此化学物质趋向或远离。趋化性在自组织系统中起着重要的作用,细胞、动物群体等的运动、聚集、模式形成等现象均可以通过趋化作用实现[23]。图3.4展示了蜂群的聚集与细胞的群体移动。
图3.4 蜜蜂(左)和细胞(右)的群体行为
研究人员受生物聚集现象的启发,研究了群体机器人的有序聚集行为。Kernbach等人[22]根据蜂群向适温区域的聚集行为提出了BEECLUST这一环境引导聚集的经典方法。在实验中,通过调节光照强度模拟环境温度的变化,机器人可在随机游走和等待两种状态之间切换:当与其他机器人相遇时,停止并等待一段时间,等待时间与光强成正比,随后再转入随机游走状态。通过不断迭代和演化,机器人趋向于聚集在温度较高(即光照较强)的区域,如图3.5所示。Yang等人提出了一种受细菌趋化性启发的群体机器人分散控制算法,用于目标搜索和捕获[26]。Bai等人[25]受趋化性启发,为有相同圆盘形状的模拟智能体群体设计了一种自组织算法。每个智能体都会释放和检测化学引诱剂,并根据这些化学物质改变其内部状态。它们使用均匀分布在周围的八个感知器进行方向感知和邻居方向探测,并与邻居行为保持一致,基于此可以完全自组织地形成用户所定义的不同形状。
图3.5 集群机器人趋光聚集:a)初始状态下将机器人放在较暗区域;b)~f)机器人逐步聚集到光照较强区域[22]
3.1.3 群体避险
群体避险是集群遭受突发状况或险情,整体反应以躲避危险的行为,如表3.3所示。例如有猎鹰之类的猛禽来捕猎时,遭受攻击的椋鸟群会及时转弯躲避捕猎者,动作敏捷,同时保持队形不分散。Potts等人[27]于1984年提出了“合唱团(Chorus-line)假说”以解释这种快速转向现象。该假说认为:最开始先有一只鸟或几只鸟转向,然后影响周围邻居,呈波浪式地传遍整个鸟群。之后的研究还对“合唱团假说”进行了量化分析,指出每只鸟总是关注相同数量的邻居。
表3.3 生物集群群智涌现机理——群体避险
在鱼群中也存在类似于鸟群急转弯的应激反应,在遇到攻击时,鱼群也会突然改变整体行进方向。面对掠食者,数目庞大的鱼群会形成巨大的旋涡,即“鱼群风暴”,形成原因之一是鱼群的快速游动,会造成大面积鱼鳞反射光线,从而迷惑和干扰掠食者。鱼群这种复杂行为的原理类似于鸟群个体间的邻居互动行为,20世纪60年代,俄罗斯生物学家Dmitrii Radakov发现,如果每一条鱼都简单地与邻居协调行动,鱼群就能够成功避开捕食者。3.1.1节所提到的Boid模型又对这一理论进行了完善和细化。Sosna等人[30]通过实验证明鱼群个体在感受到视野范围内的变化后会调整个体间距。他们将鱼群模型转化为网络连接拓扑结构,鱼群通过修改内部的空间结构以及相应的互动网络拓扑结构来应对所感知到的威胁。图3.6展示了鱼群和鸟群的快速转向现象。
图3.6 鸟群和鱼群[31]避险中的快速转向
受此启发,人工集群的研究也可以通过调整结构,如改变队列、组织结构、行进速度等来躲避威胁。例如本章开头所介绍的粒子机器人集群[5],如果在集群和光源之间设置一个有缝隙的障碍物,集群可以柔性变形挤过这个缝隙,继续向光源方向运动。基于环境动态的应急避险在未来战争的研究中也备受关注。2017年,美国DARPA提出的面向未来作战的创新性构想——马赛克战(Mosaic Warfare)也是未来战争中的一个重要概念[29]。它试图打造一个由先进计算传感器、多样化集群、作战人员和决策者等组成的具有高度适应能力的弹性杀伤网络,如图3.7所示。马赛克战将观察、判断、决策、行动等阶段分解为不同力量结构要素,以要素的自主聚合和快速分解的多种可能性来降低己方的脆弱性,并使对手面临的问题复杂化。例如,组成密集队形的无人机蜂群在遇到攻击时可自行组织分散,然后快速合并以重新发起进攻。换句话说,马赛克战将作战过程视为一个快速反应的自适应系统,将为实现特定目的而开发昂贵武器的做法替换为将小型无人系统与现有能力进行创造性持续动态组合,利用不断变化的战场条件与快速响应资源建立连接,使用低成本无人蜂群编队以及其他电子、网络等手段来击溃对手。
图3.7 马赛克战:未来作战新构想[1]
3.1.4 协作筑巢
单个昆虫通常拥有有限的行为能力,但昆虫的集体行动就能够执行令人惊叹的复杂任务,比如筑巢[32],如表3.4所示。协作筑巢也是生物群体为应对自然法则的挑战演化出的生存策略。
表3.4 生物集群群智涌现机理——协作筑巢
常见的群居性动物巢穴有蜂巢、白蚁巢和蚁巢等。蜂巢是工蜂用自身的蜡腺所分泌的蜂蜡修筑的,它由一个个排列整齐的六角形蜂房组成,每个蜂房的底部由3个相同的菱形构成,这种纯天然的生物构造具有坚固而节省材料等优势。白蚁作为群居性昆虫也有协作筑巢行为。它们所构筑的巢穴极为壮观,最高可达十多米。视力功能完全退化的白蚁仅凭借识别其他白蚁留下的分泌物气味来决定其行为,无须直接接触或者集中控制[35],即如果前面的白蚁在某个位置放了一块建材,后面的白蚁会循着气味路线接着放置新的建材,彼此间通过信息素达到协作通信的目的。
蚂蚁和白蚁属于两种不同的物种,但蚂蚁也是社会性昆虫。多数种类的蚂蚁筑巢于地下或树上,由工蚁们负责建筑和维护。巢穴内部道路错综复杂,穴外堆土有馒头形、火山口形、圆锥形等不同形状,可防风、防水,保护巢穴内部结构[37]。筑巢过程中涉及工蚁间的信息传递机制,Franks等人[34]利用其设计的模拟人工蚁巢刻画了细胸蚁的协作筑巢过程,指出这些蚂蚁通过把自己的建筑块推给其他个体以不断推进结构的构建。
建筑业也是人类主要的生产活动,这些自然生物系统启发我们设想多个独立智能体通过类似的原则协同操作,以提高建造过程的自动化程度。早在1995年就有科学家对生物筑巢行为的借鉴探索。Theraulaz等人[38]根据对黄蜂巢的观察提出了一种分布式建筑的形式化模型,让一群简单的智能体在三维立方体上随机移动,构造出形似黄蜂巢的建筑结构。Werfel等人[39]设计了一种自动组装方案,多个智能体可以根据高水平用户的指定设计自动组装二维实体结构。在其后续研究中又提出了一个更加完善的多智能体建造系统[36]。该系统先通过编译器将目标结构转换为结构路径,即机器人须遵守的交通规则以保证交通畅通,再为每个机器人设定行为规则,如每次只能爬上或爬下一块砖的高度等,确保该结构的增长以符合机器人能力的方式完成。通过对每个智能体的行为约束实现了如图3.8所示的多智能体协作实施建筑任务。
图3.8 自然界的和人工的建筑任务协作:(A)复杂的米级白蚁丘,由(B)中的白蚁建造;(C)人工协作建造系统的物理实现,多个独立的攀登机器人,配置专门的砖块;(D)多智能体建造系统概述,先将目标结构转换为结构路径,再由机器人开展行动[36]
3.1.5 分工捕食
自然界的一些群居性动物在捕猎时会分工协作,合作围捕,从而增大捕猎成功的概率,以获取食物并实现长期的生存繁衍,如表3.5所示。
表3.5 生物集群群智涌现机理——分工捕食
狼群在捕食猎物时能够做到分工明确,同时对猎物按劳分配,在种族发展方面实施优胜劣汰机制。参与捕猎的狼可分为三类,即头狼、探狼和猛狼。头狼处于领导地位,负责统筹安排,提高捕食效率;探狼负责打探猎物,在猎物活动领域根据气味浓度判断与猎物之间的距离,并把信息传递给头狼;猛狼负责攻击猎物,当头狼接收信息后会通过叫声通知它们,闻声后猛狼顺着信息围攻猎物[40, 43](如图3.9所示)。狮群作为群居性动物也存在合作狩猎的现象,但在狮群中雌狮主要承担狩猎的责任。狮群中的分工狩猎通常是一些雌狮(翅膀角色)围在猎物周围,另一些雌狮(中心角色)负责观察猎物和“翅膀”的行动,等待猎物向它们移动。处于翅膀角色的雌狮发起对猎物的攻击,处于中心角色的雌狮则在猎物逃离追击时捕获它[44]。
图3.9 狼群捕猎:狼群对猎物的追击、骚扰和包围机动[43]
借鉴动物的分工捕食行为,研究人员抽象出了狼群算法、狮群算法等优化算法以解决路径规划等寻优问题,还将这些群体协作机制用于多智能体的协同控制以提高协作效率。Yang等人[45]最早根据狼群对猎物的围捕和分享行为抽象出了狼群搜索算法(Wolf Pack Search, WPS),吴虎胜等人[40]模拟狼群习性提出了狼群算法(Wolf Pack Algorithm, WPA),为高维、多峰的复杂函数求解提供了新思路。CHEN等人[42]将改进的狼群算法用于路径规划,利用特征点坐标近似来表示某一位置的海拔高度,插值生成地形的变化趋势,进而优化旋翼无人机在复杂三维空间中的行动轨迹。
3.1.6 社会组织
除在捕食活动中体现出的协作分工外,蜜蜂、蚂蚁和狼群等生物群体中也存在着严格的社会组织,它们划分出不同角色以承担不同责任,高效维持整个群体的生存运转,如表3.6所示。与分工捕食不同的是,分工捕食是针对群体运转的某一特定活动的分工协作,社会组织则涉及维持群体运转的各种活动,不限于觅食或捕食,并且与生命体的伴随周期更长。
表3.6 生物集群群智涌现机理——社会组织
在蜜蜂中,有蜂王、雄蜂、工蜂之分。蜂王负责繁殖并维持蜂群秩序;雄蜂负责交尾;工蜂负责保育、筑巢、采蜜等。蜜蜂的激素水平、日龄和营养水平等因素都会影响蜜蜂的分工[46]。蚁群中也有类似结构的社会组织,在蚁群中有蚁后、雌蚁、雄蚁、工蚁、兵蚁等类别。其中,蚁后负责繁殖后代;雌蚁交尾后脱翅成为新的蚁后;雄蚁主要职能是与蚁后交配;工蚁则负责建造和扩大巢穴、采集食物等任务;兵蚁是对某些蚂蚁种类的大工蚁的俗称,负责粉碎坚硬食物和保卫群体。2012年,纽约大学医学院、华大基因等单位的联合研究首次从全基因组单核苷酸水平上解释了DNA甲基化调控也影响着蚂蚁的社会等级分工[47]。图3.10(左)展示了同品种的蚁群中蚁后和其他类别的蚂蚁在体型上的差异。
不同于蜂群、蚁群中受激素等客观因素影响的角色划分,狼群中等级制度的划分依靠的是个体实力与威望。狼群是母系社会,如图3.10(右)所示。美国动物学家大卫·米克指出[48],狼群等级森严:处于社会顶层的是头狼(α狼),头狼承担领导者责任;其次是乙狼(β狼),乙狼在头狼死后接替头狼的位置;处于最底层的是亥狼(ω狼),亥狼有时需扮演小丑的角色以缓解狼群中的紧张关系。在分工捕食中介绍的狮群和狼群都有协作捕食现象,同样过着群居生活的狮群像狼群一样也存在较为严密的社会结构。一个狮群通常由4~12只有亲缘关系的母狮、它们的孩子以及1~2只雄狮组成。雄狮游走在领地四周保卫领地;狮王是最强壮的雄狮,需要保护幼狮和领地;雌狮是主要的狩猎者,负责养育幼狮;幼狮主要在狮王和母狮的保护下生存[41]。
图3.10 同品种的蚁群中蚁后和雄、工蚁的体型对比(左);母系社会的狼群中母狼和两只幼崽(右)
基于生物的社会组织考虑,如果允许将协作任务划分为不同子任务,并将不同角色分配给适合的智能体,则可以促进合作的进行。Liu等人[41]基于狮群中的自然分工,模拟狮王守护、母狮捕猎、幼狮跟随三种智能行为,提出狮群算法(Lion Swarm Optimization, LSO),并将该算法应用于六个标准测试函数优化问题,通过与粒子群算法和骨干粒子群算法的比较,发现狮群算法具有较快的收敛速度,且能较好地获得全局最优解。在无人机协同搜索和作战场景中,将无人机划分为侦察型和攻击型两种,以最大化系统效能[51]。在刘立章等人提出的无人机蜂群拦截系统构想中[52],为提高整体拦截效能,根据任务职能区分拦截系统角色,采取群组编队的方式,构建以拦截群为核心,侦察群、反辐射群、诱饵群、电子对抗群(干扰群)、补充群协同运行的空中无人机蜂群拦截系统。在达到Grandmaster级别的星际争霸游戏AI训练过程中[50],DeepMind研究人员创建了一个包含四类个体的联盟(League),分别为主探索智能体(Main Agents)、主探索者(Main Exploiters)、联盟智能体(League Exploiters)和历史参数个体(Past Players)。主智能体是最核心的智能体,是最终输出的AlphaStar;主探索者用于寻找主智能体的弱点;联盟智能体则用于寻找整个群体的弱点;而历史参数个体用于存储智能体的历史参数。通过不断让联盟内部的个体之间相互对抗来进行强化学习训练,最后得到一个十分强大的游戏智能体。
3.1.7 交互通信
生物集群要实现列队飞行或成群游动等协作行为都离不开交互通信和信息共享,如表3.7所示。生物群体既有涉及全体成员的通信方式,也有只与邻居交互的通信方式,我们根据通信范围的大小将生物群体内部的通信交互分为两种:全局交互与局部交互。
表3.7 生物集群群智涌现机理——交互通信
1. 全局交互
全局交互指获取的信息涉及全体成员。例如在3.1.4节中提到的,蚁群活动范围内的信息素浓度就是全体成员共同作用产生的;蚂蚁个体感知区域内某一位置的信息素浓度,并据此做出行为抉择。再比如大雁编队排成“人”字形或“一”字形,形成一定角度飞行,每一只大雁都能看见整个编队,从而更好地调整自己在编队中的位置,避免碰撞。Frank等人指出[63],鸟群成员间的视觉交互可以提高导航能力。在蜂群中还存在根据收集成员信息进行群体决策的现象。蜜蜂决定更换巢穴时会出动一批侦察蜂,它们发现合适的位置后会回到蜂群外围跳“摇摆舞”,摇摆舞的剧烈程度和持久度代表位置的质量信息。侦察蜂飞出的方向是随机的,包括了蜂巢周围所有方向,在最早的侦察蜂返回的时候,会吸引新的侦察蜂重复访问潜在的蜂巢地址。在有不同的候选蜂巢出现时,越多侦察蜂聚集的方向,该方向候选地址的信息强度越高,从而吸引更多的蜜蜂侦察兵选择该候选地址,最终形成了蜂巢选择的群体决策。
受蚂蚁信息素交流行为的启发,Hamann等人[54]研究了一个类似于蚂蚁觅食的场景,通过在环境中留下信息素作为共享信号,形成信息素梯度场,引导机器人遵循这个梯度搜索物品。人工群智系统的协同控制研究也从蜜蜂的群体决策中获得灵感,研究如何通过充分的信息交换达到个体间的共识。例如,Tanner等人[56]提出了一种基于人工势场和图论的分散的同步(共识)策略,在固定和切换的拓扑下,通过将所有智能体的信息对齐到相同的值并稳定相对的速度,群体就能够聚集成紧密的结构。在周等[64]搭建的无人机空战仿真系统中,直接将每架无人机的视野作为公共的已知信息,即使其他无人机的探测器没有发现敌方的飞机或导弹,也可根据共享信息判断当前所处状态并做出反应,从而提高整体的防御力和攻击力。
2. 局部交互
局部交互指个体只与部分个体保持联系来做决策,获取到的是局部信息。例如椋鸟群完成协同飞行时,每只鸟关注的不是整个集体,而是只和左右队友协调行动。鱼群游动时每只鱼也只以周围一两条同伴的身体的侧线为观察标志调节自身行为。侧线是鱼类最敏感的器官,就像鱼的导航,可以感知到细微的水压、温度变化并将其传递给中枢神经系统,从而使鱼迅速反应并调整路线。鸽群的隐式层次等级也体现了局部交互行为,其中头鸽处于绝对领导地位,下层的跟随鸽会受其上每一层鸽子的影响[60, 65]。Zhang等人[66]通过进一步研究发现,在飞行方向上,当飞行轨迹平滑的时候,鸽子尽力与周围邻居的平均方向保持一致;而当通过急转弯变向时,鸽子迅速选择与领航者保持一致。在飞行速度上,鸽子则更倾向于受周围邻居影响。寒鸦群拥有非常独特的局部交互模式——配对交互[61, 67];寒鸦群体是一夫一妻制,通过个体“一对一”的配对飞行来实现群体的有序行进。
通常,可以将动物中的局部交互模式映射到人工集群的通信模式上,个体无须获取全局信息,仅通过与其周围一定范围内的个体通信协调就可以表达集群整体结构和功能。罗等[62]根据鸽群分层领导机制的灵感,提出了应用于无人机集群的分布式控制框架。该方法综合了鸽群中观测到的速度相关性、领航者-跟随者交互模式和层级领导网络等优点,通过控制每架无人机的局部位置和速度实现群集控制算法。Ren等人[57]通过智能体间的局部通信和信息交换来达到群体移动的速度或方向上的共识。Rezaee等人[68]提出了一种针对高阶多智能体系统一致性的协议,描述了智能体如何利用邻居的相对位置信息实现一致性。GALLEHDARI等人[69]提出了一种分布控制法,在智能体出现故障时,利用智能体的最近邻信息和内部故障检测与识别功能仍可保持通信交互。Fax等人[70]利用图论框架研究了不同通信或信息流拓扑对编队控制稳定性和性能的影响。他们提出了一项分散的信息交换法,在智能体之间设计最小数量的信息交换,并就编队结构的中心达成共识,作为协同运动的共同参照,实现对编队的精确控制。
3.1.8 形态发生
纵观整个生物体的生长周期,在各种细胞的配合和激素的调节下,生物从胚胎发育成一个成熟的生物体需要数百万个细胞在胚胎发育和生长过程中自组织形成具有多功能形态和一定物理形状的结构,这一过程在发育生物学中被称为“形态发生”[71-72],如表3.8所示。图3.11是花朵的形态发生示例。该过程是在基因电路的控制下通过细胞的局部相互作用产生的[72]。在胚胎发育过程中大量细胞集合在一起积极协作,以建立复杂的组织和器官,这些功能性的形状和组织可以为生物栖息在特定的生态位并在给定的环境中成长提供重要保障。
表3.8 生物集群群智涌现机理——形态发生
图3.11 花朵形态发生为成熟复杂褶皱体的过程仿真
在生物形态发生系统中,存在两种空间形态形成机理。第一种机理为自上而下控制,在某些组织中,细胞首先访问有关其位置的信息,然后根据此位置信息做出细胞命运选择[77]。比如海胆的早期胚胎发育就是自上而下控制的例子,在海胆从棱柱幼虫过渡生长为长腕幼虫时,所生长出的“海胆刺”就是通过位置信息来进行控制的。第二种机理叫作局部自组织[18],它可以通过纯粹的局部自组织或自发反应实现形态发生。一个著名的例子是图灵斑图[78]。伟大的科学家图灵曾探究过动物(如斑马、豹子、老虎等,如图3.12所示)身上的花纹究竟是如何产生的,根据图灵的理论,这是因为成形素激活一些细胞、抑制其他细胞,使化学性质不同的细胞按特定规律排列。例如老虎身上的条纹图案是因为催化剂激发了暗色条纹,抑制剂阻碍了条纹周围生长深色块,这种反应在老虎的细胞中扩散,从而形成了重复性的条纹图案。
图3.12 自然界中常见的图灵斑图:斑马、豹子、老虎
如果将智能体视为合作形成预定义或自适应模式的细胞,那么人工集群就可以利用这些生物细胞启发的算法。下面将介绍如何将形态发生素扩散、反应-扩散模型和基因调控网络等生物形态发生的机制引入人工集群系统。
1. 形态发生素扩散(Morphogen Diffusion)
在生物学中,形态发生素[73]代表在胚胎阶段扩散到发育组织中的信号分子。形态发生素的浓度与到源头的距离成正比,并形成相应的梯度。细胞可以了解它们相对于这个梯度的位置,并相应地调整它们的行为和反应。细胞生长、分化、运动以及其他基因和形态发生素的产生或抑制就是这些作用的例子。
2. 反应-扩散模型(Reaction-Diffusion Pattern)
反应-扩散(RD)模型是解释动物胚胎发育中自我调节模式形成的最著名的理论模型之一[74]。在RD模型中,图灵使用了一个简单的系统,即“两种可扩散物质彼此相互作用”来表示胚胎中的图案形成机制,并发现这种系统可以自动生成空间图案。其基本思想是“元素之间的相互作用会导致自发形成图案”。在形态发生素扩散模型中,即使有多种形态发生素,彼此间是信号独立、互不影响,而反应-扩散模型考虑了元素间的相互作用。
3. 基因调控网络(Gene Regulatory Network, GRN)
如果在系统中引入更多的形态发生素,那么基因表达的控制和形态发生素的调控的复杂性将迅速增加。在生物有机体中,基因、蛋白质和形态发生素之间相互作用的调控被编码到生物体细胞的基因组中。在多细胞生物中,所有细胞都有相同的基因组,但激活和抑制的基因排列的变化会使每个细胞的行为和功能不同,并调节基因的表达。蛋白质也是基因的产物,负责信号的传递、感知、驱动、结合等,这些过程均受到基因调控网络[75]的控制,它是一个描述基因表达速率动力学的基因和基因产物相互作用的模型。
Mamei等人[76]研究了受形态发生素启发的集群模式生成。他们展示了三种形态发生素的扩散如何用于寻找一群模拟机器人的中心,最终形成环状图案。Ikemoto等人[79]使用一组机器人应用图灵反应-扩散理论生成了多边形图案,如三角形、四边形和六边形等(如图3.13所示)。在此算法中,一旦机器人形成了圆形模式,机器人之间便会交换两个类似形态发生素的信号,并通过一组反应-扩散方程来相互影响;最终,在圆上生成了离散的图灵模式。Guo等人[80]将GRN应用于多机器人模式的形成。每个智能体都有一个包含两个基因的GRN,这两个基因产生的蛋白质可以控制智能体的x方向和y方向。由GRN产生的蛋白质将这些智能体驱至所需形状的边界,以便将它们均匀地分布在边界上,并防止碰撞。
图3.13 由图灵反应-扩散机制产生的圆形模式生成多边形图案,其中每个彩色圆圈代表单个智能体,蓝色圆圈表示在图灵反应-扩散机制之后具有较高浓度激素的个体[79](见彩插)