智能工程
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

2.3 物理信号的感知

2.3.1 物理信号感知的要求和特点

正如在讨论感知的定义和准则时所述,物理信号感知的基本要求是能理解、能完备、能成长。能理解是指只有智能体能理解的感知内容才能进入智能体的描述、学习、记忆、理解、控制、行为的智能过程中,不能理解的可以暂时保存,但不能干扰智能体相关功能的发展,不能影响智能体的资源使用需求,否则只能放弃。能完备是指感知功能体系能够在两个维度上趋近完备。一是相对于感知对象转化的完备,也就是学习目的的完备;二是相对于任务的完备,即完成任务所需的都已经感知了。相对于任务的完备是在智能体进入成熟期,即开始承担外部智能任务后实现的,存在时间约束。相对于感知对象的完备是一个渐进过程,基于智能体对该感知对象的经验积累。如何实现完备,将在2.5节讨论。

物理信号感知的特点有三个:一是类型众多,二是简繁不一,三是模式各异。类型众多是指信号的物理、化学、生物特征,如图2.4所示,每个大类中还有很多小类,小类中还有更多的具体信号。简繁不一是指感知对象的复杂程度存在巨大的差异,有的只是一个单独的、没有歧义的信号,有的则需要在复杂的画面中辨识出具有意义的内容。模式各异是指感知处理过程需要采用不同的模式。最简单的仅需要传感器功能就完成了全部感知过程,如数控车床及自动化生产线的感知,信号转换后进入描述区就实现了需要的感知功能。对于复杂的感知模式,有的需要经由分类和组合的多次循环,有的需要通过后处理在感知存储区采用模式识别的方式发现后确认。

2.3.2 物理信号感知流程分析

就感知流程而言,物理信号感知的信号来源可以区分为两类:一是现场感知,二是记录模拟信号的二次感知。所有智能体接触的,或智能体学习、行为需要感知的实物场景都属于现场感知。二次感知主要是以物理信号方式感知已经记录下来的音视频、图片、文档等内容。

图2.8所示为感知流程的框架,它是前后相继的两个过程:分类过程和识别过程。分类过程是感知对象与感知器匹配的过程;识别过程是感知器(感知功能组)将对象辨识与组合为有意义的智能体可理解、可利用的信息,并经过一系列有序操作,保存到记忆中。

图2.8 感知流程框架

将感知对象匹配到特定感知器的分类过程,有三种典型模式。首先是现场感知通道分类模式。图2.8(a)的分类功能由置于现场的传感器功能实现。不同的传感器各自感知能感知的信号:摄像机感知光和声,温度计感知温度,压力传感器感知气压,霾传感器感知空气中的微粒,等等。多次分类的产生基于不同的感知优化方式或特定的感知对象。如对于光波,采用三元色感知器为第一次分类,清晰整体物件感知器为第二次分类,模糊整体或物体部件感知器为第三次分类,简单形状感知器为第四次分类。而摄录像机感知的内容,成为二次感知的一种来源。传感器不能感知的状态信息,原则上放弃,只保留形状清晰但智能体已有的感知器尚不能识别的信息保存在感知存储区。其次是二次感知模式。有两种不同的处置场景,一种是感知通道传来的信号已有标识,这种标识若是感知功能系统可以分辨的,则通过标识分配到相应的感知器处理;另一种是没有标识或感知功能不能辨识的标识,则由内置于感知通道的分配功能,如图2.8(a)逐次适配,直至能被一个传感器感知,若没有传感器可以感知,则进入相应的处置环节。最后是功能组介入的分类模式。功能组介入是指在第一类模式下,在第一层或某个层,感知对象进入的是一个功能组的最高层,则此后的感知分类由功能组执行。功能组按内在的层次,逐次向下分配到可感知的感知器。

在分类区,还有一个特殊过程,就是感知对象直接进入执行环节。这样的场景源自特定的感知目的,智能体执行自动控制类的任务,需要根据任务执行需要,部署感知获取特定的状态信息,如对环境温湿度的调整。在图2.8(a)中,对于这类信息给出了两条通道:一是通向执行,二是通向识别。并不是每次这类感知都需要识别,因为这种过程是反复重复的,由任务执行器决定识别与不识别的规则,感知功能系统以此规则进行操作。

经分类过程转换及物理性标识之后,感知对象进入识别过程。图2.8(b)的识别过程也有三种进程,即感知微处理器、感知功能组、外部反馈。

感知微处理器的识别过程有两类。一是对来自分类区的对象的识别。感知对象经由分类,已经确定应该由给定的感知器识别,只是可能,不是确定,因为物理信号存在模糊性。传感器能感知,并已转换为电信号,都需要经过如图2.8(b)所示的识别过程。识别基于感知微处理器拥有的知识和经验。感知微处理器的知识库中保存并可以使用所有“可辨识组”。所谓“可辨识组”是指同类感知器能够分辨并已经被智能体认可的一个信号集合。感知微处理器以感知框为对象,一次感知,遍历所有已知经验,然后决定对该框的处置。二是由后处理功能确定,来自功能组感知和其他功能系统对重新识别的需求。反馈识别的过程与前者一致。

感知功能组识别有两类主要功能。一是形成场景或事件感知,对本功能组的感知微处理器识别的内容增加相关关系的识别结果。如同一个人在连续的视频框中的位置和动作,在同一框或相关框中可辨识对象的相互关系,如一个人与一只狗。二是辨识一个或一组感知框中存在的与功能组层次一致的识别对象的关系,或明确其关系,或组合识别对象为相似度更高、表达含义更正确的识别结果。这里的相似度是指识别对象与知识库中的相应对象的一致性。对一个传感器的感知内容添加时间、空间或所感知内容的特定场景标识,对一组相关传感器根据场景组合为相关的含义组,由描述功能体系描述为智能体能理解、可使用的含义,并保存到智能体的记忆中,这些都是功能组识别的例子。

物理信号的感知依赖于传感器的发展。所有可以利用的传感器都应成为智能体感知功能体系的组成部分。感知功能的增长和优化基于知识和经验的积累,基于规则、流程的完善和知识库的增加。

2.3.3 物理信号感知的示例说明

1.示例的概况及识别前置条件

感知对象:假设用于识别的是一个路况摄像头一段记录的一帧,含有声音,如图2.9所示。

感知模式:感知通道以广播方式将信号发布,感知器平等(不分层)接收传来的光波和声波。

图2.9 从图片识别物体示例

感知器和感知器组:假定智能体已经拥有车、树、楼、塔、路等物体感知功能组,以及相应的感知微处理器,如轿车、出租车、货车、机动摩托车等;已经拥有是否遵循交通规则、交通事故等事件感知功能组,以及相应的感知微处理器,如交通信号灯、道路、道路交通标识等;已经拥有路况分析、噪声分析等实时场景感知功能组,以及相应的感知微处理器,如多种频段的声波感知器、特定车声感知器、全路面感知器等。

知识库:假定相关感知微处理器及感知功能组在初始、赋予的基础上已经完成了功能测试,能够实现自身知识库中的已知对象与图像中对应物体或对象的匹配,拥有找到对应物体的匹配算法。假定知识库已经包含图2.9中给出数字标记的感知对象的相同或相似知识,拥有与特定物体识别一致的判断及推理能力。

标识体系:智能体拥有的标识规则及标识体系,主要包括感知对象相关的标识,如来源、与前后的感知对象的位置、时间关系、感知对象的时空标识等;以及与识别过程相关的标识,如感知功能组、感知微处理器、使用的感知方法和知识。

符号体系:智能体确定的内部统一符号体系。

2.物体识别

认识物体是智能体提升认知能力与承担认知任务的重要内容。视频是连续的图片,通常一秒的视频由20~30帧图片构成,因此,这里先讨论从图片中识别物体,再补充讨论视频中识别物体的其他内容。

假定感知任务要求识别图中所标1、2、3、4、5的电动三轮车、出租车、货车、树、大楼,假定有车、树、楼三个感知功能组分别对应,选择从功能组高层到低层的识别模式,则感知过程分别如下。

(1)车的识别。感知对象由功能组逐次分类,直到被感知微处理器识别为止。识别过程的正确性与速度主要与功能组及感知器拥有的知识相关。假定功能组的知识库中有关于识别车的场景知识,其中包括行驶中车辆识别大类、交通干道车辆识别子类的判定知识,并确定了该图属于交通干道识别场景,则相应的车辆子类:三轮车、轿车、货车开始启动,继续向下分类,最后为电动三轮车、出租车、厢式小货车感知微处理器识别,其中出租车至少可以识别出三辆。使用的识别模式、确定识别对象的知识、识别对象在图像中的时空坐标均成为识别对象的标识,并一起向描述功能区传送。

识别的基础是感知器已有的知识,车的图像,不同类车的不同特征,同类车、不同型号的形状差别;被识别车的场景区分能力,高层功能组知识库的场景区分知识及判断规则;知识与感知对象匹配的算法与/或流程,判断规则与赋予的简单推理能力,如距离与大小。

(2)树的识别和楼的识别。与车的识别过程和方法一致。这里的任务只要求识别树或楼,没有要求识别什么楼、什么树,所以功能组没有必要启用更深的层次。

假定识别过程反之,先由具体的感知微处理器识别,再经功能组逐层组合,或者其他识别方式,其前提和识别的具体过程是一致的。

3.实时状态识别

假定感知任务要求判别路况及噪声。

(1)路况的识别。路况识别是道路识别功能组下层功能组—城市交通干道路况识别的下层功能组。

路况识别有两个基础,一是感知功能组拥有系统、完整的知识库;二是感知对象具有识别的可能。图2.9可以识别部分路况,但有些路况不能判断。例如,要判断车辆速度,还需要车辆速度感知装置;要为导航系统提供基础路况,还需要更长距离的道路通行状态。

实时路况经由交通干道感知功能组进行判断。该功能组根据画面,结合知识库中的判断规则,从车辆密度及通行状态可以得出通行顺畅、没有交通事故的结论。

(2)噪声的识别。噪声识别是声音识别功能组下很小但又比较简单的类别。感知能力只需要频率和强度,判别标准是关于场景的强度。

图2.9自身没有可供识别的声源,但源自摄像机,声音只需要以视频方式播放,并与图片时间同步就可获得声源。能否识别,关键在于功能组的知识库,其他方面没有复杂性。

智能体实时状态识别还有两个最基本的需求:特定任务的执行和智能体自身环境的感知。这两类实时状态感知的成熟度比上述两个例子更高。只要在初始、赋予时将可以得到的成熟的知识输入智能体,智能体则在此后的成长中通过学习机制与感知实践持续完善,就能够保持智能体在这个类型中的识别能力。

4.场景或事件识别

本书中场景和事件是同义词,指一个有特定含义的连续过程。在有些文献中,同一事件可以跨越时空不连续发生,从感知的角度看,本书不考虑时空不连续的场景或事件。

从接收和转换过程看,场景或事件的感知与物体、状态的感知一样,此处不重复讨论。

场景或事件感知的重点在于相应的功能组的组合识别能力。一段连续感知对象中的人物、物件、环境状态在感知后,与场景相关的功能组即依据智能体的感知目的开始工作。识别场景并组合(复原)感知对象中内含的场景,是基于功能组的知识库。场景或事件感知器的知识库除拥有已知场景或事件的典型情景、主要特征、进程的实景及描述外,还拥有基于感知对象中特定的客体,如人、动物、植物、物体,通过这些客体的变化来辨识、确定事件的功能性规则与流程。

当一般性地讨论场景识别时,会感觉难度很大、不知从何入手,但只要将需要识别的场景如同需要识别的物体一样持续细化,用数以千计的场景功能组识别路况,用数以万计的专用感知功能组识别城市路口的不同场景,甚至可以设想一个更为直接的方法,将任何有必要识别而又具备特殊性的场景都用一个场景感知功能组承担这个场景的识别的时候,识别就不是问题,反而变成另一个命题,能否构造这么多的功能组?其实,这些功能组都是逻辑形态,不用说几万个,就是几亿个、数十亿个都不是问题。

回到图2.9中开始事件的感知识别。假定目的是判断有没有超速、逆行、超高超宽的事件存在。显然,感知并做出判断十分容易,今天的道路监控已经能够做到自动识别这样的事件。

不同的是,今天的监控系统只能做出判断,监控系统也能通过经验的积累,持续提升其性能、能力。智能体感知即使采用完全相同的方法做出了判断,但积累的知识和经验将以智能体可管理、可识别的方式进入记忆,从而成为智能体拥有的知识和经验,为其他功能系统所用,其他功能系统的积累,同样可以为这一感知功能组所用。

5.交互与反馈

小孩看到、听到、触摸到不认识的物体,第一反应就是提出问题,然后才是思考:通过类比、归纳,得出进入记忆的正确或错误的结论。人工智能界认为无法表示的常识问题,就是从出生开始的日常生活中历经数十年积累起来的。这种模式也是智能体感知的实现和成长过程。

这里的交互是指感知功能系统中任何一个组件向其他智能体提出问题,得到回答,并将回答转化为自身可用的知识。这里的反馈是指感知功能系统接收并处置来自智能体其他功能系统的、与感知结果相关的信息。

由于感知微处理器、感知功能组是高度细分的,每个只承担一种具有特殊性的感知识别任务。高层的功能组看起来是一个复杂的概念或过程,如人的识别、路况的识别,但实际上它们依然是一个简单、独特的感知任务。人的识别这种高层物体识别功能组,其实只有一个具体识别任务,就是把人从其他动物中区分出来,而路况识别功能组也只有一个具体任务,就是把路从其他同类物体中区分出来,如山、河、房屋等。具体什么样的人,是谁,什么样的路,什么路况,都由下面层次的具体感知微处理器识别。当出现高层识别不了的场景时,可以在得到下层的识别结果后再次识别。

也因为感知器的高度细分,其何时提出什么问题,提出问题的语句都是简单的填空模式。如图2.9中远处的楼,感知器若区分不出是楼还是其他物体,可以自己生成“这是什么”或“这是楼吗”的提问,接收到问题的人,回答的格式也是固定的:“楼”或“是”。显然,这样的过程,具有操作系统和知识库的感知微处理器很容易处理。更加复杂的问题,如“为什么”“为什么不是塔”一定是以逻辑功能为主的功能组才能提出的,第一个问题,是为了修改知识库,由楼的功能组提出;第二个问题是由识别“塔”的功能组与识别“楼”的功能组的上位功能组提出。

反馈基于其他功能区域发现新的结果,通向记忆区后,发现不一致,然后根据溯源的标识反馈至源头感知器。源头感知器,不管是感知微处理器还是感知功能组,应据此修改知识库或流程。修改之后,需要执行判断过程,如果在记录中有类似的感知过程,则应再次感知。

本节讨论的所有过程及前提条件都是现有技术可以实现的。智能体感知物理信号所依据的原则是能识别则识别,不能识别则通过交互系统进行请教,若交互后仍不能识别,则放弃或留存等待知识库增长后再识别。

外部的客观存在,无论是一个客体、一个场景,还是一个事件的过程,存在不同的维度和颗粒度。感知什么维度,到什么样的颗粒度,首先基于智能体的感知能力,其次基于智能体提升认知能力和执行智能任务、问题求解的需求。因此,初始、赋予应该对智能体感知维度的扩展和颗粒度的细化或组合方面具有发展的能力,这样的能力嵌套在2.2节讨论的感知功能系统中。