您的位置:首页 > 其它

人脑是怎样认知图像的?——特征分析模式(传统模式识别之三)

2011-01-22 14:49 399 查看
前面已经说过,模式是由若干元素或成分按一定关系构成的。这些元素或成分可称为特征,而其关系有时也称为特征。特征说认为,模式可分解为诸特征。

例如,一个大写的英文字母A可以分解为下列特征(见下图):两条斜线、一条水平线和3个锐角。这3个锐角实际上表明这些线段的关系,即两条斜线相交和水平线与两条斜线相接。
Lindsay和Norman(1977)指出,构成所有26个英文字母的特征共有7种,即垂直线、水平线、斜线、直角、锐角、连续曲线和不连续曲线,如F有一条垂直线、两条水平线和3个直角;P有与F一样的特征,外加一条不连续曲线;R有与P一样的特征,另有一条斜线,等等。
Gibson(1969)也曾就英文字母的特征提出过类似的看法,但区分出12种特征。
照特征说看来,特征和特征分析在模式识别中起着关键的作用。其认为外部刺激在人的长时记忆中,是以其各种特征来表征的,在模式识别过程中,首先要对刺激的特征进行分析,也即抽取刺激的有关特征,然后将这些抽取的特征加以合并,再与长时记忆中的各种刺激的特征进行比较,一旦获得最佳的匹配,外部刺激就被识别了。这就是一般的特征分析模型。



特征说所强调的特征,不管它在长时记忆中的编码形式是怎样的,其地位和作用看起来类似模板说中的模板。
Anderson(1980)指出,这种特征似可看作微型模板。这个看法是有一定道理的。也许可以说,特征是一种局部的部件模板。但是特征说毕竟不同于模板说,并且具有一定的优点。

首先,依据刺激的特征和关系进行识别,就可以不管刺激的大小、方位等其他细节,避开预加工的困难和负担,使识别有更强的适应性。
其次,同样的特征可以出现在许多不同的模式中,必然要极大地减轻记忆的负担。
第三,由于需要获得刺激的组成成分信息,即抽取必要的特征和关系,再加以综合,才能进行识别,这使模式识别过程可带有更多的学习色彩。这一点看来是极重要的。应当说,特征分析模型是含有较多的学习可能性的。
还可以预料,当不同的模式具有一些共同的特征时,就会使识别发生困难,甚至出现错误,将这些模式混淆起来。在人的实际知觉中,确实常常出现这些情况。这方面的事实也是支持特征说的有力的证据。对此曾进行过有关的实验研究。
特征分析模式是根据图像特征实现视觉再现。该模式首先是从图像中提取特征,而特征是依各种图像而千差万别的。因此特征的提取涉及面很广,与识别对象的各种物理、形态的性能都有关系。垂直线、水平线、曲线、角、交点、孔等都可以作为特征,因此产生了各种各样的特殊方法来抽取特征。均值、方差、信息量、相关系数、绝对值等也可以作为特征,这样就涉及到大量的特征计算。
特征分析模式还有两个难以克服的困难问题:一个是如何选取合理的特征去表示自然界的图像;另一个是如何确定所选特征之间的相互关系。
设想识别一只鸟,这时可以定义鸟的特征是:羽毛、翅膀、尾巴、鸟头和鸟脚。问题是识别羽毛、翅膀、尾巴、鸟头和鸟脚之类并不比识别一只完整的鸟容易。当然也可以将垂直线、水平线、曲线、角和圆作为鸟的特征。问题是这时要选取许许多多这类特征,而这类特征也可以用来描述小狗小猫,更何况至今无人用这类特征去描述自然界的复杂景物。
事实上所选取特征之间的相互关系也是个非常复杂的问题.特征所处的位置,特征之间相互形成的走向,特征与特征的相互干扰等等,以及阴影、叠合、掩盖等,都会影响视觉识别的最后结果。
特征分析模式在识别字符和简单几何图形中精度高。尤其是识别人脸;生物学的实验说明,人的头脑中存在选择物体的某些特性的专门机构。

(作者:刘建忠 http://hi.baidu.com/liujianz


内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: 
相关文章推荐