2.2 直方图特征提取
计算过程采用HSV颜色空间中的颜色值,通过将图像中的所有像素颜色映射到HSV颜色空间中的n种颜色(直方图的n位)来执行量化过程,在系统初始化的时候,确定预定颜色值及个数n,之后分别获得确定性、模糊及直觉模糊主色调颜色直方图特征。我们使用文献[5]中的算法获得图像的确定颜色直方图以及模糊颜色直方图,分别用 和 表示。
仅使用确定性颜色直方图和模糊颜色直方图不能够完整的描述像素属于某种颜色的概率,进一步采用直觉模糊集理论[6],利用非-隶属度函数完善颜色特征表达。在模糊颜色特征描述的基础上添加特征的犹豫程度,产生一个 。
其中,ri是图像中的像素不属于第i个颜色值的隶属度。通过比较模糊颜色直方图和确定性颜色直方图,可以发现在模糊量化过程中存在一些噪声。这类噪声可以通过直觉指数进行消除。通过噪声的起源,可知像素的颜色犹豫值应该正比于确定颜色值和模糊颜色值之差。
另外,根据(1)式可知存在特殊的颜色值,即 的时候,犹豫度会达到最大值 ,这种特殊的 计算如(3)式。
此式描述了图像的像素属于第i个颜色值的犹豫度随着隶属度的增加而减少的性质,通过下面的(4)式来满足(3)式的限制条件,
联合(2)式和(4)式得出了图像中所有像素对于第i个颜色值的犹豫度计算公式,
显然在[0, 1]区间内,符合的定义。根据 和 ,得出犹豫度矩阵 。一张图像的颜色特征可以表达为特征矩阵,
3 特征训练
FP神经网络是张铃在给出了M-P神经元的一种几何解释的基础上提出的一种前向神经网络的构造式学习算法,简称FP算法[7]。FP算法的实质是用一系列“球形邻域”范围来模拟训练样本在特征空间的分布,通过调整“球形邻域”的位置和大小,完成特征训练过程。在构建FP网络的时候,主要解决两个问题,建立特征之间的距离公式以及色情图像识别的神经元模型。
特征之间的距离是建立FP网络的基础。色情图像识别算法中,图像特征在表达图像内容的时候重要性各有不同,使用FP算法中的点积计算无法较好地度量特征的相似性,本文加入了权重参数,以图像特征矩阵形式为基础,由色情图像特征与色情语义间的映射关系构建加权距离公式。权重系数根据色情图像中包含的理想颜色分布情况,通过BP网络训练得到。BP网络的输入为样本图像颜色特征矩阵,理想输出为色情图像中理想的颜色特征分布矩阵,对权重矩阵赋初始值之后开始计算。得出的距离权重有如下形式,
X1表达的图像与X2表达的图像之间的特征权重距离公式如下,
单个神经元是以特征空间中某个特征向量为圆心,以某个常数为半径的“球形邻域”的形式。神经网络是由多个结构相同的色情图像样本特征“球形”神经元构成,在此球形邻域之外的图像为非色情的正常图像。
(责任编辑:adminadmin2008)