摘 要:SIFT算法是提取图像局部特征的算法,应用于物体识别、图像匹配等领域,对于旋转、尺度缩放、亮度变化保持不变,对于视角变化、噪声等也保持一定程度的稳定不变性。为了提高光照不变性,获得更高的识别率,在SIFT特征描述子中加入颜色信息。对SIFT特征进行深入的研究,分析了SIFT算法,归纳总结了SIFT彩色描述子的研究现状,给出了彩色描述子SIFT的性能评价及其发展趋势。
关键词:SIFT算法; 局部特征; 彩色描述子; 性能评价
随着多媒体技术、计算机技术迅速发展,Internet上呈现大量的图像信息。图像中包含了很多的物体特性,其中颜色是非常重要的特征之一,颜色包含了图像中更多有价值的识别信息。SIFT算法提取图像局部特征,成功应用于物体识别、图像检索等领域。该算法由DAVID G.L.于1999年提出[1],并于2004年进行了发展和完善[2],MIKOLAJCZYK[3]对多种描述子进行实验分析,结果证实了SIFT描述子具有最强的鲁棒性。然而这些描述子仅利用图像的灰度信息,忽略了图像的彩色信息。为了提高光照不变性,获得更高的识别率,研究者提出了基于颜色不变特性的SIFT彩色描述子。目前彩色描述子主要分为基于颜色直方图、基于颜色矩、基于SIFT三类。本文对彩色SIFT描述子进行了深入的研究,阐述了彩色SIFT描述子,给出了每种彩色描述子的性能评价。
1 SIFT算法分析
SIFT描述子对图像的局部特征进行描述,当图像进行旋转、平移、尺度缩放、仿射变换等,SIFT特征具有很好的稳定性。SIFT算法主要分为四个步骤:检测尺度空间极值点、精确定位极值点、为每个关键点指定方向参数、关键点描述子的生成。
1.1 检测尺度空间极值点
计算SIFT描述子的第一步是搜索所有尺度和图像位置,它通过使用高斯差函数识别对尺度和方向不变的潜在兴趣点来实现。关键点就是多尺度高斯差的极大值/极小值。
对输入的图像进行尺度变换,利用高斯核与二维图像做卷积运算:
高斯核定义如下:
实际计算中,是在特征点的领域内采样,创建梯度方向直方图。直方图每10度分为一柱,共36个柱。然后将领域内的每个采样点按梯度方向Φ归入适当的柱,以梯度模m作为权重。选择直方图的主峰值作为梯度的主方向,能量值达到主峰值80%以上的局部峰值作为辅助方向。
1.4 关键点描述子的生成
以特征点为中心取8×8的采样窗口,在4×4的小块区域上计算其梯度方向直方图。绘制好每个方向梯度累加值,形成了一个种子点。每个特征点由4个种子点构成。在实际计算过程中,通常使用4×4共16个种子点来描述特征点。这样总共产生了4×4×8共128维的特征描述子向量。
2 基于彩色的SIFT研究进展
SIFT描述子对图像的高斯梯度进行编码,该描述子在空间模式下描述了灰度图像16个种子点及每个种子点8个梯度方向。由于SIFT算法只是利用图像的灰度信息,不能很好地区分形状相似但颜色不同的物体。光照的变化很大程度上影响着彩色物体识别的效果。在物体描述与匹配中,颜色可以提供更加有用的信息,物体的颜色信息被忽略,致使一些物体会被错误地分类。在图像处理中彩色图像能够表达更多的信息,彩色信息可以获得更高的辨别率。针对这一问题,研究人员对基于彩色的SIFT特征点提取算法进行了深入的研究。
2.1 SIFT彩色描述子