当前位置:舍宁秘书网 > 专题范文 > 公文范文 > 基于PCA-SSA-BP神经网络的烟叶分级方法

基于PCA-SSA-BP神经网络的烟叶分级方法

时间:2024-01-10 17:30:01 来源:网友投稿

杨述斌,董春林,王 锋,周敏瑞

(1.武汉工程大学 电气信息学院,武汉 430205;
2.智能机器人湖北省重点实验室,武汉 430205)

烟叶是卷烟的主要原料,为保持卷烟品质的稳定,需要将不同质量的烟叶区分开来[1]。我国现行的烤烟国家标准,通过对烤烟的外观特征的标准定量将烟叶分为42 个等级[2]。传统烟叶分级由人工通过视觉和触觉对烟叶进行分级,这种感官检测分级方法的不确定性很大,且存在分选效率低、选后合格率不稳定等缺点[3]。

近些年,机器视觉技术在农产品质量检测领域的迅速发展为烟叶自动分级提供了新思路,利用成像设备采集烟叶图像,对烟叶图像进行形态特征的提取[4-5];
对烟叶图像进行颜色空间转换,提取烟叶图像反射或透射条件下的颜色特征[6-8];
采用灰度共生矩阵法、小波分析法等对烟叶进行分析,提取烟叶图像的纹理特征[9-10]。在图像特征提取后,利用聚类分析[11]、支持向量机[12]、神经网络[13]等方法对烟叶进行分级。

对上述研究总结,通过提取多维图像特征信息进行烟叶分级会增加模型计算量,另外不同的分级方法的分级识别率和分级稳定性有所差别。针对烟叶图像需提取多维特征这一特点,采用具有柔性的网络结构和强大的多维函数映射能力的BP(back propagation)神经网络作为烟叶分级模型,其可以设定隐藏层的神经元个数和网络中间层层数,适用于多个烟叶图像特征与烟叶等级映射关系的构建。但是BP 神经网络容易陷入局部最优,且存在学习速度慢等问题。为解决此问题,利用局部搜索能力强、收敛速度快的麻雀搜索算法对BP 神经网络的权值和阈值进行优化[14];
当提取的图像特征维数过大时会产生模型复杂度高、分级实时性降低等问题,为此使用PCA 进行冗余信息的消除。

因此,提出一种基于PCA-SSA-BP 优化网络模型的烟叶分级方法,在保证烟叶识别准确率的同时提高烟叶分级实时性。

1.1 PCA-SSA-BP 神经网络烟叶分级算法

将烟叶图像进行分析处理,提取其形状特征、颜色特征、纹理特征组成原始特征矩阵,使用PCA 对其进行处理,得到新的特征矩阵作为BP 网络模型的输入。针对BP 网络容易陷入局部最优的情况,引入麻雀搜索算法对BP 神经网络的初始权值和阈值进行优化,提高模型的寻优能力和收敛速度,PCASSA-BP 神经网络烟叶分级算法的流程如图1所示。

图1 PCA-SSA-BP 神经网络烟叶分级算法流程Fig.1 Flow chart of PCA-SSA-BP neural network based tobacco leaf grading algorithm

1.2 主成分分析

主成分分析(principal component analysis,PCA)依据方差最大化原理,将p 维空间特征映射到k 维空间(p>k),构建样本原始特征数据矩阵Xn×p为

式中:p 表示样本特征维数;
n 表示样本数量。将Xn×p=(X1,X2,…,Xp)表示为矩阵的p 个特征列向量,则矩阵Xn×p中第j 个特征的均值为

式中:xij为第j 个特征的第i 个样本。

假设向量X 与向量Y,那么协方差定义为

协方差矩阵为

奇异值(SVD)分解后可以得到其特征值与特征向量,将特征值按照降序排列λ1≥λ2≥…≥λp,选取与特征值对应的前k 个特征向量μ1,μ2,…,μk(k<p)组成新的线性变换矩阵Wp×k,将原始特征数据矩阵与之相乘得到为

1.3 麻雀搜索算法

麻雀搜索算法(sparrow search algorithm,SSA)是一种模仿麻雀种群社会生存行为的群体智能寻优算法,其根据麻雀种群的生存机制原理,将麻雀划分为生产者、尾随者和预警者[15]。

生产者拥有较高的搜索能力,可以搜索到食物充足的领地,为麻雀种群中的尾随者指明觅食的方向。

尾随者会尾随能量储备高的生产者来进行觅食。在种群中生产者和尾随者的身份会因能量储备的高低互相转变。

预警者占整个麻雀种群的20%左右,当有追捕者出现在种群附近时,预警者会根据预警值大小做出反捕食行为。

在麻雀搜索算法中麻雀的每一次位置改变都会使整个种群随之发生变化。

每一次生产者位置的更新公式为

当R2<ST 时,表示种群未受到追捕者的威胁,生产者可以在领地进行食物搜索;
当R2≥ST 时,预警者发出警报,使种群转移到安全领地再次进行食物搜索。

每一次尾随者的位置更新公式为

每一次预警者位置更新公式为

式中:β 为步长控制参数;
K 是步长控制参数;
fi为第i 个个体的适应度值;
fw为当前种群的最差适应度值;
fg为当前种群的全局最优适应度值;
ε 为常数项。

当fi≠fg时,表示该麻雀位于种群的边缘,需通过飞往其他领地使自身的适应度提高;
当fi=fg时,表示该麻雀位于种群中心位置且接收到预警信号,需飞往其他安全领地来降低被猎捕的可能性。

2.1 烟叶图像采集

本文采集自襄阳南漳地区的5 个等级烤烟烟叶样本共45 份,由烟叶分级专家评定等级为B2F,B3F,C3F,X2F,X3F。烟叶图像采集过程在黑色密闭箱体内完成,箱体规格(长×宽×高)为1.5 m×0.9 m×0.9 m,烤烟烟叶图像采集选用Canon EOS 77D APSC 相机,镜头采用Canon EF-S IS STM 型,箱体顶部为4 只色温为5500 K 的LED 灯管,箱体底部为白色磨砂玻璃载物台,相机与计算机通过HDMI 接口连接起来,采集装置如图2所示。使用MATLAB2018a平台控制实现烤烟烟叶图像的实时采集。

图2 烟叶图像采集装置Fig.2 Acquisition device of tobacco leaf images

2.2 特征提取

如图3所示,通过图像采集装置得到烟叶图像,如图3(a)。对烟叶图像进行预处理得到烟叶二值分割图像,如图3(b),对二值分割图像使用最小外接矩形法可以提取到烟叶的形状特征;
将RGB 颜色空间模型的烟叶图像转换到HSV 颜色空间模型来提取烟叶的颜色特征,如图3(c)为HSV 颜色空间模型下的烟叶图像;

对烟叶图像进行Gabor 小波变换,如图3(d)为π/10 滤波方向的烟叶图像。

图3 烟叶图像预处理Fig.3 Pre-processing of tobacco leaf image

根据烤烟分级国家标准对烟叶品质等级的规定,分别提取烟叶图像的3 个叶态特征:长度、宽度、长宽比;
5 个体态特征:周长、理想面积、实际面积、破损率、密质度;
6 个颜色特征:R,G,B,H,S,V;
3 个纹理特征:均值能量、对比度、熵,用x1,x2,…,x17来表示实际面积、理想面积、破损率、周长、长、宽、密质度、RGB 分量、HSV 分量、均值能量、对比度、熵共17 个特征。

2.3 模型参数选择

(1)主成分分析

构建烟叶样本原始特征数据矩阵X45×17。利用式(2)~式(5)求得协方差矩阵,计算所有PC 的累计贡献率,取不同PC 维数情况下的累计贡献率曲线,如图4所示。显示主成分大于7 后的累计贡献率趋于稳定,取前7 个主成分(累计贡献率98.2%)为降维后新的七维特征矩阵作为BP 网络的输入。

图4 主成分累计贡献率曲线Fig.4 Cumulative contribution curves for different numbers of principal components

(2)确定BP 网络隐藏层节点数

使用3 层网络结构,采用经验公式来确定隐藏层节点数,计算公式为

式中:l 为隐含层节点数;
a 为(1,10)内的常数;
m 为输出层节点数;
n 为输入层节点数。

通过式(9)计算得隐藏层节点数的取值范围,如表1所示,最佳隐藏层节点数为7,此时网络训练集的准确率为89.9%。

表1 不同隐藏层节点的识别准确率Tab.1 Recognition accuracy of nodes in different hidden layers

(3)计算优化维度

待优化的麻雀种群的维度d。计算种群维度公式为

式中:E 为BP 网络的输入参数个数;
F 为BP 网络的隐藏层节点个数;
G 为BP 网络的输出参数个数,由公式计算得到需要优化的维度为96 维。

(4)适应度函数

将训练集与测试集总体的平均绝对误差值作为适应度值,适应度值越小,模型的分类精度更高,其表达式为

本文使用收敛速度快,鲁棒性强的遗传算法(GA)对BP 网络进行优化对比,将所有对比网络模型的相同参数均保持一致设置,PS 为种群大小,PD为生产者比例,PC 为交叉概率,PM 为变异概率,ST为预警值,SD 为预警者比例,参数设置如表2所示。

表2 对比算法参数设定Tab.2 Parameter setting of comparison algorithm

将图像分析提取到的特征值向量导入到对比算法网络模型中,进行对比分析。

2.4 结果分析

各模型的适应度进化收敛曲线,如图5所示。分析可以得到PCA-SSA 优化模型、SSA 优化模型收敛曲线的整体收敛速度优于PCA-GA 优化的网络模型,而PCA-GA 优化模型的最终适应度值要低于SSA 优化模型。经PCA-SSA 优化后的模型的收敛曲线速度要快于SSA 优化模型,PCA-SSA 优化模型在进化代数为4 代的时候其平均绝对误差达到0.06579,而SSA 优化模型在进化代数为7 代的时候才到达相同水平,因此PCA-SSA 优化网络模型的适应度较为优秀。

图5 适应度收敛曲线对比Fig.5 Comparison of adaptation convergence curves

将采集到的45 个烟叶图像样本随机选择其中38 个样本作为训练集,7 个样本作为测试集,使用PCA 对提取到17 个烟叶外观特征矩阵进行降维。将降维后的七维特征矩阵作为SSA-BP 优化网络模型的输入,对烟叶样本进行等级识别。以PCA 的处理时长和网络模型的训练识别时长之和作为判别网络模型的高效性指标,并与未降维的网络模型进行对比。如表3所示,可以得知PCA-SSA-BP 优化网络模型的烟叶等级平均识别率达到96.5%,运行总时间为97.99 s,与BP 网络模型相比识别率提高了24%;
与PCA-GA-BP 优化网络模型相比识别率提高了3.8%,分级效率提高了9.9%;
与SSA-BP 优化网络模型识别率提高了1.8%,分级效率提高了54.5%。

表3 不同模型烟叶识别结果对比Tab.3 Comparison of tobacco leaf recognition results of different models

通过分析烟叶图像,提取到烟叶的17 个特征进行PCA 降维,消除冗余信息,简化模型的复杂程度,提升了模型的分级效率;
选取全局搜索能力强、稳定性优秀的麻雀搜索算法对BP 网络模型的阈值、权重参数进行优化,提高了模型的识别率。

建立PCA-SSA-BP 优化网络模型的烟叶分级实验结果表明:PCA-SSA-BP 优化网络模型的烟叶分级识别结果准确率高、实时性好,可以基本满足实际生产需求,并为小样本高维多特征的烤烟烟叶的等级识别提供了一种有效快速的鉴别方法。

猜你喜欢适应度烟叶种群改进的自适应复制、交叉和突变遗传算法计算机仿真(2022年8期)2022-09-28山西省发现刺五加种群分布今日农业(2022年15期)2022-09-20关于新形势下烟叶生产可持续发展的思考活力(2019年15期)2019-09-25中华蜂种群急剧萎缩的生态人类学探讨红土地(2018年7期)2018-09-26一种基于改进适应度的多机器人协作策略郑州大学学报(工学版)(2018年2期)2018-04-13烟叶主要真菌病害的发生与防治现代园艺(2017年23期)2018-01-18基于空调导风板成型工艺的Kriging模型适应度研究中国塑料(2016年11期)2016-04-16一种降低造纸法再造烟叶平滑度的方法天津造纸(2015年2期)2015-01-04湘西上部烟叶化学成分特征及聚类分析作物研究(2014年6期)2014-03-01岗更湖鲤鱼的种群特征当代畜禽养殖业(2014年10期)2014-02-27

推荐访问:神经网络 烟叶 分级

猜你喜欢