刘海龙,倪 金,索丽敏
(黑龙江八一农垦大学,黑龙江大庆 163319)
枸杞是目前最具发展潜力的药食两用类经济植物,因其含有丰富的营养价值和药用价值而得到消费者的普遍接受和信赖,在全国乃至全世界都享有极高的声誉[1]。目前,我国枸杞主产区的绝大多数栽培品种均引自宁夏枸杞系列品种[2]。研究表明,不同品种或不同产地的枸杞子在多酚、糖类、维生素、氨基酸等化学成分含量等方面具有较大差异[3-6]。例如,禄璐等[7]研究发现,46个枸杞原浆产品的主要成分与口感、风味具有相关性;
蒋兰等[8]研究得出多种活性成分能明显提升枸杞子品质,如枸杞多糖含量可作为枸杞果酒酿造工艺的衡量指标[9],枸杞的营养成分是其药用价值的评价指标之一[10]。因此,对不同品种枸杞子进行快速、准确判别,有利于根据不同枸杞子品种的差异有针对性地开展枸杞资源的利用,提高资源利用率。目前有关枸杞子分类方面的研究较少。
近红外光谱是一种介于可见光和中红外间的电磁波,波长为780~2 526 nm,该区域的波长能够记录C-O、O-H和N-H等化学键振动的倍频和合频吸收信息,可以作为获取信息有效载体对含氢基团有机物的理化性质进行测量,且可实现对样品快速、无损的检测,现已广泛运用于各农产品研究中[11-12]。但光谱数据中还包含噪声、基线漂移采样环境干扰等不稳定因素,会导致建立模型的精度下降,因此还需要提前对光谱数据进行预处理,提高光谱数据信噪比和分辨率,从而提高模型预测的准确度。
Keras是一种主流的神经网络框架,其采用Python编写,高度封装,能够在TensorFlow、CNTK或Theano之上运行,用户可以用最小的时间获得最优的实验结果,大大降低了神经网络的使用门槛,减少了构建网络所耗费的时间与精力。目前,该神经网络框架在医学、自动驾驶、人脸识别等众多领域都有使用[13-15]。
1.1 样本数据来源
用于实验的枸杞子为产地市购买,分别为中宁1号、中宁7号、小尖椒(中宁)、青海板型、青海条形,青海1号6个品种。将枸杞子样品进行除杂、干燥后,每个品种选取20粒作为一份样品,得到青海1号104份、青海板型104份、青海条形106份、小尖椒(中宁)106份、中宁1号106份、中宁7号122,共计648份样品。将样本置于近红外光谱实验室静置24 h后进行扫描。
采样仪器为Bruker公司生产的TANGO近红外光谱仪,测量波数为11 550~3 950 cm-1,测量样本的吸光度。每个样品单独扫背景,后扫描32次选取平均光谱作为研究样本。将样品数据按照7∶3的比例随机分为训练集和验证集,划分后训练集和测试集样本数据量分别为454个和194个,结合Keras框架进行枸杞子品种鉴别研究。
1.2 数据预处理
由于样本在扫描过程中极易受到检测环境、仪器、颗粒大小不均匀和自身因素的影响,使光谱数据质量下降,产生基线漂移、噪声、尺度差异等一系列问题,造成模型精度下降。因此对数据分别进行多元散射校正(MSC)、标准正态变换(SNV)、移动平均平滑(MA)、标准化(SS)、Savitzky-Golay平滑滤波(SG)、最大最小归一化(MMS)以及均值中心化(Zero-centered)预处理,提高信噪比和分辨率,让模型更具有稳健性。通过不同方法预处理后的光谱图如图1所示。
图1 不同方法预处理后的光谱图
1.3 建立模型
人工神经网络(Artificial Neural Network,ANN)的学习能力很强,且对于许多非线性问题有极强的映射能力和容错性[16]。基于反向传播算法(BP)的神经网络作为ANN重要组成部分,在涉及多种非线性因素建模时,相对于传统的反应机理建模显示出巨大的优势[17]。基于Keras框架搭建模型1:输入层—3个隐藏层(8)—输出层(6)以及模型2:输入层—3个隐藏层(16)—输出层(6)的全连接反向传播神经网络模型见图2,使用Sgd随机梯度下降法学习率为0.05,隐藏层均采用rule激活函数。面对多分类问题将输出层激活函数设置为softmax,每批次输入数据尺寸为100,损失函数为交叉熵(CrossEntropy Loss),设置训练迭代次数为10 000次。
图2 神经网络模型
使用Python语言和Keras框架分别建立了模型1:3个隐藏层(8)—输出层(6),以及模型2:3个隐藏层(16)—输出层(6)的神经网络模型,将通过不同方法预处理后的数据输入模型训练得到结果如图3所示。
图3 神经网络模型预测不同方法预处理后的枸杞数据
分析可知,通过标准化(SS)预处理后的数据在模型1中准确率达到了100%,而在模型2中经最大最小归一化(MMS)和标准化(SS)方法预处理后的数据测试结果准确度均能达到100%,证实了该方法的有效性。
通过对自采的6种不同枸杞子品种的光谱数据进行7种不同方法预处理后分别输入复杂度不同的两个Keras搭建的神经网络模型,最终模型对枸杞品种的鉴别准确度达到100%,能够满足枸杞品种鉴别的实际需求。通过SS和MMS两种预处理方法均能增大不同品种之间光谱图的差异,有效提高了近红外光谱预测模型的准确性和鲁棒性,为快速无损检测枸杞品种提供了一种新方法。
猜你喜欢枸杞子枸杞预处理El descubrimiento de las hierbas terapéuticas La historia de Shennong,el “Soberano de la Agricultura”今日中国·西班牙文版(2023年2期)2023-02-14是酸是碱?黑枸杞知道学与玩(2022年2期)2022-05-03嚼服枸杞子缓解口干文萃报·周二版(2020年22期)2020-06-08宁夏六月枸杞红绿色中国(2019年13期)2019-11-26采枸杞阅读(低年级)(2019年9期)2019-11-15春季,枸杞茶应该这样喝婚育与健康(2019年4期)2019-05-17枸杞到底是怎么养生的?基层中医药(2018年10期)2018-12-06基于预处理MUSIC算法的分布式阵列DOA估计制导与引信(2017年3期)2017-11-02脾胃虚弱者慎食枸杞子家庭科学·新健康(2017年4期)2017-04-14浅谈PLC在预处理生产线自动化改造中的应用工业设计(2016年11期)2016-04-16