上海11选5走势图

打开客服菜单
当前位置:红外光谱仪 > 红外光谱之家 > 红外光谱资讯 > 稻谷脂肪近红外光谱特征筛选及检测模型构建

SHANGHAI11XUAN5ZOUSHITU

LIANXIWOMEN

  • 电话 : 4000-180-060
  • 手机 : 131-0228-4693
  • 企业QQ : 56250774
  • 邮箱 : info@web-35.com
  • 网址 : http://web-35.com
  • 地址 : 天津滨海新区华苑产业园区(环外)海泰创新六路2号华鼎新区一号3号楼1门10层
稻谷脂肪近红外光谱特征筛选及检测模型构建
编辑 :

上海11选5走势图TIANJINSHINENGPUKEJIYOUXIANGONGSI

时间: 2018-05-01 浏览量: 210


稻谷脂肪近红外光谱特征筛选及检测模型构建

李路1,黄汉英1*,李毅1,赵思明2,杨素仙1

1(HUAZHONGNONGYEDAXUE GONGXUEYUAN,HUBEI WUHAN,430070) 2(HUAZHONGNONGYEDAXUE SHIPINKEJIXUEYUAN,HUBEI WUHAN,430070)

摘 要 应用近红外光谱技术对稻谷脂肪含量进行检测。采集了90个稻谷样本的漫反射近红外光谱,运用Kennard-Stone法选取校正集及预测集样本。对比研究了归一化、一阶导、二阶导、一阶导+归一化等4种预处理方法对模型性能的影响,确定一阶导为最佳预处理方法。运用竞争性自适应重加权采样技术筛选出与稻谷脂肪含量检测相关的特征波长,再用多元线性回归对特征波长进行优选,最终得到30个特征波长。其中最典型的特征波长为1 343、1 489和1 583 nm,反映了稻谷脂肪中大量存在的—CH和—OH基团。所建立的基于近红外光谱分析技术的稻谷脂肪含量检测模型具的决定系数为0.958 9,定标标准差RMSEC为0.223 6,相对偏差为5.53%。

关键词 上海11选5走势图近红外光谱;稻谷;脂肪;竞争性自适应重加权采样;多元线性回归

脂肪含量是评价稻谷品质的重要指标[1]。而其传统测定方法存在过程繁琐、条件不易控制、药品消耗大、费时费力等不足。近红外光谱分析技术以其检测过程简单迅速、耗材少、无损、分析重现性好、成本低等优点,在粮食、蔬果、肉制品等方面的检测中得到了广泛的应用[2-4]

目前国内外学者利用近红外分析技术做了一些食品检测方面的研究,BAGCHI等[5]、SUN等[6]和XIE等[7]建立了稻米中蛋白质及淀粉含量的检测模型。SIRISOMBOON等[8]研究了稻谷中黄曲霉素的近红外检测方法。张中卫等[9]、郭中华等[10]和赵明富等[11]建立了牛奶中脂肪和蛋白质含量的数学模型。林家永等[12]对不同品种和储存期限的大米水分、脂肪酸值进行检测。上述研究所建立的数学模型对食品主要营养成分的检测都能取得较好的精度,检测结果的决定系数R2大多在0.8以上,但是模型的建立思路主要集中在2个方面:(1)根据食品营养成分中特殊化学基团所对应的近红外光谱特征波长建立模型,具有模型简单,物理意义明确的优点,但检测结果不稳定,精度不高;(2)利用近红外光谱全波长建立模型,具有适应性广,精度理想的优点,但模型复杂,计算量较大。

本文针对模型性能与复杂度的矛盾关系,采用竞争性自适应重加权采样(competitive adaptive reweighted sampling,CARS)[13]方法,在稻谷近红外光谱的全波段,筛选出适量的特征波长,然后采用多元线性回归法建立稻谷脂肪含量的检测模型,在保证较好模型性能的前提下尽量减小计算量,为快速检测稻谷主要营养成分提供新的方法。

1 材料与方法

1.1 试验材料

上海11选5走势图SHIYANCAILIAOBAOHANA4A/R326、JUFENGA/R257、GUANGZHANS/R166、ZHONG9A/R591、GANGHONG1A/R15DENG46GEPINZHONGDEDAOGU,YOUHUANGGANGNONGKEYUANTIGONG,CHANZIHAINANSHENG。DAIZHUANGFENGCUNYUYINLIANGCHU,SHOUHUOZHISHIYANZAI2GEYUENEIWANCHENG。JIANGBUFENPINZHONGANZHILIANG1∶1DEBILILIANGLIANGHUNHE,DEDAO44GEHUNHEYANGBEN,GONGJI90GEDAOGUYANGBEN。

1.2 试验设备与样本光谱采集

红外光谱仪上海11选5走势图:漫反射式Supnir-2720近红外光谱仪,杭州聚光科技股份有限公司。其测定范围为1 000~1 799 nm,光谱采样间隔为1 nm,光谱分辨率为10 nm。为减小误差,每个样本扫描3次。稻谷籽粒置于样本盘内,且装满、压实,逐一扫描。

1.3 稻谷脂肪含量测定

按照GB/T 5511—2008《粮油检验 粮食中粗脂肪含量测定》中的索氏抽提法[14]测定稻谷的脂肪含量,取3次测定的平均值。

1.4 数据处理方法

1.4.1 YANGBENJIHUAFEN

运用Kennard-Stone方法[15]对90个稻谷样本进行分组,80%为校正集,20%为验证集,分别用于模型的建立与验证。Kennard-Stone方法基于变量之间的欧氏距离,在样本光谱的特征空间中均匀选取样本,依次选取欧氏距离最远的点,进入校正集,留下马氏距离居中的点在验证集之中[16]上海11选5走势图。这样可使光谱差异较大的样本全部进入校正集,从而在一定程度上避免了校正集样本分布的不均匀。

1.4.2 JINHONGWAIGUANGPUYUCHULI

上海11选5走势图YUCHULINENGJIANGGUANGPUDEYOUXIAOXINXIFANGDA,QIEJIANGGUANGPUYASUOZAIXIANGTONGDEFANWEIJINXINGBIJIAO,XIAOCHULEJIXIANPIAOYI、YANGPINBUJUNYUN、GUANGSANSHE、GUANGCHENGBIANHUADENGDUIGUANGPUDEYINGXIANG。XUANZEHESHIDEYUCHULIFANGFA,DUITIGAOMOXINGDEJIANCENENGLIHEJINGDUSHIFENZHONGYAO。BENWENYUNYONGGUIYIHUA、YIJIEDAO、ERJIEDAODENGYUCHULIFANGFAZHONGDEYIZHONGHUODUOZHONGDEZUHEDUIDAOGUJINHONGWAIGUANGPUZUOYUCHULI。RANHOUGENJUBUTONGYUCHULIFANGFASUOJIANLIMOXINGDEXINGNENGZHIBIAOLAIQUEDINGZUIZHONGDEGUANGPUYUCHULIFANGAN。

上海11选5走势图1.4.2.1 GUIYIHUA

在建立近红外定量模型前,为了将光谱的有效信息放大,常采用归一化来进行预处理,使光谱数据的方差为1,均值为0,将光谱数据放在相同的范围进行比较[17]上海11选5走势图。本文运用Z-score归一化进行预处理试验。

1.4.2.2 YIJIEDAO

导数法可消除基线偏移、背景干扰出现的谱线重叠,呈现变化明显的波峰波谷,提供比原始光谱更清晰的光谱轮廓变化[18]

1.4.2.3 ERJIEDAO

原始光谱经过二阶导数处理后,会变得很尖锐,有利于更好的确定波峰和波谷的位置,可使各吸收峰变得更容易区分。二阶导数可以消除基线的线性倾斜[19]

1.4.3 TEZHENGBOZHANGSHAIXUAN

稻谷脂肪的近红外光谱波长点数为800个,而样本数是90个,利用此数据进行回归分析,共线性非常严重。利用CARS方法[20]对特征波长进行筛选可简化模型,并提高模型的检测能力。

1.4.4 JIANMO

为了降低模型的运算量,便于后续研究中在线快速检测系统的开发,使用多元线性回归方法建立基于近红外光谱分析技术的稻谷脂肪含量检测模型,以模型的决定系数(R2)、定标标准差(RMSEC)、相对偏差来评价模型的稳定性、检测能力和优劣。当R2越趋近于1,RMSEC和相对偏差的值越趋近于0,则模型的稳定性和检测能力越好,在实际中的检测越准确。同时,在建模的过程中通过显著性指标进一步对特征波长进行优选,使模型进一步简化。

2 结果与分析

2.1 样本近红外光谱

TU1WEI90GEDAOGUYANGBENDEJINHONGWAIGUANGPUTU。KEJIAN,BUTONGYANGBENDEJINHONGWAIGUANGPUZAIZONGTIQUSHISHANGSHIYIZHIDE。DANYOUYUWUZHICHENGFENHANLIANGDEWEIXIAOCHAYI,BUTONGYANGBENDEXIGUANGDULVEYOUBUTONG。

图1 90个稻谷样本的原始近红外光谱图
上海11选5走势图Fig.1 Original Near-infrared spectra of ninety rice samples

2.2 样本集划分结果

上海11选5走势图CAIYONGKennard-StoneFAXUANQUXIAOZHENGJIYUYANZHENGJI,JIEGUOJIANBIAO1。YANZHENGJIDEFANWEIBAOHANZAIXIAOZHENGJINEI,FENZUHELI。

表1 Kennard-Stone 分组结果
Table1 Results of Kennard-Stone

2.3 样本预处理

4ZHONGYUCHULIFANGFAHOUDEJIEGUORUTU2HEBIAO2SUOSHI。YOUBIAO2KEZHI,YUNYONGYIJIEDAOCHULIHOUSUOJIANMOXINGDEJUEDINGXISHUZUIDA、DINGBIAOBIAOZHUNCHAZUIXIAO,YINCIXUANYONGYIJIEDAOWEIZUIJIADEYUCHULIFANGFA。

图2 经过4种预处理后的光谱图
Fig.2 Spectra after 4 preprocessing methods

表2 不同预处理方法的比较
Table2 Comparison of different pretreatments

2.4 特征波长筛选

上海11选5走势图DUIGUANGPUJINXINGYUCHULIHOU,CAIYONGCARSFANGFADUIDAOGUZHIFANGDETEZHENGBOZHANGJINXINGDUOCISHAIXUAN,QISHAIXUANGUOCHENGRUTU3SUOSHI。TU3-aWEISHAIXUANGUOCHENGZHONGXUANCHUBIANLIANGDEBIANHUAQUSHI,SUIZHEYUNXINGCISHUDEZENGJIA,BAOLIUDEBIANLIANGSHUYUELAIYUESHAO,QIEYOUKUAIDAOMANCHENGZHISHUHANSHUDIJIAN。TU3-bWEIBOZHANGBIANLIANGSHAIXUANGUOCHENGZHONGJIAOCHAYANZHENGJUNFANGCHARMSECVDEBIANHUAQUSHI,ZAI1~53CICAIYANGGUOCHENGZHONG,RMSECVCHENGXIANDIJIANQUSHI,BIAOMINGSHAIXUANGUOCHENGZHONGTICHULEYUYANGBENXINGZHIWUGUANDEBIANLIANG,CISHIDUIYINGDEBIANLIANGSHUWEI34,53CIHOUKAISHIDIZENG,SHUOMINGSHAIXUANGUOCHENGZHONGKAISHITICHULEYUDAOGUZHIFANGHANLIANGXIANGGUANDEBIANLIANG,CONGERDAOZHIRMSECVZHIZENGDA,KEJIANZAIDI53CISHI,YIJIANGWUGUANBIANLIANGQUANBUTICHU,ZUIHOUBAOLIUBOZHANGSHU34GE。TU3-cZHONG“*”SUODUIYINGDEDIANJIWEIRMSECVZUIDIDIAN,TU3-cZHONGGEXIANBIAOSHISUIZHEYUNXINGCISHUZENGJIAGEBOZHANGBIANLIANGHUIGUIXISHUDEBIANHUAQUSHI。TEZHENGBOZHANGSHAIXUANSHIMENGTEKALUOCAIYANGCISHUWEI100,TIAOXUANCHUDE34GETEZHENGBOZHANGJIANTU4。

图3 稻谷脂肪特征波长筛选图
Fig.3 Key wavelengths selection of fat in rice

2.5 稻谷脂肪数学模型的建立

YUNYONGDUOYUANXIANXINGHUIGUIFANGFA,YI34GETEZHENGBOZHANGJIANLIDAOGUZHIFANGHANLIANGDEJIANCEMOXING,JIANGXIANZHUXINGBUGAODETEZHENGBOZHANGTICHU,YOUXUANTEZHENGBOZHANG,ZUIZHONGDEDAO30GETEZHENGBOZHANG,HUIGUIXISHUJIXIANZHUXINGJIANBIAO3。JIANCEMOXINGDEJUTIXINGSHIWEI:

图4 稻谷脂肪特征波长的分布情况(o表示特征波长)
上海11选5走势图Fig.4 Distribution of key wavelengths (shown by “o”) for fat in rice

y=b+∑aixi

(1)

式中:y,稻谷脂肪含量;b,回归常数项;ai,各特征波长的回归系数;xi,特征波长的吸光值经过一阶导数处理后的数值;i=1 000, 1 001, … , 1 799,波长所对应的纳米数。

表3为稻谷脂肪检测模型的参数及其显著性。可见,在x1 343x1 489x1 583处,回归系数的绝对值最大,说明这些特征波长对模型的影响最大,t值相对较大,说明对模型的影响较显著。其中,1 343 nm反映了C—H基团的第二组合频和O—H基团的伸缩振动的二级倍频吸收带,1 489 nm反映了O—H基团的伸缩振动的二级倍频,1 583 nm反映了O—H基团的伸缩振动的一级倍频吸收带。检测模型的决定系数R2为0.958 9,定标标准差RMSEC为0.223 6,相对偏差为5.53%,说明模型具有较好的稳定性和准确性。

表3 稻谷脂肪检测模型的参数及其显著性
Table 3 Parameters and significances of fat prediction model

利用上述回归方程预测18个验证集的脂肪含量,偏差的绝对值最大为0.716 1,最小为0.003 2,模型验证的决定系数R2上海11选5走势图为0.825 0,校验标准差RMSEP为0.339 8,相对偏差为8.55%,说明所建模型具有较好的检测能力。

3 结论

本文首先采集了90个稻谷样本的漫反射近红外光谱,使用Kennard-Stone法选取了校正集与验证集。然后对比了归一化、一阶导、二阶导、一阶导+归一化等4种预处理方法对模型性能的影响,使用CARS法确定了与稻谷脂肪含量检测相关的近红外特征波长。最后利用多元线性回归理论对特征波长进行优选,并建立了基于近红外光谱分析技术的稻谷脂肪含量的检测模型。结果表明,稻谷红外光谱的最佳预处理方法为一阶导,与稻谷脂肪含量检测相关的近红外特征波长为30个,其中最典型的特征波长为:1 343、1 489和1 583 nm。检测模型的决定系数R2为0.958 9,定标标准差RMSEC为0.223 6,相对偏差为5.53%。将检测模型用于验证集,偏差的绝对值最大为0.716 1,最小为0.003 2,模型验证的决定系数R2为0.825 0,校验标准差RMSEP为0.339 8,相对偏差为8.55%,说明所建模型具有较好的稳定性和检测能力。

参考文献

[1] HUANGLI, BOYUN, HANWENFANG, DENG. DAOMIZHILIANGDUISHIPINANQUANDEYINGXIANG[J]. ZHONGGUOLIANGYOUXUEBAO, 2013, 28(4): 113-117.

上海11选5走势图[2] MILICA M P, JASNA S M. Near infrared spectroscopy-advanced analytical tool in wheat breeding, trade, and processing [J]. Food and Bioprocess Technology, 2013, 6: 330-352.

[3] CHENCHEN, LUXIAOXIANG, ZHANGPENG, DENG. MEIGUIXIANGPUTAOZHUZANGQIJIANTANGSUANPINZHIDEJINHONGWAIJIANCE[J]. SHIPINYUFAJIAOGONGYE, 2015, 41(6): 175-180.

上海11选5走势图[4] TUBIN, CHENZHI, PENGBO, DENG. JIYUDUOYUANGUANGPUTEZHENGRONGHEJISHUDEHUASHENGYOUCHANWEIJIANCE[J]. SHIPINYUFAJIAOGONGYE, 2014, 42(4): 169-173.

上海11选5走势图[5] BAGCHI T B, SHARMA S G, CHATTOPADHYAY K. Development of NIRS models to predict protein and amylose content of brown rice and proximate compositions of rice bran [J]. Food Chemistry, 2016, 191(1): 20-27.

上海11选5走势图[6] SUN Cheng-xiao, YU Yong-hong, DUAN Bing-wu, et al. Rapid prediction of rice quality characteristics by near-infrared reflectance spectroscopy for breeding programs [J]. Cereal Chemistry, 2014, 91(3): 270-275.

上海11选5走势图[7] XIE L H, TANG S Q, CHEN N, et al. Optimisation of near-infrared reflectance model in measuring protein and amylose content of rice flour [J]. Food Chemistry, 2014, 142: 92-100.

[8] SIRISOMBOON C D, PUTTHANG R, SIRISOMBOON P. Application of near infrared spectroscopy to detect aflatoxigenic fungal contamination in rice [J]. Food Control, 2013, 33(1): 207-214.

[9] ZHANGZHONGWEI, WENZHIYU, CENGTIANLING, DENG. WEIXINGJINHONGWAIGUANGXIANGUANGPUYIYONGYUNAIFENZHONGDANBAIZHIZHIFANGDEDINGLIANGJIANCEYANJIU[J]. PUXUEYUGUANGPUFENXI, 2013, 33(7): 1 796-1 800.

[10] GUOZHONGHUA, WANGLEI, JINLING, DENG. JIYUJINHONGWAITOUSHEGUANGPUDERUZHIPINDANBAIZHI、ZHIFANGHANLIANGJIANCE[J]. GUANGDIANZI·JIGUANG, 2013(6): 1 163-1 168.

[11] ZHAOMINGFU, SHIYUJIA, LUOBINBIN, DENG. JIYUJINHONGWAITOUSHEGUANGPUDENIUNAIZHONGZHIFANGHEDANBAIZHIHANLIANGJIANCE[J]. JIGUANGZAZHI, 2014(1): 44-45.

上海11选5走势图[12] LINJIAYONG, FANWEIYAN, XUEYALIN, DENG. DAOMICHUZANGPINZHIJINHONGWAIGUANGPUKUAISUPANDINGJISHUJIYIQIYANFA[J]. ZHONGGUOLIANGYOUXUEBAO, 2011, 26(7): 113-118.

[13] LI Hong-dong, LIANG Yi-zeng, XU Qing-song, et al. Key wavelengths screening using competitive adaptive reweighted sampling method for multivariate calibration[J]. Analytica Chimica Acta, 2009, 648(1): 77-84.

[14] GB 5009.5—2010. SHIPINANQUANGUOJIABIAOZHUN: SHIPINZHONGDANBAIZHIDECEDING[S].

上海11选5走势图[15] CHENXIN. JIYUZHINENGSUANFADEJINHONGWAIGUANGPUFENXIYUCEMOXINGJIANLIFANGFAYANJIU[D]. WUXI:JIANGNANDAXUE, 2013.

上海11选5走势图[16] ZHANGHUAXIU, LIXIAONING, FANWEI, DENG. JINHONGWAIGUANGPUJIEHECARSBIANLIANGSHAIXUANFANGFAYONGYUYETAINAIZHONGDANBAIZHIYUZHIFANGHANLIANGDECEDING[J]. FENXICESHIXUEBAO, 2010, 29(5): 430-434.

[17] WANGYANYANG, WEIYONGXIA. JIYUZBIFENSHUDECANKAOZUOWUTENGFALIANGJISUANFANGFAYOUXUAN[J]. JIESHUIGUANGAI, 2015, 29(3): 52-54.

[18] SONGLIHUA. HUASHENGZIRENDANBAIZHIHANLIANGJINHONGWAIGUANGPUMOXINGDEJIANLIJIYUZHONGYINGYONG[D]. BAODING:HEBEINONGYEDAXUE, 2011.

[19] BAIYAN, YUZHENXI, SUNSUQIN, DENG. JINHONGWAIMANFANSHEGUANGPUJISHUCEDINGNIUXIZHONGTUIPIZAITONG[J]. ZHONGCAOYAO, 2005, 36(9): 115-118.

[20] LIUXING, DANYANG, LIGAOYANG. CARSJIEHEPLS-LDAFASHIBIENAINIUSILIAOZHONGTUMEISUDEKEXINGXINGYANJIU[J]. BAOZHUANGYUSHIPINJIXIE, 2012, 30(4): 1-4.


Establishment of a selection and detection model of fat inrice by nearinfrared spectrum characteristics

LI Lu1, HUANG Han-ying 1*, LI Yi1, ZHAO Si-ming2, YANG Su-xian1

1 (College of Engineering, Huazhong Agricultural University, Wuhan 430070, China) 2 (College of Food Science & Technology, Huazhong Agricultural University, Wuhan 430070, China)

ABSTRACT 上海11选5走势图Near Infrared (NIR) spectrum was used to detect fat content in rice. NIR spectra of 90 rice samples were measured. Kennard-Stone method was used to select the calibration set and prediction set samples. The effects of different pretreatment (normalize, first derivative and second derivative methods) have been compared for the accuracy of the models. The best pretreatment method is the first derivative. The competitive self-adaptive weighted sampling technology is used to screen the key wavelengths associated with sample properties. Finally, thirty key wavelengths are selected by Multiple Linear Regression further. The most typical key wavelengths are 1 343 nm, 1 489 nm and 1 583 nm which related to the groups of —CH and —OH in rice fat. The detection model of fat content of rice based on near infrared spectroscopy has higher precision with the coefficient of determination, root mean square error of calibration and relative deviation are 0.958 9, 0.223 6 and 5.53%, respectively.

Key words near infrared spectrum; rice; fat; competitive adaptive reweighted sampling; multiple linear regression

DOI:10.13995/j.cnki.11-1802/ts.014950

引用格式:上海11选5走势图李路,黄汉英,李毅,等.稻谷脂肪近红外光谱特征筛选及检测模型构建[J].食品与发酵工业,2018,44(2):87-91.

第一作者:上海11选5走势图博士,讲师(黄汉英硕士为通讯作者,E-mail:hhywmx@mail.hzau.edu.cn)。

基金项目:上海11选5走势图中央高校基本科研业务费专项(2662015PY078);湖北省重大科技创新计划(2014ABC009)

收稿日期:2017-06-13,改回日期:2017-06-21

上一篇: 红外光谱测试样品制备中的常规与特殊攻略合集 下一篇: 傅里叶变换红外光谱法常见“套路”