全国服务咨询热线:

13867128415,18457152660

article技术文章
首页 > 技术文章 > 中药材甘草高光谱数据采集与分析

中药材甘草高光谱数据采集与分析

更新时间:2025-11-27      点击次数:36

中药材甘草高光谱数据采集与分析

(目的:高光谱识别真假甘草)

一、检测目的和依据



  • 使用高光谱技术,采集中药材中真甘草与假甘草光谱数据,通过建模分析实现高光谱技术无损检测甘草真假。



二、样品类别及数量


甘草样本:


  1. 中药材真甘草若干条;

  2. 假甘草若干条;



三、检测设备和方法



检测设备


1. 400-1000nm高光谱相机

2. 高光谱采集暗箱

3. 黑色托盘(低反射率背景)

4. 辅助材料:标签(用于标记真假甘草

采集方式


1、训练集样品摆放规则:

中药材甘草:将样品中药材甘草按如图所示摆放,使用标签标记好甘草的真假。

甘草实拍图.png


2、验证集数据采集方式

将真假甘草摆放在托盘,标记真假的标签放在了甘草样品下面放着

甘草验证图像-压缩.png

四、采集与分析结果

1. 数据提供

提供数据格式,每个样品数据包含如下6个格式文件:


  • 样本400-1000nm原始数据(包含 .dat.hdr格式)

  • 样本400-1000nm反射率数据(包含 .dat.hdr格式)

  • 样本400-1000nm高光谱图像(.png格式)



2. 数据预处理

1、使用打标工具,甘草样本进行打标,结果图如下 训练集:甘草训练集打标遮罩.png 验证集:甘草验证集1打标遮罩.png甘草验证集2打标遮罩.png
3.光谱反射率提取 真甘草(C1)和假甘草(C2)的反射率平均光谱图真假甘草平均反射率光谱.png 根据反射率曲线可以看出,真假甘草反射率存在较大差异
数据预处理

为了进一步消除噪声, 消除位置影响, 提升特征显著性, 我们实验了多种预处理方法的组合, 最终选用预处理方式 SGD1 + SNV 对原始进行处理.预处理后的 C1 和 C2 数据如下图所示:

甘草-预处理结果曲线图.png

特征分析

根据波段和分组的相关性分析, 获得分组相关性前 50 个波段位于下图中红色矩形区域

甘草-特征分析图.png

相关性最高的前 50 个 波段的 PCA 图像

甘草PCA分析.png

依据以上条件我们可以认为:真甘草(C1)和假甘草(C2) 光谱数据在 628.02nm 到 731.77nm 之间存在较为明显的差异


模型训练

模型采用我们自有的针对高光谱数据研发的深度学习模型架构,更容易捕获特征与标签之间的非线性关系。

训练数据使用上文中的 训练集01,训练 20 个 Epoch,每个 Epoch 结束后使用验证集进行一次评估

训练过程中损失下降情况如下图所示:

甘草-训练结果图.png

训练后在训练集上的推理结果:

甘草训练集-训练集模型验证.png

对比基线模型(KNN)准确率

验证集01评价结果

甘草验证集01-模型验证结果.png

验证集02评价结果

甘草验证集02-模型验证.png

结果评价:


  • 对比训练集, 模型能力有所下降, 但准确率依然高于基线模型 10% ~ 20%

  • 模型能力下降的主要原因是训练样本不够, 使用更多样本进行训练可以有效提升模型泛化能力

  • 经过后处理, 即: 在空间维度对标签做平滑处理 + 对单个样本使用置信度 (样本中标记为真的光谱数量 / 样本中所有光谱的数量) > 0.8 可以实现对验证集中样本识别做到 100% 准确率




浙江以象科技有限公司
地址:浙江省海宁市栋梁路73号
邮箱:510433896@qq.com
关注我们
欢迎您关注我们的微信公众号了解更多信息:
欢迎您关注我们的微信公众号
了解更多信息