全国服务咨询热线:

18457147929,13867128415

article技术文章
首页 > 技术文章 > 近红外高光谱预测聚合物薄膜结晶度 中

近红外高光谱预测聚合物薄膜结晶度 中

更新时间:2025-01-13      点击次数:148


近红外高光谱预测聚合物薄膜结晶度 中




若要对聚合物晶体度的空间分布进行预测,那就得在样品的近红外(NIR)光谱图像(X)所含特征与通过差示扫描量热法(DSC)获取的分析晶体度测量值(y)之间构建回归模型,也就是建立两者之间的相关性。在本次研究中,一共对四种不同的方法展开了测试与比较,这四种方法的主要差异体现在运用合适的回归技术之前,对 NIR 光谱采取何种处理方式上。

起初,测试了传统的近红外校准方法,其中一种是涉及平均光谱(方法 1)并搭配偏最小二乘(PLS)回归的方式,另一种则是涉及二阶导数(方法 2)再结合 PLS 回归的做法。之后,又对多元图像回归(MIR)方法进行了测试,该方法包含两种情况,一是基于原始光谱(方法 3)的多元图像回归,另一种是基于原始光谱二阶导数(方法 4)的多元图像回归。


在收集训练数据集时,具体步骤如下:


首先,针对 18 个样品,逐一进行全面扫描操作,随后依据公式(2)把原始图像校准成为反射图像 Ik,这里的 k 代表样品编号,其取值范围是从 1 到 18。


接着,如图 2 所示,要获取训练数据集,需为每个聚合物样品选定一个相对较小的感兴趣区域,其尺寸为 2.5 毫米 ×5 毫米,换算成像素的话就是 10×10 像素。这些所选定的区域对应的是多元子图像,其大小为(10×10×λ),这里的 λ 表示的是光谱通道数,在本次研究当中,λ 的值确定为 256。


之后,通过一种简单的操作方式,也就是按照行的顺序来存储每一个光谱,进而将这些阵列展开,使其变为大小为(100×λ)的矩阵。而这些矩阵,会作为后续所提到的四种方法共同的输入数据来使用。

近红外高光谱预测聚合物薄膜结晶度 中



四种方法的示意图:平均光谱(方法 1)、二阶导数(方法 2)、光谱的 MIR(方法 3)或二阶导数的 MIR(方法 4)

最后,从样品中切下与子图像相对应的每个感兴趣区域并送去进行 DSC 分析。得到的结晶度测量值 ( y k ) 存储在响应矩阵y (18 × 1) 中。

基于平均谱或二阶导数的 PLS 模型

基于平均谱或二阶导数的偏最小二乘(PLS)模型


方法 1:平均近红外光谱


第一种方法的操作是,针对从样本感兴趣区域获取到的所有可利用的反射光谱进行平均处理,具体而言,就是对每个矩阵按照列的方向依次求平均。之后,把每个样本经过平均处理后得到的光谱收集起来,汇总到回归矩阵 X(该矩阵规格为 18×λ)当中,具体情形可参照图 2。

近红外高光谱预测聚合物薄膜结晶度 中


接下来,要在平均光谱矩阵 X 以及与之对应的结晶度测量值 y 之间构建一个潜变量的 PLS 回归模型,其构建方式如下:


在这个模型里,P 矩阵和 Q 矩阵各自包含了一些载荷向量,这些载荷向量能够地代表 X 空间以及 y 空间的相关特性。而 W 矩阵所含的载荷向量,其作用在于定义出一个公共潜变量空间 T,这个空间是用于将 X 和 y 关联起来的。E 矩阵与 F 矩阵则涵盖了 PLS 模型的残差,这里所说的残差指的就是与模型潜变量空间的投影距离。


关于 PLS 分量,也就是潜变量(A)的数量,是通过运用标准的留一交叉验证程序来确定选择的。之所以在这种情况下选择采用 PLS,是因为矩阵 X 的各列之间呈现出高度共线性的特点。
方法 2:近红外光谱的二阶导数


此方法并非运用光谱本身,而是采用光谱的二阶导数。具体操作时,先针对感兴趣区域内的光谱导数进行平均值的计算,随后将这些平均值收集起来,纳入到每个样本对应的回归矩阵 X(其规格为 18×(λ - 2))当中,之后再利用结晶度测量值 y 来构建偏最小二乘(PLS)回归模型,具体情况可参照图 2。


取光谱的二阶导数是在近红外(NIR)光谱预处理过程中经常会用到的一种方法,早在 1990 年,Chau 等人就有所提及。当光谱中存在比较尖锐的吸收带时,运用这种方法就会展现出显著的优势。相比较一阶导数而言,二阶导数更受青睐,原因在于它不会使峰值出现移动的情况,所以有着更好的可解释性。


尽管二阶导数着重体现了光谱的转换情况,但它对于光谱强度方面出现的系统性变化并不敏感,从图 3 中就能够看出这一点,在原始光谱中,重点呈现出了三个以 1100、1300 以及 1600 纳米为中心的光谱带。


为了尽可能降低坏像素所带来的影响(Savitzky 和 Golay 在 1964 年曾对此有所研究),先是在线扫描时,沿着光谱方向采用 5 像素的窗口对其进行平滑处理,之后再运用数值近似的方式来获取二阶导数(Gerald 和 Wheatley 在 1994 年有相关阐述)。与直接使用光谱相比,通过数值微分的方式会使得回归矩阵 X 当中损失两列(也就是光谱通道)。

近红外高光谱预测聚合物薄膜结晶度 中

光谱与二阶导数:HDPE 样品的 2D 线扫描(左)和单个空间位置的 1D 光谱(右)。使用无量纲标度

多元图像回归(MIR)涵盖了一系列潜在变量技术,其主要用途在于把质量或者响应变量与从一组数字图像里提取出来的特征进行回归关联。


对于图像回归这一问题,依据从图像中所提取特征的性质差异,可以通过多种不同的方式来进行表述,这些特征性质涵盖了从针对每个光谱通道所计算得出的简单统计数据,比如平均值、方差等等,一直到分布特征等不同情况。


在本次研究工作当中,所提取的是来自近红外(NIR)光谱图像的分布特征。而这些分布特征的获取,是借助多路主成分分析(MPCA)对光谱图像数据立方体进行分解而实现的,这里所说的光谱图像数据立方体具体包括反射光谱(对应方法 3),或者是二阶导数(对应方法 4),详情可参照图 2。需要说明的是,运用多路主成分分析(MPCA)分解光谱图像数据立方体这一操作,正是被称作多元图像分析(MIA)方法的首要步骤。
多元图像分析(MIA)最早是由 Esbensen 和 Geladi 在 1989 年提出的,自问世以来,已经在多个领域得到了广泛应用,例如火焰分析、零食食品研究以及软木分级等方面。若想要全面了解 MIA,可查阅 Geladi 和 Grahn 在 1996 年发表的相关内容。


MIA 基于这样一个原理:不管图像像素在图像中的具体空间位置处于何处,都能够依据每个图像像素的光谱特性来对其进行分类,进而提取出局部强度变化。当 MIA 与回归技术相结合时,就能够从数字图像中提取出与相应响应变量(例如样品质量测量值)关联程度的特征。


在本次研究中,具体操作如下:首先,把对应于每个聚合物样品所选目标区域的展开光谱矩阵进行汇总,这些矩阵最终被收集到一个尺寸为 (1800×λ) 的大矩阵中(该大矩阵由 18 个样品,每个样品 100 个光谱组成,即 18 个样品 ×100 个光谱 / 样品 )。随后,利用主成分分析方法,将图像信息分解为一组 A 个正交载荷向量 pₐ (向量规格为 1×λ )和得分向量 tₐ(向量规格为 1800×1) ,这一过程可参照公式 (4) 以及图 4。

近红外高光谱预测聚合物薄膜结晶度 中

其中E (1800 ×  λ ) 包含投影残差(当A  <  λ时非零)。载荷向量 ( p a ) 通常通过对维度小得多(即 256 × 256)的核矩阵进行奇异值分解 (SVD) 获得。得分向量根据 计算得出。第一个得分性组合,可捕获光谱矩阵内的可能方差,而第二个得分向量t 2代表第二大方差源,依此类推。因此,得分向量可被视为每个光谱的多元摘要。

高光谱图像的 MPCA 分解

近红外高光谱预测聚合物薄膜结晶度 中

在实际应用中,人们常常发现,只需少量的分量(A),就足以从多变量图像数据中提取出大部分的相关信息。正因如此,少数几个得分向量便能够当作多变量图像具有代表性的分布特征。这些特征一般通过得分向量的散点图来展示,就像图 4 呈现的 t₁ – t₂得分图,或者通过二维密度直方图来呈现。

多元图像回归(MIR)


Yu 和 MacGregor 在 2003 年对得分散点图(或者二维密度直方图)与响应变量之间的回归问题展开了研究。这项研究需要从 K 张图像中的每一张所得到的得分图(或直方图)里,提取出一定数量(n)的特征,接着把这些特征收集到回归矩阵 X(规格为 K×n)当中,再利用目标响应变量(也就是结晶度)y(规格为 K×1)来构建回归模型,具体情况可参考图 2。

将近红外(NIR)光谱图像与聚合物晶体度测量结果关联起来的特定公式,是基于对图 5A 中展示的三种聚合物类型的 NIR 光谱聚类模式的观察而得出的。这个 t₁ - t₂散点图是通过对光谱矩阵(1800×256)进行主成分分析(PCA)分解后得到的。在使用方法 3 时,前两个得分向量分别能够解释 95.8% 和 3.2% 的方差;而在使用方法 4 时,前两个得分向量分别可以解释 77.7% 和 11.1% 的方差。正如人们所预期的那样,与三种聚合物相对应的光谱呈现出截然不同的簇群;NIR 光谱常常被用于聚合物的识别。此外,对应每种聚合物类型的光谱数据,还会依据冷却速率进行聚类,并且这些聚类具有明显的空间方向(如图 5A 中高密度聚乙烯(HDPE)簇的放大图所示)。

近红外高光谱预测聚合物薄膜结晶度 中


为了获取与结晶度相关的信息,研究人员通过将图 5A 中展示的光谱数据投影到前两个得分向量的线性组合上(见图 5B),从而计算出一个新的向量 t₁₂。最后,使用普通最小二乘法,在 t₁₂和 y 之间建立起一个简单的线性回归模型。

选择 线性组合 ( r ) 或t 12向量的角度t 12和y之间的相关性。Yu 和 MacGregor ( 2003 )讨论了类似的方法,用于得分密度直方图分割,作为 MIR 问题的可能公式之一。

近红外高光谱预测聚合物薄膜结晶度 中

分数直方图可识别聚合物和冷却速率 (A)。根据角度 ( r )将数据集投影到单个向量 ( t 12 ) 上可实现降维 (B



浙江以象科技有限公司
地址:浙江省温州市鹿城区藤桥镇南市中路155号七楼
邮箱:510433896@qq.com
关注我们
欢迎您关注我们的微信公众号了解更多信息:
欢迎您关注我们的微信公众号
了解更多信息