基于在线近红外光谱技术建立桂枝茯苓胶囊流化床干燥过程水分实时监测模型

2021年11月3日01:49:13 发表评论

摘要:目的采用在线近红外光谱(NIRS)技术,建立桂枝茯苓胶囊流化床干燥过程水分实时监测模型。方法通过NIRS漫反射探头采集16个生产批次共176个样本进行建模,优选移动窗口平滑法进行光谱预处理,采用间隔偏最小二乘法(siPLS)结合移动窗口偏最小二乘法(mwPLS)筛选特征变量为4 759.45~5 338.00 cm?1、5 503.84~6 101.67 cm?1、8 512.25~8 809.24 cm?1,采用偏最小二乘(PLS)法建立水分含量多变量校正模型。结果水分预测的交叉验证均方根误差(RMSECV)为0.243%,性能偏差比(RPD)值为13.384,预测相对偏差(RSEP)为0.270%。以8个生产批次对在线监控方法的可靠性进行持续验证,结果40个样本的相对预测误差均小于4.7%。干燥过程水分实时监测趋势图显示可准确判断干燥终点,终点样本水分含量位于控制限内。结论在线NIRS结合PLS建立的定量模型,可应用于生产规模桂枝茯苓胶囊流化床干燥过程水分含量在线监控且预测性能稳健、准确。

桂枝茯苓胶囊(Guizhi Fuling Capsules,GFC)成型工艺由混合、湿法制粒、干燥、整粒和总混等工序组成,其中湿颗粒干燥由流化床干燥设备完成。颗粒含水量影响颗粒物料的流动性、可压缩性和吸湿稳定性,进而影响胶囊装量和稳定性等关键质量属性[1]。而目前生产采用的离线检测方法实时性差,影响干燥终点的判断,不利于质量控制。因此,流化床干燥过程水分在线控制是实现GFC质量批内和批间一致性的关键步骤。

近年来,基于在线近红外光谱法(near-infrared spectroscopy,NIRS)的颗粒流化床干燥过程水分实时监测的研究是工业生产中一个热点问题[2]。从研究对象方面,已发表的文献侧重于化学药品[3],中药相关报道较少[4-7]。从NIRS在工业现场的实施方面,离线取样并建模分析的研究较多,而实时在线监控研究较少。Otsuka等[8]应用NIRS法实时监测实验室级别流化床制粒过程颗粒含水量及粒径;张广仁等[9]离线采集了散结镇痛胶囊干燥过程中67个样本NIRS,对水分含量检测的可行性进行了分析研究;易夏等[10]对注射用五头孢唑林钠干燥过程样本水分含量在线监测方法进行探究,实现了样本生产规模取样,但光谱获取方式为离线采集,且未进行实际生产验证。因此,在中药生产过程复杂工况条件下通过在线NIRS法实现流化床干燥过程水分测定的可行性和精确度仍有待进一步研究。

本实验以GFC生产规模条件下的流化床干燥过程为载体,对流化床设备进行改造,搭建透光蓝宝石视窗和近红外无损检测平台,对生产过程代表性样品进行近红外分析,优选光谱预处理和变量筛选方法,建立颗粒干燥过程水分预测模型,并对该模型在实际干燥过程中应用的准确性和稳健性进行验证。

1仪器与试药

1.1仪器

Antaris MX傅里叶变换近红外光谱仪,配备Reflector探头,美国Thermo公司;XY-105MW型卤素快速水分测定仪,常熟幸运电子设备有限公司。

1.2试药

GFC湿颗粒干燥过程中不同水分含量颗粒样品,由江苏康缘药业股份有限公司提供。28批样品批次分别为180808、180809、180810、180811、180922、180923、180924、180925、181010、181011、181012、181013、181118、181119、181120、181121、190407、190408、190409、190410、190411、190412、190501、190502、190503、190504、190505、190506。

2方法

2.1样品采集

近红外探头安装示意图见图1-a。因为制粒和干燥是不连续过程,故将近红外探头置于可移动支架上,在工人上料、卸料时可移动至旁边。开始干燥时,将支架推至窗口处,探头平面与锅体窗口相切,防止扫描到空气引起运行异常。

流化床视窗和取样口位置示意图见图1-b,圆形透光蓝宝石视窗开口于锅体中间位置,透过窗口可清晰地观察到物料运动状态,干燥过程中物料不黏附,取样口和视窗位于同一水平线上。探头采集的信号经光纤传递给控制系统。

采用积分球漫反射方式于室温下在线采集近红外光谱,光谱采集时间间隔为3 min,扫描范围10 000~4 000 cm?1,分辨率8 cm?1,4倍增益,扫描次数32次。扫描光谱的同时,从取样口中手动取样。收集4个月内16个生产批次共176个样本,每份样本约10 g颗粒。详细记录操作组、干燥时间、停止干燥时颗粒温度及干燥后颗粒的水分含量。

2.2水分测定

精密称取约5.0 g待测样品,平铺在水分测定仪样品盘上,于105℃下加热10 min,根据仪器读数即得。

2.3光谱预处理

环境温湿度变化、设备振动、现场噪音等因素会使NIRS产生噪声信号,流化床干燥过程中颗粒粒径、密度变化等亦会引起基线漂移。为了减少光谱中信号中的噪声以及无关信息,必须采用适当的预处理方法进行光谱预处理。移动窗口平均算法(window moving average algorithm)[11]是将光谱数据定义为矩阵X,X中的每个元素为xij(其中i表示第i条光谱,j表示第j个波数变量),校正后的元素定义为,则k个窗口平滑之后的校正值的计算公式如下。

其他常用的预处理方法还有卷积平滑(Savitzky-Golay smooth)、矢量归一化(normalization)、S-G平滑加一阶导数(S-G1st)、S-G平滑加二阶导数(S-G 2nd)、基线校正(baseline)、多元散射校正(multiplicative scattercorrection,MSC)、标准正则变换(standard normal variatetransformation,SNV)。S-G平滑是通过多项式来对移动窗口内的数据进行多项式最小二乘拟合以消除噪声;矢量归一化可消除光程变化或样品稀释变化等对光谱产生的影响;一阶导数可以消除背景的常数平移;二阶导数可以消除线性背景平移;基线校正主要是扣除仪器背景或漂移对光谱信号的影响;多元散射校正与标准正则变换效果近似,可降低样本中固体颗粒分布不均、大小不同和附加的散射对光谱的影响[12]。

2.4数据处理

采用SIMCA 13.0(Umetrics,Sweden)软件进行主成分分析和光谱异常值辨别,采用Unscramble X 10.4(Camo software AS,Norway)软件对光谱进行预处理,采用Matlab 7.0(Mathwork Inc.,美国)软件进行样本划分、变量筛选及模型构建,采用Origin 8.0(OriginLab,美国)软件绘图。

3结果和分析

3.1光谱相似度评价

于6个批次光谱(180808、180809、180810、180811、180922、180923)中各随机选取1条光谱,利用夹角余弦法进行光谱相似度评价,结果如表1所示,6条光谱间相似度均大于0.999,表明保持NIRS探头与锅体视窗相切时,得到的NIRS相似度高,重复性好,仪器安装方法和光谱采集方法稳定可靠。

3.2水分参考值测定结果

GFC工艺规程规定,干燥后颗粒水分含量应为3%~5%,操作人员根据干燥时间和物料温度判断干燥终点。批次180808~181121内176个样本水分含量测定结果见表2。终点样本水分含量(w)指结束干燥后物料温度降至室温时样本水分含量;干燥时间(t)指加热时间;停止温度(T)指停止加热时物料温度,由嵌在锅体上的温度计读数得到;操作组指不同的操作工人,分为2组,每组3人。当干燥过程持续时间长,停止温度高时,终点样本含水量较低。

3.3离群样本辨识和样本划分

对176组光谱数据做主成分分析(PCA),绘制所有批次的主成分1和主成分2的得分图,即图2-a,第1主成分可解释93.9%的变量信息,第2主成分可解释4.72%的变量信息。将180809、180922和181118批次中部分样本在第1主成分和第2主成分的得分绘制于图2-b中,可以看出,同一批次样本在得分图中分布在相近的区域,不同批次相距较远。表明生产过程中批间差异较为明显。离群样本会影响模型稳健性和准确性,因此在建模之前应准确识别离群样本。Hotelling’sT2统计量表征的是采样点在主成分的特征空间中与均值之间的距离,指示每个样本信息在幅值和变化趋势上偏离主成分模型的程度[13]。不同样本Hotelling’s T2距离如图3所示,有6个样本超出Hotelling’s T295%置信区间,分别是26、109、121、128、130、131号样本,建模之前剔除异常样本。针对170个样本对应的NIRS,采用Kennard-Stone算法[14]将所有样本划分为校正集和验证集,如表3所示,其中校正集样本占80%,验证集样本占20%。校正集含水量3.75%~15.32%,验证集含水量3.95%~13.14%,校正集和验证集的样本水分含量的平均值和标准偏差分别是8.25%、3.05%和7.03%、2.61%,可见校正集数据范围覆盖了验证集数据范围。

3.4光谱预处理

3.4.1光谱预处理方法的选择使用移动窗口平滑(9点)、S-G平滑(9点)、矢量归一化、S-G 1st(9点)、S-G 2nd(9点)、基线校正、MSC、SNV对原始光谱进行预处理之后,建立水分含量偏最小二乘(PLS)定量模型,不同预处理方法对模型性能的影响见表4。本研究以性能偏差比(ratioof performance to deviation,RPD)和预测相对偏差(relativestandard errorof prediction,RSEP)为评价指标,RPD越大表示模型预测能力越高,RSEP越小,表示预测偏差越小,模型性能越好[15];RMSEC(root mean square errors of calibration)、RMSECV(root meansquare errors of cross validation)、RMSEP(root meansquare error of prediction)分别表示校正均方根误差、交叉验证均方根误差和预测均方根误差,Rcal和Rpre分别表示校正集和验证集的相关系数,BIAScal和BIASpre分别表示校正的偏差和预测的偏差,RMSEC、RMSECV、RMSEP、BIAScal和BIASpre越小,Rcal和Rpre越大,表示模型校正和预测性能越好。移动窗口平滑优于其他预处理方法,RMSEC、RMSECV、RMSEP分别为0.223%、0.262%、0.229%,RPD为11.377,RSEP为3.036%。

过程湍流是干扰流化床干燥过程在线近红外光谱检测准确度的原因之一。探头周围物料密度的改变以及颗粒粒径变化,导致在线光谱的整体强度的强烈随机波动,这通常被称为“散射效应”。3种最常用的散射校正方法是MSC、SNV和求导法。在流化床干燥过程在线漫反射近红外监测的文献报道中,数据分析以MSC、SNV或求导法为主[16-17]。而本研究发现,经过移动窗口平均算法对光谱数据进行预处理之后,建立的水分含量PLS定量模型效能明显优于经MSC或SNV处理后的模型,即传统的散射校正方法可能会消除一些与水分相关的有用变量信息。该结果与Bogomolov等[18]提出的观点类似,同时,Bogomolov等[18]为了提高流化床干燥过程中颗粒水分在线监测精确度,提出一种基于时间维度的光谱平滑算法,该算法保留了更多与颗粒含水量相关的变量。Chen等[19]也研究了散射校正数据包含的信息的性质,认为对于包含可提取信息的散射校正参数而言,散射校正不一定是最佳的预处理方法。周宏[20]也发现在应用NIRS系统获取斜生栅藻的透射光谱信息时,基于经移动窗口平滑预处理之后的光谱油脂含量建立定量模型效果较好。

3.4.2平滑窗口宽度的选择窗口宽度(k)的选择是一个值得探讨的问题,k太小,平滑去噪效果不理想,k太大,会导致光谱失真。建立了不同k(3~21点)下的PLS定量模型。k与RPD、RSEP的关系如图4所示,图4-a、b中均出现2个明显的拐点,此时均有较大的RPD和较小的RSEP。当k为5时,RPD=12.129,RSEP=2.873%,当k为15时,RPD=12.293,RSEP=2.833%,即当采用15点平滑时,模型预测性能最佳,此时模型性能参数见表5。180808批次7个GFC流化床干燥过程样本的原始光谱图和经移动窗口平滑预处理之后的光谱图见图5-a、b。随着干燥的进行,lg(1/R)逐渐减小,与颗粒含水量减小趋势一致,如图5-a中箭头1所示方向。同时,随着干燥过程中物料温度升高,整体光谱有向高波数方向移动的趋势,尤其是5 150 cm?1处的吸收峰位移极为明显,如图5-a中箭头2所示方向。

3.5特征变量筛选

筛选特征波段可以剔除无关变量和非线性变量,简化模型,提高模型预测精确度和稳健性。本研究考察了3种不同变量筛选方法及其组合应用时对模型的影响。

3.5.1间隔偏最小二乘法(interval PLS,iPLS)[21]iPLS是把光谱数据等分成多个子区间,并在每个子区间进行PLS回归,建立多个局部回归模型。本研究将全波段光谱划分为20个子区间,以RMSECV为评价指标,筛选最佳建模区间。iPLS、mwPLS或者联合iPLS和mwPLS时,模型性能低于全谱建模,提示iPLS、mwPLS在本研究中处于弱势地位。使用siPLS联合mwPLS筛选的组合变量4 759.45~5 338.00 cm?1、5 503.84~6 101.67 cm?1和8 512.25~8 809.24 cm?1建模,结果显示优于其他方法单独使用。5 150 cm?1处的强吸收峰是水分子反对称伸缩振动和弯曲震动的组合频谱带,包含于第1区间;水在5 620 cm?1和8 310 cm?1附近有1个宽的比较弱的组合频吸收,也大体包含于第2、3区间,第3区间变量波数高于8 310 cm?1,可能是由于温度升高导致了吸收峰发生位移,即该变量组合包含水分子吸收峰,同时消除了温度对校正模型的影响[23],故模型预测效果较好。

3.6建立水分含量定量模型

以移动窗口平滑法对原始光谱进行预处理,采用siPLS联合mwPLS筛选特征变量,建立GFC流化床干燥过程中间体颗粒水分含量PLS模型。合适的潜变量数可以缩减建模子空间。潜变量过多时,会引入噪声和不相关部分,导致过拟合;潜变量过少又会导致欠拟合,由于模型缺少了部分相关信号,致使校正和预测阶段都无法保证模型准确度。最常用的检验技术是交互验证法。本实验采用留一交叉验证法进行优化,以预测误差平方和(predicted residual error sum square,PRESS)和RMSECV为指标,确定最优潜变量数。结果如图6所示,潜变量为8时,RMSECV最小,PRSEE趋于稳定。PLS模型性能参数如表3所示,与无预处理条件下建立的PLS模型相比,RPD提高至13.384,RESP降低至2.602%,校正集和验证集参考值和预测值相关关系如图7所示,校正集回归曲线Y=0.995 2 X+0.038 9,r2=0.994 4,验证集回归曲线Y=0.969 2 X+0.185 3,r2=0.995 1,模型性能明显提高。

3.7生产持续验证

取190407、190408、190409、190410、190501、10502、190503、190504批次流化床干燥过程颗粒作为外部验证样本,考察模型稳定性,参考值和预测值如表7所示,相对预测误差(相对预测误差=|预测值-参考值|/参考值),均小于4.62%,表明经过生产实际验证,预测结果准确,该模型较为准确和稳健。

3.8实时在线监测

将建立好的PLS模型载入控制系统,对新1批次(批号181122)GFC干燥过程进行实时在线监测。探头会及时扫描到光谱信息并经光纤传递给控制系统,这时显示器就会迅速给出当前水分含量值,当显示值达到操作规程要求时,停止干燥。图8是流化床干燥过程中PLS模型在线NIR预测值与测定值的趋势对比图。预测值和参考值重叠性良好,相关系数r2=0.995 6,平均相对预测误差为1.98%。终点样本颗粒水分含量为4.27%,在控制限(3%~5%)范围内,符合生产规定。

4讨论

中药原料不均一、生产过程缺乏在线控制是导致中药批间差异的重要因素,而过程分析技术在中药过程质量控制中的应用可显着改善批间差异。上述结果证明了应用NIRS技术实时监测流化床干燥过程颗粒水分含量的可行性。同时,与在线红外水分检测仪、在线微波水分检测仪等在线水分检测工具相比,近红外具有绿色无损、可快速同时检测多个指标等优点,可进一步应用于GFC流化床干燥过程中化学性质(如有效成分含量)和物理性质(如密度、粒径等)实时监测,从而提高批间一致性和产品稳定性。

根据上述结果,提出以下3点关于流化床干燥和类似工艺类型中水分含量的在线NIRS监测的建议:(1)准确的模型应建立在大量生产规模一级数据的基础上,要通过使用足够多的代表性样品和工艺条件来研究光谱数据与水分相关性。考虑到原料及工艺波动等造成的批间不均一性,模型校正集数据尽可能包含不同生产批次下的样本,如不同操作组、不同生产线、不同批次原料等。(2)建议在进行光谱预处理之前分析原始光谱数据与样本的联系,不鼓励在多变量校准之前对在线过程光谱进行散射校正,因为它会导致原始光谱数据中与水分有关的信息丢失,使基于此建立的模型预测效果欠佳。(3)生产应用中,应定期进行模型外部验证,必要时进行模型更新。

参考文献(略)

来源:王晴,徐芳芳,张欣,徐冰,李执栋,杜慧,张永超,相继芬,包乐伟,王振中,肖伟.在线近红外光谱监测桂枝茯苓胶囊流化床干燥过程水分的方法研究[J].中草药,2019,50(22):5429-5438.
来源: 王 晴,肖 伟 中草药杂志社