谷精华,刘 健,范文玉*,赵立杰,左 越,司文豪
(1.沈阳化工大学机械与动力工程学院,辽宁 沈阳 110142;
2.沈阳化工大学环境与安全工程学院,辽宁 沈阳 110142;
3.沈阳化工大学信息工程学院,辽宁 沈阳 110142)
1. 1 活性污泥及水样采集
本试验的活性污泥样本采自沈阳某A2O工艺污水处理厂,为了保持试验的一致性,每次均在固定点液面下50 cm处采集内、外回流活性污泥样本。为了与内、外回流污泥建立直接的联系,在采集活性污泥样本的同时,也在好氧池出水口采集了瞬时水样进行测定。每次活性污泥样品和出水样品均采集500 mL,为了减小微生物对水质的影响,样品采集、图像采集与水质指标测定之间的间隔时间不超过3 h。本试验共进行6个月,共采集样本91组。期间收集了污水处理厂的运行参数,具体见表1。
表1 试验期间污水处理厂的运行参数
1. 2 水质指标及测定方法
由于所采集的水样为泥水混合液,所以在测定前需要对其进行预处理,即首先将水样过滤,取滤液调节其pH值至中性,然后将水样稀释至合适的待测范围。水样中BOD、COD、TN和TP的测定分别采用《水质 五日生化需氧量(BOD5)的测定 稀释与接种法》(HJ 505—2009)中的稀释接种法、《水质 化学需氧量的测定 重络酸盐法》(GB 11914—89)中的重铬酸钾法、《水质 总氮的测定 碱性过硫酸钾消解紫外分光光度法》(GB 11894—89)中的过硫酸钾紫外分光光度法和《水质 总磷的测定 钼酸铵分光光度法》(GB 11893—89)中的钼酸铵分光光度法。
1. 3 活性污泥絮体图像处理与分析
1.3.1 图像采集
为了保证较大活性污泥絮体的通过,首先使用带有尖端截面枪头的校准移液枪,取10 μL活性污泥样品于载玻片上[14],并用18 mm×18 mm的盖玻片覆盖;
然后使用倒置光学显微镜(NikonEclipse TS100)和工业数码相机(ToupTekTou Camucoms03100kpa)对活性污泥样品进行图像采集。为了提高活性污泥信息的代表性,每个活性污泥样品使用3张载玻片进行形态学表征,并在总100×放大倍数下对载玻片上、中、下3个不同位置分别采集12张图像,保存为2 048×1 536像素的TIF格式图片,每个活性污泥样品总共获得108张图片(12×3×3)。试验期间,得到91个活性污泥样品,共19 656张图片(108×91×2)。
1.3.2 图像处理
根据Amaral等[15]开发的活性污泥絮体图像处理程序,使用深度卷积网络DeepLabv3+方法构建活性污泥絮体分割模型,实现活性污泥絮体的分割。首先,对活性污泥絮体图片背景进行校正;
然后,根据活性污泥絮体确定其二值图像;
最后,对活性污泥絮体二值化图像的边缘进行检测,确定测量区域,并提取活性污泥絮体的形态参数。活性污泥絮体图像处理的过程,见图1。
图1 活性污泥絮体图像处理的过程
在本研究中,基于do Amaral[8]对活性污泥絮体的研究,对选取的25个活性污泥絮体形态参数进行相关性分析,并去除多重相关系数大于|0.90|的变量和相关系数较低的变量,最终确定了14个活性污泥絮体形态参数,具体详见表2。
表2 活性污泥絮体形态参数
1.4 偏最小二乘(PLS)法
偏最小二乘(PLS)法通过提取输入矩阵X基本特征的线性组合,同时根据输入矩阵X对输出矩阵Y进行建模,是一种监测复杂过程的有效方法[17-18]。同时,PLS法也是一种兼顾多元线性回归分析、典型相关分析和主成分分析功能的多元统计分析方法,尤其适用于观测数据(样本量)较少的情况。PLS法除了可以建立更为合理的回归模型,还可以提供更大、更深层次的信息。
本文采用PLS法使用SIMCA软件对内、外回流污泥絮体形态参数与好氧池出水水质指标(CODe、BODe、TNe和TPe)进行PLS回归分析,分别建立了内回流污泥回归模型(PLS1模型)和外回流污泥回归模型(PLS2模型),并通过拟合系数R2和预测系数Q2来判断两个回归模型的适用性,最后根据预测系数Q2来确定最佳拟合模型。
拟合系数R2表示因变量与所有自变量之间的总体关系,可以体现出对回归模型的解释能力,其计算公式为
(1)
式中:SSR表示回归平方和;
SST表示总平方和。
预测系数Q2表示对因变量的预测能力,其计算公式为
(2)
式中:PRESSh为每一个维度的预测误差平方和;
SSh-1为前一个维度的残差平方和[19]。
一般认为,当R2>0.5且Q2>0.5时,回归模型的拟合效果较好[20]。在本研究中,输入矩阵X包含表1中9个污水处理厂运行参数和表2中14个活性污泥絮体形态参数;
输出矩阵Y由好氧池出水水质指标CODe、BODe、TNe和TPe组成。本次试验共得到91个活性污泥样本,使用前80个活性污泥样本作为训练集,其余11个活性污泥样本作为验证集用于验证回归模型的预测效果。
2.1 PLS模型的建立
基于PLS法的建模原理,根据预测系数Q2来确定需要提取的主成分的个数,当所提取的主成分Q2<0时,停止提取。提取主成分的目的是尽可能地保留数据本质属性,寻找原数据的内在低维结构,从而采用低维数据表征原数据,为后期研究分析提供依据。
对于内回流污泥模型(PLS1模型),共提取4个主成分,输出矩阵Y的累计拟合系数R2=0.752,累计预测系数Q2=0.694;
对于外回流污泥模型(PLS2模型),共提取4个主成分,输出矩阵Y的累计拟合系数R2=0.775,累计预测系数Q2=0.720。两个回归模型输出矩阵中输出变量的R2和Q2值,见表3。
表3 PLS1模型和PLS2模型出水水质指标的拟合系数R2和预测系数Q2
由表3可知,两个回归模型对于出水中各输出变量的预测系数Q2相差不大,但PLS1模型对于CODe、BODe有更好的预测能力,而PLS2模型则对TNe、TPe有更好的预测能力。
2. 2 模型拟合及预测效果评价
为了验证回归模型的预测效果,使用相对误差r和确定性系数dy来确定回归模型的拟合及预测程度。模型的相对误差越小,确定性系数越大,表示回归模型预测得越准确。相对误差r和确定系数dy的计算公式如下:
(3)
(4)
为了分析两个回归模型的拟合效果,将PLS1模型和PLS2模型训练集样本的预测值与实测值进行了对比,见图2。
由图2可见,两个回归模型对输出变量的预测能力大致相同,但是从相对误差数据的波动来看,PLS2模型相对误差数据的波动要小于PLS1模型,即从模型的拟合角度来看,PLS2模型的拟合效果要稍优于PLS1模型。
为了分析两个回归模型的预测效果,将验证集样本分别代入PLS1模型、PLS2模型计算其预测值,并与实测值进行了对比,见图3。
由图3可见,两个回归模型中CODe、BODe、TNe、TPe预测值与实测值的变化趋势基本一致,这意味着通过活性污泥絮体形态参数预测出水水质具有可行性,表明模型有着很好的预测能力。
PLS1模型和PLS2模型训练集和验证集的合格率E(即小于给定相对误差的样本数占总样本数的百分比)和确定性系数dy,见表4。
由表4可知,两个回归模型训练集和验证集的确定性系数dy都达到了0.60以上,说明两个回归模型对出水水质均有较好的预测效果;
但是从对比情况来看,在PLS2模型中CODe、TNe、TPe的确定性系数dy均高于PLS1模型,且合格率E<20%的样本比例更高,说明PLS2模型的计算结果更为可靠,证明从活性污泥絮体微观角度建立出水水质预测模型的可行性。通过该模型,可以更好地指导实际污水处理设施的运行,从而为污水处理厂水质监测提供理论依据。
图2 PLS1模型和PLS2模型训练集样本的预测值与实测值的比较
图3 PLS1模型和PLS2模型验证集样本的预测值与实测值的比较
表4 PLS1模型和PLS2模型出水水质指标的拟合及预测效果对比
2. 3 数据相关性分析
2.3.1 输入变量之间的相关关系
活性污泥絮体的形态特征与污水处理厂运行参数密切相关,为了研究它们之间的关系,对它们之间的相关关系进行了讨论,各参数间相关系数取绝对值后得到的相关系数矩阵,见图4。
图4 PLS1模型和PLS2模型输入变量与输出变量之间的相关系数矩阵图
由图4可以看出:
(1) 总的来看,活性污泥絮体不同形态参数间具有一定的相关关系。其中,用于表征絮体数量的参数N与用于表征絮体大小的参数A、P、Pconv、Fmax、Deq之间呈负相关关系,相关系数绝对值大于0.6(p<0.05);
表征絮体密实度、絮体大小和絮体规则性的参数之间也同样具有较强的相关关系(相关系数>0.5,p<0.05)。由此来看,在不同的客观条件下,表征絮体大小、絮体密实度和絮体规则性的参数变化较为同步。另外,进水水质指标之间也存在着较强的相关关系,其中CODi、BODi、TNi之间的相关系数都在0.85以上(p<0.05),说明进水中污染物成分较为稳定。而好氧池运行参数T、pH值与活性污泥絮体形态参数之间的相关关系较为一般,推测变量T和pH值并没有达到能够显著影响活性污泥絮体微观特征的水平。
(2) 对比来看,PLS2模型中输入变量之间的相关性更强,除了变量RD、RR、FD和R外,其他变量之间均具有较好的相关性(相关系数>0.5,p<0.05)。通过对比分析发现,对于内回流污泥,当絮体面积较大时,絮状物的密实度和圆度也较高;
而对于外回流污泥,絮体面积越大,絮状物的密实度和圆度则越低。这可能与好氧池和二沉池的环境状态有关,在好氧池中,好氧微生物快速生长,所以内回流污泥较为紧实;
在二沉池中,相比于污泥中的其他微生物,丝状菌对水中DO、有机碳源有更强的竞争能力,丝状菌的繁殖同样会导致絮体面积增大,但此时絮体的密实度会下降,严重时还会影响二沉池内泥水分离,导致出水水质恶化。
2.3.2 输入变量与输出变量之间的相关关系
表5列出了部分输入变量与输出变量的相关系数,从表中删除了输入变量RR、FD、T、pH值、r、R,因为它们与输出变量没有显著的相关性。
由表5可知,外回流污泥絮体形态参数与出水水质指标之间的相关性更强,在所筛选的变量中,絮体的密实度参数(孔率HR)、进水水质指标(CODi、BODi、TNi)与出水水质指标之间的关系更加密切。
表5 PLS1模型和PLS2模型输入变量与输出变量之间的相关系数
具体来看,对于COD、BOD来说,它们都表示水中有机物的含量,活性污泥絮体中微生物将有机物作为碳源,将其降解为无机物或合成自身细胞,从而去除水体中的有机物。在PLS1模型中,CODe、BODe与絮体密实度参数孔率HR呈正相关关系,与变量絮体密实度参数孔数H呈负相关关系,说明当活性污泥絮体结构紧密、内部孔洞数量少时,出水中CODe、BODe含量高。这主要是因为在活性污泥中,菌胶团细菌为严格好氧菌,丝状菌是好氧和微量好氧菌,而内回流污泥中DO含量较低,所以丝状菌呈优势生长,造成絮体面积增大,引起污泥膨胀现象,致使出水水质变差[21]。与此同时,大量菌胶团会通过胶质状胞外多聚物(EPS)黏附在丝状菌上,由于细菌相互堆积,会导致絮体密实度增加。另外,CODe和BODe与CODi、BODi、TNi呈正相关关系,说明CODe和BODe很大程度上取决于进水污染物的浓度。在PLS2模型中,CODe、BODe与选择的输入变量都有一定的相关性,但值得注意的是,与PLS1模型不同,在PLS2模型中,CODe、BODe与HR呈负相关关系。
TN表示水体中各种有机氮和无机氮的总量,其主要通过硝化反硝化去除。在PLS1模型中,TNe与HR呈正相关关系,与DO呈负相关关系。在活性污泥法中,一般要求内回流污泥中DO含量在0.5 mg/L以下,当内回流污泥中DO的含量较高时,会影响反硝化细菌的脱氮过程[22]。而对于PLS2模型来说,TNe与HR呈负相关关系。当活性污泥絮体密实度较低,外回流污泥孔洞内部携带的DO会造成异氧菌大量繁殖,消耗有机碳源,引起后段反硝化碳源不足,影响反硝化的正常进行,导致出水中TNe含量升高[23]。
磷对微生物生长至关重要,当水体中磷含量超过0.2 mg/L时,会引起水体的富营养化。在PLS1模型中,仅TPe与进水参数的相关性较大,这主要是因为内回流污泥主要是起到脱氮的作用,与除磷效果的相关关系较弱。而在PLS2模型中,TPe与多个输入变量呈较强的相关关系,这是因为外回流污泥中携带的硝酸盐氮含量会影响聚磷菌的释磷过程,从而影响后续的除磷过程[24]。
(1) 在本试验中,分析了内、外回流污泥絮体形态参数与好氧池出水水质指标的关系,并结合污水处理厂运行参数对出水中CODe、BODe、TNe、TPe进行了预测,并通过对比PLS1模型与PLS2模型的拟合效果和预测效果,结果发现PLS2模型的拟合效果和预测效果均要优于PLS1模型。其中,PLS2模型对CODe、BODe、TNe、TPe的预测系数Q2分别为0.736、0.665、0.753、0.716,表明该模型具有良好的预测效果,可以更好地指导实际污水处理设施的运行,为污水处理厂的水质监测提供了一种新的方法。
(2) 通过对模型的验证,结果发现PLS1模型和PLS2模型两个回归模型验证集的确定性系数都达到了0.60以上,说明两个回归模型对出水水质指标均有较好的预测效果,证明了从活性污泥絮体微观角度建立水质预报模型的可行性。但是对比来看,PLS2模型中的确定性系数均高于PLS1模型,且E<20%的样本比例更高,说明PLS2模型的计算结果更为可靠。
(3) 相关性分析表明:在PLS1模型中,当活性污泥絮体面积越大、密实度越高、形状越规则时,出水中CODe、BODe、TNe、TPe越高;
在PLS2模型中,当活性污泥絮体面积越大、絮体密实度越低、絮体形状与圆偏差越大时,出水中CODe、BODe、TNe、TPe越高。在实际污水处理厂的运行中,一方面可以对这些活性污泥絮体的形态参数进行分析,判断出水水质;
另一方面,可以通过调整模型中提及的运行参数,来改善出水水质。