膜生物反應器(MBR)作為一種新型廢水處理技術在污水處理方面具有廣闊的應用前景。但是,膜污染是制約MBR進一步發(fā)展的瓶頸性問題。近年來,隨著數(shù)學算法及計算機技術的發(fā)展,將人工神經(jīng)網(wǎng)絡(ANN)等機器學習算法應用于MBR的膜污染預測成為研究的熱點。總結了膜污染的影響因素,探討了基于經(jīng)典數(shù)學模型膜污染預測的優(yōu)缺點,綜述了近年來國內外學者運用簡單ANN、優(yōu)化算法ANN和深度學習ANN對MBR膜污染預測的研究,提出優(yōu)化算法ANN與深度學習ANN在面對復雜環(huán)境下更具優(yōu)勢。此外,還探討了當前運用ANN機器學習算法進行膜污染預測存在的缺陷,指出ANN模型在中試和工業(yè)化規(guī)模的MBR膜污染預測中應用較少,并對其未來的發(fā)展進行了展望。
膜生物反應器(Membrane bioreactor,MBR)是一種將活性污泥法與膜分離技術相結合的廢水處理技術,具有出水水質好、負荷高和占地面積小等優(yōu)點〔1-2〕。目前,大型(10 000 m3/d)和超大型(100 000 m3/d)MBR污水處理廠在包括中國、美國和歐洲等世界各地相繼建成并投入使用。據(jù)預測,中國的大型MBR污水處理廠將超過300座,總污水處理規(guī)??蛇_1 500萬t/d〔2〕。但是,膜污染會導致跨膜壓差(Transmembrane pressure,TMP)的上升和膜通量的下降,增加MBR的運行成本,成為限制MBR廣泛應用的瓶頸性問題〔3〕。
機器學習(Machine learning,ML)是一種基于以往經(jīng)驗或數(shù)據(jù)進行分類與回歸的技術,不僅被運用于農業(yè)、氣候、安全、教育、醫(yī)學等行業(yè)〔4〕,也被廣泛運用于污水處理領域。人工神經(jīng)網(wǎng)絡(Artificial neural network,ANN)作為一種機器學習模型,不僅具有參數(shù)少、預測性能好、泛化能力強等優(yōu)點〔5〕,而且具有極強的非線性映射能力、學習能力和黑箱建模能力。因此,應用ANN模型進行膜污染預測無需考慮復雜的膜污染中間過程,只需考慮與膜污染相關的指標即可。石寶強等〔6〕早在2006年就綜述了ANN在MBR膜污染預測中的應用研究,但是隨著對MBR膜污染機理的深入研究和ANN模型理論與技術的發(fā)展,亟需新的綜述對近年來的研究進行總結。而F. SCHMITT等〔7-8〕雖然綜述了人工智能用于預測膜污染的研究,但是欠缺對傳統(tǒng)數(shù)學模型與神經(jīng)網(wǎng)絡模型差異的深入分析。基于此,筆者簡述了影響膜污染的因素,對比了傳統(tǒng)數(shù)學模型與人工神經(jīng)網(wǎng)絡模型的差異與優(yōu)劣,總結了近年來ANN模型在膜污染預測中的應用及優(yōu)缺點,并對其未來的發(fā)展進行了展望。
1 膜污染的影響因素
膜材料、反應器操作條件和污泥混合液特性是與膜污染密切相關的主要因素〔9〕,其涉及到的具體參數(shù)見圖1。
由圖1可知,膜污染的影響因素眾多且相互影響,因此很難厘清各自的具體作用。例如,進水水質、污泥停留時間(Sludge retention time,SRT)和水力停留時間(Hydraulic retention time,HRT)等操作條件的改變不僅會直接影響膜污染,而且會導致污泥混合液特性發(fā)生變化,進而改變膜污染速率〔10〕。
早期研究人員建立了關于操作條件、膜通量、過濾濾阻等參數(shù)的數(shù)學模型〔11-15〕。此后,有研究建立了表達污泥混合液特性〔例如混合液懸浮固體濃度(Mixed liquid suspend solids,MLSS)、顆粒粒徑(Particle size distribution,PSD)、溶解性微生物產(chǎn)物(Soluble microbial products,SMP)等〕與膜污染關系的數(shù)學模型〔16-18〕。但是,這些傳統(tǒng)的數(shù)學模型一般為指數(shù)式經(jīng)驗模型,往往需要通過諸多假設來簡化計算,且各參數(shù)物理意義不明確,存在預測精度低和通用性差等問題〔6-7〕。因此,開發(fā)能夠更加精準預測膜污染的模型對膜污染控制及其機理研究有重要意義。
膜污染模型的構建需要選擇合適的影響因子作為輸入變量,并尋找變量與膜污染之間的關系。因此,厘清各膜污染因素之間的相互作用及其對膜污染的影響是構建膜污染預測模型的前提條件。
1.1 膜材料性質
膜材料的性質包括膜的材質、親疏水性和粗糙程度等〔19〕,這些性質均會對污染物在膜表面的遷移轉化產(chǎn)生顯著影響,進而影響膜污染。例如,Y. JEONG等〔20〕比較了Al2O3陶瓷膜與聚偏氟乙烯(Polyvinylidene fluoride,PVDF)膜污染狀況,結果發(fā)現(xiàn)陶瓷膜具有更低的膜污染速率。膜的親疏水性也與膜污染密切相關,大量研究通過表面改性和共混改性法提高了膜表面的親水性能,從而減緩了膜污染〔21〕。此外,膜表面粗糙程度也與膜污染有關,例如有學者發(fā)現(xiàn)粗糙的膜表面有利于膠體顆粒在膜上的積聚,引發(fā)膜孔堵塞,從而導致嚴重的膜污染〔19〕。
1.2操作參數(shù)
不同的MBR系統(tǒng)操作條件也會影響膜污染,主要包括進水水質、運行溫度、SRT、HRT、錯流流速和曝氣強度等。SRT與HRT是影響MBR處理效能、污泥混合液特性和膜污染的重要因素。一般認為SRT的增加會降低污泥活性和絮體大小,此外較長的SRT促進了內源性衰變和細胞裂解,導致SMP的增加〔22〕。例如,在厭氧MBR的研究中,Zhi HUANG等〔23〕比較了不同SRT(30 d、60 d、∞)對膜污染的影響,結果表明在較長的SRT下厭氧MBR中會積累較多的蛋白質與多糖,MLSS增加,從而增加了膜污染速率。對于HRT而言,較短的HRT會導致有機負荷的增加,從而導致微生物分泌更多的胞外聚合物(Extracellular polymeric substances,EPS)和SMP,從而提升膜污染速率。例如,N. FALLAH等〔24〕比較了不同HRT對膜污染的影響,結果表明隨著HRT的降低,EPS和SMP顯著增加,污泥混合液的黏度也顯著增加,導致了較高的膜污染速率。此外,通過在膜表面增加錯流流速和曝氣強度等物理剪切方式,減少顆粒物在膜表面的沉積也是減緩膜污染的常見方法。Yingyu AN等 〔25〕在厭氧MBR中發(fā)現(xiàn),一定范圍內增加含甲烷生物氣曝氣強度能夠減緩膜污染,但是過高的曝氣強度會破壞污泥絮體,導致污泥顆粒平均粒徑降低,從而更易形成致密的膜污染層,同時膜污染速率也會提高。
1.3 污泥混合液特性
對膜污染存在影響的污泥混合液特性主要包括MLSS、EPS和SMP等。盡管MLSS并不是影響膜污染的主要因素,但是過高的MLSS(>15 g/L)會增加混合液的黏度,導致膜污染速率的提高,過低的MLSS(<6 g/L)則會降低SRT并增加食物微生物比率,同樣導致較高的膜污染速率〔26〕。EPS和SMP主要是由微生物生長代謝和衰敗過程中所釋放的蛋白質、多糖、核酸、脂類物質以及腐殖酸等有機物組成,其也被證明與膜污染密切相關,有研究表明EPS中多糖和蛋白質的含量與膜污染速率呈正相關關系〔27〕。此外,SMP不僅可以吸附在膜表面,而且可以堵塞膜孔,從而降低膜面積并提高膜污染速率。
2 膜污染預測模型的相關研究
2.1 經(jīng)典數(shù)學模型
在過去幾十年里,研究人員相繼構建了表達污泥混合液特性和運行條件等與膜污染關系的經(jīng)驗公式,并建立了經(jīng)典數(shù)學模型,其部分代表性成果見表1。
經(jīng)典串聯(lián)阻力模型是一種使用達西定律來描述不同膜污染層的過濾濾阻模型,數(shù)十年來被廣泛用于膜通量的預測〔11〕?;谠撃P?,B. TANSEL等〔12〕構建了通量模型,在死端過濾與錯流過濾初期成功地預測了通量下降到60%所需的時間。S. CHANG等〔13〕結合達西定律與Hagen-Poisenille公式〔14〕構建了膜纖維半徑與膜通量關系的模型,描述了中空纖維膜中的膜污染情況。J. HERMIA等〔15〕基于膜通量下降的孔隙阻塞機制,根據(jù)膜孔堵塞情況選取不同n值(n=0,1,1.5,2),建立了通量預測模型以解釋膜通量與膜污染間的關系。
研究人員還構建了污泥混合液特性與膜污染間的數(shù)學模型。例如M. F. R. ZUTHI等〔16〕以濾餅層模型與阻塞模型為基礎,構建了SMP與膜污染間的半經(jīng)驗數(shù)學模型,對TMP的變化進行了精準的預測。T. SATO等〔17〕建立了MLSS、COD與過濾濾阻之間的關系公式,其預測誤差為±24%。此外,F(xiàn)angang MENG等〔18〕基于MLSS、PSD和EPS,構建了膜污染預測模型,用以闡明污泥混合液特性與膜污染的關系。
盡管經(jīng)典數(shù)學模型在膜污染預測方面取得了一定的成果,但是膜污染是一個受進水特性、微生物活動、過濾模式等多因素影響的復雜動態(tài)過程,這些經(jīng)典數(shù)學模型往往為了簡化僅考慮部分影響因素或在建立模型過程中設置諸多假設,例如,基于串聯(lián)阻力定律的預測模型雖然有廣泛的應用,但并沒有考慮生物膜的生長和不可逆污染物的形成等作用對膜污染的影響〔28〕,因而在實際應用中不可避免會存在一定的誤差。
2.2 機器學習常見算法
機器學習能從大量歷史數(shù)據(jù)中挖掘其隱藏的規(guī)律,并做出分類或回歸預測。機器學習常見算法及優(yōu)缺點見表2〔29-33〕。
由表2可知,機器學習能夠彌補傳統(tǒng)的數(shù)學模型預測精度低、實際應用效果差等缺點〔29-33〕。目前機器學習已被運用到MBR膜污染的研究中,不少學者使用隨機森林、SVM和多元回歸等來建立與膜污染相關的預測模型。隨機森林是一種以決策樹為基學習器的集成算法,李威威等〔31〕采用隨機森林算法預測膜通量,通過模型計算得到的預測值與真實值的平均誤差僅3.98%。SVM具有的核函數(shù)可以解決非線性問題,梁楷〔32〕基于SVM建立的膜污染預測模型有效地預測了膜通量,平均誤差僅為2.63%。多元回歸能選取自變量的最優(yōu)組合共同預測因變量,Zhan WANG等〔33〕通過多元回歸建立了化學清洗模型,通過模型預測通量恢復率,對減緩膜污染起到了指導性作用。盡管以上機器學習算法能夠在膜污染預測方面獲得較高的預測精度,但是仍然存在一定的局限性,例如,雖然隨機森林對數(shù)據(jù)集的適應能力很強并具有較快的運算速度,但其往往忽略數(shù)據(jù)集之間的相關性,導致預測精度下降。
鑒于膜污染過程的復雜性和非線性,簡單的機器學習只能粗略表示變量之間的關系,無法取得較高的預測精度。近年來,由于ANN能夠通過學習非線性的復雜關系來構建數(shù)學模型,并且具有較強的泛化能力,對未知數(shù)據(jù)具有較好的預測效果,因此,部分學者逐漸將其應用于膜污染的預測。對Web of Science上2006年至2020年運用ANN算法研究膜污染的文獻數(shù)量進行統(tǒng)計,結果見圖2。
由圖2可知,從2016年開始,關于ANN在膜污染方面研究的文獻數(shù)量迅速增加,可見ANN已經(jīng)成為研究膜污染預測及控制的重要工具。
2.3 人工神經(jīng)網(wǎng)絡算法
ANN是一種模仿動物神經(jīng)網(wǎng)絡行為特征進行分布式并行信息處理的算法。其簡單拓撲圖見圖3。
如圖3所示,ANN信息處理功能的實現(xiàn)主要依靠神經(jīng)節(jié)點的輸入輸出、神經(jīng)元的閾值及連接權值大小的調整。ANN的預測性能可以通過均方根誤差(Root mean square error,RMSE)、決定系數(shù)R2、相對誤差Error等參數(shù)來評估,其計算分別見公式(1)~(3)。
公式(1)~(3)中,yt(i)、y(i)yt(i)、y(i)分別表示第i個預測和輸出值,y?y?表示所有n個數(shù)據(jù)所預測的平均值。RMSE被用來衡量模型預測值與真實值的偏離程度,其值越接近于0則表示預測值越接近真實值,決定系數(shù)R2越接近于1則表示模型的擬合效果越好。
人工神經(jīng)網(wǎng)絡在MBR的應用中具有諸多功能,其中一種功能是對MBR中水質進行預測。例如,Yuhang CAI等〔34〕運用小波神經(jīng)網(wǎng)絡(Wavelet neural networks,WNN)對船舶廢水COD與氨氮去除率進行模擬,其R2分別為0.999與0.997,可為反應器的運行與調控提供良好的參考。此外,A. R. PENDASHTEH等〔35〕成功構建了一種處理含油高鹽廢水的水質預測模型,采用該模型對水質進行預測,結果表明,廢水中COD、總有機碳(Total organic carbon,TOC)和油脂的預測值與真實值較為接近,R2達到0.982。
ANN預測模型的另一個功能是預測膜污染并運用敏感性分析來識別影響膜污染的關鍵因素。例如A. R. ALKMIM等〔36〕運用多層感知器神經(jīng)網(wǎng)絡(Mutilayer perception neural networks,MLPNN)對膜透水率進行預測,R2可以達到0.964,且計算得出混合液揮發(fā)性懸浮固體濃度(Mixed liquid volatile suspended solids,MLVSS)對膜透水率的變化貢獻最大。H. HAZRATI等〔37〕利用反向傳播神經(jīng)網(wǎng)絡(Back propagation neural networks,BPNN)模型對TMP進行預測,其R2=0.999,且發(fā)現(xiàn)MLSS、HRT和運行時間3個變量均對TMP具有較大的影響。
2.4 人工神經(jīng)網(wǎng)絡算法的分類及在膜污染中的應用
對圖2所統(tǒng)計的運用ANN算法研究膜污染的文獻進行分類并統(tǒng)計,結果見圖4。
圖4(a)根據(jù)不同用法將ANN算法劃分為簡單人工神經(jīng)網(wǎng)絡、結合優(yōu)化算法的神經(jīng)網(wǎng)絡和深度學習神經(jīng)網(wǎng)絡(Deep learning neural networks,DLNN)3類。圖4(b)展示了不同神經(jīng)網(wǎng)絡文獻占比。由圖4(b)可知,在統(tǒng)計的82篇文獻中,82.93%的研究采用簡單神經(jīng)網(wǎng)絡構建輸入變量與目標參數(shù)的模型,另有13.41%的研究采用了結合優(yōu)化算法的神經(jīng)網(wǎng)絡,而基于深度學習神經(jīng)網(wǎng)絡的研究所占比例較小,不到5%。
筆者匯總了2016—2020年在MBR中運用不同人工神經(jīng)網(wǎng)絡算法模擬膜污染的部分研究〔36-43〕,結果見表3。
目前在MBR膜污染預測中常用的簡單人工神經(jīng)網(wǎng)絡主要有MLPNN、BPNN和徑向基函數(shù)神經(jīng)網(wǎng)絡(Radical basis function neural networks,RBFNN)等。這些簡單神經(jīng)網(wǎng)絡均包括輸入層、隱藏層、輸出層,但是又各具特點。MLPNN的不同層之間采用全連接的方式傳遞結果;BPNN的輸出結構采用前向傳播方式,誤差采用反向傳播方式進行;RBFNN則采用徑向基函數(shù)作為激活函數(shù),它的輸出是輸入的徑向基函數(shù)和神經(jīng)元參數(shù)的線性組合。大量研究證明基于簡單ANN的預測模型具有較高的預測精度,例如F. SCHMITT等〔39〕在AO-MBR中利用MLPNN預測TMP,并構建進水水質(總氮、總磷、硝酸鹽)與TMP的模型關系,其R2為0.850。盡管簡單人工神經(jīng)網(wǎng)絡在膜污染預測方面具有較高的精度,但是仍存在擬合時間長、參數(shù)眾多且無法解決某些最優(yōu)化問題等缺點。
在簡單神經(jīng)網(wǎng)絡基礎上結合優(yōu)化算法,能夠通過改善訓練方式來最小/最大化損失函數(shù),具有加快神經(jīng)網(wǎng)絡訓練速度、快速尋找參數(shù)最優(yōu)值以及提高模型預測精度等優(yōu)點。應用于膜污染預測的常見優(yōu)化算法包括遺傳算法(Genetic algorithm,GA)和粒子群算法(Particle swarm optimization,PSO)等。其中,GA是基于生物體進化規(guī)律模型化問題的求解過程,具有優(yōu)越的優(yōu)化性能,被廣泛運用于機器學習和信號處理等領域〔44〕。S. A. MIRBAGHERI等〔45〕采用MLPNN預測TMP及膜透水率,并用GA算法對權值進行優(yōu)化,結果證實優(yōu)化后的模型具有更高的預測精度。PSO則是一種基于智能體的仿生優(yōu)化算法,在求解全局最優(yōu)解方面具有較大的優(yōu)勢,可以完成神經(jīng)網(wǎng)絡連接權值的訓練、結構設計和特征選擇等。劉志峰等〔46〕研究了一種PSO-BPNN,用粒子群算法代替?zhèn)鹘y(tǒng)的梯度下降算法,結果表明優(yōu)化后的模型具有更高的預測準確度,平均誤差從2.35%下降至0.83%。但是,結合優(yōu)化算法模型的建立與參數(shù)優(yōu)化過程需要耗費大量的時間,限制了其的廣泛應用。
此外,簡單ANN和結合優(yōu)化算法的ANN的預測性能高度依賴于樣本量,并且在訓練過程中往往會陷入局部最優(yōu)狀態(tài),從而導致模型的預測穩(wěn)定性較差。近年來,DLNN由于能夠有效彌補簡單ANN和結合優(yōu)化算法ANN的不足,并挖掘數(shù)據(jù)的深度信息而被廣泛研究,其主要包括深度置信網(wǎng)絡(Deep belief network,DBN)、卷積神經(jīng)網(wǎng)絡(Convolutional neural networks,CNN)、堆疊式自動編碼器(Stacked auto-encoders,SAE)網(wǎng)絡等。通常,DLNN是一種可以有效而靈活地表達高度變化的非線性的算法,具有強大的學習能力和非線性映射能力〔47〕。Honggui HAN等〔43〕開發(fā)了一種基于自組織深度置信網(wǎng)絡(Self-organizing deep belief network,SDBN)的膜透水率的預測方法,這種方法可以通過調整模型結構及參數(shù)提高模型預測精度,與簡單ANN相比,該模型具有更高的精度(RMSE為0.872)。在一些情況下,深度神經(jīng)網(wǎng)絡的預測效果可能比結合優(yōu)化算法的ANN更佳。Shuai SHI等〔48〕基于堆疊降噪自動編碼器(Stacked denoising auto-encoders,SDAE)深度學習神經(jīng)網(wǎng)絡建立了MBR的性能預測模型,結果發(fā)現(xiàn)與GA-BPNN模型相比,其具有更高的R2及更低的均方誤差(Mean square error,MSE)。盡管深度學習神經(jīng)網(wǎng)絡具有更高的預測精度,但是目前使用深度神經(jīng)網(wǎng)絡在MBR中進行建模的研究相對較少,其原因可能是一方面深度學習神經(jīng)網(wǎng)絡的復雜性較高,模型構建的時間遠超簡單ANN,另一方面使用簡單ANN已經(jīng)可以滿足大多數(shù)的研究任務。
綜上所述,目前在MBR膜污染預測模型中,簡單神經(jīng)網(wǎng)絡因高預測精度與高效性,在短時間內仍然是研究人員運用的主流工具。但是,隨著優(yōu)化算法的運用以及深度神經(jīng)網(wǎng)絡的開發(fā),結合優(yōu)化算法的ANN與深度學習ANN在面對更復雜環(huán)境下更具優(yōu)勢,有望替代簡單神經(jīng)網(wǎng)絡成為未來研究膜污染預測模型的主要工具。
2.5 ANN在中試MBR膜污染預測中的應用
雖然研究已經(jīng)證實ANN在MBR膜污染預測上具有較高的性能,但是由于技術設備規(guī)模與廢水特性的差異,實驗室小試規(guī)模反應器的操作參數(shù)往往與實際的大規(guī)模反應器有明顯的區(qū)別,因此,推動ANN在中試規(guī)模MBR膜污染中的預測研究意義重大。Y. J. CHOI等〔49〕收集了中試規(guī)模的浸沒式MBR的長期運行數(shù)據(jù),并構建了膜化學清洗后的通量、膜過濾時間及進水水質與膜透水率間的ANN模型,該模型R2可達0.950,實現(xiàn)了在中試規(guī)模下對MBR膜污染的精準預測。盡管如此,目前相關研究仍大多停留于小試階段,在針對實際廢水的中試MBR以及污水處理廠中應用依然較少。因此亟需根據(jù)中試及實際污水處理廠長期運行的數(shù)據(jù)建立ANN膜污染預測模型,從而更加精準地預測實際污水處理中MBR的膜污染狀況。
3 結論與展望
目前,膜污染仍然是阻礙MBR廣泛應用的瓶頸性問題,近年來,ANN模型因變量簡單、預測精度高等優(yōu)點被用于MBR膜污染的預測。但是研究表明,ANN模型用于MBR膜污染預測研究仍存在以下缺陷,是未來研究的重要方向:
(1)ANN本質上屬于“黑箱”模型,目前由于神經(jīng)網(wǎng)絡結構的特殊性難以對中間過程進行解釋。因此,未來的研究可以側重于通過解析神經(jīng)網(wǎng)絡的復雜結構來厘清影響因子對膜污染的具體作用。
(2)ANN模型存在權值多、建模過程長等缺陷。因此未來膜污染預測模型的發(fā)展趨勢是優(yōu)先使用更多優(yōu)化的線性和非線性數(shù)據(jù)分析方法對數(shù)據(jù)進行降維或特征提取,從而減少數(shù)據(jù)的復雜程度,進而提高模型預測的精度并減少建模時間。
(3)目前ANN模型應用于中試和工業(yè)化規(guī)模的MBR膜污染預測較少,亟需基于長期實際運行的數(shù)據(jù)建立ANN膜污染預測模型,構建完備的預測體系,為調整污水處理廠運行操作條件提供技術支持,進而提高其運行效率、減緩膜污染并降低污水處理成本。