摘要:為解決現有公共建筑能耗預測中因數據量少、樣本維度高導致的精度低、誤差大問題,本文提出一種基于多元線性回歸(Multiple linear regression,MLR)與遺傳算法(Genetic algorithm,G A)優化小波神經網絡(Wavelet neural network,WNN)的建筑能耗預測模型。利用Pearson相關系數分析方法與多元線性回歸對歷史數據進行預處理,選取相關性強的因素用于GA-WNN模型的訓練與測試,構成MLR-GA-WNN建筑能耗預測模型,該模型精度達到了 96.4%。仿真結果表明,文中提出的方法不但預測精度優于WNN、GA-WNN、GA-BP與GA-SVM模型,而且仿真運行時長、誤差也均小于上述四種模型,驗證了提出模型對于公共建筑能耗預測的可行性。
葉永雪; 馬鴻雁; 李晟延, 計算機仿真 發表時間:2021-09-15
關鍵詞:數據處理;多元線性回歸;遺傳算法;小波神經網絡;能耗預測
1 引言
隨著生活質量的不斷提高,人們對公共建筑內部環境的舒適度要求也不斷升高,導致城市中公共建筑的能耗占比呈一種逐年上升的趨勢。公共建筑單位面積能耗遠超農村建筑單位面積能耗與城鎮建筑單位面積能耗,其能耗約為建筑總能耗的 39% [1]。因此,怎樣合理降低公共建筑能耗問題成為了研究里的重中之重。通過采集公共建筑能耗數據及其他因素后,建立相應的能耗預測模型對其進行預測,可以為公共建筑實施能源管理與分配提供有效的依據。
目前,建筑能耗預測模型主要分為兩類,一類是基于熱力學計算的物理模型,另一類為基于機器學習的數據模型[2]?,F有數據較為充足的情況下,多采用基于機器學習數據模型對建筑能耗進行預測。
申思等[3]利用改進熵權法與單一神經網絡模型進行對比,證明了提出方法的有效性與可行性,但沒有與優化模型如 GA-BP、GA-WNN 等進行對比,進一步驗證提出方法的優勢。肖冉等[4]將能耗數據按季節性區分,利用網格搜索優化支持向量機模型對辦公建筑進行逐時能耗預測;田亞清[5]利用遺傳算法的全局優化搜索能力對小波神經網絡進行優化用于建筑能耗的預測,但對于應用的數據樣本沒有進行預處理。
現有研究中主要存在以下幾個問題:以小波神經網絡為基礎,將其擬合程度高、收斂能力強等優勢應用于其他領域[6-9]較多,而應用到公共建筑能耗預測研究領域較少;現有的建筑物能耗預測研究中[10],需要應用大量數據對模型進行訓練,才能獲得較好的預測效果,若數據量較少[11],則難以保證預測精度;現有研究對于應用的數據樣本沒有進行處理,造成了網絡模型輸入樣本維度高、仿真運行時間較長等問題。
對此,本文先利用 Pearson 相關系數分析方法與多元線性回歸對現有的逐日能耗數據樣本進行處理后;再利用遺傳算法優化小波神經網絡,構成 MLR-GA-WNN 模型對公共建筑能耗問題進行研究。
2 數據收集與處理
2.1 數據收集
實際能夠影響建筑物能耗的因素如圖 1 所示。
本文以北京市某高校圖書館為研究對象的原因有以下幾點:
(1)學校為了滿足學生們的學習需求,延長了圖書館的開放時間,造成高校圖書館能耗的不斷增加。
(2)圖書館內,溫度過高或過低都會導致部分同學頻繁開啟門窗,引起圖書館的電能消耗。
(3)高校圖書館在建立時過多的考慮了天氣狀況的影響,造成電氣設備預留量,空調設備會出現“大材小用”現象。
由于,高校圖書館的節能潛力較大,對該建筑能耗進行預測具有研究意義。
通過實際調研,獲得的數據樣本示例如表 1 所示。
2.2 數據預處理
2.2.1 Pearson 相關系數分析方法
常用的相關分析方法如圖 2 所示,其中 Spearman 相關系數與 Kendall 相關系數分析方法對于數據中存在著的數據錯誤值與極端值的反應不敏感,常用于反應變量間的單調關系,無法像 Pearson 相關系數分析方法去評估變量之間的線性關系。最終,選擇 Pearson 相關系數分析方法對現有數據進行分析。相關系數表示兩個變量之間關系[12],定義為:
式中,E 表示均值,D 表示方差,其中 D X D Y ( ) ( ) 表示標準差。Cov(X,Y)表示變量 X 與 Y 之間的協方差,相關系數 PXY 為兩變量之間的協方差與兩變量的標準差的商,取值范圍為 [-1,1],其絕對值越大,表示相關性越強。
利用 SPSS22.0 軟件可以得到各變量間 Pearson 相關系數計算結果,結果如表 2 所示。
從表 2 中可以看出,因為逐日能耗與相對濕度的相關系數值為-0.014,且該 Sig 值為 0.325,表明相對濕度與建筑物能耗情況呈弱相關,所以該氣象特征值對于能耗預測的結果影響不大。其他氣象因素的 Sig 值均小于 0.05,說明剩余因素參與建模均具有統計學意義,且與總耗電量具有顯著相關性關系。
綜上,去除相對濕度這一因素,不作為訓練集參與能耗的預測。在原有的五維數據基礎上,利用 Pearson 相關系數分析方法,不僅可以降低數據樣本的維度,還可以減小各個因素間的相互影響。
2.2.2 多元線性回歸
在減少各因素間的相互影響后,對剩余因素利進行多元線性回歸擬合[13],軟件分析結果如表 3 所示。
通過分析表 3,可以得到的多元線性回歸預測模型為: 1 2 3 9089.30 33.53 31.84 503.47 Y Z Z X X X ? ?? ? ? (3) 式中:Y 為逐日總耗電量,單位 kWh;X1 為最高溫度,單位℃;X2為最低溫度,單位℃; X3 為日照時間,單位 h
通過 Pearson 相關系數分析方法與多元線性回歸的篩選,平均濕度與平均溫度為被排除變量,未被加入到預測模型中。將數據代入后發現,多元線性回歸預測模型的預測效果不佳。但得到的公式(3)表明:三維數據的天氣因素足以代替原有數據作為后續機器學習方法的訓練集與預測集,對公共建筑物進行能耗預測。
3. 遺傳算法優化小波神經網絡模型
3.1 遺傳算法
遺傳算法是基于自然界生物遺傳和進化特征而提出的方法,可以在復雜的計算中找到最優的參數賦值。從本質上來說,遺傳算法屬隨機算法中的一種,首先從具有代表性問題中存在解的集合中的一個種群開始,按照語言設定的進化方式和配比的適應度函數,進行不斷的遺傳進化和變異交叉,從參數的全局范圍內找到最佳的參數。本文適應度函數為: 1 1 ?? F E (4) 式中,E 為 WNN 的誤差函數。遺傳算法優化小波神經網絡,可以幫助神經網絡在初值上進行選取,并提高尋找最優初值的速度和精度[14]。
3.2 小波神經網絡
小波神經網絡本質上是利用小波基函數代替原有人工神經網絡中的傳遞函數。隱含層小波神經元采用 Morlet 小波函數,其表達式為: 2 ?( ) cos(1.75 )exp( 0.5 ) x x x ? ? (5) 小波神經網絡不僅結合了 BP 神經網絡自適應學習特點,還擁有著小波變換良好的時頻域特點。因此,小波神經網絡具有學習能力強,較快的收斂性能力,以及較高精度的預測能力。
小波神經網絡與 BP 神經網絡結構類似,具備著輸入層,隱藏層,輸出層共計三部分。各層之間,通過權值參數來影響各神經元的輸出,小波神經網絡的物理層結構如圖 3 所示。
4. 公共建筑能耗預測
4.1 模型介紹
圖4 為基于 MLR-GA-WNN的公共建筑能耗預測模型的流程圖,該流程圖主要由以下幾部分組成。
(1)數據處理:將獲取的數據先進行相關性分析判斷,排除與能耗數據相關性不強的因素后,對剩余影響因素進行多元線性回歸擬合后,將數據分為訓練集與測試集。
(2)遺傳算法優化:將訓練集與測試集加入到遺傳算法進行訓練,對初始值進行編碼,設定適應度函數后,進行選擇、交叉變異等操作,在選取適合的網絡權值和伸縮平移尺度值后,替換小波神經網絡中的原有值。
(3)小波神經網絡的預測輸出:在構建小波神經網絡模型時,需要注意小波函數的選取以及偏導數。在獲取最佳的權值與伸縮平移尺度值后,通過對網絡模型的訓練過程中的最大迭代次數和訓練網絡的收斂誤差,來判斷訓練過程是否需要結束,結束后會得到相應的仿真結果。
4.2 能耗模型評價指標
(1) 均 方 根 誤 差 (Root Mean Squared Error ,RMSE)
均方根誤差可以很好的反映出預測的精密度,其值越小越能反應預測數據的精確性。其公式為: n 2 i 1 1 ( ) ? RMSE f Y Y ? ? ? i i n (9)
(2)平均預測精確度(AC)
用AC來表示平均預測精確度,預測精度是評價預測模型擬合的好壞程度的標準之一,在本文中由神經網絡建筑能耗預測模型所產生的能耗預測值與實際能耗值擬合程度的優劣。平均預測精確度是衡量該方法是否適用于預測對象的重要指標。
式中:Yi為建筑能耗的實際值; Y 為網絡模型的預測值。
(3) 仿真運行時間
用T來表示仿真運行時長,輸入數據量的大小會直接影響仿真時間,不同算法在預測建筑物能耗時,結果有所不同,統計各模型的仿真運行時長。
綜上,在預測能耗建筑物能耗時應選取平均預測精確度高,誤差小,運行時間較短的模型。
5. 模型參數設置及其結果分析
5.1 模型參數設置
對 WNN、GA-WNN、GA-BP、GA-SVM 與 MLR-GA-WNN 等模型參數進行配置。
WNN、GA-WNN、GA-BP 等參數設置如下:輸入節點個數為 5、輸出節點個數為 1、隱含層節點個數為 6;其中,WNN 與 GA-WNN 采用的小波函數為公式(3);迭代次數為 1000,學習概率為 0.01。
遺傳算法參數如下:個體數目為 80,代溝為 0.9,最大遺傳代數為 100。GA-SVM 神經網絡參數設置如下:核函數參數 g 選取范圍為 [0,1000]、懲罰系數 c 選取范圍為[0,100]。
MLR-GA-WNN 的 輸 入 節 點 個 數 因 Pearson 相關系數分析法與多元線性回歸處理后為 3,輸出節點、隱含層節點、遺傳算法優化等參數設置同其他模型設置參數。
5.2 公共建筑能耗預測結果
MLR-GA-WNN 公共建筑能耗預測結果如圖 5 所示。
圖 5 中,圓圈字符代表公共建筑物當日實際能耗,星號字符為基于 MLR-GA-WNN 能耗預測模型的預測曲線。二者之間的預測誤差,呈百分比形式表示。如圖 6 所示。
在圖 6 中,星號字符代表著四月中下旬的預 測 誤 差 百 分 比 , 可 以 看 出 ,利用 MLR-GA-WNN 模型預測的公共建筑物能耗預測誤差均在 10%左右,說明預測的精度在 90% 以上。
5.3 仿真結果分析
通過1-4月所獲取的數據,按照8:2的比例分為訓練集以及測試集。從WNN、GA-WNN、 GA-BP、GA-SVM、MLR-GA-WNN預測模型隨機抽取四月中下旬的部分預測結果如表4所示。
通過分析表4發現,不同的預測方法在預測同一天的建筑能耗時,預測結果不同。如較早出現的WNN神經網絡模型,對于特定的時間或場合,其預測效果較好,但總體預測效果不佳。因此,利用提出的能耗模型評價標準對各模型進行計算,可以得到不同預測模型評價指標,如表5所示。
分析表 5 可知:
(1)單一模型 WNN 神經網絡與優化模型 GA-WNN 相比,預測精度相差 2%,用時縮短 0.6s。證明,利用遺傳算法對單一預測模型 WNN 進行優化,可以提高預測精度,減小均方根誤差,但遺傳算法尋找最優解的過程會增加運行時長。
(2) 優 化 模 型 GA-WNN 、 GA-BP 與 GA-SVM 三種模型中遺傳算法的參數設置相同;其中,GA-WNN 的預測精度最低為 94.1%,與另外兩種模型預測精度相差不多,仿真運行時長最短為 3.5s。說明,GA-WNN 在調用小波函數時可以從數據之間尋找規律,獲得較好的預測精度并減少相應的仿真運行時長。
(3)組合優化模型 MLR-GA-WNN 整體預測平均精確度約為 96.4%,仿真運行時長為 2.5s,與 GA-WNN、GA-BP、GA-SVM 相比預測精度提高約 2%左右,仿真運行時長也得到了縮短;而與普通的WNN相比MLR-GA-WNN 整體預測的精度提高了約 4.3%,仿真運行時長縮短 0.5s。
結果表明,組合優化模型與優化模型相比,不僅可以提高預測精確度,還可以有效的減少仿真時常以及均方根誤差值,避免了神經網絡易陷入局部最優的問題。
6 結論
本文提出了基于多元線性回歸與遺傳算法優化小波神經網絡的公共建筑能耗預測模型,通過仿真研究,可以得出以下幾點結論:
(1)遺傳算法優化后的模型與普通單一模型相比,可以提高模型的預測精度,但在尋找最優解的過程中可能會增加仿真運行時長。
(2)通過運用 Pearson 相關系數分析方法與多元線性回歸對天氣因素數據進行降維處理,不但減小了變量間影響因素的相互影響,而且可以提高數據質量,減少仿真運行時長。
(3) 將 經 過 降 維 處 理 后 的 數 據 作 為 GA-WNN 神經網絡模型的訓練集與測試集,構成 MLR-GA-WNN 模型,將其公共建筑能耗預測結果 與 優 化 模 型 GA-WNN 、 GA-BP 、 GA-SVM 預測結果進行對比。
仿真結果表明,MLR-GA-WNN 模型與其他模型相比,不但預測效果更加準確,可靠程度高,而且仿真運行時長較短,均方差更小。因此,本文提出的網絡模型可以有效的對公共建筑能耗進行預測。
論文指導 >
SCI期刊推薦 >
論文常見問題 >
SCI常見問題 >