要:為了提高短期負荷預測精度,提出一種基于改進灰色關聯分析(IGRA)和混沌粒子群算法(CMPSO)優化最小二乘支持向量機(LSSVM)參數的短期負荷預測的方法。該預測模型首先在傳統的灰色關聯分析方法基礎上做出改進,定義了綜合灰色關聯度從而選取相似日;其次,針對標準粒子群算法求解 LSSVM 參數優化問題時存在的易陷入局部最優的缺陷,引入混沌理論對粒子群算法加以改造,建立 CMPSO?LSSVM 預測模型;最后將該方法應用于某市 2018年夏季短期負荷預測,仿真結果表明該方法不僅可以避免算法陷入局部極值,還能提高預測的精準度。
本文源自解海翔; 陳芳芳; 劉易; 蓋佳郇; 徐天奇, 現代電子技術 發表時間:2021-04-14《現代電子技術》雜志,于1977年經國家新聞出版總署批準正式創刊,CN:61-1224/TN,本刊在國內外有廣泛的覆蓋面,題材新穎,信息量大、時效性強的特點,其中主要欄目有:電子技術及應用、能源與環境科學、智能交通與導航等。
關鍵詞:關聯分析;相似日選取;特征提取;模型建立;算法改造;短期負荷預測
實現精準的負荷預測是智能電網建設的重要保障。隨著分布式電源和電動汽車普及帶來了大量充電樁的接入,傳統的電力系統負荷預測方法已難以對新型的負荷增長方式做出精準的預測與評估。目前,應用較多的現代預測方法主要有人工神經網絡法[1] 和支持向量機法[2] 等。其中,支持向量機類預測模型的泛化能力受懲罰因子、核函數及其參數等少數關鍵參數的影響,因此尋求這些參數的優化取值方法成為提高預測精度的關鍵。在啟發式算法優化 SVM 類模型參數的文獻中,較常用的有遺傳算法[3] 、粒子群算法[4] 、蝙蝠算法[5] 、蟻群算法[6] 等。然而,由于這些算法強調全局搜索而缺乏局部搜索能力,在實際運用中易陷入局部極小,無法保證尋找到模型關鍵參數的全局最優值。對此問題,文獻[7]利用模擬退火算法(SA)控制算法收斂性的特點對遺傳算法進行改造,在溫度較高時,SA 賦予算法較高的概率突跳,避免陷入早熟;在溫度較低時,SA 加強算法的局部搜索能力,最終以全 1 概率收斂到全局最優解。類似地,文獻[8?9]分別提出了蟻群算法與粒子群算法相結合的混合智能算法和基于混沌搜索理論改進的粒子群算法對 LSSVM 參數進行尋優,分別應用于短期風壓預測和電機工作狀態模式識別中,改善了算法陷入局部極小的情況,均取得了較好的實際效果。
本文提出一種基于改進灰色關聯分析選取相似日和混沌粒子群算法優化最小二乘支持向量機參數的短期負荷預測的方法。對某市 2018 年夏季負荷數據進行的仿真實驗證明了該方法的有效性。
1 改進灰色關聯分析
為了增強 LSSVM 模型的泛化能力和魯棒性,本文采取一種改進灰色關聯分析法針對歷史日特征進行提取和分析。傳統灰色關聯分析的基本思想是根據序列各數據之差的絕對值來判斷各因素之間發展趨勢的幾何相似程度,而忽略了數值接近程度[10] 。因此,本文提出一種基于綜合灰色關聯度的分析方法,融合了特征向量幾何相似性和的距離相近性,具體步驟如下:
1) 構 造 特 征 矩 陣 。 待 測 日 特 征 序 列 為 X0 = [ x0 ( 1 ), x0 ( 2 ),…, x0 ( m ) ] T ,樣本集中第 i 個歷史樣本日特征 序 列 為 Xi = [ xi ( 1 ), xi ( 2 ),…, xi ( n ) ] T 。 式 中 :i = 1, 2,…, n;m 為特征向量的維數;n為樣本個數。
2)計算差值關聯矩陣及其幾何關聯度。差值關聯矩陣定義為待測日特征向量與樣本集中所有特征向量各分量的差,如下所示: Δx0 i ( k ) = | x0 ( k ) - xi ( k ) | (1)式中:xi ( k )為樣本集中第 i個樣本的第 k個特征值;x0 ( k ) 表示待預測日的第k個特征值;k = 1, 2,…, m。計算待測日序列和樣本序列之間的幾何相似性灰色關聯度: γ1 ( x0 ( k ), xi ( k ) ) = 1 eΔx0 i ( k ) (2)
3)計算商值關聯矩陣及其距離關聯度。商值關聯矩陣定義為待測日特征向量與樣本集中所有特征向量各分量的商,如下所示: Δx0′ i ( k ) = xi ( k ) x0 ( k ) (3)計算待測日序列和樣本序列之間的距離相近性灰色關聯度: γ2 ( x0 ( k ), xi ( k ) ) = 1 e | 1 - Δx | 0′ i ( k ) (4)
4)計算綜合灰色關聯度。結合式(2)和式(4),定義綜合灰色關聯度公式為: γ0 i = 1 m∑k = 1 m γ1 ( x0 ( k ), xi ( k ) ) ⋅ γ2 ( x0 ( k ), xi ( k ) ) (5)
2 基于混沌粒子群優化的 LSSVM 模型
最小二乘支持向量機的泛化誤差受到其參數設置的影響。本節利用基于混沌理論改進的粒子群算法搜索 LSSVM 最優參數,建立 CMPSO?LSSVM 短期負荷預測模型。
2.1 標準粒子群算法
標準粒子群算法來源于對鳥群覓食行為的模擬。標準 PSO 隨機初始化的每一個粒子均為待求問題的一個潛在解。在迭代過程中,每個粒子的位置和速度通過跟蹤兩個適應度極值來更新:粒子本身在飛行中經歷過的最好位置,即粒子的個體極值 Pbest;整個群體所經歷過的最好位置,即粒子群的全局極值 Gbest[11] 。
假設目標搜索空間維數為 D,粒子數為 N,其中第 i 個粒子的位置為 xi k = ( xi1 k , xi2 k ,…, xiD k ),其飛行速度為 vi k = ( vi1 k ,vi2 k ,…,viD k )。在第 k 次迭代中,粒子按下式更新自己的位置和速度: { vid k + 1 = wvid k + c1 r1 ( Pbest - xid k ) + c2 r2 ( Gbest - xid k ) xid k + 1 = xid k + vid k + 1 i = 1, 2,…, m ; d = 1, 2,…,D fi =∑( yi ≠ y?i ) (6)式中:w 是粒子的慣性權重;c1 ,c2 是學習因子;r1 ,r2 是在 [ 0, 1 ]上的隨機數;yi 和 y?i 分別為真實值和模型預測值; fi 為適應度函數。
2.2 基于局部混沌搜索改進的粒子群算法
混沌搜索具有隨機性、遍歷性、敏感性等特點[12] 。本文將混沌搜索理論與粒子群尋優算法相結合,可以克服標準 PSO 算法在求解多變量優化問題時易陷入局部最優的缺點。本文采用 Logistic 映射產生混沌序列,對于陷入局部最優的粒子,通過迭代產生局部最優解的鄰域 點 對 粒 子 群 進 行 重 構 ,加 速 粒 子 跳 出 局 部 極 小 。 Logistic映射的表達式為:
zk + 1 = μzk ( 1 - zk ) (7)式中:μ 是混沌控制變量;zk 為混沌變量。當 μ = 4 且 z ∈ [ 0, 1 ] 時,系統被定義為完全混沌狀態。在該狀態下,通過式(7)把 zk引入到待優化變量中,通過控制 ηj將混沌運動的遍歷范圍擴展到優化變量的取值范圍: xj = x ′ j + ηjzk (8)
式中:ηj為可變常數;x ′ j 為當前迭代最優解。式(6)中的慣性權重 w 起到了平衡 PSO 的全局搜索能力和局部搜索能力的作用。若 w 取值過大就會使算法早熟;取值過小則會出現收斂速度慢的情況。本文采用的取值方法為: wk = wmax - ( wmax - wmin )·( k - 1 ) kmax (9)
式中:kmax 為算法設定迭代的最大次數;k 為當前迭代次數。與慣性權重類似,ηj 也應隨著迭代進行逐漸減小,本文按式(10)自適應變化: ηj = ε [ ( kmax - k + 1 ) kmax ] 2 ·x ′ j (10)式中 ε為混沌變量的搜索半徑,取 ε = 0.1。
2.3 最小二乘支持向量機
LSSVM 模型將二次優化問題轉化為求解線性方程組問題,彌補了標準 SVM 求解耗時較長的缺點,提升了運算效率和收斂速度[13] 。LSSVM 回歸方程可表示為: y = f ( x ) = wTφ ( x ) + b (11)
給定訓練集{ xi, yi } M i = 1 ,其中,M 表示訓練數據集的維數,xi為輸入變量,yi為輸出數據。非線性映射函數 φ 將輸入變量映射到高維特征空間中,將非線性問題轉換為一個高維空間內的線性問題。LSSVM 模型將此表示為一個等式約束優化: min w, b, ξ R ( w, ξ ) = 1 2 wTw + 1 2 C∑i = 1 M ξ 2 i s.t. yi = wTφ ( xi ) + b + ξi, i = 1, 2,…,M (12)式中:1 2 wTw 控制模型泛化能力;∑i = 1 M ξ 2 i 為訓練誤差;C 是懲罰因子,用于平衡模型泛化能力和模型的經驗風險。
采用拉格朗日法將式(12)轉化為無約束問題: L ( w, b, ξ, a ) = R ( w, ξ ) -∑i = 1 M αi ( wTφ ( xi ) + b + ξi - yi ) (13)式中 αi為拉格朗日乘子。根據 KKT條件: ì í î ï ï ï ïï ï ï ï ï ïï ï ∂L ∂w = 0 → w =∑i = 1 M αiφ ( xi ) ∂L ∂b = 0 → ∑i = 1 M αi = 0 ∂L ∂ξi = 0 → αi = Cξi, i = 1, 2,…,M ∂L ∂αi = 0 → wTφ ( xi ) + b + ξi - yi = 0, i = 1, 2,…,M (14)可表示為下述線性方程組的解: é ë ê ù û ú 0 1T v 1v K + C-1 I é ë ù û b α = é ë ê ù û ú 0 y (15)式中:y = [ y1 , y2 ,…, yM ] T ; 1v = [1, 1 ] T ; α = [ α1 , α2 ,…, αM ] T ; I為單位矩陣。最終,LSSVM 模型可以寫成: f ( x ) =∑i = 1 M αiK ( x, xi ) + b (16)式中 K為核函數,本文采用 RBF核函數: K ( x, y ) = e - x - y 2 ( 2σ ) 2 (17)
2.4 基于混沌粒子群優化的 LSSVM 模型
本文采用前述的混沌粒子群算法對 LSSVM 模型中的懲罰因子 C 和核參數 σ 進行尋優。首先,定義適應度函數為模型的均方根誤差,即:
fi = 1 n∑i = 1 n ( y?i - yi ) 2 (18) CMPSO?LSSVM 模型具體步驟如下:
1)設定 CMPSO?LSSVM 算法的初始化參數。其中,粒子初始位置和速度按式(20)進行初始化: xid 0 = U ( 0, 1 )·( xmax - xmin ) + xmin vid 0 = U ( 0, 1 )·( vmax - vmin ) + vmin (19)
式中 U ( 0, 1 )為在[ 0, 1 ]區間上服從均勻分布的隨機數。
2)確定粒子初始適應度以及當前 Gbest和 Pbest。
3)按式(6)和式(9)迭代更新粒子的位置、速度以及粒子慣性權重,生成新一代粒子群。
4)根據式(18)計算粒子適應度并和上次迭代產生的個體極值和全局極值比較,選擇更新 Gbest和 Pbest或保留上一輪迭代所得的極值。
5)選取 Gbest為待優化變量,在其附近引入混沌變量,按式(7)~式(8)和式(10)進行混沌搜索,定義新的 Gbest為通過混沌搜索找到的適應度最小值。
6)當循環次數達到設定的 kmax時,停止算法運行并輸出最全局最優解 Gbest,否則返回步驟 3)。
7)將得到的最優參數 C 和 σ 賦給 LSSVM 模型,進行負荷預測。
綜上所述,基于 CMPSO 優化 LSSVM 參數的模型流程如圖 1所示。
3 本文方法的短期電力負荷預測實例
本文實例采用 2018年某地級市夏季 96天的網供負荷歷史數據,在 Matlab R2016a 平臺上完成仿真實驗。訓練集從 2018 年 6 月 1 日—8 月 14 日共 75 天內選取,待預測日為 8月 15日。為了充分利用樣本信息,本文采取滾動訓練預測的方式,即用第 1 天到第 3 天的負荷預測第 4 天的負荷,然后采用第 2 天到第 4 天的負荷預測下一天的負荷,依次類推直至完成最終訓練,并比較算法收斂度和誤差大小。
3.1 建模步驟
本文在建模過程中考慮了氣象因素和日期類型對負荷的影響。氣象因素對負荷的影響主要體現在氣象因素變化和電力負荷值變化的相關性;同時,工作日和休息日(周末和節假日)之間也存在負荷量上的差距。綜上所述,選取日期類型、日最高氣溫、日最低氣溫、日平均氣溫、日降水總量和日平均相對濕度組成歷史日特征向量,按表 1所示的規則選取相似日粗集。
在 2018 年 6 月 1 日—8 月 14 日共 75 天的全天負荷數據中,依據表 1選取出 30天作為相似日粗集。由于各特征值量綱不同,將特征向量按式(20)歸一化并求取歷史日與待預測日特征向量之間的綜合灰色關聯度,選擇其值大于 0.9 的所有樣本組成相似日集,共計 22 天,部分選取結果如表 2所示。
將輸入的負荷數據按最大最小歸一化的方法映射到[ 0, 1 ]區間上,如式(21)所示。 L* t = Lt - Lmin Lmax - Lmin , t = 1, 2,…, 96 (21)
本 文 CMPSO ? LSSVM 算 法 的 初 始 輸 入 量 如 表 3 所示。
3.2 結果分析
基于本文提出的 IGRA?CMPSO?LSSVM 方法預測得到了其市 2018 年 8 月 15 日的負荷預測結果。隨著迭代進行 CMPSO?LSSVM 和 PSO?LSSVM 算法平均全局適應度變化情況如圖 2所示。
由圖2可知,CMPSO通過局部混沌搜索,有效避免了標準PSO算法在迭代尋優時陷入局部極小的問題。同時,除本文方法外,將 IGRA ?LSSVM(模型一)和 IGRA ?PSO ? LSSVM(模型二)兩種模型與本文方法進行了比較見圖3。本文選用均方根誤差 RMSE、平均百分比誤差 MAPE 和日最大預測誤差 ME 為誤差評價指標進行定量分析。三種誤差公式參考式(22)~式(24),誤差分析結果見表4。 RMSE = 1 n∑t = 1 n | y ( t ) - y?( t ) | 2 (22) MAPE = 1 n∑t = 1 n | ( y ) | ( t ) - y?( t ) y ( t ) × 100% (23)
ME = maxi | y ( t ) - y?( t ) | (24)
由圖 2 和表 4 可知,三種模型均能較為準確地預測負荷的變化。相比之下,本文方法比模型一和模型二在平均相對誤差上分別降低了 2.37% 和 0.78%,同時均方根誤差和最大誤差均有明顯降低,驗證了本文方法的有效性。為了進一步驗證本文方法的可推廣性,采用同樣的方法對該市 8 月 29 日和 8 月 30 日的負荷值進行性預測,仍然采用前述三種誤差評價指標,具體結果見表 5。
可以看出,在 8 月 29 日、8 月 30 日 2 天的預測中,本文方法在三種誤差對比上均明顯優于其他模型,這進一步證明了本文方法的先進性和可推廣性。
4 結 語
本文首先改進了傳統灰色關聯分析方法,并從歷史日中選取與滿足相似日粗集規則且綜合灰色關聯度大于 0.9 的相似日組成訓練集,減少了訓練樣本的數量和差異程度。隨后,引入混沌粒子群算法建立了 CMPSO? LSSVM 模型,解決了標準 PSO 優化時算法早熟的弊端。通過分別對比本文模型、LSSVM 模型和 PSO?LSSVM 模型預測誤差,證明了該方法可以有效提高短期負荷預測精度且具有一定的推廣價值,為短期負荷預測方法研究提供了新思路。
論文指導 >
SCI期刊推薦 >
論文常見問題 >
SCI常見問題 >