2025年,隨著電力系統行業不斷發展,用電數據蘊含著豐富的信息,不僅反映了電力用戶負荷需求,還與現代社會生產生活緊密相連。從宏觀、中觀到微觀層面,用電數據在負荷預測、經濟分析、電網運行等方面都具有重要意義。然而,中觀層面的行業用電數據所蘊含的區域主導產業、產業鏈上下游結構等信息尚未得到充分挖掘。為了更準確地描述行業用電量間的關聯關係,挖掘其中的有效信息價值,有必要提出一種針對中觀行業用電數據分析的電力系統多元時間序列因果性定量分析方法。
《2025-2030年中國電力系統行業重點企業發展分析及投資前景可行性評估報告》電能作為現代社會主要能源形式,其消費數據與人類生產生活緊密相連。在工業領域,電能以生產資料形式直接參與生產活動各個環節,沿著產業鏈條流入市場。分析用電量與其他因素間的關聯關係,有助於認識人類活動其他要素的變化規律,為經濟社會發展提供指導。電力系統領域存在大量關於用電量數據分析的研究,可分為宏觀分析、個體分析、中觀分析三大類。宏觀分析關注宏觀層面所有電力用戶用電總量的變化趨勢,個體分析聚焦單個電力用戶的用電數據,而中觀分析層面的行業用電量數據同樣蘊藏著豐富的信息價值,但目前尚未得到充分挖掘。與相關性相比,因果性能夠明確關聯關係的方向,具有更強的物理意義,能夠辨識出不由因果關係產生的「偽相關性」,對關聯關係的描述更加準確,在行業用電數據分析問題上具有更好的應用價值。
電力系統行業數據分析提到為了更準確地描述行業用電量間的關聯關係,提出一種基於條件信息熵的電力系統多元時間序列數據因果性定量分析方法。因果性本質上是一種描述事物間關聯關係的統計學概念,定義為某一隨機變量對另一隨機變量變化過程的貢獻程度。與相關性相比,因果性具有明確的方向性,關係結構更為多樣。時間序列因果分析存在兩條公認假設——時序優先性假設與時序一致性假設。多元時間序列變量間的因果關係可用因果圖進行表示,不同變量在因果圖中對應不同節點,因果圖中三種因果結構類型可通過節點拓撲關係直觀反映。基於約束的因果分析方法通過馬爾可夫性質將因果圖與機率分布聯繫在一起,並基於統計學上的條件獨立性定義了變量間的因果性。檢驗條件獨立性本質上是檢驗隨機變量所含信息與其他變量的重合度,從而確定信息的流動路徑。在不滿足「因果充分性」的前提下,基於約束的因果分析方法中提出了基於最大祖先圖的 FCI 類算法,適用於問題不滿足「因果充分性」的情況。
為了在具體應用場景中檢驗因果分析方法的正確性,同時更全面地對分行業用電量數據因果性所蘊含的信息進行分析,提出一種適用於電力系統多元時序數據信息價值分析的成本 - 效用模型。該模型從信息成本角度與應用效益角度考慮電力系統多元時序數據的信息價值。在預測問題中,信息成本主要體現為歷史數據的存儲成本,而應用效益則體現在預測精度的提升上。通過預測模型所輸入的關鍵關聯因素數量與模型預測精度兩個指標,建立面向預測問題的電力系統多元時序數據成本 - 效用模型。該模型能夠從成本、效益角度綜合評價數據的信息價值,方便、直觀地基於不同原則選取綜合價值最高的關聯因素進行預測。
提出一種基於條件信息熵的電力系統多元時序數據因果性定量分析方法,並將其用於多行業用電量因果關係分析問題中。信息熵是資訊理論的核心概念,用以量化隨機變量的不確定性。在多元變量情況下,信息熵概念可擴充為聯合信息熵、條件信息熵。條件信息熵之差與條件獨立性檢驗的結果存在一致性,可作為因果性的一種定量描述。結合基於約束的因果發現方法的思路,提出一種適用於基於約束的因果發現方法的因果性定量描述快速計算方法。通過算例分析,基於某地 2017 年 1 月至 2023 年 7 月實際行業用電數據,對比了所提方法與相關性方法在月度用電量預測中的應用效果,並基於數據成本 - 效用模型驗證了其有效性。
以中國某地區的實際數據開展算例分析,數據時間跨度為 2017 年 1 月至 2023 年 7 月,共 79 個月,數據顆粒度為 1 月。數據集包括全社會、一 / 二 / 三產業、居民生活及各子行業的月度用電量。在開展因果分析前,對數據進行標準化處理,並對非平穩序列採用差分方法處理為平穩序列。基於工業領域內各行業用電量指標,對工業產業的上下游發展邏輯開展算例分析,採用改進後的 tsFCI 算法對變量間的瞬時與非瞬時因果關係進行辨識,得到摘要因果圖與窗口因果圖。通過對比「工業」、「化學」、「煤炭」、「油氣」四者的時序曲線,驗證了定性分析結果的合理性。進一步採用基於條件信息熵的因果性定量描述方法對不同行業用電量間的因果關係進行定量分析,計算了「油氣」對「煤炭」、「化學」對「工業」的因果貢獻度指標,結果表明因果分析能夠更精準地辨識變量關聯關系所提供的具有信息價值的關聯信息,在數據成本 - 效用模型中的綜合表現更優。
綜上所述,本文提出了一種基於條件信息熵的電力系統多元時序數據因果性定量分析方法,通過理論推導建立了時序變量互因果性與自因果性的定量表達形式,並在此基礎上通過基於約束的因果發現思路實現條件互信息的快速計算,最終分析得到行業用電量數據間的因果關係網絡與因果貢獻度指標。基於實際數據的算例分析表明,該方法能夠準確地反映出變量間因果關係的強弱,並在實際應用中以數據效益的形式體現,為深入開發電網數據資產,支撐政府、國家宏觀決策,輔助行業、企業制定發展戰略提供了有力支持。