摘要:針對自動化系統在現場實際運行中的常見故障:通信網絡類故障、數據采集故障、誤報警故障和與其他廠家裝置不匹配故障進行了分析和歸納,從大量的現場數據中找出其規律性,分析了產生的原因(產品質量、不同廠家設備的接口通信、開放性等問題),提出了處理建議與改進措施。著重介紹了與變電站自動化系統密切相關幾類典型問題的解決方法,為快速查找和正確處理變電站自動化系統故障提供了指導方法。
隨著自動化技術、通信技術、計算機和網絡技術的飛速發展與應用普及,目前新建變電站大多是采用計算機自動化系統。自動化系統不但在現場生產與辦公等方面提高了生產運行部門的工作效率,使得電力生產更加數字化、自動化,同時也使得現場運行更加安全可靠,運行維護成本大大降低,效益顯著提高。并且在后期多變電站集控應用上,自動化系統的應用也是實現集控必需具備的基礎條件。隨著自動化變電站投入運行的時間逐漸增長,在現場實際工作中各類問題也慢慢出現,其中就有一些很有常見性的故障隱患。因此,針對自動化變電站大多運行時間不長、經驗較少的弱點,以下就自動化變電站常見的一些具有普遍代表性的問題進行分析探討。
1.自動化系統的結構
變電站自動化系統采用自動控制和計算機技術實現變電站二次系統的部分或全部功能[1]。為達到這一目的,滿足電網運行對變電站的要求,變電站自動化系統體系由“數據采集和控制”、“繼電保護”、“直流電源系統”三大塊構成變電站自動化系統的基礎。
變電站自動化系統目前有三類系統結構:分布式系統結構、集中式系統結構、分層分布式系統結構。
1.1分布式系統結構
分布式系統結構是按功能設計,如按保護和監控等功能劃分單元而分布實施,其最大特點是將變電站自動化系統的功能分散給多臺計算機來完成。其結構采用主從CPU協同工作方式,多CPU系統提高了處理并行多發事件的能力,解決了CPU運算處理的瓶頸問題。各功能模塊之間采用網絡技術或串行方式實現數據通信。分布式結構有助于系統擴展和維護,可靠性好,局部故障不影響系統其它模塊正常運行。該模式在安裝上有集中組屏和分層組屏兩種方式,較適合于中低壓變電站[2]。
1.2集中式系統結構
集中式系統結構按信息類型劃分功能。采用這類結構的系統其功能模塊與硬件無關,各功能模塊的連接通過模塊化軟件實現,信息是集中采集、處理和運算的。受計算機硬件水平的限制,該結構在早期自動化系統中應用較多。此類結構對監控主機的性能要求較高,且系統處理能力有限,開發手段少,系統在開放性、擴展性和可維護性等方面較差,抗干擾能力不強[3]。
1.3分層分布式系統結構
分層分布式系統結構采用“面向對象”設計[4],系統結構的特點是功能分散、管理集中。所謂面向對象,就是面向電氣一次回路設備或電氣間隔設備,間隔層中數據、采集、控制單元(I/O單元)和保護單元就地分散安裝在開關柜上或其他一次設備附近[5],相互間通過通信網絡相連,與監控主機通信。目前,此種系統結構在自動化系統中較為流行[6],主要原因是:
1)現在的智能設備[7]大多是按面向對象設計的,如專門的線路保護單元、主變保護單元、小電流接地選線,其在保護安裝接線中仍是面向對象的;
2)利用了現場總線的技術優勢,省去了大量二次接線,控制設備之間僅通過雙絞線或光纖連接,設計規范,設備布置整齊,調整擴建也很簡單,成本低,運行維護方便;
3)系統裝置及網絡冗余性強,不依賴于通信網和主機,主機或單臺智能設備損壞并不影響其它設備的正常工作,運行可靠性有保證[3]。
分層分布式系統結構代表了現代變電站自動化技術發展的趨勢,大幅度地減少了連接電纜,減少了電纜傳送信息的電磁干擾,且具有很高的可靠性,比較好的實現了部分故障不相互影響,也方便維護和擴展,擴展性與開放性較高,有利于工程設計及應用[8-9]。
2.常見故障及其處理
因自動化變電站需對站內一二次設備實現實時數據采集、通信、遙控、遙調等功能,還應考慮與不同廠家設備實現互操作性及未來擴容擴建等兼容擴展性[10],其穩定性依賴于微處理器與通信技術的可靠發展。自動化變電站內設備的參數采集、信號控制等都需要通過網絡傳輸,在穩定性上對網絡系統及傳輸設備的穩定可靠性依賴很大[11],一旦網絡傳輸出現問題,有可能導致數據出錯、丟失、失控等問題,嚴重的可能導致發生事故未及時察覺而進一步擴大事故,可以說網絡傳輸系統就是自動化變電站的神經傳輸系統,其重要性不言而喻。就廈門超高壓局的自動化變電站運行幾年來的 經驗總結,發現現場發生的缺陷有很大一部分是網絡通信的不穩定性造成的。以廈門超高壓局500kV漳州變電站為例,自2006年5月投產以來,在三年的時間里,有關自動化系統的缺陷共計49條,占缺陷總數的27.68%,其中Ⅰ類缺陷2次、Ⅱ類缺陷14次、Ⅲ類缺陷33次。最嚴重的情況是雙網絡冗余配置的自動化系統A網與B網同時中斷,導致測控數據采集丟失、設備失去遠程控制。
以下是常見的幾類自動化系統故障,并對發生原因進行分析和針對性處理。
2.1通信網絡類故障
2.1.1某保護小室內某單元保護裝置或測控裝置通信中斷
出現該類故障,其原因多在于保護裝置與自動化系統的通信出現問題,有可能是因為保護裝置通信接口模塊故障、通信接線松動。針對該類情況可以先查找保護裝置至保護管理機之間的接線是否牢固、完好,保護管理機通信指示燈是否正常,保護裝置面板顯示是否正常,是否出現通信模塊故障或是裝置故障的告警,而后相應的進行緊固接線、重啟裝置、更換相關裝置模塊等處理。
2.1.2某保護小室內所有保護裝置(非自動化系統廠家的保護裝置)通信中斷
自動化系統與其他廠家的保護裝置因為使用的通信規約不同,所以自動化系統采集保護信號需要經過保護管理機進行規約轉換,一臺保護管理機可以容納多臺保護裝置的信號傳輸,一旦小室內的保護管理機出現死機或是故障,往往導致所接的所有保護裝置信號無法正常傳輸,遙信信號無法更新,可能會錯失重要信號報文。出現該類問題,可以通過觀察保護管理機的通信指示燈是否正常來判斷,并且檢查其與交換機之間的接線是否松脫,而后相應的進行重啟裝置、緊固接線、更好裝置等處理。
2.1.3某保護小室內所有保護裝置、測控裝置通信中斷
一旦出現整間保護小室內的所有保護裝置、測控裝置的通信全部中斷,不論是單網絡中斷或是雙網絡中斷,其故障原因大多在于該小室內的交換機、光電轉換裝置以及該小室在站控層所對應的光電轉換裝置等網絡傳輸設備出現故障導致的,所以可以首先對網絡傳輸設備及其接線進行排查,而后進行相應處理。
2.1.4所內雙網絡結構通信其中一個網絡或是兩個網絡都中斷
全所內的自動化系統網絡出現單網絡或是雙網絡的整體通信中斷,可以先對站控層所屬的交換機等網絡設備及其接線進行檢查。因為現場的所有通信信號,不論是測控采集的信號,還是保護管理機轉換傳輸的遙信信號,最終都需經過站控層的交換機、光電轉換裝置等網絡傳輸裝置進行傳輸,所以出現該類問題,應該首先從站控層自上而下的查起。
2.2數據采集類故障
實際運行中,在網絡連接正常的情況下,存在個別遙信信號量顯示與現場實際狀態不一致的問題。例如,某保護屏上壓板投退后,監控主機卻顯示并未變位。該類情況往往還應參考SOE事件[12]信號進行綜合分析判斷。當SOE事件中也沒有該壓板投退的信號出現時,可以判斷是屬于保護裝置與自動化系統間通信出現故障,或是保護管理機死機,此時只需對保護管理機重啟便可恢復正常,也可能是因保護裝置內部的通信出口模塊損壞導致信號缺失,此時需要對相關模塊進行修復、更換。當SOE事件中有該壓板投退信號時,則說明保護裝置與自動化系統的通信采集正常,此時需要對自動化系統數據庫中該壓板軟節點的定義進行重新設置修定。
對于遙測硬節點開入的報文,如果某一硬節點開入信號丟失,或頻繁動作、復位(即節點抖動),而與現場實際運行情況不符時,則該節點的接線觸點可能存在接頭松脫、虛接的現象,需要對接線進行緊固處理。如果同屬于一個測控裝置的多個硬節點開入同時出現信號丟失、節點抖動的問題時,則應對該測控裝置的開入模塊加強檢查,同時檢查其管理插件配置是否存在不匹配現象。
2.3誤報警故障
在自動化系統中,所有非自動化系統廠家的保護裝置發出的軟報文,均由保護管理機接入自動化系統后臺數據庫[13]。當保護信號量非常大的時候,例如保護調試、系統事故等情況,保護裝置發出的部分信號會堆棧在保護裝置內存中,根據通信規約先入先出的原理,這部分堆積的信號會在下次保護管理機讀取信號時(如收發信啟動),隨著收發信告警信號一起被保護管理機讀取上報至監控主機報文,對運行監視及信號判斷造成干擾。此類因堆積而延遲上報的信號,其動作時間不是當前時間,而是其真實發信時間,此時需要結合現場實際保護動作情況進行分析判斷,將其告警發生時間與相應保護裝置內的歷史記錄進行對比,即可發現屬于信號堆積延遲誤報警,進而排除干擾。對于存在該類問題的變電站,可以在每次保護調試或事故處理后,對保護裝置內存事件進行清空,即可解決該問題。
2.4與其他廠家裝置不匹配故障
現場運行中發現,有一部分廠家的同一類型保護裝置存在裝置異常、通信中斷等頻繁告警現象,主要是因為保護裝置與自動化系統存在不匹配造成的。例如,珠海泰坦的TEP-G-C(D)分布式絕緣監測裝置、南自的PSL603電流差動保護都存在與北京四方CSC2000自動化系統不匹配的問題。在珠海泰坦的TEP-G-C(D)分布式絕緣監測裝置與CSC2000自動化系統的通信過程中,因為經規約轉換后的通信數據存在冗余、缺失等不匹配現象,所以在運行中會不時出現保護裝置異?;蛲ㄐ胖袛嗟葓缶?,短時后自動復位。針對該類問題,四方廠家與珠海泰坦廠家分別對各自的通信模塊與規約進行了修改升級,使該類問題得以解決。對于南自PSL603保護與CSC2000自動化系統的不匹配問題,經檢查試驗發現,保護管理機的COM通信口發送報文給PSL603保護裝置,卻無法收到回應報文,同時用上海許繼I-POFAS故障信息處理系統召喚PSL603保護裝置也無回應。對此,由南自廠家對PSL603保護裝置進行版本升級后,該問題得以解決。
3.問題發生的原因
通過對自動化系統常見問題的歸納分析,可以發現導致這些故障的原因主要在于以下幾點:
3.1產品質量問題
正常運行維護中對通信網絡的操作并不多,而之所以會出現各類通信中斷的問題,最主要的就是在于自動化系統的產品設備選型方面存在著所選系統不夠全面、產品質量不過關、系統性能不達標等問題[14]。一些產品出廠時能夠正常調試使用,但在運行一段時間之后穩定性有所下降,廠家對現有設備改進更新的積極性不高,缺乏質量保證措施,對設備售后出現質量問題的反饋與改進不足,致使一些相同的問題重復出現。如舉例中該變電站自動化系統所使用的自動化設備,其通信接口部件均為外協加工,使得該變電站自動化系統通信故障發生率較高。
3.2不同廠家設備的接口通信問題
接口問題是自動化系統中非常重要而又長期以來未得到妥善解決的問題之一[15],包括RTU、保護、五防、直流監測、故障錄波、無功裝置等與自動化系統設備之間的通信。這些不同廠家的產品要在數據接口方面溝通,需花費軟件人員很大精力去協調數據格式、通信規約等問題[16],與自動化系統通信時也需要通過加裝保護管理機(規約轉換器)等中間設備進行溝通,既增加了投資成本,又因為中間環節設備的增加而導致故障發生概率的增高。當不同廠家的產品、種類很多時,問題會很嚴重。
如果所有廠家的自動化產品的數據接口遵循統一的、開放的數據接口標準,則上述問題可得到圓滿解決,用戶可以根據各種產品的特點進行選擇,以滿足自身的使用要求。
3.3開放性問題
變電站自動化系統應能實現不同廠家生產的設備的互操作性(互換性);系統應能包容變電站自動化技術新的發展要求;還必須考慮和支持變電站運行功能的要求。而現有的變電站自動化系統卻不能滿足這樣的要求,各廠家的設備之間接口困難,甚至不能連接,從而造成各廠家各自為政,重復開發,浪費了大量的財力物力。
另外,各種屏體及設備的組織方式不盡相同,給運行維護和管理帶來許多問題。并且在現有的變電站二次設備中,廠家數量較多,各廠不同系列的產品造成產品型號復雜,備品備件通用性差、儲備繁多,設備運行率低。
4.結論
在對自動化系統出現的各類故障進行歸類分析之后,在實際檢查處理過程中不斷總結經驗,找出其規律性,可以對自動化系統各類故障的排查進行指導,以便迅速發現故障點,消除缺陷,縮短故障存在時間,進而提高設備運行的穩定性。隨著通信技術與計算機技術的不斷進步,變電站自動化系統也將不斷發展完善,這就要求電力生產人員對自動化系統熟悉掌握,充分發揮其作用,才能提高工作效率,保證電網的安全、經濟、優質運行。