當前位置: 首頁 > 能源互聯(lián)網(wǎng) > 市場研究

ChatGPT火爆 電力AI春天來了么?

魚眼看電改發(fā)布時間:2023-03-30 10:39:06  作者:俞慶

  最近ChatGPT爆火,在文字和視覺內(nèi)容的AIGC方向,確實達到了某種臨界值,涌現(xiàn)出“智能”。

  趁著這個熱度,AI方向也很火,最近看了幾個能源、電力方向的AI創(chuàng)業(yè)公司的BP,感覺就是“干啥都沒想明白,就出來融資了”。

  電力AI的春天真的來了嗎?

  (來源:微信公眾號“魚眼看電改” 作者:俞慶)

  回歸本質(zhì),AIGC的奇點突破,個人覺得是三個因素的結(jié)合:

  1、GPT是人類神經(jīng)元的仿生產(chǎn)物

  NLP為代表的GPT類AI,是計算機神經(jīng)元網(wǎng)絡算法,其本質(zhì)是對人類大腦皮層的神經(jīng)元網(wǎng)絡模擬。

  而語言、音樂、圖像,甚至味覺信息的處理和智能想象,都是人類大腦作為一種“蛋白質(zhì)計算機”,在長期進化中積累出來的功能。

  所以GPT作為仿生產(chǎn)物,自然最適合處理同類的信息,也就是非結(jié)構(gòu)化的語言、音樂、圖像。

  其處理的機制,也不是意義的理解,而是一種提煉、識別、聯(lián)想。這就是非常吊詭的一件事。

  早期的語音語義識別算法,本質(zhì)上是建立語法模型和語音庫,然后把語音對應到詞匯,再把詞匯放到語法庫里去理解詞匯的意義,最后得到識別結(jié)果。

  這種基于“邏輯機理”的語法識別,識別效率一直徘徊在70%左右,比如IBM在上世紀90年代推出的ViaVoice識別算法。

  AIGC不是這么去玩,其本質(zhì)是不去管什么語法,而是建立一個神經(jīng)元網(wǎng)絡算法,讓計算機自己去統(tǒng)計不同詞匯之間的概率聯(lián)系,是神經(jīng)元的聯(lián)系,而不是語義的聯(lián)系。

  很像我們小時候?qū)W母語,我們自然就學會了,而不是一開始去學習“主謂賓、狀定補”,然后去理解一段話。

  這就是AI的思維模型,是識別,而不是理解。

  這也是AI對所有經(jīng)典機理模型的顛覆意義——計算機不用在邏輯層理解這件事,而是識別、認識到內(nèi)在信息之間的關(guān)聯(lián)關(guān)系,就知道了。

  比如電網(wǎng)的潮流狀態(tài)和潮流預測,基于經(jīng)典電力網(wǎng)絡仿真,是建立機理數(shù)學模型,然后用矩陣算法去收斂。未來可能不需要了,AI直接就根據(jù)每個節(jié)點的狀態(tài)去識別和預測出某個模態(tài)班圖(Pattern)。

  節(jié)點越多,而經(jīng)典矩陣算法越不喜歡,因為算法復雜度隨節(jié)點數(shù)量增加,幾何級數(shù)的增加,而AI偏偏喜歡超大規(guī)模的節(jié)點并發(fā),因為識別和預測最可能的網(wǎng)絡模態(tài)是AI擅長的。

  無論是圍棋的下一步預測(AlphaGO可以預測后面幾十步,每一步都有無數(shù)種可能),還是天氣復雜系統(tǒng)的模態(tài)預測,AI的精確度都比機理模型高很多。

  電網(wǎng)之所以目前不需要AI,是因為省級調(diào)度管理的220kV及以上的電力網(wǎng)絡,節(jié)點數(shù)量不多,而且設(shè)置了很多條件對矩陣線性化,稀疏化,極大降低了機理模型的計算復雜度。

  但是到了配網(wǎng)潮流階段,面對一個大型配電網(wǎng)里幾萬、幾十萬的電源節(jié)點、負荷節(jié)點、傳統(tǒng)矩陣算法是無力的。

  我認為未來AI在配網(wǎng)層面的模式識別將成為可能。

  2、非結(jié)構(gòu)化信息的積累、訓練與生成

  AIGC之所以獲得突破,第二個原因是信息的積累程度。從語音的A/D轉(zhuǎn)換(麥克風+PCM采樣),到圖像的A/D化(CMOS+色彩空間映射),人類過去幾十年,用極低成本的方式,積累了視覺、聽覺領(lǐng)域的全息數(shù)據(jù)。

  尤其是攝像頭、智能手機的大規(guī)模普及,人類在視聽領(lǐng)域的,非結(jié)構(gòu)化數(shù)據(jù)積累幾乎零成本,互聯(lián)網(wǎng)上文字信息的爆發(fā)性積累,是AIGC訓練的關(guān)鍵——訓練數(shù)據(jù)集不要錢。

  上圖是全球數(shù)據(jù)的增長趨勢,明顯呈現(xiàn)指數(shù)級趨勢,這種數(shù)據(jù)積累的非線性增長,是AIGC能力非線性增長的基礎(chǔ)。

  BUT,這些數(shù)據(jù)大部分都是非結(jié)構(gòu)化的視聽數(shù)據(jù),是零成本積累的。

  在電力領(lǐng)域,這點是做不到的,首先電力行業(yè)絕大多數(shù)是結(jié)構(gòu)化、半結(jié)構(gòu)化數(shù)據(jù),比如電壓、電流,是時間序列的點數(shù)據(jù)集合,是半結(jié)構(gòu)化的。

  結(jié)構(gòu)性數(shù)據(jù)集合,需要讓計算機理解,是需要“對齊”的,比如設(shè)備對齊——一個開關(guān)的電壓、電流、功率數(shù)據(jù),都需要對齊到這個節(jié)點上。

  還有更麻煩的是時間對齊,要根據(jù)時標去對齊電壓、電流、有功無功,這樣才能后續(xù)識別。還有正反向,是四象限的空間對齊。

  不像文本數(shù)據(jù),不用對齊,一段話扔給計算機就行了,它自己去識別出可能的信息關(guān)聯(lián)。

  為了對齊這件事,比如營配數(shù)據(jù)的設(shè)備對齊,而且是不斷需要對齊,因為中低壓配網(wǎng)每天都在增刪改設(shè)備和線路,電網(wǎng)公司花費巨大的人工成本。

  和“數(shù)據(jù)標注”一樣,這件事計算機做不了。

  其次,電力領(lǐng)域的數(shù)據(jù)獲取成本很高,都要裝傳感器,而不是有個手機就能說話拍照。電壓每降低一個等級(或者配電關(guān)系每降低一個層級),所需傳感器投資至少增加一個數(shù)量級,要做到負荷側(cè)(毛細血管末端)的感知,那更是天量的數(shù)字化投資。

  如果要識別電網(wǎng)暫態(tài)模式,那需要高精度高頻采樣,那成本就更高。

  因為數(shù)據(jù)獲取和數(shù)據(jù)對齊的邊際成本極高,導致電網(wǎng)目前無法積累足夠的、呈非線性增長的數(shù)據(jù)信息,去訓練一個達到AI奇點的算法。

  更別說數(shù)據(jù)的開放性,一個電力AI創(chuàng)業(yè)公司,是不可能拿到這些數(shù)據(jù)的。

  所以AI之前,必先解決數(shù)據(jù)集的問題,否則通用AI代碼是訓練不出一個好的AI的。

  3、算力突破

  AIGC的奇點突破,除了算法和數(shù)據(jù),還有就是算力突破,傳統(tǒng)CPU不適合做大規(guī)模并發(fā)的神經(jīng)元計算的,恰好是GPU在3D游戲和影視方面的應用,使得大規(guī)模并行的浮點+流計算成為可能,摩爾定律更使得單位算力的計算成本下降。

  電網(wǎng)AI,未來必然的趨勢

  隨著大量分布式光伏、分布式儲能的并網(wǎng),以及負荷側(cè)虛擬電廠的應用需求,客觀上需要對公共配電網(wǎng)系統(tǒng)、用戶配(微)電網(wǎng)系統(tǒng),進行源、荷預測,以及配(微)網(wǎng)的實時潮流優(yōu)化。

  配網(wǎng)側(cè)的計算復雜度其實高于輸電網(wǎng)調(diào)度,即使一個商業(yè)綜合體,負荷設(shè)備就可能幾萬幾十萬,開關(guān)成百上千,基于AI的微網(wǎng)/配網(wǎng)運行控制需求將會出現(xiàn)。

  而傳感器的低成本化,固態(tài)變壓器、固態(tài)開關(guān)、逆變器(變流器)等功率電子設(shè)備大量使用,在電網(wǎng)邊緣的感知-計算-控制融合也成為創(chuàng)新的趨勢。

  所以電網(wǎng)的AIGC,是未來。只不過,今天需要的,不是馬上拿個AI算法出來圈錢,

  而是先解決AI所需的數(shù)據(jù)基礎(chǔ)構(gòu)建問題

  在AIGC的熱潮中,對電力AI的應用水平與未來,需要有足夠的冷靜思考。

  目前電力AI意義不大:比如一個預測精度90%的光伏算法,放到交易偏差門檻5%的現(xiàn)貨市場里,算法偏差就把交易利潤全部干完了。

  數(shù)據(jù)是水,算法算力是渠,水到渠成。


評論

用戶名:   匿名發(fā)表  
密碼:  
驗證碼:
最新評論0