摘要
雙相情感障礙(BD)是一種常見的精神疾病,特點是躁狂或輕躁狂與抑郁交替發作,其嚴重程度各異,導致準確及時的診斷具有一定的挑戰性。EEG的非線性特征被認為是精神障礙的生物標志物,能夠反映大腦的非線性動態。盡管已有研究證明EEG功率譜密度在BD患者中存在顯著變化,但熵度量作為一種互補的非線性方法,尚未得到充分探索。本研究對各種熵度量進行了全面評估,包括近似熵、樣本熵、排列熵(PermEn)、模糊熵(FuzzyEn)和散布熵(DispEn)。此外,考慮到信號在不同尺度上的波動復雜性,本研究還評估了四種多尺度熵度量,以探討其在區分BD患者與健康對照組(HCs)方面的有效性。本研究使用了60名個體的靜息態EEG數據,其中包括30名BD患者(15名女性,平均年齡=37.33,標準差=8.83)和30名HC參與者(13名女性,平均年齡=35.73,標準差=9.01),涵蓋了閉眼(EC)和睜眼(EO)兩種條件。在對原始EEG數據進行預處理后,分別計算了五個大腦皮層區域的五種基本熵和四種多尺度熵。然后應用統計分析和機器學習方法來評估兩組之間熵度量的差異。研究結果顯示,與HC組相比,BD患者在所有基本熵度量中均表現出更高的額葉和中央腦區不規則性,其中散布熵和模糊熵的變化尤為顯著。在多尺度熵分析中,前腦區β頻段(近似尺度因子4)的結果最為顯著,尤其是多尺度散布熵(MDE)。此外,在EO條件下,MDE度量的分類性能最佳,準確率達到95%,特異性為93.33%,敏感性為96.66%。本研究強調了熵度量的變化(特別是額葉腦區的MDE變化)作為雙相情感障礙及相關障礙的敏感生物標志物的潛力。
引言
精神障礙通常表現為個體在認知、情緒或行為上的顯著紊亂,表明生物、心理或發育過程中的功能失調。精神障礙不僅大大增加了全球疾病負擔,而且極大地影響了個體的社會和經濟福祉。精神障礙有許多類型,包括雙相情感障礙(BDs),這是一種慢性疾病,由雙相I型和雙相II型障礙組成。雙相I型障礙以躁狂發作為特征,而雙相II型障礙則涉及輕躁狂發作和重度抑郁發作。全球雙相I型障礙的終生患病率約為0.6-1.0%,雙相II型障礙約為0.4-1.1%。通常,精神障礙通過對行為的仔細評估和對異常體驗的主觀報告來診斷。這一過程會將患者分類為不同的組別,然而這種分類可能會掩蓋患者之間的顯著異質性。BD是精神疾病中難以準確診斷的典型例子之一。
在過去的十年中,精神障礙的自動識別引起了神經科學和工程學界的廣泛關注。在眾多神經影像工具中,腦電圖(EEG)作為一種非侵入性、成本效益高且具有高時間分辨率的方法脫穎而出,因此在臨床應用方面具有很大的潛力。此外,機器學習方法在檢測神經和精神疾病方面也越來越受歡迎。
雖然有一些研究觀察到了BD患者靜息態EEG的變化,但其結果存在差異。一些研究檢測了BD個體的線性功率譜密度(PSD)的變化。例如,一項研究顯示,與健康對照組(HC)相比,處于穩定期的BD個體在所有五個頻段(δ、θ、α、β和γ)中的PSD顯著增加,尤其是在與視覺空間處理相關的腦區。在睜眼(EO)條件下,右顳區的θ功率和左枕區的β功率增幅最為顯著。此外,Khaleghi等人(2019)比較了BD(包括輕躁狂和抑郁發作)組和HC組之間的頻譜功率,發現BD患者在額中央、中顳和右頂葉腦區的α功率更高。相比之下,一項綜合性研究考察了各種神經和精神疾病,結果發現BD抑郁發作患者的δ、θ和α功率下降,同時前腦β功率增加。Kam等人(2013)的研究發現BD患者的高頻段(β和γ)功率有所增加,但兩組之間并未觀察到顯著差異。另一項早期研究發現,BD躁狂發作與左額葉α活動降低有關。Clementz等人(1994)報告稱,BD患者的δ和θ活動增加,同時α活動減少。此外,處于穩定期的BD個體的α功率顯著低于HC組。Painold等人(2014)發現,與BD抑郁發作患者相比,躁狂發作組的θ活動較低,而β-2(18.5-21.0Hz)和β-3(21.5-30.0Hz)頻段的活動較高。值得注意的是,他們的研究使用了精神藥物,這可能會影響結果的解釋。
以往的研究強調,非線性動態通常比線性方法在理解腦疾病方面更有效。使用復雜性度量(如基于熵的方法),可以評估時間序列中的隨機性或不規則性,從而使我們能夠更全面地建模大腦活動。基于熵的方法已成為量化EEG信號復雜性的強大工具,為神經活動的動態特性提供了深刻見解。這些方法使研究人員能夠評估神經皮層的復雜性,而神經皮層復雜性已經被證明反映了大腦的生理和病理狀態。例如,先前的研究表明,熵度量(包括近似熵(ApEn)、樣本熵(SampEn)和排列熵(PermEn))在檢測注意力缺陷多動障礙(ADHD)兒童在使用哌甲酯治療后的神經皮層復雜性水平降低方面具有實用價值。此外,有研究通過排列熵度量闡明了音樂經驗在增強神經聲音編碼表現中的作用。將這些方法納入EEG分析可以增強我們在各種背景下解釋熵值功能意義的能力。
一些研究考慮使用非線性特征(包括熵)來區分BD和HC個體,主要采用機器學習方法。Khaleghi等人(2019)還使用了香農熵,結果顯示BD組的δ、α和γ熵顯著更高。該研究使用k近鄰(KNN)(K=3)和所有α特征(熵和功率譜密度(PSD))在區分BD和HC個體方面達到了95.8%的準確率。此外,Mateo-Sotos等人(2022)使用了幾種非線性特征,包括近似熵(ApEn)、Higuchi分形維數(HFD)、去趨勢波動分析和Hurst指數,并結合線性PSD,采用極端梯度提升分類器取得了94%的準確率。另一項研究發現,BD組的HFD和樣本熵(SampEn)值均高于HC組。該研究報告的準確率在90.24%到97.56%之間,其中使用樣本熵特征時的性能最佳。Wang等人(2023)使用功率、均值、方差、偏度和香農熵特征對BD和HC個體進行分類,使用特征選擇和自組織映射方法達到了97.62%的準確率。此外,還有一項研究采用了幾種簡單的非線性方法,包括三種分形特征(Petrosian分形維數、Katz和HFD)和三種熵度量(樣本熵、排列熵和多尺度樣本熵(MSE))。研究結果發現,當使用多層感知器神經網絡時,熵特征產生了最佳分類結果,準確率高達95.74%。然而,該研究不僅未能將每個尺度因子下的MSE值與相應的頻率范圍聯系起來,而且也沒有包含最新的熵度量。最近,Hwang等人(2024)使用MSE進行評估發現,與HC組相比,BD組的雙側額葉和中央葉在某些尺度因子(13-40)上的MSE值更高。
總的來說,最新的綜述文章報告了使用EEG信號自動診斷雙相情感障礙(BD)的準確率約為90%。雖然這些進展值得關注,但它們作為臨床工具的應用仍不確定,需要進一步的研究以獲得臨床界的廣泛接受。許多先前的研究側重于區分BD與其他精神障礙,但并未納入健康對照組(HC)。大多數技術和研究側重于機器學習結果,而沒有對最新特征進行統計評估。此外,盡管基于熵的方法已用于EEG分析,但尚無研究專門針對抑郁癥(包括BD)應用最新的熵度量。為此,基于BD文獻中的空白,本研究旨在對各種熵度量進行全面評估,包括已建立的熵以及最近引入的多尺度散布熵(MDE),它通過估計不同尺度上的熵來捕捉EEG時間序列的復雜性。在使用統計方法評估這些特征后,本研究使用了多種分類器,如決策樹(DT)、K近鄰(KNN)和支持向量機(SVM),以評估研究結果的有效性,并確定其在臨床實踐中的實用性。
材料與方法
參與者
本研究共納入了60名參與者,其中包括30名雙相情感障礙(BD)患者(15名女性,平均年齡=37.33,標準差=8.83)和30名健康對照組(HC)參與者(13名女性,平均年齡=35.73,標準差=9.01)。納入標準為參與者年齡在18至60歲之間,且無精神藥物使用史。所有參與者均未報告有頭部創傷、腦損傷或神經系統疾病史。BD患者的診斷基于DSM-V標準,并通過經驗豐富的精神科醫生進行訪談確認。所有患者完成了一系列自我評估量表,包括貝克抑郁量表-II(BDI-II)和貝克焦慮量表(BAI)。BDI-II得分≥29分表示中度至重度抑郁。值得一提的是,所有HC參與者均使用癥狀自評量表-90(SCL-90)進行評估,未發現明顯的心理障礙。所有參與者在研究開始前都簽署了知情同意書。
EEG數據記錄
使用Mitsar-EEG-201設備(Mitsar Ltd.)采集閉眼(EC)和睜眼(EO)條件下的靜息態EEG數據。使用了19個Ag/AgCl電極,包括額區(FP1、FP2、F7、F8、F3、F4和Fz)、中央(C3、C4和Cz)、頂區(P3、P4和Pz)、顳區(T7、T8、T5和T6)以及枕區(O1和O2)。這些電極按照國際10-20系統放置。EEG信號的采樣率(Fs)為500Hz,參考電極為雙側乳突參考。在記錄過程中,使用導電凝膠將皮膚阻抗保持在5KΩ以下。
EEG數據預處理
在本研究中,使用運行于MATLAB 2024a的EEGLAB工具箱進行預處理。首先,將所有通道降采樣至250Hz,以減少計算時間,同時保留EEG信號中的關鍵信息。接下來,使用兩個獨立的有限脈沖響應(FIR)濾波器對數據進行濾波。應用截止頻率為0.5Hz的高通濾波器以去除低頻漂移和基線波動。此外,使用一個截止頻率為45Hz的低通濾波器來抑制高頻噪聲,包括肌肉偽跡和電干擾。值得注意的是,這兩個FIR濾波器均應用了零相移。在排除噪聲通道后,對數據集應用了共同平均參考(CAR)。此外,對所有數據通道進行了目視檢查,以去除和排除偽跡時間點,特別是與身體運動相關的偽跡。然后使用邏輯Infomax ICA算法進行獨立成分分析(ICA),以將神經EEG數據與非神經成分(如眼動和肌肉偽跡)分離。被移除的通道使用球面樣條插值法進行插值。最后,將連續的EEG數據分割為4s的時段以進行進一步分析。選擇此時長是為了平衡關鍵考慮因素,包括解決EEG信號固有的非平穩性,并確保時段足夠長以在多尺度熵分析中產生可靠的結果。
熵方法
熵是一種反映規律性或隨機程度的指標,熵值越高表示序列越復雜或越無序,而較低的值則表示序列具有更高的規律性或結構性。在這里,本研究選擇了五種基本的熵度量,包括近似熵(ApEn)、樣本熵(SampEn)、排列熵(PermEn)、模糊熵(FuzzyEn)和散布熵(DispEn),以及四種多尺度熵度量,即多尺度近似熵(MAE)、多尺度排列熵(MPE)、多尺度樣本熵(MSE)和多尺度散布熵(MDE)。本研究的選擇基于先前EEG研究中的發現,特別是與雙相情感障礙(BD)相關的研究成果,以及最新的方法和已建立的熵度量。
統計分析與分類
由于數據不符合正態分布,采用Wilcoxon秩和檢驗(p<0.05)評估健康個體與BD患者之間的差異。值得注意的是,本研究使用了單樣本Kolmogorov-Smirnov檢驗來檢驗正態性。考慮到多重比較的影響,本研究對所有比較應用了錯誤發現率(FDR)校正。此外,使用Hedge’s g作為效應量度量,這對于處理小樣本量特別有用。在提取非線性特征(包括基本熵和多尺度熵)后,應用互信息(MI)作為基于濾波器的特征選擇方法,以確定最小特征集。MI通過測量每個特征與目標變量之間的依賴關系來選擇最相關的特征,從而通過僅保留最具信息量的特征來降低數據維度。這種方法減少了計算時間,簡化了模型,并且提高了預測準確性。值得注意的是,所選特征的數量是通過反復試驗來確定的,以最小化分類錯誤。然后,使用多種分類器(包括決策樹(DT)、KNN和支持向量機(SVM))來評估所選特征。本研究采用留一法交叉驗證(LOSO-CV)來提高結果的可靠性。最后,使用準確率、特異性、敏感性和F1分數等指標評估模型的性能。圖1展示了所提方法的框架。
圖1.該方法框架包括診斷訪談、腦電記錄與預處理、熵特征提取、統計分析和分類。
結果
在本研究中,所有分析(包括統計和機器學習程序)均使用MATLAB 2024a在一臺配備16GB內存和2.50GHz Intel Core i5-10300H處理器的Windows PC上完成。熵度量使用EntropyHub工具箱和MATLAB腳本計算,相關代碼可在https://github.com/HamedAzami上獲取。
熵度量參數
對于近似熵(ApEn)、樣本熵(SampEn)和模糊熵(FuzzyEn),必須謹慎選擇三個關鍵參數——時延d、閾值r和嵌入維數m。將時延d設置為1,以避免d較大(d>1)時可能發生的混疊和頻率信息丟失。設置d=1簡化了分析,并與先前關于單變量熵方法的研究一致。閾值參數r設置為EEG信號標準差的0.2倍。選擇該值是為了在對數似然估計的準確性和保留信號信息之間取得平衡。當r值過小時,條件概率估計變得不可靠。相反,建議使用較大的r值以減輕噪聲的影響,但r值過大則會導致數據細節丟失。因此,需要在較小和較大的r值之間找到最佳平衡。在文獻中,一種常見的方法是將r定義為原始信號標準差的常數因子(通常在0.1到0.3之間)。嵌入維數m(表示比較的序列長度)設置為2。這一選擇基于文獻中的建議,因為較大的m值需要更多的數據點來進行可靠計算,這對于生理數據來說可能具有挑戰性。對于模糊熵(FuzzyEn),模糊冪參數(影響指數函數邊界的梯度)設置為默認值2,這是文獻中已驗證的標準。對于排列熵(PermEn),考慮了兩個主要參數:嵌入維數m和時延d。與其他方法一樣,選擇d=1以防止頻率失真。嵌入維數m設置為3,旨在平衡計算效率和信號復雜度的分辨率。為了確保統計結果的可靠性,一般建議(m+1)!?N,其中N表示數據點的數量。較大的m值提供了更詳細的信息,但需要更多的數據點并增加計算需求。選擇m=3可以確保在不過度增加計算成本的情況下提供足夠的狀態多樣性,這與現有研究一致。散布熵(DispEn)依賴于三個參數:嵌入維數m、類別數c和時延d。對于散布熵,本研究選擇m=2、c=6和d=1。這種組合符合散布熵在類別數或嵌入維數較小時需要較少的數據點以達到其最大值的原理。為了達到散布熵的最大值,至少需要ln(cm)個數據點,在選擇參數時,確保散布熵在保持計算效率的同時,仍能有效地區分信號動態中的細微差異。
對于多尺度近似熵(MAE)、多尺度排列熵(MPE)、多尺度樣本熵(MSE)和多尺度散布熵(MDE),為保持一致性,保留了它們各自單尺度方法中的參數。具體而言,對于MAE和MSE,r設置為信號時間序列標準差的0.2倍,并且m=2用于基礎的ApEn和SampEn計算。對于MPE,m和d分別設置為3和1。對于MDE,使用m=2、c=6和d=1,與DispEn的設置一致。同樣地,對于MAE和MPE,時延設置為d=1,嵌入維數分別設置為m=2和m=3。此外,選擇尺度因子30以覆蓋所有多尺度熵的整個頻率范圍(尺度因子τ與Fs/(2×τ)相關),使這些度量能夠在不同尺度上表征快慢動態。
各腦區的基本熵
為了確定在比較兩組時每個腦區的重要性,本研究將EEG電極劃分為五個腦葉,包括額葉(Fp1、Fp2、F7、F8、F3、F4、Fz)、中央(C3、C4、Cz)、頂葉(P3、P4、Pz)、顳葉(T3、T4、T5、T6)和枕葉(O1、O2)。本研究計算了每個區域的中值以處理噪聲段,并從這些選定區域提取特征。圖2和圖3分別展示了閉眼(EC)和睜眼(EO)條件下每個基本熵度量在五個指定腦區中的值。此外,表1展示了在五個腦區中,經過FDR校正后,HC組和BD組在EC和EO條件下的統計比較結果。可以看出,BD組在大多數腦區中具有較高的基本熵值(除了在EO條件下,顳葉、頂葉和枕葉區域的排列熵(PermEn))。進一步分析發現,大多數變化主要出現在額葉和中央腦區。統計結果顯示,最顯著的結果(基于Hedges’ g效應量)位于額葉和中央腦區,并與散布熵(DispEn)和模糊熵(FuzzyEn)相關。值得注意的是,在EC和EO條件下,排列熵(PermEn)均未觀察到顯著差異,因此該度量被排除在進一步分析之外。為了更清晰地展示,兩組z值比較的地形圖如圖4所示,其中頂部為EC條件,底部為EO條件。該圖清楚地顯示,最顯著的結果屬于FuzzyEn和DispEn,從額葉延伸至頂葉腦區,并且在EO條件下觀察到的結果最顯著。
表1.在五個腦區中,HC組和BD組在EC和EO條件下的統計比較結果。
圖2.在EC條件下,所有個體在五個特定腦區的基本熵值。
圖3.在EO條件下,所有個體在五個特定腦區的基本熵值。
圖4.兩組之間z值地形圖的比較。
各腦區的多尺度熵
與上一節類似,本研究計算了五個腦區中每個區域的多尺度近似熵(MAE)、多尺度排列熵(MPE)、多尺度樣本熵(MSE)和多尺度散布熵(MDE)。圖5展示了在閉眼(EC)和睜眼(EO)條件下,HC組和BD組參與者在不同腦區中MAE和MPE的均值和標準差隨尺度因子的變化情況。值得注意的是,在EO條件下,兩組的MAE和MPE最顯著的差異位于額葉和中央腦區,且這些差異與較低的尺度因子(對應于β頻段)相關。同樣,圖6展示了在EC和EO條件下,HC組和BD組參與者在每個腦區中MSE和MDE的均值和標準差隨尺度因子的變化。值得注意的是,在MDE的EO條件下,兩組之間最顯著的差異位于額葉(校正后p=6.99e?08,BD>HC)和中央腦區(校正后p=8.60e?08,BD>HC),且尺度因子=4(對應于β頻段)。此外,可以觀察到,MSE和MDE在較高的尺度因子下都存在顯著差異,特別是在EO條件下的額葉和中央腦區(額葉MDE:校正后p=1.07e?07,BD<HC;中央MDE:校正后p=2.26e?07,BD<HC;額葉MSE:校正后p=1.22e?07,BD<HC;中央MSE:校正后p=2.26e?07,BD<HC)。
圖5.在閉眼(EC)和睜眼(EO)條件下,HC組和BD組在不同腦區中MAE和MPE的均值和標準差隨尺度因子的變化情況。
圖6.在EC和EO條件下,HC組和BD組在不同腦區中MSE和MDE的均值和標準差隨尺度因子的變化情況。
機器學習
為了更好地評估每種熵度量(包括基本熵和多尺度熵),本研究使用留一受試者交叉驗證(LOSO-CV)和幾種傳統分類器分別評估每種熵度量在BD中的效用。為了實現這一目標,本研究選擇一名受試者作為測試數據,并使用其余受試者(共59名)訓練每個分類器。此過程對每名受試者重復進行,以確保評估的穩健性。表2展示了每種熵度量的性能評估指標,包括敏感性、特異性、F1分數和準確率。從表中可以看出,使用支持向量機(SVM)分類器和MDE特征在EO條件下獲得了區分BD和HC個體的最佳分類結果(準確率=95%,敏感性=96.66%,特異性=93.33%,F1分數=0.95)。值得注意的是,EC條件下的最佳分類結果是使用FuzzyEn度量和SVM分類器獲得的(準確率=88.33%,敏感性=86.66%,特異性=90%,F1分數=0.88)。
表2.EC和EO條件下的分類結果,最佳結果以粗體突出顯示。
結論
本研究首次全面探討了常規熵和多尺度熵度量在非線性分析中的應用,并通過統計分析和機器學習技術對五個腦區的熵度量進行了評估。研究結果顯示,雙相情感障礙(BD)患者的基本熵度量值顯著高于HC參與者。在EC和EO條件下,兩組在散布熵(DispEn)和模糊熵(FuzzyEn)上的差異最為顯著,并分別位于額葉和中央腦區。此外,與HC個體相比,BD患者在較低尺度因子(對應于β頻段)下的熵值顯著增加,而在較高尺度因子(對應于θ頻段)下的熵值顯著降低,尤其是在額葉和中央區域。值得注意的是,EO條件下的差異最為顯著。機器學習結果進一步支持了熵度量(尤其是多尺度散布熵(MDE))作為雙相情感障礙及相關障礙潛在生物標志物的價值。因此,本研究為使用熵度量提高雙相情感障礙及相關障礙的診斷準確性提供了重要的見解。為了增強研究方法的穩健性,未來的研究應考慮更多種類的熵度量方法,如香農熵、對數能量熵、譜熵、改進的多尺度樣本熵和多尺度波動散布熵等,這些方法能夠提供互補的見解,從而提升分析的全面性。
參考文獻:H. Bagheri et al., “A Comprehensive Assessment of EEG Entropy Measures for Bipolar Disorder Diagnosis Using Machine Learning,” in IEEE Access, vol. 13, pp. 26527-26541, 2025, doi: 10.1109/ACCESS.2025.3539323.
小伙伴們關注茗創科技,將第一時間收到精彩內容推送哦~