固定閾值是通過實驗確定的經驗值。然而,很難為不同的參與者或動作選擇一個通用的固定閾值。因此,我們提出了一種基于最優閾值的SampEn方法。該實現分為三個步驟:計算SampEn、基于固定閾值檢測活動段和計算最佳閾值。
在第一步中,計算分析窗口的樣本(M個樣本,M=512)。9信道信號之和的時間序列sEMGsum(k)構造如下:
表面肌電總和(k)=∑ i=1c表面肌電i(k)(1)
其中C是通道總數(C=9),i是通道數,k是分析窗口中的點數。
然后,將標量時間序列sEMGsum(k),k=1,2,…,M嵌入延遲的M維空間,以形成一組M維向量(長度為M的數據段)(Zhang和Zhou,2012;Yentes等人,2013):
{sEMGsumm(j)=[Semgsum(j+p)]p=0m−1j=1,2,…,M-M+1(2)
匹配m個點的兩個序列的概率Bm(r)通過計算其距離低于相似公差r的向量對的平均數量來計算。類似地,可以計算m+1維的概率Am(r)。最后,SampEn計算為:
SampEn(m,r,m)=-ln8290;(A,m(r)B,m(r))(3)
尺寸m和相似公差r的選擇決定了SampEn的計算結果。這些值有經驗公式(Pincus,1991;Costa等人,2002):m=1或2,r=(0.15-0.25)∗ σ. 其中σ是整個數據序列sEMGsum的標準偏差。在本文中,這些值為:m=2,r=0.25∗ σ.
在第二步驟中,執行基于固定閾值的活動段檢測。根據第一步,獲得第l個分析窗口的采樣點(l)。然后,計算第l個分析窗口的狀態函數s(l):
s(l)={0,SampEn(l)<Th1,SampEn(l)≥第(4)條
其中Th是固定閾值。基于狀態函數的活動段的條件是:
{s(l1−1) =0ands(l1)=1s(l2−1) =1和(l2)=0 L=l2−l1≥L0=12×秒(5)
其中,l1和l2是活動段的開始和結束分析窗口,L是l1和l2之間的分析窗口數,秒表示時間秒,L0是活動段中分析窗口的預設數。只有當L不小于L0時,該活動段才能被視為有效活動段。否則,該活動段仍被視為噪聲。此外,可以在采集的sEMG信號中檢測到多個活動段(例如n個)。為了區分每個活動段,每個活動段的l1和l2分別存儲在長度為n的一維數組x1和x2中。
在第三步中,通過迭代計算最佳閾值。目標函數不僅要精確檢測已知的n0個活動段(本文中的n0=5),還要使每個活動段盡可能長,以包含更多的運動信息。因此,目標函數通過兩個循環實現,流程圖如圖5所示。
圖5
noraxon
圖5.計算最佳閾值的流程圖。
外循環和內循環的循環變量分別是活動段中分析窗口的數量L0(將L0替換為秒,10)≥秒≥1) 并且SampEn閾值Th(0≤Th≤2). 循環體按順序執行前兩步,并輸出檢測到的活動段數n,并確定其是否等于n0。如果n等于n0,則輸出此時的x1、x2和Th值。以執行從上到下運動的中風參與者為例,9通道表面肌電信號的活動段檢測結果如圖6所示。
圖6
noraxon
圖6.從上到下運動中基于自適應采樣筆閾值算法的活動段檢測。DT,斜方肌下降部分;左腹直;右腹直;左腹外側斜;右外斜;左胸豎脊;右胸豎脊。蛔笱Q脊;右腰豎脊肌。
特征提取
與頻域和時頻域特征相比,時域特征簡單且耗時較少。因此,我們選擇了五種常用的時域特征來建立特征向量。這些特征包括均方根(RMS)、方差(Varrecchia等人,2018)、MAV、波形長度(WL)和四階自回歸模型系數(4th ARMC)。
RMS是給定分析窗口中表面肌電信號平均功率的平方根。計算如下:
均方根i(t)=1m∑ k=1 M表面肌電i t(k)2(6)
其中i是信道號(i=1、2、3、…、9),t是分析窗口均方根i(t)=1m∑ k=1 M表面肌電i t(k)2(6)
其中,i是信道編號(i=1、2、3、…、9),t是分析窗口編號,k是第t個分析窗口中的點數。
VAR反映了表面肌電信號偏離平均值的程度,計算公式如下:
{AVR i(t)=1米∑ k=1m表面肌電i t(k)VAR i 8290;(t)=1m∑ k=1m(表面肌電i(k)-AVR i(t))2(7)
在統計學中,表面肌電信號近似為平均值為零的隨機信號。平均值不反映信號特性。因此,表面肌電信號的絕對值被平均,這是MAV的定義。計算如下:
MAV i(t)=1m∑ k=1 M |sEMG i t(k)|(8)
WL是sEMG信號長度的簡單累積,可以反映sEMG信號波形的復雜性。其定義為:
WL i(t)=∑ k=1 M |表面肌電(k+1)-表面肌電t(k)|(9)
AR模型是用于表面肌電信號時間序列分析的線性模型。其定義為:
表面肌電t(k)=∑ j=1qajsemgit(k-j)+eit(k)(10)
其中q是AR模型的階數(q=4),aj是第j階AR系數,eit(k)是白噪聲殘差。
從單通道表面肌電信號的每個分析窗口提取五個時域特征。本文采集了9通道表面肌電信號,因此1∗ 45 (5 ∗ 9) 從每個分析窗口提取一維特征向量。然而,中風患者受影響的一側可能是左手或右手。不同的受影響側導致相反方向的SE和TR補償。這導致四對肌肉(LRA/RRA、LOEA/ROEA、LTE/RTE和LLE/RLE)產生相反的效果。相應地,從后8通道表面肌電信號中提取的特征向量的一致性較差,甚至相反,這不利于分類。因此,為了減少不同受影響手的影響,我們將后部8通道表面肌電信號的五個時域特征重建為:
{feat i′(t)=feat i(t)+feat i+1⁘(t)feat i+1′(t)=abs⁎(feat i(t)-feat i+1 |(t))i=2、4、6、8(11)
其中,i是第i個通道,t是分析窗口號,feati(t)代表上述五個時域特征(均方根、VAR、MAV、WL和第四個ARMC)中的任何一個。特征重構僅改變特征值,但不改變特征維數,因此每個分析窗口提取1∗ 45維特征向量。此外,考慮到該方法在臨床應用中的便利性,連續減少了四對軀干肌肉的數量,最后研究了9、7、5和3個通道。相應地,每個分析窗口提取的特征向量維數為1∗ 45, 1 ∗ 35, 1 ∗ 25和1∗ 分別為15。
分類
由于SVM算法實現了結構風險最小化原則(Burges,1998),因此它在解決小樣本、非線性和高維模式識別方面具有獨特的優勢。一些研究(例如,Bellingegni等人,2017;Quitadamo等人,2017)也表明支持向量機具有更高的分類性能。因此,我們選擇了支持向量機分類器。支持向量機的目的是尋找最優超平面來分割樣本。分割的原則是使區間最大化,并最終將其轉化為凸二次規劃問題(Scholkopf和Smola,2001),表示為:
{min1 2||w| | 2 s.t.y t(w*8290x t+b)-1≥ 0 (12)
其中(xt,yt)是第t個數據點,(w,b)是超平面參數。拉格朗日乘子用于求解該問題。
TCD模型為四類模型(NC、LF、TR和SE),因此采用一對一策略進行多分類。我們使用LIBLINEAR(Fan等人,2008)工具包進行SVM分類器。當使用L2正則化L2損失支持向量分類時,只需搜索懲罰因子C(Hsu等人,2003)。在本文中,交叉驗證用于將參數C從小到大調整。當增加的C對分類結果沒有太大影響時,調試完成,并選擇相對較小的C值以提高模型的收斂速度(最后,C=1)。此外,還使用了保持方法來評估分類器的性能。具體而言,為了盡可能保持數據分布的一致性,將訓練子集和測試子集隨機劃分為每個類特征集的80:20%。將四個類的訓練子集和測試子集分別組合以形成訓練集和測試集。此外,我們使用100次保持法獲得了穩定可靠的評估結果。此外,我們選擇分類準確度、F1得分、受試者操作特征(ROC)曲線和曲線下(AUC)作為模型eva模型評估參數。分類準確度是最常用的分類模型評價指標,是指正確分類的樣本數與總樣本數的比值。F1分數是精確性和召回率的調和平均值。ROC曲線是一條評估曲線,其中假陽性率(FPR)為橫軸,真陽性率(TPR)為縱軸。AUC定義為ROC曲線和坐標軸包圍的區域。
結果和討論
后果
分類精度
為了研究該方法的可行性,我們基于健康組數據集和中風組數據集建立了兩個軀干補償模型。首先,研究了通道數量對分類的影響。從圖7可以看出,較少的通道導致較低的平均精度。根據最佳精度原則,以下僅報告九個通道的詳細檢測結果。
圖7
noraxon
圖7.不同通道數建立的健康組和中風組模型的平均精度。
結果表明,健康組模型和患者組模型的平均準確度分別為95.0%和83.1%(圖7)。兩個模型的混淆矩陣作為灰度圖像給出(圖8);煜仃囍械膶窃兀╪,n)(n=1,2,3,4)表示每個類別的分類精度,而其他元素表示錯誤分類率。
圖8
noraxon
圖8.干線補償檢測模型的混淆矩陣。(A) 健康組。(B) 中風組。NC,無補償;左前傾;TR,軀干旋轉;SE,肩部標高。
ROC和F1得分
由于每個參與者的運動功能不同,四個班的樣本分布略有不平衡。因此,我們還選擇F1分數、ROC和AUC作為模型評估參數。這些參數通常用于不平衡分布的二元分類。然而,本文建立的模型是四類模型,因此需要進行轉換才能獲得這些參數。我們將當前類視為正類,其余類視為負類。通過這種方法,獲得了四類ROC和AUC(圖9)。在ROC曲線中,曲線左上角越凸,模型性能越好。AUC越接近1,模型性能越好。本文中單個類別的AUC達到1,表明模型在檢測這些類別時表現出期望的識別性能。
圖9
noraxon
圖9.主干補償檢測模型的ROC曲線。(A) 健康組。(B) 中風組。NC,無補償;左前傾;TR,軀干旋轉;SE,肩部標高。
F1分數是精確性和召回率的調和平均值。F1分數越接近1,模型性能越好。我們使用相同的轉換方法計算每個類的F1分數,結果如圖10所示。
圖10
noraxon
圖10.健康和中風組模型各類別的F1得分。NC,無補償;左前傾;TR,軀干旋轉;SE,肩部標高。
討論
本文提出了表面肌電bTCD方法,并驗證了其可行性。據我們所知,這是第一項基于9塊淺表軀干肌肉的表面肌電信號檢測健康受試者模擬軀干代償和中風受試者真實軀干代償的研究。此外,提出了一種基于最佳采樣筆閾值的活動段檢測方法,并分別用于檢測健康組和中風組的表面肌電信號的活動段。提取活動段中每個通道的五個復合時域特征以形成特征向量空間,包括RMS、VAR、MAV、WL和第四ARMC。使用SVM分類器,建立、訓練和測試了兩個四類模型,用于檢測三種軀干補償(LF、TR和SE補償)和NC運動,包括健康檢測模型和中風檢測模型。此外,還研究了通道數對分類的影響,結果表明,基于九個通道的兩種檢測模型均達到了最佳精度。因此,下面僅分析九個通道的實驗結果。
首先,基于健康組的表面肌電信號建立健康檢測模型。測試結果表明,每個類別的準確率均>90%(平均95.0%)。與88.6(Ranganathan等人,2017年)和85.9%(Taati等人,2012年)的準確度相比,使用本文提出的方法獲得了更高的檢測準確度。我們還選擇了AUC和F1- |