可穿戴傳感器在健康應用中的多目標層次分類


引用

LaTex

@ARTICLE{7801131,
author={M. Janidarmian and A. Roshan Fekr and K. Radecka and Z. Zilic},
journal={IEEE Sensors Journal},
title={Multi-Objective Hierarchical Classification Using Wearable Sensors in a Health Application},
year={2017},
volume={17},
number={5},
pages={1421-1433},
keywords={accelerometers;biomedical telemetry;body sensor networks;feature selection;medical disorders;medical signal processing;optimisation;patient monitoring;pneumodynamics;remote sensing;signal classification;abdomen;accelerometer sensors;anterior-posterior diameter;breathing disorders;breathing function;chest wall;classification accuracy;classification performance;feature selection;global performance;health application;model selection problem;multiclass problem;multiclassification technique;multiobjective hierarchical classification;multiobjective optimization;respiratory patterns;rib cage;sensor number;sensor placement;tree-based hierarchical classification model;wearable remote monitoring system;wearable sensors;worst case sensitivity;Accelerometers;Calibration;Hidden Markov models;Lungs;Sensitivity;Sensors;Support vector machines;Respiration disorder;accelerometer sensor;classification;multi-objective optimization},
doi={10.1109/JSEN.2016.2645511},
ISSN={1530-437X},
month={March},}

Normal

M. Janidarmian, A. Roshan Fekr, K. Radecka and Z. Zilic, “Multi-Objective Hierarchical Classification Using Wearable Sensors in a Health Application,” in IEEE Sensors Journal, vol. 17, no. 5, pp. 1421-1433, March1, 1 2017.
doi: 10.1109/JSEN.2016.2645511
keywords: {accelerometers;biomedical telemetry;body sensor networks;feature selection;medical disorders;medical signal processing;optimisation;patient monitoring;pneumodynamics;remote sensing;signal classification;abdomen;accelerometer sensors;anterior-posterior diameter;breathing disorders;breathing function;chest wall;classification accuracy;classification performance;feature selection;global performance;health application;model selection problem;multiclass problem;multiclassification technique;multiobjective hierarchical classification;multiobjective optimization;respiratory patterns;rib cage;sensor number;sensor placement;tree-based hierarchical classification model;wearable remote monitoring system;wearable sensors;worst case sensitivity;Accelerometers;Calibration;Hidden Markov models;Lungs;Sensitivity;Sensors;Support vector machines;Respiration disorder;accelerometer sensor;classification;multi-objective optimization},
URL: http://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=7801131&isnumber=7845729


摘要

多分類技術
兩個分類問題的沖突的目標:分類准確度最壞情況敏感性

全局性能度量:總准確度 — 不夠

模型選擇問題

基於樹的層次分類模型
基於 — 六種不同分類器的集成

多目標優化

呼吸障礙的多類
一種可穿戴遠程監控系統

十例受試者的呼吸模式 — 99.25%准度,97.78%敏度(呼吸時,胸部前后徑變化,使用兩個加速度傳感器,戴於受試者肋骨和腹部)

傳感器的數目、位置,特征選擇,這些因素的影響


I 簡介

呼吸障礙 —》 不良健康問題

呼吸障礙的准確識別 《— 上氣道氣流與呼吸力

多導睡眠圖Polysomnography (PSG) — 在呼吸系統疾病診斷中的事實性金標准:不方便、昂貴、費時、需在實驗室進行;很少醫院提供PSG檢測,尤其農村地區。

呼吸障礙被忽視 —》 發展成為心血管的疾病的風險:中風與心力衰竭

另一診斷肺疾病引起的呼吸問題的傳統技術:聽診器
極依賴醫生經驗

移動健康技術的出現 + 普適感測、無線技術及數據處理技術的成熟 —》 呼吸問題遠程檢測,促進個體健康

遠程診斷 —》 監督分類問題
觀測屬性 —》 呼吸障礙類
分類器 —》 未見樣本,遠程地

本文:
慣性傳感器 + 新的機器學習技術 — 模擬 — 人體呼吸模式 —》 基於雲的呼吸問題識別


II 相關工作

機器學習技術:
1. 線性二次判別模型linear and quadratic discriminant model
2. 回歸樹方法regression tree method
3. 貝葉斯層次Bayesian hierarchical
4. 支持向量機Support Vector Machine (SVM)

阻塞性睡眠呼吸暫停
Obstructive Sleep Apnea (OSA)
的自動檢測
基於由心率變異性(HRV)和心電信號(EDR)信號
Heart Rate Variability (HRV) and ECG-derived respiration (EDR) signals
提取的特征

【1】
wavelet transform and an Artificial Neural Network (ANN) algorithm
小波變換與人工神經網絡
electroencephalogram (EEG) signal
腦電圖(EEG)信號
sleep apnea episodes
睡眠呼吸暫停發作 識別
—》
基波的四個頻帶:
delta (δ), theta (θ), alpha (α) and beta (β)

呼吸暫停 — δ頻帶以上
呼吸暫停發作結束 — 從δ到θ和α,4∼14Hz

敏度 — ~69.64%
特異性 — ~44.44%

【2】
實時便攜式呼吸暫停低通氣檢測系統
基於
使用Gaussian Radial Basis Function (GRBF)高斯徑向基函數的SVM + 口鼻氣流信號

檢測准度 — 93.4% 與 91.8%:8個不同受試者,脫機和聯機測試

雖然有用 — 需信號 — 醫院,實驗室 — 不能提供自動無線遠程監測

正常呼吸狀態 –》 分類異常呼吸的方法
例如:
1. 【3】多層感知器神經網絡分類器 + 肺活量測量數據:總准度、敏度、特異性 — 97.6%, 97.5% 與 98.8%
2. 【4】二元分類問題 — 肺功能試驗與神經網絡:准度92%
3. 【5】徑向基函數神經網絡 + 流量計肺活量計 — 區分正常與阻塞性異常:准度90%
4. 【6】一種組合的二相繼二進神經網絡分類器 — 正常、阻塞性和限制性呼吸模式 — 正常與異常模式(第一個分類器)+ 阻塞性和限制性呼吸模式(第二類二元分類):平均准度92.5%
5. 【7】SVM分類器 + 線性和二階多項式核 —》 OSA自動識別 — Polysomnographic data 多導睡眠圖數據(50例OSA患者和50例對照組,不同類型的特征:HRV、呼吸、血氧飽和度及綜合特征):血氧飽和度 — 最好特異性(98%),呼吸力度 — 最高敏度(72%),敏度 — 25%(線性核)-》60%(多項式核)— 對於血氧飽和度 :::分時分類總精度達80% + 主題分類95%
6. 【8】胸腹部呼吸信號的相位差 — 准度80–90% — 從OSA選擇的1-min段和對照組的分類
7. 【9】非接觸式監測系統 — 床下六個稱重傳感器 – 監測運動、心率和呼吸 — 貝葉斯分類器 + 不同特征 — 正常呼吸,中樞性和阻塞性睡眠呼吸暫停:准度、最小敏度 — 76.89% 與 65%

呼吸音 — 呼吸疾病 — 流感、肺炎和支氣管炎
1. 【10】MelFrequency Cepstral Coefficients (MFCC) — 特征 — SVM — 正常、阻塞性病理氣道及實質病理學 — 平均分類准確度:90.77%
2. 【11】二元分類技術 — 基於 最大似然法 — Hidden Markov Models (HMMs) 隱馬爾可夫模型 — 特征提取階段:心肺音 — 肺音 - 81.3% + 心肺音 - 83%
3. 【12】Pulmonary Emphysema (PE) diagnosis 肺氣腫(PE)的診斷 — 83.9%

呼吸音/
呼吸音 + 心音

呼吸音 — 視為 帶限或寬帶噪聲 — 強化的信號處理

【13】 — 本文作者
加速度傳感器 — 9種不同的呼吸模式
6個不同分類器
SVM — 97.50%;
Decision Tree Bagging (DTB) — 97.37%

這里寫圖片描述

這里寫圖片描述

這里寫圖片描述

這里寫圖片描述


本文工作

分類准確度 + 模型的最小敏度

不同分類器的層次集合


III 提出的方法


A 三軸加速度傳感器標定

技術或硬件異常
標定降級或電池故障
偏移、比例因子、非線性或電子噪聲的變化

具有專業經驗的專用工具

6個靜止位置
幾秒鍾的加速度計原始數據在每個位置
傳感器在這些靜止位置上的錯位 — 影響標定過程 —— 帶有測角器的兩個盒子 幫助固定

最小二乘法

傳感器質量與臨界性 — 人工標定頻率

標定過程:

這里寫圖片描述

向量 ω :6個固定位置收集的加速度傳感器原始數據
向量 y :已知的歸一化地球重力矢量
矩陣 X :由下式決定的標定參數

這里寫圖片描述

標定矩陣只算一次


B 數據分割與特征提取

定義:基於運動傳感器提取的 p 個特征,給定標簽集 W = { w 1 , w 2 , , w m } 和同樣大小的時間窗,呼吸模式標簽集 A = { a 1 , a 2 , , a n } ,目標為 — 尋找最好分類器模型,以使對於任意 w k (包含特征集 F k = { f k , 1 , f k , 2 , , f k , p } ),所預測的標簽 a ^ k = C ( F k ) 與在 w k 期間的實際呼吸模式盡可能相同。

呼吸問題包括:
1. Bradypnea
2. Tachypnea
3. Kussmaul
4. Cheyn–stokes
5. OSA
6. Biot’s breathing
7. Sighing
8. Apneustic


- 呼吸徐緩
- 呼吸急促
- 呼吸深慢 — 一種過度換氣
- 查恩-斯托克斯 — 逐漸增加再降低
- 阻塞性睡眠呼吸暫停 — 與比奧呼吸相似,但在肋骨與腹部間有不同的階段轉換
- 比奧呼吸 — 快速呼吸 再 呼吸暫停正常周期
- 嘆息 — 過度換氣綜合征:深周期性吸氣的高不規則呼吸 - 無明顯器質性疾病的焦慮
- 無氣門的 — 延長的吸氣相+ 擴大的呼氣相 - 腦橋上部損傷

這里寫圖片描述

這里寫圖片描述

數據分割為 — Fixed-size Overlapping Sliding Window (FOSW) 固定尺寸重疊滑動窗口:窗大小 — 13秒,重疊 — 90%

識別過程:
1. 從兩個運動傳感器(圖1)收集數據
2. 特征提取過程 — 強化每個呼吸模式的獨特性 + 呼吸模式分類的信號的更易於處理的表示

數據特征:
1. 時間域特征 — cheaper 廉價
2. 頻率域特征 — 采樣率高 以捕捉每個窗口的所有相關頻率

故本文使用時間域特征 — 輕量級的 — 減少延遲和功耗 - 在線分類

窗口數據 — 特征
- Mean
- Standard Deviation (SD)
- Respiration Rate ( R R = P × 60 w s ; P 為局部極大值的數目, w s 表示秒數表示的窗口大小)
- 平均呼吸時間參數:吸氣時間( T i ),呼氣時間( T e
- 平均傾斜角(滾轉和俯仰)
- 窗口大小為 t T V ; t = 3 )時的平均基於加速度計的呼吸量
- 平均潮氣量變率( T V v a r ; t = 3
- AB與RC間的平均相移( θ
- 符號聚集近似 Symbolic Aggregate approXimation SAX (間隔 w = 3 ,字母表示尺寸 α = 4

本文選擇了
均值標准差


C 特征選擇

  • 降低冗余
  • 減少維度

基礎假設,好的特征集:
- 與類高度相關
- 相互之間不相關

  • filter方法:不考慮模型
  • wrapper方法:基於目標學習算法評估特征子集

基於相關性的特征選擇 Correlation-based Feature Selection (CFS) — filter
CFS優於wrapper — 小的數據集
計算成本不高 — 不會重復調用學習算法

CFS — 啟發式搜索策略 — 最大化如下目標:

這里寫圖片描述

M s — 具有 k 個特征的特征子集的啟發式價值
r ¯ c f — 平均特征-類相關性
r ¯ f f — 平均特征-特征互相關

CFS由空特征子集開始,使用向前最優搜索方法;終止 — 5個相繼完全展開子集對於當前最優子集無提升


D 分類算法

監督式方法 — 離散特征時使用類標簽 —》 在數據分割及特征選擇前訓練集被標記

選用的分類算法:

  • 決策樹 Decision Tree (DT)
  • 判別分析 Discriminant Analysis (DA)
  • k -近鄰 k -Nearest Neighbors
  • 支持向量機 Support Vector Machines (SVM)
  • 朴素貝葉斯 Naïve Bayes (NB)
  • 神經網絡 Neural Networks (NN)

用二元結構生成分類層
自上而下,二元樹形式
特征向量沿着樹枝行進

這里寫圖片描述


E 進化層次模型

  • 最大化分類准確度
  • 最優化每個類的分類率(識別系統中通常不討論 — 對每個類均取得高准確度)

基於Pareto的多目標遺傳進化算法
潛在優勢 — 多目標技術 防止 陷入局部最優 — 提升模型准確度

1)層次二元樹結構

  • 內部節點 — 二元分類器
  • 葉節點 — 呼吸模式(類)

自上而下構建

開始於一個二元分類器,兩個組(分別有 m n 個類) — G n G m = G l , G m , G n G m = , l = 9 .

G l G 1 分別表示樹的根與葉
分類器數目為 l 1

基於二元樹的層次分類法 — 高准確率 + 低運算復雜度 — 廣泛接受

樹的數目如下得到:

這里寫圖片描述

M — 具有 | M | 個方法的分類器集合

但如上的完全搜索是不可能的 — 上百萬的可行的二元樹( > 3 , 000 , 000 )—》 EA — 近似最優解(合理時間內有效采樣大搜索空間)

使用了多目標遺傳算法 Genetic Algorithm (GA) — NSGA-II 的變體

  • 較好適應值
  • 提升種群多樣性(即使適應值較低)

染色體 — 雙層
C = ( C c l a s s , C m o d e l )

亞染色體

  • C c l a s s = ( C c l a s s [ 1 ] , C c l a s s [ 2 ] , , C c l a s s [ l ] ) — 終端節點從屬的點 j , j = 1 , 2 , , l , 在區間 [ 1 , l 1 ] 的整數
  • C m o d e l = ( C m o d e l [ 1 ] , C m o d e l [ 2 ] , , C m o d e l [ l 1 ] ) — 每個節點的分類器類型 i { 1 , 2 , , l 1 } , C m o d e l [ i ] M , 為區間 [ 1 , | M | ] 的整數

可行解判定條件:

這里寫圖片描述

Eq(6)— 保證圖為二叉樹,每個節點最多有兩個子代
Eq(7)— 檢查是否有地方( p j > 0 )在下一步添加一個類或分類器
s i z e ( C c l a s s == j ) — 返回 C c l a s s j 的地方的總數

這里寫圖片描述

算法1給出了二叉樹生成過程及條件
算法由在樹的根部的第一個節點 n 1 開始、
f r e e P o s i t i o n s — 在每次迭代存儲樹中可用位置的數組 — s i z e ( f r e e P o s i t i o n s ( j ) ) = p j ,在第 j 次迭代
行3 — 驗證Eq(7)— :
- 若 s i z e ( i n d i c e s ) = 1 (行13)- 左孩子為葉節點(行14)+ 節點 n 2 為右子樹的根(行16);
- 若 s i z e ( i n d i c e s ) = 0 — 節點 n 2 n 3 分別作為左右子樹的根(行9-12);
- 若 s i z e ( i n d i c e s ) = 2 — 添加相應的類標簽作為左右葉節點(行18-19);
- 否則, v a l i d a t i o n F l a g 標示染色體不是有效樹

行5 — 基於 C m o d e l [ i ] 的值確定分類器 n i 的類型。

圖4為示例

這里寫圖片描述

M = { D T , N B , D A , k N N , S V M , N N }
| M | = 6

2)適應度函數

  • 最大化分類准確度 — 性能度量 – 正確分類所占總分類實例的比例Eq(9)
  • 對於每個類的可接受准確度級別

這里寫圖片描述

混淆矩陣 confusion matrix C M — 每行為一個真實類中的實例,每列為在一個預測類中的實例:即,每個類的准確預測的試驗所占相應類的全部試驗數目的最低百分比
此兩個目標,在一定級別后,通常是在優化過程中是相互沖突的
多類分類的靈敏度:

這里寫圖片描述

S e n s i t i v i t y ( i ) — 准確識別為是類 i 的模式數相對於類 i 中模式的總數的比例(類 i 的敏感度)

分類器的靈敏度為:

這里寫圖片描述

主要目標可總結如下:

這里寫圖片描述

二維度量 — ( S , A ) — 二者大體來說為非合作性的
在學習過程開始時 — 能為合作性的
在一定級別過后 — 競爭性的 — 一個目標的提升 - 另一個惡化
目標 — 尋找層次樹結構模型 — 同時優化兩個目標:整個數據集的全局性能 + 每個類的性能

使用的GA的基本遺傳算子為:選擇、交叉、變異
錦標賽選擇tournament selection,自適應可行突變adaptive feasible mutation,兩點交叉two points crossover

種群大小 — 30
代數 — 50


IV 實驗結果


A 試驗設置

10個健康志願者:5男5女 — 27 ~ 48 ( 34.80 ± 6.89
麥克吉爾大學倫理委員會 — McGill University Ethics Committee — 支持

每人試驗持續約35分鍾。
提供9種呼吸模式 — 1分鍾/種,坐姿(軀干與地面約呈90°角)

SPR-BTA 肺活量計

具有12位分辨率的兩個LIS3DH三軸加速度計
胸骨中段 + 臍區
50Hz采樣


B 演化層次模型的性能評估

10重交叉驗證

圖5為准確度與靈敏度

這里寫圖片描述

最壞情況靈敏度( S )— 橫軸
准確率( A )— 縱軸

這里寫圖片描述

p — 估計的先驗概率最小值: 1 l l 個類)
(a)-(b):一個傳感器分別在肋骨與腹部
(e)-(h):部分放大

上肋骨 upper rib cage (RC)
下肋骨/腹部 lower rib cage/abdomen (AB) — 效果較好

基於相關性的特征選擇 Correlation-based Feature Selection (CFS)

(c)(d)(g)(h)— CFS特征選擇后的結果

表II總結了選擇的特征:

這里寫圖片描述

特征冗余度降低:
- 66%(27 -> 9)— 單傳感器 — ( S , A ) = ( 87.23 % , 92.06 % ) (Acc1) + { ( 89.74 % , 94.77 % ) , ( 88.64 % , 95.06 % ) } (Acc2)
- 雙傳感器 - ( 97.78 % , 99.25 % ) -> ( 93.02 % , 95.44 % ) (圖6)

這里寫圖片描述

平均特征數目:55 -> 14 (74.55%)
准確率降低:<4%
靈敏度降低:<5%
每個類:97% -> 93%

圖7為每個類的靈敏度與誤分類率

這里寫圖片描述

誤分類率計算:

這里寫圖片描述

表III — 單目標與多目標算法比較

這里寫圖片描述

K 重交叉驗證
Leave-One-Subject-Out (LOSO) — 目標獨立交叉驗證 — 反映了主題間變異性 + 在未見數據檢測

使用所有檢測者(除了一個)的數據訓練
利用排除的那個進行驗證
對所有的10個受試者均進行
准確率值降低:
- 單目標 — 7.19% 6.83% 6.93% (Acc1, Acc2, Both)平均6.98%
- 集合模型 — 准確率 + 靈敏度 降低:5.92% + 6.55%

降低原因 — 驗證過程中的測試者間的變異

時間優勢:
訓練的計算復雜度高
使用模型分類效率更高 — 3.22倍快於多類別SVM分類器模型 — 每個內部節點的分類器的計算復雜度遠低於帶糾錯輸出碼(error correcting output codes,ECOC)的9-類別SVM


V 結論

傳感器技術 — 數據

機器學習技術

多目標

EA

多種分類器集成

層次模型

二叉樹


參考文獻

【1】R. Lin, R. Lee, C. Tseng, H. Zhou, C. Chao, and J. Jiang, “A new approach for identifying sleep apnea syndrome using wavelet transform and neural networks,” Biomed. Eng. Appl. Basis Commun., vol. 18, no. 3, pp. 138–143, 2006.
【2】B. Koley and D. Dey, “Adaptive classification system for real-time detection of apnea and hypopnea events,” in Proc. IEEE Point–Care Healthcare Technol., Jan. 2013, pp. 42–45.
【3】S. Jafari, H. Arabalibeik, and K. Agin, “Classification of normal and abnormal respiration patterns using flow volume curve and neural network,” in Proc. Int. Symp. Health Inform. Bioinform. (HIBIT), Apr. 2010, pp. 110–113.
【4】V. Mahesh and S. Ramakrishnan, “Assessment and classification of normal and restrictive respiratory conditions through pulmonary function test and neural network,” J. Med. Eng. Techno., vol. 31, no. 4, pp. 300–304, 2007.
【5】V. Mahesh and S. Ramakrishnan, “Detection of obstructive respiratory abnormality using flow–volume spirometry and radial basis function neural networks,” J. Med. Syst., vol. 31 no. 6, pp. 461–465, 2007.
【6】M. J. Baemani, M. Amirhasan, and P. Moallem, “Detection of respiratory abnormalities using artificial neural networks,” J. Comput. Sci., vol. 4, no. 8, pp. 663–667, 2008.
【7】M. Al-Angari and V. Sahakian, “Automated recognition of obstructive sleep apnea syndrome using support vector machine classifier,” IEEE Trans. Inf. Technol. Biomed., vol. 16, no. 3, pp. 463–468, May 2012.
【8】P. Varady, S. Bongar, and Z. Benyo, “Detection of airway obstructions and sleep apnea by analyzing the phase relation of respiration movement signals,” IEEE Trans. Instrum. Meas., vol. 52, no. 1, pp. 2–6, Feb. 2003.
【9】Z. T. Beattie, C. C. Hagen, M. Pavel, and T. L. Hayes, “Classification of breathing events using load cells under the bed,” in Proc. Conf., Sep. 2009, pp. 3921–3924.
【10】R. Palaniappan and K. Sundaraj, “Respiratory sound classification using cepstral features and support vector machine,” in Proc. IEEE Recent Adv. Intell. Comput. Syst. (RAICS), Dec. 2013, pp. 132–136.
【11】M. Yamashita, M. Himeshima, and S. Matsunaga, “Robust classification between normal and abnormal lung sounds using adventitious-sound and heart-sound models,” in Proc. IEEE Int. Conf. Acoust., Speech Signal Process. (ICASSP), May 2014, pp. 4418–4422.
【12】T. Okubo, N. Nakamura, M. Yamashita, and S. Matsunaga, “Classification of healthy subjects and patients with pulmonary emphysema using continuous respiratory sounds,” in Proc. 36th Annu. Int. Conf. IEEE Eng. Med. Biol. Soc. (EMBC), Aug. 2014, pp. 70–73.
【13】A. R. Fekr, M. Janidarmian, K. Radecka, and Z. Zilic, “Respiration disorders classification with informative features for m-health applications,” IEEE J. Biomed. Health Inform., vol. 20, no. 3, pp. 733–747, May 2016.


注意!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系我们删除。



 
粤ICP备14056181号  © 2014-2021 ITdaan.com