隱馬爾科夫模型——基本概念


前言

本文介紹了什么是隱馬爾科夫模型及其基本概念。學習資料來自李航《統計學習方法》和網絡博客。通過舉例加深對模型的理解,閱讀本文可以完全掌握隱馬的基本原理和符號表示。

什么是隱馬爾科夫

隱馬爾科夫模型由初始概率分布、狀態轉移概率分布以及觀測概率分布確定。隱馬爾科夫模型 λ 可以用三元符號表示:

λ=(A,B,π)
其中 A,B,λ 被稱為隱馬爾科夫模型的三要素。
此外,我們還有一些常見名詞:
所有可能狀態集合Q:
Q={q1,q2,...,qN}

所有可能觀測集合V:
V={v1,v2,...,vN}
長度為T的狀態序列I:
I=(i1,i2,...,iT)

與之對應的觀測序列O:
O=(o1,o2,...,oT)
狀態轉移概率矩陣:
A=[aij]NN
其中
aij=P(it+1=qj|it=qi)
是在t時刻處於狀態 qj 的條件下在時刻t+1轉移到狀態 qj 的概率。
觀測概率矩陣B:
B=[bj(k)]NM
其中
bj(k)=P(ot=vk|it=qk)
是在t時刻處於狀態 qj 的條件下生成觀測 vk 的概率。

模型舉例

假設有4個盒子,編號為A、B、C、D。每個盒子里面都裝有紅白兩種顏色的球。

盒子 A B C D
紅球數 5 3 6 8
白球數 5 7 4 2

按照一定的方法抽球:從4個盒子里面以等概論隨機選取一個盒子,從這個盒子里面隨機抽取1個求,記錄顏色后放回。然后再重新選取盒子,進行下一輪的抽取。每輪抽取的規則如下:
如果當前選取A盒子,那么下次必須選取B盒子;
如果當前選取B盒子,那么下次有0.4概率選取A盒子,0.6 概率選取C盒子;
如果當前選取C盒子,那么下次有0.4概率選取B盒子,0.6概率選取D盒子;
如果當前是D盒子,那么下次有0.5概率選取D盒子,0.5概率選取C盒子。

某次實驗中,我們按照某種次序,依次從五個盒子里共抽取了,得到球的顏色順序如下:{紅,紅,白,白,紅}
(設計如此“復雜”的規則是為了后面清晰地表明矩陣的含義)

模型與例子的變量對應說明

“盒子”對應狀態。本實驗中,狀態集合為:

Q={A,B,C,D}
“按照某種次序,依次從五個盒子里共抽取”明顯地,我們不知道是按照哪種盒子次序抽取的,抽取盒子的序列是不可觀測的,是 狀態序列
I=(XXXXX)
“球的顏色”對應觀測。本實驗中, 觀測集合是:
V={}
“抽取了五次,得到球的顏色順序如下:{紅,紅,白,白,紅}”對應 狀態觀測序列
O=()
”開始,從四個盒子 等概率選取一個盒子”對應 初始概率分布
π=(0.25,0.25,0.25,0.25)T
“如果當前選取XX盒子,那么下一個選取XX盒子”對應 狀態轉移概率
A=00.400100.4000.600.5000.60.5
Aij 代表,從i盒子轉移到j盒子,概率有多大
“每個盒子里各自的紅白球數”對應 觀測概率分布
B=0.50.30.60.80.50.70.40.2
Bij 代表,第i盒子第j種球抽到的概率有多大

兩個基本假設

  • 齊次馬爾科夫性假設:假設隱藏的馬爾科夫鏈在任意t時刻的狀態只依賴於前一時刻的狀態,與其他時刻的狀態及觀測無關。本實驗中,抽取下個盒子X的概率只跟抽取前一個盒子X有關,與其他時刻抽取盒子和抽取的球顏色沒有關系。
  • 觀測獨立性假設:假設任意時刻的觀測只依賴於該時刻的馬爾科夫鏈的狀態,與其他觀測及狀態無關。在本實驗中,抽取紅球和白球的概率只與當前抽取的盒子有關,與其他抽取球的顏色和抽取的盒子無關。

后續

隱馬爾科夫模型是關於時序的概率模型,描述由一個隱藏的馬爾科夫鏈隨機生成不可觀測的狀態序列,再由各個狀態隨機生成一個觀測而產生觀測序列的過程

如果你認真閱讀了例子和對應關系,我相信能夠比較清楚地理解什么是隱馬爾科夫模型了。本人水平有限,如有任何表達不清或錯誤地方,歡迎各位朋友交流指正。


注意!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系我们删除。



 
粤ICP备14056181号  © 2014-2021 ITdaan.com