使用隐马尔科夫模型Viterbi算法解决词性标注问题
2011-07-26 10:58
525 查看
中文的有些单词对应多个词性,所以给词标注词性是需要研究的问题。解决此问题的一个方法是从单词的所有可能的词性中选出其最常用的词性作为这个词的词性,也就是一个概率最大的词性。隐马尔可夫模型同时考虑到了次的生成概率与词性之间的转移概率,所以能够提高词性的准确率。
隐马尔可夫模型(Hidden Markov Model, HMM)中有隐状态和显状态。隐状态之间有转移概率。在初始概率、转移概率、发射概率以及显状态已知的情况下,可以从观测到的显状态序列中计算出可能性最大的隐状态,这个算法是Viterbi算法。
那么什么是HMM,什么是Viterbi算法,它们又是怎么在词性标注中起作用的。
刚读到“隐马尔科夫模型”的时候,只是觉得这个耳熟。但是没真正接触过,不知道到底讲的什么,继续往下看的过程中,发现了“转移矩阵”、“发射矩阵”、初始概率。看到作者画的几个矩阵表和简单的形式化语言,才知道不懂得这个模型根本无法继续下去。
幸好有高人指点,没费多大功夫就入了门。
(1)马尔科夫性
如果一个过程的“将来”仅依赖“现在”而不依赖“过去”,则此过程具有马尔可夫性,或称此过程为马尔可夫过程 用函数表示为 X(t+1) = f( X(t) ) (2)马尔可夫链
1.时间和状态都离散的马尔科夫过程称为马尔科夫链 记作{Xn= X(n), n = 0,1,2,…} –在时间集T1 ={0,1,2,…}上对离散状态的过程相继观察的结果 –链的状态空间记做I= {a1,a2,…},ai∈R. 条件概率Pij ( m,m+n)=P{Xm+n= aj|Xm= ai}为马氏链在时刻m处于状态ai条件下,在时刻m+n转移到状态aj的转移概率。 关于转移矩阵的举例: 晴天 阴天 下雨晴天 0.50 0.25 0.25阴天 0.375 0.25 0.375下雨 0.25 0.125 0.625 由于链在时刻m从任何一个状态ai出发,到另一时刻m+n,必然转移到a1,a2…,诸状态中的某一个,所以有当Pij(m,m+n)与m无关时,称马尔科夫链为齐次马尔科夫链,通常说的马尔科夫链都是指齐次马尔科夫链。 (3)HMM概念 HMM的状态是不确定或不可见的,只有通过观测序列的随机过程才能表现出来; 观察到的事件与状态并不是一一对应,而是通过一组概率分布相联系; HMM是一个双重随机过程,两个组成部分: – 马尔可夫链:描述状态的转移,用转移概率描述。 – 一般随机过程:描述状态与观察序列间的关系, 用观察值概率描述。 (4)HMM的组成
![](https://oscdn.geek-share.com/Uploads/Images/Content/201908/07/c499874531e39e6318b9c097fea3c6c4.gif)
(5)HMM的基本要素
![](https://oscdn.geek-share.com/Uploads/Images/Content/201908/07/2b1a2c29c81af79ddb627620d310bab5.gif)
实例内容描述如下: n设有N个缸,每个缸中装有很多彩球,球的颜色由一组概率分布描述。实验进行方式如下 –根据初始概率分布,随机选择N个缸中的一个开始实验 –根据缸中球颜色的概率分布,随机选择一个球,记球的颜色为O1,并把球放回缸中 –根据描述缸的转移的概率分布,随机选择下一口缸,重复以上步骤。 最后得到一个描述球的颜色的序列O1,O2,…,称为观察值序列O。
(6)HMM所要解决的问题
![](https://oscdn.geek-share.com/Uploads/Images/Content/201908/07/e567f18d310d83b4740a35097c31dc77.gif)
解决问题一<基础方法>
![](https://oscdn.geek-share.com/Uploads/Images/Content/201908/07/3edceb65f1b0e66fbcf7f284bd3c3730.gif)
解决问题一<前向法>
![](https://oscdn.geek-share.com/Uploads/Images/Content/201908/07/29453fe8306be4470ab89b532a9c0fcb.gif)
前向法示意图
![](https://oscdn.geek-share.com/Uploads/Images/Content/201908/07/ddd137856fbcf4ae8f9912b1d6eb88fa.gif)
解决问题一<后向法>
![](https://oscdn.geek-share.com/Uploads/Images/Content/201908/07/0bd9c0f66a0b16980449031b7a8b8511.gif)
解决问题二<Viterbi算法>
![](https://oscdn.geek-share.com/Uploads/Images/Content/201908/07/1d5e61372221a01175f45ff7b3aa435e.gif)
![](https://oscdn.geek-share.com/Uploads/Images/Content/201908/07/d47e3b1fb897f6a3688bfcfa256d8638.gif)
解决问题三<Baum-Welch算法(模型训练算法)> 目的:给定观察值序列O,通过计算确定一个模型l, 使得P(O|l)最大。 算法步骤: 1. 初始模型(待训练模型)l0
2. 基于l0以及观察值序列O,训练新模型 l;
3. 如果 log P(X|l)- log(P(X|l0) < Delta,说明训练已经达到预期效果, 算法结束。
4. 否则,令l0=l,继续第2步工作
![](https://oscdn.geek-share.com/Uploads/Images/Content/201908/07/717d6a4d234faf21e4c178e17a8beac9.gif)
在词性的标注过程中,用的HMM模型就是第二种问题。
一个形象的例子。
假设这样的一个场景:动物园里的cow(牛)发出moo(牟)和hello(打招呼)两种叫声,duck(鸭子)发出quack(噶)和hello(打招呼)两种叫声。
如果只听到hello、quack、moo...的叫声,要猜测这些声音究竟是牛还是鸭子发出的。
如果把动物发出的声音当成它们的语言,那么犹如下一个简化版本的语言模型描述:
start :go(cow,1.0)
cow:emit(moo,0.9) emit(hello,0.1) go(cow,0.5) go(duck,0.3) go(end,0.2)
duck:emit(quack,0.6) emit(hello,0.4) go(duck,0.5) go(cow,0.3) go(end,0.2)
代表的转移概率矩阵是:
代表的发射概率(混淆矩阵)矩阵是:
听到的声音作为输入:moo hello quack Viterbi求解的主要代码如下:
MaxProb(DUCK,hello)=MaxProb(COW,moo)*TransProb(COW,DUCK)*EmitProb(DUCK,hello)=0.9*0.3*0.4=0.108
MaxProb(DUCK,quack)=MaxProb(DUCK,hello)*TransProb(DUCK,DUCK)*EmitProb(DUCK,quack)=0.108*0.5*0.6=0.0324
MaxProb(DUCK,quack)=MaxProb(COW,hello)*TransProb(COW,DUCK)*EmitProb(DUCK,quack)=0.045*0.3*0.6=0.0081
MaxPob(END,end)=MaxProb(DUCK,quack)*TransProb(DUCK,END)*EmitProb(END,end)=0.0324*0.2*1=0.00648
执行回溯过程发现最佳隐状态,所以猜测输出为 COW DUCK DUCK
隐马尔可夫模型(Hidden Markov Model, HMM)中有隐状态和显状态。隐状态之间有转移概率。在初始概率、转移概率、发射概率以及显状态已知的情况下,可以从观测到的显状态序列中计算出可能性最大的隐状态,这个算法是Viterbi算法。
那么什么是HMM,什么是Viterbi算法,它们又是怎么在词性标注中起作用的。
刚读到“隐马尔科夫模型”的时候,只是觉得这个耳熟。但是没真正接触过,不知道到底讲的什么,继续往下看的过程中,发现了“转移矩阵”、“发射矩阵”、初始概率。看到作者画的几个矩阵表和简单的形式化语言,才知道不懂得这个模型根本无法继续下去。
幸好有高人指点,没费多大功夫就入了门。
(1)马尔科夫性
如果一个过程的“将来”仅依赖“现在”而不依赖“过去”,则此过程具有马尔可夫性,或称此过程为马尔可夫过程 用函数表示为 X(t+1) = f( X(t) ) (2)马尔可夫链
1.时间和状态都离散的马尔科夫过程称为马尔科夫链 记作{Xn= X(n), n = 0,1,2,…} –在时间集T1 ={0,1,2,…}上对离散状态的过程相继观察的结果 –链的状态空间记做I= {a1,a2,…},ai∈R. 条件概率Pij ( m,m+n)=P{Xm+n= aj|Xm= ai}为马氏链在时刻m处于状态ai条件下,在时刻m+n转移到状态aj的转移概率。 关于转移矩阵的举例: 晴天 阴天 下雨晴天 0.50 0.25 0.25阴天 0.375 0.25 0.375下雨 0.25 0.125 0.625 由于链在时刻m从任何一个状态ai出发,到另一时刻m+n,必然转移到a1,a2…,诸状态中的某一个,所以有当Pij(m,m+n)与m无关时,称马尔科夫链为齐次马尔科夫链,通常说的马尔科夫链都是指齐次马尔科夫链。 (3)HMM概念 HMM的状态是不确定或不可见的,只有通过观测序列的随机过程才能表现出来; 观察到的事件与状态并不是一一对应,而是通过一组概率分布相联系; HMM是一个双重随机过程,两个组成部分: – 马尔可夫链:描述状态的转移,用转移概率描述。 – 一般随机过程:描述状态与观察序列间的关系, 用观察值概率描述。 (4)HMM的组成
![](https://oscdn.geek-share.com/Uploads/Images/Content/201908/07/c499874531e39e6318b9c097fea3c6c4.gif)
(5)HMM的基本要素
![](https://oscdn.geek-share.com/Uploads/Images/Content/201908/07/2b1a2c29c81af79ddb627620d310bab5.gif)
实例内容描述如下: n设有N个缸,每个缸中装有很多彩球,球的颜色由一组概率分布描述。实验进行方式如下 –根据初始概率分布,随机选择N个缸中的一个开始实验 –根据缸中球颜色的概率分布,随机选择一个球,记球的颜色为O1,并把球放回缸中 –根据描述缸的转移的概率分布,随机选择下一口缸,重复以上步骤。 最后得到一个描述球的颜色的序列O1,O2,…,称为观察值序列O。
(6)HMM所要解决的问题
![](https://oscdn.geek-share.com/Uploads/Images/Content/201908/07/e567f18d310d83b4740a35097c31dc77.gif)
解决问题一<基础方法>
![](https://oscdn.geek-share.com/Uploads/Images/Content/201908/07/3edceb65f1b0e66fbcf7f284bd3c3730.gif)
解决问题一<前向法>
![](https://oscdn.geek-share.com/Uploads/Images/Content/201908/07/29453fe8306be4470ab89b532a9c0fcb.gif)
前向法示意图
![](https://oscdn.geek-share.com/Uploads/Images/Content/201908/07/ddd137856fbcf4ae8f9912b1d6eb88fa.gif)
解决问题一<后向法>
![](https://oscdn.geek-share.com/Uploads/Images/Content/201908/07/0bd9c0f66a0b16980449031b7a8b8511.gif)
解决问题二<Viterbi算法>
![](https://oscdn.geek-share.com/Uploads/Images/Content/201908/07/1d5e61372221a01175f45ff7b3aa435e.gif)
![](https://oscdn.geek-share.com/Uploads/Images/Content/201908/07/d47e3b1fb897f6a3688bfcfa256d8638.gif)
解决问题三<Baum-Welch算法(模型训练算法)> 目的:给定观察值序列O,通过计算确定一个模型l, 使得P(O|l)最大。 算法步骤: 1. 初始模型(待训练模型)l0
2. 基于l0以及观察值序列O,训练新模型 l;
3. 如果 log P(X|l)- log(P(X|l0) < Delta,说明训练已经达到预期效果, 算法结束。
4. 否则,令l0=l,继续第2步工作
![](https://oscdn.geek-share.com/Uploads/Images/Content/201908/07/717d6a4d234faf21e4c178e17a8beac9.gif)
在词性的标注过程中,用的HMM模型就是第二种问题。
一个形象的例子。
假设这样的一个场景:动物园里的cow(牛)发出moo(牟)和hello(打招呼)两种叫声,duck(鸭子)发出quack(噶)和hello(打招呼)两种叫声。
如果只听到hello、quack、moo...的叫声,要猜测这些声音究竟是牛还是鸭子发出的。
如果把动物发出的声音当成它们的语言,那么犹如下一个简化版本的语言模型描述:
start :go(cow,1.0)
cow:emit(moo,0.9) emit(hello,0.1) go(cow,0.5) go(duck,0.3) go(end,0.2)
duck:emit(quack,0.6) emit(hello,0.4) go(duck,0.5) go(cow,0.3) go(end,0.2)
代表的转移概率矩阵是:
cow | duck | end | |
---|---|---|---|
start | 1.0 | 0 | 0 |
cow | 0.5 | 0.3 | 0.2 |
duck | 0.3 | 0.5 | 0.2 |
moo | hello | quack | |
cow | 0.9 | 0.1 | 0 |
duck | 0 | 0.4 | 0.6 |
import java.awt.*; import java.util.*; import java.text.*; import java.awt.event.*; import java.applet.*; class Symbol { public String name; public Symbol(String s) { name = s; } } class SymbolTable { Hashtable table; public SymbolTable() { table = new Hashtable(); } public Symbol intern(String s) { s = s.toLowerCase(); Object sym = table.get(s); if (sym == null) { sym = new Symbol(s); table.put(s, sym); } return (Symbol)sym; } } class SymbolList { Vector list; public SymbolList() { list = new Vector(); } public int size() { return list.size(); } public void set(int index, Symbol sym) { list.setElementAt(sym, index); } public void add(Symbol sym) { list.addElement(sym); } public Symbol get(int index) { return (Symbol) list.elementAt(index); } } class IntegerList { Vector list; public IntegerList() { list = new Vector(); } public int size() { return list.size(); } public void set(int index, int i) { list.setElementAt(new Integer(i), index); } public void add(int i) { list.addElement(new Integer(i)); } public int get(int index) { return ((Integer)list.elementAt(index)).intValue(); } } class ProbTable { Hashtable table; public ProbTable() { table = new Hashtable(); } public void put(Object obj, double prob) { table.put(obj, new Double(prob)); } public double get(Object obj) { Double prob = (Double)table.get(obj); if (prob == null) { return 0.0; } return prob.doubleValue(); } // normalize probability public void normalize() { double total = 0.0; for(Enumeration e = table.elements() ; e.hasMoreElements() ;) { total += ((Double)e.nextElement()).doubleValue(); } if (total == 0.0) { return; // div by zero! } for(Enumeration e = table.keys() ; e.hasMoreElements() ;) { Object k = e.nextElement(); double prob = ((Double)table.get(k)).doubleValue(); table.put(k, new Double(prob / total)); } } } class State { public String name; ProbTable emits; ProbTable linksto; public State(String s) { name = s; emits = new ProbTable(); linksto = new ProbTable(); } public void normalize() { emits.normalize(); linksto.normalize(); } public void addSymbol(Symbol sym, double prob) { emits.put(sym, prob); } public double emitprob(Symbol sym) { return emits.get(sym); } public void addLink(State st, double prob) { linksto.put(st, prob); } public double transprob(State st) { return linksto.get(st); } } class StateTable { Hashtable table; public StateTable() { table = new Hashtable(); } public State get(String s) { s = s.toUpperCase(); State st = (State)table.get(s); if (st == null) { st = new State(s); table.put(s, st); } return st; } } class StateIDTable { Hashtable table; public StateIDTable() { table = new Hashtable(); } public void put(State obj, int i) { table.put(obj, new Integer(i)); } public int get(State obj) { Integer i = (Integer)table.get(obj); if (i == null) { return 0; } return i.intValue(); } } class StateList { Vector list; public StateList() { list = new Vector(); } public int size() { return list.size(); } public void set(int index, State st) { list.setElementAt(st, index); } public void add(State st) { list.addElement(st); } public State get(int index) { return (State) list.elementAt(index); } } class HMMCanvas extends Canvas { static final int grid_x = 60; static final int grid_y = 40; static final int offset_x = 70; static final int offset_y = 30; static final int offset_y2 = 10; static final int offset_y3 = 65; static final int col_x = 40; static final int col_y = 10; static final int state_r = 10; static final Color state_fill = Color.white; static final Color state_fill_maximum = Color.yellow; static final Color state_fill_best = Color.red; static final Color state_boundery = Color.black; static final Color link_normal = Color.green; static final Color link_processed = Color.blue; static final Color link_maximum = Color.red; HMMDecoder hmm; public HMMCanvas() { setBackground(Color.white); setSize(400,300); } public void setHMM(HMMDecoder h) { hmm = h; } private void drawState(Graphics g, int x, int y, Color c) { x = x * grid_x + offset_x; y = y * grid_y + offset_y; g.setColor(c); g.fillOval(x-state_r, y-state_r, state_r*2, state_r*2); g.setColor(state_boundery); g.drawOval(x-state_r, y-state_r, state_r*2, state_r*2); } private void drawLink(Graphics g, int x, int y0, int y1, Color c) { int x0 = grid_x * x + offset_x; int x1 = grid_x * (x+1) + offset_x; y0 = y0 * grid_y + offset_y; y1 = y1 * grid_y + offset_y; g.setColor(c); g.drawLine(x0, y0, x1, y1); } private void drawCenterString(Graphics g, String s, int x, int y) { x = x - g.getFontMetrics().stringWidth(s)/2; g.setColor(Color.black); g.drawString(s, x, y+5); } private void drawRightString(Graphics g, String s, int x, int y) { x = x - g.getFontMetrics().stringWidth(s); g.setColor(Color.black); g.drawString(s, x, y+5); } public void paint(Graphics g) { if (hmm == null) { return; } DecimalFormat form = new DecimalFormat("0.0000"); int nsymbols = hmm.symbols.size(); int nstates = hmm.states.size(); // complete graph. for(int i = 0; i < nsymbols; i++) { int offset_ymax = offset_y2+nstates*grid_y; if (i < nsymbols-1) { for(int y1 = 0; y1 < nstates; y1++) { for(int y0 = 0; y0 < nstates; y0++) { Color c = link_normal; if (hmm.stage == i+1 && hmm.i0 == y0 && hmm.i1 == y1) { c = link_processed; } if (hmm.matrix_prevstate[i+1][y1] == y0) { c = link_maximum; } drawLink(g, i, y0, y1, c); if (c == link_maximum && 0 < i) { double transprob = hmm.states.get(y0).transprob(hmm.states.get(y1)); drawCenterString(g, form.format(transprob), offset_x + i*grid_x + grid_x/2, offset_ymax); offset_ymax = offset_ymax + 16; } } } } // state circles. for(int y = 0; y < nstates; y++) { Color c = state_fill; if (hmm.matrix_prevstate[i][y] != -1) { c = state_fill_maximum; } if (hmm.sequence.size() == nsymbols && hmm.sequence.get(nsymbols-1-i) == y) { c = state_fill_best; } drawState(g, i, y, c); } } // max probability. for(int i = 0; i < nsymbols; i++) { for(int y1 = 0; y1 < nstates; y1++) { if (hmm.matrix_prevstate[i][y1] != -1) { drawCenterString(g, form.format(hmm.matrix_maxprob[i][y1]), offset_x+i*grid_x, offset_y+y1*grid_y); } } } // captions (symbols atop) for(int i = 0; i < nsymbols; i++) { drawCenterString(g, hmm.symbols.get(i).name, offset_x+i*grid_x, col_y); } // captions (states in left) for(int y = 0; y < nstates; y++) { drawRightString(g, hmm.states.get(y).name, col_x, offset_y+y*grid_y); } // status bar g.setColor(Color.black); g.drawString(hmm.status, col_x, offset_y3+nstates*grid_y); g.drawString(hmm.status2, col_x, offset_y3+nstates*grid_y+16); } } class HMMDecoder { StateList states; int state_start; int state_end; public IntegerList sequence; public double[][] matrix_maxprob; public int[][] matrix_prevstate; public SymbolList symbols; public double probmax; public int stage, i0, i1; public boolean laststage; public String status, status2; public HMMDecoder() { status = "Not initialized."; status2 = ""; states = new StateList(); } public void addStartState(State st) { state_start = states.size(); // get current index states.add(st); } public void addNormalState(State st) { states.add(st); } public void addEndState(State st) { state_end = states.size(); // get current index states.add(st); } // for debugging. public void showmatrix() { for(int i = 0; i < symbols.size(); i++) { for(int j = 0; j < states.size(); j++) { System.out.print(matrix_maxprob[i][j]+" "+matrix_prevstate[i][j]+", "); } System.out.println(); } } // initialize for decoding public void initialize(SymbolList syms) { // symbols[syms.length] should be END symbols = syms; matrix_maxprob = new double[symbols.size()][states.size()]; matrix_prevstate = new int[symbols.size()][states.size()]; for(int i = 0; i < symbols.size(); i++) { for(int j = 0; j < states.size(); j++) { matrix_prevstate[i][j] = -1; } } State start = states.get(state_start); for(int i = 0; i < states.size(); i++) { matrix_maxprob[0][i] = start.transprob(states.get(i)); matrix_prevstate[0][i] = 0; } stage = 0; i0 = -1; i1 = -1; sequence = new IntegerList(); status = "Ok, let's get started..."; status2 = ""; } // forward procedure public boolean proceed_decoding() { status2 = ""; // already end? if (symbols.size() <= stage) { return false; } // not started? if (stage == 0) { stage = 1; i0 = 0; i1 = 0; matrix_maxprob[stage][i1] = 0.0; } else { i0++; if (states.size() <= i0) { // i0 should be reinitialized. i0 = 0; i1++; if (states.size() <= i1) { // i1 should be reinitialized. // goto next stage. stage++; if (symbols.size() <= stage) { // done. status = "Decoding finished."; return false; } laststage = (stage == symbols.size()-1); i1 = 0; } matrix_maxprob[stage][i1] = 0.0; } } // sym1: next symbol Symbol sym1 = symbols.get(stage); State s0 = states.get(i0); State s1 = states.get(i1); // precond: 1 <= stage. double prob = matrix_maxprob[stage-1][i0]; DecimalFormat form = new DecimalFormat("0.0000"); status = "Prob:" + form.format(prob); if (1 < stage) { // skip first stage. double transprob = s0.transprob(s1); prob = prob * transprob; status = status + " x " + form.format(transprob); } double emitprob = s1.emitprob(sym1); prob = prob * emitprob; status = status + " x " + form.format(emitprob) + "(" + s1.name+":"+sym1.name + ")"; status = status + " = " + form.format(prob); // System.out.println("stage: "+stage+", i0:"+i0+", i1:"+i1+", prob:"+prob); if (matrix_maxprob[stage][i1] < prob) { matrix_maxprob[stage][i1] = prob; matrix_prevstate[stage][i1] = i0; status2 = "(new maximum found)"; } return true; } // backward proc public void backward() { int probmaxstate = state_end; sequence.add(probmaxstate); for(int i = symbols.size()-1; 0 < i; i--) { probmaxstate = matrix_prevstate[i][probmaxstate]; if (probmaxstate == -1) { status2 = "Decoding failed."; return; } sequence.add(probmaxstate); //System.out.println("stage: "+i+", state:"+probmaxstate); } } } public class Viterbi extends Applet implements ActionListener, Runnable { SymbolTable symtab; StateTable sttab; HMMDecoder myhmm = null; HMMCanvas canvas; Panel p; TextArea hmmdesc; TextField sentence; Button bstart, bskip; static final String initialHMM = "start: go(cow,1.0)\n" + "cow: emit(moo,0.9) emit(hello,0.1) go(cow,0.5) go(duck,0.3) go(end,0.2)\n" + "duck: emit(quack,0.6) emit(hello,0.4) go(duck,0.5) go(cow,0.3) go(end,0.2)\n"; final int sleepmillisec = 100; // 0.1s // setup hmm // success:true. boolean setupHMM(String s) { myhmm = new HMMDecoder(); symtab = new SymbolTable(); sttab = new StateTable(); State start = sttab.get("start"); State end = sttab.get("end"); myhmm.addStartState(start); boolean success = true; StringTokenizer lines = new StringTokenizer(s, "\n"); while (lines.hasMoreTokens()) { // foreach line. String line = lines.nextToken(); int i = line.indexOf(':'); if (i == -1) break; State st0 = sttab.get(line.substring(0,i).trim()); if (st0 != start && st0 != end) { myhmm.addNormalState(st0); } //System.out.println(st0.name+":"+line.substring(i+1)); StringTokenizer tokenz = new StringTokenizer(line.substring(i+1), ", "); while (tokenz.hasMoreTokens()) { // foreach token. String t = tokenz.nextToken().toLowerCase(); if (t.startsWith("go(")) { State st1 = sttab.get(t.substring(3).trim()); // fetch another token. if (!tokenz.hasMoreTokens()) { success = false; // err. nomoretoken break; } String n = tokenz.nextToken().replace(')', ' '); double prob; try { prob = Double.valueOf(n).doubleValue(); } catch (NumberFormatException e) { success = false; // err. prob = 0.0; } st0.addLink(st1, prob); //System.out.println("go:"+st1.name+","+prob); } else if (t.startsWith("emit(")) { Symbol sym = symtab.intern(t.substring(5).trim()); // fetch another token. if (!tokenz.hasMoreTokens()) { success = false; // err. nomoretoken break; } String n = tokenz.nextToken().replace(')', ' '); double prob; try { prob = Double.valueOf(n).doubleValue(); } catch (NumberFormatException e) { success = false; // err. prob = 0.0; } st0.addSymbol(sym, prob); //System.out.println("emit:"+sym.name+","+prob); } else { // illegal syntax, just ignore break; } } st0.normalize(); // normalize probability } end.addSymbol(symtab.intern("end"), 1.0); myhmm.addEndState(end); return success; } // success:true. boolean setup() { if (! setupHMM(hmmdesc.getText())) return false; // initialize words SymbolList words = new SymbolList(); StringTokenizer tokenz = new StringTokenizer(sentence.getText()); words.add(symtab.intern("start")); while (tokenz.hasMoreTokens()) { words.add(symtab.intern(tokenz.nextToken())); } words.add(symtab.intern("end")); myhmm.initialize(words); canvas.setHMM(myhmm); return true; } public void init() { canvas = new HMMCanvas(); setLayout(new BorderLayout()); p = new Panel(); sentence = new TextField("moo hello quack", 20); bstart = new Button(" Start "); bskip = new Button("Auto"); bstart.addActionListener(this); bskip.addActionListener(this); p.add(sentence); p.add(bstart); p.add(bskip); hmmdesc = new TextArea(initialHMM, 4, 20); add("North", canvas); add("Center", p); add("South", hmmdesc); } void setup_fallback() { // adjustable State cow = sttab.get("cow"); State duck = sttab.get("duck"); State end = sttab.get("end"); cow.addLink (cow, 0.5); cow.addLink (duck, 0.3); cow.addLink (end, 0.2); duck.addLink (cow, 0.3); duck.addLink (duck, 0.5); duck.addLink (end, 0.2); cow.addSymbol(symtab.intern("moo"), 0.9); cow.addSymbol(symtab.intern("hello"), 0.1); duck.addSymbol(symtab.intern("quack"), 0.6); duck.addSymbol(symtab.intern("hello"), 0.4); } public void destroy() { remove(p); remove(canvas); } public void processEvent(AWTEvent e) { if (e.getID() == Event.WINDOW_DESTROY) { System.exit(0); } } public void run() { if (myhmm != null) { while (myhmm.proceed_decoding()) { canvas.repaint(); try { Thread.sleep(sleepmillisec); } catch (InterruptedException e) { ; } } myhmm.backward(); canvas.repaint(); bstart.setLabel(" Start "); bstart.setEnabled(true); bskip.setEnabled(true); myhmm = null; } } public void actionPerformed(ActionEvent ev) { String label = ev.getActionCommand(); if (label.equalsIgnoreCase(" start ")) { if (!setup()) { // error return; } bstart.setLabel("Proceed"); canvas.repaint(); } else if (label.equalsIgnoreCase("proceed")) { // next if (! myhmm.proceed_decoding()) { myhmm.backward(); bstart.setLabel(" Start "); myhmm = null; } canvas.repaint(); } else if (label.equalsIgnoreCase("auto")) { // skip if (myhmm == null) { if (!setup()) { // error return; } } bstart.setEnabled(false); bskip.setEnabled(false); Thread me = new Thread(this); me.setPriority(Thread.MIN_PRIORITY); // start animation. me.start(); } } public static void main(String args[]) { Frame f = new Frame("Viterbi"); Viterbi v = new Viterbi(); f.add("Center", v); f.setSize(400, 400); f.show(); v.init(); v.start(); } public String getAppletInfo() { return "A Sample Viterbi Decoder Applet"; } }Vierbi的求解过程如下: MaxProb(COW,moo)= TransProb(start,COW)*EmitPob(COW,moo)=1.0*0.9=0.9 MaxProb(COW,hello)=MaxProb(COW,moo)*TransProb(COW,COW)*EmitProb(COW,hello)=0.9*0.5*0.1=0.045
MaxProb(DUCK,hello)=MaxProb(COW,moo)*TransProb(COW,DUCK)*EmitProb(DUCK,hello)=0.9*0.3*0.4=0.108
MaxProb(DUCK,quack)=MaxProb(DUCK,hello)*TransProb(DUCK,DUCK)*EmitProb(DUCK,quack)=0.108*0.5*0.6=0.0324
MaxProb(DUCK,quack)=MaxProb(COW,hello)*TransProb(COW,DUCK)*EmitProb(DUCK,quack)=0.045*0.3*0.6=0.0081
MaxPob(END,end)=MaxProb(DUCK,quack)*TransProb(DUCK,END)*EmitProb(END,end)=0.0324*0.2*1=0.00648
执行回溯过程发现最佳隐状态,所以猜测输出为 COW DUCK DUCK
相关文章推荐
- 使用RNN解决NLP中序列标注问题的通用优化思路
- 使用CDI规范中的@Named标注jsf bean时,引发null问题的解决
- Spark做词性标注遇到的问题及解决方法
- Spring @Async配置4. 基于@Async无返回值调用 使用的方式非常简单,一个标注即可解决所有的问题: 1 @Async //标注使用 2 public void asyncMe
- 使用RNN解决NLP中序列标注问题的通用优化思路
- 转:使用RNN解决NLP中序列标注问题的通用优化思路
- 使用RNN解决NLP中序列标注问题的通用优化思路
- 使用RNN解决NLP中序列标注问题的通用优化思路
- 使用RNN解决NLP中序列标注问题的通用优化思路
- MapX中使用动态图层AnimationLayer,移动图元时标注和图元分离问题解决办法。
- php使用开源的adodb连接mssql解决乱码问题
- 解决cocos2dx 3.12版本使用PageView调用addEventListener函数,参数不明问题
- SqlServer使用 case when 解决多条件模糊查询问题
- 百度富文本ueditor使用 以及 与 Struts2 整合时出现的问题解决
- 使用GoogleCode作SVN服务器的一些问题及解决办法
- Android手机JmDNS的使用以及解决某些品牌手机Multicast无法接收组播消息的问题
- JS/Jquery使用过程中遇到的问题和解决方法
- Linux多线程实践(六)使用Posix条件变量解决生产者消费者问题
- Eclipse3.2使用VSS签出状态不显示问题解决
- Java 使用 Velocity 发送邮件中文内容乱码问题的解决办法