您的位置:首页 > 产品设计 > UI/UE

SVM学习—SMO算法(Sequential Minimal Optimization)

2017-09-01 09:50 344 查看


SVM学习——SequentialMinimalOptimization



链接:http://www.cnblogs.com/vivounicorn/archive/2011/06/01/2067496.html


1、前言

接触SVM也有一段时间了,从理论到实践都有了粗浅的认识,我认为SVM的发展可以划分为几个相对独立的部分,首先是SVM理论本身,包括寻找最大间隔分类超平面、引入核方法极大提高对非线性问题的处理能力、引入松弛变量的软间隔优化,用间隔定量的描述置信风险等等;其次是核方法理论的发展,它独立于SVM本身,这也同时是SVM的一大优点;最后是最优化理论的发展,它同样与SVM具有相对独立性;套个流行话,三者是相辅相成、互相促进的。本文所提到的方法已经被很多人学习和研究过了,我这里做个简单介绍再加点自己的想法作为自己对学习SVM的一点总结吧。


2、背景知识

关于SVM的基础理论在先前的系列文章中已经有所体现了,SequentialMinimalOptimization(之后就用其简写SMO了)所解决的是支持向量机C-SVC模型,就是之前SVM学习——软间隔优化一文中提到的SVM模型,从这个名字也可以看出,这个模型的主要功能是分类,它有一个需要调节的参数C,以一阶软间隔优化为例,模型如下:

SMO就是要解这个凸二次规划问题,这里的C是个很重要的参数,它从本质上说是用来折中经验风险和置信风险的,C越大,置信风险越大,经验风险越小;并且所有的因子都被限制在了以C为边长的大盒子里。SMO的出现使得我们不必去求助于昂贵的第三方工具去解决这个凸二次规划问题,目前对它的改进版本很多,我这里就介绍它的最初形式和思想。

SMO是MicrosoftResearch的JohnC.Platt在《SequentialMinimalOptimization:AFastAlgorithmforTrainingSupportVectorMachines》一文中提出的,作者信息:http://research.microsoft.com/en-us/people/jplatt/,其基本思想是将Vapnik在1982年提出的Chunking方法推到极致,即:通过将原问题分解为一系列小规模凸二次规划问题而获得原问题解的方法,每次迭代只优化由2个点组成的工作集,SMO算法每次启发式地选择两个因子同时固定其它因子来找到这两个因子的最优值,直到达到停止条件


3、算法详述


(1)、KKT条件

SMO是以C-SVC的KKT条件为基础进行后续操作的,这个KKT条件是:

其中

上述条件其实就是KT互补条件,SVM学习——软间隔优化一文,有如下结论:

&
4000
nbsp;

从上面式子可以得到的信息是:当时,松弛变量,此时有:,对应样本点就是误分点;当时,松弛变量为零,此时有,对应样本点就是内部点,即分类正确而又远离最大间隔分类超平面的那些样本点;而时,松弛变量为零,有,对应样本点就是支持向量。


(2)、凸优化问题停止条件

对于凸优化问题,在实现时总需要适当的停止条件来结束优化过程,停止条件可以是:

1、监视目标函数的增长率,在它低于某个容忍值时停止训练,这个条件是最直白和简单的,但是效果不好;

2、监视原问题的KKT条件,对于凸优化来说它们是收敛的充要条件,但是由于KKT条件本身是比较苛刻的,所以也需要设定一个容忍值,即所有样本在容忍值范围内满足KKT条件则认为训练可以结束;

3、监视可行间隙,它是原始目标函数值和对偶目标函数值的间隙,对于凸二次优化来说这个间隙是零,以一阶范数软间隔为例:

原始目标函数与对偶目标函数的差为:

定义比率:

,可以利用这个比率达到某个容忍值作为停止条件。


(3)、SMO思想

沿袭分解思想,固定“Chunking工作集”的大小为2,每次迭代只优化两个点的最小子集且可直接获得解析解,算法流程:








(4)、仅含两个Langrange乘子解析解

为了描述方便定义如下符号:

于是目标函数就变成了:

注意第一个约束条件:,可以将看作常数,有(为常数,我们不关心它的值),等式两边同时乘以,得到(为常数,其值为,我们不关心它,)。将用上式替换则得到一个只含有变量的求极值问题:

这下问题就简单了,对求偏导数得到:

将、带入上式有:

带入、,用,表示误差项(可以想象,即使分类正确,的值也可能很大)、(是原始空间向特征空间的映射),这里可以看成是一个度量两个样本相似性的距离,换句话说,一旦选择核函数则意味着你已经定义了输入空间中元素的相似性

最后得到迭代式:

注意第二个约束条件——那个强大的盒子:,这意味着也必须落入这个盒子中,综合考虑两个约束条件,下图更直观:

20000
ounicorn/201106/201106012315139619.png"target=_blank>



和异号的情形





和同号的情形

可以看到两个乘子既要位于边长为C的盒子里又要在相应直线上,于是对于的界来说,有如下情况:

整理得下式:

又因为,,消去后得到:


(5)、启发式的选择方法

根据选择的停止条件可以确定怎么样选择点能对算法收敛贡献最大,例如使用监视可行间隙的方法,一个最直白的选择就是首先优化那些最违反KKT条件的点,所谓违反KKT条件是指:

由前面的停止条件3可知,对可行间隙贡献最大的点是那些

其中

取值大的点,这些点导致可行间隙变大,因此应该首先优化它们,原因如下:

1、当满足KKT条件:即时,

当违背KKT条件:即时,,于是

可见,由于违背KKT条件导致可行间隙变大;

2、当满足KKT条件:即时,

当违背KKT条件:即时

若则且,其中

若则且,其中

可见,由于违背KKT条件依然导致可行间隙变大;

3、当满足KKT条件:即时,

当违背KKT条件:即时,且,其中

可见,由于违背KKT条件还是会导致可行间隙变大。

SMO的启发式选择有两个策略:

启发式选择1:

最外层循环,首先,在所有样本中选择违反KKT条件的一个乘子作为最外层循环,用“启发式选择2”选择另外一个乘子并进行这两个乘子的优化,接着,从所有非边界样本中选择违反KKT条件的一个乘子作为最外层循环,用“启发式选择2”选择另外一个乘子并进行这两个乘子的优化(之所以选择非边界样本是为了提高找到违反KKT条件的点的机会),最后,如果上述非边界样本中没有违反KKT条件的样本,则再从整个样本中去找,直到所有样本中没有需要改变的乘子或者满足其它停止条件为止。

启发式选择2:

内层循环的选择标准可以从下式看出:

要加快第二个乘子的迭代速度,就要使最大,而在上没什么文章可做,于是只能使最大。

确定第二个乘子方法:

1、首先在非界乘子中寻找使得最大的样本;

2、如果1中没找到则从随机位置查找非界乘子样本;

3、如果2中也没找到,则从随机位置查找整个样本(包含界上和非界乘子)。


(6)、关于两乘子优化的说明

由式子

可知:

于是对于这个单变量二次函数而言,如果其二阶导数,则二次函数开口向下,可以用上述迭代的方法更新乘子,如果,则目标函数只能在边界上取得极值(此时二次函数开口向上),换句话说,SMO要能处理取任何值的情况,于是在时有以下式子:

1、时:

2、时:

3、

分别将乘子带入得到两种情况下的目标函数值:和。显然,哪种情况下目标函数值最大,则乘子就往哪儿移动,如果目标函数的差在某个指定精度范围内,说明优化没有进展。

另外发现,每一步迭代都需要计算输出进而得到,于是还要更新阈值,使得新的乘子、满足KKT条件,考虑、至少有一个在界内,则需要满足,于是的迭代可以这样得到:

1、设在界内,则:

又因为:

于是有:

等式两边同乘后移项得:



2、设在界内,则:



3、设、都在界内,则:情况1和情况2的值相等,任取一个;

4、设、都不在界内,则:取值为情况1和情况2之间的任意值。


(7)、提高SMO的速度

从实现上来说,对于标准的SMO能提高速度的地方有:

1、能用缓存的地方尽量用,例如,缓存核矩阵,减少重复计算,但是增加了空间复杂度;

2、如果SVM的核为线性核时候,可直接更新,毕竟每次计算的代价较高,于是可以利用旧的乘子信息来更新,具体如下:

,应用到这个性质的例子可以参见SVM学习——CoordinateDesentMethod。

3、关注可以并行的点,用并行方法来改进,例如可以使用MPI,将样本分为若干份,在查找最大的乘子时可以现在各个节点先找到局部最大点,然后再从中找到全局最大点;又如停止条件是监视对偶间隙,那么可以考虑在每个节点上计算出局部可行间隙,最后在master节点上将局部可行间隙累加得到全局可行间隙。

对标准SMO的改进有很多文献,例如使用“MaximalViolatingPair”去启发式的选择乘子是一种很有效的方法,还有使用“SecondOrderInformation”的方法,我觉得理想的算法应该是:算法本身的收敛速度能有较大提高,同时算法可并行程度也较高。


4、算法实现

以cowman望达兄的PyMing-v0.2为平台做一个简单的实现,初学python,写的比较烂,拍砖时候轻点哈,貌似目前PyMing支持python3.0以下版本,开发python代码我使用的工具是:(python-2.6)+(PyQt-Py2.6-x86-gpl-4.8.4-1)+(Eric4-4.4.14),用Eric的最大好处是调试方便和智能感知做的比较好,安装很简单,先装python-2.6、再装PyQt(不停的点下一步)、最后装Eric,建立一个项目如图:





实现思路就是platt的那段伪码,需要加三个文件,py_mining_0_2_D\pymining\classifier里加一个分类器standard_smo_csvc;py_mining_0_2_D\example里加一个测试的例子standard_smo_csvc_train_test;py_mining_0_2_D\example\conf里改一下配置文件test。

1、standard_smo_csvc.py

importmath

importpickle

importrandom


from..math.matriximportMatrix

from..math.text2matriximportText2Matrix

from..nlp.segmenterimportSegmenter

from..common.global_infoimportGlobalInfo

from..common.configurationimportConfiguration


classStandardSMO:

'''Platt'sstandardSMOalgorithmforcsvc.'''


def__init__(self,config,nodeName,loadFromFile=False,C=100,tolerance=0.001):

#storeanumbernearlyzero.

self.accuracy=1E-3

#storepenaltycoefficientofslackvariable.

self.C=C

#storetoleranceofKKTconditions.

self.tolerance=tolerance

#storeisTrainedbydata.

self.istrained=loadFromFile


#storelagrangemultipiers.

self.alpha=[]

#storeweight

self.w=[]

#storethreshold.

self.b=float(0)

#storekii

self.kcache={}


self.istrained=False


#-------------------beginmodelinfo-------------------------------

self.curNode=config.GetChild(nodeName)

self.modelPath=self.curNode.GetChild("model_path").GetValue()

self.logPath=self.curNode.GetChild("log_path").GetValue()

#-------------------endmodelinfo-------------------------------


#-------------------beginkernelinfo-------------------------------

self.curNode=config.GetChild(nodeName)

self.kernelNode=self.curNode.GetChild("kernel");

self.kernelName=self.kernelNode.GetChild("name").GetValue();

#togetparametersfromtoptobutton->fromlefttoright->frominnertoouter.

self.parameters=self.kernelNode.GetChild("parameters").GetValue().split(',');

#-------------------endkernelinfo-------------------------------


if(loadFromFile):

f=open(self.modelPath,"r")

modelStr=pickle.load(f)

[self.alphay,self.sv,self.b,self.w]=pickle.loads(modelStr)

f.close()

self.istrained=True


defDotProduct(self,i1,i2):

'''Togetvector'sdotproductfortraining.'''


dot=float(0)

foriinrange(0,self.trainx.nCol):

dot+=self.trainx.Get(i1,i)*self.trainx.Get(i2,i)

returndot


defKernel(self):

'''Togetkernelfunctionwithconfigurationfortraining.


kernelfunctionincludesRBF,Linearandsoon.'''


ifself.kernelName=='RBF':

returnlambdaxi,yi:math.exp((2*self.DotProduct(xi,yi)-self.DotProduct(xi,xi)-self.DotProduct(yi,yi))/(2*float(self.parameters[0])*float(self.parameters[0])))

elifself.kernelName=='Linear':

returnlambdaxi,yi:self.DotProduct(xi,yi)+float(self.parameters[0])

elifself.kernelName=='Polynomial':

returnlambdaxi,yi:(float(self.parameters[0])*self.DotProduct(xi,yi)+float(self.parameters[1]))**int(self.parameters[2])


defDotVectorProduct(self,v1,v2):

'''Togetvector'sdotproductfortesting.'''


iflen(v1)!=len(v2):

print'Thedimensionsoftwovectorshouldequal'

return0.0

dot=float(0)

foriinrange(0,len(v1)):

dot+=v1[i]*v2[i]

returndot


defKernelVector(self,v1,v2):

'''Togetkernelfunctionfortesting.'''


ifself.kernelName=='RBF':

returnmath.exp((2*self.DotVectorProduct(v1,v2)-self.DotVectorProduct(v1,v1)-self.DotVectorProduct(v2,v2))/(2*float(self.parameters[0])*float(self.parameters[0])))

elifself.kernelName=='Linear':

returnself.DotVectorProduct(v1,v2)+float(self.parameters[0])

elifself.kernelName=='Polynomial':

return(float(self.parameters[0])*self.DotVectorProduct(v1,v2)+float(self.parameters[1]))**int(self.parameters[2])


defF(self,i1):

'''Tocalculateoutputofansample.


returnoutput.'''


ifself.kernelName=='Linear':

dot=0

foriinrange(0,self.trainx.nCol):

dot+=self.w[i]*self.trainx.Get(i1,i);

returndot+self.b


K=self.Kernel()

final=0.0

foriinrange(0,len(self.alpha)):

ifself.alpha[i]>0:

key1='%s%s%s'%(str(i1),'-',str(i))

key2='%s%s%s'%(str(i),'-',str(i1))

ifself.kcache.has_key(key1):

k=self.kcache[key1]

elifself.kcache.has_key(key2):

k=self.kcache[key2]

else:

k=K(i1,i)

self.kcache[key1]=k


final+=self.alpha[i]*self.trainy[i]*k

final+=self.b

returnfinal


defexamineExample(self,i1):

'''Tofindthefirstlagrangemultipliers.


thenfindthesecondlagrangemultipliers.'''

y1=self.trainy[i1]

alpha1=self.alpha[i1]


E1=self.F(i1)-y1


kkt=y1*E1


if(kkt>self.toleranceandkkt>0)or(kkt<-self.toleranceandkkt<self.C):#notabidebyKKTconditions

ifself.FindMaxNonbound(i1,E1):

return1

elifself.FindRandomNonbound(i1):

return1

elifself.FindRandom(i1):

return1

return0


defFindMaxNonbound(self,i1,E1):

'''Tofindsecondlagrangemultipliersfromnon-bound.


conditionismaximum|E1-E2|ofnon-boundlagrangemultipliers.'''

i2=-1

maxe1e2=None

foriinrange(0,len(self.alpha)):

ifself.alpha[i]>0andself.alpha[i]<self.C:

E2=self.F(i)-self.trainy[i]

tmp=math.fabs(E1-E2)

ifmaxe1e2==Noneormaxe1e2<tmp:

maxe1e2=tmp

i2=i

ifi2>=0andself.StepOnebyOne(i1,i2):

return1

return0


defFindRandomNonbound(self,i1):

'''Tofindsecondlagrangemultipliersfromnon-bound.


conditionisrandomofnon-boundlagrangemultipliers.'''

k=random.randint(0,len(self.alpha)-1)

foriinrange(0,len(self.alpha)):

i2=(i+k)%len(self.alpha)

ifself.alpha[i2]>0andself.alpha[i2]<self.Candself.StepOnebyOne(i1,i2):

return1

return0


defFindRandom(self,i1):

'''Tofindsecondlagrangemultipliersfromall.


conditionisrandomoneofalllagrangemultipliers.'''

k=random.randint(0,len(self.alpha)-1)

foriinrange(0,len(self.alpha)):

i2=(i+k)%len(self.alpha)

ifself.StepOnebyOne(i1,i2):

return1

return0


defW(self,alpha1new,alpha2newclipped,i1,i2,E1,E2,k11,k22,k12):

'''TocalculateWvalue.'''


K=self.Kernel()

alpha1=self.alpha[i1]

alpha2=self.alpha[i2]

y1=self.trainy[i1]

y2=self.trainy[i2]

s=y1*y2


w1=alpha1new*(y1*(self.b-E1)+alpha1*k11+s*alpha2*k12)

w1+=alpha2newclipped*(y2*(self.b-E2)+alpha2*k22+s*alpha1*k12)

w1=w1-k11*alpha1new*alpha1new/2-k22*alpha2newclipped*alpha2newclipped/2-s*k12*alpha1new*alpha2newclipped

returnw1


defStepOnebyOne(self,i1,i2):

'''Tosolvetwolagrangemultipliersproblem.

thealgorithmcanreferencetheblog.'''


ifi1==i2:

return0


#togetkernelfunction.

K=self.Kernel()


alpha1=self.alpha[i1]

alpha2=self.alpha[i2]

alpha1new=-1.0

alpha2new=-1.0

alpha2newclipped=-1.0

y1=self.trainy[i1]

y2=self.trainy[i2]

s=y1*y2


key11='%s%s%s'%(str(i1),'-',str(i1))

key22='%s%s%s'%(str(i2),'-',str(i2))

key12='%s%s%s'%(str(i1),'-',str(i2))

key21='%s%s%s'%(str(i2),'-',str(i1))

ifself.kcache.has_key(key11):

k11=self.kcache[key11]

else:

k11=K(i1,i1)

self.kcache[key11]=k11


ifself.kcache.has_key(key22):

k22=self.kcache[key22]

else:

k22=K(i2,i2)

self.kcache[key22]=k22


ifself.kcache.has_key(key12):

k12=self.kcache[key12]

elifself.kcache.has_key(key21):

k12=self.kcache[key21]

else:

k12=K(i1,i2)

self.kcache[key12]=k12


eta=k11+k22-2*k12


E1=self.F(i1)-y1

E2=self.F(i2)-y2


#tocalucatebound.

L=0.0

H=0.0

ify1*y2==-1:

gamma=alpha2-alpha1

ifgamma>0:

L=gamma

H=self.C

else:

L=0

H=self.C+gamma


ify1*y2==1:

gamma=alpha2+alpha1

ifgamma-self.C>0:

L=gamma-self.C

H=self.C

else:

L=0

H=gamma

ifH==L:

return0

#------------------------begintomovelagrangemultipliers.----------------------------

if-eta<0:

#tocalculateapha2'snewvalue

alpha2new=alpha2+y2*(E1-E2)/eta


ifalpha2new<L:

alpha2newclipped=L

elifalpha2new>H:

alpha2newclipped=H

else:

alpha2newclipped=alpha2new

else:

w1=self.W(alpha1+s*(alpha2-L),L,i1,i2,E1,E2,k11,k22,k12)

w2=self.W(alpha1+s*(alpha2-H),H,i1,i2,E1,E2,k11,k22,k12)

ifw1-w2>self.accuracy:

alpha2newclipped=L

elifw2-w1>self.accuracy:

alpha2newclipped=H

else:

alpha2newclipped=alpha2


ifmath.fabs(alpha2newclipped-alpha2)<self.accuracy*(alpha2newclipped+alpha2+self.accuracy):

return0


alpha1new=alpha1+s*(alpha2-alpha2newclipped)

ifalpha1new<0:

alpha2newclipped+=s*alpha1new

alpha1new=0

elifalpha1new>self.C:

alpha2newclipped+=s*(alpha1new-self.C)

alpha1new=self.C

#------------------------endtomovelagrangemultipliers.----------------------------

ifalpha1new>0andalpha1new<self.C:

self.b+=(alpha1-alpha1new)*y1*k11+(alpha2-alpha2newclipped)*y2*k12-E1

elifalpha2newclipped>0andalpha2newclipped<self.C:

self.b+=(alpha1-alpha1new)*y1*k12+(alpha2-alpha2newclipped)*y2*k22-E2

else:

b1=(alpha1-alpha1new)*y1*k11+(alpha2-alpha2newclipped)*y2*k12-E1+self.b

b2=(alpha1-alpha1new)*y1*k12+(alpha2-alpha2newclipped)*y2*k22-E2+self.b

self.b=(b1+b2)/2


ifself.kernelName=='Linear':

forjinrange(0,self.trainx.nCol):

self.w[j]+=(alpha1new-alpha1)*y1*self.trainx.Get(i1,j)+(alpha2newclipped-alpha2)*y2*self.trainx.Get(i2,j)


self.alpha[i1]=alpha1new

self.alpha[i2]=alpha2newclipped


print'a',i1,'=',alpha1new,'a',i2,'=',alpha2newclipped

return1


defTrain(self,trainx,trainy):

'''Totrainsamples.


self.trainxistrainingmatrixandself.trainyisclassifyinglabel'''


self.trainx=trainx

self.trainy=trainy


iflen(self.trainy)!=self.trainx.nRow:

print"ERROR!,x.nRowshould==len(y)"

return0


numChanged=0;

examineAll=1;

#toinitializealllagrangemultipierswithzero.

foriinrange(0,self.trainx.nRow):

self.alpha.append(0.0)

#toinitializewwithzero.

forjinrange(0,self.trainx.nCol):

self.w.append(float(0))


whilenumChanged>0orexamineAll:

numChanged=0

print'numChanged=',numChanged

ifexamineAll:

forkinrange(0,self.trainx.nRow):

numChanged+=self.examineExample(k);#firsttimeoralloflagrangemultipiersareabidebyKKTconditionsthenexaminallsamples.

else:

forkinrange(0,self.trainx.nRow):

ifself.alpha[k]!=0andself.alpha[k]!=self.C:

numChanged+=self.examineExample(k);#toexaminallnon-boundlagrangemultipliers


if(examineAll==1):

examineAll=0

elif(numChanged==0):

examineAll=1

else:

#storesupportvectormachine.

self.alphay=[]

self.index=[]

foriinrange(0,len(self.alpha)):

ifself.alpha[i]>0:

self.index.append(i)

self.alphay.append(self.alpha[i]*self.trainy[i])


self.sv=[[0forjinrange(self.trainx.nCol)]foriinrange(len(self.index))]


foriinrange(0,len(self.index)):

forjinrange(0,self.trainx.nCol):

self.sv[i][j]=self.trainx.Get(self.index[i],j)


#dumpmodelpath

f=open(self.modelPath,"w")

modelStr=pickle.dumps([self.alphay,self.sv,self.b,self.w],1)

pickle.dump(modelStr,f)

f.close()


self.istrained=True


defTest(self,testx,testy):

'''Totestsamples.


self.testxistrainingmatrixandself.testyisclassifyinglabel'''


#checkparameter

if(notself.istrained):

print"Error!,nottrained!"

returnFalse

if(testx.nRow!=len(testy)):

print"Error!testx.nRowshould==len(testy)"

returnFalse


self.trainx=testx

self.trainy=testy

correct=0.0

foriinrange(0,self.trainx.nRow):

fxi=0.0

rowvector=[self.trainx.Get(i,k)forkinrange(0,self.trainx.nCol)]


ifself.kernelName=='Linear':

fxi+=self.KernelVector(self.w,rowvector)+self.b

else:

forjinrange(0,len(self.alphay)):

fxi+=self.alphay[j]*self.KernelVector(self.sv[j],rowvector)

fxi+=self.b


iffxi*self.trainy[i]>=0:

correct+=1


print'outputis',fxi,'labelis',self.trainy[i]


print'acu=',correct/len(self.trainy)






2、standard_smo_csvc_train_test

importsys,os

importmath

sys.path.append(os.path.join(os.getcwd(),'../'))


frompymining.math.matriximportMatrix

frompymining.math.text2matriximportText2Matrix

frompymining.nlp.segmenterimportSegmenter

frompymining.common.global_infoimportGlobalInfo

frompymining.common.configurationimportConfiguration

frompymining.preprocessor.chisquare_filterimportChiSquareFilter

frompymining.classifier.standard_smo_csvcimportStandardSMO


if__name__=="__main__":

config=Configuration.FromFile("conf/test.xml")

GlobalInfo.Init(config,"__global__")

txt2mat=Text2Matrix(config,"__matrix__")

[trainx,trainy]=txt2mat.CreateTrainMatrix("data/train-csvc.txt")

chiFilter=ChiSquareFilter(config,"__filter__")

chiFilter.TrainFilter(trainx,trainy)

[trainx,trainy]=chiFilter.MatrixFilter(trainx,trainy)


nbModel=StandardSMO(config,"standard_smo_csvc")

nbModel.Train(trainx,trainy)


[trainx,trainy]=txt2mat.CreatePredictMatrix("data/train-csvc-test.txt")

[trainx,trainy]=chiFilter.MatrixFilter(trainx,trainy)


nbModel=StandardSMO(config,"standard_smo_csvc",True)

nbModel.Test(trainx,trainy)



3、test.xml

<config>

<__segmenter__>

<main_dict>dict/dict.main</main_dict>

</__segmenter__>


<__matrix__>

</__matrix__>


<__global__>

<term_to_id>mining/term_to_id</term_to_id>

<id_to_term>mining/id_to_term</id_to_term>

<id_to_doc_count>mining/id_to_doc_count</id_to_doc_count>

<class_to_doc_count>mining/class_to_doc_count</class_to_doc_count>

<id_to_idf>mining/id_to_idf</id_to_idf>

</__global__>


<__filter__>

<rate>0.9</rate>

<method>max</method>

<log_path>mining/filter.log</log_path>

<model_path>mining/filter.model</model_path>

</__filter__>


<naive_bayes>

<model_path>mining/naive_bayes.model</model_path>

<log_path>mining/naive_bayes.log</log_path>

</naive_bayes>


<twc_naive_bayes>

<model_path>mining/naive_bayes.model</model_path>

<log_path>mining/naive_bayes.log</log_path>

</twc_naive_bayes>


<standard_smo_csvc>

<model_path>mining/standard_smo.model</model_path>

<log_path>mining/standard_smo.log</log_path>

<kernel>

<name>RBF</name>

<parameters>10</parameters>

</kernel>

</standard_smo_csvc>

</config>


代码可以从这里获得


5、参考文献

1)、Platt(1998):http://research.microsoft.com/~jplatt/smoTR.pdf;

2)、《AnIntroductiontoSupportVectorMachinesandOtherKernel-basedLearningMethods》;

3)、Osuna等:AnImprovedTrainingAlgorithmforSupportVectorMachines;

4)、Keerthietal.(2001):ImprovementstoPlatt’sSMOalgorithmforSVMclassifierdesign;

5)、Fan,Chen,andLin(2005):WorkingSetSelectionUsingSecondOrderInformation;

6)、google
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: