您的位置:首页 > 其它

Terrier文档翻译:配置概述

2016-02-07 13:17 423 查看

配置Terrier

配置概述

Terrier全都是由几个文件来配置的,都在etc/目录。最核心的文件是terrier.properties和terrier-log.xml。在terrier.properties里,你可以指定Terrier中定义的任意变量的属性。属性文档页(Properties)列出了你配置Terrier会用到的大部分属性。,而javadoc里列出了那些直接影响类的属性。terrier.properties文件的默认配置如下:


#defaultcontrolsforqueryexpansion

querying.postprocesses.order=QueryExpansion

querying.postprocesses.controls=qe:QueryExpansion


#defaultandallowedcontrols

querying.default.controls=

querying.allowed.controls=qe,start,end,qemodel


#documenttagsspecification

#forprocessingthecontentsof

#thedocuments,ignoringDOCHDR

TrecDocTags.doctag=DOC

TrecDocTags.idtag=DOCNO

TrecDocTags.skip=DOCHDR


#querytagsspecification

TrecQueryTags.doctag=TOP

TrecQueryTags.idtag=NUM

TrecQueryTags.process=TOP,NUM,TITLE

TrecQueryTags.skip=DESC,NARR


#stop-wordsfile

stopwords.filename=stopword-list.txt


#theprocessingstagesatermgoesthrough

termpipelines=Stopwords,PorterStemmer

在errier.properties文件中属性都以name=value这种格式指定(默认Java属性格式)。注释都是以#开头的一行。

脚本化配置

TrecTerrier支持在命令行下指定属性进行配置。这就能够轻松地重置属性,即使有些属性已经在etc/terrier.properties里被指定过了。比如说要创建一个不带词干分析的索引,你就可以用这条命令:

[user@machine]$bin/trec_terrier.sh-i-Dtermpipelines=Stopwords

另:在查找要重置的属性的时候,Terrier也会去SystempropertiesprovidedbyJava里核查有Java提供的系统属性。这意味着你可以在Java代码的任意地方或者以Java命令行的方式设置属性。

作为另一个例子,你可以用shell脚本(e.g.Bash)来跑Terrier,同时带上很多expansion.terms里的查询扩展的属性设定:

[user@machine]$for((i=2;i<10;i++));do

bin/trec_terrier.sh-r-q-Dexpansion.terms=$i

done

日志配置

Terrier用Log4j来打日志。你可以通过调整etc/terrier-log.xml(为什么我没看到)里的log4j配置来控制日志信息输出的数量。(logginglevel)更多关于Log4j的内容,请看Log4jdocumentation。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: