Terrier文档翻译:配置概述
2016-02-07 13:17
423 查看
配置Terrier
配置概述
Terrier全都是由几个文件来配置的,都在etc/目录。最核心的文件是terrier.properties和terrier-log.xml。在terrier.properties里,你可以指定Terrier中定义的任意变量的属性。属性文档页(#defaultcontrolsforqueryexpansion
querying.postprocesses.order=QueryExpansion
querying.postprocesses.controls=qe:QueryExpansion
#defaultandallowedcontrols
querying.default.controls=
querying.allowed.controls=qe,start,end,qemodel
#documenttagsspecification
#forprocessingthecontentsof
#thedocuments,ignoringDOCHDR
TrecDocTags.doctag=DOC
TrecDocTags.idtag=DOCNO
TrecDocTags.skip=DOCHDR
#querytagsspecification
TrecQueryTags.doctag=TOP
TrecQueryTags.idtag=NUM
TrecQueryTags.process=TOP,NUM,TITLE
TrecQueryTags.skip=DESC,NARR
#stop-wordsfile
stopwords.filename=stopword-list.txt
#theprocessingstagesatermgoesthrough
termpipelines=Stopwords,PorterStemmer
在errier.properties文件中属性都以name=value这种格式指定(默认Java属性格式)。注释都是以#开头的一行。
脚本化配置
TrecTerrier支持在命令行下指定属性进行配置。这就能够轻松地重置属性,即使有些属性已经在etc/terrier.properties里被指定过了。比如说要创建一个不带词干分析的索引,你就可以用这条命令:[user@machine]$bin/trec_terrier.sh-i-Dtermpipelines=Stopwords
另:在查找要重置的属性的时候,Terrier也会去
作为另一个例子,你可以用shell脚本(e.g.Bash)来跑Terrier,同时带上很多expansion.terms里的查询扩展的属性设定:
[user@machine]$for((i=2;i<10;i++));do
bin/trec_terrier.sh-r-q-Dexpansion.terms=$i
done
日志配置
Terrier用相关文章推荐
- python一段代码 感受一下
- hdu 5621 KK's Point Bestcoder #71 1002
- tsiLnoititraP.86
- C 函数 strstr 的高效实现
- linux oracle设置环境变量
- HDU 1053:Entropy
- 二维码生成(利用iOS CoreImage框架)
- Terrier文档翻译:组件
- unix网络编程 str_cli epoll 非阻塞版本
- 平台其他说明
- Linux系统启动和关闭oracle数据库
- vs2013中经常会遇到XXX与XXXXX不兼容
- could not open parameter file "..../product/11.2/db_1/dbs/initorcl.ora
- install cinnamon on ubuntu 14.04
- B - Numbers That Count
- 判断是否是同一天
- MongoDB仲裁节点的理解以及memcached,zookeeper,redis,故障恢复方案思考.
- Algorithm, Counting sort
- 递归(图的遍历)2
- POJ 1061 青蛙的约会【扩欧】