Stanford parser入门1:单句中文句法分析
2017-10-01 14:02
190 查看
开发工具:win10 + java8(jdk-8u111) + stanford-parser-full-2015-12-09
在eclipse中运行standfordparser官方java例程请参考“使用StanfordParser进行句法分析”一文。其中,以ParserDemo.java为例,在Eclipse中右键点击ParserDemo.java文件,设置运行参数Arguments为:
edu/stanford/nlp/models/lexparser/chinesePCFG.ser.gz data/chinese-onesent-utf8.txt
如此,可进行中文句法分析。
这里是一个简单中文句法分析的例子。
1.在Stanford官方网站下载最新安装包
http://nlp.stanford.edu/software/lex-parser.html#Download
![](https://img-blog.csdn.net/20171001140639453?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvdTAxMDIzOTEwMg==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast)
2.解压下载后的zip包
stanford-parser-full-2015-12-09.zip,里面会有数据,依赖包以及demo,还有相关的source
code和java doc
3.使用Eclipse创建项目,名为stanfordparser,在build
path中引入stanford-parser-3.6.0-models.jar,stanford-parser.jar,slf4j-simple.jar,
slf4j-api.jar
![](https://img-blog.csdn.net/20171001142038187?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvdTAxMDIzOTEwMg==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center)
![](https://img-blog.csdn.net/20171001142043978?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvdTAxMDIzOTEwMg==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center)
![](https://img-blog.csdn.net/20171001142049407?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvdTAxMDIzOTEwMg==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center)
4.从步骤2中解压的文件中把data文件夹复制到Eclipse项目中,新建ParserTest1.java类,代码如下:
5.运行,输出的结果为:
[main] INFOedu.stanford.nlp.parser.lexparser.LexicalizedParser - Loading parser fromserialized
file edu/stanford/nlp/models/lexparser/chinesePCFG.ser.gz ...
done [1.6 sec].
(ROOT
(IP
(NP (PN这))
(VP (VC是)
(NP
(QP (CD一个))
(CP
(IP
(VP
(VA 简单)))
(DEC的))
(NP (NN例子))))))
[main] INFOedu.stanford.nlp.parser.lexparser.LexicalizedParser - Loading parser fromserialized
file edu/stanford/nlp/models/lexparser/chineseFactored.ser.gz ...
done [6.0 sec].
Parsing file:data/chinese-onesent-utf8.txt
Parsing [sent. 1 len. 8]:俄国希望伊朗没有制造核武器计划。
(ROOT
(IP
(NP (NR俄国))
(VP (VV希望)
(IP
(NP (NR伊朗))
(VP
(ADVP
(AD 没有))
(VP (VV制造)
(NP
(NN 核武器) (NN计划))))))
(PU。)))
nsubj(希望-2,俄国-1)
root(ROOT-0,希望-2)
nsubj(制造-5,伊朗-3)
neg(制造-5,没有-4)
ccomp(希望-2,制造-5)
nn(计划-7,核武器-6)
dobj(制造-5,计划-7)
Parsed file: data/chinese-onesent-utf8.txt[1 sentences].
Parsed 8 words in 1 sentences (22.66 wds/sec;2.83 sents/sec).
参考资料:
stanford parser使用说明
http://blog.csdn.net/u010454729/article/details/46845403
使用Stanford
Parser进行句法分析
http://www.cnblogs.com/Denise-hzf/p/6612574.html
在eclipse中运行standfordparser官方java例程请参考“使用StanfordParser进行句法分析”一文。其中,以ParserDemo.java为例,在Eclipse中右键点击ParserDemo.java文件,设置运行参数Arguments为:
edu/stanford/nlp/models/lexparser/chinesePCFG.ser.gz data/chinese-onesent-utf8.txt
如此,可进行中文句法分析。
这里是一个简单中文句法分析的例子。
1.在Stanford官方网站下载最新安装包
http://nlp.stanford.edu/software/lex-parser.html#Download
2.解压下载后的zip包
stanford-parser-full-2015-12-09.zip,里面会有数据,依赖包以及demo,还有相关的source
code和java doc
3.使用Eclipse创建项目,名为stanfordparser,在build
path中引入stanford-parser-3.6.0-models.jar,stanford-parser.jar,slf4j-simple.jar,
slf4j-api.jar
4.从步骤2中解压的文件中把data文件夹复制到Eclipse项目中,新建ParserTest1.java类,代码如下:
import java.io.IOException; import edu.stanford.nlp.parser.lexparser.LexicalizedParser; import edu.stanford.nlp.trees.Tree; public class ParserTest1 { public static void main(String[]args)throws IOException { // String grammar = "edu/stanford/nlp/models/lexparser/chineseFactored.ser.gz"; String grammar ="edu/stanford/nlp/models/lexparser/chinesePCFG.ser.gz"; String[] options = {}; LexicalizedParser lp = LexicalizedParser.loadModel(grammar,options); String line ="这 是 一个 简单 的 例子"; Tree parse =lp.parse(line); parse.pennPrint(); String[] arg2 = {"-encoding","utf-8", "-outputFormat","penn,typedDependenciesCollapsed", "edu/stanford/nlp/models/lexparser/chineseFactored.ser.gz", "data/chinese-onesent-utf8.txt"}; LexicalizedParser.main(arg2); } }
5.运行,输出的结果为:
[main] INFOedu.stanford.nlp.parser.lexparser.LexicalizedParser - Loading parser fromserialized
file edu/stanford/nlp/models/lexparser/chinesePCFG.ser.gz ...
done [1.6 sec].
(ROOT
(IP
(NP (PN这))
(VP (VC是)
(NP
(QP (CD一个))
(CP
(IP
(VP
(VA 简单)))
(DEC的))
(NP (NN例子))))))
[main] INFOedu.stanford.nlp.parser.lexparser.LexicalizedParser - Loading parser fromserialized
file edu/stanford/nlp/models/lexparser/chineseFactored.ser.gz ...
done [6.0 sec].
Parsing file:data/chinese-onesent-utf8.txt
Parsing [sent. 1 len. 8]:俄国希望伊朗没有制造核武器计划。
(ROOT
(IP
(NP (NR俄国))
(VP (VV希望)
(IP
(NP (NR伊朗))
(VP
(ADVP
(AD 没有))
(VP (VV制造)
(NP
(NN 核武器) (NN计划))))))
(PU。)))
nsubj(希望-2,俄国-1)
root(ROOT-0,希望-2)
nsubj(制造-5,伊朗-3)
neg(制造-5,没有-4)
ccomp(希望-2,制造-5)
nn(计划-7,核武器-6)
dobj(制造-5,计划-7)
Parsed file: data/chinese-onesent-utf8.txt[1 sentences].
Parsed 8 words in 1 sentences (22.66 wds/sec;2.83 sents/sec).
参考资料:
stanford parser使用说明
http://blog.csdn.net/u010454729/article/details/46845403
使用Stanford
Parser进行句法分析
http://www.cnblogs.com/Denise-hzf/p/6612574.html
相关文章推荐
- Stanford parser入门2:中文句法路径提取
- stanford parser 中文句法分析
- stanford parser 中文句法分析
- stanford parser中文句法分析时注意的问题
- ZH奶酪:中文依存句法分析概述及应用
- 使用Stanford CoreNLP的Python封装包处理中文(分词、词性标注、命名实体识别、句法树、依存句法分析)
- 入门句法分析
- 入门句法分析
- 我的中文句法分析器
- 中文依存句法分析概述及应用
- 中文依存句法分析
- 十二、教你如何利用强大的中文语言技术平台做依存句法和语义依存分析
- 中文句法分析器 下载
- 【已解决】win10环境下基于nltk搭建stanford parser环境,进行中文依存句法分析
- 【已解决】win10环境下基于nltk搭建stanford parser环境,进行中文依存句法分析
- Elasticsearch入门和查询语法分析(ik中文分词)
- 入门句法分析
- 中文依存句法分析概述及应用
- fudannlp - 开源中文自然语言处理工具包|中文分词|词性标注|依存句法分析|指代消解 - Google Project Hosting
- 中文依存句法分析概述及应用