ICTCLAS2011_JNI学习笔记-ICTCLAS_FileProcess接口
2013-04-18 11:37
357 查看
boolean ICTCLAS_FileProcess(byte[] sSrcFilename, int eCodeType, int bPOSTagged, byte[]sDestFilename)接口:该接口与ICTCLAS_ParagraphProcess接口类似,只是该接口用与处理文件,对整个文件的内容进行分词并标注,最后将结果存在目标文件中
* Method: ICTCLAS_FileProcess<!文本文件分词>
* Parameter: byte[] sSrcFilename<!要分词的文件>
* Parameter: int eCodeType<!要处理的文本编码类型>
* Parameter: int bPOSTagged<! 是否词性标准,0:不标注.1:标注.标注的词集根据ICTCLAS_SetPOSmap的设置值来定>
* Parameter: byte[] sDestFilename<! 结果文件存放位置>
* Returns: ICTCLAS_API bool<! 分词是否成功>
* Description: 1.用户若不指定分词结果保存位置,系统将结果保存至
当前目录下test_result.txt 中
2.sDestFilename,若该文件不存在, 则自动生成; 否则先清空已有内容
调用示例:
Java代码
package ICTCLAS.I3S.test;
import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStreamReader;
import java.io.UnsupportedEncodingException;
import ICTCLAS.I3S.AC.ICTCLAS50;
public class Test_ICTCLAS_FileProcess {
/**
* @param args
*/
public static void main(String[] args) {
// TODO Auto-generated method stub
ICTCLAS50 ictclas = new ICTCLAS50();
String useage = "java Test_ICTCLAS_ParagraphProcess sPath [nPOSmap]";
if (args.length < 1) {
System.err.println(useage);
return;
}
try {
if (!ictclas.ICTCLAS_Init(args[0].getBytes("GB2312"))) {
System.err.println("Initial failed!");
return;
}
System.out.println("Initial successed!");
/* 设置词性标注集(0 计算所二级标注集,1 计算所一级标注集,2 北大二级标注集,3 北大一级标注集) */
int nPosmap = args.length == 2 ? Integer.valueOf(args[1]) : 1;
ictclas.ICTCLAS_SetPOSmap(nPosmap);
BufferedReader reader = new BufferedReader(new InputStreamReader(
System.in, "GB2312"));
System.out.print("input the src file:");
String srcFilename = reader.readLine();
System.out.print("input the dst file:");
String dstFilename = reader.readLine();
if (ictclas.ICTCLAS_FileProcess(srcFilename.getBytes("GB2312"), 0,
1, dstFilename.getBytes("GB2312"))) {
System.out.println("process successly!");
} else {
System.err.println("process failed!");
}
} catch (UnsupportedEncodingException e) {
// TODO Auto-generated catch block
e.printStackTrace();
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
} finally {
ictclas.ICTCLAS_Exit();
}
}
}
* Method: ICTCLAS_FileProcess<!文本文件分词>
* Parameter: byte[] sSrcFilename<!要分词的文件>
* Parameter: int eCodeType<!要处理的文本编码类型>
* Parameter: int bPOSTagged<! 是否词性标准,0:不标注.1:标注.标注的词集根据ICTCLAS_SetPOSmap的设置值来定>
* Parameter: byte[] sDestFilename<! 结果文件存放位置>
* Returns: ICTCLAS_API bool<! 分词是否成功>
* Description: 1.用户若不指定分词结果保存位置,系统将结果保存至
当前目录下test_result.txt 中
2.sDestFilename,若该文件不存在, 则自动生成; 否则先清空已有内容
调用示例:
Java代码
package ICTCLAS.I3S.test;
import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStreamReader;
import java.io.UnsupportedEncodingException;
import ICTCLAS.I3S.AC.ICTCLAS50;
public class Test_ICTCLAS_FileProcess {
/**
* @param args
*/
public static void main(String[] args) {
// TODO Auto-generated method stub
ICTCLAS50 ictclas = new ICTCLAS50();
String useage = "java Test_ICTCLAS_ParagraphProcess sPath [nPOSmap]";
if (args.length < 1) {
System.err.println(useage);
return;
}
try {
if (!ictclas.ICTCLAS_Init(args[0].getBytes("GB2312"))) {
System.err.println("Initial failed!");
return;
}
System.out.println("Initial successed!");
/* 设置词性标注集(0 计算所二级标注集,1 计算所一级标注集,2 北大二级标注集,3 北大一级标注集) */
int nPosmap = args.length == 2 ? Integer.valueOf(args[1]) : 1;
ictclas.ICTCLAS_SetPOSmap(nPosmap);
BufferedReader reader = new BufferedReader(new InputStreamReader(
System.in, "GB2312"));
System.out.print("input the src file:");
String srcFilename = reader.readLine();
System.out.print("input the dst file:");
String dstFilename = reader.readLine();
if (ictclas.ICTCLAS_FileProcess(srcFilename.getBytes("GB2312"), 0,
1, dstFilename.getBytes("GB2312"))) {
System.out.println("process successly!");
} else {
System.err.println("process failed!");
}
} catch (UnsupportedEncodingException e) {
// TODO Auto-generated catch block
e.printStackTrace();
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
} finally {
ictclas.ICTCLAS_Exit();
}
}
}
相关文章推荐
- ICTCLAS2011_JNI学习笔记-ICTCLAS_SetPOSmap及ICTCLAS_ParagraphProcess接口
- ICTCLAS2011_JNI学习笔记-ICTCLAS_ImportUserDictFile及ICTCLAS_SaveTheUsrDic接口
- Android(java)学习笔记261:JNI之编写jni程序适配所有处理器型号
- Android(java)学习笔记262:JNI之工具快速开发步骤
- Android JNI 学习笔记(一):简答实现
- [Android]JNI学习笔记(一)
- JNI 学习笔记
- [JNI]学习笔记系列:二 基本数据类型,字符串,数据
- 1.JAVA中使用JNI调用C++代码学习笔记 - 星云博客园
- Android NDK(学习笔记四)—— 在NDK开发中JNI打印Log信息
- Android(java)学习笔记257:JNI之helloword案例(利用NDK工具)
- JNI 学习笔记系列(一)
- 2011寒假-数据库学习笔记
- JNI 学习笔记(三)-- JNI访问数组、引用、异常处理、缓存策略
- JNI 学习笔记(一)——字符串字符集转换
- Android JNI编程学习笔记——前言
- 2011 09 14学习笔记
- JNI学习笔记 C++传递结构体、String、数组对象给JavaC++传递结构体、String、数组对象给Java
- JNI学习笔记之:锅炉压力监控测试Demo
- JNI——《深入理解(I)》学习笔记2