您的位置:首页 > 移动开发 > Android开发

Android 科大讯飞第三方SDK 4000 集成

2017-11-01 09:00 274 查看
一、语音识别

1.下载SDK(地址:http://www.xfyun.cn/sdk/dispatcher),选择语音听写SDK ,下载前会让你先创建应用,创建应用后会得到一个appid。然后点“立即开通”去开通“语音识别”功能,之后就会跳出“SDK下载”的页面,然后就可以下载了(未注册账号的要先注册一个账号)。

2.将下载好的SDK中 libs 目录下的 Msc.jar包引入到工程中(参见http://blog.csdn.net/highboys/article/details/51549679,此外,因为本Demo中会用到json的东西,所以还得自己去下一个Gson的依赖包,一并引进去)。之后在main目录下新建一个jniLibs目录,将 SDK中 libs 目录下的armeabi 拷进去,如下图所示(第④个先不用管):



3.科大讯飞为我们提供了一套语音听写时的UI,即听写的时候会有一个动画效果(如上图),这个时候我们需要 先将 SDK 资源包 assets 路径下的资源文件拷贝至 Android 工程asstes 目录下(没有的话自己新建),参照上图。



4.接下来就是代码的实现了。首先在Manifest中添加一下权限

<!--连接网络权限,用于执行云端语音能力 -->
<uses-permission android:name="android.permission.INTERNET" />
<!--获取手机录音机使用权限,听写、识别、语义理解需要用到此权限 -->
<uses-permission android:name="android.permission.RECORD_AUDIO" />
<!--读取网络信息状态 -->
<uses-permission android:name="android.permission.ACCESS_NETWORK_STATE" />
<!--获取当前wifi状态 -->
<uses-permission android:name="android.permission.ACCESS_WIFI_STATE" />
<!--允许程序改变网络连接状态 -->
<uses-permission android:name="android.permission.CHANGE_NETWORK_STATE" />
<!--读取手机信息权限 -->
<uses-permission android:name="android.permission.READ_PHONE_STATE" />

<!--SD卡读写的权限(如果需要保存音频文件到本地的话)-->
<uses-permission android:name="android.permission.MOUNT_UNMOUNT_FILESYSTEMS" />
<uses-permission android:name="android.permission.WRITE_EXTERNAL_STORAGE" />
<uses-permission android:name="android.permission.READ_EXTERNAL_STORAGE" />


5.其次是mainActivity代码

public class MainActivity extends AppCompatActivity implements View.OnClickListener {
private RecognizerDialog iatDialog;
private EditText etText;
private Button b1, b2;

@Override
protected void onCreate(Bundle savedInstanceState) {
super.onCreate(savedInstanceState);
setContentView(R.layout.activity_main);
etText = (EditText) findViewById(R.id.ed);
b1 = (Button) findViewById(R.id.yu);
b2 = (Button) findViewById(R.id.tx);
b2.setOnClickListener(this);
b1.setOnClickListener(this);
SpeechUtility.createUtility(MainActivity.this, SpeechConstant.APPID + "=59f856b2");
}

private void spec() {

// ②初始化有交互动画的语音识别器
iatDialog = new RecognizerDialog(MainActivity.this, mInitListener);
//③设置监听,实现听写结果的回调
iatDialog.setListener(new RecognizerDialogListener() {
String resultJson = "[";//放置在外边做类的变量则报错,会造成json格式不对(?)

@Override
public void onResult(RecognizerResult recognizerResult, boolean isLast) {
System.out.println("-----------------   onResult   -----------------");
if (!isLast) {
resultJson += recognizerResult.getResultString() + ",";
} else {
resultJson += recognizerResult.getResultString() + "]";
}

if (isLast) {
//解析语音识别后返回的json格式的结果
Gson gson = new Gson();
List<DictationResult> resultList = gson.fromJson(resultJson,
new TypeToken<List<DictationResult>>() {
}.getType());
String result = "";
for (int i = 0; i < resultList.size() - 1; i++) {
result += resultList.get(i).toString();
}
etText.setText(result);
//获取焦点
etText.requestFocus();
//将光标定位到文字最后,以便修改
etText.setSelection(result.length());
}
}

@Override
public void onError(SpeechError speechError) {
//自动生成的方法存根
speechError.getPlainDescription(true);
}
});
//开始听写,需将sdk中的assets文件下的文件夹拷入项目的assets文件夹下(没有的话自己新建)
iatDialog.show();
}

public static final String TAG = "MainActivity";
private InitListener mInitListener = new InitListener() {
@Override
public void onInit(int code) {
Log.d(TAG, "SpeechRecognizer init() code = " + code);
if (code != ErrorCode.SUCCESS) {
Toast.makeText(MainActivity.this, "初始化失败,错误码:" + code, Toast.LENGTH_SHORT).show();
}
}
};

@Override
public void onClick(View v) {
switch (v.getId()) {
case R.id.yu:
spec();
break;
case R.id.tx:
text();
break;

}
}
private void text(){
//1. 创建 SpeechSynthesizer 对象 , 第二个参数: 本地合成时传 InitListener
SpeechSynthesizer mTts = SpeechSynthesizer.createSynthesizer(this, null);
//2.合成参数设置,详见《 MSC Reference Manual》 SpeechSynthesizer 类
//设置发音人(更多在线发音人,用户可参见 附录 13.2
mTts.setParameter(SpeechConstant.VOICE_NAME, "vixyun"); // 设置发音人
mTts.setParameter(SpeechConstant.SPEED, "50");// 设置语速
mTts.setParameter(SpeechConstant.VOLUME, "80");// 设置音量,范围 0~100
mTts.setParameter(SpeechConstant.ENGINE_TYPE, SpeechConstant.TYPE_CLOUD); //设置云端
//设置合成音频保存位置(可自定义保存位置),保存在 “./sdcard/iflytek.pcm”
//保存在 SD 卡需要在 AndroidManifest.xml 添加写 SD 卡权限
//仅支持保存为 pcm 和 wav 格式, 如果不需要保存合成音频,注释该行代码
mTts.setParameter(SpeechConstant.TTS_AUDIO_PATH, "./sdcard/iflytek.pcm");
//3.开始合成
mTts.startSpeaking(etText.getText().toString(), new MySynthesizerListener());
}
class MySynthesizerListener implements SynthesizerListener {

@Override
public void onSpeakBegin() {
showTip(" 开始播放 ");
}

@Override
public void onSpeakPaused() {
showTip(" 暂停播放 ");
}

@Override
public void onSpeakResumed() {
showTip(" 继续播放 ");
}

@Override
public void onBufferProgress(int percent, int beginPos, int endPos,
String info) {
// 合成进度
}

@Override
public void onSpeakProgress(int percent, int beginPos, int endPos) {
// 播放进度
}

@Override
public void onCompleted(SpeechError error) {
if (error == null) {
showTip("播放
d061
完成 ");
} else if (error != null) {
showTip(error.getPlainDescription(true));
}
}

@Override
public void onEvent(int eventType, int arg1, int arg2, Bundle obj) {
// 以下代码用于获取与云端的会话 id,当业务出错时将会话 id提供给技术支持人员,可用于查询会话日志,定位出错原因
// 若使用本地能力,会话 id为null
//if (SpeechEvent.EVENT_SESSION_ID == eventType) {
//     String sid = obj.getString(SpeechEvent.KEY_EVENT_SESSION_ID);
//     Log.d(TAG, "session id =" + sid);
//}
}
}
private void showTip (String data) {
Toast.makeText( this, data, Toast.LENGTH_SHORT).show() ;
}
}


上面的代码用到了一个DictationResult类(一个用来接收转换 语音听写结果的类),需要自己新建,定义如下

/**
* 解析 语音听写返回结果Json格式字符串 的模板类(多重嵌套Json)
*
* 语音识别结果Json数据格式(单条数据):
* {"sn":1,"ls":true,"bg":0,"ed":0,"ws":[
* {"bg":0,"cw":[{"w":"今天","sc":0}]},
* {"bg":0,"cw":[{"w":"的","sc":0}]},
* {"bg":0,"cw":[{"w":"天气","sc":0}]},
* {"bg":0,"cw":[{"w":"怎么样","sc":0}]},
* {"bg":0,"cw":[{"w":"。","sc":0}]}
* ]}
*
* sn  number :第几句
* ls   boolean: 是否最后一句
* bg  number :开始
* ed  number :结束
* ws  array :词
* cw   array :中文分词
* w  string :单字
* sc  number :分数
*/
public class DictationResult {
private String sn;
private String ls;
private String bg;
private String ed;

private List<Words> ws;

public static class Words {
private String bg;
private List<Cw> cw;

public static class Cw {
private String w;
private String sc;

public String getW() {
return w;
}

public void setW(String w) {
this.w = w;
}

public String getSc() {
return sc;
}

public void setSc(String sc) {
this.sc = sc;
}

@Override
public String toString() {
return w;
}
}

public String getBg() {
return bg;
}

public void setBg(String bg) {
this.bg = bg;
}

public List<Cw> getCw() {
return cw;
}

public void setCw(List<Cw> cw) {
this.cw = cw;
}

@Override
public String toString() {
String result = "";
for (Cw cwTmp : cw) {
result += cwTmp.toString();
}
return result;
}
}

public String getSn() {
return sn;
}

public void setSn(String sn) {
this.sn = sn;
}

public String getLs() {
return ls;
}

public void setLs(String ls) {
this.ls = ls;
}

public String getBg() {
return bg;
}

public void setBg(String bg) {
this.bg = bg;
}

public String getEd() {
return ed;
}

public void setEd(String ed) {
this.ed = ed;
}

public List<Words> getWs() {
return ws;
}

public void setWs(List<Words> ws) {
this.ws = ws;
}

@Override
public String toString() {
String result = "";
for (Words wsTmp : ws) {
result += wsTmp.toString();
}
return result;
}
}


最后是XML中的:一个输入框两个按钮

<?xml version="1.0" encoding="utf-8"?>
<LinearLayout xmlns:android="http://schemas.android.com/apk/res/android"
xmlns:tools="http://schemas.android.com/tools"
android:id="@+id/activity_main"
android:orientation="vertical"
android:layout_width="match_parent"
android:layout_height="match_parent"
android:paddingBottom="@dimen/activity_vertical_margin"
android:paddingLeft="@dimen/activity_horizontal_margin"
android:paddingRight="@dimen/activity_horizontal_margin"
android:paddingTop="@dimen/activity_vertical_margin"
tools:context="test.bwie.com.myspeech.MainActivity">

<EditText
android:layout_width="match_parent"
android:layout_height="wrap_content"
android:id="@+id/ed"/>
<Button
android:layout_width="match_parent"
android:layout_height="wrap_content"
android:id="@+id/yu"
android:text="语音转文字"/>
<Button
android:layout_width="match_parent"
android:layout_height="wrap_content"
android:id="@+id/text"
android:text="文字转语音"/>
</LinearLayout>


以上就是语言听写的实现,注意一定要把app id改成自己的!!!
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  android