Python语言实现百度语音识别API的使用实例
未来的一段时间,人工智能在市场上占有很重的位置,Python语言则是研究人工智能的最佳编程语言,下面,就让我们来感受一下它的魅力吧!
百度给的样例程序,不论C还是Java版,都分为method1和method2两种
前者称为隐式(post的是json串,音频数据编码到json里),后者称为显式(post的就是音频数据)
一开始考虑到pythonwave包处理的都是“字符串”,担心跟C语言的数组不一致,所以选择低效但保险的method1,
即先将音频数据base64编码,再加上采样率、通道数等信息汇集成dict,最后总体编码成json串
结果老是报:
3300输入参数不正确
先后试过urllib2和pycurl包,都是上面情况
不得已换用method2,成功(看来wave包对音频的存储并不是“字符串”)
#encoding=utf-8
importwave
importurllib,urllib2,pycurl
importbase64
importjson
##getaccesstokenbyapikey&secretkey
defget_token():
apiKey="xxxxxxxx"
secretKey="xxxxxxxxx"
auth_url="https://openapi.baidu.com/oauth/2.0/token?grant_type=client_credentials&client_id="+apiKey+"&client_secret="+secretKey;
res=urllib2.urlopen(auth_url)
json_data=res.read()
returnjson.loads(json_data)['access_token']
defdump_res(buf):
printbuf
##postaudiotoserver
defuse_cloud(token):
fp=wave.open('vad_0.wav','rb')
nf=fp.getnframes()
f_len=nf*2
audio_data=fp.readframes(nf)
cuid="xxxxxxxxxx"#myxiaomiphoneMAC
srv_url='http://vop.baidu.com/server_api'+'?cuid='+cuid+'&token='+token
http_header=[
'Content-Type:audio/pcm;rate=8000',
'Content-Length:%d'%f_len
]
c=pycurl.Curl()
c.setopt(pycurl.URL,str(srv_url))#curldoesn'tsupportunicode
#c.setopt(c.RETURNTRANSFER,1)
c.setopt(c.HTTPHEADER,http_header)#mustbelist,notdict
c.setopt(c.POST,1)
c.setopt(c.CONNECTTIMEOUT,30)
c.setopt(c.TIMEOUT,30)
c.setopt(c.WRITEFUNCTION,dump_res)
c.setopt(c.POSTFIELDS,audio_data)
c.setopt(c.POSTFIELDSIZE,f_len)
c.perform()#pycurl.perform()hasnoreturnval
if__name__=="__main__":
token=get_token()
use_cloud(token)
运行结果
{"corpus_no":"6150045491002357923","err_msg":"success.","err_no":0,"result":["播放小苹果,"],"sn":"243903724071431919050"}
总结
以上就是本文关于Python语言实现百度语音识别API的使用实例的全部内容,希望对大家有所帮助。感兴趣的朋友可以继续参阅本站:
Python实现简单的语音识别系统
Python通过Django实现用户注册和邮箱验证功能代码
python使用pil进行图像处理(等比例压缩、裁剪)实例代码
如有不足之处,欢迎留言指出。感谢朋友们对本站的支持!