现在我正在用python和SpeechRecognition做一个语音助手,但是每次我说一个命令,这个命令到文本的转换需要很长时间(5-15秒),非常不愉快。有什么方法可以加快这个过程吗?或者建议另一个图书馆...
这是识别码。
def recognize_cmd():
r = sr.Recognizer()
m = sr.Microphone(device_index=1)
with m as source:
print("---------")
r.pause_threshold = 0.5
r.adjust_for_ambient_noise(source, duration=1)
audio = r.listen(source)
try:
cmd = r.recognize_google(audio, language='en-EN').lower()
print("[log]User - " + cmd + '\n---------')
except sr.UnknownValueError:
talk("Voice is not recognized!")
cmd = recognize_cmd()
return cmd
PS最好该库具有这样的功能,adjust_for_ambient_noise()
并且如果可能的话,建议一个可以离线工作的库
你可以试试沃斯克
代码示例:
其他例子在这里。
安装使用
视窗下