2020年新年大赛！

Question

E_d_u_a_r_d

Asked:2020-02-26 03:06:43 +0000 UTC2020-02-26 03:06:43 +0000 UTC 2020-02-26 03:06:43 +0000 UTC

python中的快速语音识别

772

现在我正在用python和SpeechRecognition做一个语音助手，但是每次我说一个命令，这个命令到文本的转换需要很长时间（5-15秒），非常不愉快。有什么方法可以加快这个过程吗？或者建议另一个图书馆...

这是识别码。

def recognize_cmd():
    r = sr.Recognizer()

    m = sr.Microphone(device_index=1)

    with m as source:
        print("---------")
        r.pause_threshold = 0.5
        r.adjust_for_ambient_noise(source, duration=1)
        audio = r.listen(source)

    try:
        cmd = r.recognize_google(audio, language='en-EN').lower()
        print("[log]User - " + cmd + '\n---------')
    except sr.UnknownValueError:
        talk("Voice is not recognized!")
        cmd = recognize_cmd()

    return cmd

PS最好该库具有这样的功能，adjust_for_ambient_noise() 并且如果可能的话，建议一个可以离线工作的库

1 个回答

Voted

Nikolay Shmyrev · Answer 1 · 2020-02-26T23:04:36Z

Best Answer

Nikolay Shmyrev

2020-02-26T23:04:36Z2020-02-26T23:04:36Z

你可以试试沃斯克

代码示例：

#!/usr/bin/python3

from vosk import Model, KaldiRecognizer
import os

if not os.path.exists("model-en"):
    print ("Please download the model from https://github.com/alphacep/kaldi-android-demo/releases and unpack as 'model' in the current folder.")
    exit (1)

import pyaudio

p = pyaudio.PyAudio()
stream = p.open(format=pyaudio.paInt16, channels=1, rate=16000, input=True, frames_per_buffer=8000)
stream.start_stream()

model = Model("model-en")
rec = KaldiRecognizer(model, 16000)

while True:
    data = stream.read(2000)
    if len(data) == 0:
        break
    if rec.AcceptWaveform(data):
        print(rec.Result())
    else:
        print(rec.PartialResult())

print(rec.FinalResult())

其他例子在这里。

安装使用

pip install vosk

视窗下

pip install https://github.com/dtreskunov/tiny-kaldi/releases/download/0.3.1.2/vosk-0.3.1.2-cp37-cp37m-win_amd64.whl

2

python中的快速语音识别

如何从列表中打印最大元素（str 类型）的长度？

如何在 PyQT5 中清除 QFrame 的内容

如何将具有特定字符的字符串拆分为两个不同的列表？

导航栏活动元素

是否可以将文本放入数组中？[关闭]

如何一次用多个分隔符拆分字符串？

如何通过 ClassPath 创建 InputStream？

在一个查询中连接多个表

对列表列表中的所有值求和

如何对齐 string.Format 中的列？

python中的快速语音识别

1 个回答

相关问题