我正在做一个项目,即TG中的一个聊天机器人,任务之一就是回答用户的问题。我有一个常见问题列表,但我不知道如何将它们添加到数据库(sqlite)中,或者是否值得这样做。问题还在于,本质上相同的问题可以用不同的词语提出,据我所知,它可以通过 nltk 库来解决。告诉我如何最好地做到这一点,或者告诉我如何正确地谷歌搜索这个问题。提前致谢!
我正在做一个项目,即TG中的一个聊天机器人,任务之一就是回答用户的问题。我有一个常见问题列表,但我不知道如何将它们添加到数据库(sqlite)中,或者是否值得这样做。问题还在于,本质上相同的问题可以用不同的词语提出,据我所知,它可以通过 nltk 库来解决。告诉我如何最好地做到这一点,或者告诉我如何正确地谷歌搜索这个问题。提前致谢!
使用 SQLite 是一个好主意 - 它也将使搜索变得更容易。
如果我是你,我实际上会创建一个数据库,如下所示:
但要添加问题和答案,我会使用sql查询:
INSERT INTO faq (question, answer) VALUES ('вопрос?', 'ответ!');当收到问题时,当然,你可以使用NLTK,但我会寻找替代方案,但似乎只有一个LIKE用于在SQL中搜索的运算符。如果我是你,我会使用 TF-IDF 或 Word2Vec 来比较问题的相似度,但方法有点复杂但有效