我需要编写一种方法来识别输入的单词,而不管键盘语言如何。我主要使用俄语 (RU) 和英语 (US) 布局。我需要在使用英语键盘输入俄语单词时,系统知道我正在输入一个俄语单词,但没有切换到俄语键盘,反之亦然,这样它就可以识别输入的英语单词而不切换到英语键盘。例如,就像在 Google 搜索中所做的那样。如果你输入英文单词milk,它会返回milk。如果您以这种方式输入俄语单词milk - vjkjrj(英语-俄语键盘) - 它会给我带有俄语单词milk的结果。
例如:
- 牛奶
- 厄库树
- 阿卜杜勒·莱克夫
- g.ht 果泥
- i.go shupeaux
从哪里开始?也许有一些图书馆准备好了?
数据通过 Solr 提取(使用全文搜索)。
为了解决这一问题,可以计算输入的单词与预先准备的不同语言词典中的单词之间的 Damerau-Levenshtein 距离。如有必要,也许有一些限制。
示例算法: