Umy Asked:2020-02-06 21:56:32 +0000 UTC2020-02-06 21:56:32 +0000 UTC 2020-02-06 21:56:32 +0000 UTC 模糊搜索字符串中的子串 772 你好。有必要在 Java 中实现在字符串中搜索子字符串。那些。“出生人数与死亡人数的差额”这一行 应该在“一定时期内(例如一年)出生人数与死亡人数之间的差额称为人口自然增长”这一行中找到。 而“伊万诺夫”这一行应该在“伊万诺夫 - 这座城市最古老的居民”这一行中找到 只需要答案 - 该行中是否有类似的东西。建议一些东西,最好已经用 Java 实现了。 java 1 个回答 Voted Best Answer Barmaley 2020-02-06T23:58:23Z2020-02-06T23:58:23Z 粗略地说,这分 3 个步骤完成: 将字符串拆分为标记/单词 我们通过具有俄语形态的Apache Lucene运行生成的词素- 结果,我们得到了一个词素列表,其中清除了大小写/通用和其他强大的形态特征特征,即,而不是: 给定时间内出生人数与死亡人数之间的差异 我们得到 一定时间内出生人数与死亡人数之差 接下来,对于这些标记,我们计算一个哈希函数,该函数可以为相似的词给出接近的哈希值 - 例如,SimHash或类似提到的Levenshtein 我希望,其余的不需要解释。
粗略地说,这分 3 个步骤完成:
我们得到
我希望,其余的不需要解释。