设置狮身人面像。索引来源。我决定优化停用词列表,同时查看数据库中的常用词——即 按“出现”的降序输出我的 Sphinx 索引中的单词。
你需要得到类似列表“word_in_reduced_form”的东西:number of_occurrences。例子:
и: 1394783948
в: 3482575
дом: 23415
участок: 1241
синхрофазатрон: 1
怎么做?
设置狮身人面像。索引来源。我决定优化停用词列表,同时查看数据库中的常用词——即 按“出现”的降序输出我的 Sphinx 索引中的单词。
你需要得到类似列表“word_in_reduced_form”的东西:number of_occurrences。例子:
и: 1394783948
в: 3482575
дом: 23415
участок: 1241
синхрофазатрон: 1
怎么做?
为此有一个特殊的索引模式 -
indexer --buildstops ... --buildfreqs。在一般情况下,这是不可能在已构建的索引上执行的,因为 规范化标记(形态、异常等)时,初始形式可能会丢失。