RError.com

RError.com Logo RError.com Logo

RError.com Navigation

  • 主页

Mobile menu

Close
  • 主页
  • 系统&网络
    • 热门问题
    • 最新问题
    • 标签
  • Ubuntu
    • 热门问题
    • 最新问题
    • 标签
  • 帮助
主页 / 问题 / 1359329
Accepted
YuriiS
YuriiS
Asked:2022-05-10 16:48:18 +0000 UTC2022-05-10 16:48:18 +0000 UTC 2022-05-10 16:48:18 +0000 UTC

仅从字符串中获取唯一元素

  • 772

任务是从字符串中仅获取唯一元素,必须删除所有重复元素。例子:

Input:
String line = "Однажды в стране и однажды в мире";
Output:
"стране и мире"

首先我得到一个单词数组

String[] words = str.replaceAll("[^\\da-zA-Za-яёА-ЯЁ ]", "").toLowerCase().split(" ");

然后我需要遍历这个数组并将第一个元素与后续元素进行比较,如果发现重复,则获取下一个元素,如果不重复,则将其放入List<String> uniqueWords = new ArrayList<>() 我写的列表中:

for (int i = 0; i < words.length; i++) {
    String temp = words[i];
    for (int j = 0; j < uniqueWords.size(); j++) {
        if (uniqueWords.get(j).equals(temp)){
            break;
        } else {
             uniqueWords.add(temp);
           }
      }
  }

for(String cell : uniqueWords){
    result.append(cell).append(" ");
 }
System.out.println(result);

但它不起作用。我遗漏了一些东西并且做错了,但我无法弄清楚。我想在不使用Map I ask for help in this matter 的情况下做到这一点。

java
  • 3 3 个回答
  • 10 Views

3 个回答

  • Voted
  1. Nowhere Man
    2022-05-11T00:21:45Z2022-05-11T00:21:45Z

    此类问题通常通过构建词频图Map<String, Integer>,然后按不超过 1 的词频进行过滤来解决。这允许在不使用二次搜索的情况下求解,复杂度为 O(N)。

    另外,要得到一个单词数组,用replaceAll是多余的,用非字母或数字的字符分割字符串就足够了[^\p{L}\p{N}]

    String[] words = str.toLowerCase().split("[^\\p{L}\\p{N}]+");
    

    要构建地图,使用 Stream API 很方便:

    List<String> uniqueWords = Arrays.stream(words)
        .collect(Collectors.groupingBy(
            w -> w, LinkedHashMap::new, Collectors.counting()
        )) // Map<String, Long>
        .entrySet()
        .stream() // Stream<Map.Entry<String, Long>>
        .filter(e -> 1L == e.getValue())
        .map(Map.Entry::getKey)
        .collect(Collectors.toList());
    System.out.println(uniqueWords);
    System.out.println(String.join(" ", uniqueWords));
    

    结论:

    [стране, и, мире]
    стране и мире
    

    在不使用地图和计算频率的情况下,您可以使用两个Set- 第一个将记录所有出现,第二个 - 仅重复,如果元素已经存在于该集合中,则该方法在 main 完成后Set::add返回false循环,所有检测到的都应该从第一组重复中删除Set::removeAll。

    也会有 O(N) 复杂度。

    Set<String> uniques = new LinkedHashSet<>();
    Set<String> dups = new HashSet<>();
    for (String word : words) {
        if (!uniques.add(word)) {
            dups.add(word);
        }
    }
    uniques.removeAll(dups);
    System.out.println(uniques);
    System.out.println(String.join(" ", uniques));
    

    结论:

    [стране, и, мире]
    стране и мире
    

    通过使用Set<String> uniques = new TreeSet<>();,您可以按字母顺序对单词进行排序。


    null如果在迭代数组时设置重复单词,您还可以稍微优化现有解决方案words,在最好的情况下(所有重复)复杂度将为 O(N),在最坏的情况下(无重复),二次复杂度将仍然存在,但实际的迭代次数将是n * (n - 1) / 2:

    for (int i = 0, n = words.length; i < n; i++) {
        String word = words[i];
        if (null == word) {
            continue; // обнаружен удалённый дубликат
        }
        boolean unique = true;
        for (int j = i + 1; j < n; j++) {
            if (word.equals(words[j])) {
                unique = false;
                words[j] = null;
            }
        }
        if (unique) {
            uniqueWords.add(word);
        }
    }
    System.out.println(uniqueWords);
    
    • 2
  2. Best Answer
    MBo
    2022-05-10T17:28:10Z2022-05-10T17:28:10Z

    如果第一次检查成功,您立即输入单词,但您需要等到最后。并且不与选定的唯一值进行比较,而是与数组的其余部分进行比较。(将标志设为布尔值,因为它是用 Java 编写的)

    for (int i = 0; i < words.length; i++) {
        String temp = words[i];
        int flag = 1;  
        for (int j = 0; j < words.length; j++) {
            if ((i!=j) && (words.get(j).equals(temp))){
                flag = 0;
                break;
            }
          }
       if (flag==1) {
           uniqueWords.add(temp);
       }
      }
    
    • 1
  3. flawe
    2022-05-10T17:51:38Z2022-05-10T17:51:38Z

    根据您的 TK,我可以为您提供以下代码

            String line = "Однажды в стране и однажды в мире";
            String[] words = line.replaceAll("[^\\da-zA-Za-яёА-ЯЁ ]", "").toLowerCase().split(" ");
            List<String> wordList = new ArrayList<>();
            for (String word : words) {
                int count = 0;
                for (String s : words) {
                    if (word.equalsIgnoreCase(s))
                        count++;
                }
                if (count == 1)
                    wordList.add(word);
            }
            System.out.println(wordList);
    
    • 1

相关问题

  • wpcap 找不到指定的模块

  • 如何以编程方式从桌面应用程序打开 HTML 页面?

  • Android Studio 中的 R.java 文件在哪里?

  • HashMap 初始化

  • 如何使用 lambda 表达式通过增加与原点的距离来对点进行排序?

  • 最大化窗口时如何调整元素大小?

Sidebar

Stats

  • 问题 10021
  • Answers 30001
  • 最佳答案 8000
  • 用户 6900
  • 常问
  • 回答
  • Marko Smith

    表格填充不起作用

    • 2 个回答
  • Marko Smith

    提示 50/50,有两个,其中一个是正确的

    • 1 个回答
  • Marko Smith

    在 PyQt5 中停止进程

    • 1 个回答
  • Marko Smith

    我的脚本不工作

    • 1 个回答
  • Marko Smith

    在文本文件中写入和读取列表

    • 2 个回答
  • Marko Smith

    如何像屏幕截图中那样并排排列这些块?

    • 1 个回答
  • Marko Smith

    确定文本文件中每一行的字符数

    • 2 个回答
  • Marko Smith

    将接口对象传递给 JAVA 构造函数

    • 1 个回答
  • Marko Smith

    正确更新数据库中的数据

    • 1 个回答
  • Marko Smith

    Python解析不是css

    • 1 个回答
  • Martin Hope
    Alexandr_TT 2020年新年大赛! 2020-12-20 18:20:21 +0000 UTC
  • Martin Hope
    Alexandr_TT 圣诞树动画 2020-12-23 00:38:08 +0000 UTC
  • Martin Hope
    Air 究竟是什么标识了网站访问者? 2020-11-03 15:49:20 +0000 UTC
  • Martin Hope
    Qwertiy 号码显示 9223372036854775807 2020-07-11 18:16:49 +0000 UTC
  • Martin Hope
    user216109 如何为黑客设下陷阱,或充分击退攻击? 2020-05-10 02:22:52 +0000 UTC
  • Martin Hope
    Qwertiy 并变成3个无穷大 2020-11-06 07:15:57 +0000 UTC
  • Martin Hope
    koks_rs 什么是样板代码? 2020-10-27 15:43:19 +0000 UTC
  • Martin Hope
    Sirop4ik 向 git 提交发布的正确方法是什么? 2020-10-05 00:02:00 +0000 UTC
  • Martin Hope
    faoxis 为什么在这么多示例中函数都称为 foo? 2020-08-15 04:42:49 +0000 UTC
  • Martin Hope
    Pavel Mayorov 如何从事件或回调函数中返回值?或者至少等他们完成。 2020-08-11 16:49:28 +0000 UTC

热门标签

javascript python java php c# c++ html android jquery mysql

Explore

  • 主页
  • 问题
    • 热门问题
    • 最新问题
  • 标签
  • 帮助

Footer

RError.com

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

帮助

© 2023 RError.com All Rights Reserve   沪ICP备12040472号-5