RError.com

RError.com Logo RError.com Logo

RError.com Navigation

  • 主页

Mobile menu

Close
  • 主页
  • 系统&网络
    • 热门问题
    • 最新问题
    • 标签
  • Ubuntu
    • 热门问题
    • 最新问题
    • 标签
  • 帮助
主页 / 问题 / 1107412
Accepted
Tenge
Tenge
Asked:2020-04-08 23:07:58 +0000 UTC2020-04-08 23:07:58 +0000 UTC 2020-04-08 23:07:58 +0000 UTC

从另一个文件中删除与行匹配的行

  • 772

有一个文件 test1.txt 和一个文件 test2.txt,它们都由带有随机字符的字符串组成。但有些行在 test1.txt 和 test2.txt 中是相同的

例子:

$ cat test1.txt 
случайные_символы1
случайные_символы2
случайные_символы3
случайные_символы4
!@#%^%&^*^
8246****

$ cat test2.txt 
случайные_символы1
!@#%^%&^*^
8246****
случайные_символы20

我想得到带有结果的 test1.txt 文件:

случайные_символы2
случайные_символы3
случайные_символы4

找到了这样的解决方案:

sed -i -f <(sed 's,^,/^,;s,$,/d,' test2.txt) test1.txt

给出错误消息:

sed: file /dev/fd/63 line 3: Invalid preceding regular expression

据我了解,它在第 8246 行发誓 ****

如何使处理任何字符串成为可能,无论其中包含什么字符?或者也许有另一种解决方案?


解决方案:文件小于 1GB,'Enikeyshchik' 的答案效果很好

因为我的文件要大得多 - 这出现了:

comm -2 -3 test1.txt test2.txt
python-3.x
  • 1 1 个回答
  • 10 Views

1 个回答

  • Voted
  1. Best Answer
    Эникейщик
    2020-04-08T23:20:10Z2020-04-08T23:20:10Z

    您可以将这两个文件读入列表(例如,通过 readlines()),从列表中创建集合,然后从第一个中减去第二个:

    file1 = ["случайные_символы1","случайные_символы2","случайные_символы3","случайные_символы4","!@#%^%&^*^","8246****"]
    
    file2 = ["случайные_символы1","!@#%^%&^*^","8246****","случайные_символы20"]
    
    s1 = set(file1)
    s2 = set(file2)
    print (s1-s2)
    

    非常大文件的选项:

    with open("text2.txt") as file2:
        data2 = f1.readlines()
        s2 = set(data1)
    s1 = []
    with open("text1.txt") as file1:
        for line in file2:
            if line not in s2:
                s1.append(line)
    print(s1)
    

    我们完整读取第二个文件,然后逐行读取第一个文件并检查第二个文件中是否存在一行。

    • 1

相关问题

  • 在 Linux 服务器上运行 Django 项目

  • 当您单击kivy设置中的关闭按钮时,如何调用更新应用程序本身的gui的方法

  • 制作一个按钮处理程序来调用该函数。那些。单击按钮时,该函数应运行。遥控机器人

  • 如何正确地将列表项添加到 Word 表格中?

  • 内容解析(Python、BeautifulSoup、请求)

  • 脚本不适用于 BeautifulSoup 和请求 (Python3x)

Sidebar

Stats

  • 问题 10021
  • Answers 30001
  • 最佳答案 8000
  • 用户 6900
  • 常问
  • 回答
  • Marko Smith

    如何从列表中打印最大元素(str 类型)的长度?

    • 2 个回答
  • Marko Smith

    如何在 PyQT5 中清除 QFrame 的内容

    • 1 个回答
  • Marko Smith

    如何将具有特定字符的字符串拆分为两个不同的列表?

    • 2 个回答
  • Marko Smith

    导航栏活动元素

    • 1 个回答
  • Marko Smith

    是否可以将文本放入数组中?[关闭]

    • 1 个回答
  • Marko Smith

    如何一次用多个分隔符拆分字符串?

    • 1 个回答
  • Marko Smith

    如何通过 ClassPath 创建 InputStream?

    • 2 个回答
  • Marko Smith

    在一个查询中连接多个表

    • 1 个回答
  • Marko Smith

    对列表列表中的所有值求和

    • 3 个回答
  • Marko Smith

    如何对齐 string.Format 中的列?

    • 1 个回答
  • Martin Hope
    Alexandr_TT 2020年新年大赛! 2020-12-20 18:20:21 +0000 UTC
  • Martin Hope
    Alexandr_TT 圣诞树动画 2020-12-23 00:38:08 +0000 UTC
  • Martin Hope
    Air 究竟是什么标识了网站访问者? 2020-11-03 15:49:20 +0000 UTC
  • Martin Hope
    Qwertiy 号码显示 9223372036854775807 2020-07-11 18:16:49 +0000 UTC
  • Martin Hope
    user216109 如何为黑客设下陷阱,或充分击退攻击? 2020-05-10 02:22:52 +0000 UTC
  • Martin Hope
    Qwertiy 并变成3个无穷大 2020-11-06 07:15:57 +0000 UTC
  • Martin Hope
    koks_rs 什么是样板代码? 2020-10-27 15:43:19 +0000 UTC
  • Martin Hope
    Sirop4ik 向 git 提交发布的正确方法是什么? 2020-10-05 00:02:00 +0000 UTC
  • Martin Hope
    faoxis 为什么在这么多示例中函数都称为 foo? 2020-08-15 04:42:49 +0000 UTC
  • Martin Hope
    Pavel Mayorov 如何从事件或回调函数中返回值?或者至少等他们完成。 2020-08-11 16:49:28 +0000 UTC

热门标签

javascript python java php c# c++ html android jquery mysql

Explore

  • 主页
  • 问题
    • 热门问题
    • 最新问题
  • 标签
  • 帮助

Footer

RError.com

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

帮助

© 2023 RError.com All Rights Reserve   沪ICP备12040472号-5