在 Linux 服务器上运行 Django 项目

Question

Tenge

Asked:2020-04-08 23:07:58 +0000 UTC2020-04-08 23:07:58 +0000 UTC 2020-04-08 23:07:58 +0000 UTC

从另一个文件中删除与行匹配的行

772

有一个文件 test1.txt 和一个文件 test2.txt，它们都由带有随机字符的字符串组成。但有些行在 test1.txt 和 test2.txt 中是相同的

例子：

$ cat test1.txt 
случайные_символы1
случайные_символы2
случайные_символы3
случайные_символы4
!@#%^%&^*^
8246****

$ cat test2.txt 
случайные_символы1
!@#%^%&^*^
8246****
случайные_символы20

我想得到带有结果的 test1.txt 文件：

случайные_символы2
случайные_символы3
случайные_символы4

找到了这样的解决方案：

sed -i -f <(sed 's,^,/^,;s,$,/d,' test2.txt) test1.txt

给出错误消息：

sed: file /dev/fd/63 line 3: Invalid preceding regular expression

据我了解，它在第 8246 行发誓 ****

如何使处理任何字符串成为可能，无论其中包含什么字符？或者也许有另一种解决方案？

解决方案：文件小于 1GB，'Enikeyshchik' 的答案效果很好

因为我的文件要大得多 - 这出现了：

comm -2 -3 test1.txt test2.txt

1 个回答

Voted

Эникейщик · Answer 1 · 2020-04-08T23:20:10Z

Best Answer

Эникейщик

2020-04-08T23:20:10Z2020-04-08T23:20:10Z

您可以将这两个文件读入列表（例如，通过 readlines()），从列表中创建集合，然后从第一个中减去第二个：

file1 = ["случайные_символы1","случайные_символы2","случайные_символы3","случайные_символы4","!@#%^%&^*^","8246****"]

file2 = ["случайные_символы1","!@#%^%&^*^","8246****","случайные_символы20"]

s1 = set(file1)
s2 = set(file2)
print (s1-s2)

非常大文件的选项：

with open("text2.txt") as file2:
    data2 = f1.readlines()
    s2 = set(data1)
s1 = []
with open("text1.txt") as file1:
    for line in file2:
        if line not in s2:
            s1.append(line)
print(s1)

我们完整读取第二个文件，然后逐行读取第一个文件并检查第二个文件中是否存在一行。

1

从另一个文件中删除与行匹配的行

如何从列表中打印最大元素（str 类型）的长度？

如何在 PyQT5 中清除 QFrame 的内容

如何将具有特定字符的字符串拆分为两个不同的列表？

导航栏活动元素

是否可以将文本放入数组中？[关闭]

如何一次用多个分隔符拆分字符串？

如何通过 ClassPath 创建 InputStream？

在一个查询中连接多个表

对列表列表中的所有值求和

如何对齐 string.Format 中的列？

从另一个文件中删除与行匹配的行

1 个回答

相关问题