2020年新年大赛！

Question

Alex Brunno

Asked:2022-08-18 15:41:09 +0000 UTC2022-08-18 15:41:09 +0000 UTC 2022-08-18 15:41:09 +0000 UTC

分隔列的内容

772

有DF：

Project name
0   ABC-ND-SON-Project-a
1   ABC-ND-SON-Project-a
2   ABC-ND-SON-Project-a
3   ABC-WD-SON-Project-b
4   ABC-WD-SON-Project-b
5   ABC-LI-SON-Project-c
6   ABC-LI-SON-Project-c
7   ABC-KD-SON-Project-d
8   ABC-KD-SON-Project-d

其中，我需要删除前 4 个字符以摆脱“ABC-”部分，然后对于“LI-SON”和“KD-SON”项目，只保留测试的前两个部分。对于其他类型的项目，留下3个部分。

这是我想要得到的结果：

Project name
0   ND-SON-Project
1   ND-SON-Project
2   ND-SON-Project
3   WD-SON-Project
4   WD-SON-Project
5   LI-SON
6   LI-SON
7   KD-SON
8   KD-SON

编码：

import pandas as pd
df_list = pd.read_html('Table.html', match='Projects:')
df = pd.concat([df_list], axis=1) #датафрейм с изначальным списком

df['Project name'] = df['Project name'].str[4:] #удаление "ABC-" 
df = df['Project name'].str.split('-', 3,  expand=True)
cols = [0, 1, 2]
df['New'] = df[cols].apply(lambda row: '-'.join(row.values.astype(str)), axis=1) #новый столбец, в котором все Project names содержат только первые 3 части текста (без ABC-)
df = df.drop(columns=[0, 1, 2, 3])
print(df)

在这个阶段，我不能只删除 LI 和 KD 项目的“-Project”部分：

New
0   ND-SON-Project
1   ND-SON-Project
2   ND-SON-Project
3   WD-SON-Project
4   WD-SON-Project
5   LI-SON-Project
6   LI-SON-Project
7   KD-SON-Project
8   KD-SON-Project

我试图只删除“LI”：

def row(df):
    for k in df['New']:
        if k.startswith('LI'):
            k.str.split('-', 1)[0]
df['New'] = df['New'].apply(row)

但它给出了这个错误：

TypeError                                 Traceback (most recent call last)
Input In [66], in <module>
      3         if k.startswith('LI'):
      4             k.str.split('-', 1)[0]
----> 5 df['New'] = df['New'].apply(row)

Input In [66], in row(df)
      1 def row(df):
----> 2     for k in df['New']:
      3         if k.startswith('LI'):
      4             k.str.split('-', 1)[0]

TypeError: string indices must be integers

1 个回答

Voted

strawdog · Answer 1 · 2022-08-18T17:15:03Z

Best Answer

strawdog

2022-08-18T17:15:03Z2022-08-18T17:15:03Z

你做了什么，我想

df.loc[df["Project name"].str.contains("LI|KD")] = df.loc[df["Project name"].str.contains("LI|KD")].applymap(lambda x: "-".join(x.split("-")[1:3]))
df.loc[df["Project name"].str.contains("ABC")] = df.loc[df["Project name"].str.contains("ABC")].applymap(lambda x: "-".join(x.split("-")[1:4]))

东风：

     Project name
0  ND-SON-Project
1  ND-SON-Project
2  ND-SON-Project
3  WD-SON-Project
4  WD-SON-Project
5          LI-SON
6          LI-SON
7          KD-SON
8          KD-SON

1

分隔列的内容

我看不懂措辞

请求的模块“del”不提供名为“default”的导出

"!+tab" 在 HTML 的 vs 代码中不起作用

我正在尝试解决“猜词”的问题。Python

可以使用哪些命令将当前指针移动到指定的提交而不更改工作目录中的文件？

Python解析野莓

问题：“警告：检查最新版本的 pip 时出错。”

帮助编写一个用值填充变量的循环。解决这个问题

尽管依赖数组为空，但在渲染上调用了 2 次 useEffect

数据不通过 Telegram.WebApp.sendData 发送

分隔列的内容

1 个回答

相关问题