RError.com

RError.com Logo RError.com Logo

RError.com Navigation

  • 主页

Mobile menu

Close
  • 主页
  • 系统&网络
    • 热门问题
    • 最新问题
    • 标签
  • Ubuntu
    • 热门问题
    • 最新问题
    • 标签
  • 帮助
主页 / 问题 / 1592122
Accepted
polsok
polsok
Asked:2024-08-28 14:57:49 +0000 UTC2024-08-28 14:57:49 +0000 UTC 2024-08-28 14:57:49 +0000 UTC

表解析(一般数据、不同数据和空数据)

  • 772

假设 .csv 文件中有一个表

(为了方便和人类可读性,我采用了测试数据)

ID 234522 524321 234956 234983 293853
姓 伊万诺夫 塔拉索娃 彼得罗夫 库兹涅佐娃 普希金
地面 男性 女性 男性 女性 男性
出生年份 1965年 1999年 1984年 1979年 2001年
职称 工程师 工程师 工程师 工程师 工程师
儿童数量 2 1 3
电话 7485 3310 6500
办公室 中央 中央 中央 中央 中央
邮件 [电子邮件受保护] [电子邮件受保护] [电子邮件受保护]

您需要处理这些数据:

1 分离可变和不可变数据:

不可变数据:

钥匙 意义
职称 工程师
办公室 中央

可变数据:

ID 234522 524321 234956 234983 293853
姓 伊万诺夫 塔拉索娃 彼得罗夫 库兹涅佐娃 普希金
地面 男性 女性 男性 女性 男性
出生年份 1965年 1999年 1984年 1979年 2001年
儿童数量 2 1 3
电话 7485 3310 6500
邮件 [电子邮件受保护] [电子邮件受保护] [电子邮件受保护]

2 分离空数据和非空数据:

空数据(有空数据的行,没有空数据的列除外)

ID 524321 234956 234983 293853
儿童数量 1 3
电话 3310 6500
邮件 [电子邮件受保护] [电子邮件受保护]

非空数据(仅限字符串):

ID 234522 524321 234956 234983 293853
姓 伊万诺夫 塔拉索娃 彼得罗夫 库兹涅佐娃 普希金
地面 男性 女性 男性 女性 男性
出生年份 1965年 1999年 1984年 1979年 2001年
职称 工程师 工程师 工程师 工程师 工程师
办公室 中央 中央 中央 中央 中央

我想用 pandas 将它们分开,请帮我解决问题

python
  • 1 1 个回答
  • 44 Views

1 个回答

  • Voted
  1. Best Answer
    strawdog
    2024-08-28T15:12:19Z2024-08-28T15:12:19Z

    这些实际上是简单的任务。

    unmutable_data = ["должность", "офис"]
    print(df.loc[df["ID"].isin(unmutable_data)])
    print(df.loc[~df["ID"].isin(unmutable_data)])
    print(df.loc[df.isnull().any(axis=1)])
    print(df.loc[~df.isnull().any(axis=1)])
    
              ID       234522       524321       234956       234983       293853
    3  должность      инженер      инженер      инженер      инженер      инженер
    6       офис  центральный  центральный  центральный  центральный  центральный
    
                     ID          234522            524321          234956     234983   293853
    0           фамилия          Иванов          Тарасова          Петров  Кузнецова   Пушкин
    1               пол         мужской           женский         мужской    женский  мужской
    2      год рождения            1965              1999            1984       1979     2001
    4  количество детей               2                 1             NaN          3      NaN
    5           телефон            7485               NaN            3310       6500      NaN
    7             почта  [email protected]  [email protected]  [email protected]        NaN      NaN
    
                     ID          234522            524321          234956 234983 293853
    4  количество детей               2                 1             NaN      3    NaN
    5           телефон            7485               NaN            3310   6500    NaN
    7             почта  [email protected]  [email protected]  [email protected]    NaN    NaN
    
                 ID       234522       524321       234956       234983       293853
    0       фамилия       Иванов     Тарасова       Петров    Кузнецова       Пушкин
    1           пол      мужской      женский      мужской      женский      мужской
    2  год рождения         1965         1999         1984         1979         2001
    3     должность      инженер      инженер      инженер      инженер      инженер
    6          офис  центральный  центральный  центральный  центральный  центральный
    

    如果unmutable_data您需要根据收到的数据进行计算,那么您可以这样做:

    unmutable_data = df[df.iloc[:, 2:].eq(df.iloc[:,2], axis=0).all(1)]["ID"]
    

    或者像这样:

    unmutable_data = df.loc[df.iloc[:,2:].nunique(axis=1)==1, "ID"]
    

    更新 如果数据帧有一个“ID”列作为索引,那么代码将如下所示:

    unmutable_data = df[df.iloc[:, 1:].eq(df.iloc[:,1], axis=0).all(1)].index
    # либо
    # unmutable_data = df.loc[df.iloc[:,1:].nunique(axis=1)==1].index
    # здесь выводим только ключ и значение
    print(df.iloc[:, :1].loc[df.index.isin(unmutable_data)])
    print(df.loc[~df.index.isin(unmutable_data)])
    print(df.loc[df.isnull().any(axis=1)])
    print(df.loc[~df.isnull().any(axis=1)])
    
    • 3

相关问题

  • 是否可以以某种方式自定义 QTabWidget?

  • telebot.anihelper.ApiException 错误

  • Python。检查一个数字是否是 3 的幂。输出 无

  • 解析多个响应

  • 交换两个数组的元素,以便它们的新内容也反转

Sidebar

Stats

  • 问题 10021
  • Answers 30001
  • 最佳答案 8000
  • 用户 6900
  • 常问
  • 回答
  • Marko Smith

    我看不懂措辞

    • 1 个回答
  • Marko Smith

    请求的模块“del”不提供名为“default”的导出

    • 3 个回答
  • Marko Smith

    "!+tab" 在 HTML 的 vs 代码中不起作用

    • 5 个回答
  • Marko Smith

    我正在尝试解决“猜词”的问题。Python

    • 2 个回答
  • Marko Smith

    可以使用哪些命令将当前指针移动到指定的提交而不更改工作目录中的文件?

    • 1 个回答
  • Marko Smith

    Python解析野莓

    • 1 个回答
  • Marko Smith

    问题:“警告:检查最新版本的 pip 时出错。”

    • 2 个回答
  • Marko Smith

    帮助编写一个用值填充变量的循环。解决这个问题

    • 2 个回答
  • Marko Smith

    尽管依赖数组为空,但在渲染上调用了 2 次 useEffect

    • 2 个回答
  • Marko Smith

    数据不通过 Telegram.WebApp.sendData 发送

    • 1 个回答
  • Martin Hope
    Alexandr_TT 2020年新年大赛! 2020-12-20 18:20:21 +0000 UTC
  • Martin Hope
    Alexandr_TT 圣诞树动画 2020-12-23 00:38:08 +0000 UTC
  • Martin Hope
    Air 究竟是什么标识了网站访问者? 2020-11-03 15:49:20 +0000 UTC
  • Martin Hope
    Qwertiy 号码显示 9223372036854775807 2020-07-11 18:16:49 +0000 UTC
  • Martin Hope
    user216109 如何为黑客设下陷阱,或充分击退攻击? 2020-05-10 02:22:52 +0000 UTC
  • Martin Hope
    Qwertiy 并变成3个无穷大 2020-11-06 07:15:57 +0000 UTC
  • Martin Hope
    koks_rs 什么是样板代码? 2020-10-27 15:43:19 +0000 UTC
  • Martin Hope
    Sirop4ik 向 git 提交发布的正确方法是什么? 2020-10-05 00:02:00 +0000 UTC
  • Martin Hope
    faoxis 为什么在这么多示例中函数都称为 foo? 2020-08-15 04:42:49 +0000 UTC
  • Martin Hope
    Pavel Mayorov 如何从事件或回调函数中返回值?或者至少等他们完成。 2020-08-11 16:49:28 +0000 UTC

热门标签

javascript python java php c# c++ html android jquery mysql

Explore

  • 主页
  • 问题
    • 热门问题
    • 最新问题
  • 标签
  • 帮助

Footer

RError.com

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

帮助

© 2023 RError.com All Rights Reserve   沪ICP备12040472号-5