RError.com

RError.com Logo RError.com Logo

RError.com Navigation

  • 主页

Mobile menu

Close
  • 主页
  • 系统&网络
    • 热门问题
    • 最新问题
    • 标签
  • Ubuntu
    • 热门问题
    • 最新问题
    • 标签
  • 帮助
主页 / 问题 / 720736
Accepted
taniamasmas
taniamasmas
Asked:2020-09-20 16:16:56 +0000 UTC2020-09-20 16:16:56 +0000 UTC 2020-09-20 16:16:56 +0000 UTC

从数据框中删除元素

  • 772

有两个数据框trans_train_data和train_labels. train_labels包含类标签:0,1,-1。需要从 中删除所有 -1train_labels和匹配的行trans_train_data。也就是说,如果在 train_labels -1 位于 3.45 和 78 位置,则trans_train_data必须删除第 3.45 和 78 行。这些数据帧中的索引是任意的(即,不是 0,1,2,3 ...,而是 98, 45623 , 3.64785...)

我尝试通过 设置新索引.reindex(),但在这种情况下出现 NaN 并且元素的顺序发生了变化。

我也尝试过使用发电机:

generator = enumarate(train_labels)
out = [x: for i,x in generator if x==-1]

返回具有无效索引的数组。告诉我该怎么做?

python
  • 1 1 个回答
  • 10 Views

1 个回答

  • Voted
  1. Best Answer
    MaxU - stop genocide of UA
    2020-09-20T17:09:21Z2020-09-20T17:09:21Z

    例子:

    源数据帧的:

    In [1]: df = pd.DataFrame(np.random.randint(10, size=(10,3)), columns=list('abc'))
    
    In [2]: df
    Out[2]:
       a  b  c
    0  2  7  6
    1  8  8  0
    2  7  7  8
    3  9  5  1
    4  5  0  9
    5  1  8  4
    6  9  1  5
    7  8  3  3
    8  1  0  7
    9  2  3  7
    
    In [3]: train_labels = pd.DataFrame(np.random.choice([-1,0,1], 10), columns=['val'])
    
    In [4]: train_labels
    Out[4]:
       val
    0    1
    1    1
    2    0
    3   -1
    4   -1
    5    1
    6   -1
    7   -1
    8    1
    9    1
    

    找到所需的索引元素:

    In [5]: np.where(train_labels.val==-1)[0]
    Out[5]: array([3, 4, 6, 7], dtype=int64)
    

    过滤:

    In [6]: df.loc[np.where(train_labels.val==-1)[0]]
    Out[6]:
       a  b  c
    3  9  5  1
    4  5  0  9
    6  9  1  5
    7  8  3  3
    

    删除相应 行:

    In [10]: df = df.drop(np.where(train_labels.val==-1)[0])
    
    In [11]: df
    Out[11]:
       a  b  c
    0  2  7  6
    1  8  8  0
    2  7  7  8
    5  1  8  4
    8  1  0  7
    9  2  3  7
    

    甚至更简单:

    In [15]: df.loc[train_labels.val!=-1]
    Out[15]:
       a  b  c
    0  2  7  6
    1  8  8  0
    2  7  7  8
    5  1  8  4
    8  1  0  7
    9  2  3  7
    
    • 1

相关问题

Sidebar

Stats

  • 问题 10021
  • Answers 30001
  • 最佳答案 8000
  • 用户 6900
  • 常问
  • 回答
  • Marko Smith

    Python 3.6 - 安装 MySQL (Windows)

    • 1 个回答
  • Marko Smith

    C++ 编写程序“计算单个岛屿”。填充一个二维数组 12x12 0 和 1

    • 2 个回答
  • Marko Smith

    返回指针的函数

    • 1 个回答
  • Marko Smith

    我使用 django 管理面板添加图像,但它没有显示

    • 1 个回答
  • Marko Smith

    这些条目是什么意思,它们的完整等效项是什么样的

    • 2 个回答
  • Marko Smith

    浏览器仍然缓存文件数据

    • 1 个回答
  • Marko Smith

    在 Excel VBA 中激活工作表的问题

    • 3 个回答
  • Marko Smith

    为什么内置类型中包含复数而小数不包含?

    • 2 个回答
  • Marko Smith

    获得唯一途径

    • 3 个回答
  • Marko Smith

    告诉我一个像幻灯片一样创建滚动的库

    • 1 个回答
  • Martin Hope
    Air 究竟是什么标识了网站访问者? 2020-11-03 15:49:20 +0000 UTC
  • Martin Hope
    Алексей Шиманский 如何以及通过什么方式来查找 Javascript 代码中的错误? 2020-08-03 00:21:37 +0000 UTC
  • Martin Hope
    Qwertiy 号码显示 9223372036854775807 2020-07-11 18:16:49 +0000 UTC
  • Martin Hope
    user216109 如何为黑客设下陷阱,或充分击退攻击? 2020-05-10 02:22:52 +0000 UTC
  • Martin Hope
    Qwertiy 并变成3个无穷大 2020-11-06 07:15:57 +0000 UTC
  • Martin Hope
    koks_rs 什么是样板代码? 2020-10-27 15:43:19 +0000 UTC
  • Martin Hope
    user207618 Codegolf——组合选择算法的实现 2020-10-23 18:46:29 +0000 UTC
  • Martin Hope
    Sirop4ik 向 git 提交发布的正确方法是什么? 2020-10-05 00:02:00 +0000 UTC
  • Martin Hope
    faoxis 为什么在这么多示例中函数都称为 foo? 2020-08-15 04:42:49 +0000 UTC
  • Martin Hope
    Pavel Mayorov 如何从事件或回调函数中返回值?或者至少等他们完成。 2020-08-11 16:49:28 +0000 UTC

热门标签

javascript python java php c# c++ html android jquery mysql

Explore

  • 主页
  • 问题
    • 热门问题
    • 最新问题
  • 标签
  • 帮助

Footer

RError.com

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

帮助

© 2023 RError.com All Rights Reserve   沪ICP备12040472号-5