RError.com

RError.com Logo RError.com Logo

RError.com Navigation

  • 主页

Mobile menu

Close
  • 主页
  • 系统&网络
    • 热门问题
    • 最新问题
    • 标签
  • Ubuntu
    • 热门问题
    • 最新问题
    • 标签
  • 帮助
主页 / 问题 / 1036067
Accepted
Xander
Xander
Asked:2020-10-18 20:32:53 +0000 UTC2020-10-18 20:32:53 +0000 UTC 2020-10-18 20:32:53 +0000 UTC

如果数据列少于名称,如何读取 CSV,用空值填充它们

  • 772

遇到这样的问题。

csv 中的数据从外部进入我的代码。我从中创建了一个数据框并进一步使用它。参数如下所示:

df = pandas.read_csv(f, header=None, index_col=False,
                     delimiter='\t',
                     names=name_list, dtype=dtype_dict, 
                     converters=converters_dict, usecols=usecols_list
                     )

问题是一段时间以来数据的来源现在给 CSV 没有最后一列的某些数据,在这种情况下,我的代码因错误而崩溃:

Too many columns specified: expected 21 and found 20

在这种情况下,我需要代码来创建一个包含 21 列的数据框,只有最后一个应该用空值填充。

当然,您可以对传入 CSV 中的列数进行初步检查,根据这一点,创建一个名称为 20 或 21 个值的列表,然后添加或不添加另一列。

但它有点像拐杖。如果数据中的名称多于实际列,是否有让熊猫自己创建最后一个空列的设置?

python
  • 2 2 个回答
  • 10 Views

2 个回答

  • Voted
  1. Best Answer
    strawdog
    2020-10-18T21:18:59Z2020-10-18T21:18:59Z

    除非您确定数据量或确定 和 的长度相等,否则您可能应该使用该参数names而不使用该参数。usecolsnamesusecols

    源csv:

    a,b
    a,b,c,d
    a,b,c
    a,b,c
    

    编码:

    import pandas as pd
    
    df = pd.read_csv('111.csv', names=list(range(1,10)))
    print(df)
    

    结果:

       1  2    3    4   5   6   7   8   9
    0  a  b  NaN  NaN NaN NaN NaN NaN NaN
    1  a  b    c    d NaN NaN NaN NaN NaN
    2  a  b    c  NaN NaN NaN NaN NaN NaN
    3  a  b    c  NaN NaN NaN NaN NaN NaN
    
    • 2
  2. Andrey
    2020-10-18T21:10:47Z2020-10-18T21:10:47Z

    我不知道是否有任何单独的参数,想到的唯一决定是通过append()添加从 CSV 文件创建的数据框来创建一个具有所需列数的空数据框。

    In [6]: import pandas as pd
    
    In [7]: pd.read_csv('test.csv')
    Out[7]: 
       one  two
    0    1    2
    1    2    3
    2    5    6
    
    In [8]: df = pd.DataFrame(columns=['one', 'two', 'three'])
    
    In [9]: df
    Out[9]: 
    Empty DataFrame
    Columns: [one, two, three]
    Index: []
    
    In [10]: df = df.append(pd.read_csv('test.csv'), sort=False)
    
    In [11]: df
    Out[11]: 
      one two three
    0   1   2   NaN
    1   2   3   NaN
    2   5   6   NaN
    
    • 1

相关问题

Sidebar

Stats

  • 问题 10021
  • Answers 30001
  • 最佳答案 8000
  • 用户 6900
  • 常问
  • 回答
  • Marko Smith

    根据浏览器窗口的大小调整背景图案的大小

    • 2 个回答
  • Marko Smith

    理解for循环的执行逻辑

    • 1 个回答
  • Marko Smith

    复制动态数组时出错(C++)

    • 1 个回答
  • Marko Smith

    Or and If,elif,else 构造[重复]

    • 1 个回答
  • Marko Smith

    如何构建支持 x64 的 APK

    • 1 个回答
  • Marko Smith

    如何使按钮的输入宽度?

    • 2 个回答
  • Marko Smith

    如何显示对象变量的名称?

    • 3 个回答
  • Marko Smith

    如何循环一个函数?

    • 1 个回答
  • Marko Smith

    LOWORD 宏有什么作用?

    • 2 个回答
  • Marko Smith

    从字符串的开头删除直到并包括一个字符

    • 2 个回答
  • Martin Hope
    Alexandr_TT 2020年新年大赛! 2020-12-20 18:20:21 +0000 UTC
  • Martin Hope
    Alexandr_TT 圣诞树动画 2020-12-23 00:38:08 +0000 UTC
  • Martin Hope
    Air 究竟是什么标识了网站访问者? 2020-11-03 15:49:20 +0000 UTC
  • Martin Hope
    Qwertiy 号码显示 9223372036854775807 2020-07-11 18:16:49 +0000 UTC
  • Martin Hope
    user216109 如何为黑客设下陷阱,或充分击退攻击? 2020-05-10 02:22:52 +0000 UTC
  • Martin Hope
    Qwertiy 并变成3个无穷大 2020-11-06 07:15:57 +0000 UTC
  • Martin Hope
    koks_rs 什么是样板代码? 2020-10-27 15:43:19 +0000 UTC
  • Martin Hope
    Sirop4ik 向 git 提交发布的正确方法是什么? 2020-10-05 00:02:00 +0000 UTC
  • Martin Hope
    faoxis 为什么在这么多示例中函数都称为 foo? 2020-08-15 04:42:49 +0000 UTC
  • Martin Hope
    Pavel Mayorov 如何从事件或回调函数中返回值?或者至少等他们完成。 2020-08-11 16:49:28 +0000 UTC

热门标签

javascript python java php c# c++ html android jquery mysql

Explore

  • 主页
  • 问题
    • 热门问题
    • 最新问题
  • 标签
  • 帮助

Footer

RError.com

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

帮助

© 2023 RError.com All Rights Reserve   沪ICP备12040472号-5