RError.com

RError.com Logo RError.com Logo

RError.com Navigation

  • 主页

Mobile menu

Close
  • 主页
  • 系统&网络
    • 热门问题
    • 最新问题
    • 标签
  • Ubuntu
    • 热门问题
    • 最新问题
    • 标签
  • 帮助
主页 / 问题 / 798738
Accepted
Дмитрий Владимирович
Дмитрий Владимирович
Asked:2020-03-15 21:57:05 +0000 UTC2020-03-15 21:57:05 +0000 UTC 2020-03-15 21:57:05 +0000 UTC

pd.read_csv() 将某些列转换为 [float] 即使 CSV 文件中有整数值

  • 772

有 2 个具有文本和数字列的 csv 文件。数字数字显示为整数。连接后,所有数字都以 .0 结尾显示,即 以小数的形式。如何组织文件的合并以使数字保持整数?下面的串联示例:

print 'Concatenating with 2-file...'
df1 = "1.csv"
df2 = '2.csv'

files = [pd.read_csv(df1, sep=','), pd.read_csv(df2, sep=',')]
result = pd.concat(files, ignore_index=True)
result.to_csv(df1, index=False)
print 'Done!'
python
  • 1 1 个回答
  • 10 Views

1 个回答

  • Voted
  1. Best Answer
    MaxU - stop genocide of UA
    2020-03-15T22:16:56Z2020-03-15T22:16:56Z

    如果您至少有一个单元格值 - NaN(Not A Number) 或至少一个 type 值,通常会发生这种情况float。

    例子:

    .csv 文件:

    text,a,b,c
    aa,1,10,100
    bb,,20,200
    cc,3,30,300.0
    

    我们读:

    df = pd.read_csv(filename)
    

    结果:

    In [56]: df
    Out[56]:
      text    a   b      c
    0   aa  1.0  10  100.0
    1   bb  NaN  20  200.0
    2   cc  3.0  30  300.0
    
    In [57]: df.dtypes
    Out[57]:
    text     object
    a       float64
    b         int64
    c       float64
    dtype: object
    

    如何检查 - 显示每列的 NaN 数量:

    In [58]: df.isnull().sum()
    Out[58]:
    text    0
    a       1
    b       0
    c       0
    dtype: int64
    

    解决方案:

    Numpy/Pandas 中的类型列np.int*不能包含-如果列中至少有一个值,NaN它们将自动转换为。要解决此问题,您需要将所有值替换为某个整数:np.float_NaNNaN

    In [61]: df['a'] = df['a'].fillna(-1).astype(int)
    
    In [62]: df
    Out[62]:
      text  a   b      c
    0   aa  1  10  100.0
    1   bb -1  20  200.0
    2   cc  3  30  300.0
    

    如果问题是由float某个值引起的,那么可以将列中的值四舍五入并转换为int:

    In [85]: df['c'] = [100, 200, 300.55]
    
    In [86]: df
    Out[86]:
      text    a   b       c
    0   aa  1.0  10  100.00
    1   bb  NaN  20  200.00
    2   cc  3.0  30  300.55
    
    In [87]: df['c'] = df['c'].round().astype(int)
    
    In [88]: df
    Out[88]:
      text    a   b    c
    0   aa  1.0  10  100
    1   bb  NaN  20  200
    2   cc  3.0  30  301
    

    或通过转换为 丢弃小数部分int:

    In [89]: df['c'] = [100, 200, 300.55]
    
    In [90]: df['c'] = df['c'].astype(int)
    
    In [91]: df
    Out[91]:
      text    a   b    c
    0   aa  1.0  10  100
    1   bb  NaN  20  200
    2   cc  3.0  30  300
    

    PS 最好像这样合并文件:

    files = ["1.csv", "2.csv"]
    
    (pd.concat([pd.read_csv(f) for f in files], ignore_index=True)
       .to_csv(output_filename, index=False))
    
    • 1

相关问题

Sidebar

Stats

  • 问题 10021
  • Answers 30001
  • 最佳答案 8000
  • 用户 6900
  • 常问
  • 回答
  • Marko Smith

    是否可以在 C++ 中继承类 <---> 结构?

    • 2 个回答
  • Marko Smith

    这种神经网络架构适合文本分类吗?

    • 1 个回答
  • Marko Smith

    为什么分配的工作方式不同?

    • 3 个回答
  • Marko Smith

    控制台中的光标坐标

    • 1 个回答
  • Marko Smith

    如何在 C++ 中删除类的实例?

    • 4 个回答
  • Marko Smith

    点是否属于线段的问题

    • 2 个回答
  • Marko Smith

    json结构错误

    • 1 个回答
  • Marko Smith

    ServiceWorker 中的“获取”事件

    • 1 个回答
  • Marko Smith

    c ++控制台应用程序exe文件[重复]

    • 1 个回答
  • Marko Smith

    按多列从sql表中选择

    • 1 个回答
  • Martin Hope
    Alexandr_TT 圣诞树动画 2020-12-23 00:38:08 +0000 UTC
  • Martin Hope
    Suvitruf - Andrei Apanasik 什么是空? 2020-08-21 01:48:09 +0000 UTC
  • Martin Hope
    Air 究竟是什么标识了网站访问者? 2020-11-03 15:49:20 +0000 UTC
  • Martin Hope
    Qwertiy 号码显示 9223372036854775807 2020-07-11 18:16:49 +0000 UTC
  • Martin Hope
    user216109 如何为黑客设下陷阱,或充分击退攻击? 2020-05-10 02:22:52 +0000 UTC
  • Martin Hope
    Qwertiy 并变成3个无穷大 2020-11-06 07:15:57 +0000 UTC
  • Martin Hope
    koks_rs 什么是样板代码? 2020-10-27 15:43:19 +0000 UTC
  • Martin Hope
    Sirop4ik 向 git 提交发布的正确方法是什么? 2020-10-05 00:02:00 +0000 UTC
  • Martin Hope
    faoxis 为什么在这么多示例中函数都称为 foo? 2020-08-15 04:42:49 +0000 UTC
  • Martin Hope
    Pavel Mayorov 如何从事件或回调函数中返回值?或者至少等他们完成。 2020-08-11 16:49:28 +0000 UTC

热门标签

javascript python java php c# c++ html android jquery mysql

Explore

  • 主页
  • 问题
    • 热门问题
    • 最新问题
  • 标签
  • 帮助

Footer

RError.com

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

帮助

© 2023 RError.com All Rights Reserve   沪ICP备12040472号-5