圣诞树动画

Question

Дмитрий Владимирович

Asked:2020-03-15 21:57:05 +0000 UTC2020-03-15 21:57:05 +0000 UTC 2020-03-15 21:57:05 +0000 UTC

pd.read_csv() 将某些列转换为 [float] 即使 CSV 文件中有整数值

772

有 2 个具有文本和数字列的 csv 文件。数字数字显示为整数。连接后，所有数字都以 .0 结尾显示，即以小数的形式。如何组织文件的合并以使数字保持整数？下面的串联示例：

print 'Concatenating with 2-file...'
df1 = "1.csv"
df2 = '2.csv'

files = [pd.read_csv(df1, sep=','), pd.read_csv(df2, sep=',')]
result = pd.concat(files, ignore_index=True)
result.to_csv(df1, index=False)
print 'Done!'

1 个回答

Voted

MaxU - stop genocide of UA · Answer 1 · 2020-03-15T22:16:56Z

如果您至少有一个单元格值 - NaN(Not A Number) 或至少一个 type 值，通常会发生这种情况float。

例子：

.csv 文件：

text,a,b,c
aa,1,10,100
bb,,20,200
cc,3,30,300.0

我们读：

df = pd.read_csv(filename)

结果：

In [56]: df
Out[56]:
  text    a   b      c
0   aa  1.0  10  100.0
1   bb  NaN  20  200.0
2   cc  3.0  30  300.0

In [57]: df.dtypes
Out[57]:
text     object
a       float64
b         int64
c       float64
dtype: object

如何检查 - 显示每列的 NaN 数量：

In [58]: df.isnull().sum()
Out[58]:
text    0
a       1
b       0
c       0
dtype: int64

解决方案：

Numpy/Pandas 中的类型列np.int*不能包含-如果列中至少有一个值，NaN它们将自动转换为。要解决此问题，您需要将所有值替换为某个整数：np.float_NaNNaN

In [61]: df['a'] = df['a'].fillna(-1).astype(int)

In [62]: df
Out[62]:
  text  a   b      c
0   aa  1  10  100.0
1   bb -1  20  200.0
2   cc  3  30  300.0

如果问题是由float某个值引起的，那么可以将列中的值四舍五入并转换为int：

In [85]: df['c'] = [100, 200, 300.55]

In [86]: df
Out[86]:
  text    a   b       c
0   aa  1.0  10  100.00
1   bb  NaN  20  200.00
2   cc  3.0  30  300.55

In [87]: df['c'] = df['c'].round().astype(int)

In [88]: df
Out[88]:
  text    a   b    c
0   aa  1.0  10  100
1   bb  NaN  20  200
2   cc  3.0  30  301

或通过转换为丢弃小数部分int：

In [89]: df['c'] = [100, 200, 300.55]

In [90]: df['c'] = df['c'].astype(int)

In [91]: df
Out[91]:
  text    a   b    c
0   aa  1.0  10  100
1   bb  NaN  20  200
2   cc  3.0  30  300

PS 最好像这样合并文件：

files = ["1.csv", "2.csv"]

(pd.concat([pd.read_csv(f) for f in files], ignore_index=True)
   .to_csv(output_filename, index=False))

pd.read_csv() 将某些列转换为 [float] 即使 CSV 文件中有整数值

是否可以在 C++ 中继承类 <---> 结构？

这种神经网络架构适合文本分类吗？

为什么分配的工作方式不同？

控制台中的光标坐标

如何在 C++ 中删除类的实例？

点是否属于线段的问题

json结构错误

ServiceWorker 中的“获取”事件

c ++控制台应用程序exe文件[重复]

按多列从sql表中选择

pd.read_csv() 将某些列转换为 [float] 即使 CSV 文件中有整数值

1 个回答

相关问题