R：构建回归模型[特例]最方便的表格数据结构是什么？

Question

sasamb4ik

Asked:2022-07-19 22:28:13 +0000 UTC2022-07-19 22:28:13 +0000 UTC 2022-07-19 22:28:13 +0000 UTC

所有值都是NaN

772

在读取一些数据集时，我的数据有问题，所有值\u200b\u200bare都等于NaN。例如，在泰坦尼克号火车数据集上，尽管这在大多数数据集上都不会发生。可能是什么错误？ titanic = pd.read_csv('train.csv') titanic

1 个回答

Voted

CrazyElf · Answer 1 · 2022-07-19T22:35:07Z

Best Answer

CrazyElf

2022-07-19T22:35:07Z2022-07-19T22:35:07Z

如果我没记错的话，标准的列分隔符就是这个;（或者它是自动确定的，我记不太清了）。在您的数据中，从屏幕截图来看，分隔符是逗号。读取文件时需要指定：

titanic = pd.read_csv('train.csv', sep=',')

虽然奇怪的是，在这种情况下，列名通常是分开的。我想查看源文件的前几行train.csv以给出准确的诊断。

一般来说，你有某种歪曲的文件，似乎第一个谷歌搜索的类似文件通常以标准方式读取：

import pandas as pd

df = pd.read_csv('https://raw.githubusercontent.com/agconti/kaggle-titanic/master/data/train.csv')

正常可读文件的前几行train.csv是：

PassengerId,Survived,Pclass,Name,Sex,Age,SibSp,Parch,Ticket,Fare,Cabin,Embarked
1,0,3,"Braund, Mr. Owen Harris",male,22,1,0,A/5 21171,7.25,,S
2,1,1,"Cumings, Mrs. John Bradley (Florence Briggs Thayer)",female,38,1,0,PC 17599,71.2833,C85,C

1

所有值都是NaN

表格填充不起作用

提示 50/50，有两个，其中一个是正确的

在 PyQt5 中停止进程

我的脚本不工作

在文本文件中写入和读取列表

如何像屏幕截图中那样并排排列这些块？

确定文本文件中每一行的字符数

将接口对象传递给 JAVA 构造函数

正确更新数据库中的数据

Python解析不是css

所有值都是NaN

1 个回答

相关问题