sasamb4ik Asked:2022-07-19 22:28:13 +0800 CST2022-07-19 22:28:13 +0800 CST 2022-07-19 22:28:13 +0800 CST 所有值都是NaN 772 在读取一些数据集时,我的数据有问题,所有值\u200b\u200bare都等于NaN。例如,在泰坦尼克号火车数据集上,尽管这在大多数数据集上都不会发生。可能是什么错误? titanic = pd.read_csv('train.csv') titanic dataframe 1 个回答 Voted Best Answer CrazyElf 2022-07-19T22:35:07+08:002022-07-19T22:35:07+08:00 如果我没记错的话,标准的列分隔符就是这个;(或者它是自动确定的,我记不太清了)。在您的数据中,从屏幕截图来看,分隔符是逗号。读取文件时需要指定: titanic = pd.read_csv('train.csv', sep=',') 虽然奇怪的是,在这种情况下,列名通常是分开的。我想查看源文件的前几行train.csv以给出准确的诊断。 一般来说,你有某种歪曲的文件,似乎第一个谷歌搜索的类似文件通常以标准方式读取: import pandas as pd df = pd.read_csv('https://raw.githubusercontent.com/agconti/kaggle-titanic/master/data/train.csv') 正常可读文件的前几行train.csv是: PassengerId,Survived,Pclass,Name,Sex,Age,SibSp,Parch,Ticket,Fare,Cabin,Embarked 1,0,3,"Braund, Mr. Owen Harris",male,22,1,0,A/5 21171,7.25,,S 2,1,1,"Cumings, Mrs. John Bradley (Florence Briggs Thayer)",female,38,1,0,PC 17599,71.2833,C85,C
如果我没记错的话,标准的列分隔符就是这个
;
(或者它是自动确定的,我记不太清了)。在您的数据中,从屏幕截图来看,分隔符是逗号。读取文件时需要指定:虽然奇怪的是,在这种情况下,列名通常是分开的。我想查看源文件的前几行
train.csv
以给出准确的诊断。一般来说,你有某种歪曲的文件,似乎第一个谷歌搜索的类似文件通常以标准方式读取:
正常可读文件的前几行
train.csv
是: