通常,在执行任何数据分析任务之前,您需要验证数据。有必要防止数据集中缺少数值。为此,我使用求平均值和插值的函数。但在每种情况下我都会遇到一个问题。
当data1.mean(axis=1)
我收到 TypeError: unsupported operand type(s) for +: 'int' and 'str' 时。
当data1.interpolate(method ='linear', axis = 1)
我收到 TypeError: Cannot interpolate with all object-dtype columns in the DataFrame 时。尝试将至少一列设置为数字数据类型。
我尝试了不同的选项来纠正这种情况,例如,我使用 to_numeric 函数将 str 值转换为 int,但这种方式出现了越来越多的问题(神奇地出现了更多 NaN 值)。与 相同astype(int)
。
数据集。这里NaN值为“-”。
你如何解决这个问题?
正确读取数据就足够了。