在构建回归模型时,我想知道如何最好地比较它们?选择哪个参数以及如何在python中找到它?
例如,我构建、训练并尝试预测
train = pd.read_csv('state_1.csv',";",header=None)
X_train = train.drop([16,17],axis=1)
Y_train = train[16]
test_data = pd.read_csv('state_2.csv',";",header=None)
X_test = test_data.drop([16,17],axis=1)
Y_test = test_data[16]
normalized_X_train = preprocessing.normalize(X_train)
normalized_X_test = preprocessing.normalize(X_test)
model1 = svm.SVR(kernel='linear', C=1.0)
cl1 = model1.fit(normalized_X_train,Y_train)
predictions1 = cl1.predict(normalized_X_test)
model2 = RandomForestRegressor(n_estimators=200, max_depth=5)
cl2 = model2.fit(normalized_X_train,Y_train)
predictions2 = cl2.predict(normalized_X_test)
模型应根据哪些参数进行比较?以及如何使用 python 找到它们(我最近切换到 python)?
通常,模型的准确性是根据测试数据评估的。评估回归模型最流行的指标是:
那些。您可以比较不同模型的相同指标或使用不同超参数比较同一模型的性能。