大家好。我使用不同的分类方法(例如朴素贝叶斯、对数回归)解决了垃圾邮件识别问题,从而测试哪种方法效果更好。
问题:我似乎无法绘制逻辑回归图。
进步:
- 我读取了文件并进行了数据清理。
- 由于数据是文本形式,所以我做了文本向量化和LabelEncoding。
- 我应用了对数回归函数。
- 我画了这样的图表:
y_pred = y_pred.squeeze()
y_prob = model.predict_proba(X_test_vectorized)
# Plot scatter plot
sns.scatterplot(x= range(len(y_pred)), y=y_pred, hue= Y_test)
plt.figure()
sns.scatterplot(x = range(len(y_pred)), y = y_prob[:,1], hue = Y_test)
plt.xlabel('Text Feature')
plt.ylabel('Predicted')
plt.legend()
plt.show()