再会。我想组织一个网格搜索GridSearchCV
来找到分类器的最佳参数ExtraTreesClassifier
。作为一个指标,我对 Ginny 标准感兴趣(也就是说,我想获得基于 Ginny 的分类器的参数)。但在描述中(http://scikit-learn.org/stable/modules/model_evaluation.html)它不是。如何设置自己的指标,是否可行?
主页
/
user-267904
taniamasmas's questions
有两个数据框trans_train_data
和train_labels
. train_labels
包含类标签:0,1,-1。需要从 中删除所有 -1train_labels
和匹配的行trans_train_data
。也就是说,如果在 train_labels -1 位于 3.45 和 78 位置,则trans_train_data
必须删除第 3.45 和 78 行。这些数据帧中的索引是任意的(即,不是 0,1,2,3 ...,而是 98, 45623 , 3.64785...)
我尝试通过 设置新索引.reindex()
,但在这种情况下出现 NaN 并且元素的顺序发生了变化。
我也尝试过使用发电机:
generator = enumarate(train_labels)
out = [x: for i,x in generator if x==-1]
返回具有无效索引的数组。告诉我该怎么做?