user16357289提出的问题

user16357289

Asked: 2022-08-11 20:38:54 +0000 UTC

机器学习模型的准确性

1

关闭这个问题是题外话。目前不接受回复。

寻求调试帮助的问题（“为什么这段代码不起作用？ ”）应该包括期望的行为、具体的问题或错误，以及在问题中重现它的最少代码。没有明确描述问题的问题对其他访问者毫无用处。请参阅如何创建一个最小的、独立的和可重现的示例。

3 个月前关闭。

改进问题

使用 5 折交叉验证，最后一次拆分时的回归准确度（确定系数 r^2）较低。

这是什么意思？在对整个数据集进行训练时，训练质量会下降吗？还是没关系？

值：0.29、0.05、0.36、0.18、-1.31
平均值：-0.08346647029663619 这些是工资上限输出列的值（那里的数据不如下限，因为它经常被省略) 在下限 r2 约为 48%，这非常适合我。

是否值得用这样的值进行训练，以便进一步使用不是在整个数据集上，而是在数据集的第 1 部分和第 3 部分上，准确率更高的地方？

数据集 - hh.ru 的职位空缺。目标是工资预测。

37,000条记录，29列：经验、关键技能、职位、雇主、上下限薪、专业、专业领域（这些字段用标签编码进行编码）；城市（基洛夫、莫斯科、圣彼得堡）、日程安排和就业类型以一种热编码方式编码。

数据未缩放，因为梯度提升对缩放不敏感。模型的复杂度应该足够了，在训练数据集上，准确率在 70-80% 左右。如果我理解正确，模型会被重新训练。

数据集链接：https ://drive.google.com/file/d/1QJZAYyXIXcrMgzet8SUC31MzV5dHODcv/view?usp=sharing

user16357289

Asked: 2022-08-04 16:31:58 +0000 UTC

从另一个脚本运行 Python 脚本会引发错误

0

您需要从另一个脚本运行一个脚本。我这样做：

import get_pages.py
exec(get_pages.py)

get_pages.py 文件中的代码可以正常工作，但最后会出错

ModuleNotFoundError: No module named 'get_pages.py'; 'get_pages' is not a package

可能是什么问题呢？你还能怎么开始？

user16357289

Asked: 2022-07-25 19:19:39 +0000 UTC

比较机器学习中的真实值和预测值

1

薪资预测。一个包含约 40,000 条记录（职位、工作经验、公司、日程安排等）的数据集。R^2 估计约为 35-40%。我使用来自 sklearn 和交叉验证的回归器。

gb_reg = GradientBoostingRegressor(random_state=0, **params)
gb = cross_validate(gb_reg, X, y, cv=5, scoring=('r2', 
                                             'neg_mean_absolute_error'),
                    return_train_score=True)

是否有可能以某种方式显示列的值，真实的和预测的，以便了解模型到底哪里出错了？

user16357289

Asked: 2022-07-15 02:08:49 +0000 UTC

访问字典列表的元素

0

有一个数据集DataFrame。它有一个 key_skills 列。在 key_skills 中，每一行要么是一个空列表，要么是一个字典列表，格式如下：

 [{'name': 'PHP'}, {'name': '1С-Битрикс'}, {'name': 'Git'}, {'name': 'MySQL'}, {'name': 'CSS3'}, {'name': 'ООП'}, {'name': 'API'}, {'name': 'HTML5'}]

如何计算名称的每个元素？也就是说，获取值：PHP、1C-Bitrix、Git、MySQL 等。

这是我在列中获取字典值的方式，但这不适用于字典列表：

df['skills'] = df['key_skills'].map(lambda x: x.get("name", np.nan) if isinstance(x, dict) else np.nan)

机器学习模型的准确性

从另一个脚本运行 Python 脚本会引发错误

比较机器学习中的真实值和预测值

访问字典列表的元素

我看不懂措辞

请求的模块“del”不提供名为“default”的导出

"!+tab" 在 HTML 的 vs 代码中不起作用

我正在尝试解决“猜词”的问题。Python

可以使用哪些命令将当前指针移动到指定的提交而不更改工作目录中的文件？

Python解析野莓

问题：“警告：检查最新版本的 pip 时出错。”

帮助编写一个用值填充变量的循环。解决这个问题

尽管依赖数组为空，但在渲染上调用了 2 次 useEffect

数据不通过 Telegram.WebApp.sendData 发送

user16357289's questions