ANN 错误地构建正弦曲线

Question

hyper-cookie

Asked:2022-06-13 02:32:26 +0000 UTC2022-06-13 02:32:26 +0000 UTC 2022-06-13 02:32:26 +0000 UTC

如何为机器学习准备数据集？

772

例如：有一个文件夹，里面有一个对象的图片，图片格式是png。我想教分类器（我使用 scikit-learn，Python）来识别这个对象，但我不知道将什么作为一组数据和标签传递给fit方法。

求助，我第二次问这个问题了，最后一个没有人回答。知道如何去做是非常重要的。

确切的问题：

如何将带有对象图片的文件夹转换为带有标签的数据集？
完成第一点后，如何在代码本身中使用数据集和标签？（根据一本关于ML的书的代码，加载MNIST数据集后，显示为数字，即每个像素都有一个值，但我文件夹里只有图片）

1 个回答

Voted

passant · Answer 1 · 2022-06-13T04:17:09Z

对“确切问题”的不准确答案：

1.如何将包含对象图片的文件夹变成带标签的数据集？

变成带标签的数据集意味着给你的图片贴标签。很明显是用手。自己或雇中国人。然后结果发生的事情被馈送到你的神经网络的输入。表示的类型由工具决定，粗略地说 - 由您使用的神经网络决定。至少你显然保守了这个秘密——他们没有告诉我们。如果是这样 - 请参阅文档 - 这就是在这种情况下可以建议的全部内容。通常有例子。总的来说 - 一切都应该看起来很简单。例如，编写一个脚本，该脚本将按顺序浏览带有标记图像的文件夹，将它们读入一个数组并将其（数组）传递给教程的输入。

2. 完成第一步后，如何在代码本身中使用数据集和标签？（根据一本关于ML的书的代码，加载MNIST数据集后，显示为数字，即每个像素都有一个值，但我文件夹里只有图片）

奇怪的是，在阅读了整本“一本关于 ML 的书”之后（顺便问一下，是哪一本？）您不了解如何使用神经网络。你是不是只看了书中的代码，却错过了描述？毕竟，必须首先将图片数字化这一事实甚至在书籍中都没有描述，而是在任何有关图像识别的文章中都有描述。你的 MNIST 在到达神经网络的输入之前经过了这样的处理。好吧，你需要对你的照片做同样的事情。你应该如何看待你的照片：它们是彩色的还是黑白的，相等或不相等，等等。

总的来说，我推荐关于 ML 的书都一样“阅读”。最后一个。

如何为机器学习准备数据集？

表格填充不起作用

提示 50/50，有两个，其中一个是正确的

在 PyQt5 中停止进程

我的脚本不工作

在文本文件中写入和读取列表

如何像屏幕截图中那样并排排列这些块？

确定文本文件中每一行的字符数

将接口对象传递给 JAVA 构造函数

正确更新数据库中的数据

Python解析不是css

如何为机器学习准备数据集？

1 个回答

相关问题