RError.com

RError.com Logo RError.com Logo

RError.com Navigation

  • 主页

Mobile menu

Close
  • 主页
  • 系统&网络
    • 热门问题
    • 最新问题
    • 标签
  • Ubuntu
    • 热门问题
    • 最新问题
    • 标签
  • 帮助
主页 / 问题 / 1294591
Accepted
hyper-cookie
hyper-cookie
Asked:2022-06-13 02:32:26 +0000 UTC2022-06-13 02:32:26 +0000 UTC 2022-06-13 02:32:26 +0000 UTC

如何为机器学习准备数据集?

  • 772

例如:有一个文件夹,里面有一个对象的图片,图片格式是png。我想教分类器(我使用 scikit-learn,Python)来识别这个对象,但我不知道将什么作为一组数据和标签传递给fit方法。

求助,我第二次问这个问题了,最后一个没有人回答。知道如何去做是非常重要的。

确切的问题:

  1. 如何将带有对象图片的文件夹转换为带有标签的数据集?
  2. 完成第一点后,如何在代码本身中使用数据集和标签?(根据一本关于​​ML的书的代码,加载MNIST数据集后,显示为数字,即每个像素都有一个值,但我文件夹里只有图片)
машинное-обучение
  • 1 1 个回答
  • 10 Views

1 个回答

  • Voted
  1. Best Answer
    passant
    2022-06-13T04:17:09Z2022-06-13T04:17:09Z

    对“确切问题”的不准确答案:

    1.如何将包含对象图片的文件夹变成带标签的数据集?

    变成带标签的数据集意味着给你的图片贴标签。很明显是用手。自己或雇中国人。然后结果发生的事情被馈送到你的神经网络的输入。表示的类型由工具决定,粗略地说 - 由您使用的神经网络决定。至少你显然保守了这个秘密——他们没有告诉我们。如果是这样 - 请参阅文档 - 这就是在这种情况下可以建议的全部内容。通常有例子。总的来说 - 一切都应该看起来很简单。例如,编写一个脚本,该脚本将按顺序浏览带有标记图像的文件夹,将它们读入一个数组并将其(数组)传递给教程的输入。

    2. 完成第一步后,如何在代码本身中使用数据集和标签?(根据一本关于​​ML的书的代码,加载MNIST数据集后,显示为数字,即每个像素都有一个值,但我文件夹里只有图片)

    奇怪的是,在阅读了整本“一本关于 ML 的书”之后(顺便问一下,是哪一本?)您不了解如何使用神经网络。你是不是只看了书中的代码,却错过了描述?毕竟,必须首先将图片数字化这一事实甚至在书籍中都没有描述,而是在任何有关图像识别的文章中都有描述。你的 MNIST 在到达神经网络的输入之前经过了这样的处理。好吧,你需要对你的照片做同样的事情。你应该如何看待你的照片:它们是彩色的还是黑白的,相等或不相等,等等。

    总的来说,我推荐关于 ML 的书都一样“阅读”。最后一个。

    • 1

相关问题

  • ANN 错误地构建正弦曲线

  • 我在哪里可以获得图像形式的卫星图像数据集?

  • 如何用一个隐喻来描述最大似然法的本质?

  • 将多个 .tsv 文件合并为一个

  • 一系列预训练的神经网络模型和库

  • 用于构建机器学习模型的数据集选择

Sidebar

Stats

  • 问题 10021
  • Answers 30001
  • 最佳答案 8000
  • 用户 6900
  • 常问
  • 回答
  • Marko Smith

    表格填充不起作用

    • 2 个回答
  • Marko Smith

    提示 50/50,有两个,其中一个是正确的

    • 1 个回答
  • Marko Smith

    在 PyQt5 中停止进程

    • 1 个回答
  • Marko Smith

    我的脚本不工作

    • 1 个回答
  • Marko Smith

    在文本文件中写入和读取列表

    • 2 个回答
  • Marko Smith

    如何像屏幕截图中那样并排排列这些块?

    • 1 个回答
  • Marko Smith

    确定文本文件中每一行的字符数

    • 2 个回答
  • Marko Smith

    将接口对象传递给 JAVA 构造函数

    • 1 个回答
  • Marko Smith

    正确更新数据库中的数据

    • 1 个回答
  • Marko Smith

    Python解析不是css

    • 1 个回答
  • Martin Hope
    Alexandr_TT 2020年新年大赛! 2020-12-20 18:20:21 +0000 UTC
  • Martin Hope
    Alexandr_TT 圣诞树动画 2020-12-23 00:38:08 +0000 UTC
  • Martin Hope
    Air 究竟是什么标识了网站访问者? 2020-11-03 15:49:20 +0000 UTC
  • Martin Hope
    Qwertiy 号码显示 9223372036854775807 2020-07-11 18:16:49 +0000 UTC
  • Martin Hope
    user216109 如何为黑客设下陷阱,或充分击退攻击? 2020-05-10 02:22:52 +0000 UTC
  • Martin Hope
    Qwertiy 并变成3个无穷大 2020-11-06 07:15:57 +0000 UTC
  • Martin Hope
    koks_rs 什么是样板代码? 2020-10-27 15:43:19 +0000 UTC
  • Martin Hope
    Sirop4ik 向 git 提交发布的正确方法是什么? 2020-10-05 00:02:00 +0000 UTC
  • Martin Hope
    faoxis 为什么在这么多示例中函数都称为 foo? 2020-08-15 04:42:49 +0000 UTC
  • Martin Hope
    Pavel Mayorov 如何从事件或回调函数中返回值?或者至少等他们完成。 2020-08-11 16:49:28 +0000 UTC

热门标签

javascript python java php c# c++ html android jquery mysql

Explore

  • 主页
  • 问题
    • 热门问题
    • 最新问题
  • 标签
  • 帮助

Footer

RError.com

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

帮助

© 2023 RError.com All Rights Reserve   沪ICP备12040472号-5