假设我想发送一个神经网络的黑白图像(10,000 个输入神经元,100x100 分辨率)。如何处理具有不同纵横比的图像?我看到三个选项:
1.裁剪图像中的“多余部分”,使其成为正方形(此选项立即消失)
2.将图像大小调整为100x100,不考虑纵横比
3. 将图片调整为正方形,保持纵横比。用黑色填充剩余的空闲像素。
哪个选项更可取?
假设我想发送一个神经网络的黑白图像(10,000 个输入神经元,100x100 分辨率)。如何处理具有不同纵横比的图像?我看到三个选项:
1.裁剪图像中的“多余部分”,使其成为正方形(此选项立即消失)
2.将图像大小调整为100x100,不考虑纵横比
3. 将图片调整为正方形,保持纵横比。用黑色填充剩余的空闲像素。
哪个选项更可取?
取决于任务和网络。在完成的网络上,最好使用网络被训练的方法(因此问题是:网络是如何在非方形图像上训练的?)
每种方法的优缺点:
切断多余的:
调整大小:
适合正方形:
妥协选项是可能的(调整大小+裁剪,提升+适合)并微调每种方法。您可以尝试将图像放置在正方形的不同部分或用噪声填充它 - 根据网络,一切都可能阻碍或帮助识别。