一般来说,我需要分析监控摄像头的视频,并根据同一对象的给定照片找到特定对象并保存帧。我看到了类似于 Habré 的东西,视频中的对象是确定的,但我不知道如何专门针对我的对象训练模型。另外,分析一定要准确,因为视频里人很多,质量也不是最好的,而且视频里需要找的包裹本身也很单调。有人可以帮助编写代码或至少给出如何实现这一点的想法吗?
一般来说,我需要分析监控摄像头的视频,并根据同一对象的给定照片找到特定对象并保存帧。我看到了类似于 Habré 的东西,视频中的对象是确定的,但我不知道如何专门针对我的对象训练模型。另外,分析一定要准确,因为视频里人很多,质量也不是最好的,而且视频里需要找的包裹本身也很单调。有人可以帮助编写代码或至少给出如何实现这一点的想法吗?
首先,我推荐使用深度学习,例如基于卷积神经网络(CNN)进行物体识别的模型,有几种流行的:(R-CNN、Fast R-CNN、Faster R-CNN、YOLO、SSD) )。 TensorFlow 和 PyTorch 是实现此目的的绝佳库。
首先,您需要收集数据:您想要在视频中查找的对象的图像。然后,标记它们(确定每个图像中对象的坐标)。
数据收集和标记:使用 LabelImg 等专用工具来标记图像。
训练模型:使用YOLO(You Only Look Once)模型或Faster R-CNN。 YOLO 很好,因为它提供了高精度和速度。
训练模型:标记数据后,使用 TensorFlow 或 PyTorch 训练模型。这是使用 YOLO 的示例:
视频分析:使用 OpenCV 捕获视频并使用经过训练的模型分析每一帧。
这是一个示例,您可以根据自己的需要进行调整。
还有一个您可以研究的文档的链接,我希望它有用:https ://arxiv.org/pdf/1905.01614