是否可以以某种方式自定义 QTabWidget？

Question

QuL1ux

Asked:2024-10-07 23:58:21 +0000 UTC2024-10-07 23:58:21 +0000 UTC 2024-10-07 23:58:21 +0000 UTC

在视频中查找相似的物体

772

一般来说，我需要分析监控摄像头的视频，并根据同一对象的给定照片找到特定对象并保存帧。我看到了类似于 Habré 的东西，视频中的对象是确定的，但我不知道如何专门针对我的对象训练模型。另外，分析一定要准确，因为视频里人很多，质量也不是最好的，而且视频里需要找的包裹本身也很单调。有人可以帮助编写代码或至少给出如何实现这一点的想法吗？

1 个回答

Voted

Alexandr Ogorodnik · Answer 1 · 2024-10-11T04:03:58Z

首先，我推荐使用深度学习，例如基于卷积神经网络（CNN）进行物体识别的模型，有几种流行的：（R-CNN、Fast R-CNN、Faster R-CNN、YOLO、SSD））。 TensorFlow 和 PyTorch 是实现此目的的绝佳库。

首先，您需要收集数据：您想要在视频中查找的对象的图像。然后，标记它们（确定每个图像中对象的坐标）。

数据收集和标记：使用 LabelImg 等专用工具来标记图像。

训练模型：使用YOLO（You Only Look Once）模型或Faster R-CNN。 YOLO 很好，因为它提供了高精度和速度。

训练模型：标记数据后，使用 TensorFlow 或 PyTorch 训练模型。这是使用 YOLO 的示例：

         import torch
         from models.common import DetectMultiBackend
         from utils.general import non_max_suppression, scale_coords
         from utils.torch_utils import select_device

         # Указание пути к весам, конфигурации и изображениям
         weights = 'yolov5s.pt'
         device = select_device('')
         model = DetectMultiBackend(weights, device=device)
         img_size = 640

         # Функция для загрузки изображения и получения предсказаний
         def detect_objects(image_path):
             img = torch.load(image_path)
             results = model(img, augment=False, size=img_size)
             pred = non_max_suppression(results[0], 0.25, 0.45)
             return pred

         # Загрузка и предсказание для тестового изображения
         image_path = 'test.jpg'
         predictions = detect_objects(image_path)
         print(predictions)

视频分析：使用 OpenCV 捕获视频并使用经过训练的模型分析每一帧。

       import cv2

       cap = cv2.VideoCapture('video.mp4')

       while cap.isOpened():
           ret, frame = cap.read()
           if not ret:
               break

           predictions = detect_objects(frame)

           # Сохранение кадров с найденным объектом
           for det in predictions:
               if det is not None and len(det):
                   cv2.imwrite('output_frame.jpg', frame)

       cap.release()
       cv2.destroyAllWindows()

这是一个示例，您可以根据自己的需要进行调整。

还有一个您可以研究的文档的链接，我希望它有用：https ://arxiv.org/pdf/1905.01614

在视频中查找相似的物体

我看不懂措辞

请求的模块“del”不提供名为“default”的导出

"!+tab" 在 HTML 的 vs 代码中不起作用

我正在尝试解决“猜词”的问题。Python

可以使用哪些命令将当前指针移动到指定的提交而不更改工作目录中的文件？

Python解析野莓

问题：“警告：检查最新版本的 pip 时出错。”

帮助编写一个用值填充变量的循环。解决这个问题

尽管依赖数组为空，但在渲染上调用了 2 次 useEffect

数据不通过 Telegram.WebApp.sendData 发送

在视频中查找相似的物体

1 个回答

相关问题