物品识别——基于python语言

物品识别——基于python语言

news2025/4/27 9:13:47

目录

1.物品识别

2.模型介绍

3.文件框架

4.代码示例

4.1 camera.py

4.2 interaction.py

4.3 object_detection.py

4.4 main.py

4.5 运行结果

5.总结

1.物品识别

该项目使用Python，OpenCV进行图像捕捉，进行物品识别。我们将使用YOLO（You Only Look Once）模型进行物品识别，YOLO是一个高效的实时物体检测系统。

2.模型介绍

YOLO（You Only Look Once）是一种目标检测算法，它在实时性和精确度上取得了很好的平衡。它的核心思想是在一张图片上同时预测出所有物体的位置和类别，而无需像传统的区域提议网络（R-CNN）那样分步骤进行。

3.文件框架

models中的定义标签文件可以搜索yolo模型来找，下面的四个代码文件是主文件，camera是调用电脑摄像头，interaction是调用opencv绘制图像框，object_detection是定义物品检测函数，main是主函数。

运行main函数即可实现物品检测。

4.代码示例

4.1 camera.py

import cv2  # 导入OpenCV库

def get_camera_frame():
    cap = cv2.VideoCapture(0)  # 打开摄像头
    if not cap.isOpened():
        raise Exception("无法打开摄像头。")  # 如果无法打开摄像头，抛出异常
    
    ret, frame = cap.read()  # 读取帧
    cap.release()  # 释放摄像头
    
    if not ret:
        raise Exception("读取照片信息失败。")  # 如果读取失败，抛出异常
    
    return frame  # 返回捕捉到的帧

4.2 interaction.py

import cv2  # 导入OpenCV库

def draw_boxes(frame, detections):
    for (class_name, confidence, box) in detections:
        x, y, w, h = box
        label = f"{class_name} {confidence:.2f}"  # 创建标签
        cv2.rectangle(frame, (x, y), (x + w, y + h), (0, 255, 0), 2)  # 绘制矩形框
        cv2.putText(frame, label, (x, y - 10), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (0, 255, 0), 2)  # 绘制标签
    return frame  # 返回绘制后的帧

4.3 object_detection.py

import cv2  # 导入OpenCV库，用于计算机视觉任务
import numpy as np  # 导入NumPy库，用于处理数组

class ObjectDetector:
    def __init__(self, config_path, weights_path, names_path):
        # 初始化YOLO模型
        self.net = cv2.dnn.readNetFromDarknet(config_path, weights_path)
        self.layer_names = self.net.getLayerNames()
        # 获取YOLO模型的输出层
        self.output_layers = [self.layer_names[i - 1] for i in self.net.getUnconnectedOutLayers()]
        # 读入类别名称
        with open(names_path, 'r') as f:
            self.classes = [line.strip() for line in f.readlines()]

    def detect_objects(self, frame):
        height, width = frame.shape[:2]  # 获取图像的高度和宽度
        # 将图像转换为YOLO模型输入所需的blob格式
        blob = cv2.dnn.blobFromImage(frame, 0.00392, (416, 416), (0, 0, 0), True, crop=False)
        self.net.setInput(blob)  # 设置YOLO模型的输入
        outs = self.net.forward(self.output_layers)  # 前向传播，获取检测结果

        class_ids = []  # 存储检测到的类别ID
        confidences = []  # 存储检测到的置信度
        boxes = []  # 存储检测到的边框

        # 处理每个输出层的检测结果
        for out in outs:
            for detection in out:
                scores = detection[5:]  # 获取每个类别的置信度分数
                class_id = np.argmax(scores)  # 获取置信度最高的类别ID
                confidence = scores[class_id]  # 获取最高置信度
                if confidence > 0.5:  # 过滤低置信度的检测结果
                    center_x = int(detection[0] * width)
                    center_y = int(detection[1] * height)
                    w = int(detection[2] * width)
                    h = int(detection[3] * height)
                    x = int(center_x - w / 2)
                    y = int(center_y - h / 2)
                    boxes.append([x, y, w, h])
                    confidences.append(float(confidence))
                    class_ids.append(class_id)

        # 非极大值抑制，去除冗余的边框
        indices = cv2.dnn.NMSBoxes(boxes, confidences, 0.5, 0.4)
        result = []
        if len(indices) > 0:
            for i in indices.flatten():  # 确保indices是一个可迭代的列表
                box = boxes[i]
                result.append((self.classes[class_ids[i]], confidences[i], box))
        return result

4.4 main.py

import sys
import os
import cv2  # 导入OpenCV库
from camera import get_camera_frame  # 导入相机捕捉函数
from object_detection import ObjectDetector  # 导入物体检测类
from interaction import draw_boxes  # 导入绘制边框函数

def main():
    # 配置文件路径
    config_path = "./pythonProject/ai_modle_win/wupin/models/yolov3.cfg"
    weights_path = "./pythonProject/ai_modle_win/wupin/models/yolov3.weights"
    names_path = "./pythonProject/ai_modle_win/wupin/models/coco.names"

    # 初始化物体检测器
    detector = ObjectDetector(config_path, weights_path, names_path)

    while True:
        frame = get_camera_frame()  # 获取摄像头帧
        detections = detector.detect_objects(frame)  # 检测物体
        frame = draw_boxes(frame, detections)  # 绘制检测结果

        cv2.imshow("Object Detection", frame)  # 显示结果
        if cv2.waitKey(1) & 0xFF == ord('q'):  # 按下 'q' 键退出
            break

    cv2.destroyAllWindows()  # 关闭所有窗口

if __name__ == "__main__":
    main()

4.5 运行结果

5.总结

YOLO的主要用途是计算机视觉中的目标检测任务，例如自动驾驶中的行人和车辆识别、安防监控、无人机拍摄分析等场景，它能够实现实时检测，并且对于小目标和大目标都具备较好的性能。你也快来试一试吧！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2138758.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

Dating App约会软件都有哪些商业化策略

Dating App约会软件都有哪些商业化策略

在设计一个成功的Dating App时，吸引并留住用户（特别是女用户）和实现商业化是两个核心任务。比如探探、陌陌等，以下是可行的产品流程思路，以及商业化的功能设计策略，借鉴了成熟的约会平台的经验。吸引并留住…

阅读更多...

2000-2021年3月海关数据库

2000-2021年3月海关数据库

2000-2021年3月海关数据库 1、时间：2000-2021年3月 2、指标：2000-2015数据变量包括：年份、截止日期、进出口分类代码、进出口分类名称、HS商品编码、HS商品名称、金额_美元、数量、价格、经营单位代码、经营单位名称、经营单位地址、电话、…

阅读更多...

AI论文写作测评！类似茅茅虫论文写作助手网站

AI论文写作测评！类似茅茅虫论文写作助手网站

在当前的学术研究和写作环境中，AI论文写作助手成为了许多学者和学生的重要工具。其中，千笔-AIPassPaper和茅茅虫论文写作助手是两款备受关注的平台。本文将对这两款工具进行详细测评，并推荐适合不同需求的用户使用。千笔-AIPassPaper AI论文…

阅读更多...

linux安全软件Hydra使用教程

linux安全软件Hydra使用教程

Hydra 是一个强大的网络登录工具，常用于渗透测试，支持对多种服务和协议（如 SSH、FTP、HTTP 等）进行暴力crack攻击。它可以通过字典攻击来测试用户名和密码的有效性。以下是关于如何使用 Hydra 的基本步骤和示例： 1. 安…

阅读更多...

【mechine learning-九-梯度下降】

【mechine learning-九-梯度下降】

梯度下降更加通用的梯度下降算法算法步骤上一节讲过，随机的寻找w和b使损失最小不是一种合适的方法，梯度下降算法就是解决解决这个问题的，它不仅可以用于线性回归，还可以用于神经网络等深度学习算法，是目前的通用性算…

阅读更多...

【QT】定时器使用

【QT】定时器使用

文章目录关于 Qt 定时器使用的注意细节总结实例-检查工具使用周期时间是否合理UI设计头文件 remind.h源文件 remind.cpp实现效果关于 Qt 定时器使用的注意细节总结一、创建与初始化使用 QTimer 类来创建定时器。可以在构造函数中指定父对象，确保定时器在正确的…

阅读更多...

跨境电商代购新纪元：一键解锁全球好物，系统流程全揭秘

跨境电商代购新纪元：一键解锁全球好物，系统流程全揭秘

添加图片注释，不超过 140 字（可选） 在全球化日益加深的今天，跨境电商代购成为了连接消费者与世界各地优质商品的桥梁。本文将在CSDN平台上，深入剖析跨境电商代购系统的功能流程，带您一窥其背后的技术奥秘与…

阅读更多...

vue3+ant design vue实现可编辑表格弹出气泡弹出窗~

vue3+ant design vue实现可编辑表格弹出气泡弹出窗~

1、这里主要是介绍下::v-deep伪元素的作用。用于穿透组件作用域，以便在组件内部修改样式。用来覆盖Ant Design Vue组件库中的样式 <a-table:dataSource"dataList":columns"columns":scroll"{ x: 100% }":pagination"false&q…

阅读更多...

架构师备考的一些思考（四）

架构师备考的一些思考（四）

前言对于数学，我们之前学的是对的，但不是真的，所以我们没有数学思维。对于计算机，我们学校教的是对的，但不是真的，所以仅仅从学校学习知识的应届毕业生，不论985,211，本科&#xff…

阅读更多...

优化深度学习模型训练过程：提升PASCAL VOC 2012数据集上Deeplabv3+模型训练效率的策略

优化深度学习模型训练过程：提升PASCAL VOC 2012数据集上Deeplabv3+模型训练效率的策略

创作不易，您的打赏、关注、点赞、收藏和转发是我坚持下去的动力！ 优化说明： 避免重复下载和解压数据集：将downloadTrue改为downloadFalse，防止每次运行代码都重新下载和解压数据集，从而节省时间。使用pin…

阅读更多...

8. Transforms的使用(三)-- Resize

8. Transforms的使用(三)-- Resize

Transforms的使用（三） 1. 为什么要使用Resize 在模型的训练过程中往往需要图片数据的维度相同，才能适应深度学习模型中的相关神经网络结构，这时候就需要使用Resize保证所有的图片保持相同的尺寸2. 使用Resize调整图片的尺寸在pytorch2.3的版本上，Resize()支持对Tensor类…

阅读更多...

k8s Service 服务

k8s Service 服务

文章目录一、为什么需要 Service二、Kubernetes 中的服务发现与负载均衡 -- Service三、用例解读1、Service 语法2、创建和查看 Service 四、Headless Service五、集群内访问 Service六、向集群外暴露 Service七、操作示例1、获取集群状态信息2、创建 Service、Deployment3、创…

阅读更多...

分贝转换 1 mVpp = 9.03dBmV

分贝转换 1 mVpp = 9.03dBmV

分贝转换 1 mVpp 9.03dBmV 函数发生器调节如下参数在频谱仪器上能看到9.03dBmv的电压值函数发生器产生 30mVpp 频谱仪会显示多少dBmV 函数发生器调节如下参数 输出频率：10 MHz 波形类型：正弦波 阻抗：50 Ω 幅度：1 mVpp …

阅读更多...

【笔记】CCF直播：《如何在国际会议上有效交流》（2024-9-15）

【笔记】CCF直播：《如何在国际会议上有效交流》（2024-9-15）

目录一、提问的勇气二、提问什么三、其他主题的报告为什么听四、会议前怎么读大量论文？五、workshop为什么参加？Poster环节？六、提问环节七、其他今天听了《如何在国际会议上有效交流》的直播讲座，记录一些笔记。一、提问的勇…

阅读更多...

Gitlab及Git使用说明

Gitlab及Git使用说明

目录 1 Gitlab及Git介绍说明 5 1.1 什么是 Gitlab 5 1.2 什么是Git 5 1.3 Git 家族成员 5 1.4 Gitlab版本 5 1.5 Gitlab 优势 5 1.6 Gitlab 主要服务构成 6 1.7 Gitlab 简单工作流程 6 1.8 Gitlab用户角色 6 2 Gitlab安装与使用 7 2.1 Gitlab安装说明（管理员&#…

阅读更多...

文心智能体应用：美国旅游助手的诞生

文心智能体应用：美国旅游助手的诞生

创造灵感在如今的数字化时代，旅行体验越来越依赖于智能技术的辅助。从机票预订到行程安排，再到当地美食推荐，智能助手在旅行中的作用愈发重要。尤其在美国这样一个广袤且多样化的国家，拥有一个智能旅行助手能够极大地提升游客的…

阅读更多...

地震勘探原理视频总结（1-6）

地震勘探原理视频总结（1-6）

目录一、为什么要学好这门课？ 1.1 为什么要学这门课（为啥学）？ 1.2 课程包括哪些主要内容（学什么）？ 1.3 如何学好这门课（怎么学）？ 二、石油的生成与聚集…

阅读更多...

网络安全有救了，37所高校新增网络安全空间安全专业

网络安全有救了，37所高校新增网络安全空间安全专业

《网安面试指南》http://mp.weixin.qq.com/s?__bizMzkwNjY1Mzc0Nw&mid2247484339&idx1&sn356300f169de74e7a778b04bfbbbd0ab&chksmc0e47aeff793f3f9a5f7abcfa57695e8944e52bca2de2c7a3eb1aecb3c1e6b9cb6abe509d51f&scene21#wechat_redirect 《Java代码审…

阅读更多...

Google提出 Speculative RAG：通过草稿机制增强检索增强生成

Google提出 Speculative RAG：通过草稿机制增强检索增强生成

每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领…

阅读更多...

【自动化测试】自动化测试的价值和误区以及如何高效实用地落地自动化测试

【自动化测试】自动化测试的价值和误区以及如何高效实用地落地自动化测试

引言自动化并不仅仅是机器“点点点”的操作。虽然从表面上看，自动化测试确实涉及到了机器按照预设的脚本进行一系列的操作，但它的内涵远比这要丰富得多高效实用地落地自动化测试，需要从策略规划、工具选择、团队协作、持续改进等多个方面进…

阅读更多...

推荐文章

最新文章