基于Keras-YOLO实现目标检测

news2025/1/7 6:02:19

Keras-YOLO 3项目使用Python语言实现了YOLO v3网络模型,并且可以导入Darknet网络预先训练好的权重文件信息直接使用网络进行目标识别。

1. 下载Keras-YOLO 3项目

执行如下命令下载Keras-YOLO 3项目代码:

git clone https://github.com/qqwweee/keras-yolo3.git

2. 转换Darknet的weights文件格式为Keras支持的格式

将上一小节中从Darknet官方网站下载的权重文件yolov3.weights放到Keras-YOLO 3项目根目录下,执行如下命令将Darknet的权重文件转换为Keras-YOLO 3支持的.h5格式:

python3 convert.py yolov3.cfg yolov3.weights model_data/yolo.h5

执行成功会输出类似如图7.19所示的信息和结果。

 

图7.19  输出结果

执行完成后,Keras-YOLO 3项目的目录结构如图7.20所示。

 

图7.20  Keras-YOLO 3项目的目录和文件结构

其中,各选项说明如下:

  • yolo.py实现了主要的使用功能。
  • yolo_video.py是整个项目的入口文件,调用了yolo.py文件。
  • model.py实现了YOLO v3算法框架。
  • utils.py封装了实现过程中需要的应用功能。
  • kmeans.py用于获取数据集的全部锚点边界框(Anchor Box),通过K-Means算法将这些边界框的宽和高聚类为9类,获取9个聚类中心,面积从大到小排列,作为9个锚点边界框(Anchor Box)。
  • train.py用于训练自己的数据集。
  • coco_annotation.py和voc_annotation.py用于在训练COCO以及VOC数据集时生成对应的Annotation文件。
  • convert.py用于将Darknet中YOLO v3的.cfg模型文件和.weights权重文件转换为Keras支持的.h5文件,并存放于model_data子目录下。
  • font子目录中包含一些字体,model_data子目录中包含COCO数据集和VOC数据集的类别及相关的Anchors文件。
  • yolov3.weights文件是从Darknet下载的预先训练好的权重文件。
  • model_data/yolo.h5是根据yolov3.weight文件转换生成的Keras格式的权重文件。

3. 执行YOLO目标检测任务

将待检测的输入文件提前准备在Keras-YOLO 3项目根目录下,本案例中我们依然使用了上一小节使用的person.jpg输入文件,然后在Keras-Yolo 3项目根目录下执行如命令启动YOLO v3模型的目标检测任务:

python3 yolo_video.py --image

yolo_video.py更详细的使用说明如下:

usage: yolo_video.py [-h] [--model MODEL] [--anchors ANCHORS]
                     [--classes CLASSES] [--gpu_num GPU_NUM] [--image]
                     [--input] [--output]
positional arguments:
  --input        Video input path
  --output       Video output path
optional arguments:
  -h, --help         show this help message and exit
  --model MODEL      path to model weight file, default model_data/yolo.h5
  --anchors ANCHORS  path to anchor definitions, default
                     model_data/yolo_anchors.txt
  --classes CLASSES  path to class definitions, default
                     model_data/coco_classes.txt
  --gpu_num GPU_NUM  Number of GPU to use, default 1
  --image            Image detection mode, will ignore all positional arguments

输入待检测的图像文件名后,输出结果如图7.21所示。

 

图7.21  Keras-YOLO 3的输入和输出结果

输出结果显示已经成功检测出的目标数量、置信度、预测框的位置等信息,与Darknet网络一样,也会同时以可视化的图形方式显示检测结果,如图7.22所示。

 

图7.22  Keras-YOLO 3生成的检测结果

本文节选自《Python深度学习原理、算法与案例》,内容发布获得作者和出版社授权。

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/561995.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

直播和短视频美颜sdk的开发流程、代码分析

目前,美颜技术是提高视频质量的重要手段之一,特别是短视频和直播两个行业。本文将介绍其开发流程和代码分析。 一、美颜SDK的开发流程 1.需求分析 首先我们需要明确的一点就是“需求”,例如:美颜效果、美颜程度、性能要求等。同…

解决找不到微信支付V3版本公钥问题

参考微信文档链接为签名验证-接口规则 | 微信支付商户平台文档中心 写的内容特别不明显,往下面看会找到 下载openssl工具使用命令从私钥证书中导出即可。

地图在线编辑平台,无基础轻松实现私域地图

位构云平台让用户轻松构建诸如空间信息管理、建筑信息管理及三维空间数据可视化、导航等类型应用的多平台、综合型地图引擎,基于OpenGLES/WebGL三维可视化技术体系的自主研发图形引擎,可以让开发者轻松构建运行在 Web、Android、iOS 等多平台的应用程序。…

安捷伦DSO80404B(Agilent)dso80404b租售回收 数字示波器

DSO80404B 是 Agilent 的 4 GHz、4 通道数字示波器。测量电子电路或组件中随时间变化的电压或电流信号,以显示振幅、频率和上升时间等。应用包括故障排除、生产测试和设计。 附加功能: 4 GHz 带宽,可升级至 13 GHz 4个模拟通道 高达 40 G…

day10 前端技术-HTMLCSS

HTML 含义:超文本标记语言,静态网页,用于在浏览器显示数据 双标签:<> </>,开始标签和结束标签同时出现 单标签: 属性名:属性后面的值都加双引号 常用的HTML标签 :文档的根标签 :HTML页面的头部标签 “”:页面标题 “”:页面主体部分 “ “ “ 到 ”:标题…

『树莓派云台机器人』02. 电脑连接树莓派 配置开发环境

目录 1. 下载ssh交互工具 Xshell 与XFTP&#xff08;有过相关使用经历的朋友可以跳过这一节内容&#xff09;2. 下载VNC远程控制工具软件3. 连接过程4. Xshell 命令工具5. XFTP 文件传送工具6. 关于联网总结 欢迎关注 『树莓派云台机器人』 博客&#xff0c;持续更新中 欢迎关注…

PoseiSwap IDO在Bounce上启动在即,如何参与?

目前&#xff0c;Nautilus Chain 生态基本完成测试&#xff0c;并即将在不久上线主网。PoseiSwap 作为 Nautilus Chain 上的首个 DEX&#xff0c;也即将面向市场并上线正式版本。我们看到&#xff0c; PoseiSwap 也正式发布了新的市场进程&#xff0c;基于其治理代币 POSE 的 I…

转辙机介绍

简介 转辙机是指用以可靠地转换道岔位置&#xff0c;改变道岔开通方向&#xff0c;锁闭道岔尖轨&#xff0c;反映道岔位置的重要的信号基础设备&#xff0c;它可以很好地保证行车安全&#xff0c;提高运输效率&#xff0c;改善行车人员的劳动强度。 分类 01、转辙机按动作时…

如何做出有价值的知识管理文档?

知识管理文档是企业中重要的资产&#xff0c;它可以帮助企业员工更好地理解业务流程、产品功能、标准操作等信息。如何做出有价值的知识管理文档&#xff0c;满足员工知识需求&#xff0c;提高工作效率&#xff0c;本文将探讨以下几个方面&#xff1a; 一、制定有效的知识管理…

jsp网上鞋城系统Myeclipse开发mysql数据库web结构java编程计算机网页项目

一、源码特点 java 网上鞋城系统 是一套完善的web设计系统&#xff0c;对理解JSP java编程开发语言有帮助&#xff0c;系统具有完整的源代码和数据库&#xff0c;系统主要采用B/S模式开发。开发环境为TOMCAT7.0,Myeclipse8.5 开发&#xff0c;数据库为Mysql&#xff0c;使用j…

建议熟知:2023谷歌新搜索规则!

谷歌作为全球最大的搜索引擎之一&#xff0c;不断更新和调整其搜索算法和规则&#xff0c;以提供更精准、高质量的搜索结果。2023年&#xff0c;谷歌搜索将迎来一系列新的搜索规则&#xff0c;同时&#xff0c;AI工具的快速发展也为谷歌搜索带来了全新的应用场景和可能性。 这…

基于Go开发PaaS平台1

Go开发PaaS平台核心功能 代码仓库地址GitHub - yunixiangfeng/gopaas 1 云原生PaaS平台介绍 随着云计算的发展&#xff0c;越来越多的企业逐步的把IT资源迁移到云上。PaaS平台作为基础设施基座&#xff0c;可以帮助企业快速构建功能丰富的容器云平台&#xff0c;提升交付效率…

应用在智能手表中监测温度的数字红外接近检测模块

智能手表是将手表内置智能化系统、搭载智能手机系统而连接于网络而实现多功能&#xff0c;能同步手机中的电话、短信、邮件、照片、音乐等。显示方式包括指针、数字、图像等。随着对于健身、运动的高度关注&#xff0c;以及大众购买力的增强&#xff0c;智能手表这个可穿戴设备…

SpringCloud 性能优化

Springcloud的性能问题 Springcloud 原始的配置&#xff0c;性能是很低的&#xff0c;大家可以使用Jmeter测试一下&#xff0c;QPS不会到50。要做到高并发&#xff0c;需要做不少的配置优化&#xff0c;主要的配置优化有以下几点&#xff1a; Feign 配置优化hystrix配置 优化…

《水经注地图服务》地图服务与通用设置说明

&#xff08;本文首发于“水经注GIS”公号&#xff0c;关注公号免费领取地图数据&#xff09; 《水经注地图服务》&#xff08;WeServer&#xff09;是一款可快速发布全国乃至全球海量卫星影像的地图发布服务产品&#xff0c;该产品完全遵循OGC相关协议标准&#xff0c;是一个基…

在 Linux 中如何使用 HAProxy、Nginx 和 Keepalived 进行负载均衡?

在现代网络应用中&#xff0c;负载均衡是提高性能和可靠性的关键因素之一。通过将请求分发到多个服务器上&#xff0c;负载均衡可以确保请求被合理地处理&#xff0c;并避免单点故障。 在 Linux 环境下&#xff0c;常用的负载均衡解决方案包括 HAProxy、Nginx 和 Keepalived。…

Vue3全家桶之数据管理

我们都知道Vue框架是通过数据驱动的&#xff0c;所以数据的重要性不言而喻&#xff0c;那么有哪些数据需要管理又是如何进行管理的呢&#xff1f;本节我们就来聊一聊Vue3中的数据管理。 哪些数据需要管理&#xff1f; 在我们的前端项目中&#xff0c;都会有哪些数据呢&#x…

Imagination推出IMG CXM最小GPU,为家庭娱乐带来无比便捷的用户界面

全新IMG CXM GPU核兼容RISC-V并原生支持全HDR&#xff0c;帮助数字电视及整个消费市场降低成本 中国北京 - 2023年5月23日 - Imagination Technologies推出全新IMG CXM GPU系列为对成本敏感的消费级设备带来无缝的视觉体验。该系列包含原生支持全HDR用户界面的最小GPU。 IMG CX…

全面撤出印度市场,郭台铭终于明白了到底谁成就了富士康

郭台铭创立的富士康迅速发展成为全球最大的代工厂&#xff0c;它也因此成为制造业中的标杆&#xff0c;巨大的成绩让郭台铭开始有点飘飘然&#xff0c;以为富士康的成就完全是他的努力&#xff0c;然而随着手机组装业在印度遭受的挫折&#xff0c;郭台铭或许终于清醒认识到富士…

图的拓扑排序AOV网,有向无环图DAG描述表达式,关键路径AOE网。

一&#xff0c;有向无环图DAG描述表达式 1.DAG 若一个有向图中不存在环&#xff0c;则称为有向无环图&#xff0c;记为DAG。 2.用二叉树描述表达式 3.用DAG描述表达式 用二叉树描述表达式有缺点&#xff0c;有些结点大可不必存储&#xff0c;可以共用。 step1:把各个操作数…