Yolo v8目前已经支持Yolo-World,整理一下初步使用步骤。
使用步骤
1 先下载Yolo-World的pt文件,下载地址:GitHub - AILab-CVC/YOLO-World: [CVPR 2024] Real-Time Open-Vocabulary Object Detection
官网应该是点这里(有个笑脸)下载,我一直刷不出来界面,所以不确定:
我自己用的是在其他网友提供的地址下载的,应该是V1版本(yolov8-world.pt),目前已经出了V2版本。
2 新建一个python脚本,叫testYolo-World.py,这里我们使用Yolo v8自带的bus.jpg进行测试。
from ultralytics import YOLOWorld
# 目标检测
# Load a model
model = YOLOWorld('data/yolov8s-world.pt') # load a pretrained model
# Define custom classes
model.set_classes(['glasses'])
#model.save("data/yolov8s-world2.pt")
# Run inference on 'bus.jpg' with arguments
results = model.predict('data/bus.jpg',save=True, imgsz=640)
运行过程中,会提示缺失CLIP库,然后等待一会,会自动安装。安装成功后,再次运行一遍,会出结果,能检测到glasses.
但是尝试了其他类别,'tree' 'window' 'clothes' 'shoes',除了'shoes',其他都检测不出来,不知道V2效果会不会好一点。
如果注释掉设置类别这句话,能检测到的类别和Yolo v8自带的pt文件检测类别基本一致,置信度很高,但是有一个错误,多检测出来一个person。