OpenMMLab-AI实战营第二期——相关1. COCO数据集格式和pycocotools使用(目标检测方向)

news2025/1/11 8:48:37

文章目录

  • 1. COCO数据集
    • 1.1 COCO数据集介绍
    • 1.2 COCO数据集格式
      • 1.2.1 常见目标检测数据格式
      • 1.2.2 COCO数据集文件结构及标注文件说明
      • 1.2.3 COCO的evaluation指标
    • 1.3 其他
  • 2. pycocotools
    • 2.1 pycocotools简介和安装
    • 2.2 基本使用
  • 3. 图像的EXIF使用
    • 3.1 图像的EXIF
      • 3.1.1 基本介绍
      • 3.1.2 JEPG等格式说明
      • 3.1.3 EXIF属性和对应code
      • 3.1.4 EXIF中的key和value意义(EXIF Tags)
      • 3.1.5 借助EXIF信息处理图像的意义
    • 3.2 使用PIL借助EXIF校正图像旋转
      • 3.2.0 PIL支持的EXIF Tags
      • 3.2.1 推荐简单的写法
      • 3.2.2 朴实的写法
    • 3.3 OpenCV中的EXIF信息问题
      • 3.3.1 imread默认应用了EXIF
      • 3.3.2 imread默认不应用EXIF

1. COCO数据集

参考:目标检测实战篇1——数据集介绍(PASCAL VOC,MS COCO)

现在说的COCO数据集一般指的就是2017年的数据集:图像一共25GB,看看就好了,肯定不会训练的。

图像标注
2017 Train images [118K/18GB]2017 Train/Val annotations [241MB]
2017 Val images [5K/1GB]
2017 Test images [41K/6GB]2017 Testing Image info [1MB]

1.1 COCO数据集介绍

COCO是一个用于目标检测、分割和图像描述生成的大型数据集,有以下特点:

  • 图像分割
  • 上下文识别
  • 超像素分割
  • 33w图像,其中有标记的超过20w
  • 150w目标实例
  • 80个目标类别,这80个类别是做目标检测时的类别,详见:COCO Explorer,标注的不错,下图左上角的那些标签是可以点击的,会和下面的图像有交互效果。
    在这里插入图片描述
  • 91个物体类别:除了上面那确定对象的80个类别,还有天空、海洋等一些别的,不是目标检测类别,是全景分割等需要的内容。
  • 每张图像5个情景描述,如上图
  • 有25w人的关键点标注

1.2 COCO数据集格式

1.2.1 常见目标检测数据格式

  • 一般目标检测任务使用Pascal VOCYOLOCOCO数据集格式,
  • 语义分割任务Pascal VOC和COCO都有,还有一些街景、遥感图像、医疗影像特定领域的格式,不是通用类的。
  • 后续会另外介绍语义分割任务相关部分,这里只关注目标检测方面的

1.2.2 COCO数据集文件结构及标注文件说明

1. 基本的文件结构

data
├─  annotations
│   ├─  instances_train2017.json
│   └─  instances_val2017.json
├─  train2017
│   ├─  000000000???.jpg
│   ├─  000000000???.jpg
│   └─  ...
└─  val2017
    ├─  000000000???.jpg
    ├─  000000000???.jpg
    └─  ...

参考: COCO with YOLO

2. 标注文件格式

标注文件以json格式存在,不是PASAL VOC那种一个xml对应一个文件标注,这里是所有图像的标注都存在于一个文件里,看下图左侧的行号:
在这里插入图片描述
具体点:

{
    "images": [
        {
            "id": 0,
            "file_name": "34020010494_e5cb88e1c4_k.jpg",
            "height": 1536,
            "width": 2048
        }, //这是一个示例
    ],//"images"字段结束
    "annotations": [
        {
            "image_id": 0,
            "id": 0,
            "category_id": 0,
            "bbox": [
                994,
                619,
                451,
                547
            ],
            "area": 246697,
            "segmentation": [
                [
                    1020.5,
                    963.5,
                    1000.5,
                    ...
                    963.5
                ]
            ],
            "iscrowd": 0
        },//这是一个示例
	],//"annotations"字段结束
    "categories": [
        {
            "id": 0,
            "name": "balloon"
        }
    ]//"annotations"字段结束
}       

其遵循的数据格式参见:COCO-Data format。

  • COCO有分别用于目标检测、关键点检测和实例分割、全景分割、姿态估计和图像描述生成的多种数据标注类型,这些标注都使用JSON格式存储。
  • COCO API(例如:pycocotools)可以用于访问处理上面所有的标注,这些标注都遵循以下基本数据结构
  • 上面展示的那个数据集没有info字段和licenses字段,其他都是基本符合的
{
    "info": info,
    "images": [image],
    "annotations": [annotation],
    "licenses": [license],
}

info{
    "year": int,
    "version": str,
    "description": str,
    "contributor": str,
    "url": str,
    "date_created": datetime,
}

image{
    "id": int,
    "width": int,
    "height": int,
    "file_name": str,
    "license": int,
    "flickr_url": str,
    "coco_url": str,
    "date_captured": datetime,
}

license{
    "id": int,
    "name": str,
    "url": str,
}
  • 另外,针对不同类型,其annotations字段一般不同,同时有些还会有categories字段,目标检测任务这两个字段的规范是:
annotation{
    "id": int,
    "image_id": int,
    "category_id": int,
    "segmentation": RLE or [polygon
    ],
    "area": float,
    "bbox": [x,y,width,height
    ],
    "iscrowd": 0 or 1,
    // iscrowd是1,表示要使用RLE
}

categories[
    {
        "id": int,
        "name": str,
        "supercategory": str, 
        // 比如 蓝猫的父类是猫咪,类别的层次
    }
]

这和上面的例子也是差不多的,这就是COCO的标注格式了。

1.2.3 COCO的evaluation指标

Evaluation指标: 参考 Metrics
在这里插入图片描述
截了个图,不做具体说明了

1.3 其他

除了COCO API,还有MASK API和FiftyOne

  • MASK API:处理RLE格式存储的mask
  • FiftyOne:开源的可视化和访问COCO的工具,也可以对COCO模型做可视化的评估
    • 有兴趣可以看看:FIFTYONE
    • 也提供了一个colab上的快速体验:quickstart.ipynb

2. pycocotools

2.1 pycocotools简介和安装

来源:cocoapi/PythonAPI/pycocotools/

  • 其实就是个对json格式进行解析的库,就三个.py脚本,不要和protobuf这个库搞混了,名字有一丢丢像(我之前以为这个库很难,就是和这个搞混了)
  • 简单到网上连个document都没有,直接自己安装看函数help吧

安装:

# windows下(直接pip需要编译,需要visual studio)
conda install pycocotools -c conda-forge

# macos (也需要编译,但是macOS系统包含编译工具,不需要进行额外依赖安装)
pip install pycocotools

2.2 基本使用

主要就是以下几个函数(其中,“ann”=annotation, “cat”=category, “img”=image)

函数名称功能
getAnnIds返回满足筛选条件的标注id
getCatIds返回满足筛选条件的类别id
getImgIds返回满足筛选条件的图像id
loadAnns加载指定id的标注
loadCats加载指定id的类别
loadImgs加载指定id的图像
loadReseval评估模型效果时加载预测结果的
showAnns显示特定的标注

示例代码:上传到github了(jupyter),详见:openMMLabCampusLearn/selfExercise/1.pycocotools.ipynb


参考:

  • 2. COCO API
  • cocoapi/PythonAPI/pycocoDemo.ipynb
  • cocoapi/PythonAPI/pycocoEvalDemo.ipynb

3. 图像的EXIF使用

这部分对应的代码详见Github: openMMLabCampusLearn/selfExercise/2.图像EXIF信息.ipynb

3.1 图像的EXIF

3.1.1 基本介绍

可交换图像文件格式(英语:Exchangeable image file format,官方简称Exif),是专门为数码相机的照片设定的,可以记录数码照片的属性信息和拍摄数据。

  • Exif可以附加于JPEG、TIFF、RIFF等文件之中,为其增加有关数码相机拍摄信息的内容和索引图或图像处理软件的版本信息。
  • Windows 7操作系统具备对Exif的原生支持,通过鼠标右键点击图片打开菜单,点击属性并切换到详细信息标签下即可直接查看Exif信息
  • macOS也可以看,双击图像,在预览中->点击检查器->点击i符号,就可以看到了
    在这里插入图片描述
  • Exif信息是可以被任意编辑的,因此只有参考的功能。Exif信息以0xFFE1作为开头标记,后两个字节表示Exif信息的长度。所以Exif信息最大为64 kb,而内部采用TIFF格式。

关于EXIF中tags的介绍,可以看EXIF标准的pdf文件:https://www.cipa.jp/std/documents/e/DC-X008-Translation-2019-E.pdf
在这里插入图片描述


可以把一个jpeg图像后缀名改为txt格式,用文本文件打开,就可以看到读取JPG图片的Exif属性(一) - Exif信息简介里介绍的那些十六进制码流了

参考:

  • 百度百科-Exif
  • wiki百科-https://en.wikipedia.org/wiki/Exif
    • 这里提供了EXIF标准的pdf文件链接:https://www.cipa.jp/std/documents/e/DC-X008-Translation-2019-E.pdf
    • 进而可以知道JPEG中EXIF信息的规定,要去看JPEG的标准:ISO/IEC 10918-1
  • 读取JPG图片的Exif属性(一) - Exif信息简介

3.1.2 JEPG等格式说明

关于JEPG解码的格式,主要要去看这个协议:
ISO/IEC 10918-1(ISO/IEC 10918-1:1994
Information technology — Digital compression and coding of continuous-tone still images: Requirements and guidelines)

参考:

  • 读取JPG图片的Exif属性(一) - Exif信息简介
    • 这里涉及到一些JEPG格式中EXIF的内容
  • JPEG文件编/解码详解
  • JPEG文件格式及其解码流程

3.1.3 EXIF属性和对应code

from PIL import Image

demo_path = "datasets/cat_dataset/images/IMG_20211020_091507.jpg"
demo_image = Image.open(demo_path)

for k, v in demo_image.getexif().items():
    print("Tag", k, "Value", v)  
> Tag 274 Value 6

这里的274表示的是图像的朝向(Orientation),
参考:

  • 【记录】PIL img.getexif()获取图像信息
  • https://pillow.readthedocs.io/en/stable/reference/Image.html#PIL.Image.Exif

3.1.4 EXIF中的key和value意义(EXIF Tags)

Tag (hex)Tag (dec)IFDKeyTypeTag description
0x000b11ImageExif.Image.ProcessingSoftwareAsciiThe name and version of the software used to post-process the picture
0x0100256ImageExif.Image.ImageWidthLongThe number of columns of image data, equal to the number of pixels per row. In JPEG compressed data a JPEG marker is used instead of this tag.
0x0101257ImageExif.Image.ImageLengthLongThe number of rows of image data. In JPEG compressed data a JPEG marker is used instead of this tag.
0x0103259ImageExif.Image.CompressionShortThe compression scheme used for the image data. When a primary image is JPEG compressed, this designation is not necessary and is omitted. When thumbnails use JPEG compression, this tag value is set to 6.
0x0106262ImageExif.Image.PhotometricInterpretationShortThe pixel composition. In JPEG compressed data a JPEG marker is used instead of this tag.
0x0107263ImageExif.Image.ThresholdingShortFor black and white TIFF files that represent shades of gray, the technique used to convert from gray to black and white pixels.
0x0108264ImageExif.Image.CellWidthShortThe width of the dithering or halftoning matrix used to create a dithered or halftoned bilevel file.
0x010a266ImageExif.Image.FillOrderShortThe logical order of bits within a byte
0x010f271ImageExif.Image.MakeAsciiThe manufacturer of the recording equipment. This is the manufacturer of the DSC, scanner, video digitizer or other equipment that generated the image. When the field is left blank, it is treated as unknown.
0x0110272ImageExif.Image.ModelAsciiThe model name or model number of the equipment. This is the model name or number of the DSC, scanner, video digitizer or other equipment that generated the image. When the field is left blank, it is treated as unknown.
0x0112274ImageExif.Image.OrientationShortThe image orientation viewed in terms of rows and columns
0x011a282ImageExif.Image.XResolutionRationalThe number of pixels per in the direction. When the image resolution is unknown, 72 [dpi] is designated.
0x011b283ImageExif.Image.YResolutionRationalThe number of pixels per in the direction. The same value as is designated.

上面只贴了一部分,完整的可以参考:

  • Standard Exif Tags
  • TIFF Tag Reference, Exif Tags
  • 在线表格转markdown语法可以使用:https://jakebathman.github.io/Markdown-Table-Generator/

另外,有些字段的取值是枚举的,每个值都有自己的意义,以Exif.Image.Orientation为例,在参考网站中搜索Orientation字段,可以得到:

1 = Horizontal (normal)
2 = Mirror horizontal
3 = Rotate 180
4 = Mirror vertical
5 = Mirror horizontal and rotate 270 CW(ClockWise rotation,顺时针方向)
6 = Rotate 90 CW
7 = Mirror horizontal and rotate 90 CW
8 = Rotate 270 CW

具体字段的值可以看看:

  • https://exiftool.org/TagNames/EXIF.html
  • https://www.media.mit.edu/pia/Research/deepview/exif.html
  • 不嫌麻烦的也可以在原始标准文档中看:https://www.cipa.jp/std/documents/e/DC-X008-Translation-2019-E.pdf

3.1.5 借助EXIF信息处理图像的意义

以下内容转载自:

  • ✅计算机视觉模型效果不佳,你可能是被相机的Exif信息坑了 来源:量子位
  • ✅知乎-计算机视觉应用开发中踩到EXIF的坑

日常用手机拍照的时候应该都遇到过这种情况:竖着拿手机拍横向的内容时,手机里的画面会自动变成横向,拍摄结束后,也会以横向的格式保存。

  • 以手机为例: iOS的设备中也是包含了这样的方向传感器,它也采用了同样的方式来保存照片的方向信息到EXIF中。但是它默认的照片方向并不是竖着拿手机时的情况,而是横向,即Home键在右侧,如下:
  • 如此一来,如果竖着拿手机拍摄时,就相当于对手机顺时针旋转了90度,也即上面相机图片中的最后一幅,那么它的Orientation值为6。即,默认存储图像格式是横屏的,显示时会加上EXIF的信息。(软件中看到的图是进行了EXIF信息变换之后的)
  • EXIF原先是用在TIFF图像格式上,后来才加入到JPEG图像格式中,而图像数据集中的图片大多是JPEG格式。大多数训练图像中则不含EXIF信息(PNG图像无法保存EXIF信息)。
  • 一些程序为了保持向后兼容性,不会去解析EXIF信息。大多数用于处理图像数据的Python库(如NumPy、SciPy,TensorFlow,Keras等)就是这样的
    • 这意味着当你使用这些工具导入图像时,都将获得原始的未旋转图像数据。
    • 如果把这些侧躺着或上下颠倒的图像输入到CV模型中,会得到错误的检测结果;
    • 如在我现在描述的场景中,图像就旋转了270度,导致图像的宽高颠倒了。
  • 电脑软件和手机可以正确显示图像方向,是因为其会对EXIF进行解析和处理
  • 所以同一张图,手机可以正常显示,而使用matplotlib这些进行显示则长宽就可能错位。

为什么手机不直接把图像旋转存成旋转后的图像,有个说法:
jpg旋转以后二次编码会损失画质
所以相机默认不旋转原始数据,而是在语义层面添加旋转语义供后续使用。

3.2 使用PIL借助EXIF校正图像旋转

3.2.0 PIL支持的EXIF Tags

from PIL import ExifTags
for k,v in ExifTags.TAGS.items():
    print(f"Tag:{k}, Value:{v}")
>...
Tag:271, Value:Make
Tag:272, Value:Model
Tag:273, Value:StripOffsets
Tag:274, Value:Orientation
...

参考:

  • Get date and time when photo was taken from EXIF data using PIL
  • https://pillow.readthedocs.io/en/stable/reference/ExifTags.html

3.2.1 推荐简单的写法

Pillow>=6.0.0的版本里,已经有一个现成的工具帮助用户根据EXIF的Orientation信息旋转图像

from PIL import ImageOps
image = ImageOps.exif_transpose(image)
"""
ImageOps.exif_transpose:
如果一个图像的EXIF朝向标签的值不是1,根据其方向值对图像进行转换,然后删除方向标签
"""

# 完整代码
from PIL import ImageOps,Image
demo_path = "datasets/cat_dataset/images/IMG_20211020_091507.jpg"
demo_image = Image.open(demo_path)

image = ImageOps.exif_transpose(demo_image)

plt.figure(figsize=(8,6))
plt.subplot(1,2,1)
plt.title(f"Orientation:{demo_image.getexif()[274]}")
plt.imshow(demo_image)
plt.axis("off")

plt.subplot(1,2,2)
plt.title("Modified")
plt.imshow(image)
plt.axis("off")

在这里插入图片描述

  • 对于numpy、matplotlib等库来说,默认不使用EXIF信息,所以呈现的就是左侧的样子。
  • 但是对于标注数据来说,标注软件会读取EXIF信息,所以在标注软件中显示的是右侧的图像,则标注信息对应的也是右边。
  • 所以如果不对原图进行旋转,重新保存的话,在大部分的python程序里,读入都是不对的。
  • 另外,还有一点:
    • ImageOps.exif_transpose在完成数据转换后,会删除方向标签
    • 防止转换后的图像还有方向标签,后续处理程序不断进行旋转。
    • 以及防止再次标注时,标注软件等解析EXIF,导致显示错误

参考:

  • Rotating an image with orientation specified in EXIF using Python without PIL including the thumbnail
  • https://pillow.readthedocs.io/en/latest/_modules/PIL/ImageOps.html#exif_transpose

3.2.2 朴实的写法

老式的写法(MMDetection课上写的,其实是来自PIL提供的exif_transpose函数的改写,点击这里)

下面的脚本,在旋转图像后,并没有删除方向标签,可能会给之后的重新标记或者其他处理带来隐患。。

def apply_exif_orientation(image):
    _EXIF_ORIENT =274
    if not hasattr(image,'getexif'):
        return image
    try:
        exif = image.getexif()
    except Exception:
        exif=None
        return image
    orientation = exif.get(_EXIF_ORIENT)
    """
	1 = Horizontal (normal)
	2 = Mirror horizontal # 水平镜像
	3 = Rotate 180 # 旋转180度
	4 = Mirror vertical # 竖直镜像
	5 = Mirror horizontal and rotate 270 CW(ClockWise rotation,顺时针方向)
	6 = Rotate 90 CW # orientation=6 表示这张图在标注软件上显示是  顺时针旋转原图90度之后的样子
	7 = Mirror horizontal and rotate 90 CW
	8 = Rotate 270 CW
    """
    method = {2:Image.FLIP_LEFT_RIGHT,
            3:Image.ROTATE_180,
            4:Image.FLIP_TOP_BOTTOM,
            5:Image.TRANSPOSE,
            6:Image.ROTATE_270, # PIL库旋转都是以逆时针方向角度来算的,所以这里和上面90度是互补的
            7:Image.TRANSVERSE,
            8:Image.ROTATE_90}.get(orientation)
    if method is not None:
        return image.transpose(method)
        # 注意,旋转的时候是以左上角的顶点为旋转中心进行旋转的
    return image

根据:Image.rotate(angle, resample=Resampling.NEAREST, expand=0, center=None, translate=None, fillcolor=None)可知:

  • Image这个库旋转使用的是逆时针的角度。。。
  • angle – In degrees counter clockwise.

参考:

  • Image.rotate(angle, resample=Resampling.NEAREST, expand=0, center=None, translate=None, fillcolor=None)
  • image_to_numpy/image_to_numpy/src.py
  • Python: PIL读取的图像发生自动旋转
  • PIL Image 旋转 Rotate函数的坑和解决方案

3.3 OpenCV中的EXIF信息问题

3.3.1 imread默认应用了EXIF

默认OpenCV在读取图像时已经应用了EXIF信息

import cv2
demo_path = "datasets/cat_dataset/images/IMG_20211020_091507.jpg"

demo_image = cv2.imread(demo_path)
plt.imshow(demo_image[:,:,::-1])

在这里插入图片描述

详见:Opencv4.x-imread()-文档
或者看看这个讲解:20170227. EXIF信息的说明(opencv320 ApplyExifOrientation)
在这里插入图片描述


3.3.2 imread默认不应用EXIF

如果不想OpenCV默认使用EXIF信息,可以:

import cv2
demo_path = "datasets/cat_dataset/images/IMG_20211020_091507.jpg"

plt.figure(figsize=(15,5))
plt.subplot(1,3,1)
demo_image = cv2.imread(demo_path)
plt.title("With EXIF(Default)")
plt.imshow(demo_image[:,:,::-1])

plt.subplot(1,3,2)
# opencv-python要求Flag必须是整数,所以要找Flag对应的整数值
withOut_image_1 = cv2.imread(demo_path,-1)
plt.title("cv::IMREAD_UNCHANGED")
# cv::IMREAD_UNCHANGED 会保持原图的通道数
plt.imshow(withOut_image_1[:,:,::-1])

plt.subplot(1,3,3)
withOut_image_2 = cv2.imread(demo_path,128)
plt.title(" cv::IMREAD_IGNORE_ORIENTATION")
# cv::IMREAD_IGNORE_ORIENTATION输出单通道图像
plt.imshow(withOut_image_2)

在这里插入图片描述

在这里插入图片描述

参考:

  • https://docs.opencv.org/4.x/d8/d6a/group__imgcodecs__flags.html#ga61d9b0126a3e57d9277ac48327799c80
  • https://docs.opencv.org/4.x/d8/d6a/group__imgcodecs__flags.html#gga61d9b0126a3e57d9277ac48327799c80a34f91a514cd95127d8ba900840af548e

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/674998.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

车载以太网MACsec

车载以太网MACsec 1.概述 MACsec(Media Access Control Security)定义了基于 IEEE 802 局域网络的数据安全通信的方法。MACsec 可为用户提供安全的 MAC 层数据发送和接收服务,包括用户数据加密(Confidentiality)、数…

新浪股票接口获取历史数据

这两天做了一个调用新浪股票接口获取实时以及历史股票数据的应用,因为新浪没有公开关于其接口的官方文档,所以通过各种百度差了很多关于新浪股票接口的使用,不过大家基本都是转载或者直接复制,对于实时数据的获取讲的很详细&#…

Linux【系统学习】(shell篇)

第 1 章 Shell 概述 1)Linux 提供的 Shell 解析器有 Ubuntu 使用的是dash 2)bash 和 sh 的关系 3)Centos 默认的解析器是 bash 第 2 章 Shell 脚本入门 1)脚本格式 (结尾不是必须以 .sh 结尾,只是为了区…

《网络安全0-100》VPN 讲解

1、前言 VPN虽好可不要贪玩哦 2、VPN的概念和结构 VPN:虚拟专用网(virtual personal network)是利用internet等公共网络的基础设施,通过隧道技术,为用户提供的专用网络具有相同通信功能的安全数据通道。 ‘虚拟’是指用户无需建立各逻辑上的专用物理线…

​AVS3支持下的8K内容生产和传输应用实践

AVS标准经过20年发展,到AVS3这一代实现了国产标准从跟跑到领跑的突破。博雅睿视团队深度参与AVS3标准制定,开发的8K AVS3实时、离线编解码设备有力支持了我国8K超高清视频产业的落地和推广。 本次分享将会分为三个部分,第一部分重点介绍AVS标…

MusicGen配乐工具开源,教你怎么给抖音短视频配乐,助你涨粉1000!

大家好,我是千与千寻,好久不见了,很多粉丝私信我说,千寻哥这是去哪了?难道被野外捕捉了。 哈哈哈,当然不是了,千寻依然在学习ChatGPT的道路上和大家一起学习,一起搞钱! 但…

TC8:TCP_MSS_OPTIONS_05-09

TCP_MSS_OPTIONS_05: Illegal option length for MSS in a SYN-ACK segment 目的 TCP能够处理SYN+ACK报文段中MSS选项的长度非法,而不会崩溃 可以正常地响应,就是不崩溃,这里指的应该是DUT发送ACK 测试步骤 Tester:让DUT侧的应用程序发起主动open调用DUT:发送SYNTester:…

C++类和对象--构造函数和析构函数

0.前言 在我们写某些需要动态开辟内存空间的函数时候,会经常忘记初始化、销毁,而且有时候程序返回的情况很多,那么销毁函数写起来就会很繁琐,那么有没有什么办法解决这个问题呢?答案是:当然有!在…

Java类 继承

Java是一种面向对象的编程语言,类是Java中最基本的编程单元。一个类可以包含变量、方法和构造函数等。类的定义需要使用关键字class,例如: public class Person { private String name; private int age; public Person(St…

文心一言 VS 讯飞星火 VS chatgpt (44)-- 算法导论6.1 1题

一、在高度为h的堆中,元素个数最多和最少分别是多少? 文心一言: 在高度为 h 的二叉搜索树(BST)中,元素个数最多和最少的情况分别如下: 1.最多情况:当每个节点都包含两个子节点时&#xff0c…

CSS3-盒子模型-边距问题

1 清除默认内外边距 场景:浏览器会默认给部分标签设置默认的margin和padding,但一般在项目开始前需要先清除这些标签默认的margin和padding,后续自己设置 比如:body标签默认有margin:8px、p标签默…

一句提示词生成整个代码库——Gpt Engineer神级项目开源(附演示视频)

近日,一个名为Gpt Engineer神级项目开源,并迅速火爆全网。 短短几天内,该项目已经得到了25K的星星。 使用GPT-engineer进行人工智能软件开发,可以改变软件开发的未来。 在软件开发领域,一场巨大的革命正在开始。这一转…

【计算机视觉 | 目标检测】arxiv 计算机视觉关于目标检测的学术速递(6月 22 日论文合集)

文章目录 一、检测相关(9篇)1.1 Wildfire Detection Via Transfer Learning: A Survey1.2 Polygon Detection for Room Layout Estimation using Heterogeneous Graphs and Wireframes1.3 Exploiting Multimodal Synthetic Data for Egocentric Human-Object Interaction Detec…

前端中的相关概念

谁道人生无再少, 门前流水尚能西。 桃花落尽胭脂透, 庭院无声五更鸡。 —— 杜甫《端午节》 HTML中class属性 HTML中class属性是一种用于为元素定义样式和标识的属性,以下是class属性的几种常见用法实例,包括标识元素、定义样…

利用OpenCV计算条形物体的长度

0、前言 在图像处理中,我们可能会遇到求一个线条长度的场景,比如,现在有一条裂缝,需要求其长度,或者有一个长条形的零件需要知道其长度。 本文利用OpenCV和skimage两个库,提供了一个解决方案。 1、解决步…

贪心法与动态规划的对比分析

高级算法设计课程论文 题 目:贪心法与动态规划的对比分析 作者姓名: 作者学号: 专业班级: 提交时间: 2023/6/3 目 录 1 引言 1 2 分析过程 2 2.1多段图的最短路径问题 2 2.2最小生成树问题 4 3动态规划与贪心法的对…

【动态规划算法练习】day3

文章目录 一、931. 下降路径最小和1.题目简介2.解题思路3.代码4.运行结果 二、64. 最小路径和1.题目简介2.解题思路3.代码4.运行结果 三、面试题 17.16. 按摩师1.题目简介2.解题思路3.代码4.运行结果 总结 一、931. 下降路径最小和 1.题目简介 931. 下降路径最小和 题目描述&…

浅析 GeoServer CVE-2023-25157 SQL注入

原创稿件征集 邮箱:eduantvsion.com QQ:3200599554 黑客与极客相关,互联网安全领域里 的热点话题 漏洞、技术相关的调查或分析 稿件通过并发布还能收获 200-800元不等的稿酬 更多详情,点我查看! 简介 GeoServer是一个开…

十八、网络基础(一)

一、协议 (一)前置 协议其实是一种约定!!! 计算机之间的传输媒介是光信号和电信号 , 通过 " 频率 " 和 " 强弱 " 来表示 0 和 1 这样的信息 , 要想传递各种不同的信息 , 就需要约定好双方的数据…

(自己动手开发自己的语言练手级应用)JSON(JavaScript Object Notation) 产生式(BNF)

写自己的开发语言时&#xff0c;很多人都会拿JSON当第一个练习对象 开源net json FJSON 解析工具https://dbrwe.blog.csdn.net/article/details/107611540?spm1001.2014.3001.5502 <json> :: <object> | <array> <object> :: "{" [ <me…