在人工智能的浪潮中,语料数据如同建筑的基石,其质量、规模和运用策略直接决定了AI模型的表现和应用的广泛性。
景联文科技在AI领域深耕多年,打磨了高质量多模态数据集,致力于为不同训练阶段的算法精准匹配高质量数据资源。
3000万张图像数据集
数据详情:3000万张图像,图像内容来源于真实世界;图像内容合法合规,不涉及敏感数据。
图片规格:7680*4320以上,长宽比∈[0.5,2],PNG、JPG格式。
图像质量:纹理细节丰富;图像信噪比高,噪声低;图像无水印;风格真实,色调自然;图像内容干净无歧义;构图较好,美感较好;图像边缘不出现黑框、白框,图像非黑白照;图像非拼图或合成图,纯色背景(影棚)不超过1%。
场景多样性:覆盖场景包括动物,植物,建筑,建材,静物,食物,人像; 动物,植物,建筑,建材,静物,食物,人像类别占比超过80%,且各个类别分布相对均匀。
光照条件:正常光照条件下(非阴天、逆光、夜景)拍摄的图像,或者摄影专用灯光环境下拍摄图片。
图像标签:提供图像的场景描述/内容主体类别描述;光照分类标签;提供拍摄信息描述:拍摄角度(例如微距特写,广角、正面、侧拍、俯拍等);提供相机参数描述,包含光圈信息(f14,f16,f22等),滤镜信息(渐变滤镜,色彩滤镜,UV滤镜等),曝光信息(双重曝光,多重曝光等),焦段信息(24mm,35mm等)等,exif信息不做强制要求。
100万条特写视频数据集
数据数量:100万条视频
数据格式:短边分辨率≥1080P,mp4、mkv格式。
数据多样性:
1)人物:全身/半身/脸部表情特写
2)风景:自然景观、气候
3)动物:萌宠、动物特写、类似《动物世界》
4)植物:植物生长、微距镜头、昆虫
5)建筑:人文建筑运镜
100万条航拍视频数据集
数据详情:100万条视频
1)俯拍视角数据:自然风景、城市人文风景
2)跟随环绕画面
3)无人机及穿越机穿梭视角数据
数据格式:短边分辨率≥1080P,mp4、mkv格式。
画面内容:
1.有镜头语言:推、拉、摇、移、升、降、跟随、环绕、变焦等大幅度运镜,画面流畅无抖动。
2.光线充足不欠曝或过曝,噪声低,画质锐利,色彩正确(非黑白无偏色)。
200万条虚拟渲染视频
数据详情:200万条视频
数据格式:短边分辨率≥1080P,mp4、mkv格式;
画面内容:
1.非固定视角,视角环绕人物(人物静止、人物运动)、视角跟随人物 (第三人称);物体/场景:视角环绕物体、视角在场景中穿梭。
2.光线充足不欠曝或过曝,噪声低,画质锐利,色彩正确(非黑白无偏色)。
在数据安全与合规方面,景联文科技已通过ISO9001质量、ISO27001信息安全、ISO27701国际隐私安全管理认证,积极参与8项国家数据交换格式和数据安全标准制定,牢固构筑数据保护的基石。
获取样例请登录景联文科技官网咨询客服。https://www.jinglianwen.com/ai/
或直接发送需求至邮箱:lx@jinglianwen.com
景联文科技|数据采集|数据标注|多模态数据集
助力人工智能技术,赋能传统产业智能化转型升级
文章图文著作权归景联文科技所有,商业转载请联系景联文科技获得授权,非商业转载请注明出处。