景联文科技:高质量垂直领域数据集助力AI技术突破

news2024/11/27 20:38:54

随着人工智能技术的飞速发展,垂直领域数据集在提升模型性能、解决领域问题、推动创新应用以及提升竞争力等方面的重要性日益凸显。

提高模型性能:垂直领域数据集专注于特定任务或领域,使用这些数据集进行训练可以让模型更好地理解和解决特定领域的问题。

深入解决领域问题:垂直领域数据集通常包含丰富的专业知识和深度信息,这使得模型能够更深入地了解特定领域的问题。

推动创新应用:通过垂直领域数据集的训练,模型可以更好地适应特定领域的需求和规则,从而推动该领域的创新应用。

提升竞争力:对于企业和研究机构来说,拥有高质量的垂直领域数据集可以提升其在特定领域的竞争力。可以更好地理解市场需求、客户行为以及行业趋势,从而制定出更有效的商业策略。

景联文科技是AI基础数据行业的供应商,拥有丰富的垂直领域成品数据集。

一、自动驾驶领域成品数据集

部分数据样例如下:

1.2000000张DMS驾驶员行为视频训练集

采集设备:可见光和红外双目摄像头

车型要求:大众-桑塔纳、日产-轩逸、起亚-赛拉图、雪铁龙-爱丽舍,车型都是五年内的,每种车型平均

数据规模:2000000张图像,2000000个json文件

采集多样性:多年龄段、多时间段、多种行为(疲劳驾驶、副驾驶及后排座椅、未系安全带、抽烟、吃喝、后挡风玻璃置物台、主驾驶防护栏、中控台 、手持手机打电、中央扶手处、聊微信看视频)

2.5000个id1225900段车内录音采集数据集

采集规模:5000个id1225900段录音

采集设备及要求:专业录音设备进行录制,麦克风间距95mm

采集多样性:在汽车行驶过程中或静止状态时、开窗或关窗时、开空调或不开空调的情况下各录制一遍

录音内容为:口语类、新闻类

男女比例:1:1

年龄分布:年龄在20到50之间,20到30占30%,30到40占50%,40到50占20%。

语言:标准的普通话

二、智能安防领域成品数据集

部分数据样例如下:

1.225570张火焰标注图像训练集

采集设备:手机

数据规模:225570张png图像、22550个xml文件

采集多样性:多种室外场景

标注规则:分“flame、smoke、fire、cloud、leaf、fog、sunset、light 、sunlight”九类火焰做拉框标注,一张图上标注区域不超过三个

采集时间:白天、夜晚

2.1500段烟火视频数据集

采集设备:相机分辨率为1080p(200万),平角监控相机

数据规模:总共7500分钟左右,1500段视频,每段视频5分钟左右

采集内容:在5个工厂场景,5个仓库场景,5个办公楼场景下,分别在灯光、昏暗、正常光三种不同的光下采集大火、中火、小火三种不同的火势大小的视频

采集角度:多角度采集

采集环境:共15个场景,分别为5个工厂场景,5个仓库场景,5个办公楼场景

三、智慧城市垂直领域成品数据集

部分数据样例如下:

1.1200000张城市治理图像数据集

采集内容:采集城市道路上暴露垃圾、打包垃圾、单车违停、电动车违停、店外经营、垃圾桶满溢、乱堆废料、违规撑伞、违规户外广告、沿街晾晒 、游摊小贩、占道经营等12种场景数据  

采集设备:摄像头  

数据规模:1200000张图像,12类场景每类100000张

采集场景:暴露垃圾、打包垃圾、单车违停、电动车违停、店外经营、垃圾桶满溢、乱堆废料、违规撑伞、违规户外广告、沿街晾晒、游摊小贩、占道经营

采集要求:拍摄高度1.8-4.5米,拍摄距离15-20米

采集多样性:多种场景、不同时间段、不同拍摄角度

采集时间:白天、夜晚

2.10000张牵狗绳数据集

数据内容:不同人遛狗牵狗绳图片或视频,要求10个以上不同场景、10种以上不同狗

数据规模:10000张图像

采集犬类多样性:金毛、拉布拉多、哈士奇、柯基犬、萨摩耶犬等10余种

采集场景多样性:小区绿化带、小区道路、马路边等10余种

景联文科技支持定制采集标注服务。拥有来自不同领域的专家,可以对垂直领域的数据信息进行清洗,删除有害或者存在偏见的内容,从而确保训练数据的正确性,避免生成式AI模型产生偏见、错误信息或其他问题行为。

数据安全合规方面,景联文科技已通过ISO9001质量、ISO27001信息安全、ISO27701国际隐私安全管理认证,参与8项国家数据交换格式和数据安全标准制定。

为自动驾驶、智能安防、智慧城市等领域的全球数千家人工智能从业公司和高校科研机构交付海量、高质量的AI算法训练数据。

景联文科技|数据采集|数据标注

助力人工智能技术,赋能传统产业智能化转型升级

文章图文著作权归景联文科技所有,商业转载请联系景联文科技获得授权,非商业转载请注明出处。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1291533.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

安防音频接口选型的高性能国产芯片分析

在人工智能兴起之后,安防市场就成为了其全球最大的市场,也是成功落地的最主要场景之一。对于安防应用而言,智慧摄像头、智慧交通、智慧城市等概念的不断涌现,对于芯片产业催生出海量需求。今天,我将为大家梳理GLOBALCH…

得帆云助力容百科技构建CRM系统,实现LTC全流程管理

宁波容百新能源科技股份有限公司 宁波容百新能源科技股份有限公司(以下简称“容百科技”)于2014年9月建立,是高科技新能源材料行业的跨国型集团公司。专业从事锂电池正极材料的研发、生产和销售,于2019年登陆上交所科创板&#x…

CV计算机视觉每日开源代码Paper with code速览-2023.12.1

点击CV计算机视觉,关注更多CV干货 论文已打包,点击进入—>下载界面 点击加入—>CV计算机视觉交流群 1.【基础网络架构:Transformer】TransNeXt: Robust Foveal Visual Perception for Vision Transformers 论文地址:http…

Java聊天

一对一聊天 服务端 package 一对一用户;import java.awt.BorderLayout; import java.io.BufferedReader; import java.io.IOException; import java.io.InputStreamReader; import java.io.PrintWriter; import java.net.ServerSocket; import java.net.Socket; import java.…

【问题思考】泰勒公式证明题如何选展开点?【对称美】

我的证明题水平很烂,这个纯属让自己有一个初步的理解,恳请指正! 问题 我们可以看到这里有两种展开方式(注意:x0叫展开点),分别是正确的做法,在x0展开,然后将0和a代入fx中…

【JavaEE】生产者消费者模式

作者主页:paper jie_博客 本文作者:大家好,我是paper jie,感谢你阅读本文,欢迎一建三连哦。 本文于《JavaEE》专栏,本专栏是针对于大学生,编程小白精心打造的。笔者用重金(时间和精力)打造&…

【开源】基于JAVA的天沐瑜伽馆管理系统

项目编号: S 039 ,文末获取源码。 \color{red}{项目编号:S039,文末获取源码。} 项目编号:S039,文末获取源码。 目录 一、摘要1.1 项目介绍1.2 项目录屏 二、功能模块2.1 数据中心模块2.2 瑜伽课程模块2.3 课…

线程池基础参数和执行流程

线程池核心参数 1.corePoolSize:线程池中核心线程的个数。 2.maximumPoolSize:线程池中线程的总数。(线程总数核心线程数 救急线程数) 3. keepAliveTime:救急线程的存活时间。(救急线程空闲时的存活时间。) 4.unit:存活时间的…

numpy数据读取保存及速度测试

目录 数据保存及读取 速度比对测试 数据保存及读取 代码示例: # 导入必要的库 import numpy as np # 生成测试数据 arr_disk np.arange(8) # 打印生成能的数据 print(arr_disk) # numpy保存数据到本地 np.save("arr_disk", arr_disk) # 加载本地数据…

gpt3、gpt2与gpt1区别

参考:深度学习:GPT1、GPT2、GPT-3_HanZee的博客-CSDN博客 Zero-shot Learning / One-shot Learning-CSDN博客 Zero-shot(零次学习)简介-CSDN博客 GPT-2 模型由多层单向transformer的解码器部分构成,本质上是自回归模型…

软件系统应用开发安全指南

2.1.应用系统架构安全设计要求 2.2.应用系统软件功能安全设计要求 2.3.应用系统存储安全设计要求 2.4.应用系统通讯安全设计要求 2.5.应用系统数据库安全设计要求 2.6.应用系统数据安全设计要求 全资料获取进主页。

C、C++、C#的区别概述

C、C、C#的区别概述 https://link.zhihu.com/?targethttps%3A//csharp-station.com/understanding-the-differences-between-c-c-and-c/文章翻译源于此链接 01、C语言 ​ Dennis Ritchie在1972年创造了C语言并在1978年公布。Ritchie设计C的初衷是用于开发新版本的Unix。在那之…

关于DWC OTG2.0中PFC的理解

在DWC OTG2.0 Controller手册中,有一章节专门介绍了PFC,Packet FIFO Controller。其内部分为共享FIFO(shared FIFO)以及专用FIFO(Dedicated FIFO),并针对dev和host两种模式,并且还要…

IT行业软件数据文件传输安全与高效是如何保障的?

在当今迅速发展的科技世界中,云计算、大数据、移动互联网等信息技术正迎来蓬勃发展,IT行业正置身于一个全新的世界。数据不仅是最重要的资产,也是企业竞争力的核心所在。然而,如何缩短信息共享时间、高速流转数据、跨部门/跨区域协…

智能优化算法应用:基于鹰栖息算法无线传感器网络(WSN)覆盖优化 - 附代码

智能优化算法应用:基于鹰栖息算法无线传感器网络(WSN)覆盖优化 - 附代码 文章目录 智能优化算法应用:基于鹰栖息算法无线传感器网络(WSN)覆盖优化 - 附代码1.无线传感网络节点模型2.覆盖数学模型及分析3.鹰栖息算法4.实验参数设定5.算法结果6.参考文献7.…

Linux--文件权限与shell外壳的理解

目录 一.Linux的用户与用户切换,提权 二.对文件权限的理解 1.文件权限角色的权限文件属性 2.Linux中的三种角色 3.为什么会存在所属组这个角色 4.文件属性的意义 4.1.第一个字母的意义 4.2 第2——第10个字母的意义 4.3修改文件权限的方法 三.目录权限 四…

记录 | linux手动清理 buff/cache

linux下手动清理 buff/cache 切换到 root 权限 # 这个drop_caches文件可以设置的值分别为1、2、3 echo 1 > /proc/sys/vm/drop_caches # 表示清除pagecache echo 2 > /proc/sys/vm/drop_caches # 表示清除回收slab分配器中的对象(包括目录项缓存和inode缓…

idea报错——Access denied for user ‘root‘@‘localhost‘ (using password: YES)

项目场景: 使用idea启动SpringBoot项目报错,可以根据提示看到是数据库的原因,显示使用了密码,具体报错信息如下: 解决方案: 第一步:先去配置文件里面查看连接MySQL的url是否正确,如果…

代码随想录算法训练营第四十二天 _ 动态规划_01背包问题、416.分割等和子集。

学习目标: 动态规划五部曲: ① 确定dp[i]的含义 ② 求递推公式 ③ dp数组如何初始化 ④ 确定遍历顺序 ⑤ 打印递归数组 ---- 调试 引用自代码随想录! 60天训练营打卡计划! 学习内容: 二维数组处理01背包问题 听起来…

Node.js快速搭建简单的HTTP服务器并发布公网远程访问

文章目录 前言1.安装Node.js环境2.创建node.js服务3. 访问node.js 服务4.内网穿透4.1 安装配置cpolar内网穿透4.2 创建隧道映射本地端口 5.固定公网地址 前言 Node.js 是能够在服务器端运行 JavaScript 的开放源代码、跨平台运行环境。Node.js 由 OpenJS Foundation&#xff0…