数据集相关网站(Open datasets and sources)

news2024/9/27 19:22:02

数据集相关网站(Open datasets and sources)

  • 数据集网站 Open datasets and sources
    • 政府数据网站 Government Data:
    • 金融数据网站 Financial Data Sources:
    • 犯罪数据网站 Crime Data:
    • 健康数据网站 Health Data:
    • 学术和商业数据网站 Academic and Business Data:
    • 其他数据集网站Other:
  • 数据集许可证 Dataset licenses

数据集网站 Open datasets and sources

在这里插入图片描述

政府数据网站 Government Data:

  • https://www.data.gov/ — 美国政府公开数据网站
  • https://www.census.gov/data.html
  • https://data.gov.uk/ – 英国政府公开数据网站
  • https://www.opendatanetwork.com/ – 一个美国各种数据的搜索网站
  • https://data.un.org/ – 联合国公开数据,可以查看全球各个国家的人口、教育、医疗、健康、经济等多种数据。
  • https://data.stats.gov.cn/ – 中国国家统计局数据查询网站

金融数据网站 Financial Data Sources:

  • https://data.worldbank.org/ – 世界银行公开数据网站
  • https://www.globalfinancialdata.com/ – 全球金融数据网站
  • https://comtrade.un.org/ – 联合国商品贸易统计数据库
  • https://www.nber.org/ – 美国国家经济研究局
  • https://fred.stlouisfed.org/ – 美联储经济数据,可以查找美国各个地区,各个行业等多种数据。

犯罪数据网站 Crime Data:

  • https://www.fbi.gov/services/cjis/ucr – 美国联邦调查局犯罪信息数据
  • https://www.icpsr.umich.edu/icpsrweb/content/NACJD/index.html – 美国国家刑事司法数据档案馆
  • https://www.drugabuse.gov/related-topics/trends-statistics – 美国国立卫生研究院数据网站
  • https://www.unodc.org/unodc/en/data-and-analysis/ – 联合国毒品和犯罪数据网站

健康数据网站 Health Data:

  • https://www.who.int/gho/database/en/ – 全球卫生健康观察网站,有全球的卫生健康方面的数据
  • https://www.fda.gov/Food/default.htm – 美国食品和药物管理局
  • https://seer.cancer.gov/faststats/selections.php?series=cancer – 癌症相关数据,美国政府网站
  • https://www.opensciencedatacloud.org/ – 开放科学数据云网站,需要注册
  • https://pds.nasa.gov/ – NASA行星数据,大气、行星相关数据。
  • https://earthdata.nasa.gov/ – NASA地球数据,地表面积、海洋、生物圈、人口等地球层面的数据。
  • https://www.sgim.org/communities/research/dataset-compendium/public-datasets-topic-grid – 普通内科协会网站,有医学相关的各种数据

学术和商业数据网站 Academic and Business Data:

  • https://scholar.google.com/ – 谷歌学术,需要梯子
  • https://nces.ed.gov/ – 美国国家教育统计中心,需要梯子
  • https://www.glassdoor.com/research/ – 玻璃门经济研究网站,主要数据内容针对:工作、薪水、福利、公司评论、招聘、薪酬和广泛经济方面的重要趋势。
  • https://www.yelp.com/dataset – 提供企业、大都市、图片等数据资源,网站打开的有些慢,有梯子会快一些

其他数据集网站Other:

  • https://www.kaggle.com/datasets – 大家都知道

  • https://www.reddit.com/r/datasets/ – 需梯子。。

  • https://www.datacastle.cn/dataset_list.html – datacastle网站,有数据竞赛,也可以下载数据集,国内网站

  • https://tianchi.aliyun.com/dataset/ – 阿里云天池数据网站,阿里的数据科学赛事平台。

  • https://connect.huaweicloud.com/courses/learn/aiModel?resourceType=dataset – 华为云大赛,数据集下载,华为的数据赛事平台

数据集许可证 Dataset licenses

  • 选择数据集时,有必要查看许可证。许可证说明您是否可以使用该数据集;或解释您是否必须接受某些准则才能使用该数据集。下面列出了不同的许可证类型。

PUBLIC DOMAIN MARK - PUBLIC DOMAIN

  • 当数据集具有公共领域许可时,使用、访问、修改和共享数据集的所有权利均向所有人开放。从技术上讲,这里没有许可证。

OPEN DATA COMMONS PUBLIC DOMAIN DEDICATION AND LICENSE – PDDL

  • 开放数据共享许可证与公共领域许可证具有相同的功能,但不同之处在于PDDL许可证使用许可机制来授予数据集的权利。

CREATIVE COMMONS ATTRIBUTION 4.0 INTERNATIONAL CC-BY

  • 此许可证允许用户共享和修改数据集,但前提是他们向数据集的创建者提供功劳。

COMMUNITY DATA LICENSE AGREEMENT – CDLA PERMISSIVE-2.0

  • 与大多数开源许可证一样,此许可证允许用户使用、修改、改编和共享数据集,但前提是还包括免责声明和责任。

OPEN DATA COMMONS ATTRIBUTION LICENSE - ODC-BY

  • 此许可证允许用户共享和改编数据集,但前提是他们向数据集的创建者致谢。

CREATIVE COMMONS ATTRIBUTION-SHAREALIKE 4.0 INTERNATIONAL - CC-BY-SA

  • 此许可证允许用户使用、共享和改编数据集,但前提是他们授予数据集信用并显示他们对数据集所做的任何更改或转换。用户可能不想使用此许可证,因为他们必须共享他们在数据集上所做的工作。

COMMUNITY DATA LICENSE AGREEMENT – CDLA-SHARING-1.0

  • 该许可证使用“copyleft”原则:用户可以使用,修改和改编数据集,但前提是他们不对使用数据集创建的新作品添加许可证限制。

OPEN DATA COMMONS OPEN DATABASE LICENSE - ODC-ODBL

  • 此许可证允许用户使用、共享和改编数据集,但前提是他们为数据集提供信用并显示他们对数据集所做的任何更改或转换。用户可能不想使用此许可证,因为他们必须共享他们在数据集上所做的工作。

CREATIVE COMMONS ATTRIBUTION-NONCOMMERCIAL 4.0 INTERNATIONAL - CC BY-NC

  • 此许可证是限制性许可证。用户可以共享和改编数据集,前提是他们将其归功于其创建者并确保数据集不用于任何商业目的。

CREATIVE COMMONS ATTRIBUTION-NO DERIVATIVES 4.0 INTERNATIONAL - CC BY-ND

  • 此许可证也是限制性许可证。如果用户将功劳归功于数据集的创建者,则可以共享数据集。此许可不允许对数据集进行添加、转换或更改。

CREATIVE COMMONS ATTRIBUTION-NONCOMMERCIAL-SHAREALIKE 4.0 INTERNATIONAL - CC BY-NC-SA

  • 此许可证允许用户仅在将数据集的创建者归功于数据集时共享数据集。用户可以共享数据集的添加、转换或更改,但不能将数据集用于商业目的。

CREATIVE COMMONS ATTRIBUTION-NONCOMMERCIAL-NODERIVATIVES 4.0 INTERNATIONAL - CC BY-NC-ND

  • 此许可证允许用户仅在将数据集的创建者归功于数据集时共享数据集。用户不得修改数据集,也不得将其用于商业目的。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/838303.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Linux下进程的特点与环境变量

目录 进程的特点 进程特点的介绍 进程时如何实现并发性的 进程间如何切换 概念铺设 PC指针 上下文 环境变量 PATH 修改PATH HOME SHELL env 命令行参数 什么是命令行参数? 打印命令行参数 通过函数获得环境变量 getenv 命令行参数 env 修改环境变…

Compose:从重组谈谈页面性能优化思路,狠狠优化一笔

作者:晴天小庭 前言: 随着越来越多的人使用Compose开发项目的组件或者页面,关于使用Compose构建的组件卡顿的反馈也愈发增多,特别是LazyColumn这些重组频率较高的组件,因此很多人质疑Compose的性能过差,这…

flask服务生成证书文件,采用https访问,开启用户密码验证

openssl req -x509 -newkey rsa:4096 -nodes -out cert.pem -keyout key.pem -days 3072开启用户密码验证 auth.verify_password def verify_password(username, password):if username abcdefg and password 1234546:return usernameapp.route(/post_request, methods[POST…

HDFS中的Federation联邦机制

HDFS中的Federation联邦机制 当前HDFS体系架构--简介局限性 联邦Federation架构简介好处配置示例 当前HDFS体系架构–简介 当前的HDFS结构有两个主要的层: 命名空间(namespace) 由文件,块和目录组成的统一抽象的目录树结构。由n…

JavaScript |(五)DOM简介 | 尚硅谷JavaScript基础实战

学习来源:尚硅谷JavaScript基础&实战丨JS入门到精通全套完整版 文章目录 📚DOM简介📚DOM查询🐇文档的加载🐇节点🐇节点的属性🐇元素节点的子节点🐇获取父节点和兄弟节点&#x1…

4,链表【p5】

链表 4.1哈希表简介4.2有序表简介4.3链表4.3.1例1-反转单向和双向链表4.3.2例2-打印两个有序链表的公共部分4.3.3面试时链表解题的方法论4.3.4例3-判断一个链表是否为回文结构4.3.4.1快慢指针 4.3.5例4-将单向链表按某值划分成左边小、中间相等、右边大的形式4.3.6例5-复制好友…

redis 原理 7:开源节流 —— 小对象压缩

Redis 是一个非常耗费内存的数据库,它所有的数据都放在内存里。如果我们不注意节约使用内存,Redis 就会因为我们的无节制使用出现内存不足而崩溃。Redis 作者为了优化数据结构的内存占用,也苦心孤诣增加了非常多的优化点,这些优化…

【JavaEE初阶】了解JVM

文章目录 一. JVM内存区域划分二. JVM类加载机制2.1 类加载整体流程2.2 类加载的时机2.3 双亲委派模型(经典) 三. JVM垃圾回收机制(GC)3.1 GC实际工作过程3.1.1 找到垃圾/判定垃圾1. 引用计数(不是java的做法,Python/PHP)2. 可达性分析(Java的做法) 3.1.2 清理垃圾1. 标记清除2…

CMake:检测python解释器和python库

CMake:检测python解释器和python库 导言检测python解释器CMakeLists.txt输出附录 检测python库项目结构CMakeLists.txt相关源码附录 导言 python是一种非常流行的语言。许多项目用python编写的工具,从而将主程序和库打包在一起,或者在配置或构建过程中使…

企业集团员工内部食堂餐厅食材预定订餐统计系统开发

内部食堂是针对员工食堂设计的预定系统 可以提前进行点餐,统计餐食人数 定量制作,避免浪费食材。 首页预定菜单提前显示一周菜单 用户可以提前预定想要购买的餐品 在用餐时取餐核销 食堂平台方用餐时对用户的菜品进行核销 通过后台预订信息 根据报餐统计做出对应数量…

Example: Beam Allocation in Multiuser Massive MIMO阅读笔记一

文章目录 A Machine Learning FrameworkApplication of Supervised Learning to Resource AllocationResearch Challenges and Open IssuesLow-Complexity ClassifierMulti-BS CooperationFast Evolution of Scenarios Conclusion A Machine Learning Framework 对于现有的云计…

python在函数中更改外部变量值

目录 前言 列表、字典(可变对象) 元组(不可变对象) 全局变量 前言 今天在写LeetCode题时,发现一个问题我并没有掌握,那就是如何在Python的函数中更改变量值(包括列表,字典&…

C++ - 模板分离编译

模板分离编译 我们先来看一个问题&#xff0c;我们用 stack 容器的声明定义分离的例子来引出这个问题&#xff1a; // stack.h // stack.h #pragma once #include<deque>namespace My_stack {template<class T, class Container std::deque<T>>class stack…

Python 开发工具 Pycharm —— 使用技巧Lv.3

单步执行调试 1&#xff1a; 鼠标左键单击红点是断点行 2&#xff1a;甲虫样式是进行调试方式运行&#xff0c;鼠标左键单击点击 3&#xff1a; 单步运行图标&#xff0c;点击让程序运行一行 4&#xff1a; 步入步出&#xff0c;可以进入当前代码行函数内 5&#xff1a;重新运行…

JSON.stringify()与JSON.parse()没有你想的那样简单

重新学习这两个API的起因 在本周五有线上的项目&#xff0c;16:30开始验证线上环境。 开始都是顺顺利利&#xff0c;一帆风顺。 大概17:50左右&#xff0c;我正在收拾东西。 准备下班去王者峡谷骑着我的船溜达一圈。 可是天降意外&#xff0c;给我派了一个bug。 测试给我说&am…

山西电力市场日前价格预测【2023-08-06】

日前价格预测 预测明日&#xff08;2023-08-06&#xff09;山西电力市场全天平均日前电价为411.77元/MWh。其中&#xff0c;最高日前电价为457.52元/MWh&#xff0c;预计出现在19: 30。最低日前电价为370.37元/MWh&#xff0c;预计出现在13: 15。 价差方向预测 1&#xff1a; 实…

海外应用商店优化实用指南之关键词

和SEO一样&#xff0c;关键词是ASO中的一个重要因素。就像应用程序标题一样&#xff0c;在Apple App Store和Google Play中处理应用程序关键字的方式也有所不同。 关键词研究。 对于Apple&#xff0c;我们的所有关键词只能获得100个字符&#xff0c;Google Play没有特定的关键…

数据结构10 -查找_树表查找

创建二叉搜索树 二叉搜索树 二叉搜索树是有数值的了&#xff0c;二叉搜索树是一个有序树。 若它的左子树不空&#xff0c;则左子树上所有结点的值均小于它的根结点的值&#xff1b; 若它的右子树不空&#xff0c;则右子树上所有结点的值均大于它的根结点的值&#xff1b; 它…

47.Linux学习day01 基础命令详解1(很全面)

目录 一、Linux和Windows的区别 二、Linux系统目录结构 常见目录说明 三、Linux常见的基础命令 1.pwd 2.cd 3.ls 4.man 5. touch 6.mkdir 7. rmdir 今天正式学习了linux的一些基础操作和基础知识&#xff0c;以及linux和windows的区别。 一、Linux和Windows的区…

SpringMVC基于SpringBoot的最基础框架搭建——包含数据库连接

SpringMVC基于SpringBoot的最基础框架搭建——包含数据库连接 背景目标依赖配置文件如下项目结构如下相关配置如下启动代码如下Controller如下启动成功接口调用成功 背景 工作做了一段时间&#xff0c;回忆起之前有个公司有线下笔试&#xff0c;要求考生做一个什么功能&#x…