Kaggle下载数据
从Kaggle网站下载数据,要么点击页面中的Download按钮,要么找到下面形式的命令
kaggle competitions download -c xxxxxxxx
用命令行工具下载。
下载的前提:接受规则
在数据集的下方,往往有“接受规则”的选项,点击"I Understand and Accept"即可。
特别提醒:如果你的kaggle账号没有验证手机号,是无法成功接受规则的。
未接受规则时,命令行下载会报错:
403 - forbidden - You must accept this competition's rules before you'll be able to download files.
使用Download All
按钮下载也只会下载一个rules.htm
,而不是真正的数据压缩包。
命令行下载
命令行下载工具由kaggle库提供,因此首先需要安装它:
pip install kaggle
下载数据前需要先下载kaggle.json:
访问链接https://www.kaggle.com/settings/account
,点击Create New Token
,即可下载kaggle.json
。
下载kaggle.json后,把它放到C:/Users/用户名/.kaggle/目录下。否则命令行下载会报下图所示的错误:
OSError: Could not find kaggle.json. Make sure it's located in C:\Users\用户名\.kaggle. Or use the environment method.
点击Download All下载
完成手机号验证、接受规则后,点击按钮即可直接下载数据。