通过命令行下载kaggle数据

0 阅读1分钟

安装并配置Kaggle API

安装 kaggle 命令行工具

在你当前的项目环境中安装 kaggle 命令行工具 pip install kaggle

创建 Legacy API 凭证

点击右上角头像->Your API tokens

最下面找到 Legacy API Credentials

点击 Create Legacy API Key ,之后便会下载得到一个 kaggle.json 文件,这就是你的 Legacy API 文件

配置凭证

Colab

如果使用 colab 可以直接通过运行

from google.colab import files
files.upload()

来上传kaggle.json文件到pwd 然后运行

!mkdir -p ~/.kaggle
!cp kaggle.json ~/.kaggle/
!chmod 600 ~/.kaggle/kaggle.json

来将凭证放在系统默认查找路径,并收紧权限(Kaggle API 强制安全要求)

自己的服务器或者主机

可以通过复制 kaggle.json文件中的内容来自己配置凭证

mkdir -p ~/.kaggle
nano ~/.kaggle/kaggle.json

然后将之前下载好的 kaggle.json 中的内容输入进去即可,内容通常是{"username":"你的名字","key":"一串数字字母"}

然后赋予安全权限

chmod 600 ~/.kaggle/kaggle.json

下载数据

kaggle competitions download -c <比赛名> -f <文件名>

即可下载指定的数据文件了