【Colab】【使用外部数据的7种方法】

1,065 阅读1分钟

本文已参与「新人创作礼」活动,一起开启掘金创作之路。

方法1:通过Files explorer上传

点击Notebook的Files explorer面板:

在这里插入图片描述

然后点击上传按钮:

在这里插入图片描述

当上传结束后,就可以直接读取:

在这里插入图片描述

方法2:使用Colab files上传

输入并运行下面代码:

from google.colab import files
uploaded = files.upload()

在这里插入图片描述

然后就可以选择对应的文件,完成上传:

在这里插入图片描述

方法3:读取Github链接

在github页面找到对应的文件路径,注意是文件的Raw链接:

在这里插入图片描述

然后将链接写到对应的位置。

方法4:克隆Github项目

先从命令行下载项目:

!git clone https://github.com/BindiChen/machine-learning.git

然后从对应的路径完成数据读取。

在这里插入图片描述

方法5:使用wget/axel下载文件

在Notebook中可以使用Linux系统命令,可以使用wgetaxel下载数据:

在这里插入图片描述

方法6:读取谷歌硬盘数据

挂载了谷歌硬盘后,写好路径完成读取:

在这里插入图片描述

在这里插入图片描述

方法7:Kaggle API完成数据下载

详细步骤可以参考以前的文章【Colab】连接【Kaggle】使用Kaggle数据集/文CSDN@AXDLMG7

首先在Kaggle账户的Kaggle API,点击Create New API Token,会下载一个kaggle.json文件。

在这里插入图片描述

kaggle.json文件上传后,就可以使用kaggle-api下载比赛数据或者数据集。

!kaggle competitions download -c titanic
!kaggle datasets download -d alexanderbader/forbes-billionaires-2021-30

在这里插入图片描述

Reference

微信公众号@Coggle数据科学