Kaggle训练模型教程

2,307 阅读2分钟

Kaggel官网:Kaggle

模型代码&数据集地址(仅做演示使用):pan.baidu.com/s/1eMbsYVx5…

前置条件:可以使用谷歌浏览器

1、登录

建议使用谷歌账号登录

image-20240506110648719.png

image-20240506110720086.png

image-20240506110913731.png

数据集、模型代码、运行代码(notebook)位置如侧边栏所示,在Your Work可以看到自己上传的数据集、模型代码、运行代码(notebook)

image-20240506112358912.png

2、开启GPU权限

账号第一次登录kaggle,在Session options内没有GPU可选项,需要手机号验证后才能使用

image-20240507160352843.png

打开Home页面,点击右上角头像,进入设置,验证手机号

image-20240507160442891.png

image-20240507160600035.png

手机号直接使用国内的+86类型号码,人机身份验证需要魔法上网

image-20240507160606465.png

image-20240507160836181.png

image-20240507160843688.png

验证成功效果图示

image-20240507160900775.png

Kaggle每周只能使用30hGPU

image-20240507161810127.png

image-20240507160919265.png

3、新建数据集、模型、notebook

  • kaggle根路径:kaggle/
  • 挂载数据集、模型的路径:kaggle/input/
  • 输出路径:kaggle/working/

3.1、新建数据集

建议设置公开(多账号可以直接使用)

image-20240506145624472.png

image-20240506160727239.png

数据集上传较慢,耐心等待

image-20240506160745719.png

image-20240506150257584.png

查看上传成功的数据集

image-20240506164300878.png

3.2、新建模型

修改模型代码。运行和保存文件的路径容易出错,路径以notebook复制的为准。

image-20240506153829852.png

image-20240506153906977.png

新建模型

image-20240506123229169.png

填写模型名称、是否选择公开展示(有多个账号需要同时使用时,建议公开)、选择模型框架

image-20240506123416221.png

image-20240506123729600.png

上传模型

image-20240506123829393.png

image-20240506123935583.png

上传完成

image-20240506124027645.png

查看上传成功的模型

image-20240506124125799.png

image-20240506124202423.png

增加、删除模型代码

image-20240506130337901.png

image-20240506130434608.png

3.3、新建 notebook

image-20240506124809919.png

image-20240506125610060.png

一般情况,除GPU外,其他选项不需要改动

image-20240506125937014.png

ACCELERATOR选择NONE是CPU环境(可用于调试),T4*2性能小于P100,使用GPU时建议直接选择P100。

4、运行代码

4.1、notebook挂载数据集、模型

image-20240506150655053.png

image-20240506164851504.png

image-20240506151059845.png

image-20240506151119888.png

查看已挂载的数据集和模型

image-20240506173031945.png

4.2、运行

开启GPU,进行代码调试

image-20240506165333763.png

调试运行成功后,离线运行(离线运行后可以关闭网页,不影响训练进程)

image-20240506165431047.png

使用GPU离线运行

image-20240506165527526.png

离线运行成功图示

image-20240506170105961.png

查看离线运行状态

image-20240506170132560.png

image-20240506165800070.png

image-20240506165953176.png

手动停止

image-20240506170201139.png

PS:Kaggle每次使用时长是12小时,到时间自动停止

image-20240506170257862.png