问题
环境
python=3.8
wandb=0.13.10
transformers=4.26.1
报错信息
停止主程序的训练后,终端不断跳出如下信息
wandb: \ 0.007 MB of 0.007 MB uploaded (0.000 MB deduped)07 MB of 0.007 MB uploaded (0.000 MB deduped)
通过ps -ef | grep wandb
发现wandb-service
进程没有没停掉,但是由于其父进程被停止,其父进程转移给了进程号1
。
解决方法
安装旧版本的包
经测试wandb==0.12.18
无此问题发生