在日常开发与科研工作中,本地设备的 GPU 算力不足是一个普遍存在的痛点,尤其是在运行深度学习模型训练、大规模数据处理、复杂数值模拟这类算力密集型任务时,往往会面临运行卡顿、耗时过长甚至无法启动的问题。而云端 GPU 租用服务的兴起,恰好为这类问题提供了高效且高性价比的解决方案 —— 无需投入高昂成本购置专业硬件,也无需进行复杂的本地硬件维护,只需按需租用云端算力,就能快速获取强劲的 GPU 支持,轻松支撑各类高负载代码的顺畅运行。本文将以在便宜好用的算力平台(SmoothCloud 润云:www.smoothcloud.com.cn/)为例,详细讲解从租用… GPU 实例,到配置 PyCharm 远程连接,最终成功运行代码的完整流程,全程实操无踩坑,新手也能轻松上手。
一、前期准备
注册并登录 SmoothCloud 润云平台账号,完成实名认证与账户小额充值(平台支持多种便捷支付方式,操作流程简洁高效,充值后即可按需租用 GPU 实例)。 本地设备安装 PyCharm(推荐专业版,支持完整的远程开发功能;社区版可通过插件补充,本文以专业版为例进行演示)。 本地设备安装 SSH 客户端(Windows 系统可通过 PowerShell、Xshell;Mac/Linux 系统自带终端 SSH 功能,无需额外安装,满足远程连接验证需求即可)。
二、第一步:租用润云平台 GPU 实例并验证连通性
2.1 选择合适的 GPU 实例规格
-
登录润云平台后,进入「云服务器」或「GPU 算力池」核心模块(平台界面布局清晰,核心功能入口直观易懂)。
-
点击「创建实例」,进入实例配置页面,根据自身业务需求筛选配置项,重点关注以下几点:
地域与可用区:平台国内覆盖 20 + 省市,优先选择与自身网络所在地相近的地域,依托其超低延迟优势,保障后续代码与数据传输的流畅性(如华东、华南节点都是使用率较高的选择)。
GPU 型号:平台提供高性能推理卡(算力≥5090,显存 32GB、内存 48GB)、高性能训练卡(算力≥H200,显存 128GB+、内存 200GB)等多种规格,深度学习模型训练与推理推荐推理卡或基础训练卡,超大参数模型(如满血版 DeepSeek 671B)训练可选择高规格训练卡。
镜像环境:推荐选择平台预装的深度学习镜像,可省去后续手动配置环境的大量时间;若有自定义环境需求,也可选择纯净 Ubuntu/CentOS 镜像自行搭建,平台还支持镜像快速克隆与部署功能,方便环境复用。
CPU / 内存 / 存储:平台会根据所选 GPU 型号给出配套推荐配置,无需盲目自行选择,存储建议优先选择 SSD,保障数据读写速度,支撑高效运算。
网络配置:务必开启公网 IP(这是后续实现远程连接的前提),带宽根据需求选择(推荐 10M 以上,能有效提升代码、数据的传输效率,减少等待时间)。
3.配置完成后,确认订单并完成支付,等待实例创建(通常 1分钟即可完成,创建过程中可在「实例列表」实时查看进度,状态更新及时)。平台支持按需计费,启停随心,后续无需使用时可随时停止,避免不必要的费用消耗。
2.2 获取 GPU 实例的远程连接核心信息
实例创建成功后,在「实例列表」中找到对应的 GPU 实例,点击「详情」,重点记录以下 4 项核心信息(后续远程连接 PyCharm 的关键,建议整理在记事本中备用):
- 公网 IP 地址(如:123.45.67.89)。
- SSH 端口(默认 22,若手动修改过需记录自定义端口)。
- 登录用户名(通常为 root,或镜像预设的用户名如 ubuntu,平台会清晰标注)。
- 登录密码 / 密钥对(若创建实例时选择密码登录,直接记录密码;若选择密钥对,需妥善保存本地私钥文件(.pem 格式),避免丢失)。
2.3 验证 SSH 连通性(可选,保障后续流程顺畅)
为避免后续 PyCharm 连接出现网络问题,建议先通过本地终端验证能否成功 SSH 登录 GPU 实例,操作步骤如下:
1.打开 Windows(PowerShell)/Mac/Linux(终端)命令行工具。
2.若为密码登录,输入以下命令: bash
运行
3.若为密钥对登录,输入以下命令:
bash
运行
三、第二步:配置 PyCharm 远程开发环境
3.1 配置 SSH 远程服务器(PyCharm 端)
-
打开本地 PyCharm,点击顶部菜单栏「File」->「Settings」(Windows)或「PyCharm」->「Preferences」(Mac),进入设置界面。
-
在左侧导航栏中,展开「Tools」->「SSH Configurations」,点击右侧「+」号,新建 SSH 配置。
-
在弹出的配置窗口中,填写以下信息:
3.1「Name」:自定义配置名称(如「Cloud GPU - SmoothCloud」,方便后续识别)。
3.2「Host」:填写之前记录的 GPU 实例公网 IP 地址。
3.3「Port」:填写 SSH 端口号(默认 22)。
3.4「User name」:填写登录用户名。
3.5「Authentication type」:选择对应的认证方式(「Password」密码认证或「Key pair」密钥对认证)。
3.5.1 若选择密码认证,直接在「Password」栏填写登录密码。
3.5.2 若选择密钥对认证,点击「Browse」选择本地保存的私钥文件(.pem 格式)。
4.填写完成后,点击底部「Test Connection」测试连接,若提示「Connection successful」,说明 SSH 服务器配置成功;若提示连接失败,可检查 IP、端口、用户名或认证信息是否填写正确,或验证本地网络是否通畅。
3.2 配置远程 Python 解释器
1.继续在 PyCharm 设置界面,左侧导航栏展开「Project」->「Python Interpreter」。
2.点击右侧当前解释器旁边的下拉箭头,选择「Add Interpreter」->「On SSH」。
3.在弹出的窗口中,选择之前已经配置成功的 SSH 服务器(即第一步新建的「Cloud GPU - SmoothCloud」),点击「Next」。
4.接下来 PyCharm 会自动检测远程 GPU 实例中的 Python 环境,若在润云平台选择了预装 Python 的镜像,会直接识别到对应的 Python 解释器路径(如「/usr/bin/python3.8」);若未自动识别,可手动浏览选择实例中的 Python 解释器。
5.填写远程项目目录(可自定义,如「/root/project/cloud_gpu_demo」,PyCharm 会自动创建该目录),点击「Next」,等待环境配置完成,完成后即可在 Python Interpreter 中看到远程解释器已被添加。
3.3 配置本地项目与远程目录同步
1.打开本地已有的算力密集型项目(或新建一个测试项目),点击顶部菜单栏「Tools」->「Deployment」->「Configuration」。
2.在弹出的窗口中,点击右侧「+」号,选择「SFTP」,自定义部署配置名称(与 SSH 配置名称保持一致即可,方便关联)。
3.在「Connection」标签页中,选择之前配置的 SSH 服务器,验证连接是否成功。
4.切换到「Mappings」标签页,配置本地目录与远程目录的映射关系:
4.1「Local path」:选择本地项目的根目录。
4.2「Deployment path on server」:选择之前配置的远程项目目录(与 Python 解释器配置中的目录保持一致)。
5.配置完成后,勾选「Automatic upload (always)」(自动上传本地文件变更到远程服务器),避免手动同步的繁琐,点击「OK」保存配置。
四、第三步:在 PyCharm 中远程运行代码并验证 GPU 可用性
4.1 上传项目文件并编写测试代码
1.配置完成后,PyCharm 会自动将本地项目文件上传到润云平台 GPU 实例的对应目录,可通过右侧「Remote Host」窗口查看远程目录中的文件,确认上传成功。
2.新建一个 Python 测试文件(如「gpu_test.py」),编写简单的 GPU 可用性验证代码,示例如下: python
运行
3.若需要运行特定 AI 模型,可借助润云平台的模型广场功能————平台汇聚了 Qwen3、DeepSeek、ChatGPT、GLM4、Meta Llama、Stable Diffusion 等多种主流 AIGC 大模型,支持标准 API 调用、零代码一键部署等方式,可直接在项目中对接使用,无需手动部署复杂模型。
4.2 远程运行代码并查看结果
右键点击测试文件,选择「Run 'gpu_test'」,PyCharm 会通过远程 Python 解释器运行代码,运行日志会在底部「Run」窗口中显示。
若日志中显示 CUDA 可用,并输出了 GPU 设备名称、数量等信息,说明润云平台的云端 GPU 已成功启用,代码运行正常。
若需要运行大型深度学习模型或数据处理代码,直接在 PyCharm 中编辑本地文件(会自动同步到远程),然后运行即可 —— 依托润云平台的高性能 GPU 资源与智能算力调度能力,能高效适配负载,提升代码运行效率,所有算力消耗均由云端 GPU 承担,本地设备仅负责界面交互与日志查看。
五、后续注意事项
1.代码运行完成后,及时在润云平台控制台停止或释放 GPU 实例,平台支持按需计费、启停随心,释放后停止计费,避免不必要的算力费用消耗;若需长期使用,也可选择对应的套餐,性价比更高(推理卡会员价 2.68 元 / 小时,训练卡会员价 11.04 元 / 小时)。
2.若需要长期保存项目数据,可使用平台的数据集中心功能(高质量训练数据集的管理与共享库),或定期将远程服务器中的关键数据下载到本地备份,避免实例释放后数据丢失。
3.润云平台提供智能运维服务,支持智能监控告警、自动化运维调度,故障秒级响应,能稳定保障实例高可用;若遇到远程连接卡顿、代码运行缓慢等问题,可检查网络带宽是否充足,或尝试切换平台的其他地域节点,同时也可查看 GPU 实例的资源占用情况,确保没有其他无关进程占用过多资源。
4.若需要搭建自定义 Python 环境,可通过 PyCharm 的远程终端或本地 SSH 连接,在 GPU 实例中使用 pip 或 conda 安装所需依赖包,安装完成后 PyCharm 会自动识别更新后的环境;若需复用环境,还可借助平台的镜像克隆与部署工具,提高开发效率。