谷歌云代理商:‌谷歌云服务器如何修复服务崩溃?‌

163 阅读4分钟

本文由【云老大】 TG@yunlaoda360 撰写

通用排查与修复

  • 检查服务状态页面 :访问Google Cloud 状态页面,查看是否是谷歌云平台自身存在问题导致的服务崩溃,若是平台问题,可关注其更新动态,等待谷歌官方修复。
  • 查看日志 :通过 Google Cloud Console 查看相关日志,如系统日志、应用日志等,确定服务崩溃的具体时间、错误信息及异常情况,从而分析崩溃原因。
  • 重启服务 :对于一些非关键性的服务崩溃,重启相关服务或实例可能能解决问题。可在 Google Cloud Console 中找到对应的服务或实例,点击 “重启” 按钮进行操作。
  • 重新部署应用 :若是部署在谷歌云服务器上的应用程序崩溃,可尝试重新部署应用。先检查应用代码及配置是否有误,再按照部署流程重新上传、配置并启动应用。

针对特定原因的修复

  • 资源耗尽 :如果是因为服务器资源耗尽,如内存、磁盘空间或 CPU 等,导致服务崩溃,需要优化应用或增加服务器资源。一方面,优化应用程序代码,提高资源利用率;另一方面,可通过 Google Cloud Console 调整服务器资源配置,如升级内存、扩大磁盘空间或增加 CPU 核心数等。
  • 软件故障 :若是服务器上运行的软件出现故障,如 Web 服务器、数据库服务器等崩溃,需更新或修复相关软件。检查软件的官方更新渠道,安装最新的稳定版本,按照软件的文档进行配置和修复操作。
  • 安全问题 :怀疑服务器遭受黑客攻击或恶意软件入侵,应立即采取安全措施。使用 Google Cloud 的安全工具,如防火墙、入侵检测系统等,加强服务器防护;同时,进行病毒扫描和系统漏洞修复,清除恶意软件和修复被破坏的系统文件。
  • 配置错误 :由于服务器或应用的配置错误导致崩溃,需重新检查并修正配置。仔细核对服务器的系统设置、网络配置、应用配置文件等,确保各项配置正确无误,符合应用的运行要求。
  • 磁盘 I/O 问题 :当磁盘 I/O 出现问题时,可能会导致服务崩溃或性能下降。可以尝试更换磁盘类型,如将标准持久磁盘更换为 SSD 持久磁盘,以提高磁盘性能;或者优化磁盘的使用方式,如调整文件系统、优化数据库查询等,减少磁盘 I/O 压力。

Windows VM 使用 CrowdStrike 导致崩溃的修复

  • 重启修复 :先尝试重启 Windows VM 主机,让其有机会下载修复的通道文件,大部分受此问题影响的 Windows VM 可在重启后恢复正常。
  • 安全模式修复 :若重启无效,可将主机引导至 Windows 安全模式或 Windows 恢复环境,并将主机连接到有线网络,再导航到%WINDIR%\System32\drivers\CrowdStrike目录,删除匹配 “C-00000291*.sys” 的文件,然后正常启动主机。
  • 救援 VM 修复 :使用救援 VM,将受此问题影响的 Windows VM 的启动磁盘附加为辅助磁盘。需确保救援 VM 的启动磁盘镜像与要修复的启动磁盘不同,然后导航到D:\Windows\System32\drivers\CrowdStrike目录,删除匹配 “C-00000291*.sys” 的文件,关闭救援 VM 并分离辅助磁盘,将辅助磁盘重新附加到原始 VM 并启动。

Google BigQuery 访问 Google Drive 出现错误的修复

  • 项目恢复 :若因内部项目被误删导致 API 密钥丢失,从而引发服务崩溃,谷歌工程师会尽快恢复被误删的项目,以恢复 API 密钥和数据导出功能。对于用户来说,可关注 Google Cloud 状态页面的更新,等待服务恢复。