一次线上环境资源丢失问题的排查和解决发布生产环境后产品称用户创建的agent“头像丢失”. 我打开控制台发现一个网络

发布生产环境后产品称用户创建的agent“头像丢失”.

我打开控制台发现一个网络请求超时的异常便认为是网络的问题让产品多刷新几次就好了.可是过了一段时间他报告了最新的情况即有一部分agent的头像正常显示另一部分是灰色的(antd的头像组件).

我打开网络面板筛选"图片" 发现只有无论成功还是失败都只有寥寥数个请求和当前页面几十个agent的情况完全不符遂怀疑是数据问题———然而后端的接口正确地返回了头像链接.

此时有人提醒我接口返回的很多数据是'/assets/'开头的少数则是用户上传到云存储的以https开头而"图片"类型的网络请求全都是https开头的是不是前端的资源出了问题？我受此启发查看"文档"类型的网络请求果然发现了一系列/assets/xx/.png的请求显然是nginx将这些请求都重定向到了index.html而非对应的静态资源.

不过 nginx配置几乎没人动过上次更改还是三四个月前把单引号改成了双引号.此外配置中先"try files"再定向到index.html是完全符合预期的.这说明前端的静态资源里根本就没有这些图片！

正在我思考vite的bug之类的东西时我突然意识到这些图片的名称都后缀了一串哈希值.此时我回想起国庆节前的一周需求像拉稀一样从雇主的嘴里喷涌而出包括但不限于UI的全面改版其中就有十分钟三变的"Agent默认头像调整" 当时我为了省事直接把图片放在了组件的文件夹里并通过import引入这就导致这些图片会vite重命名并且即便是同一图片两次打包的哈希值都不同.用户创建agent时我会将图片的url提交给后端如果用户没有上传头像就提交默认头像.而第二次打包后默认头像的文件名已经变化上次提交的"默认头像"自然也访问不到对应的资源.

解决方案:
1.后端清洗数据将所有以'/'开头的头像都改为字符串'default'
2.前端做判断无论创建还是展示若头像url是'default' 则展示对应类型的默认头像