那台不敢重启的服务器,终于在上个月倒下了

0 阅读5分钟

那台服务器,我们已经不敢碰它了。

不是不想碰,是真的不敢。

运维同事跟我说,这台跑着方正采编系统的机器,已经连续运行了好几年没有重启过。不是因为稳定,是因为一旦重启,可能就起不来了。每天早上他来上班,第一件事就是看一眼监控,确认服务还活着。

就像养了一只老猫,知道它随时可能走,但你不敢带它去医院,怕折腾死了。

上个月,鞋子落地了。

服务崩了。

我接到消息的时候,第一反应不是慌,是一种奇怪的平静。因为这一天,我们等了太久了。

为什么有预案

其实从一两年前,我们就开始做预案了。

不是因为我们有多高瞻远瞩,是因为这个系统的状态,任何人看了都知道,它撑不了多久。

方正采编系统,很多报社用了十几二十年的老系统。功能完整,工作流成熟,采编人员用得顺手。但这些年纸媒的日子不好过,没有经费升级,系统就一直停在那个版本。

不是不想升级,是升级的代价太高了。

一套完整的采编系统迁移,涉及的不只是数据,还有整个工作流的重建,还有几十个采编人员的习惯迁移。这个成本,在纸媒收缩的大背景下,很难排上优先级。

所以就一直拖着,直到拖不下去了。

自研系统现在做到哪了

我们自研的云系统,现在做到哪了?

说实话,还在路上。

稿件主线已经跑通。  投稿、审核、稿费管理,这条主线已经通了。采编人员可以在系统里提交稿件,编辑可以在线审核。报社有19个栏目,每个栏目的稿件分类、审核权限,都已经配置好了。

AI这块也上了一个功能。  我们做了文章智能采集,把历史文章和外部素材抓进来,建了一个RAG库。采编人员写稿的时候,可以让AI基于这个库来辅助创作。特别是写一些固定题材的稿件,效率提升比较明显。

还没做完的:留痕和智能校对。  留痕功能还在开发中,稿件的修改历史、审核意见,都需要有迹可查。智能校对是下一个大功能,后面细说。

排版这块,我们现在是这样凑合的

排版是个大坑。

web端的排版方案,目前没有找到特别好的。报纸排版对版式要求很高,字体、行距、分栏、图文混排,这些在web端做起来,要么效果差,要么开发成本太高。

暂时的做法是,版式编辑还是用飞腾软件在本地排版,排完之后导出PDF,然后我们自研了一个程序,把PDF自动提交到稿件系统里。校对人员在系统里看PDF,做校对标注。

这个方案不优雅,但能用。

而且有一个意外的好处,飞腾是很多报社排版人员用了多年的工具,这块不用迁移,减少了一个摩擦点。

校对API选型,踩了两个坑

接下来要做的是智能校对。

这块我们对比了三个方案。

方正的API。  本来以为它最懂报纸校对,毕竟是做采编系统起家的,对报纸行业的语言规范应该有积累。但实际测下来,效果一般,对一些专业术语和行业表达的处理,并没有我们期待的那么好。

密度的API。  也试了,也没让我们满意。

最后发现,千问反而是最好用的。  通义千问在文本理解和校对这块,表现出乎意料地好。我们测了几篇真实稿件,包括医疗健康类、政策解读类,千问的校对结果,在准确率和可读性上都明显优于前两个。API接入也比较顺畅,文档清晰,响应速度可以接受。

所以最终选了千问。

最难的不是技术,是这个

说实话,技术上的事,不是最难的。

最难的是工作流迁移。

采编人员用了二十年的方正,那套操作习惯已经刻进肌肉记忆里了。你给他一个新系统,哪怕功能更好,他也会觉得别扭。

我们现在的策略是,不强推,慢慢来。先让系统跑起来,让大家看到它能用。然后一个功能一个功能地迁移,每次只改一个地方,让大家有时间适应。遇到反馈就改,改完再推。

强推的结果,往往是表面上用了,实际上绕过去了。

一点反思

这件事给我最大的感受,不是「自研比外购好」,也不是「AI能替代传统系统」。

是:预案要早做,但不要等到完美再切换。

我们的系统现在还有很多不完善的地方,留痕功能还没上,智能校对还在开发,排版方案还是临时的。但系统崩了,我们还是切过来了,业务没有中断。

如果等到系统完美再切,那就真的来不及了。

还有一点,体制内做技术改造,有一个特殊的难处,就是你很难拿到足够的预算和时间窗口。所以很多时候,你只能在夹缝里做,用最小的资源,先把主线跑通,再一点点补齐。

这不是最优解,但往往是唯一解。