那台服务器,我们已经不敢碰它了。
不是不想碰,是真的不敢。
运维同事跟我说,这台跑着方正采编系统的机器,已经连续运行了好几年没有重启过。不是因为稳定,是因为一旦重启,可能就起不来了。每天早上他来上班,第一件事就是看一眼监控,确认服务还活着。
就像养了一只老猫,知道它随时可能走,但你不敢带它去医院,怕折腾死了。
上个月,鞋子落地了。
服务崩了。
我接到消息的时候,第一反应不是慌,是一种奇怪的平静。因为这一天,我们等了太久了。
为什么有预案
其实从一两年前,我们就开始做预案了。
不是因为我们有多高瞻远瞩,是因为这个系统的状态,任何人看了都知道,它撑不了多久。
方正采编系统,很多报社用了十几二十年的老系统。功能完整,工作流成熟,采编人员用得顺手。但这些年纸媒的日子不好过,没有经费升级,系统就一直停在那个版本。
不是不想升级,是升级的代价太高了。
一套完整的采编系统迁移,涉及的不只是数据,还有整个工作流的重建,还有几十个采编人员的习惯迁移。这个成本,在纸媒收缩的大背景下,很难排上优先级。
所以就一直拖着,直到拖不下去了。
自研系统现在做到哪了
我们自研的云系统,现在做到哪了?
说实话,还在路上。
稿件主线已经跑通。 投稿、审核、稿费管理,这条主线已经通了。采编人员可以在系统里提交稿件,编辑可以在线审核。报社有19个栏目,每个栏目的稿件分类、审核权限,都已经配置好了。
AI这块也上了一个功能。 我们做了文章智能采集,把历史文章和外部素材抓进来,建了一个RAG库。采编人员写稿的时候,可以让AI基于这个库来辅助创作。特别是写一些固定题材的稿件,效率提升比较明显。
还没做完的:留痕和智能校对。 留痕功能还在开发中,稿件的修改历史、审核意见,都需要有迹可查。智能校对是下一个大功能,后面细说。
排版这块,我们现在是这样凑合的
排版是个大坑。
web端的排版方案,目前没有找到特别好的。报纸排版对版式要求很高,字体、行距、分栏、图文混排,这些在web端做起来,要么效果差,要么开发成本太高。
暂时的做法是,版式编辑还是用飞腾软件在本地排版,排完之后导出PDF,然后我们自研了一个程序,把PDF自动提交到稿件系统里。校对人员在系统里看PDF,做校对标注。
这个方案不优雅,但能用。
而且有一个意外的好处,飞腾是很多报社排版人员用了多年的工具,这块不用迁移,减少了一个摩擦点。
校对API选型,踩了两个坑
接下来要做的是智能校对。
这块我们对比了三个方案。
方正的API。 本来以为它最懂报纸校对,毕竟是做采编系统起家的,对报纸行业的语言规范应该有积累。但实际测下来,效果一般,对一些专业术语和行业表达的处理,并没有我们期待的那么好。
密度的API。 也试了,也没让我们满意。
最后发现,千问反而是最好用的。 通义千问在文本理解和校对这块,表现出乎意料地好。我们测了几篇真实稿件,包括医疗健康类、政策解读类,千问的校对结果,在准确率和可读性上都明显优于前两个。API接入也比较顺畅,文档清晰,响应速度可以接受。
所以最终选了千问。
最难的不是技术,是这个
说实话,技术上的事,不是最难的。
最难的是工作流迁移。
采编人员用了二十年的方正,那套操作习惯已经刻进肌肉记忆里了。你给他一个新系统,哪怕功能更好,他也会觉得别扭。
我们现在的策略是,不强推,慢慢来。先让系统跑起来,让大家看到它能用。然后一个功能一个功能地迁移,每次只改一个地方,让大家有时间适应。遇到反馈就改,改完再推。
强推的结果,往往是表面上用了,实际上绕过去了。
一点反思
这件事给我最大的感受,不是「自研比外购好」,也不是「AI能替代传统系统」。
是:预案要早做,但不要等到完美再切换。
我们的系统现在还有很多不完善的地方,留痕功能还没上,智能校对还在开发,排版方案还是临时的。但系统崩了,我们还是切过来了,业务没有中断。
如果等到系统完美再切,那就真的来不及了。
还有一点,体制内做技术改造,有一个特殊的难处,就是你很难拿到足够的预算和时间窗口。所以很多时候,你只能在夹缝里做,用最小的资源,先把主线跑通,再一点点补齐。
这不是最优解,但往往是唯一解。