不完整收录:2021年字节自研的8项“黑科技”| 字节技术年货

avatar
@字节跳动

祝全天下的开发者朋友,新年职业发展虎啸风生,新年工资增速如虎添翼,新年爱情运势虎跃龙骧,新年代码事故下虎口逃生,虎!虎!虎!

软件工程圣经《人月神话》一书中曾提到“软件开发没有银弹”,事实也正是如此,复杂的软件工程问题无法靠简单的答案来解决。在字节跳动,海量数据、复杂业务场景、快速发展的业务规模,都对业界成熟的开源技术方案带来了或多或少的挑战。字节跳动各技术团队在充分调研了业界成熟方案后,从业务实际出发,自研了多套取得了卓越成效的方案与工具,其中部分已开源,部分已集成到火山引擎服务中,更多方案在内部打磨成熟后也将开放给业界使用。

以下内容为过去一年中,字节跳动技术团队公众号所发布的自研技术方案集合,以飨读者。

字节工程师自研基于 IntelliJ 的终极文档套件

众所周知,程序员最讨厌的四件事:写注释、写文档、别人不写注释、别人不写文档。因此,想办法降低文档的编写和维护成本是很有必要的。为解决写文档原始模式的诸多痛点,字节工程师自研的基于 IntelliJ 的终极文档套件方案可以做到完全脱离浏览器 / 文档编辑器,线上页面的同步完全交给定时触发的自动化部署。

👉 详情回顾戳这里

字节自研 Android 虚拟机内存管理优化黑科技 mSponge

字节自研的 Android 虚拟机内存管理工具 mSponge,从应用侧视角对 Android 虚拟机内存管理进行改造,优化了虚拟机对 LargeObjectSpace 的内存管理策略,间接增加其它内存空间使用上限。改造后的方案,32 位运行环境 LargeObjectSpace 的内存使用上限可达到 2G 甚至更多(64 位环境使用上限理论上会趋于无限大)。通过本方案可以最大程度上从系统侧解决诸多应用都会遇到的内存瓶颈和 OOM 问题,一键接入,安全可靠。

👉 详情回顾戳这里

自研推荐系统大规模 Training & Serving 方案 Monolith

Monolith 是字节跳动火山引擎智能推荐平台中的大规模 Training 和 Serving 方案,包括了 Training/Serving/Parameter Sync 等,是一套完整的系统方案。与业界其它系统相比,Monolith 成功应对了多方面的挑战,具备以下特色:解决了 TensorFlow PS 通信瓶颈、全方位容错、分布式 Serving、性能优化等,目前,Monolith 已通过推荐平台,成功应用在电商、社区、视频等多个行业的场景上,效果、稳定性、性能均得到了充足的验证。未来,我们也将继续保持高速迭代,不断优化用户体验和平台功能。

👉 详情回顾戳这里

字节优化版性能检测工具 atop

atop 是一款开源的单机性能监测工具,支持实时观测的同时、也支持读取历史文件排查问题。另外一个优点是除提供 CPU、MEM、DISK 等全局指标外,还提供进程、线程级别的各项指标监控数据。字节跳动基于社区的 atop 进行优化,目前已迭代 3 个版本,稳定运行接近三年,新增包括 NUMA 聚合、JSON 格式输出、交互界面改进、日志相关改进及其他特性优化。

👉 详情回顾戳这里

自研 OpenBMC 方案

OpenBMC 是 Linux Foundation 组织里的一个项目,也是目前开源 BMC 里方案最成熟、社区最活跃的项目。字节跳动系统部 STE 团队自研的 OpenBMC,已在内部成功上线,并稳定运行了四个多月。这也是字节跳动首次正式上线并初步产品化的 OpenBMC 方案。同时,STE 团队的工程师们,也在 OpenBMC 开源社区里提交了涉及新 feature 及 bug fix 的诸多 commits,目前已经成为了 OpenBMC Technical Oversight Forum (TOF) 的一员。

👉 详情回顾戳这里

自研同传系统「火山同传」

2021 北京智源大会上,火山翻译推出的产品  「火山同传」  为会议现场和线上直播提供  「低延时、高质量」  的同传字幕,助力大会顺利召开。字节跳动 AI-LAB 智能语音团队对 RNN-T 模型做了较多尝试和探索,通过数据的不断积累、算法的持续优化,基于 RNN-T 模型的自研端到端语音识别系统获得了显著优于 CTC 模型的性能,被应用到了会议转录、同传等多个业务中,都取得了较好的反馈。

👉 详情回顾戳这里

自研智能化测试系统 Fastbot

Fastbot 是由字节自研的客户端智能测试工具,主要适用客户端稳定性/兼容性/压力测试。目前 Fastbot 已支持多平台:Android,iOS,Web,PC 等。目前,Fastbot 已广泛应用于字节客户端类产品的稳定性测试与兼容性测试。每日启动任务数超过 1 万次,每月平均发现 5 万个以上的崩溃。借助 Fastbot 的能力,我们在发版前就可以修复大部分的 crash,确保线上用户的使用体验。同时,Fastbot 在整个 DevOps 流程扮演重要的基础服务角色。其中 iOS、Android 版本均以开源。

👉 详情回顾戳这里

自研端智能一体化方案 Pitaya

Pitaya 是字节跳动移动平台团队与 MLX 团队深度合作共建的一套从端(云端)到端(终端)的全链路动态部署方案。Pitaya 是专门为移动端打造的端智能一体化方案,与传统方案相比,具备以下优势:降低了端智能使用成本,方便业务快速集成,拿到业务收益;;完善的动态化能力,支持模型的快速迭代与效果验证;提升多方协作的效率,让算法工程师深入参与客户端场景中;算法、模型高度复用,可以快速推广已经验证的方案。目前,字节跳动内已经有抖音、头条、西瓜等众多产品线基于 Pitaya 开始了端智能的实践和探索,后续还将规划特征工程、模型自衍化、通用 AI 能力建设等新功能。

👉 详情回顾戳这里

下期字节技术年货预告:实践篇