2024年度十大热门计算机技术研究论文精粹本文介绍了2024年度浏览量最高的十篇研究论文，内容涵盖从云数据库、图异常检测

COSMO：某中心的大规模电商常识知识生成与服务系统

在电商平台中应用大规模知识图谱可以改善客户的购物体验。虽然现有的电商知识图谱整合了大量概念或产品属性，但未能发现用户意图，遗漏了关于人们如何思考、行为和与周围世界互动的重要信息。这项工作提出了COSMO，一个从行为数据中挖掘以用户为中心的常识知识，并构建工业规模知识图谱以赋能多样化在线服务的可扩展系统。特别是，描述了一个收集高质量种子知识声明的流程，这些声明从大语言模型中提炼，并通过基于人机回圈标注数据训练的评论分类器进一步精炼。

某中心MemoryDB：快速且持久的内存优先云数据库

某中心MemoryDB for Redis 是一种设计为具有11个9持久性和内存性能的数据库服务。本文描述了MemoryDB的架构，以及如何利用开源Redis（一种流行的数据结构存储）来构建企业级云数据库。MemoryDB将持久性卸载到独立的低延迟、持久的事务日志服务，从而能够独立于内存执行引擎扩展性能、可用性和持久性。描述了如何通过这种架构，在保持与Redis完全兼容的同时，提供个位数毫秒级写入和微秒级读取延迟、强一致性和高可用性。MemoryDB于2021年推出。

BASE TTS：基于10万小时数据构建十亿参数文本转语音模型的教训

引入了一种名为BASE TTS的文本转语音模型，代表具有涌现能力的大规模自适应可流式TTS。BASE TTS是迄今为止最大的TTS模型，在10万小时的公共领域语音数据上训练，在语音自然度方面达到了新的技术水平。它部署了一个十亿参数的自回归变换器，将原始文本转换为离散代码（“语音代码”），随后是一个基于卷积的解码器，以增量、可流式的方式将这些语音代码转换为波形。此外，其语音代码采用了一种新颖的语音标记化技术构建，具有说话人身份解耦和使用字节对编码的压缩。与LLM在增加数据量训练时被广泛报告的“涌现能力”相呼应，展示了基于1万小时以上数据和5亿以上参数构建的BASE TTS变体开始在处理文本复杂的句子时展现出自然的韵律。

Aurora Serverless中的资源管理

某中心Aurora Serverless 是某中心Aurora的一种按需、自动扩展配置，完全兼容MySQL和PostgreSQL。它根据客户数据库应用的需求自动提供容量扩缩容（即垂直扩展）。通过这种方式，它解除了客户显式管理其数据库容量的负担；客户只需要使用一种易于理解的多资源容量抽象（称为Aurora容量单位）来指定最小和最大界限。对于具有时变工作负载的客户，由于其敏捷和精细的扩展以及基于使用的计费模式，与预配置的Aurora或其他替代方案相比，它提供了成本节约。本文描述了支撑Aurora Serverless资源管理的关键思想。为了帮助实现其目标，Aurora Serverless采用并微调了关于资源超额订阅、基于近期测量的反应式控制、分布式和分层决策以及DB引擎、操作系统和虚拟机管理程序为提高效率而进行创新等成熟思想。也许最具挑战性的目标是在以高利用率运行主机的同时，提供一致的资源弹性体验。Aurora Serverless为平衡这些对立需求实现了几种新颖的想法。

Panda：使用LLM智能体进行数据库性能调试

调试数据库中的性能问题 notoriously 困难。如果每个数据库系统都有一个预言机或副驾驶，用户可以自然地用“出了什么问题？”甚至“我们如何修复它？”来查询，岂不是很方便？大语言模型似乎是这种预言机的天然替代品，因为它们能够通过有效编码来自互联网大部分内容的广泛知识来回答各种问题。然而，用数据库性能查询来提示LLM通常会产生“技术上正确”但高度“模糊”或“通用”的建议，经验丰富的数据库工程师通常认为无用或不可信。在这项工作中，提出了Panda，一个为预训练LLM提供上下文基础的框架，以生成更“有用”和“在上下文中”的故障排除建议。Panda从经验丰富的DBE执行调试的方式中汲取灵感，并建立一个系统，包含在生产中稳健部署预训练LLM进行调试所需的组件。

某中心Nova模型系列：技术报告和模型卡

展示了某中心Nova，新一代最先进的基础模型，提供前沿智能和行业领先的性价比。某中心Nova Pro是一个高度能力的多模态模型，为广泛的任务提供了准确性、速度和成本的最佳组合。某中心Nova Lite是一种低成本多模态模型，在处理图像、视频、文档和文本时速度极快。某中心Nova Micro是一个纯文本模型，以非常低的成本提供最低延迟的响应。某中心Nova Canvas是一个图像生成模型，创建具有丰富定制控制的专业级图像。某中心Nova Reel是一个视频生成模型，提供高质量输出、定制和运动控制。我们的模型是负责任地构建的，并致力于客户信任、安全和可靠性。报告了核心能力、智能体性能、长上下文、功能适应、运行时性能和人类评估的基准测试结果。

为何TPC不够：对某中心Redshift舰队分析

数据库研究和开发深受TPC-H和TPC-DS等行业标准基准测试的影响。然而，这些已有20年历史的基准测试既未反映数据库的部署方式，也未反映现代云数据仓库系统面临的工作负载。本文使用经验数据总结了TPC-H/DS与实际工作负载之间已知的、已怀疑的和新发现的差异。基于来自某中心Redshift（最大的云数据仓库部署之一）的遥测数据进行分析。在其他见解中，展示了繁重写入的数据管道如何突出，工作负载如何随时间变化（负载和类型），查询如何具有重复性，以及查询或工作负载的大多数属性呈现非常长尾的分布。结论是，数据仓库基准测试就像数据库系统一样，需要变得更加全面，而不仅仅是关注查询引擎性能。最后，发布了一个数据集，包含200个随机选择的Redshift无服务器和预配置实例（各一个）在三个月期间的查询统计数据，作为构建更真实基准测试的基础。

实时衰退风险预测

提出一个简单而稳健的框架，以月度频率对美国及欧元区的衰退风险进行实时预测。我们的实时预测利用了宏观经济和金融状况，并在参考月结束后的第一个工作日即可获得。特别地，认为金融状况不仅对预测未来的衰退有用——正如现有文献所强调的——而且在衰退展开时对区分扩张和衰退也有用。然后，通过借鉴分布回归和分位数回归的文献，将衰退风险实时预测与风险增长联系起来。最后，将实时预测与专业预测者调查（SPF）进行基准比较，表明虽然两者识别衰退的能力相似，但前者在正确识别扩张期方面更为准确。

用于异常检测的图扩散模型

图异常检测侧重于识别图结构数据中显著偏离常规的不规则模式或节点。该技术非常重要，因为其在垃圾邮件检测、反洗钱和网络安全等领域的广泛应用。图异常检测应用面临的两个挑战是标签不平衡和数据不足。最近生成模型（尤其是扩散模型）的激增提供了一个解决方案。本文介绍了一种在潜在空间中的图扩散模型，旨在缓解标签不平衡问题。所提出的模型能够多任务生成图结构和节点特征，并展示了条件生成能力，通过仅生成正例来缓解标签不平衡。将扩散模型应用于同质图和异质图。通过大量实验，证明所提出的方法相对于传统技术提供了显著的改进。

大语言模型在表格数据上的应用：预测、生成与理解——综述

大语言建模的最新突破促进了对它们在表格数据建模相关多样化任务中应用的严格探索，例如预测、表格数据合成、问答和表格理解。每个任务都带来了独特的挑战和机遇。然而，目前还没有全面综述来总结和比较这一研究领域的关键技术、指标、数据集、模型和优化方法。本综述旨在通过整合这些领域的最新进展来弥补这一空白，提供所用数据集、指标和方法论的全面综述和分类。