首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
AI相关开发
渐儿
创建于2026-04-30
订阅专栏
xyh
等 2 人订阅
共133篇文章
创建于2026-04-30
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
案例2:内存管理与性能优化
场景描述 某图像处理应用需要批量处理用户上传的照片。开发者使用AI生成了图像处理代码,在本地测试时一切正常。但部署到服务器后,处理大量图片时频繁崩溃,错误信息显示"Out of Memory",但服务
缓存一致性与分布式锁:工程踩坑全解
一、为什么要缓存?为什么会有一致性问题? 引入缓存的根本原因:数据库扛不住读 QPS。Redis 单机 10 万 QPS,MySQL 单机几千 QPS,差两个数量级。 但凡数据有两份副本(DB + C
案例1:多线程并发编程中的竞态条件
场景描述 某电商平台在高并发秒杀活动中,库存扣减逻辑出现超卖问题:库存只有100件商品,但系统却成功处理了150个订单。 用户投诉激增,平台不得不紧急下线活动,造成重大损失和信誉危机。 问题代码 为什
上下文工程(Context Engineering)生产落地指南
目录 核心认知:什么是上下文工程 上下文的五个来源 上下文窗口管理策略 Prompt 工程的生产规范 多轮对话的上下文设计 Agent 场景的上下文管理 上下文压缩与摘要技术 成本与延迟优化 评估与可
深度学习:反向传播算法完全解析
1. 引言 反向传播(Backpropagation)是训练神经网络的核心算法,它解决了如何高效计算深层网络中每个参数的梯度这一难题。本教程将从数学原理到代码实现,完整揭示反向传播的奥秘。 2. 问题
vLLM部署Qwen3模型完整指南
目录 环境准备 显存计算与模型选择 安装vLLM 模型下载 单机多卡部署 性能优化 API调用示例 常见问题 1. 环境准备 1.1 系统要求 操作系统: Linux (推荐 Ubuntu 20.04
LLM模型部署与推理优化技术详解
一、概述 大语言模型(LLM)的部署和推理优化是将模型从实验室推向生产环境的关键环节。本文档详细介绍主流的推理加速技术、量化方法、推理框架以及实际部署方案。 二、推理性能的挑战 2.1 核心瓶颈 1.
n8n 源码深度剖析与生产应用教程
本文档分为两大部分: 第一部分:对 n8n 源码进行体系化、模块级、直至关键类与方法的深度剖析。 第二部分:从零搭建生产环境(单机 → Queue 集群 → 多主节点 HA),并给出最佳实践。 目录
CrewAI 源码深度剖析与生产应用教程
目录 项目全景与设计哲学 核心抽象关系图 Agent 源码剖析 Task 源码剖析 Crew 编排源码剖析 CrewAgentExecutor:ReAct 与原生 ToolCall 双循环 LLM 层
PageIndex
02-PageIndex-检索与实战 01-PageIndex-深度解析 04-PageIndex-设计决策与陷阱 03-PageIndex-逐行代码解析 02-PageIndex-检索与实战 Pag
LLM 部署与微调可运行代码集
所有代码以 Qwen2.5-7B-Instruct 为主示例(其他模型按 模型手册 替换 target_modules 和 chat_template 即可)。Linux 环境为准,Windows 需
奖励信号设计:从稀疏到稠密的工程实践
一、奖励函数的核心作用 1.1 什么是奖励函数? 在强化学习中,奖励函数是模型唯一的"指南针": 案例对比: 任务 监督学习标签 强化学习奖励 数学题 标准解题步骤 答案正确→+1,错误→0 代码生成
密集检索与向量数据库技术详解
一、概述 密集检索(Dense Retrieval)是现代信息检索的核心技术,通过将文本编码为稠密向量,实现语义级别的相似度匹配。本文档详细介绍主流的密集检索模型、向量数据库以及相关优化技术。 二、密
群聊实时聊天系统生产落地指南
目录 核心认知:群聊系统的本质挑战 整体架构设计 技术选型与职责划分 消息发送链路详解 消息接收与推送链路详解 Redis 数据模型设计 Kafka 主题设计与消费策略 MySQL 表结构设计 离线消
案例3:文件系统与数据持久化
场景描述 某金融交易系统记录每笔交易到日志文件。开发者使用AI生成的代码在测试环境运行正常,但上线后机房突然断电,重启后发现最近30分钟的交易记录全部丢失,造成严重的数据一致性问题。 代码明明已经执行
RAG 与 Agentic Search 生产级落地指南
目录 核心认知:两种范式的本质差异 选型决策框架 成熟技术栈选型 传统 RAG 生产方案详解 Agentic Search 生产方案详解 知识库构建规范 评估体系 部署与成本 常见生产问题与根本解法
OpenClaw 源码深度分析与应用文档
一、项目定位与设计哲学 OpenClaw 官方自述为 "the AI that actually does things": 一个运行在用户自有设备上、面向多消息渠道、能实际执行任务(而不仅是问答)的
数据库索引与事务:原理与实战
一、为什么需要索引? 无索引时,查找一条记录需要全表扫描(O(N))。索引相当于书的目录,把查找复杂度降到 O(log N)。 代价: 占用磁盘空间(一个大表的索引可能数 GB) 写入变慢(每个索引都
消息队列高阶应用 - 从原理到实战全面解析
一、历史背景与发展历程 1.1 消息队列诞生的历史背景 分布式系统的通信困境 早期单体应用的问题: 微服务架构的兴起: 同步调用的局限性: 消息队列的解决方案 核心理念:异步解耦: 1.2 消息队列解
AI大模型专有名词完全指南
一、概述 本文档系统化地整理了AI大模型领域的所有核心专有名词,按应用场景分类,帮助你快速理解和掌握大模型技术栈的完整知识体系。 二、基础架构相关 2.1 模型架构 Transformer 定义:基于
下一页