首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
后端
前端
Android
iOS
人工智能
开发工具
代码人生
阅读
从零实现 REINFORCE/GRPO —— 大模型推理强化微调实践
引言 你是否也遇到过:模型“会思考”,但少数题正确,格式还常常不合规?我在 Qwen/Qwen2.5-Math-1.5B 上亲历这一痛点——zero-shot 在 GSM8K 只有约 1%。本文分享我
时间轮实现延迟消息
原理 轮盘实现的延迟消息(也称为时间轮)是一种高效的时间调度算法,用于管理和执行时间延迟操作。其原理主要包括以下几个方面: 时间轮结构:时间轮类似于一个圆形的时钟,它被分成多个槽(也称为桶),每个槽对
2025年AI论文工具实测对比:从开题到降重,哪款最适合你?
AI论文工具作为现代学术写作的重要辅助手段,能够显著提升写作效率和质量。通过本次实测对比可见,不同工具在特定场景下各具优势。aibijiang在整体写作和编辑优化方面表现突出;askpaper适合解决
灵宇宙获 2 亿新融资,要做 AI 世界操作系统;Vogent :自然语言描述生成语音智能体丨日报
Vogent 发布了 Voice Agent Wizard,旨在通过简化语音 AI 应用的开发流程,大幅缩短开发周期并降低技术门槛。用户只需提供描述和相关文件,即可在短短几分钟内生成一套完整、可部署的
手撸大模型的分布式训练:深刻理解大模型训练的“起飞”原理
单卡不够?内存爆炸?训练太慢? 在大型语言模型(LLM)的训练过程中,单设备算力和内存往往成为性能瓶颈。如何高效地利用多GPU甚至多节点资源进行分布式训练,是每个LLM研究者和工程师必须面对的挑战。本
手搓一个简易Agent
如果跟着我完成了前面的一些学习,相信你也对ai有一定程度的了解了,话不多说我们下一步继续学手搓一个简单的ReAct Agent!
深入理解JavaScript中的深拷贝与浅拷贝:内存管理的艺术
围绕 JavaScript 深拷贝与浅拷贝展开,先介绍栈堆内存基础,再阐述浅拷贝共享引用、深拷贝完全独立的特点,讲解 JSON 与递归两种深拷贝实现,分析其局限性、应用场景,给出选择建议与实践方法。
2025年11月新手必备公众号排版工具实战指南:8款公众号排版软件测评与优选方案
《2025新媒体工具效率研究白皮书》数据显示,新手小白在公众号运营中面临的首要难题是“工具选择”,“公众号排版一般用什么软件”的搜索热度季度环比增长89%,而“公众号排版工具哪个最好”更是成为行业高频
优雅实现系统重试
进入正题之前,先引入这样一个场景: 接到这个需求,A同学开动小脑筋,马上就想到了解决策略,说干就干,A同学的代码结构如下: 其他接口的重试代码也大致是这样,A同学是一个有代码洁癖的程序员,重复的
事件循环其实很简单!
一、概念 JavaScript 是单线程执行(基于执行栈 / 调用栈 call stack),事件循环负责不断地从各种任务队列里取任务执行——以保证异步任务的函数回调按规则有序运行,浏览器环境和 No
设计模式-模板设计模式
在进入正题之前,先引入这样一个场景: 程序员A现在接到这样一个需求:这个需求有10个接口,这些接口都需要接收前端的传参,以及给前端返回业务状态信息。出于数据保密的要求,不管是前端传参还是最终参数返
AI-S1-07-卷积神经网络
昨天我们掌握了神经网络自我学习的“秘籍”(反向传播和梯度下降)。今天,我们来看看神经网络家族里的一位“专科医生”,它在处理图像方面有着无与伦比的天赋。 学习计划第七天:卷积神经网络 (Convolut
从0到1:揭秘LLM预训练前的海量数据清洗全流程
本文将深入剖析 llm-from-scratch 仓库中 alignment 模块,展示 SFT 的完整流程。 引言 大语言推理模型常见的两个痛点:一是“答不对”,二是“答不规范”。前者意味着推理链条
《Unity多语言开发:从文本到体验的深层适配指南》
本文聚焦Unity游戏多语言本地化的核心技术实践,跳出单纯文本翻译的表层认知,深入拆解语言特性与技术架构的深度耦合逻辑。
《Unity渲染实战宝典:突破平台限制的优化策略》
本文聚焦Unity渲染的核心优化逻辑,深入解构渲染管线、材质系统、光照阴影、后处理、纹理资源及管线适配六大关键环节。
2025 前端工具链封神指南:Rust+AI 驱动,从编码到上线效率翻倍
2025 前端工具链封神指南:Rust+AI 驱动,从编码到上线效率翻倍 前端开发早已进入 “工具决定效率” 的时代 —— 有人还在为 Webpack 配置头疼半天,有人用 Vite+AI 助手半天搞
为什么企业应用要构建在Web上?从架构看数据工具的未来(下)
前文中,我们得出一个明确的结论:SaaS(软件即服务)之所以能成为现代企业应用的绝对主流,是因为其B/S(Web原生)架构是实现“零摩擦交付”、“T+0持续迭代”和“订阅制商业模式”的唯一解。 然而,
JS普通对象与异质对象的行为
在 ECMAScript 的世界里,万物皆可为对象(或表现得像对象)。但这些形形色色的对象,其底层是否遵循着同一套行为准则?本章将揭示所有对象共享的秘密——一套名为“内部方法”的通用接口,并带你认识那
NVIDIA Isaac Lab 2.3机器人学习全流程优化
本文详细介绍NVIDIA Isaac Lab 2.3在机器人学习领域的技术更新,包括全身控制优化、远程操作系统增强、运动规划算法改进,以及新的策略评估框架,全面提升机器人模拟训练效率。
Java 开发三大神器:深入理解 Spring、Spring Boot 与 MyBatis-Plus
一、基石与灵魂:Spring Framework 如果把整个 Java 技术栈比作一座大厦,那么 Spring Framework 就是深埋地下的基石和贯穿整体的钢筋混凝土结构。它不仅是技术的基础,更
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30