首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
后端
前端
Android
iOS
人工智能
开发工具
代码人生
阅读
领域数据在NLU模型蒸馏中胜于教师知识
研究表明,在自然语言理解任务中,仅使用任务特定数据蒸馏的学生模型,其性能优于混合通用数据训练的模型。该发现为低延迟应用(如语音助手)的模型压缩提供了新思路,验证了目标域数据蒸馏的优越性。
AI编程载体赋能研发全流程:从环境搭建到代码交付的效率革
在研发团队的日常工作中,环境配置繁琐、单任务执行效率受限、代码审查存在盲区、跨设备研发受制约等问题,一直是影响研发效率的核心痛点。传统AI编程工具多聚焦于代码补全、片段生成等单一功能,难以从底层解决
Seedance 2.0刷屏之后:当AI开始「导演」电影,我们该如何保持「人类观众」的清醒?
Seedance 2.0刷屏之后:当AI开始「导演」电影,我们该如何保持「人类观众」的清醒? 过去一周,整个内容创作界都被一种混合着兴奋与焦虑的情绪笼罩。字节跳动推出的Seedance 2.0,用一段
实测震撼:1美元/小时的开源模型,编程能力追平Claude Opus 4.6
MiniMax M2.5 重磅登场,在关键的编码基准测试中,与 Claude Opus 4.6 这些全球最顶尖大模型间的差距已无限缩小!
从向量到文字:Transformer 的预测与输出(LM Head)
在经过 $N$ 层 Decoder 的复杂思考(Attention, MLP, MoE)后,模型最终需要将抽象的数学向量转化为人类可读的文字。这个过程主要发生在模型的“输出头”——LM Head。 一
让 AI 帮你写代码?先学会跟它说话
提示词不是聊天,而是给 AI 的结构化需求文档。本文从角色、上下文、指令、示例、约束五个基础要素出发,延伸到十维度进阶技巧,结合实战模板和踩坑经验,讲透如何写出让 AI 生成可用代码的提示词。
Seedance2.0真的太强了
Seedance2.0真的太强了 ①支持多模态(文本、图像、音频、视频) ②自带音效、BGM ③自带字幕、文案 ④真实感(符合物理规律、人物/画面自然) ⑤指令遵循强 ⑥导演视角(自带分镜,自然语言描
老金开源Agent Teams编排Skill:一句话自动组队,手动挡时代结束了
术语说明:"Swarm/蜂群"是多Agent协作的通用说法(OpenAI有官方项目叫Swarm),但 Claude Code的官方概念是Agent Teams。本文使用官方术语Agent Teams,
从“全能大脑”到“专家集群”:MLP 与 MoE 架构深度白皮书
在大语言模型(LLM)的 Decoder Block 中,如果说 Attention 负责信息的社交与分发,那么 MLP(及其演进版 MoE)则负责信息的内化与推理。它是模型真正的“知识仓库”。 第一
LaRecipe模板注入漏洞(CVE-2025-53833)深度剖析:从SSTI到RCE的完整攻击链分析
深入分析CVE-2025-53833漏洞,这是一个影响LaRecipe文档生成器(版本<2.8.1)的严重服务器端模板注入漏洞。未经身份验证的攻击者可利用该漏洞执行任意代码,窃取敏感信息如数据库凭据和
Gemini安全防御:对抗指令注入攻击
本文阐述了某机构在保护Gemini模型免受间接提示注入攻击方面的技术策略。文章详细介绍了自动化红队测试、模型加固等安全技术,通过多层防御体系显著提升了模型对抗恶意指令的能力,确保AI代理的安全可靠。
告别手写公式的烦恼
告别手写公式的烦恼 数学公式的数字化困境 记得大学时整理数学笔记,最头疼的就是那些复杂的手写公式。想要把它们变成电子版,要么一个字一个字地敲LaTeX代码,要么用鼠标在公式编辑器里艰难地点选。直到发现
openFuyao 社区 2025 年度报告,致谢所有同行者!
自 2025 年 5 月宣布开源以来,openFuyao 社区已汇聚 30 家成员单位、300 多名开发者、成立 16 个 SIG,围绕多样化算力集群生产场景,探索算力极致释放新路径。
Deepseek技术深挖:Multi-head Latent Attention (MLA) 全解析
一、 技术背景:KV Cache 的“维度灾难” 在标准 Transformer 或 GQA 架构中,随着上下文长度和模型维度的增加,KV Cache 成为系统的头号性能杀手: 显存占用量 (VRAM
NVIDIA免费API的申请与配置
前言 小伙伴们大家好,我是小溪,见字如面。今天记录一下申请英伟达免费API的流程,希望对有需要的小伙伴有所帮助。对其他免费API内容感兴趣的小伙伴可以看往期内容: 智谱清言提供的免费模型及工具推荐 限
2026数字助理时代真的要来临了——直接自然语言操作AI助理,马斯克预言真的来了
今天年前最后一天班,马上下班了,让AI看看还有没有回老家的火车票。结果AI还真的自己打开浏览器,打开12306页面,自己搜索。神奇了。2026数字助理时代真的要来临了。 后台真的自动打开浏览器去处理了
一天一个开源项目(第22篇):nanochat - 百元级「最好的 ChatGPT」,Karpathy 的极简 LLM 训练套件
深入解读 nanochat,Andrej Karpathy 打造的极简 LLM 实验套件,用单一复杂度旋钮(depth)在单机多卡上完成 tokenization、预训练、微调、评估与聊天 UI
Transform 注意力机制:多头注意力、KV Cache、PagedAttention、FlashAttention
一、 注意力机制:多维语义的并行构建 注意力机制是 Transformer 的灵魂,其核心任务是在海量序列中实现高价值特征的选择性聚合。 1.1 核心公式与参数定义 $$\text{Attention
我的本地知识库探索之旅:安全与高效并存
我的本地知识库探索之旅:安全与高效并存 初识本地知识库 作为一名经常需要处理大量文档的职场人,我一直在寻找一种既能快速查找文件内容,又能保护数据隐私的解决方案。直到最近,我接触到了本地知识库这个概念。
高压电线电力巡检六类目标的图像识别数据集分享(适用于目标检测任务)
高压电线电力巡检六类目标的图像识别数据集分享(适用于目标检测任务) 数据集分享 如需下载该数据集,可通过以下方式获取: 网盘链接: https://pan.baidu.com/s/1rNbncL8NW
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30