首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
LLM
AIFrontiers
创建于2026-02-12
订阅专栏
介绍LLM的底层原理、应用
暂无订阅
共7篇文章
创建于2026-02-12
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
LLM核心参数配置指南:基础篇
拆解LLM API每个核心参数的作用机制,并通过真实案例演示如何像调节「旋钮」一样,精准操控AI的输出效果,让AI更好地服务于实际业务需求。
transformer学习资源汇总
原文:https://mp.weixin.qq.com/s/qap5mePkP2rVbVSMsaBUMw 欢迎关注公zh: AI-Frontiers 苏剑林大师的博客 序号 发布日期 文章标题 链接
Context Engineering要过时?AI圈新风口「Harness Engineering」,OpenAI/Anthropic齐发力
随着LLM从简单的chatbot演进为可自主执行复杂任务的Agent,AI圈的范式正在发生深刻的转变。 最近,AI圈内又火了一个新名词:Harness Engineering。
Google 迎来「DeepSeek 时刻」:TurboQuant算法实现3bit无损、8×加速、6×压缩、零预处理
TurboQuant算法通过几何视角的向量量化手段,从根本上解决自回归推理中的「内存墙」难题。该技术结合了PolarQuant(极坐标量化)与QJL(Quantized Johnson-Lindens
GLM技术复盘:21篇论文深度解读智谱模型家族
从2022年双语稠密模型GLM-130B的破局,到2026年以智能体工程为导向的GLM-5家族,智谱AI不仅见证了中国大模型产业从追赶到并跑的转变,更在MoE架构优化、推理思维对齐、长时程智能体协作等
万字长文解读Qwen进化史:27篇论文深度复盘Qwen模型家族
本篇将按照时间倒序从2026年3月追溯至2023年9月,梳理了Qwen生态系统中发布的27项LLM核心技术成果:基座大模型历经Qwen → Qwen2 → Qwen2.5 → Qwen3 → Qwen
从ResNet到mHC:DeepSeek重构残差连接,额外开销仅6.7%,附复现代码
原文: https://mp.weixin.qq.com/s/ZuA3zSpVHo1-bGB2tQuRpg 关注公zh: AI-Frontiers 延续在节假日搞事情的习惯,2026年元旦期间,Dee