AIFrontiers

公众号: AI-Frontiers

赞

1

|

搜索文章

3天前

LLM核心参数配置指南：基础篇

拆解LLM API每个核心参数的作用机制，并通过真实案例演示如何像调节「旋钮」一样，精准操控AI的输出效果，让AI更好地服务于实际业务需求。...

0

评论

8天前

transformer学习资源汇总

原文：https://mp.weixin.qq.com/s/qap5mePkP2rVbVSMsaBUMw 欢迎关注公zh: AI-Frontiers 苏剑林大师的博客序号...

0

评论

17天前

Context Engineering要过时？AI圈新风口「Harness Engineering」，OpenAI/Anthropic齐发力

随着LLM从简单的chatbot演进为可自主执行复杂任务的Agent，AI圈的范式正在发生深刻的转变。最近，AI圈内又火了一个新名词：Harness Engineerin...

0

评论

22天前

Google 迎来「DeepSeek 时刻」：TurboQuant算法实现3bit无损、8×加速、6×压缩、零预处理

TurboQuant算法通过几何视角的向量量化手段，从根本上解决自回归推理中的「内存墙」难题。该技术结合了PolarQuant（极坐标量化）与QJL（Quantized J...

0

评论

26天前

GLM技术复盘：21篇论文深度解读智谱模型家族

从2022年双语稠密模型GLM-130B的破局，到2026年以智能体工程为导向的GLM-5家族，智谱AI不仅见证了中国大模型产业从追赶到并跑的转变，更在MoE架构优化、推理...

0

评论

1月前

GraphRAG开源生态全景：6大主流开源项目，微软/蚂蚁/港大项目同台PK

本篇将对当前开源社区内关注度最高、技术路线最具代表性的GraphRAG项目进行全方位解析，深入剖析其技术架构、核心特性、适用场景，并为企业及开发者提供严谨的选型战略建议。...

0

评论

1月前

万字长文解读Qwen进化史：27篇论文深度复盘Qwen模型家族

本篇将按照时间倒序从2026年3月追溯至2023年9月，梳理了Qwen生态系统中发布的27项LLM核心技术成果：基座大模型历经Qwen → Qwen2 → Qwen2.5 ...

0

评论

1月前

收藏！AI代理全家桶：MCP/Skills/Agent /OpenClaw，原理+操作指南一步到位

原文: https://mp.weixin.qq.com/s/ZUKdpMX1CfolrHCY4IkcqA 欢迎关注公zh: AI-Frontiers...

0

评论

1月前

从ResNet到mHC：DeepSeek重构残差连接，额外开销仅6.7%，附复现代码

原文: https://mp.weixin.qq.com/s/ZuA3zSpVHo1-bGB2tQuRpg 关注公zh: AI-Frontiers 延续在节假日搞事情的习惯...

1

评论

2月前

收藏！RAG核心工具大全: 7大解析工具+向量模型+数据库+检索排序

原文: https://mp.weixin.qq.com/s/5XAWHqjZspU9xtC_CckV3w 关注gzh: AI-Frontiers RAG往期文章推荐 RA...

0

评论

2月前

3年，从0到全球领跑：万字长文拆解DeepSeek大模型技术演进

原文： https://mp.weixin.qq.com/s/MG9nB7VYK-N4Q3RQFiwcuw gzh: AI-Frontiers...

0

评论

2月前

收藏！LLM开发全链路：5大步骤+15大框架，从数据治理到RLHF一文通关

这一链路涵盖了从海量异构数据的精炼、超大规模分布式环境下的模型训练、特定任务驱动的指令微调，到最终模型输出与人类价值观对齐的RLHF阶段。如近的开源生态系统已涌现出一批高性...

0

评论

2月前

收藏！LLM-RL训练框架：3大流派+6大框架，一文搞定

本报告将深度解构分析TRL、OpenRLHF、verl、LLaMA Factory四大主流开源LLM-RL训练框架，及 DeepSpeed等重要生态组件，围绕架构设计、关键...

0

评论

3月前

小白也能看懂的LLM-RL算法：PPO/DPO/GRPO/GSPO

先解释一些基本概念，涵盖强化学习理解、价值函数、NLP中的强化学习。随后，介绍RLHF的起源、设计思路、如何与大模型RLHF算法关联的。再对LLM-RL主流的（PPO、D...

0

评论

3月前

250个LLM 评估基准大盘点！从推理到多模态，一文看懂LLM考试大纲

原文：https://mp.weixin.qq.com/s/ihKJVqs3TWXVQcqnsjZ9Og 选不对 LLM，业务落地全是坑！面对五花八门的大模型，你是否还在纠...

0

评论

3月前

RAG效果差？7个指标让你的准确率大幅提升

原文: https://mp.weixin.qq.com/s/VV29xpdOMEkbz4iXmD_szg 在上一篇 RAG评测完整指南：指标、测试和最佳实践中，我们对R...

0

评论

4月前

小白也能看懂的RLHF-PPO：原理篇

原文: https://mp.weixin.qq.com/s/8O7W8--x14-b1d3M9IS_3w LLM-RL往期文章推荐小白也能看懂的RL-PPO 收藏！强化...

0

评论

4月前

RAG评测完整指南：指标、测试和最佳实践

RAG框架是一个复杂的工作流，包括分块、搜索、上下文拼接和内容生成等步骤，一旦系统最终响应的内容不符合预期，对于问题的定位会非常复杂，是模型出现了幻觉？还是从一开始就没有获...

0

评论

4月前

Huggingface 214页训练手册：揭秘构建世界级大语言模型的秘密

The Smol Training Playbook: The Secrets to Building World-Class LLMs 由 Hugging Face 团队...

0

评论

个人成就

文章被点赞 1

文章被阅读 4,623

加入于

2025-11-20