首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
人工智能
MobotStone
创建于2023-11-12
订阅专栏
收集人工智能相关资料
等 32 人订阅
共43篇文章
创建于2023-11-12
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
从单次提问到系统工程:上下文设计如何推动大模型能力的升级
Anthropic公司最近公布了Claude 4模型的系统提示文本。 这些长达数千字的内容展示了如何通过设置提示词来引导大模型的每一次回答。 仔细阅读这些文本,可以直接获取优化大模型系统的方法。 以下
AI时代的加速器效应:好的更好,差的更差
很多公司都有一个危险的错觉:他们觉得只要用了人工智能,就能解决企业经营的根本问题。但实际上,这些企业的问题可能是商业模式过时、管理层决策错误或企业文化僵化。人工智能不仅解决不了这些根本缺陷,反而会让问
AI试点的艺术:如何用"小成功"撬动企业智能化转型
过去半年,我一直想写篇"泼冷水"的AI应用现状观察,但总感觉缺少几份真实的一线实践反馈。 转机出现在上周,我先后与几位科技公司的CTO深聊,当谈到各自企业的AI应用进展时,有些直言不讳的反馈实在过于真
2025年不得不知道AI 智能体系列五:打通大模型与工具的最后一公里
距离上次更新"AI智能体系列"已经过去一周了,我决定给这个系列做个完美收尾。当然要重点说说MCP。 在搭建AI智能系统时,最关键的就三大块:大脑(大模型)、工具(各种功能模块)和知识库(数据资料)。但
从试错到优化:大模型的循环改进策略
这是关于AI智能体系列文章的第四篇。虽然我们通常通过提示词工程来提升大语言模型的任务表现,但这种方法存在一个核心缺陷:它依赖模型一次性准确执行任务的能力。本文将讨论另一种通过反馈循环来改进大语言模型系
都2025年了你还不知道怎么用AI 智能体工作流架构吗?
这是关于AI智能体系列文章的第三篇。在前一篇文章中,我展示了大模型(LLMs)如何使用工具与现实世界系统互动,无需具体指令就能解决问题。虽然这种灵活性很强大,但它可能以控制力和可靠性为代价。在这里,我
2025年你必须知道如何利用工具提升大模型效果
欢迎回到AI智能体系列文章。在上一篇文章中,我们探讨了智能体系统的三大核心要素:大语言模型(LLM)、工具调用能力和推理决策机制。今天我们将深入解析这一架构中最基础的实现形态——LLM+工具的简易组合
2025年你真的懂AI智能体吗
刚刚结束全国教育系统紧张的高利害阶段的攻坚工作,我特别欣喜地正式将多个AI智能体部署至生产环境,并且取得了超出预期的成效。这段时间我们成功研发了几个实用的AI智能体应用: Text2SQL——实现了从
MCP vs Function Calling vs A2A:大模型技术协议横评,谁更胜一筹?
大模型时代主要采用三种核心协议方案:MCP(模型协作协议)、Function Calling(函数调用)和A2A(代理间通信协议)。这些协议在设计理念和应用场景上各有侧重: MCP专注于多模型间的协同
亲测!国内外12大MCP资源平台深度横评+避坑指南
MCP生态资源平台深度评测 当前MCP(Model Context Protocol)生态蓬勃发展,各类资源平台层出不穷。作为专注AI和程序开发的从业者,我全面评测了12个主流MCP资源平台,从工具完
MCP还是AI智能体?如何为你的AI应用选择最佳"大脑"架构
各位AI开发者们,说起大语言模型的应用开发,想必都遇到过这个经典难题: 👉 既要让模型能调用搜索、计算器、API等各种工具,又要保持它的智能性、适应性和可控性,该怎么设计架构? 目前行业主流的解决方案
让AI秒变你的助理:MCP实战全攻略
最近在公司做了很多AI工具分享,发现每次都要重复解释同样的内容。干脆把这些经验写成系列文章吧!不需要教科书式的长篇大论,只分享实践中马上能用的干货。 为什么需要MCP?先看这个例子 假设我要AI完成这
MCP协议:AI界的"万能插槽"革命
2024年11月,Anthropic公司发布的模型上下文协议(MCP) ,正如同90年代USB终结外设接口乱局——它为LLM与工具/数据的对接提供了标准化解决方案。目前主要兼容Claude模型,但协议
LLM路由实用智能——如何构建可靠、可扩展的 AI 应用程序
模型越来越大,储存量和上下文窗口容量越来越高,看似所向披靡。作为SmartAI的开发者,我亲眼见证实际应用中最适用的模型不一定是最强大的,而是要最契合场景的。 就像处理博士级别的数学题时,虽然有的模型
DeepSeek 成功的数学原理与实践
今天我们来回顾一下**群体相对策略优化 (GRPO)**背后的数学原理,这是 DeepSeek 强大推理能力的核心强化学习算法。我将一一分析 GRPO 的工作原理、关键组成部分,以及它为何能颠覆大型语
七个步骤带你轻松搭建商用 AI Agent
当我们着手打造商用AI代理时,通常会遇到以下一些问题: 在众多平台和工具中,我应该选择哪一个?是 Coze、Dify 还是 LangGraph?或者是自己开发一套系统? 在开发过程中有哪些关键的注意事
没有数据、没有GPU的情况下怎么训练DeepSeek
春节期间,AI 界热闹非凡,到处都是关于 DeepSeek 的报道。大家都知道,训练好的模型通常需要昂贵的专用 GPU,这对很多想试试微调技术的人来说,真是一道门槛。 好消息来了:你完全可以用免费的
手机也能跑大模型?DeepSeek-r1 部署教程来了!
现在,大家用手机的时间越来越长,对隐私安全的关注也越来越高。各大厂商也在琢磨,怎么才能让大模型直接跑在手机上。这几天写文章时,发现不少小伙伴都在问:怎么在手机上部署 DeepSeek? 既然大家都感兴
从零开始:使用DeepSeek-R1 实现高效的本地 RAG
有小伙伴私信我,DeepSeek-R1能用来搭建 RAG(检索增强生成)系统吗?答案是绝对可以! 春节前夕,我们接到了业务方的紧急任务,需要探讨如何将 DeepSeek-R1 快速集成到即将上线的项目
DeepSeek R1 简单指南:架构、训练、本地部署和硬件要求
DeepSeek推出的LLM推理新策略 DeepSeek最近发表的论文DeepSeek-R1中介绍了一种创新的方法,通过强化学习(RL)提升大型语言模型(LLM)的推理能力。这项研究在如何仅依靠强化学
下一页