首页
AI Coding
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
大语言模型应用
sivdead
创建于2024-01-16
订阅专栏
大语言模型相关应用,如RAG,ApiExecution,nl2sql等
等 3 人订阅
共6篇文章
创建于2024-01-16
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
当前智能体的几种形式
工作流驱动稳定低成本适合大部分场景,自主决策型灵活但贵且不稳定,多智能体目前不成熟。建议:优先工作流 > 自主决策 >>> 多智能体。
智能体记忆机制详解
本文旨在从记忆的分类体系出发,深入剖析各类记忆的技术实现与权衡,并进一步探讨前沿的基于 Agent 的主动式记忆管理,最终为开发者在不同场景下设计和选型记忆模块提供一份兼具理论深度与实践价值的指南
从提示到编排:上下文工程与生产级 AI 系统
上下文工程并非对提示工程的简单重命名,而是一门系统级工程学科。其目标是在恰当的时间、以恰当的格式,为 LLM 提供完成任务所需的信息与工具
SpringBoot思维害了我!FastAPI定时任务设计思维转换
现在切换到Python+FastAPI来开发智能体应用,习惯性的使用SpringBoot的方式来处理一些问题,最后才发现,进程模型不一样,很多东西都没法直接套用
3万字符也不怕!Langchain Embedding长度限制优化
一个知识库构建过程中如何解决 Embedding 模型长度限制问题的实践记录: 最近在构建知识库时遇到了一个棘手问题:某些文档的文本块长度超过了 Embedding 模型的上下文限制,导致调用失败。
Fastapi+Langgraph工作流接口优化
最近在做一个智能体项目,基于 FastAPI + Gunicorn + LangGraph 搭建。本以为用了异步架构会很丝滑,结果上线后各种问题接踵而至:工作流初始化慢、worker经常kill