首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
大模型技术学习
风生水气
创建于2024-07-20
订阅专栏
个人学习过程中总结的一些大模型相关的技术
等 7 人订阅
共22篇文章
创建于2024-07-20
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
关于AI Coding工具使用的一些经验分享
Ai 编程工具可以帮助我们提升开发效率,但如果使用不当可能反而会降低效率。今天主要分享一下这段时间AI Coding中遇到的一些问题以及解决方法。
项目剖析:基于Agent的个人知识管理系统如何设计
本文档主要从整体架构、dataflow的视角剖析khoj项目,分析应该一个知识管理Agent系统的架构是怎样的。如果你也在做类似的事,希望能有一定的启发作用。
在supabase中实现关键词检索和语义检索
怎么基于supabase来实现关键词检索、语义检索、混合检索呢?是否需要引入额外的向量数据库呢?本文将描述如何在supabase中实现这些检索。
让AI Agent能记住用户偏好:mem0源码分析
在ai agent应用中,某些场景下可能需要记住用户的喜好,从而根据用户的一些偏好来对用户问题的回答进行调整。那么如何记住用户的偏好呢?今天介绍一种实现方式:mem0
DeepSeek-R1论文中的一些关键信息
最近DeepSeek-R1展现出了惊人的推理效果,在推理能力上达到了当前业内最新的水平。那么它是怎么训练出来的?为什么有这么好的效果呢?带着这些问题,我去阅读了下DeepSeek R1的相关论文。
Agent白皮书解读:了解AI Agent
本文主要是针对google Agents白皮书的解读,抽取出其中一些比较重要的部分进行展示。读完本文希望读者能够对AI时代的Agent有更加深入的了解。
Cache-Augmented Generation(CAG):一种新的生成增强方案
缓存增强生成(CAG)**消除了检索延迟并最小化了检索错误,同时保持了上下文相关性**。今天我们来看一看这篇论文中的一些先进的解决方案。
Mooncake:kimi后端推理服务的架构设计
本文依托论文《Mooncake: A KVCache-centric Disaggregated Architecture for LLM Serving》来讲解kimi的后端服务架构Mooncake
RAGCache:针对RAG应用特点进行设计的Cache
本文将介绍一个最新的Cache:RAGCache,它是针对RAG应用的特点设计了一套分层的缓存系统,通过它可以提升应用的吞吐量,加速了应用的处理。
Lovable: 使用自然语言构建web app
之前的文章中我们已经介绍和探索了两款使用自然语言构建应用程序的工具,今天,我们介绍另一款相关的工具:Lovable。
深入理解大模型应用中的Cache:GPTCache
本文将主要聚焦于技术栈中应用层和底层基座之间中间件层的缓存(*个人定位*),以开源项目GPTCache(LLM的语义缓存)为例,深入讲解这部分缓存的结构和关键实现。
bot.new: 另一个自然语言编程的低代码平台
上一篇文章中,介绍了v0.dev这样一个利用自然语言进行编程的低代码平台。那除了它之外,还有没有其他类似的工具呢?这篇文章会介绍另一个类似功能的平台:bot.new
V0.dev:更符合用户习惯的低代码平台
之前的文章《关于大模型应用到低代码平台的一些想法》中,曾经描述过我对于低代码平台的设计构想,在这种构想下以聊天对话内容为主,其他部分为辅。最近,我发现一些实现这种想法的工具。在这里做一下分享。
windows部署基于Composio的skekit应用问题解决记录
windows部署skekit应用时需要的问题解决记录。skekit(SWE Development Kit)是一个使用 Composio 的工具生态系统构建软件工程代理的强大框架。
RAG新动向:CORAL,多轮对话RAG的benchmark
最近开始有关于RAG的研究将关注点聚焦到了多轮对话上,他们构造了关于多轮对话RAG的benchmark。本文是对《CORAL: Benchmarking Multi-turn Conversation
大模型部署和推理加速
如何对训练好的模型进行部署呢?目前有哪些部署方式呢?本文将从部署演进的视角,来阐述大模型部署方式以及其中涉及到的推理优化过程。
构建大模型应用的技术栈浅析
本文主要从上层的视角分析了大模型应用的架构和基本流程,并基于流程梳理了每个流程中涉及到的技术/工具/框架,为后续继续探索打下了基础。
关于大模型应用到低代码平台的一些想法
在大模型应用发展起来之前,可能最最简单的方式只能是拖拽了,因为应用本身不具备意图理解和推理的能力,无法让用户以更简单的方式进行交互。但随着大模型应用的兴起,一种更新的交互方式逐渐呈现出来。
RAG 学习完结篇:思考与总结
关于RAG的学习,准备到这里暂时告一段落。在当前的学习过程中发现实际落地还是要依托于更加确定的业务场景和业务数据,但目前来说并没有遇到很合适的继续发展下去的场景。因此,准备暂时搁置RAG,继续探索其他
RAG能否进一步抽象成Agent?关于RAG系统构建的一些想法
最近在不断地学习RAG相关的知识,这个学习过程中对于RAG的认知也在不断地改变。这篇文章主要记录一些当前最新的想法。
下一页