大模型技术学习

大模型技术学习

大模型技术学习

个人学习过程中总结的一些大模型相关的技术

等 8 人订阅共24篇文章创建于2024-07-20

vllm部署实践：windows单显卡上部署qwen模型

本文主要记录一下windows上使用vlllm做本地模型部署并对外提供api服务的部署过程，帮助有类似需求的朋友快速部署，减少踩坑

7月前
761
点赞
评论

关于AI Coding的一些踩坑经验

最近工作中也开始尝试完全使用ai coding来完成工作内容了，但说实话，这不仅要求我们对业务逻辑的理解到位，更要求我们对业务逻辑的描述准确。否则ai coding经常会莫名奇妙的生成一些无关的内容。

8月前
595
点赞
评论

关于AI Coding工具使用的一些经验分享

Ai 编程工具可以帮助我们提升开发效率，但如果使用不当可能反而会降低效率。今天主要分享一下这段时间AI Coding中遇到的一些问题以及解决方法。

11月前
756
5
4

项目剖析:基于Agent的个人知识管理系统如何设计

本文档主要从整体架构、dataflow的视角剖析khoj项目，分析应该一个知识管理Agent系统的架构是怎样的。如果你也在做类似的事，希望能有一定的启发作用。

1年前
400
1
评论

项目剖析:基于Agent的个人知识管理系统如何设计

在supabase中实现关键词检索和语义检索

怎么基于supabase来实现关键词检索、语义检索、混合检索呢？是否需要引入额外的向量数据库呢？本文将描述如何在supabase中实现这些检索。

1年前
353
1
评论

让AI Agent能记住用户偏好：mem0源码分析

在ai agent应用中，某些场景下可能需要记住用户的喜好，从而根据用户的一些偏好来对用户问题的回答进行调整。那么如何记住用户的偏好呢？今天介绍一种实现方式：mem0

1年前
1.0k
3
评论

让AI Agent能记住用户偏好：mem0源码分析

DeepSeek-R1论文中的一些关键信息

最近DeepSeek-R1展现出了惊人的推理效果，在推理能力上达到了当前业内最新的水平。那么它是怎么训练出来的？为什么有这么好的效果呢？带着这些问题，我去阅读了下DeepSeek R1的相关论文。

1年前
311
2
评论

DeepSeek-R1论文中的一些关键信息

Agent白皮书解读：了解AI Agent

本文主要是针对google Agents白皮书的解读，抽取出其中一些比较重要的部分进行展示。读完本文希望读者能够对AI时代的Agent有更加深入的了解。

1年前
480
3
评论

Agent白皮书解读：了解AI Agent

Cache-Augmented Generation（CAG）：一种新的生成增强方案

缓存增强生成（CAG）**消除了检索延迟并最小化了检索错误，同时保持了上下文相关性**。今天我们来看一看这篇论文中的一些先进的解决方案。

1年前
650
1
评论

Cache-Augmented Generation（CAG）：一种新的生成增强方案

Mooncake：kimi后端推理服务的架构设计

本文依托论文《Mooncake: A KVCache-centric Disaggregated Architecture for LLM Serving》来讲解kimi的后端服务架构Mooncake

1年前
905
点赞
评论

Mooncake：kimi后端推理服务的架构设计

RAGCache：针对RAG应用特点进行设计的Cache

本文将介绍一个最新的Cache：RAGCache，它是针对RAG应用的特点设计了一套分层的缓存系统，通过它可以提升应用的吞吐量，加速了应用的处理。

1年前
1.2k
2
评论

RAGCache：针对RAG应用特点进行设计的Cache

Lovable: 使用自然语言构建web app

之前的文章中我们已经介绍和探索了两款使用自然语言构建应用程序的工具，今天，我们介绍另一款相关的工具：Lovable。

1年前
1.1k
点赞
评论

Lovable: 使用自然语言构建web app

深入理解大模型应用中的Cache：GPTCache

本文将主要聚焦于技术栈中应用层和底层基座之间中间件层的缓存（*个人定位*），以开源项目GPTCache（LLM的语义缓存）为例，深入讲解这部分缓存的结构和关键实现。

1年前
760
1
评论

深入理解大模型应用中的Cache：GPTCache

bot.new: 另一个自然语言编程的低代码平台

上一篇文章中，介绍了v0.dev这样一个利用自然语言进行编程的低代码平台。那除了它之外，还有没有其他类似的工具呢？这篇文章会介绍另一个类似功能的平台：bot.new

1年前
309
点赞
评论

bot.new: 另一个自然语言编程的低代码平台

V0.dev：更符合用户习惯的低代码平台

之前的文章《关于大模型应用到低代码平台的一些想法》中，曾经描述过我对于低代码平台的设计构想，在这种构想下以聊天对话内容为主，其他部分为辅。最近，我发现一些实现这种想法的工具。在这里做一下分享。

1年前
274
点赞
评论

V0.dev：更符合用户习惯的低代码平台

windows部署基于Composio的skekit应用问题解决记录

windows部署skekit应用时需要的问题解决记录。skekit(SWE Development Kit）是一个使用 Composio 的工具生态系统构建软件工程代理的强大框架。

1年前
275
点赞
1

windows部署基于Composio的skekit应用问题解决记录

RAG新动向：CORAL，多轮对话RAG的benchmark

最近开始有关于RAG的研究将关注点聚焦到了多轮对话上，他们构造了关于多轮对话RAG的benchmark。本文是对《CORAL: Benchmarking Multi-turn Conversation

1年前
1.1k
点赞
评论

RAG新动向：CORAL，多轮对话RAG的benchmark

大模型部署和推理加速

如何对训练好的模型进行部署呢？目前有哪些部署方式呢？本文将从部署演进的视角，来阐述大模型部署方式以及其中涉及到的推理优化过程。

1年前
1.5k
点赞
1

构建大模型应用的技术栈浅析

本文主要从上层的视角分析了大模型应用的架构和基本流程，并基于流程梳理了每个流程中涉及到的技术/工具/框架，为后续继续探索打下了基础。

1年前
828
1
1

关于大模型应用到低代码平台的一些想法

在大模型应用发展起来之前，可能最最简单的方式只能是拖拽了，因为应用本身不具备意图理解和推理的能力，无法让用户以更简单的方式进行交互。但随着大模型应用的兴起，一种更新的交互方式逐渐呈现出来。

1年前
278
点赞
评论

关于大模型应用到低代码平台的一些想法