大语言模型应用必知必会：LangChain和LlamaIndex快速入门LangChain和LlamaIndex作为当前

LangChain和LlamaIndex作为当前大语言模型（LLM）应用开发中的两大核心框架，均在2024-2025年持续推陈出新，推出了多种最新运行模式和最佳实践。以下是基于最新资料的详细总结，并给出一个具体的前沿使用案例示例。

LangChain最新运行模式与最佳实践

1. 架构稳定性与模块拆分

LangChain v0.2版本将核心库与社区扩展包（LangChain-Community）完全分离，使核心包更轻量、安全，便于生产环境稳定运行。
组件包拆分为LangChain-Core、LangChain和LangChain-Community，社区扩展包包含第三方集成，减少了核心包的依赖复杂度。

2. LangGraph智能体框架

引入了LangGraph，作为智能体（Agent）构建的推荐方式，支持更灵活的智能体工作负载定义。
LangGraph基于LCEL（链式可组合表达语言），支持智能体的循环定义和内置记忆，极大提升智能体定制能力和复杂任务处理能力。
保留旧的AgentExecutor接口，兼容旧代码，但鼓励使用LangGraph构建更强大的智能体。

3. 流式支持与异步改进

增强了对流媒体的支持，支持事件流API，适合实时交互和长文本生成。
改进异步支持，提升性能和响应速度，适合高并发场景。

4. 标准化接口与多模型支持

标准化了大型语言模型（LLM）接口，简化不同模型间切换。
新增30多个合作伙伴集成包，覆盖MongoDB、Miracle、Together AI、Google VertexAI等，方便与外部系统对接。

5. 企业级最佳实践

模板化Prompt设计，分层管理基础模板和业务模板。
严格版本控制和回滚机制，保证生产环境稳定。
性能优化和成本控制方案，适合从PoC到生产的平滑过渡。

LlamaIndex最新运行模式与最佳实践

1. 数据编排与RAG（检索增强生成）核心

LlamaIndex专注于RAG场景，通过构建结构化数据索引，结合智能检索机制，解决LLM知识时效性和领域适应性问题。
支持多种数据格式（PDF、Markdown、SQL数据库等）统一接入，方便整合异构数据源。

2. 多样化查询响应模式（ResponseMode）

支持多种响应模式控制生成结果：
- tree_summarize：适合文章总结，保证文本完整理解。
- refine：迭代式回答生成，适合关键词查询。
- compact：压缩多个文本块，节省token，效果较refine更优。
- simple_summarize：快速提炼，省token但可能丢失上下文。
- generation：纯生成，不依赖文档内容。
- no_text：占位符模式，暂时无实际应用。

3. 数据代理与知识工作者

LlamaIndex引入AI代理，遵循ReAct推理与行动模式，支持工具调用和API集成，提升自动化知识工作能力。

4. 集成与扩展

可与LangChain、Flask、Docker等生态无缝集成。
支持自定义低级API，方便高级用户定制数据连接器、索引和查询引擎。

5. 图数据库与知识图谱集成

支持将NebulaGraph等图数据库作为存储后端，实现GraphRAG（基于知识图谱的RAG）。
通过KnowledgeGraphIndex快速构建知识图谱索引，提升复杂关系查询和推理能力。

具体前沿使用案例示例

基于LangChain + Ollama + Chroma构建本地知识库问答系统

使用Ollama本地运行Qwen2.5大模型，结合LangChain框架进行链式调用。
通过Chroma向量数据库做文本嵌入和检索，结合LangChain的Prompt模板，实现上下文增强问答。
代码示例：

from langchain_ollama.llms import OllamaLLM
from langchain_ollama.embeddings import OllamaEmbeddings
from langchain_chroma import Chroma
from langchain_core.prompts import ChatPromptTemplate
from langchain_core.output_parsers import StrOutputParser
from langchain_core.runnables import RunnablePassthrough

model = OllamaLLM(model="qwen2.5:0.5b")
embeddings = OllamaEmbeddings(model="nomic-embed-text")
db = Chroma(embedding_function=embeddings, persist_directory='./embeddings')
retriever = db.as_retriever(search_kwargs={"k": 3})

template = """你是徐州工业职业技术学院的专业助手，能够根据知识库中的新闻稿回答问题：

{context}

问题：{question}

回答应简洁且准确，避免编造信息。
"""

prompt = ChatPromptTemplate.from_template(template)

chain = (
    {"context": retriever, "question": RunnablePassthrough()}
    | prompt
    | model
    | StrOutputParser()
)

def chat_with_system(question):
    response = chain.invoke(question)
    print(f"AI: {response}")
    return response

# 交互示例
if __name__ == "__main__":
    while True:
        user_input = input("You: ")
        if user_input.lower() in ["exit", "quit"]:
            break
        chat_with_system(user_input)

该案例展示了如何利用最新的LangChain智能体框架和本地LLM模型，结合向量数据库实现高效的上下文增强问答，适合企业内部知识库和本地化部署需求。

总结

LangChain v0.2通过架构拆分、LangGraph智能体、流式异步支持和丰富集成包，提升了框架稳定性和智能体定制能力，适合构建复杂多任务智能体系统。
LlamaIndex专注于RAG领域，提供多样化响应模式、强大的数据索引和知识图谱集成，适合构建高效的知识管理和智能问答系统。
两者均支持与主流LLM和生态系统深度集成，结合使用可实现更强大的大模型应用。

以上内容基于2024-2025年最新公开资料整理，反映了LangChain和LlamaIndex的前沿运行模式和最佳实践，以及一个具体的本地知识库问答系统示例