笔记

5 阅读1分钟

【AI工程化】 LLM应用:RAG全流程(文档切分/向量化/重排序)、Agent工作流(ReAct/Plan-and-Solve)、Prompt Engineering 模型服务:vLLM推理加速、TensorRT-LLM、模型量化(INT8/AWQ)、API流式输出

啊问问啊啊额