笔记 哈哈哈哈哈哈哈哈853 2026-04-28 5 阅读1分钟 【AI工程化】 LLM应用:RAG全流程(文档切分/向量化/重排序)、Agent工作流(ReAct/Plan-and-Solve)、Prompt Engineering 模型服务:vLLM推理加速、TensorRT-LLM、模型量化(INT8/AWQ)、API流式输出 啊问问啊啊额