首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
小爷毛毛_卓寿杰
掘友等级
大模型算法
NLP对话、大模型、AIGC。 微信视频号:毛毛AIGC
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
0
文章 0
沸点 0
赞
0
返回
|
搜索文章
最新
热门
【OpenClaw算法】系统提示工程:构建高效Agent指令的算法实现
引言 想象一下,你要给一个AI助手写一份工作说明书。这份说明书要告诉它:你是谁、你能做什么、应该怎么工作、要注意什么。在AI Agent的世界里,这份"工作说明书"就是系统提示。 OpenClaw的系
【OpenClaw算法】上下文管理:智能窗口管理与压缩优化
引言 想象一下,你正在和一个AI助手进行长时间的对话。随着对话越来越长,AI需要记住的内容也越来越多。但是,AI的"记忆空间"是有限的——这就是我们常说的"上下文窗口"。如果对话内容超出了这个窗口,A
Xinference vLLM Rerank 分数异常:Cross-Encoder 参数顺序的致命陷阱
问题现象 在 Xinference版本中,用户报告了一个严重的分数异常问题。使用 vLLM 引擎部署 bge-reranker-v2-m3 模型时,对于完全不相关的查询-文档对,返回了接近 1 的高相
SlideFlow: AI 驱动的 PPT 自动化生成引擎
Github地址:https://github.com/xiaoyesoso/SlideFlow SlideFlow 不仅仅是一个 PPT 生成器,它是一个基于 LangGraph 状态机编排、MCP
修复 Xinference + vLLM 启动失败:0 bytes read 错误的真实原因与解决方案
🔥 问题现象:vLLM 模式下大模型启动失败 但轻量模型的嵌入模型仍可正常运行: 关键背景: 使用 vLLM 作为推理引擎 模型为 Qwen2.5-14B-GPTQ-Int4(约 8–9GB 磁盘大小
FastW2V-JNI:从模型到移动端语义检索的完整落地实践
github 项目地址:https://github.com/xiaoyesoso/FastW2V-JNI 一、项目背景:为什么是 FastW2V-JNI? 在很多中文业务场景里,我们经常会遇到类似的
检索增强的大模型工具调用:语义驱动的精准API选择技术
🔥🔥🔥Retrieval-Augmented Tool Selector 工具已开源!!! 求 Star ⭐️⭐️⭐️ :https://github.com/xiaoyesoso/retrieval
问题修复记录:Dify Docker Sandbox 指定Pip源 与 代码运行无权限 问题
如何安装 Pip 包 在 volumes/sandbox/dependencies/python-requirements.txt 文件里面添加需要的包就行。sandbox容器启动后就会开始下载。 如
问题修复记录:Xinference部署 Embedding Model 服务偶发超时
1. 异常表现 用 Xinference 部署Embedding Model,正常来说一次调用在 0.0x s 就能返回了,但是总会调着调着突然有超时的情况(超时设置为 0.2s)。 以下为排查时的耗
问题修复记录:Linux docker 部署 dify,无法调用宿主机本地服务
使用docker compose启动Dify后,在其中配置本地xinference中的模型,报错: get xinference model extra parameter failed, url
下一页
个人成就
文章被点赞
1
文章被阅读
10,261
掘力值
359
关注了
3
关注者
8
收藏集
0
关注标签
16
加入于
2022-04-11