向量检索服务基于阿里云自研的向量引擎 Proxima 内核,提供具备水平拓展、全托管、云原生的高效向量检索服务。向量检索服务将强大的向量管理、查询等能力,通过简洁易用的 SDK/API 接口透出,方便在大模型知识库搭建、多模态 AI 搜索等多种应用场景上集成。
| 功能集 | 功能 | 功能描述 | 参考文档 |
|---|---|---|---|
| 实例管理 | 实例创建 | 通过产品详情页或控制台创建Cluster实例。 | * 开通服务 * 创建Cluster |
| 实例升配 | 支持在控制台进行Cluster实例的升配。 | 升配Cluster | |
| 实例状态查询 | 支持通过控制台查询实例详情。 | 控制台介绍 | |
| 监控报警 | 通过控制台查看Cluster的监控数据、创建报警规则和管理报警规则。 | 监控报警 | |
| 实例释放 | 支持在控制台进行实例释放。 | 释放Cluster | |
| Collection管理 | 创建Collection | 支持通过控制台、SDK、API三种不同的方式创建Collection。支持在新建Collection时选择对应的量化策略。 | * 创建Collection * 向量动态量化 |
| 自定义Field字段 | 向量检索服务DashVector在设计上支持Schema Free,在插入Doc、更新Doc、插入或更新Doc时,可设置任意KeyValue结构的字段(Field)。 | Schema Free | |
| 删除Collection | 支持通过控制台、SDK、API三种不同的方式查看Collection详情。例如DOC数、Schema信息等。 | 控制台介绍 | |
| 查看Collection | 支持通过控制台、SDK、API三种不同的方式查看Collection详情。例如DOC数、Schema信息等。 | 控制台介绍 | |
| Partition管理 | 创建Partition | 支持通过控制台、SDK、API三种不同的方式创建Partition。 | 创建Partition |
| 删除Partition | 支持通过控制台、SDK、API三种不同的方式删除Partition。 | 删除Partition | |
| 向量管理 | 向量入库 | 支持通过控制台、SDK、API三种不同的方式新增向量。 | 向量新增 |
| 检索向量 | 支持通过控制台、SDK、API三种不同的方式检索向量。检索时支持条件过滤检索,支持分组向量检索(group_by),只支持关键词感知检索。 | * 向量检索 * 条件过滤检索 * 分组检索Doc * 关键词感知检索 | |
| 更新向量 | 支持通过控制台、SDK、API三种不同的方式更新向量。 | 向量更新 | |
| 删除向量 | 支持通过控制台、SDK、API三种不同的方式删除向量。 | 向量删除 | |
| 开发工具 | SDK参考 | 向量检索服务当前支持Python和Java语言的SDK。 | * Python SDK * Java SDK |
| HTTP API | 向量检索服务当前支持HTTP API方式调用。 | HTTP API | |
| 访问控制 | RAM鉴权 | 向量检索服务支持RAM账号授予访问。 | * 向量检索服务RAM授权 * 监控报警服务RAM授权 |
| 白名单 | 向量检索服务支持通过控制台添加、修改、复制和删除Cluster实例的公网IP白名单。 | IP白名单管理 | |
| 内网访问 | 向量检索服务支持何使用专有网络进行内网连接。 | 专有网络 | |
| API-KEY管理 | API-KEY是访问向量检索服务的密钥。 | API-KEY管理 |