当您听到“以图搜图”时,是否首先想到了百度、Google 等搜索引擎的以图搜图功能呢?事实上,您完全可以搭建一个属于自己的以图搜图系统:自己建立图片库;自己选择一张图片到库中进行搜索,并得到与其相似的若干图片。
Milvus 作为一款针对海量特征向量的相似性检索引擎,旨在助力分析日益庞大的非结构化数据,挖掘其背后蕴含的巨大价值。为了让 Milvus 能够应用于相似图片检索的场景,我们基于 Milvus 和图片特征提取模型 VGG 设计了一个以图搜图系统。
1. 数据准备
说明:您也可以使用其他的图片数据进行加载。目前支持的图片格式有 .jpg 格式、 .png 格式。
2. 系统概览
3. VGG 模型
VGGNet 由牛津大学的视觉几何组( Visual Geometry Group )和 Google DeepMind 公司的研究员共同提出,是 ILSVRC-2014 中定位任务第一名和分类任务第二名。其突出贡献在于证明使用很小的卷积( 3*3 ),增加网络深度可以有效提升模型的效果,而且 VGGNet 对其他数据集具有很好的泛化能力。VGG 模型在多个迁移学习任务中的表现要优于 GoogleNet ,从图像中提取 CNN 特征, VGG 模型是首选算法。因此,在本方案中选择 VGG 作为深度学习模型。
VGGNet 探索了 CNN 的深度及其性能之间的关系,通过反复堆叠 3*3 的小型卷积核和 2*2 的最大池化层, VGGNet 成功地构筑了 16-19 层深的 CNN 。在本方案中使用了 Keras 的应用模块( keras.applications )提供的 VGG16 模型。
(1) VGG16 结构
VGG16 共包含 13个 卷积层( Convolutional Layer ), 3 个全连接层( Fully connected Layer ), 5 个池化层( Pool layer )。其中,卷积层和全连接层具有权重系数,因此也被称为权重层,总数目为 13+3=16 ,这即是 VGG16 中 16 的来源。(池化层不涉及权重,因此不属于权重层,不被计数)。
(2) VGG16 特点
- 卷积层均采用相同的卷积核参数
- 池化层均采用相同的池化核参数
- 模型是由若干卷积层和池化层堆叠( stack )的方式构成,比较容易形成较深的网络结构

(3) VGG16 块结构

(4) 权重参数
4. API 介绍
(1) train
methods | name | type |
---|---|---|
POST | File | string |
from preprocessor.vggnet import VGGNetnorm_feat = model.vgg_extract_feat(img_path)
from indexer.index import milvus_client, insert_vectorsstatus, ids = insert_vectors(index_client, table_name, vectors)
from diskcache import Cachefor i in range(len(names)): cache[ids[i]] = names[i]
(2) process
(3) count
(4) search
methods | Num | file |
---|---|---|
POST | topk (int) | image file |
from preprocessor.vggnet import VGGNetnorm_feat = model.vgg_extract_feat(img_path)
from milvus import Milvus, IndexType, MetricType, Statusstatus, results = client.search_vectors(table_name=table_name, query_records=vectors, top_k=top_k, nprobe=16)
from diskcache import Cachedef query_name_from_ids(vids): res = [] cache = Cache(default_cache_dir) for i in vids: if i in cache: res.append(cache[i]) return res
(5) delete
5. 镜像构建
(1) 构建 pic-search-webserver 镜像
$ git clone https://github.com/milvus-io/bootcamp.git$ cd bootcamp/solutions/pic_search/webserver# 构建镜像$ docker build -t pic-search-webserver .# 查看生成的镜像$ docker images | grep pic-search-webserver
$ docker pull milvusbootcamp/pic-search-webserver:0.1.0
(2) 构建 pic-search-webclient 镜像
$ git clone https://github.com/milvus-io/bootcamp.git$ cd bootcamp/solutions/pic_search/webclient# 构建镜像$ docker build -t pic-search-webclient .# 查看生成的镜像$ docker images | grep pic-search-webclient
$ docker pull milvusbootcamp/pic-search-webclient:0.1.0
6. 系统部署
Step 1 启动 Milvus Docker
Step 2 启动 pic-search-webserver docker
$ docker run -d --name zilliz_search_images_demo \-v IMAGE_PATH1:/tmp/pic1 \-v IMAGE_PATH2:/tmp/pic2 \-p 35000:5000 \-e "DATA_PATH=/tmp/images-data" \-e "MILVUS_HOST=192.168.1.123" \milvusbootcamp/pic-search-webserver:0.1.0
Step 3 启动 pic-search-webclient docker
$ docker run --name zilliz_search_images_demo_web \-d --rm -p 8001:80 \-e API_URL=http://192.168.1.123:35000 \milvusbootcamp/pic-search-webclient:0.1.0
7. 界面展示
VGG 官方网站:http://www.robots.ox.ac.uk/~vgg/research/very_deep/VGG Github:https://github.com/machrisaa/tensorflow-vgg
github.com/milvus-io/milvus
milvus.io
milvusio.slack.com