本文由【云老大】 TG@yunlaoda360 撰写
使用Google Cloud Vision API进行对象识别
-
创建Google Cloud项目:
- 访问Google Cloud Console并创建一个新项目。
- 启用Cloud Vision API。
- 创建服务账户并下载服务账户密钥文件(JSON格式)。
-
安装客户端库:
-
Google提供了多种编程语言的客户端库,包括Python、Java、Node.js、Ruby、Go和.NET。
-
以Python为例,可以通过pip安装客户端库:
bash
pip install google-cloud-vision
-
-
编写代码:
-
以下是一个简单的Python示例,展示如何使用Cloud Vision API进行对象识别:
Python
from google.cloud import vision from google.cloud.vision_v1 import types # 初始化客户端 client = vision.ImageAnnotatorClient() # 读取图像文件 with open('path/to/your/image.jpg', 'rb') as image_file: content = image_file.read() # 创建图像对象 image = types.Image(content=content) # 调用对象检测 response = client.object_localization(image=image) objects = response.localized_object_annotations # 打印检测到的对象 for obj in objects: print(f"Object: {obj.name}, Confidence: {obj.score}") print(f"Bounding Box: {obj.bounding_poly}")
-
-
运行代码:
- 确保设置了环境变量
GOOGLE_APPLICATION_CREDENTIALS,指向服务账户密钥文件的路径。 - 运行上述Python脚本,即可获取图像中检测到的对象及其置信度分数和边界框。
- 确保设置了环境变量
Google Cloud Vision API的核心功能
- 对象检测(Object Detection) :识别图像中的物体,并提供物体的边界框和置信度分数。
- 图像标记(Label Detection) :自动为图像生成描述性标签,帮助快速理解图像内容。
- 面部检测(Face Detection) :识别图像中的人脸,并提供面部特征的详细信息。
- 地标检测(Landmark Detection) :识别图像中的地标建筑或自然景观。
- 文本检测(Text Detection) :从图像中提取文本内容,支持多种语言。
- 安全搜索检测(Safe Search Detection) :检测图像中是否包含成人内容、暴力内容等。