Microsoft Azure 的 Computer Vision API 简介

109 阅读2分钟

ision API** 提供了多种强大的视觉分析功能,主要分为以下几类(用最简单的方式总结):# Microsoft Azure 的 Computer Vision API 提供了多种强大的视觉分析功能,主要分为以下几类(用最简单的方式总结):


1. 图像内容分析

  • 标签识别(Tagging):自动识别物体、场景或动作(如“狗”“沙滩”“跑步”)。
  • 物体检测(Object Detection):框出图像中的物体并标注(如“汽车:置信度92%”)。
  • 场景分类(Scene Detection):判断整体场景类型(如“户外”“会议室”)。

2. 文字处理(OCR)

  • 印刷体识别(OCR):提取图片中的文字(如扫描文档、路牌)。
  • 手写体识别(Handwriting Recognition):支持手写笔记或签名提取。

3. 人脸与人物分析

  • 人脸检测(Face Detection):定位人脸并返回坐标(不涉及身份识别)。
  • 人脸属性(Face Attributes):估计年龄、性别、表情(如“微笑”)。

4. 高级语义理解

  • 图像描述生成(Image Captioning):用一句话描述图片内容(如“一只猫坐在沙发上”)。
  • 名人/地标识别(Celebrity & Landmark Recognition):识别知名人物或景点(如“埃菲尔铁塔”)。

5. 内容审核

  • 成人/暴力内容检测(Content Moderation):标记敏感内容(如“成人内容:概率85%”)。

6. 其他实用功能

  • 缩略图生成(Smart Thumbnail):自动裁剪图片重点区域生成缩略图。
  • 颜色分析(Color Scheme):提取主色调和是否黑白图。
  • 图像类型判断(Image Type):区分剪贴画、插画或照片。

常用 API 示例

# 调用标签识别API
response = computervision_client.tag_image("图片URL")

# 调用OCR识别文字
response = computervision_client.read("图片URL", raw=True)

# 生成图像描述
response = computervision_client.describe_image("图片URL")

典型应用场景

  • 电商:自动生成商品图片标签(如“红色连衣裙”)。
  • 社交媒体:过滤违规图片内容。
  • 无障碍:为视障用户朗读图片描述。
  • 文档数字化:扫描纸质文件转文字。

免费额度

Azure 提供免费层(每月5000次基础API调用),适合学习和小规模测试。