用通用文字识别API实现文字“翩然”于纸上

76 阅读1分钟

通用文字识别API,它能够自动提取并快速识别图像中的文字内容,支持多场景下的文字识别,如文字提取与多语种识别,内容审核与风险规避,助力深度学习与图像理解,极大地提升了信息处理的效率和准确性,为人们节省了大量宝贵的时间和精力。

代码示例

请求参数说明:

名称必填类型说明
keystring个人中心查看
imgstring图像数据,base64编码后post请求,要求base64编码后大小不超过1M,支持jpg/jpeg/png格式。

返回参数说明:

名称类型说明
listarray识别文字

JSON返回示例

{
  "code": 0,
  "msg": "操作成功",
  "data": {
    "list": [
      "课堂笔记:2025年4月17日",
      "会议记录:项目进度讨论",
      "白板内容:团队周计划安排"
    ]
  }
}

Python代码示例:

接口地址:https://www.tanshuapi.com/market/detail-89
import base64
import requests
import json

# 图像文件路径
image_path = "example.jpg"

# API密钥(需替换为您个人的API密钥)
api_key = "your_api_key_here"

# 读取图像文件并进行base64编码
with open(image_path, "rb") as image_file:
    img_data = base64.b64encode(image_file.read()).decode("utf-8")

# 构建请求数据
request_data = {
    "key": api_key,
    "img": img_data
}

# API接口地址
api_url = "https://api.tanshuapi.com/api/ocr_general/v1/index"

# 发送POST请求
response = requests.post(api_url, json=request_data)

# 解析返回结果
result = response.json()
if result["code"] == 0:
    recognized_text = result["data"]["list"]
    print("识别成功,识别出的文字内容如下:")
    for text in recognized_text:
        print(text)
else:
    print(f"识别失败,错误信息:{result['msg']}")

总结

该API无论是个人用户还是企业机构,都能借助这一强大的工具,轻松实现图片文字的提取与转化,提升信息处理的效率和质量。