通用文字识别API,它能够自动提取并快速识别图像中的文字内容,支持多场景下的文字识别,如文字提取与多语种识别,内容审核与风险规避,助力深度学习与图像理解,极大地提升了信息处理的效率和准确性,为人们节省了大量宝贵的时间和精力。
代码示例
请求参数说明:
| 名称 | 必填 | 类型 | 说明 |
|---|---|---|---|
| key | 是 | string | 个人中心查看 |
| img | 是 | string | 图像数据,base64编码后post请求,要求base64编码后大小不超过1M,支持jpg/jpeg/png格式。 |
返回参数说明:
| 名称 | 类型 | 说明 |
|---|---|---|
| list | array | 识别文字 |
JSON返回示例
{
"code": 0,
"msg": "操作成功",
"data": {
"list": [
"课堂笔记:2025年4月17日",
"会议记录:项目进度讨论",
"白板内容:团队周计划安排"
]
}
}
Python代码示例:
接口地址:https://www.tanshuapi.com/market/detail-89
import base64
import requests
import json
# 图像文件路径
image_path = "example.jpg"
# API密钥(需替换为您个人的API密钥)
api_key = "your_api_key_here"
# 读取图像文件并进行base64编码
with open(image_path, "rb") as image_file:
img_data = base64.b64encode(image_file.read()).decode("utf-8")
# 构建请求数据
request_data = {
"key": api_key,
"img": img_data
}
# API接口地址
api_url = "https://api.tanshuapi.com/api/ocr_general/v1/index"
# 发送POST请求
response = requests.post(api_url, json=request_data)
# 解析返回结果
result = response.json()
if result["code"] == 0:
recognized_text = result["data"]["list"]
print("识别成功,识别出的文字内容如下:")
for text in recognized_text:
print(text)
else:
print(f"识别失败,错误信息:{result['msg']}")
总结
该API无论是个人用户还是企业机构,都能借助这一强大的工具,轻松实现图片文字的提取与转化,提升信息处理的效率和质量。