Skip to content

任务:OCR服务

简洁描述:使用 OCR 服务识别图像或文档中的文本,并生成可下载的文本或文档结果。


概览

  • 请求方法:POST
  • 路径:/task/pic/ocr
  • 内容类型:multipart/form-data

认证方式

  • Header:Authorization: Bearer <token>

请求示例

表单参数

参数类型必填说明
image_filefile源图像或文档文件(二进制),与 image_url 二选一,支持 pdf、ppt、pptx、xls、xlsx、doc、docx、jpeg、jpg、png、gif、bmp
image_urlstring源图像或文档 URL,与 image_file 二选一,建议使用 80 或 443 端口地址
formatstring输出格式,支持 txtpdfdocxxlsxpptx
languagestring输入文件语言,默认 ChinesePRC;支持多语言逗号分隔,例如 English,ChinesePRC,Digits
passwordstring文档密码,若输入文件存在密码则传入,最长 32 位

curl 示例

bash
curl -X POST "https://api.gpt.ge/task/pic/ocr" \
  -H "Authorization: Bearer sk-xxxx" \
  -F "image_url=https://example.com/document.pdf" \
  -F "format=txt" \
  -F "language=ChinesePRC,English" \
  -F "password=123456"

JavaScript (fetch) 示例

javascript
const formData = new FormData();
formData.append('image_url', 'https://example.com/document.pdf');
formData.append('format', 'txt');
formData.append('language', 'ChinesePRC,English');
formData.append('password', '123456');

fetch('https://api.gpt.ge/task/pic/ocr', {
  method: 'POST',
  headers: {
    'Authorization': 'Bearer sk-xxxx'
  },
  body: formData
}).then(r => r.json()).then(console.log);

Python(requests)示例

python
import requests

url = 'https://api.gpt.ge/task/pic/ocr'
headers = {
    'Authorization': 'Bearer sk-xxxx'
}

files = {
    'image_url': (None, 'https://example.com/document.pdf')
}
data = {
    'format': 'txt',
    'language': 'ChinesePRC,English',
    'password': '123456'
}

response = requests.post(url, headers=headers, files=files, data=data)
print(response.json())

返回示例(200)

json
{
  "status": 200,
  "data": {
    "file": "https://wxtechsz.oss-cn-shenzhen.aliyuncs.com/tasks/output/ocr/a695981c-5c4f-45c4-a931-92bf4f58077f.txt",
    "type": 101,
    "state": 1,
    "task_id": "a695981c-5c4f-45c4-a931-92bf4f58077f",
    "progress": 100,
    "ocr_pages": 1,
    "created_at": 1746953927,
    "file_pages": 1,
    "input_size": 116929,
    "output_size": 164,
    "completed_at": 1746953930,
    "processed_at": 1746953927,
    "state_detail": "Complete"
  }
}

注意:该接口使用 multipart/form-data 上传文件,建议仅使用 image_fileimage_url 中的一种方式提交源文件;language 参数支持多语言逗号分隔,名称区分大小写。