Skip to content

whisper-large-v3-turbo

简洁描述:使用 OpenAI whisper-large-v3-turbo 模型将音频快速转录为文本,适用于低延迟多语种语音识别。


概览

  • 请求方法:POST
  • 路径:/v1/audio/transcriptions
  • 内容类型:multipart/form-data

认证方式

  • Header:Authorization: Bearer <token>
  • 支持 bearer token 认证

请求示例

请求体参数

参数类型必填描述
filefile音频文件对象,支持格式:flacmp3mp4mpegmpgam4aoggwavwebm。文件大小上限 25 MB
modelstring模型名称,填写 whisper-large-v3-turbo
response_formatstring输出格式,支持 jsontextsrtverbose_jsonvtt。默认 json
languagestring音频语言,支持 zhendees。建议使用 ISO-639-1 代码提高识别准确性

whisper-large-v3-turbo 是一款高效、低延迟的语音识别模型,适合实时语音处理和大规模应用场景。


curl 示例

bash
curl -X POST "https://api.gpt.ge/v1/audio/transcriptions" \
  -H "Authorization: Bearer sk-xxxx" \
  -F "file=@./audio.wav" \
  -F "model=whisper-large-v3-turbo" \
  -F "response_format=json" \
  -F "language=zh"

JavaScript (fetch) 示例

javascript
const formData = new FormData();
formData.append('file', audioFile);
formData.append('model', 'whisper-large-v3-turbo');
formData.append('response_format', 'json');
formData.append('language', 'zh');

fetch('https://api.gpt.ge/v1/audio/transcriptions', {
  method: 'POST',
  headers: {
    'Authorization': 'Bearer sk-xxxx'
  },
  body: formData
}).then(r => r.json()).then(console.log);

Python (requests) 示例

python
import requests

with open('audio.wav', 'rb') as f:
    files = {'file': f}
    data = {
        'model': 'whisper-large-v3-turbo',
        'response_format': 'json',
        'language': 'zh'
    }
    response = requests.post(
        'https://api.gpt.ge/v1/audio/transcriptions',
        headers={'Authorization': 'Bearer sk-xxxx'},
        files=files,
        data=data
    )
print(response.json())

返回示例(200)

json
{
  "text": "你好,这是 OpenAI Whisper Large V3 Turbo 转录的结果。"
}

注意:whisper-large-v3-turbo 在低延迟和高准确度之间提供优秀平衡,适用于实时语音转录场景。