创建翻译
简洁描述:使用 OpenAI Whisper 相关模型将音频翻译为目标文本。
概览
- 请求方法:
POST - 路径:
/v1/audio/translations - 内容类型:
multipart/form-data
认证方式
- Header:
Authorization: Bearer <token> - 支持 bearer token 认证
请求示例
请求体参数
| 参数 | 类型 | 必填 | 描述 |
|---|---|---|---|
| file | file | 是 | 音频文件对象,支持格式:flac、mp3、mp4、mpeg、mpga、m4a、ogg、wav 或 webm |
| model | string | 是 | 模型名称,通常填写 whisper-1 |
| prompt | string | 否 | 可选提示文本,用于引导翻译风格,建议使用英文 |
| response_format | string | 否 | 输出格式,支持 json、text、srt、verbose_json 或 vtt。默认 json |
| temperature | number | 否 | 采样温度,范围 0 到 1。值越高输出越随机,值越低输出越稳定 |
| timestamp_granularities | array | 否 | 时间戳粒度,可选 response_format、verbose_json、word、segment |
| language | string | 否 | 音频语言,推荐使用 ISO-639-1 代码以提高翻译准确性 |
curl 示例
bash
curl -X POST "https://api.gpt.ge/v1/audio/translations" \
-H "Authorization: Bearer sk-xxxx" \
-F "file=@./audio.wav" \
-F "model=whisper-1" \
-F "response_format=json" \
-F "language=zh"JavaScript (fetch) 示例
javascript
const formData = new FormData();
formData.append('file', audioFile);
formData.append('model', 'whisper-1');
formData.append('response_format', 'json');
formData.append('language', 'zh');
fetch('https://api.gpt.ge/v1/audio/translations', {
method: 'POST',
headers: {
'Authorization': 'Bearer sk-xxxx'
},
body: formData
}).then(r => r.json()).then(console.log);Python (requests) 示例
python
import requests
with open('audio.wav', 'rb') as f:
files = {'file': f}
data = {
'model': 'whisper-1',
'response_format': 'json',
'language': 'zh'
}
response = requests.post(
'https://api.gpt.ge/v1/audio/translations',
headers={'Authorization': 'Bearer sk-xxxx'},
files=files,
data=data
)
print(response.json())返回示例(200)
json
{
"text": "Hello, my name is Wolfgang and I come from Germany. Where are you heading today?"
}注意:翻译接口会返回已翻译的文本结果,若选择
response_format为srt、vtt或verbose_json,将包含时间戳或字幕信息。