whisper-1

简洁描述：使用 OpenAI whisper-1 模型将音频转录为文本。

概览

请求方法：POST
路径：/v1/audio/transcriptions
内容类型：multipart/form-data

认证方式

Header：Authorization: Bearer <token>
支持 bearer token 认证

请求示例

请求体参数

参数	类型	必填	描述
file	file	是	音频文件对象，支持格式：`flac`、`mp3`、`mp4`、`mpeg`、`mpga`、`m4a`、`ogg`、`wav`、`webm`。文件大小上限 25 MB
model	string	是	模型名称，填写 `whisper-1`
prompt	string	否	可选提示文本，用于引导转录风格，建议与音频语言一致
response_format	string	否	输出格式，支持 `json`、`text`、`srt`、`verbose_json`、`vtt`。默认 `json`
temperature	number	否	采样温度，范围 `0` 到 `1`。值越高输出越随机，值越低输出越稳定
timestamp_granularities	array	否	时间戳粒度，可选 `response_format`、`verbose_json`、`word`、`segment`
language	string	否	音频语言，推荐使用 ISO-639-1 代码以提高转录准确性

curl 示例

bash

curl -X POST "https://api.gpt.ge/v1/audio/transcriptions" \
  -H "Authorization: Bearer sk-xxxx" \
  -F "file=@./audio.wav" \
  -F "model=whisper-1" \
  -F "response_format=json" \
  -F "language=zh"

JavaScript (fetch) 示例

javascript

const formData = new FormData();
formData.append('file', audioFile);
formData.append('model', 'whisper-1');
formData.append('response_format', 'json');
formData.append('language', 'zh');

fetch('https://api.gpt.ge/v1/audio/transcriptions', {
  method: 'POST',
  headers: {
    'Authorization': 'Bearer sk-xxxx'
  },
  body: formData
}).then(r => r.json()).then(console.log);

Python (requests) 示例

python

import requests

with open('audio.wav', 'rb') as f:
    files = {'file': f}
    data = {
        'model': 'whisper-1',
        'response_format': 'json',
        'language': 'zh'
    }
    response = requests.post(
        'https://api.gpt.ge/v1/audio/transcriptions',
        headers={'Authorization': 'Bearer sk-xxxx'},
        files=files,
        data=data
    )
print(response.json())

返回示例（200）

json

{
  "text": "你好，我是 OpenAI Whisper 模型。"
}

注意：若选择 response_format 为 srt、vtt 或 verbose_json，输出将包含更详细的时间戳或字幕信息。

whisper-1 ​

概览 ​

认证方式 ​

请求示例 ​

请求体参数 ​

curl 示例 ​

JavaScript (fetch) 示例 ​

Python (requests) 示例 ​

返回示例（200） ​

whisper-1

概览

认证方式

请求示例

请求体参数

curl 示例

JavaScript (fetch) 示例

Python (requests) 示例

返回示例（200）