Gemini TTS 系列
简洁描述:使用 Gemini TTS 系列模型将文本转换为语音。
概览
- 请求方法:
POST - 路径:
/v1/audio/speech - 内容类型:
application/json
认证方式
- Header:
Authorization: Bearer <token> - 支持 bearer token 认证
请求示例
请求体参数
| 参数 | 类型 | 必填 | 描述 |
|---|---|---|---|
| model | string | 是 | 模型名称,可选 gemini-2.5-flash-preview-tts 或 gemini-2.5-pro-preview-tts |
| input | string | 是 | 需要生成语音的文本,最大长度 10000 字符 |
| voice | string | 是 | 音色名称,可参考官方文档,如 achernar、leda、zubenelgenubi 等 |
| response_format | string | 否 | 音频格式,默认 wav。支持:mp3、opus、aac、flac、wav、pcm |
| temperature | number | 否 | 温度控制,范围 0 到 2。值较低时语音一致性更高 |
建议使用默认的
wav或pcm格式以获得更高效率。
curl 示例
bash
curl -X POST "https://api.gpt.ge/v1/audio/speech" \
-H "Content-Type: application/json" \
-H "Authorization: Bearer sk-xxxx" \
-d '{
"model": "gemini-2.5-flash-preview-tts",
"input": "您好,我是 v-api TTS 小助手,欢迎使用我们的 API 服务!",
"voice": "leda",
"response_format": "mp3",
"temperature": 1.0
}'JavaScript (fetch) 示例
javascript
fetch('https://api.gpt.ge/v1/audio/speech', {
method: 'POST',
headers: {
'Content-Type': 'application/json',
'Authorization': 'Bearer sk-xxxx'
},
body: JSON.stringify({
model: 'gemini-2.5-flash-preview-tts',
input: '您好,我是 v-api TTS 小助手,欢迎使用我们的 API 服务!',
voice: 'leda',
response_format: 'mp3',
temperature: 1.0
})
}).then(r => r.blob()).then(console.log)Python 示例(requests)
python
import requests
response = requests.post(
'https://api.gpt.ge/v1/audio/speech',
headers={
'Content-Type': 'application/json',
'Authorization': 'Bearer sk-xxxx'
},
json={
'model': 'gemini-2.5-flash-preview-tts',
'input': '您好,我是 v-api TTS 小助手,欢迎使用我们的 API 服务!',
'voice': 'leda',
'response_format': 'mp3',
'temperature': 1.0
}
)
print(response.status_code)
print(response.content[:20])返回示例(200)
text
<直接返回音频文件数据,例如 WAV 或 MP3 二进制内容>注意:响应通常会直接返回所选
response_format的音频文件内容,并在响应头中包含使用量信息,如X-Usage。