Skip to content

Step-Audio-TTS-3B

简洁描述:使用 Step-Audio-TTS-3B 模型将文本转换为语音。


概览

  • 请求方法:POST
  • 路径:/v1/audio/speech
  • 内容类型:application/json

认证方式

  • Header:Authorization: Bearer <token>
  • 可选 Header:Accept: */*

请求示例

请求体参数

参数类型必填描述
modelstring模型名称,填写 Step-Audio-TTS-3B
inputstring需要生成语音的文本
extra_bodyobject额外参数对象,用于提供参考文本或音色模仿音频
extra_body.prompt_textstring参考文本内容,用于辅助音色模仿,支持 zhen
extra_body.prompt_audio_urlstring音色模仿音频 URL,只支持 WAV 格式

curl 示例

bash
curl -X POST "https://api.gpt.ge/v1/audio/speech" \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer sk-xxxx" \
  -H "Accept: */*" \
  -d '{
    "model": "Step-Audio-TTS-3B",
    "input": "您好,我是 morphogen TTS 小助手,感谢体验我们的 API 服务!",
    "extra_body": {
      "prompt_text": "zh",
      "prompt_audio_url": "https://example.com/path/to/voice.wav"
    }
  }'

JavaScript (fetch) 示例

javascript
fetch('https://api.gpt.ge/v1/audio/speech', {
  method: 'POST',
  headers: {
    'Content-Type': 'application/json',
    'Authorization': 'Bearer sk-xxxx',
    'Accept': '*/*'
  },
  body: JSON.stringify({
    model: 'Step-Audio-TTS-3B',
    input: '您好,我是 morphogen TTS 小助手,感谢体验我们的 API 服务!',
    extra_body: {
      prompt_text: 'zh',
      prompt_audio_url: 'https://example.com/path/to/voice.wav'
    }
  })
}).then(r => r.blob()).then(console.log)

Python 示例(requests)

python
import requests

response = requests.post(
    'https://api.gpt.ge/v1/audio/speech',
    headers={
        'Content-Type': 'application/json',
        'Authorization': 'Bearer sk-xxxx',
        'Accept': '*/*'
    },
    json={
        'model': 'Step-Audio-TTS-3B',
        'input': '您好,我是 morphogen TTS 小助手,感谢体验我们的 API 服务!',
        'extra_body': {
            'prompt_text': 'zh',
            'prompt_audio_url': 'https://example.com/path/to/voice.wav'
        }
    }
)
print(response.status_code)
print(response.content[:20])

返回示例(200)

text
<直接返回音频文件数据,例如 MP3 或 WAV 二进制内容>

注意:响应通常直接返回所选音频格式的音频文件内容。