Skip to content

图生视频

概览

  • 接口:图生视频(Image → Video)
  • 说明:将图片作为起始帧并根据文本描述生成短视频。
  • 模型:海螺(MiniMax-Hailuo 系列)

认证

  • 使用 Bearer Token(在请求头 Authorization: Bearer <token> 中传入)。

请求参数

  • 请求 Content-Type:application/json

  • 请求体字段:

    • model (string, 必填)

      • 模型名称,可选值:
        • MiniMax-Hailuo-2.3
        • MiniMax-Hailuo-2.3-Fast
        • MiniMax-Hailuo-02
        • I2V-01-Director
        • I2V-01-live
        • I2V-01
    • prompt (string)

      • 视频的文本描述,最大 2000 字符。对于 MiniMax-Hailuo-2.3、MiniMax-Hailuo-2.3-Fast、MiniMax-Hailuo-02 和 I2V-01-Director 系列模型,支持使用 [指令] 语法进行运镜控制。

      可在 prompt 中通过 [指令] 格式添加运镜指令,以实现精确的镜头控制。

      支持 15 种运镜指令的指令:

      • 左右移: [左移], [右移]

      • 左右摇: [左摇], [右摇]

      • 推拉: [推进], [拉远]

      • 升降: [上升], [下降]

      • 上下摇: [上摇], [下摇]

      • 变焦: [变焦推近], [变焦拉远]

      • 其他: [晃动], [跟随], [固定]

      使用规则:

      • 组合运镜: 同一组 [] 内的多个指令会同时生效,如 [左摇,上升],建议组合不超过 3 个。

      • 顺序运镜: prompt 中前后出现的指令会依次生效,如 "...[推进], 然后...[拉远]"。

      • 自然语言: 也支持通过自然语言描述运镜,但使用标准指令能获得更准确的响应。

      多运镜教程及模板,可参考 运镜使用教程

    • prompt_optimizer (boolean, 可选, 默认 true)

      • 是否自动优化 prompt,默认为 true。设为 false 可进行更精确的控制。
    • fast_pretreatment (boolean, 可选, 默认 false)

      • 是否缩短 prompt_optimizer 的优化耗时,默认为 false。仅对 MiniMax-Hailuo-2.3、MiniMax-Hailuo-2.3-Fast 和 MiniMax-Hailuo-02 模型生效。
    • duration (integer, 必填)

      • 视频时长(秒),默认值为 6。其可用值与模型和分辨率相关:

        模型720p768p1080P
        MiniMax-Hailuo-2.3-6或106
        MiniMax-Hailuo-2.3-Fast-6或106
        MiniMax-Hailuo-02-6或106
        其他模型6-6
    • resolution (string, 必填)

      • 视频分辨率。其可用值与模型相关:

        模型6s10s
        MiniMax-Hailuo-2.3768P (默认), 1080P768P (默认)
        MiniMax-Hailuo-2.3-Fast768P (默认), 1080P768P (默认)
        MiniMax-Hailuo-02512P, 768P (默认), 1080P512P, 768P (默认)
        其他模型720P (默认)不支持
    • callback_url (string, 可选)

      • 接收任务状态更新通知的回调 URL。支持通过 callback_url 参数可以配置回调,以接收任务状态的更新的异步通知。

      地址验证:配置后,MiniMax 服务器会向 callback_url 发送一个 POST 请求,请求体中包含 challenge 字段。服务端需要在 3 秒内原样返回该 challenge 值以完成验证。

      状态更新:验证成功后,每当任务状态变更时,MiniMax 都会向该 URL 推送最新的任务状态。推送的数据结构与调用查询视频生成任务接口的响应体一致。

      回调返回的“status”包括以下状态:

      • processing - 生成中
      • success - 成功
      • failed - 失败
    • first_frame_image (string, 必填)

      • 将指定图片作为视频的起始帧。支持公网 URL 或 Base64 编码的 Data URL (data:image/jpeg;base64,...)。

      图片要求:

      • 格式:JPG, JPEG, PNG, WebP

      • 体积:小于 20MB

      • 尺寸:短边像素大于 300px,长宽比在 2:5 和 5:2 之间

请求示例

curl 示例:

bash
curl -X POST "https://api.gpt.ge/task/minimax/v1/video_generation" \
  -H "Authorization: Bearer $YOUR_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "MiniMax-Hailuo-02",
    "prompt": "女孩骑上马背[右移],然后拽着马头转身,飞奔而去[拉远]。",
    "duration": 10,
    "resolution": "768P",
    "first_frame_image": "https://p2.a.kwimgs.com/bs2/upload-ylab-stunt/ai_portal/1731125871/6N0QrAnAeU/409-f054fa25c21a.png"
  }'

请求体示例(JSON):

json
{
  "model": "MiniMax-Hailuo-02",
  "prompt": "女孩骑上马背[右移],然后拽着马头转身,飞奔而去[拉远]。",
  "duration": 10,
  "resolution": "768P",
  "first_frame_image": "https://p2.a.kwimgs.com/bs2/upload-ylab-stunt/ai_portal/1731125871/6N0QrAnAeU/409-f054fa25c21a.png"
}

成功响应示例

响应示例(JSON):

json
{
  "task_id": "106916112212032",
  "base_resp": {
    "status_code": 0,
    "status_msg": "success"
  }
}

返回字段说明

  • task_id (string):任务 ID,用于后续查询任务状态与结果。

  • base_resp (object):基础返回信息

    • status_code (integer):状态码,0 表示成功。
    • status_msg (string):状态信息描述。

(注:完整的响应结构中可能包含更丰富的状态与结果字段,具体以实际返回为准。)

说明

  • 请注意参数必填字段,如果缺失必填参数,有可能造成无法识别内部模型名称。

  • 对于支持指令语法的模型,建议在 prompt 中使用标准指令以获得更可控的运镜效果。

  • 回调配置与图片要求详见请求参数说明。