- 🎨 文生图 / 图生图
- 🎬 文生视频 / 图生视频
- 🎞️ 首尾帧视频
- 🔄 AT/ST自动刷新 - AT 过期自动刷新,ST 过期时自动通过浏览器更新(personal 模式)
- 📊 余额显示 - 实时查询和显示 VideoFX Credits
- 🚀 负载均衡 - 多 Token 轮询和并发控制
- 🌐 代理支持 - 支持 HTTP/SOCKS5 代理
- 📱 Web 管理界面 - 直观的 Token 和配置管理
- 🎨 图片生成连续对话
- 🧩 Gemini 官方请求体兼容 - 支持
generateContent/streamGenerateContent、systemInstruction、contents.parts.text/inlineData/fileData - ✅ Gemini 官方格式已实测出图 - 已使用真实 Token 验证
/models/{model}:generateContent可正常返回官方candidates[].content.parts[].inlineData
-
Docker 和 Docker Compose(推荐)
-
或 Python 3.8+
-
由于Flow增加了额外的验证码,你可以自行选择使用浏览器打码或第三发打码: 注册YesCaptcha并获取api key,将其填入系统配置页面
YesCaptcha API密钥区域 -
默认
docker-compose.yml建议搭配第三方打码(yescaptcha/capmonster/ezcaptcha/capsolver)。 如需 Docker 内有头打码(browser/personal),请使用下方docker-compose.headed.yml。 -
自动更新st浏览器拓展:Flow2API-Token-Updater
# 克隆项目
git clone https://github.com/TheSmallHanCat/flow2api.git
cd flow2api
# 启动服务
docker-compose up -d
# 查看日志
docker-compose logs -f说明:Compose 已默认挂载
./tmp:/app/tmp。如果把缓存超时设为0,语义是“不自动过期删除”;若希望容器重建后仍保留缓存文件,也需要保留这个tmp挂载。
# 使用 WARP 代理启动
docker-compose -f docker-compose.warp.yml up -d
# 查看日志
docker-compose -f docker-compose.warp.yml logs -f适用于你有虚拟化桌面需求、希望在容器里启用有头浏览器打码的场景。
该模式默认启动Xvfb + Fluxbox实现容器内部可视化,并设置ALLOW_DOCKER_HEADED_CAPTCHA=true。
仅开放应用端口,不提供任何远程桌面连接端口。
# 启动有头模式(首次建议带 --build)
docker compose -f docker-compose.headed.yml up -d --build
# 查看日志
docker compose -f docker-compose.headed.yml logs -f- API 端口:
8000 - 进入管理后台后,将验证码方式设为
browser或personal
# 克隆项目
git clone https://github.com/TheSmallHanCat/flow2api.git
cd flow2api
# 创建虚拟环境
python -m venv venv
# 激活虚拟环境
# Windows
venv\Scripts\activate
# Linux/Mac
source venv/bin/activate
# 安装依赖
pip install -r requirements.txt
# 启动服务
python main.py服务启动后,访问管理后台: **http://localhost:8000**,首次登录后请立即修改密码!
- 用户名:
admin - 密码:
admin
| 模型名称 | 说明 | 尺寸 |
|---|---|---|
gemini-2.5-flash-image-landscape |
图/文生图 | 横屏 |
gemini-2.5-flash-image-portrait |
图/文生图 | 竖屏 |
gemini-3.0-pro-image-landscape |
图/文生图 | 横屏 |
gemini-3.0-pro-image-portrait |
图/文生图 | 竖屏 |
gemini-3.0-pro-image-square |
图/文生图 | 方图 |
gemini-3.0-pro-image-four-three |
图/文生图 | 横屏 4:3 |
gemini-3.0-pro-image-three-four |
图/文生图 | 竖屏 3:4 |
gemini-3.0-pro-image-landscape-2k |
图/文生图(2K) | 横屏 |
gemini-3.0-pro-image-portrait-2k |
图/文生图(2K) | 竖屏 |
gemini-3.0-pro-image-square-2k |
图/文生图(2K) | 方图 |
gemini-3.0-pro-image-four-three-2k |
图/文生图(2K) | 横屏 4:3 |
gemini-3.0-pro-image-three-four-2k |
图/文生图(2K) | 竖屏 3:4 |
gemini-3.0-pro-image-landscape-4k |
图/文生图(4K) | 横屏 |
gemini-3.0-pro-image-portrait-4k |
图/文生图(4K) | 竖屏 |
gemini-3.0-pro-image-square-4k |
图/文生图(4K) | 方图 |
gemini-3.0-pro-image-four-three-4k |
图/文生图(4K) | 横屏 4:3 |
gemini-3.0-pro-image-three-four-4k |
图/文生图(4K) | 竖屏 3:4 |
imagen-4.0-generate-preview-landscape |
图/文生图 | 横屏 |
imagen-4.0-generate-preview-portrait |
图/文生图 | 竖屏 |
gemini-3.1-flash-image-landscape |
图/文生图 | 横屏 |
gemini-3.1-flash-image-portrait |
图/文生图 | 竖屏 |
gemini-3.1-flash-image-square |
图/文生图 | 方图 |
gemini-3.1-flash-image-four-three |
图/文生图 | 横屏 4:3 |
gemini-3.1-flash-image-three-four |
图/文生图 | 竖屏 3:4 |
gemini-3.1-flash-image-landscape-2k |
图/文生图(2K) | 横屏 |
gemini-3.1-flash-image-portrait-2k |
图/文生图(2K) | 竖屏 |
gemini-3.1-flash-image-square-2k |
图/文生图(2K) | 方图 |
gemini-3.1-flash-image-four-three-2k |
图/文生图(2K) | 横屏 4:3 |
gemini-3.1-flash-image-three-four-2k |
图/文生图(2K) | 竖屏 3:4 |
gemini-3.1-flash-image-landscape-4k |
图/文生图(4K) | 横屏 |
gemini-3.1-flash-image-portrait-4k |
图/文生图(4K) | 竖屏 |
gemini-3.1-flash-image-square-4k |
图/文生图(4K) | 方图 |
gemini-3.1-flash-image-four-three-4k |
图/文生图(4K) | 横屏 4:3 |
gemini-3.1-flash-image-three-four-4k |
图/文生图(4K) | 竖屏 3:4 |
| 模型名称 | 说明 | 尺寸 |
|---|---|---|
veo_3_1_t2v_fast_portrait |
文生视频 | 竖屏 |
veo_3_1_t2v_fast_landscape |
文生视频 | 横屏 |
veo_2_1_fast_d_15_t2v_portrait |
文生视频 | 竖屏 |
veo_2_1_fast_d_15_t2v_landscape |
文生视频 | 横屏 |
veo_2_0_t2v_portrait |
文生视频 | 竖屏 |
veo_2_0_t2v_landscape |
文生视频 | 横屏 |
veo_3_1_t2v_fast_portrait_ultra |
文生视频 | 竖屏 |
veo_3_1_t2v_fast_ultra |
文生视频 | 横屏 |
veo_3_1_t2v_fast_portrait_ultra_relaxed |
文生视频 | 竖屏 |
veo_3_1_t2v_fast_ultra_relaxed |
文生视频 | 横屏 |
veo_3_1_t2v_portrait |
文生视频 | 竖屏 |
veo_3_1_t2v_landscape |
文生视频 | 横屏 |
📸 支持1-2张图片:1张作为首帧,2张作为首尾帧
💡 自动适配:系统会根据图片数量自动选择对应的 model_key
- 单帧模式(1张图):使用首帧生成视频
- 双帧模式(2张图):使用首帧+尾帧生成过渡视频
| 模型名称 | 说明 | 尺寸 |
|---|---|---|
veo_3_1_i2v_s_fast_portrait_fl |
图生视频 | 竖屏 |
veo_3_1_i2v_s_fast_fl |
图生视频 | 横屏 |
veo_2_1_fast_d_15_i2v_portrait |
图生视频 | 竖屏 |
veo_2_1_fast_d_15_i2v_landscape |
图生视频 | 横屏 |
veo_2_0_i2v_portrait |
图生视频 | 竖屏 |
veo_2_0_i2v_landscape |
图生视频 | 横屏 |
veo_3_1_i2v_s_fast_portrait_ultra_fl |
图生视频 | 竖屏 |
veo_3_1_i2v_s_fast_ultra_fl |
图生视频 | 横屏 |
veo_3_1_i2v_s_fast_portrait_ultra_relaxed |
图生视频 | 竖屏 |
veo_3_1_i2v_s_fast_ultra_relaxed |
图生视频 | 横屏 |
veo_3_1_i2v_s_portrait |
图生视频 | 竖屏 |
veo_3_1_i2v_s_landscape |
图生视频 | 横屏 |
🖼️ 支持多张图片
2026-03-06 更新
- 已同步上游新版
R2V视频请求体textInput已切换为structuredPrompt.parts- 顶层新增
mediaGenerationContext.batchId- 顶层新增
useV2ModelConfig: true- 横屏 / 竖屏
R2V模型共用同一套新版请求体- 横屏
R2V的上游videoModelKey已切换为*_landscape形式- 根据当前上游协议,
referenceImages当前最多传 3 张
| 模型名称 | 说明 | 尺寸 |
|---|---|---|
veo_3_1_r2v_fast_portrait |
图生视频 | 竖屏 |
veo_3_1_r2v_fast |
图生视频 | 横屏 |
veo_3_1_r2v_fast_portrait_ultra |
图生视频 | 竖屏 |
veo_3_1_r2v_fast_ultra |
图生视频 | 横屏 |
veo_3_1_r2v_fast_portrait_ultra_relaxed |
图生视频 | 竖屏 |
veo_3_1_r2v_fast_ultra_relaxed |
图生视频 | 横屏 |
| 模型名称 | 说明 | 输出 |
|---|---|---|
veo_3_1_t2v_fast_portrait_4k |
文生视频放大 | 4K |
veo_3_1_t2v_fast_4k |
文生视频放大 | 4K |
veo_3_1_t2v_fast_portrait_ultra_4k |
文生视频放大 | 4K |
veo_3_1_t2v_fast_ultra_4k |
文生视频放大 | 4K |
veo_3_1_t2v_fast_portrait_1080p |
文生视频放大 | 1080P |
veo_3_1_t2v_fast_1080p |
文生视频放大 | 1080P |
veo_3_1_t2v_fast_portrait_ultra_1080p |
文生视频放大 | 1080P |
veo_3_1_t2v_fast_ultra_1080p |
文生视频放大 | 1080P |
veo_3_1_i2v_s_fast_portrait_ultra_fl_4k |
图生视频放大 | 4K |
veo_3_1_i2v_s_fast_ultra_fl_4k |
图生视频放大 | 4K |
veo_3_1_i2v_s_fast_portrait_ultra_fl_1080p |
图生视频放大 | 1080P |
veo_3_1_i2v_s_fast_ultra_fl_1080p |
图生视频放大 | 1080P |
veo_3_1_r2v_fast_portrait_ultra_4k |
多图视频放大 | 4K |
veo_3_1_r2v_fast_ultra_4k |
多图视频放大 | 4K |
veo_3_1_r2v_fast_portrait_ultra_1080p |
多图视频放大 | 1080P |
veo_3_1_r2v_fast_ultra_1080p |
多图视频放大 | 1080P |
除了下方
OpenAI-compatible示例,服务也支持 Gemini 官方格式:
POST /v1beta/models/{model}:generateContentPOST /models/{model}:generateContentPOST /v1beta/models/{model}:streamGenerateContentPOST /models/{model}:streamGenerateContentGemini 官方格式支持以下认证方式:
Authorization: Bearer <api_key>x-goog-api-key: <api_key>?key=<api_key>Gemini 官方图片请求体已兼容:
systemInstructioncontents[].parts[].textcontents[].parts[].inlineDatacontents[].parts[].fileData.fileUrigenerationConfig.responseModalitiesgenerationConfig.imageConfig.aspectRatiogenerationConfig.imageConfig.imageSize
已使用真实 Token 实测通过。 如需流式返回,可将路径替换为
:streamGenerateContent?alt=sse。
curl -X POST "http://localhost:8000/models/gemini-3.1-flash-image:generateContent" \
-H "x-goog-api-key: han1234" \
-H "Content-Type: application/json" \
-d '{
"systemInstruction": {
"parts": [
{
"text": "Return an image only."
}
]
},
"contents": [
{
"role": "user",
"parts": [
{
"text": "一颗放在木桌上的红苹果,棚拍光线,极简背景"
}
]
}
],
"generationConfig": {
"responseModalities": ["IMAGE"],
"imageConfig": {
"aspectRatio": "1:1",
"imageSize": "1K"
}
}
}'curl -X POST "http://localhost:8000/v1/chat/completions" \
-H "Authorization: Bearer han1234" \
-H "Content-Type: application/json" \
-d '{
"model": "gemini-3.1-flash-image-landscape",
"messages": [
{
"role": "user",
"content": "一只可爱的猫咪在花园里玩耍"
}
],
"stream": true
}'curl -X POST "http://localhost:8000/v1/chat/completions" \
-H "Authorization: Bearer han1234" \
-H "Content-Type: application/json" \
-d '{
"model": "gemini-3.1-flash-image-landscape",
"messages": [
{
"role": "user",
"content": [
{
"type": "text",
"text": "将这张图片变成水彩画风格"
},
{
"type": "image_url",
"image_url": {
"url": "data:image/jpeg;base64,<base64_encoded_image>"
}
}
]
}
],
"stream": true
}'curl -X POST "http://localhost:8000/v1/chat/completions" \
-H "Authorization: Bearer han1234" \
-H "Content-Type: application/json" \
-d '{
"model": "veo_3_1_t2v_fast_landscape",
"messages": [
{
"role": "user",
"content": "一只小猫在草地上追逐蝴蝶"
}
],
"stream": true
}'curl -X POST "http://localhost:8000/v1/chat/completions" \
-H "Authorization: Bearer han1234" \
-H "Content-Type: application/json" \
-d '{
"model": "veo_3_1_i2v_s_fast_fl_landscape",
"messages": [
{
"role": "user",
"content": [
{
"type": "text",
"text": "从第一张图过渡到第二张图"
},
{
"type": "image_url",
"image_url": {
"url": "data:image/jpeg;base64,<首帧base64>"
}
},
{
"type": "image_url",
"image_url": {
"url": "data:image/jpeg;base64,<尾帧base64>"
}
}
]
}
],
"stream": true
}'
R2V会由服务端自动组装新版视频请求体,调用方仍然使用 OpenAI 兼容输入即可。 服务端会将横屏R2V自动映射到最新的*_landscape上游模型键。 当前最多传 3 张参考图。
curl -X POST "http://localhost:8000/v1/chat/completions" \
-H "Authorization: Bearer han1234" \
-H "Content-Type: application/json" \
-d '{
"model": "veo_3_1_r2v_fast_portrait",
"messages": [
{
"role": "user",
"content": [
{
"type": "text",
"text": "以三张参考图的人物和场景为基础,生成一段镜头平滑推进的竖屏视频"
},
{
"type": "image_url",
"image_url": {
"url": "data:image/jpeg;base64/<参考图1base64>"
}
},
{
"type": "image_url",
"image_url": {
"url": "data:image/jpeg;base64/<参考图2base64>"
}
},
{
"type": "image_url",
"image_url": {
"url": "data:image/jpeg;base64/<参考图3base64>"
}
}
]
}
],
"stream": true
}'本项目采用 MIT 许可证。详见 LICENSE 文件。
- PearNoDec 提供的YesCaptcha打码方案
- raomaiping 提供的无头打码方案 感谢所有贡献者和使用者的支持!
- 提交 Issue:GitHub Issues
⭐ 如果这个项目对你有帮助,请给个 Star!