GitHub - luoliguang/AI-Media2Doc: 一键将音视频转化为小红书/公众号/知识笔记/思维导图/视频字幕等各种风格的文档。

📖 简介

AI 视频图文创作助手是一款 Web 工具, 基于 AI 大模型, 一键将视频和音频转化为各种风格的文档, 无需登录注册, 前后端本地部署，以极低的成本体验 AI 视频/音频转风格文档服务。

✨ 核心功能

✅ 完全开源：MIT 协议授权，支持本地部署。
🔒 隐私保护：无需登录注册，任务记录保存在本地
💻 前端处理：采用 ffmpeg wasm 技术，无需本地安装 ffmpeg
🎯 多种风格支持：支持小红书/公众号/知识笔记/思维导图/内容总结等多种文档风格支持。
🤖 AI 对话：支持针对视频内容进行 AI 二次问答。
🎬 支持字幕导出: 结果一键导出为字幕文件。
🖼️ 智能截图: 基于字幕信息智能截图并插入文章, 无需视觉大模型, 实现真正的图文并茂。
🎨 支持自定义 Prompt：支持在前端自定义配置 prompt。
🐳 一键部署：支持 Docker 一键部署。
🔒 支持设置访问密码: 后端设置访问密码之后, 前端用户需要填写该密码才可以正常使用。

🔜 未来计划

🎙️ 音频识别支持使用 fast-whisper 本地大模型处理，进一步降低成本

👾 项目说明

AI 视频创作助手是一款基于 AI 大模型的 Web 工具，可以将视频和音频内容转化为各种风格的文档。本项目采用 MIT 协议，支持本地部署，任何人都可以以极低的成本体验音视频转文本服务。

项目截图

全新设计的首页, 尽力之作

全新功能: 支持智能截图并插入到文中对应位置(本地方案, 无需视觉大模型, 0成本)

开启方式, 点击自定义设置->智能截图选择打开。

全新设计的结果页, 支持一键导出为字幕。

支持自定义 prompt

📦 docker 本地一键部署

0️⃣：安装 docker, 这个网上有教程, Windows 玩家建议使用 wsl 启动该项目。

1️⃣：下载项目首页的 docker-compose.yaml 文件

2️⃣：参考variables_template.env 在项目根目录下生成 variables.env 文件。请根据后端 README.md 中的配置说明完善 variables.env 文件中的环境变量。 variables.env 必须与 docker-compose.yaml 在同一目录下, 建议建个新的文件夹单独存放这两个文件。

3️⃣：运行, 在 docker-compose.yaml 所在目录下运行:

$ docker-compose -f docker-compose.yaml up -d

Name		Name	Last commit message	Last commit date
Latest commit History 63 Commits
.github/workflows		.github/workflows
backend		backend
docs/images		docs/images
frontend		frontend
.flake8		.flake8
.gitignore		.gitignore
LICENSE		LICENSE
Makefile		Makefile
README.md		README.md
README_EN.md		README_EN.md
docker-compose.yaml		docker-compose.yaml
variables_template.env		variables_template.env

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

📖 简介

✨ 核心功能

🔜 未来计划

👾 项目说明

项目截图

全新设计的首页, 尽力之作

全新功能: 支持智能截图并插入到文中对应位置(本地方案, 无需视觉大模型, 0成本)

全新设计的结果页, 支持一键导出为字幕。

支持自定义 prompt

📦 docker 本地一键部署

🔧 本地开发指南

🔄 处理流程

🙌 致谢

📄 许可证

🔗 相关链接

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

📖 简介

✨ 核心功能

🔜 未来计划

👾 项目说明

项目截图

全新设计的首页, 尽力之作

全新功能: 支持智能截图并插入到文中对应位置(本地方案, 无需视觉大模型, 0成本)

全新设计的结果页, 支持一键导出为字幕。

支持自定义 prompt

📦 docker 本地一键部署

🔧 本地开发指南

🔄 处理流程

🙌 致谢

📄 许可证

🔗 相关链接

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages