Skip to content

luoliguang/AI-Media2Doc

 
 

Repository files navigation

logo

MIT License Web Platform Docker Support

📖 简介

AI 视频图文创作助手是一款 Web 工具, 基于 AI 大模型, 一键将视频和音频转化为各种风格的文档, 无需登录注册, 前后端本地部署,以极低的成本体验 AI 视频/音频转风格文档服务。

✨ 核心功能

  • 完全开源:MIT 协议授权,支持本地部署。
  • 🔒 隐私保护:无需登录注册,任务记录保存在本地
  • 💻 前端处理:采用 ffmpeg wasm 技术,无需本地安装 ffmpeg
  • 🎯 多种风格支持:支持小红书/公众号/知识笔记/思维导图/内容总结等多种文档风格支持。
  • 🤖 AI 对话:支持针对视频内容进行 AI 二次问答。
  • 🎬 支持字幕导出: 结果一键导出为字幕文件。
  • 🖼️ 智能截图: 基于字幕信息智能截图并插入文章, 无需视觉大模型, 实现真正的图文并茂。
  • 🎨 支持自定义 Prompt:支持在前端自定义配置 prompt。
  • 🐳 一键部署:支持 Docker 一键部署。
  • 🔒 支持设置访问密码: 后端设置访问密码之后, 前端用户需要填写该密码才可以正常使用。

🔜 未来计划

  • 🎙️ 音频识别支持使用 fast-whisper 本地大模型处理,进一步降低成本

👾 项目说明

AI 视频创作助手是一款基于 AI 大模型的 Web 工具,可以将视频和音频内容转化为各种风格的文档。本项目采用 MIT 协议,支持本地部署,任何人都可以以极低的成本体验音视频转文本服务。

项目截图

全新设计的首页, 尽力之作

index

全新功能: 支持智能截图并插入到文中对应位置(本地方案, 无需视觉大模型, 0成本)

开启方式, 点击自定义设置->智能截图 选择打开。

task details

全新设计的结果页, 支持一键导出为字幕。

task details

支持自定义 prompt

task details

📦 docker 本地一键部署

0️⃣:安装 docker, 这个网上有教程, Windows 玩家建议使用 wsl 启动该项目。

1️⃣:下载项目首页的 docker-compose.yaml 文件

2️⃣:参考variables_template.env 在项目根目录下生成 variables.env 文件。请根据后端 README.md 中的配置说明完善 variables.env 文件中的环境变量。 variables.env 必须与 docker-compose.yaml 在同一目录下, 建议建个新的文件夹单独存放这两个文件。

3️⃣:运行, 在 docker-compose.yaml 所在目录下运行:

$ docker-compose -f docker-compose.yaml up -d

🔧 本地开发指南

🔄 处理流程

architecture

🙌 致谢

感谢所有为本项目做出贡献的开发者和社区成员。

📄 许可证

本项目采用 MIT 许可证

🔗 相关链接

About

一键将音视频转化为小红书/公众号/知识笔记/思维导图/视频字幕等各种风格的文档。

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages

  • Vue 71.0%
  • Python 10.1%
  • JavaScript 9.6%
  • TypeScript 7.5%
  • CSS 0.9%
  • Dockerfile 0.6%
  • Other 0.3%