使用自然语言控制无人机,支持来自 12 大主流提供商的最新 AI 模型:OpenAI GPT-5.4、Anthropic Claude 4.6、Google Gemini 3.1 Pro Preview、阿里巴巴 Qwen3.5 Plus/Flash、xAI Grok 4.1、智谱AI GLM-5、MiniMax、DeepSeek、月之暗面 Kimi K2.5、美团 LongCat Flash、Meta Llama 4,以及本地/网络 Ollama 模型。
🌐 语言版本 | Language Versions
🤖 AI 助手 | AI Assistant
# 1. 安装依赖
uv sync
# 2. 启动交互式设置
uv run main.py# 一键启动 Web 界面
uv run start_web.py
# 访问:http://localhost:8000应用程序将引导您完成:
- AI 提供商选择:从 12 个提供商中选择最新模型
- 模型选择:选择前沿 AI 模型(支持网络 Ollama)
- 无人机连接:连接到模拟器或真实无人机
- 自然语言控制:"起飞到30米","飞行正方形路线"
- 🤖 全面的 AI 支持:12 大主流提供商的最新模型(GPT-5.4、Claude 4.6、Gemini 3.1 Pro Preview、MiniMax、Kimi K2.5、美团 LongCat Flash、Llama 4、Grok 4.1 等)
- 🌐 双重界面:终端 CLI 和现代化 Web 界面
- 🌐 网络灵活性:支持本地、局域网和互联网 Ollama 服务器
- 🚁 真实无人机控制:DroneKit 集成,支持实际飞行控制
- 💬 自然语言:使用对话式命令控制无人机
- 🛠️ 内置模拟器:包含无人机模拟器用于测试
- 🔒 安全操作:紧急停止和返航功能
- 📱 移动端就绪:响应式 Web 界面,支持触摸操作
DeepDrone 包含现代化的 Web 界面,支持基于浏览器的无人机控制,采用简洁响应式设计。
- 🖥️ 现代化 UI:响应式设计,采用自定义 CSS 设计系统(无 Material-UI 依赖)
- 🤖 AI 集成:实时聊天界面,支持自然语言控制
- 🚁 无人机控制:实时状态监控和快捷命令按钮
- 📊 仪表盘:系统概览和实时数据可视化
- 📱 移动端支持:触摸友好界面,底部导航
# 方式 1:一键启动(推荐)
uv run start_web.py
# 方式 2:手动启动
uv run web_api.py
# 然后访问:http://localhost:8000- 后端:FastAPI + Uvicorn,RESTful API
- 前端:React 18 + 自定义 CSS 设计系统
- 实时通信:WebSocket 支持实时更新
- 响应式:移动端优先设计,支持触摸操作
# 快速模拟器(内置)
uv run simulate_drone.py
# 高级 SITL(可选)
# 请参考 ArduPilot SITL 安装指南🚁 DeepDrone> 连接模拟器并起飞到20米
🚁 DeepDrone> 飞行到 GPS 坐标 37.7749, -122.4194
🚁 DeepDrone> 执行边长50米的正方形飞行路线
🚁 DeepDrone> 返航并安全降落
| 提供商 | 模型 | API 类型 | 描述 |
|---|---|---|---|
| OpenAI | GPT-5.4, GPT-5.4-mini, GPT-5.4-nano | 云端 | 最新 GPT-5.4 系列模型 |
| Anthropic | Claude Opus 4.6, Claude Sonnet 4.6, Claude Haiku 4.5 | 云端 | 先进的 Claude 4.6 模型 |
| Gemini 3.1 Pro Preview, Gemini 3 Flash Preview, Gemini 3.1 Flash Lite Preview, Gemini Flash Latest, Gemini Flash Lite Latest | 云端 | 来自 Google AI Studio 的 Gemini 3.1 和 Gemini 系列模型 | |
| Qwen | Qwen3.5 Plus, Qwen3.5 Flash, Qwen3.5 397B A17B, Qwen3.5 122B A10B, Qwen3.5 27B, Qwen3.5 35B A3B | 云端 | DashScope 提供的 OpenAI 兼容接口 |
| xAI | Grok 4.1 Fast Reasoning, Grok 4.1 Fast Non-Reasoning, Grok 4 | 云端 | 马斯克的 xAI 模型 |
| 智谱AI | GLM-5-Turbo, GLM-5, GLM-4.7-Flash 等 | 云端 | 中文 AI 模型,JWT 认证 |
| MiniMax | MiniMax-M2.7, MiniMax-M2.7-highspeed | 云端 | 来自 MiniMax 的 MiniMax-M2.7 模型 |
| DeepSeek | DeepSeek V4 Flash, DeepSeek V4 Pro 等 | 云端 | DeepSeek V4 系列推理模型 |
| 月之暗面(Kimi) | Kimi K2.5, Kimi K2 Thinking Turbo, Kimi K2 Turbo, Kimi K2 Thinking, Kimi K2 0905 Preview 等 | 云端 | 月之暗面 AI Kimi K2 系列模型,支持思维链 |
| 美团 LongCat | LongCat Flash Thinking, LongCat Flash Chat, LongCat Flash Omni 2603, LongCat Flash Lite | 云端 | OpenAI 兼容的 LongCat Flash 系列模型 |
| Meta | Llama 4 Maverick, Llama 3.3 Turbo 等 | 云端 | 通过提供商的最新 Llama 模型 |
| Ollama | NanBeige4.1, Qwen3.5:4B, Qwen3.5:Latest, GLM-4.7-Flash, Qwen3.5:35B 等 | 本地/网络 | 本地和远程服务器支持 |
- Python 3.9+
- uv(包管理器)
- DroneKit-Python
- LiteLLM(云端模型)
- Ollama(本地/网络模型,可选)
- uv - 快速 Python 包管理和项目工具
- LiteLLM - 云端 AI 模型统一接口(OpenAI、Anthropic、Google、xAI 等)
- 直接 API 集成 - 原生支持智谱AI、Qwen(DashScope)、MiniMax、DeepSeek、月之暗面 Kimi
- Ollama - 本地/网络 AI 模型执行,支持自定义服务器
- DroneKit-Python - 真实无人机控制和遥测
- Rich - 美观的终端界面和格式化
- Typer - 命令行界面框架
- Pydantic - 配置管理和验证
- Ollama 网络支持:连接到局域网或互联网上的 Ollama 服务器
- 自定义服务器 URL:配置远程 Ollama 实例
- 自动模型检测:自动检测任何服务器上的可用模型
- 灵活部署:在本地或强大的远程服务器上运行模型
- 模拟器:
udp:127.0.0.1:14550 - USB 连接:
/dev/ttyACM0(Linux)或COM3(Windows) - TCP 连接:
tcp:192.168.1.100:5760 - UDP 连接:
udp:192.168.1.100:14550
- 在 Web 界面中导航到设置页面
- 从下拉菜单选择 AI 提供商
- 选择模型(Ollama 模型自动检测)
- 输入 API 密钥(Ollama 不需要)
- 测试连接并保存
AI 模型连接失败:
- 验证 API 密钥是否正确
- 检查网络连接
- 查看浏览器控制台错误信息
无人机连接失败:
- 确认连接字符串格式正确
- 确保模拟器正在运行
- 检查串口权限(Linux/Mac)
Ollama 连接失败:
- 验证 Ollama 服务器正在运行
- 检查基础 URL 配置
- 确保模型已安装:
ollama pull 模型名称
模拟器无响应:
- 重启模拟器:
uv run simulate_drone.py - 检查连接字符串是否匹配模拟器端口
- 验证没有其他进程占用端口
# 终端界面
uv run main.py
# Web 界面热重载
cd frontend
npm start # 前端(端口 3000)
# 在另一个终端中:
uv run uvicorn web_api:app --reload # 后端(端口 8000)# 构建前端
cd frontend
npm run build
# 启动生产服务器
uv run start_web.py欢迎贡献!请随时提交问题和拉取请求。
享受您的 DeepDrone 体验! 🚁✨
