VoiceToTask — это голосовой помощник для быстрого создания списка задач. Вы просто произносите вслух, что нужно сделать, а приложение автоматически распознаёт речь, извлекает задачи и сохраняет их в структурированном виде. ИИ-модели выделяют приоритеты, сроки и категории, превращая голосовой поток в готовый список дел. Идеально подходит для планирования дня, ведения заметок и быстрой фиксации идей без отвлечения на набор текста.
- Python 3.10+ (скачать с python.org)
- Windows 10/11 или macOS/Linux
- Микрофон для голосового ввода
- Оперативная память: минимум 8 ГБ (рекомендуется 16 ГБ)
- Свободное место: ~5 ГБ для моделей ИИ
Скопируйте папку pomr в удобное место на компьютере.
Откройте терминал (cmd) в папке проекта:
cd путь\к\pomr
python -m venv .venv.venv\Scripts\pip install -r requirements.txtУстановка может занять 10-20 минут — библиотеки torch и llama-cpp-python объёмные.
При первом запуске автоматически скачаются модели:
- Whisper (~1.5 ГБ) — для распознавания речи
- Qwen 2.5 (~3 ГБ) — для анализа задач
.venv\Scripts\python main.py- Нажмите Enter для начала записи
- Произнесите задачи (например: "Купить молоко, срочно")
- Нажмите Enter для завершения
- ИИ автоматически извлечёт задачи и сохранит их
- Поместите аудиофайл (.wav, .mp3) в папку проекта
- При запуске выберите пункт 2 и укажите путь к файлу
pomr/
├── main.py # Главный файл запуска
├── requirements.txt # Зависимости
├── src/
│ ├── audio_input.py # Запись с микрофона
│ ├── whisper_transcriber.py # Распознавание речи
│ ├── llm_analyzer.py # Анализ ИИ
│ ├── task_parser.py # Парсинг задач
│ └── output_manager.py # Сохранение результатов
├── models/ # Папка для ИИ-моделей
├── output/ # Результаты (.json файлы)
└── temp_audio/ # Временные аудиозаписи
.venv\Scripts\pip install -r requirements.txtПриложение автоматически использует CPU, если GPU недоступен. Это нормально, но медленнее.
При первом запуске модели скачиваются из интернета. Убедитесь в стабильном соединении.