Документация Vera

Полностью локальный голосовой агент с оффлайн-распознаванием речи и локальной моделью LLM.

О проекте

Vera — локальный голосовой агент для Windows, работающий без передачи данных в облако. Все вычисления выполняются на компьютере пользователя:

  • Распознавание речи: Vosk (оффлайн)
  • Модель LLM: Ваша локальная (рекомендуется Qwen 3 1.7B)
  • Синтез речи: pyttsx3

Важно: агент может ошибаться. Проверяйте критически важные данные, включая результаты веб-поиска, курсы валют, погодные данные и статистику.

Быстрый старт

Скачайте portable-версию с сайта и запустите:

Vera.exe

Последовательность:

  1. Дождитесь сообщения «Система готова»
  2. Скажите слово активации
  3. Произнесите команду

Режимы работы:

Голосовой режим

Обязательно используйте слово активации перед командой. Агент слушает постоянно, но реагирует только на свое имя.

«Вера, поставь таймер»
«Поставь таймер»

Текстовый режим (Терминал)

При вводе команд текстом слово активации не требуется. Вы уже находитесь в контексте диалога.

«Поставь таймер»
«Вера, поставь таймер» (тоже сработает)

Консольные команды:

КомандаОписание
/helpСправка
/color greenЦвет консоли
/mute / /unmuteУправление микрофоном
/exitЗавершение работы

Системные требования

КомпонентМинимумРекомендуется
ОСWindows 10 x64Windows 11 x64
RAM4 ГБ8+ ГБ
Диск2 ГБ4 ГБ SSD
МикрофонЛюбойUSB или качественный встроенный

Установка (для разработчиков)

Если вы хотите запустить агента из исходного кода или внести изменения:

Шаг 1: Клонирование

git clone https://github.com/tripleguard/agent_vera.git
cd agent_vera

Шаг 2: Зависимости

pip install -r requirements.txt

Шаг 3: Установка llama-cpp-python (Windows)

Установите Visual C++ Build Tools, затем:

pip install --upgrade pip setuptools wheel
pip install llama-cpp-python

Шаг 4: Модели

Vosk:

  1. Скачайте модель vosk-model-small-ru-0.22
  2. Распакуйте её в корень проекта

LLM:

  1. Скачайте модель GGUF (например, Q4_K_M)
  2. Поместите файл в корень проекта (модель автоматически определяется агентом)
  3. Либо укажите путь в data/config.json

Шаг 5: Запуск

python -m main.agent

Справочник команд

Приложения

Вера, открой хром
Вера, закрой телеграм
Вера, запусти калькулятор

Агент использует нечёткий поиск названий программ.

Окна

Вера, сверни окно
Вера, разверни браузер
Вера, переключись на телеграм

Файлы и папки

Вера, открой файл отчет
Вера, найди файл резюме
Вера, открой папку проект

Поиск выполняется в стандартных пользовательских каталогах.

Системные настройки

Громкость:

Вера, громкость 5
Вера, громкость 75 процентов

Яркость:

Вера, яркость 7

Прочее:

Вера, сделай скриншот
Вера, какой мой IP

Питание

Вера, выключи компьютер
Вера, перезагрузи через час
Вера, спящий режим

Без подтверждения выполняются только немедленные команды.

Время и напоминания

Вера, который час
Вера, таймер 10 минут
Вера, напомни через полчаса позвонить

Погода

Вера, погода в Москве

Курсы валют

Вера, курс доллара

Источник: ЦБ РФ.

Веб-поиск и Википедия

Вера, найди информацию о Python
Вера, кто такой Эйнштейн
Вера, открой ютуб

Агент выполняет поиск через DuckDuckGo, извлекает текст, затем формирует краткий ответ.

Как работает веб-поиск

Этапы:

  1. Запрос через DuckDuckGo
  2. Получение списка ссылок
  3. Загрузка страниц
  4. Очистка текста
  5. Суммаризация LLM

Ограничения:

  • Возможны блокировки при частых запросах
  • Некоторые сайты защищены от парсинга
  • Модель может искажать информацию

Конфигурация

Файл: data/config.json

Основные параметры:

ПараметрОписание
activation_wordСлово активации
silence_timeoutТаймаут тишины
tts.voice_indexГолос Windows
tts.rateСкорость речи
sitesАлиасы для сайтов

Структура проекта

main/                  Ядро агента
web/                   Веб-модули
user/                  Данные пользователя
data/                  Конфигурация и сохранения
vosk-model/            Модель распознавания речи
*.gguf                 Модель LLM

Устранение неполадок

Vosk не загружается

Проверьте наличие директории vosk-model-small-ru-0.22.

LLM не загружается

Проверьте путь до GGUF и корректность файла.

Нет звука

Проверьте корректность значения tts.voice_index.

Микрофон не работает

Проверьте настройки устройства в Windows.

Благодарности

  • Георгию Герганову — за вклад в развитие локальных языковых моделей и технологий, лежащих в основе экосистемы LLM.
  • Андрею Abetlen — за создание и поддержку проекта llama-cpp-python, позволившего интегрировать локальную LLM в Vera.

Лицензии и ссылки