- Explore MCP Servers
- mcp_voice_salute
Mcp Voice Salute
What is Mcp Voice Salute
mcp_voice_salute is an implementation of the MCP (Model Context Protocol) server that provides tools for working with the SaluteSpeech voice API from Sberbank. It enables AI assistants to record user speech from a microphone, recognize it, and synthesize speech from text.
Use cases
Use cases include creating voice interfaces for virtual assistants, developing applications that require voice commands, and enhancing user interaction through voice recognition and synthesis.
How to use
To use mcp_voice_salute, integrate it into your agent by adding it to the MCP server configuration. Ensure you provide the necessary SaluteSpeech token in the environment variables. Use the provided tools to record audio and synthesize speech.
Key features
Key features include full integration with Sber’s SaluteSpeech API, support for Russian speech recognition and synthesis, and the ability to create voice interfaces for AI assistants and applications with voice control.
Where to use
mcp_voice_salute can be used in various fields such as AI assistant development, voice-controlled applications, and integration of voice capabilities in LLM-based agent systems.
Clients Supporting MCP
The following are the main client software that supports the Model Context Protocol. Click the link to visit the official website for more information.
Overview
What is Mcp Voice Salute
mcp_voice_salute is an implementation of the MCP (Model Context Protocol) server that provides tools for working with the SaluteSpeech voice API from Sberbank. It enables AI assistants to record user speech from a microphone, recognize it, and synthesize speech from text.
Use cases
Use cases include creating voice interfaces for virtual assistants, developing applications that require voice commands, and enhancing user interaction through voice recognition and synthesis.
How to use
To use mcp_voice_salute, integrate it into your agent by adding it to the MCP server configuration. Ensure you provide the necessary SaluteSpeech token in the environment variables. Use the provided tools to record audio and synthesize speech.
Key features
Key features include full integration with Sber’s SaluteSpeech API, support for Russian speech recognition and synthesis, and the ability to create voice interfaces for AI assistants and applications with voice control.
Where to use
mcp_voice_salute can be used in various fields such as AI assistant development, voice-controlled applications, and integration of voice capabilities in LLM-based agent systems.
Clients Supporting MCP
The following are the main client software that supports the Model Context Protocol. Click the link to visit the official website for more information.
Content
MCP SaluteSpeech
MCP SaluteSpeech - это реализация MCP (Model Context Protocol) сервера, предоставляющего инструменты для работы с голосовыми API SaluteSpeech от Сбера. Позволяет AI ассистентам записывать речь пользователя с микрофона, распознавать её с помощью и синтезировать речь из текста.
Сервер предоставляет доступ агентам на основе LLM к голосовому интерфейсу, значительно расширяя возможности взаимодействия с пользователем.
Из чего состоит MCP SaluteSpeech?
MCP SaluteSpeech предоставляет два основных инструмента:
-
sber_stt_record_and_recognize - записывает аудио с микрофона до появления 3-секундной паузы, отправляет запись на API распознавания речи SaluteSpeech и возвращает распознанный текст.
-
synthesize_speech - синтезирует речь из текста с помощью API SaluteSpeech и воспроизводит её через аудиоустройство компьютера.
Эти инструменты особенно полезны для:
- Создания голосовых интерфейсов для AI ассистентов
- Разработки приложений с поддержкой голосового управления
- Интеграции голосовых возможностей в агентные системы на базе LLM
Возможности
- Реализация голосовых инструментов для MCP (Model Context Protocol)
- Полная интеграция с API SaluteSpeech от Сбера
- Готовность к работе с такими ассистетами как Cursor, Windsurf и другими
- Поддержка распознавания и синтеза русской речи
Возможные проблемы с аудиоустройствами и дополнительные зависимости
Если запись или воспроизведение аудио не работает “из коробки”, возможно, потребуется установить дополнительные зависимости для вашей операционной системы:
- Linux: убедитесь, что установлен пакет
portaudioи соответствующие dev-заголовки. Например, для Ubuntu/Debian:Также может понадобиться установитьsudo apt-get install portaudio19-devalsa-utils:sudo apt-get install alsa-utils - macOS: обычно всё работает из коробки, но убедитесь, что приложению даны разрешения на доступ к микрофону и динамикам (Системные настройки → Конфиденциальность → Микрофон/Звук).
- Windows: убедитесь, что установлены последние драйверы для вашей звуковой карты. Для работы некоторых библиотек может понадобиться Microsoft Visual C++ Redistributable.
Если после установки зависимостей проблема не решена, проверьте сообщения об ошибках в консоли — они могут подсказать, какой компонент отсутствует или требует настройки.
Настройка MCP сервера
Добавьте этот MCP сервер к вашему агенту.
Описание инструментов
sber_stt_record_and_recognize
Записывает аудио с микрофона до появления 3-секундной паузы, затем отправляет запись на API распознавания речи SaluteSpeech и возвращает распознанный текст.
Вход: Не требует параметров
Поведение: Выполняет запись с микрофона, распознавание и возвращает текст
Выход: Строка с распознанным текстом
synthesize_speech
Синтезирует речь из текста с помощью API SaluteSpeech и воспроизводит её через аудиоустройство компьютера.
Вход:
text(string) — Текст для преобразования в речьformat(string, опционально) — Формат аудио (по умолчанию “wav16”)voice(string, опционально) — Голос для синтеза (по умолчанию “Bys_24000”)
Поведение: Преобразует текст в речь и воспроизводит через динамики
Выход: Подтверждение успешного воспроизведения
Как добавить этот MCP сервер в Cursor
Есть два способа добавить MCP сервер в Cursor:
- Глобально - добавить сервер в файл
~/.cursor/mcp.json - Для проекта - добавить сервер в файл
.cursor/mcp.jsonв вашем проекте
Требования к окружению
Для работы с API требуется установить переменную окружения:
SALUTE_SPEECH - токен Basic авторизации для доступа к API SaluteSpeech
Лицензия
MIT License
Dev Tools Supporting MCP
The following are the main code editors that support the Model Context Protocol. Click the link to visit the official website for more information.










