MSpeech
Программа для преобразования речи в текст и выполнения Windows-команд голосом
Совместимость:
- Windows 10
- Windows 8.1
- Windows 8
- Windows 7
- Windows Vista
- Windows XP
Тип лицензии:
Условно-бесплатное
MSpeech — программа для распознавания голоса с последующим его преобразованием в текст или выполнением заданной пользователем команды. Кроме того, приложение может использоваться и в обратном направлении — для преобразования текста в голос.
MSpeech — условно-бесплатная программа с ограниченным функционалом (но имеется возможность бесплатно получить полнофункциональную версию). Подходит для компьютеров под управлением Windows XP, Vista, 7, 8, 8.1 и 10 (32 и 64 бит). Интерфейс программы выполнен на русском языке.
Как пользоваться программой MSpeech?
Для распознавания голоса программа MSpeech использует встроенный модуль Google Voice API (т.е. для работы приложения требуется доступ в интернет). В его задачу входит отправка записанного голосового сообщения на сервер Google, где оно обрабатывается (транскрибируется в текст) и отправляется обратно на пользовательский компьютер в виде текстового сообщения. Благодаря Google Voice API программа MSpeech способна распознавать более 50 языков, включая русский.
Для ввода звука (голоса) в приложении предусмотрен собственный звукозаписывающий модуль, которым можно управлять посредством горячих клавиш. Также через программу можно транскрибировать голос из ранее созданных аудиозаписей, но для этого придется внести соответствующие настройки в системные параметры Windows, отвечающие за управление микрофоном (нужно задействовать функцию «Прослушать с данного устройства» в свойствах микрофона).
Однако у Google Voice API есть недостаток — для работы с сервисом пользователю может потребоваться создать специальный ключ API (API key Google Speech), что можно сделать на одном из сайтов известного поисковика. Также у сервиса Google Voice API есть ограничение на бесплатное использование — общая продолжительность отправляемых звукозаписей не должно превышать 60 минут в месяц. За дальнейшее распознавание голоса требуется оформить платную подписку.
Функции MSpeech
Помимо основной функции по распознаванию голоса, в возможности программы MSpeech также входят:
- Возможность создания неограниченного количества голосовых команд. Всего их 5 категорий — запуск, закрытие и остановка процесса программ, запуск программ с параметрами командной строки, а также запуск функции преобразования текста в голос (синтез речи).
- Функция преобразования текста в голос имеет собственные настройки. Пользователь может выбрать одну из 5 систем синтеза речи, включая стандартную Microsoft SAPI, которая может работать без интернета. Все прочие системы — онлайн (сервисы от Google, Yandex, iSpeech и Nuance).
- Возможность передачи преобразованного из голоса текста в текстовые поля любых запущенных программ путем использования метода WM_SETTEXT +EM_REPLACESEL, WM_PASRE, WM_CHAR, WM_PASTE (MOD) или WM_COPYDATA (платная функция). Данный функционал предназначен, в первую очередь, для программистов с целью организации взаимодействия своих разрабатываемых программ с MSpeech.
- Автоматическая коррекция текста перед отправкой в поля ввода других программ (замена слов по словарю и изменение первых букв предложений на заглавные буквы). Это еще одна платная функция.
Как получить MSpeech без ограничений по функционалу?
Разработчик MSpeech на своем официальном сайте выложил исходный код своей программы на языке Delphi. Исходники можно скачать и самостоятельно скомпилировать в компиляторе «Delphi XE6» или более поздних версиях. Скомпилированная в итоге программа MSpeech не будет иметь функциональных ограничений (не относится к ограничениям сервиса Google Voice API).
Не работает. При попытке открыть показывает ошибку
На нашем сайте размещена последняя версия программы MSpeech. Причины ее некорректной работы рекомендуем уточнять у официальных разработчиков
Так же как и у всез не запускается.
Runtime error 217 at 00692077.
Программа не работает
Скачала. Установила. Запустила. Выходит ошибка сразу и закрывает работу программы. runtime error 217 at 00692077