Как набрать текст голосом

Сервисы голосового набора

Существуют сервисы, которые работают онлайн, и есть программы, которые устанавливаются на компьютер.

Онлайн-сервисы

Это бесплатная разработка Google Chrome, которая, соответственно, работает только в этом браузере. Думаю, с этим проблем не будет, ведь это лучший браузер, и если вы до сих пор им не пользуетесь, то читайте статью про то, почему мы выбираем Chrome. Блокнот можно установить прямо в браузер или пользоваться возможностью набора текста голосом, перейдя на их сайт.

Аналогичен предыдущему сервису, также работает только в Google Chrome. Пользоваться им элементарно: выбираем нужный язык и приложение под диктовку само печатает.

Ещё один интернет-сервис быстрого голосового ввода текста. Понятный интерфейс и бесплатное использование. В арсенале этого сервиса русский, украинский, английский, немецкий, французский и итальянский языки.

Преимущества данного бесплатного сервиса в наличии голосовых подсказок, возможности просмотра вариантов распознавания. Также имеется удобный редактор, с помощью которого вы cможете скопировать полученный материал, распечатать его на принтере, осуществить перевод на иностранные языки или отправить по почте.

Чтобы воспользоваться набором, не прикасаясь к клавиатуре, вам нужно открыть вкладку “Инструменты”, а затем нажать на “Голосовой ввод…”

Разные команды для редактирования и форматирования пока доступны только на английском языке, но для русского языка поддерживаются пунктуационные команды:

  • “точка”,
  • “запятая”,
  • “восклицательный знак”,
  • “вопросительный знак”,
  • “новая строка”,
  • “новый абзац”.

Как показала практика, это очень удобно.

Программы

Платная программа, которая при помощи голоса не только печатает на компьютере и устанавливает знаки препинания, но и радует дополнительными опциями: она умеет транскрибировать аудио, также можно расширить версию словарями (например, с юридическими терминами или другими).

Поддерживается операционными системами, начиная с Windows 7 и выше.

Цена: от 1 690 руб.

Бесплатна и может удовлетворить амбиции многих пользователей. Её привлекательность состоит в том, что она может распознавать голос на 50 языках. Для удобного использования есть горячие клавиши, можно самому выбирать источник звука, корректировать распознанный текст.

Веб-сервисы и приложения для голосового ввода

Для использования голосового ввода от случая к случаю можно обойтись без  установки на компьютер специальных программ. Скорее всего, вам будет достаточно возможностей веб-сервисов и расширений для браузера.

Google Docs

Простой инструмент голосового ввода есть в Google Docs — сервисе для работы с текстовыми документами. Для его использования достаточно иметь аккаунт почты Gmail.

Как пользоваться голосовым вводом в Google Docs:

  1. Откройте сайт поисковой системы Google.
  2. Авторизуйтесь под своей учётной записью Google или зарегистрируйте новый профиль.
  3. Кликните по квадрату из точек, чтобы раскрыть меню с сервисами.
  4. Нажмите «Ещё», чтобы увидеть полный список.
  5. Перейдите в «Документы».
  6. В поле «Создать документ» нажмите «Пустой файл».

На экране появится текстовый редактор Google. Чтобы включить голосовой ввод, раскройте меню «Инструменты» и выберите соответствующую опцию. Слева появится виджет с микрофоном. Выберите в нём язык, на котором вы будете говорить, а затем нажмите на иконку микрофона, чтобы включить распознавание. Значок должен стать красным. Если браузер запросит разрешение на использование микрофона, дайте его.

Запуск голосового ввода доступен также с помощью сочетания клавиш Ctrl+Shift+S. Функция запускается с языком, установленным по умолчанию.

После настройки начинайте говорить — Google Docs будет распознавать речь и превращать её в текст. Знаки препинания и новую строку проговаривайте словами, чётко произносите окончания слов — в противном случае исправлять текст придётся очень долго.

Speechpad

Speechpad — бесплатный сервис, который работает только в браузере Chrome. Выше мы рассказали, как настроить его интеграцию с Windows. Однако для набора небольшого фрагмента текста в этом нет необходимости — с задачей отлично справится веб-интерфейс голосового блокнота.

  1. Откройте сайт Speechpad.ru.
  2. Пролистните главную страницу до окна редактора.
  3. Выберите язык ввода.
  4. Нажмите на кнопку «Включить запись» и разрешите использование микрофона.
  5. Диктуйте текст.

Возле кнопки «Включить запись» вы увидите поле предварительного показа. В нём отображается то, что будет добавлено в документ.

Расставлять знаки препинания и переходить на новую строку можно голосом или кнопками, которые находятся между полем предварительного просмотра и редактором. При наведении на каждую кнопку появляется текст голосовой команды, к которой она применяется — например, «вопросительный знак» или «открыть скобку».

Итоговый документ доступен для скачивания в формате TXT.

VoiceNote

VoiceNote — ещё один сервис для преобразования голоса в текст, который работает только в Google Chrome. При попытке запустить его в другом браузере появляется сообщение об ошибке.

Для голосового ввода через VoiceNote можно использовать Live Demo или отдельное приложение для Chrome.

Как пользоваться VoiceNote:

  1. Откройте редактор.
  2. Нажмите на значок в виде земного шара и выберите язык ввода.
  3. Кликните по иконке микрофона.
  4. Разрешите использование записывающего устройства.
  5. Диктуйте текст.

Правила ввода здесь стандартные: знаки препинания можно проговаривать словами, а также голосом отправлять текст на новую строчку.

Полученный документ доступен для сохранения в формате TXT.

TalkTyper

TalkTyper — онлайн-редактор для голосового ввода. Главное его достоинство — поддержка 37 языков. Однако TalkTyper, как и предыдущие сервисы, работает только в Google Chrome.

Принцип ввода текста в этом редакторе не отличается от других: вы указываете язык, нажимаете на значок микрофона и разрешаете его использование. Знаки препинания и новая строка проговариваются словами.

Результат обработки текста в TalkTyper можно сохранить в виде документа в формате TXT, скопировать в буфер обмена, распечатать, отправить по почте, твитнуть и перевести на другой язык.

Voice Notepad

Voice Notepad — ещё один сервис для преобразования голоса в текст, работающий только в Chrome. Он поддерживает больше 120 языков ввода. В остальном функциональность у него такая же, как у сервисов, перечисленных выше: расстановка знаков препинания голосом, сохранение документа в формате TXT, копирование в буфер обмена, отправка по почте или на печать и т.д.

Особенность онлайн-сервисов заключается в том, что все они работают только в Google Chrome. Это связано с тем, что в их основе лежит лицензионная гугловская технология распознавания речи. Другие браузеры её не поддерживают или поддерживают с ограничениями. Например, Speechpad можно запускать в Яндекс.Браузере, однако в чужеродной среде он часто работает с ошибками. Так что если вы не пользуетесь Google Chrome, проще всего установить одну из программ для голосового ввода на компьютер и забыть про неудобства.

Переводчик с вводом текста голосом

Этот онлайн переводчик позволяет не только переводить, но и вводить текст непосредственно при помощи голоса.

Эта функция работает только в браузере Google Chrome.

Чтобы начать работу с этим сервисом следует перейти на страницу переводчика Google, который расположен по адресу translate.google.ru.

После выбора всех нужных языковых настроек следует нажать на иконку микрофона и произнести фразу. Как только сервис распознает слова, в одном поле появится результат в текстовой форме, а в другом поле появится переведенный текст.

Яндекс

Основным отличием этого сервиса от Google переводчика является возможность голосового ввода не только в браузере Google Chrome, но и в любом другом.

Чтобы начать работу с этим сервисом требуется перейти по адресу translate.yandex.ru, выставить все необходимые языковые настройки, кликнуть на значок микрофона, и разрешить его использование.

Возможности

Данное приложение предназначено для преобразования голоса в текст, который автоматически вставляется в одно из полей браузера. Именно то поле, которое было активно на момент ввода.

Ниже мы напишем, как установить расширение в свой браузер, а пока давайте разберемся с его дополнительными возможностями.

Кроме установки SpeechPad. Мы можем интегрировать утилиту в саму ОС и использовать ее в любой программе Windows.

Список основных функций SpeechPad:

  • распознавание голоса, полученного через микрофон и его конвертация в текст;
  • работа с различными языками;
  • выполнение заранее запрограммированных голосовых команд;
  • автоматическая и ручная расстановка знаков пунктуации в итоговом тексте;
  • обработка заглавных букв, точек, запятых и т. д;
  • при помощи данного приложения мы можем не просто записывать голосовые заметки, но и в режиме реального времени создавать субтитры к любому видео;
  • текст, который был набран голосом, можно скопировать в буфер обмена и оттуда экспортировать куда угодно;
  • поддерживается и перевод между различными языками.

Далее переходим к обзору достоинств и недостатков нашей программы.

Голосовой набор текста в Google Docs

Голосовой набор – весьма удобная вещь, если знать, как ею правильно пользоваться. К тому же есть несколько нюансов, не относящихся к технической части. Например, если у вас плохо поставлена речь, вы «глотаете» слова или вовсе есть какой-то дефект, то в набранном тексте будет много ошибок. Редактирование такого документа может занять больше времени, чем ручное написание нового. Есть и другие особенности. Далее мы разберемся в устройстве инструмента и потренируемся в его использовании.

Техническая часть

Для начала необходимо убедиться в том, что микрофон подключен к ПК или ноуту и нормально работает.

Подробнее:
Как настроить микрофон на Windows 10, Windows 8, Windows 7, на ноутбуке

Теперь посмотрим, как включить голосовой набор.

  1. Заходим в свой Гугл Диск и жмем на кнопку «Создать».

    Открываем новый документ, нажав на соответствующий пункт.

  2. Идем в меню «Инструменты» и выбираем «Голосовой ввод».

  3. На экране появится значок с изображением микрофона. Для запуска функции нажимаем на него один раз.

Обратите внимание, что после нажатия браузер может запросить разрешение на использование вашего микрофона. Если такое диалоговое окно появилось (слева вверху), следует нажать «Разрешить», иначе ничего не заработает

Сигналом к тому, что уже можно говорить, станет изменение формы и цвета значка.

Набор текста

На первый взгляд кажется, что ничего сложного здесь нет. Это так, но, как мы уже писали выше, есть несколько нюансов. Во-первых, это знаки препинания. Их необходимо проговаривать словами, например, «запятая», «точка» и так далее. Если вы остановились в тексте, а затем сказали «запятая», система, скорее всего, напишет это слово, а не поставит знак. Поэтому предложения лучше наговаривать целиком, без перерывов. К этому нужно привыкнуть. А вот перенос строки «новая строка» нужно вставлять немного позже завершения.

Во-вторых, нужно максимально четко проговаривать окончания. Это нужно для того, чтобы умный алгоритм Гугла разобрался, о чем идет речь. Сейчас сложно привести пример, но вы сами поймете, когда он ошибется. Это же касается и тех слов, что пишутся с дефисом, то есть вместо «почему-то» мы можем получить «почему ты».

Полное описание поддерживаемых команд, которые воспринимаются системой, можно найти в официальной справке по инструменту. Кроме знаков препинания, там содержатся и фразы, с помощью которых можно редактировать документ, то есть удалять символы и слова, выделять фрагменты, создавать списки и так далее. Неудобство заключается в том, что они должны произноситься на английском языке. При этом и ваш аккаунт, и редактируемый документ должны быть настроены на English. Это значит, что при вводе текста на русском вы никак не сможете ими воспользоваться, поэтому придется редактировать написанное вручную с клавиатуры.

Тренировка

Для тренировки мы выбрали вот такое четверостишие Сергея Есенина:

Отцовский дом покинул я;
Травой он зарастет —
Собачка верная моя
Залает у ворот…

Для того чтобы надиктовать его Гуглу, необходимо проговорить следующее ( говорить не нужно):

Отцовский дом покинул я «точка с запятой» «новая строка»
Травой он зарастет (тире придется поставить вручную: такой команды нет) «новая строка»
Собачка верная моя «новая строка»
Залает у ворот «точка» «точка» «точка»

Многоточия также лучше писать вручную, так как после каждой точки придется делать паузу, а это отнимает время.

Заключение

Сегодня мы познакомились с голосовым вводом текста в Документах Гугл. Этот инструмент может стать незаменимым помощником в быстром сохранении каких-то заметок и мыслей, а вот для использования его в качестве полноценного заменителя клавиатуры придется потренироваться.

Опишите, что у вас не получилось.
Наши специалисты постараются ответить максимально быстро.

Возможные проблемы при работе с программами голосового набора

Схема распознавания речи устройством выглядит так:

Весь процесс можно разделить на 3 главных этапа:

Акустический распознаватель

Важно говорить четко, громко, микрофон должен передавать голос без перебоев.

Лингвистическая обработка. Чем больше в словаре программы есть слов, тем качественнее будет набранный текст

То есть, все вами сказанное будет опознаваться и передаваться в текстовом виде без искажения.

Распознанный орфографический текст. Программа в автоматическом режиме выводит на экран орфографическую версию надиктованной речи, опираясь на паузы, четкость слов, найденные лексемы в словаре и т.д.

При работе с компьютерными наборщиками текста чаще всего возникает 2 проблемы:

  1. Акустический распознаватель «улавливает» вашу речь с перебоями.
  2. В словаре системы недостаточно слов, чтобы распознать всё, сказанное вами.

Чтобы решить первую проблему, необходимо четко и громко говорить. А вот для второй проблемы решения практически не существует, по крайней мере, бесплатного.

Версии программ распознавания речи, которые распространяются свободно, имеют очень скупой словарный запас.

Чтобы обеспечить программе обширный запас слов разработчикам требуется вложить немало денег, поэтому многие распознаватели демонстрируют низкий уровень перевода речи в текст.

Дальше всех в этом деле продвинулась компания Google, т.к. имеет достаточно средств для инвестиций. Эта компания, кроме прочего, создала самый большой онлайн-словарь, который помогает распознавать голос и переводить его в графическую версию.

Именно поэтому большинство программ для голосового набора работают только с помощью браузера Google Chrome, а также именно они пользуются повышенной популярностью.

Как использовать программу голосового ввода текста «SpeechPad»?

Смотрите подробное руководство в этом ролике:

Системные требования

Для того чтобы использовать это дополнение, и забыть, что такое «писать от руки», необходимо чтобы на компьютере был установлен «Net Framework 4.5» или новее. Если данное ПО у вас отсутствует или вы не можете это определить (факт установки на ПК), нужно будет выполнить следующие действия.

  1. После этого вам предложат установить дополнительные обновления.
  2. Нажмите на кнопку «Отказаться».

  1. Запустите скаченный файл.
  2. Далее возможны два варианта: сообщение о том, что Net Framework уже установлен или стартовая страница установки.
  3. В данном случае мы видим, что кнопка «Продолжить» не активна. И при этом нам говорят, что на этом компьютере всё в порядке.

В противном случае нужно будет просто нажать на кнопку «Продолжить» и дождаться окончания процесса установки.

Как заработать на записи текста с голоса

Чтобы заработать на записи текста с голосового набора, вы можете устроиться специалистом по набору текста. Таким образом, читая текст при помощи голосового набора, вы вполне можете заработать несколько тысяч на перепечатывании страниц, материал с которых не может быть скопирован.

Для начала работы вам нужно будет зарегистрироваться на тематической бирже, где работодатели размещают заказы на перевод текста или перемещение нечитаемых фрагментов материала в файл «Ворд». Выбирайте подходящий для вас заказ, связывайтесь с работодателем и предлагайте свои услуги. Например, такие заказы можно поискать на Freelancer, E-txt и других биржах.

Перед началом работы проверьте, что ваш работодатель не числится в списках мошенников в тематических сообществах.

Для выполнения подобных видов работ чаще всего не нужно делать тестовое задание, однако некоторые работодатели могут предъявить такое требование к новому удаленному сотруднику. Договор на оказание услуг чаще всего не заключается.

Заработать на голосовом наборе текста вы можете достаточно просто, поскольку для этого вам потребуется только читать уже существующий или отредактированный вами текст и после править получившийся документ. Это быстрый способ заработать деньги, который подходит практически всем пользователям интернета. Но работодатели могут оказаться мошенниками; чтобы не нарваться на нечестных заказчиков, не выполняйте объемное тестовое задание перед началом работы и всегда проверяйте адреса электронной почты и любые другие данные о человеке, который предлагает вам работу. Часто мошенники используют названия крупных компаний (например, известных издательств) и даже имеют сайты с похожим названием, но даже поверхностная проверка показывает, что это сайты-клоны, и их адрес не совпадает с адресом официального сайта компании.  Ни в коем случае не переводите никаких “страховых взносов” или любой оплаты работодателю – под каким бы предлогом вам это ни преподносили.

Голосовой набор текста может помочь при написании небольших текстов на иностранном языке. Большинство из упомянутых выше сервисов позволяют редактировать текст и самостоятельно указывают на ошибки пользователя, предлагая заменить неудачные обороты другими фразами.

Как подключается звуковой набор Google

Как уже было сказано ранее, на современных мобильных телефонах система Гугл уже автоматически установлена.

К сведению! Для нормального функционирования достаточно обновлять ее не реже раза в 2-3 месяца.

Однако если аудио ввод команд по каким-то причинам отключен, его можно активировать самостоятельно. Делается это следующим образом:

  1. Зайти в меню «Настройки» программы Гугл.
  2. Далее открыть «Поиск и подсказки».
  3. В разделе «Google NOW» поставить переключатель в режим «Включить».

Включение ОК Google

Если на смартфоне используется мобильное приложение от Гугл, то функция звукового поиска включается так:

  1. Открыть функцию настроек. Делается это путем нажатия на значок в виде 3 точек, располагающийся вверху с правой стороны.
  2. Далее нужно перейти в настройки, а затем в «Голосовой поиск».
  3. Активировать функцию распознавания «ОК Google».

Как набирать текст в Word голосом

Впрочем, это не совсем так. Не так давно компания выпустила расширение с говорящим названием Microsoft Dictate, позволяющее набирать тексты в Word голосом, но оно не идет ни в какое сравнение с голосовым движком Google. Если вы хотите реализовать голосовой ввод в Word, придется поискать более эффективные инструменты или, в крайнем случае, отказаться от голосового набора в Microsoft Word в пользу онлайнового текстового редактора Google Docs, в котором эта функция действительно работает.

Microsoft Dictate

Как уже было сказано, это не самый лучший и эффективный способ реализации голосового ввода в Microsoft Word. Скачав с сайта разработчика https://dictate.ms/

и установив модуль Microsoft Dictate, вы сможете набирать в Word лишь английские тексты, да и то не самого лучшего качества. После установки расширения на панели инструментов приложений Microsoft Office появится вкладка Dictation,

где вы сможете активировать распознавание голоса и выбрать язык.

В настоящее время приложение поддерживает ввод с 20-и языков и перевод с более чем 60-и языков, но, похоже, русский в эту двадцатку не входит. Набирать голосом вы сможете только английские тексты, если же попробуйте сделать это на русском, то получите полную несуразицу. К тому же приложение Dictate использует тот же языковой движок, что и Cortana, а как известно, последний не так хорош, как голосовой движок Google. В общем, проведя ряд тестов с приложением, мы были вынуждены отложить Dictate в долгий ящик и перейти к более эффективному инструменту.

Голосовой блокнот

В интернете по адресу speechpad.ru есть замечательный отечественный инструмент под названием «Голосовой блокнот», использующий для распознавания голоса алгоритмы Google. Позиционируется он как веб-сервис, но также предлагает возможность интеграции непосредственно в операционную систему для последующего ввода текста голосом в сторонних приложениях, в том числе и Microsoft Word. Чтобы получить возможность набирать в редакторе голосом, вам нужно будет зарегистрироваться на сайте разработчика,

установить расширение Голосового блокнота для Chrome, скачать со странички https://speechpad.ru/blog/windows-integration/ модуль интеграции и установить его, запустив командный файл install_host.bat.

Затем, авторизовавшись на сайте и зайдя в личный кабинет пользователя, включить тестовый период. Далее на страничке speechpad.ru нужно установить флажок «Интеграция с ОС» и включить запись.

После этого в приложениях должен стать доступен голосовой текстовый ввод. Никаких всплывающих окон и кнопок Голосовой блокнот не выводит, просто начинаем диктовать текст в том же Word или другом приложении. Главное, чтобы браузер был запущен, и кнопка записи включена.

Инструмент на наш взгляд вполне достойный, но за его использование придется платить порядка 100 рублей в месяц, такова установленная его создателем такса.

Google Documents

Сервис Google Documents не имеет прямого отношения к Microsoft Word, будучи продуктом иной компании, но он может стать отличной альтернативой для тех пользователей, которым нужен качественный инструмент голосового набора. Здесь всё проще простого: создайте новый или откройте уже существующий документ, перейдите в меню Инструменты –> Голосовой ввод,

нажмите появившуюся иконку микрофона и начинайте диктовать.

Возможно, Google Documents не так удобен и функционален как Microsoft Word, но зато с голосовым вводом в нём у вас не будет проблем и это тем более, что никаких модулей в систему устанавливать не придется.

Голосовой ввод текста в редакторе Word – очень удобный и продвинутый инструмент. Но о нём знают не многие. Это не удивительно, поскольку технология была запущена относительно недавно: 27 июня 2017 года на официальном сайте Microsoft появилась новость, в которой они сообщили о новой возможности.

Использование голосового набора в Документах Google

Чтобы использовать эту функцию в Google Документах, вам просто нужно включить микрофон голосового набора. Затем выберите значок микрофона, и вы готовы продиктовать свой документ.

Для начала запустите Google Docs. Выберите инструменты меню и затем выберите Голосовой набор из раскрывающегося меню.

В новом окне откроется значок микрофона. Вы можете перемещать это маленькое окно по документу, как вам нужно, чтобы оно не блокировало то, что вы диктуете.

Чтобы начать диктовать документ, просто нажмите значок микрофона. Значок станет красным, когда он вас слушает (через микрофон).

Просто начните говорить, как обычно, и вы увидите, как ваши слова будут появляться в документе по мере ввода.

Обязательно укажите, где идут знаки препинания. Ниже приведены все типы пунктуации, которые вы можете указать в Документах Google.

  • Период
  • Запятая
  • Восклицательный знак
  • Вопросительный знак

Просто произнесите любую из этих команд в середине или в конце предложения, чтобы применить этот знак препинания.

Заметка: Очень важно говорить несколько медленно и хорошо произносить слова. Если вы говорите быстро или бормочете, вы заметите, что технология распознавания голоса может вводить неправильные слова или совершенно неправильные фразы

Еще несколько примечаний о том, как диктовать текст в Документах Google:

  • Первая буква любого предложения будет автоматически заглавной.
  • Существительные собственные также пишутся с заглавной буквы.
  • Ошибки написания маловероятны, поскольку функция голосового набора использует только известные слова из словаря.
  • Фоновый шум может мешать, поэтому убедитесь, что вы работаете в тихой комнате.
  • Если вы сделаете паузу слишком долго, функция голосового набора автоматически отключится и перестанет слушать.

К этому нужно привыкнуть, но как только вы наберете хороший темп и начнете хорошо излагать, вы обнаружите, что в конечном продукте у вас практически не будет ошибок.

Немного хитростей

Таскер – это хардкор. Можно творить потрясающие вещи, но для этого нужно освоить много информации, разбираться в переменных, регулярных выражениях и прочем. Для тех, кто не хочет возиться с Таскером, есть большое количество программ, которые используют возможности голосового управления, но имеют более понятный и доступный интерфейс и просты в обращении. Остановлюсь на трех.

Программа позволяет изменить ключевую фразу с «Ok, Google» на любую другую. К сожалению, после одного из обновлений сервисов и запроса от Google перестала работать с Google Engine, оставив только PocketSphinx. В связи с этим для ключевой фразы подходят только английские словосочетания, но раньше можно было удивлять присутствующих обращением к телефону «эй, ты» или «слушай команду».

Тем не менее разработчик обещает все поправить в следующих обновлениях. Из других функций можно отметить запуск распознавания по датчику приближения (два взмаха руки) и по встряске телефона. Как и MOTO X, поддерживает распознавание при выключенном экране, но, к сожалению, это очень сильно отражается на батарее, поэтому актуально для телефона на зарядке или автомобильных медиацентров на Android с постоянным питанием. Работает с Bluetooth-гарнитурой, имеет интеграцию с Таскером, может зачитывать текстовые сообщения.

Еще одна программа от разработчика Open Mic+. Интегрируется с Google Now и позволяет использовать расширенный набор команд. В списке поддерживаемых есть следующие: включить/выключить беспроводную точку доступа, приостановить/возобновить музыку, следующая/предыдущая песня, непрочитанные СМС/gmail (озвучит их голосом), громкость, блокировка телефона, сделать снимок, сделать селфи. Также можно включить диктофон, управлять подсветкой, автоповоротом экрана. С рутом можно выключить/перезагрузить телефон, очистить уведомления, включить режим «В самолете». Для поддерживаемых функций можно менять команды на свои. Также имеет интеграцию с Таскером, позволяя включить для каждой задачи срабатывание по названию Task. Есть модуль для Xposed, позволяющий использовать Commandr с Android Wear.

Ассистент Дуся

Ну и наконец, детище российских разработчиков – русскоязычный голосовой ассистент Дуся, который объединяет в себе все преимущества описанных приложений и утилит. Как и Tasker, Дуся позволяет создавать свои голосовые функции (они называются «скрипты»), причем в намного более понятной и простой форме (есть справка на русском, видеоуроки) и с более мощными функциями работы именно с речевыми командами. Вдобавок здесь есть и свой онлайн-каталог готовых скриптов, созданных другими пользователями. На момент написания статьи их было около ста.

Так же как и Commandr, Дуся умеет интегрироваться с Google Now, а также имеет множество видов других бесконтактных активаций – встряхиванием, взмахом, гарнитурой, поднесением к уху и в том числе и своей фразой активации на русском. А если хочется использовать интерфейс, то и он есть, очень простой, быстрый и функциональный. Среди функций есть 25 наиболее часто востребованных, есть даже управление умными домами и домашними кинотеатрами.

Dictation.io

Сервис онлайн распознавания речи через микрофон. Посредством голоса можно расставлять параграфы, знаки пунктуации и даже смайлики. Dictation пригодится для написания электронных писем или заполнения документов в браузере.

Использование сервиса:

  • Перейти на страницу транскрибации.
  • В правой части экрана нажать на три горизонтальные полоски, чтобы выбрать язык ввода. Поддерживается большое количество языковых направлений.

В левом нижнем углу кликнуть по кнопке «Start».

Начать диктовку текста.
Редактирование материала осуществляется путем встроенного редактора. Непосредственно со страницы можно выполнить сохранение текста, его публикацию, печать.

«Яндекс»

«Яндекс» не обладает таким большим набором платформ, на которых можно было бы применять голосовой ввод. Поэтому пока он представлен в продуктах «Поиск», «Разговор» и «Переводчик». Также навигаторы от «Яндекс» умеют распознавать речь и разговаривать с пользователем.

«Поиск» можно встретить в «Яндекс Браузере». Здесь он встроен по умолчанию и действует аналогично Chrome. Основана технология на собственной разработке компании, которая также доступна и для коммерческих нужд в виде Speech.Kit. Подключив его к своему проекту, можно использовать неограниченное количество запросов для распознавания. Однако услуга эта платная.

Рекомендации, которые помогут улучшить качество распознавания текста

Все сервисы, которые мы привели в подборке, достаточно хорошо распознают русский язык, однако иногда качество распознанного текста может быть посредственным. Чтобы такого не происходило, следуйте нескольким базовым рекомендациям.

  • Используйте хороший микрофон. Идеально, если у вас есть качественная гарнитура или внешний микрофон с шумоподавлением. Если же используете встроенный микрофон компьютера/ноутбука, убедитесь, что микрофон исправно работает, ничем не прикрыт, а вы находитесь достаточно близко, чтобы звук хорошо улавливался устройством.
  • Произносите слова четко и неторопливо. Хорошая дикция определенно будет плюсом. Чем четче вы произносите слова, тем выше вероятность, что сервис сможет корректно распознать речь (даже если качество микрофона оставляет желать лучшего). Также не стоит произносит фразы слишком быстро, в этом случае часть слов может быть не распознана и текст придется редактировать.
  • Позаботьтесь, чтобы вокруг вас не было посторонних звуков и шумов. Для качественного распознавания речи вокруг не должно быть музыки и других громких звуков.

Соблюдайте эти рекомендации и необходимость правок будет минимальной.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Adblock
detector