Голосовые переводчики реального времени
Содержание:
- Что такое транскрибация
- iTranslate
- 5 Dragon Dictation
- TripLingo
- Google Translate
- Заказ перевода аудио в текст у специалистов
- Microsoft Translator
- Переводчик от Яндекс – эффективный отечественный транслейтор
- Bing Translator – онлайн-решение от компании Майкрософт
- Стационарные программы для голосового ввода
- 1 Сайт speechpad.ru
- Особенности перевода голоса в текстовый формат
- Day Translations
- Приложение для онлайн-трансформации текста на другой язык
- Translate Voice – переводчик аудио
- Google Translate
- Google Переводчик — ведущий сетевой переводчик онлайн
- Заключение
- Заключение
Что такое транскрибация
Транскрибация – это автоматический или ручной перевод речи в текст, точнее, запись аудио или видео-файла в текстовом виде.
Есть в интернете оплачиваемые платные задания, когда за транскрибацию текста исполнителю выплачивается некоторая сумма денег. В этом случае транскрибацию делают вручную.
Однако можно сделать транскрибацию автоматически, с помощью специальной программы, умеющей “слушать” текст и одновременно “печатать” его, превращать в текстовый файл, пригодный для дальнейшего использования.
Перевод речи в текст вручную или с помощью специальной программы полезен
- студентам для перевода записанных аудио- или видео-лекций в текст,
- блогерам, ведущим сайты и блоги,
- писателям, журналистам для написания книг и текстов,
- инфобизнесменам, которым нужен текст после проведенного ими вебинара, выступления и т.д.,
- фрилансерам, которые вручную делают перевод речи в текст, для облегчения и ускорения своей работы,
- людям, которым сложно печатать – они могут надиктовать письмо и послать его родным или близким,
- другие варианты.
О проблемах автоматического перевода речи в текст
Можно выделить две крупных проблемы перевода речи в текст с помощью программы: качество записанной речи и наличие в записи фона в виде шума, музыки или иных посторонних звуков.
Речь у всех людей разная:
- настолько быстрая, что слова проглатываются, или, наоборот, очень медленная;
- с четкой дикцией, как у профессиональных дикторов, или настолько невыразительная, что сложно что-либо разобрать;
- с отличным произношением или, напротив, с сильным акцентом, например, когда говорит иностранец.
В каких случаях программа автоматической транскрибации будет давать самый наилучший результат перевода речи в текст? Программа будет делать более или менее качественный перевод, когда на записи человек говорит с четкой дикцией, с нормальным темпом речи, без акцента. При этом в записи речи отсутствуют посторонние звуки в виде шума, музыки, разговоров других людей. Тогда можно надеяться на хороший автоматический перевод, не требующий ручных исправлений или с минимальными изменениями.
В остальных случаях, когда речь невыразительная и присутствуют посторонние шумы, перевод с помощью программы или приложения будет значительно хуже. Возможно, какая-то программа или сервис будет выполнять транскрибацию такой речи лучше, чем другие программы и приложения, но не стоит ожидать чуда.
В некоторых случаях стоит все-таки обратиться на биржу фриланса, где живой человек выполнит перевод вручную. Впрочем, здесь тоже нельзя гарантировать высокого качества, поскольку фрилансер может использовать программы автоматической транскрибации, и поленится вносить в получившийся текст правки.
Опишем наиболее эффективные инструменты, доступные на компьютере, мобильные приложения и онлайн-сервисы для перевода речи в текст.
iTranslate
Переводчик iTranslate, пожалуй, главный конкурент Google Translate, так как имеет почти такой же богатый функционал. Кроме работы с аудио, он распознает текст на фотографиях и поддерживает автономные словари, дающие возможность переводить без подключения к Интернету. Однако эти функции доступны только в платной версии.
Возможности приложения:
- поддержка более 100 языков; кроме привычных английского, немецкого, французского, итальянского, испанского и т.д., здесь присутствуют китайский, корейский и другие восточные языки.
- автономный режим перевода более чем на 40 языках;
- озвучивание текста на выбор мужским или женским голосом;
- различение диалектов;
- встроенный словарь и тезаурус;
- транслитерация, совместное использование, функция избранного и история переводов;
- перевод с камеры телефона;
В iTranslate есть раздел с часто используемыми фразами, которые могут понадобиться в общении с иностранцами.
Переведенный текст можно отправить по почте или в виде СМС на телефон.
В бесплатной версии программы есть ограничение на объем переводимого материала. Чтобы его убрать, придется купить премиум-подписку. Кроме того, бесплатная версия не поддерживает захват текста с камеры и фото, а также не работает без подключения к Интернету.
Чтобы выполнить звуковой перевод в iTranslate, сделайте следующее:
- Выберите направление.
- Нажмите на иконку с изображением микрофона и начните говорить.
Цены на различные опции программы варьируются от $2.99 — $43.99 долларов США.
5 Dragon Dictation
Это приложение, которое распространяется бесплатно для мобильных устройств от компании Apple.
Программа может работать с 15 языками. Она позволяет редактировать результат, выбирать из списка нужные слова. Нужно четко проговаривать все звуки, не делать лишних пауз и избегать интонации. Иногда возникают ошибки в окончаниях слов.
Приложение Dragon Dictation используют обладатели яблочных гаджетов, например, чтобы, перемещаясь по квартире, надиктовать список покупок в магазине. Придя туда, они могут посмотреть на текст в заметке, и не надо слушать.
Только так можно будет получить безукоризненный текст без ошибок.
TripLingo
Мне нравитсяНе нравится
Это приложение – интерактивный разговорник, которым удобно и интересно пользоваться. Оно мгновенно переводит устную речь с 19 языков. Программа была разработана для путешествий, поэтому у нее много соответствующих функций, таких как:
- расчет чаевых с учетом особенностей и этикета страны;
- возможность позвонить по телефону в США через Интернет;
- конвертация валют;
- краткий экскурс в культуру определенной страны.
После последнего обновления приложение стало работать еще быстрее. Также были добавлены новые, актуальные сведения о различных странах, советы для путешественников, справочник по местам культурного отдыха. Теперь ТрипЛингво – это больше, чем переводчик, это настоящий путеводитель для туристов.
Приложение очень популярно, им пользуется более чем 300 тысяч человек во всем мире. Его не раз упоминали в средствах массовой информации, и количество скачиваний все время растет.
Загрузить ТрипЛингво можно на устройства Apple и Android. Есть бесплатная и платная версии ( в последней расширяется выбор доступных функций).
Плюсы и минусы
Огромное количество фраз.
Множество файлов для прослушивания.
Встроенный конвертер валют.
Поддержка карточек.
Небольшое количество языков
Google Translate
Компания Google преуспела не только в развитии своей поисковой системы, но и создала, пожалуй, самый признанный в мире переводчик, который воспринимает голос, печатный текст, а также текст на фотографиях на более чем 100 языках. Google Translate распознает речь даже при низким качеством звука и в большинстве случаев выдает правильный перевод.
Если предварительно загрузить словари, в текстовом режиме Google Translate работает автономно, но для голосового переводчика всегда нужен доступ в Интернет.
Функции приложения:
- текстовой перевод на 103 языка, без подключения к интернету — на 59;
- мгновенный перевод захваченного изображения с камеры на 88 языков, текста на фото — на 50;
- прямой голосовой перевод на 43 языка;
- распознавание рукописного текста на 95 языках;
- сохранение переведенных слов и фраз для дальнейшего использования;
- синхронизация между устройствами.
Голосовой перевод Google Translate работает в двух режимах. В первом вы произносите фразу, программа ее распознает и выдает переведенный текст, который впоследствии можно озвучить, нажав соответствующую кнопку. Второй режим отличается от первого тем, что озвучивает переведенное сразу, однако он поддерживает не все диалекты.
Чтобы выполнить голосовой перевод в Google Translate, сделайте следующее:
- Переключите программу в режим разговора.
- Установите направление перевода.
- Нажмите на иконку с изображением микрофона и начните диктовать текст.
Заказ перевода аудио в текст у специалистов
Вообще, мне достаточно часто нужна услуга по расшифровке аудиозаписей в текст. Нужно переводить в текст мои видеоуроки. Иногда я сначала наговариваю мысли для статьи на диктофон, а потом транскрибирую. Можно конечно заниматься этим самостоятельно с помощью программ, но это отнимает много времени. Почему? Потому что программы для транскрибации не всегда верно расшифровывают слова и приходится долго править полученный текст, форматировать его, вставлять знаки препинания и таймкоды.
Поэтому я нанимаю фрилансеров. Но.. И тут есть “засады”! Очень сложно найти “правильного” фрилансера, который бы делал все четко и в срок. И особенная проблема в том, что фрилансеры (особенно молодые) плохо дружат с русским языком. И часто делают еще больше ошибок, чем программы 🙁 Поэтому я стал искать специализированный сервис, который занимается ручным переводом аудио в текст. И чтобы качественно и недорого. И… Я похоже, нашел такую фирму.
Сейчас я расскажу, чем мне приглянулся данный сервис. Итак, смотрим. Кстати, Все картинки увеличиваются по клику…
Это пока единственный российский сервис по транскрибации аудио с личными кабинетами, который “заточен” под бизнесменов, журналистов, юристов и т.п. То есть, для тех людей, для которых качество и скорость расшифровки аудиофайлов являются самыми важными факторами.
Из “приятных плюшек” хочу отметить еще три, особо мне понравившихся.
- Тестовый заказ. Бесплатный. Для проверки качества работы этого сервиса. Можете попробовать, если не уверены в качестве расшифровки.
- Работа с PayPal. Это означает, что с сервисом могут работать “забугорные” люди. Кстати, проблема с платежами, нередка в случае когда пытаются оплатить услуги российского сервиса из-за рубежа. Ну и PayPal дополнительно защищает Ваши покупки.
- Работа с аудиозаписями из судов. Для меня это ничего не говорит, но мой друг, юрист, говорит, что это крутая фишка..
Короче, не буду навязывать Вам этот сервис. Лучше сами посмотрите и решите, стоит ли с ним работать.
Ну и как обещал выше, рекомендую посмотреть это видео, где я подробней разбираю этот сайт.
А вот и подоспели итоги полной расшифровки моего видеоролика. Посмотрим, что получилось!
Microsoft Translator
Мне нравится216Не нравится76
Переводчик от компании Майкрософт способен работать не только с напечатанным текстом, но и с голосом. При этом он способен распознавать нескольких людей и корректно отобразить, а далее и перевести беседу. Программа способна организовать единовременное общение до 100 человек.
Одно из особенных функций переводчика от Майкрософт – он может работать с изображениями и камерой. То есть, чтобы перевести какую-то надпись на объекте, ее не потребуется вводить вручную: достаточно будет просто навести на нее камеру смартфона. Также в программу встроен разговорник и руководство по произношению слов и выражений на некоторых языках. Общая языковая база:
- для текстового перевода – 64 языка (большинство из них работает в режиме офлайн);
- для распознавания и перевода речи – 21 язык.
Переводчик способен помочь с общением в чужой стране. В его базу занесен большой разговорник, который можно и читать, и слушать. Примечательно, что приложение также активно в фоновом режиме: любую фразу из браузера и других программ можно будет перевести через контекстное меню.
Скачать переводчик от Майкрософт можно и на устройства Apple, и на ОС Android.
Плюсы и минусы
Поддержка огромного количества языков.
Возможность скачивания языкового пакета для работы без интернета.
Перевод надписей с изображений.
Возможность синхронного перевода (до 100 собеседников одновременно.)
Полностью бесплатное приложение
Возникают проблемы при переводе технических текстов.
Отзывы
Переводчик от Яндекс – эффективный отечественный транслейтор
Компания «Яндекс» использует собственный алгоритм машинного перевода для работы своего сервиса «Яндекс.Переводчик». Последний был создан ещё в 2009 году, прошёл несколько этапов своего становления, а с сентября 2017 года начал активный переход на нейронный машинный перевод. На сервисе доступен конвертер текста до 10 тысяч символов с озвучкой голосом.
Работа с Яндекс в целом не отличается от аналога Гугл:
- Перейдите на Яндекс.Переводчик.
- В поле слева введите нужный текст.
- Справа просмотрите полученный результат.
- Для воспроизведения голосом нажмите на пиктограмму динамика чуть выше текста.
Bing Translator – онлайн-решение от компании Майкрософт
Компания Майкрософт старается не отставать от конкурентов, постоянно работая над созданием и улучшением своих переводчиков. Последние встроены в Bing, MS Office, Edge, SharePoint, Skype Translator и другие инструменты, позволяя выполнять качественные переводы текстов с одного языка в другой. Давайте воспользуемся данным инструментом, содержащимся в популярном сервисе bing.com.
Для запуска переводчика со звуком голоса от Бинг выполните следующее:
- Активируйте bing.com.
- Введите в поле слева ваш текст. Справа автоматически отобразится полученный результат.
- Для прочтения результата голосом нажмите на значок динамика чуть выше.
Стационарные программы для голосового ввода
Кроме перечисленных сервисов существуют разнообразные стационарные программы, позволяющие перевести речь в текст. Обычно они имеют в своей структуре встроенный механизм для распознавания текста, работают с множеством языков, и во многих случаях не требуют постоянного подключения к Интернету.
Среди таких программ отметим следующие:
- «Dictate» — специальная программа-надстройка для MS Word. После установки программы в системе откройте ваш Ворд, и выберите в нём вкладку «Dictation». Появится значок с микрофоном. Рядом с последним выберите русский язык и начните запись;
- «Dragon Professional Individual» (Windows, Mac) – одна из лучших платных программ в своём сегменте. Включает множество инноваций, поддерживает различные голосовые команды формата, имеют мощные возможности транскрибации;
- «Braina Pro» (Windows) – это целый виртуальный ассистент, управляемый искусственным интеллектом. Вы можете диктовать ему текст более чем на 100 языках, он отлично понимает различные компьютерные команды, устанавливает будильник, служит как словарь и тезаурус;
- «E-speaking.com» (Windows) — Используя программный интерфейс «Microsoft Speech Application» и «Net Framework», программа «e-Speaking» позволяет использовать голос для управления ПК, диктовки документов и электронных писем, прочтения текста вслух. Поддерживается множество голосовых команд для управления ПК.
1 Сайт speechpad.ru
Это онлайн-сервис, который позволяет через браузер Google Chrome переводить речь в текст. Сервис работает с микрофоном и с готовыми файлами. Конечно, качество будет значительно выше, если использовать внешний микрофон и диктовать самому. Однако сервис неплохо справляется даже с видеороликами на YouTube.
Нажимаем «Включить запись», отвечаем на вопрос про «Использование микрофона» – для этого кликаем «Разрешить».
Длинную инструкцию про использование сервиса можно свернуть, нажав на кнопку 1 на рис. 3. От рекламы можно избавиться, пройдя несложную регистрацию.
Рис. 3. Сервис speechpad
Готовый результат легко редактируется. Для этого нужно либо вручную исправить выделенное слово, либо надиктовать его заново. Результаты работы сохраняются в личном кабинете, их также можно скачать на свой компьютер.
Список видео-уроков по работе с speechpad:
Можно транскрибировать видео с Youtube или со своего компьютера, правда, понадобится микшер, подробнее:
Видео «Транскрибирование аудио»
Работает сервис с семью языками. Есть небольшой минус. Он заключается в том, что если нужно транскрибировать готовый аудио-файл, то его звучание раздаётся в колонки, что создает дополнительные помехи в виде эха.
Особенности перевода голоса в текстовый формат
Как известно, попытки создать программы для распознавания голоса берут своё начало ещё в середине 20 века. Поначалу распознавание было довольно слабым, но использование более совершенных методов и технологий (скрытые марковские модели, нейронные сети etc.) подняло распознавание голоса на довольно высокий уровень.
Ныне мы можем встретить достаточное количество сетевых сервисов и программ, выполняющих перевод речи в текст. Практически все они хорошо распознают человеческий голос на многих языках (включая русский), и способны переводить его в текстовый формат. При этом 100% понимания речи достичь пока не удаётся, Это связано с шумами при звучании, невнятной дикцией или акцентом говорящего, помехами в работе микрофона, эмоциональным состоянием человека и другими схожими факторами.
При этом использование таких сервисов и программ позволяет существенно сэкономить время при наборе различных текстов. Вы можете быстро надиктовать нужный фрагмент после чего сохранить его в удобном текстовом формате на ваш компьютер или телефон.
Давайте разберёмся, какие сервисы и программы помогут быстро перевести речь в текст.
Day Translations
Иногда бесплатные сервисы не справляются. Например, плохо читается надпись, у собеседника специфическое произношение или просто требуется максимально высокое качество перевода для серьезных задач. Тогда на помощь приходят гибридные решения, сочетающие скорость систем на базе ИИ с уровнем профессиональных лингвистов.
Такой метод использует в своем одноименном онлайн-сервисе компания Day Translations Inc. Она была основана в Нью-Йорке в 2007 году, и с тех пор предлагает услуги перевода более чем на ста языках.
На момент написания этой статьи (ноябрь 2019 года) была доступна версия 2.0.2. Она оставила в целом приятное впечатление, но в ходе тестирования выявились и некоторые минусы. В частности, Day Translations не позволяет изменять вручную неуверенно распознанные слова. Программа сама подменяет их сходными по звучанию и сразу озвучивает перевод. Еще одно существенное ограничение касается работы с текстом. В бесплатной версии установлен лимит на перевод в объеме до 30 тыс. символов в сутки.
Если программа не справляется, то прямо в ней можно воспользоваться платными услугами профессиональных переводчиков. Они всегда доступны в чате и готовы помочь там, где ИИ не распознает оригинал или плохо улавливает контекст. По большому счету, это единственное преимущество программы.
Приложение для онлайн-трансформации текста на другой язык
В мобильном приложении Google Translate всё так же очень просто. Доступно для двух популярных мобильных платформ — Андроид и iOS.
Оно также ещё более функциональное, чем сайт переводчика Google:
Функции: | Особенности: |
---|---|
Большой выбор языков | Позволяет переводить текстовые сообщения на более чем 100 языков. |
Работа в режиме офлайн | Можно переводить предложения и речь без интернета. Эта функция будет работать для 59 языков до того момента, пока вы снова не подключитесь к интернету. |
Перевод через фотокамеру | Моментальный перевод, используя фотокамеру мобильного устройства (функция доступна для Android 5.0 и выше). Поддерживается 38 языков. |
Распознавание текста на картинках | Поддерживается 37 языков. |
Поддержка моментального перевода надиктованной речи | В этом режиме можно общаться с иностранцами и читать перевод на смартфоне |
Перевод рукописного ввода | Ввода со стилуса. |
Разговорник | Есть также словарь, который составляет сам пользователь. Каждый раз при переводе фразы можно отбирать для разговорника. |
Чтобы переводить на смартфоне свою речь, например, с русского языка на английский, скачайте приложение. Если его ещё нет на вашем мобильном устройстве.
Порядок работы с сервисом:
- Откройте Google Translate в главном меню;
- Выберите в приложении кнопку с микрофоном;
- Укажите пару языков, для которых нужен перевод;
- И произнесите фразу, которую нужно трансформировать.
Если вы выбрали какой-то язык, но кнопка с микрофоном сейчас окрашена в серый цвет, значит выбранный вами язык не поддерживается для голосового перевода в сервисе Google. Когда вы увидите приглашение «Говорите» в окне приложения, это значит, что можно произносить слова для перевода. Пользователь может настроить в онлайн-программе диалекты. Доступно не для всех поддерживаемых языков.
Translate Voice – переводчик аудио
Translate Voice — приложение для перевода диалогов с одного языка на другой. Будет полезно, если вы хотите на лету перевести собеседника или наоборот, озвучить свои фразы на другом языке.
Вкратце отметим основные функции мобильного переводчика:
- Перевод между несколькими языками. В настройках выбираете язык, на котором произносятся фразы, а также направление перевода (по такому принципу работают многие голосовые переводчики). Немецкий, итальянский, испанский, английский русский, японский – всего около 100 языковых направлений.
- Переводить можно не только человеческую речь, но и простой текст — результат будет доступен в виде текста либо можно озвучить переведенные фразы.
- Публикация результатов перевода — можно отправить на почту, поделиться в социальной сети, сбросить в онлайн-облако.
- Доступно такое направление перевода: речь преобразуется в текст, затем текст переводится.
В общем и целом, переводчик Translate Voice удобен и прост в использовании (можно переводить в один клик). Приложение будет полезно для общения с носителями иностранных языков, простого текстового перевода.
Преимущества | Недостатки |
|
|
Google Translate
Скорость перевода текста этим голосовым переводчиком для iPhone достаточно высокая. Результаты он выдает очень быстро. Даже если проговорить целое предложение, программа выдаст результаты перевода почти сразу. Все быстро и красиво. Минималиcтичный интерфейс, аккуратные кнопки, значки и прочее.
Для активации работы приложения с голосом достаточно нажать на микрофончик около поля ввода текста и приложение начнет считывать ваш голос.
Пожалуй, две важнейшие особенности приложения, которые заставят вас побежать в App Store и скачать приложение – это его цена – бесплатно, и поддержка русского языка.
Естественно, приложение работает с API Google. И это его огромный плюс. Но увы, переводчик не поддерживает перевод диалога. То есть, один говорит «в микрофон» и приложение переводит его речь, затем другой делает то же самое, и так далее, как это реализовано в iTranslate Voice.
С той самой замысловатой фразой, которую я приводил выше, приложение справилось абсолютно также, как и все остальные.
Google Переводчик — ведущий сетевой переводчик онлайн
Наиболее популярным в мире переводчиком является Гугл Переводчик – веб-служба Гугл, созданная для выполнения автоматического перевода части текста или сетевой страницы на различные языки. Данный переводчик имеет бесплатный характер, способен за раз переводить большие куски текста с узбекского языка, поддерживает более сотни других языков. С 2017 годов компания Гугл полностью перевела свой переводчик на нейросеть, что существенно улучшило качество выполняемых переводов.
Имеется на сервисе и функция перевода с узбекского на русский язык и наоборот. Голосовой ввод на узбекском на данный момент не доступен, тексты же с узбекского Гугл Переводчик переводит без проблем.
Для работы с сервисом перейдите на translate.google.com, слева введите текст на узбекском, а справа получите перевод.
Нажав на кнопку динамика под ответом, вы сможете прослушать перевод с узбекского голосом.
Заключение
Итак, для перевода с русского на другие языки и обратно мы рекомендуем использовать программу от Яндекса, поскольку нашу речь она понимает лучше всего. Для переводов c/на остальные языки целесообразнее использовать Гугл переводчик и iTranslate. А для специфических текстов и терминов — Day Translations.
Важно отметить и особенность всех голосовых переводчиков: для повышения точности результата лучше диктовать текст фразами из 5-7 слов. Это нужно для того, чтобы приложение уловило смысл текста и выбрало наиболее подходящие формулировки
На этом обзор голосовых переводчиков подошел к концу. Надеемся, что информация будет вам полезна.
Обложка: Яндекс.Переводчик
Заключение
Большинству пользователей в зарубежных поездках поможет сервис Google Translate, доступный как через веб-интерфейс, так и через мобильное приложение с интеграцией функций перевода в контекстное меню. За счет офлайновых словарей он выручит и там, где нет Интернета.
Если вам требуется локализация программ, быстрый перевод презентаций или чтение лекций для зарубежных студентов, обратите внимание на Microsoft Translator. В этом сервисе доступна интеграция через API и специальные инструменты для образования.. Обладателям старых смартфонов стоит присмотреться к SayHi как самому легковесному приложению
Его функция выбора голоса и настройки скорости озвучки существенно упрощают живое общение.
Обладателям старых смартфонов стоит присмотреться к SayHi как самому легковесному приложению. Его функция выбора голоса и настройки скорости озвучки существенно упрощают живое общение.
По возможности используйте несколько переводчиков для перекрестной проверки результата. Благо, они бесплатные и не занимают много места в памяти смартфона.