Голосовые переводчики реального времени

Что такое транскрибация

Транскрибация – это автоматический или ручной перевод речи в текст, точнее, запись аудио или видео-файла в текстовом виде.

Есть в интернете оплачиваемые платные задания, когда за транскрибацию текста исполнителю выплачивается некоторая сумма денег. В этом случае транскрибацию делают вручную.

Однако можно сделать транскрибацию автоматически, с помощью специальной программы, умеющей “слушать” текст и одновременно “печатать” его, превращать в текстовый файл, пригодный для дальнейшего использования.

Перевод речи в текст вручную или с помощью специальной программы полезен

  • студентам для перевода записанных аудио- или видео-лекций в текст,
  • блогерам, ведущим сайты и блоги,
  • писателям, журналистам для написания книг и текстов,
  • инфобизнесменам, которым нужен текст после проведенного ими вебинара, выступления и т.д.,
  • фрилансерам, которые вручную делают перевод речи в текст, для облегчения и ускорения своей работы,
  • людям, которым сложно печатать – они могут надиктовать письмо и послать его родным или близким,
  • другие варианты.

О проблемах автоматического перевода речи в текст

Можно выделить две крупных проблемы перевода речи в текст с помощью программы: качество записанной речи и наличие в записи фона в виде шума, музыки или иных посторонних звуков.

Речь у всех людей разная:

  • настолько быстрая, что слова проглатываются, или, наоборот, очень медленная;
  • с четкой дикцией, как у профессиональных дикторов, или настолько невыразительная, что сложно что-либо разобрать;
  • с отличным произношением или, напротив, с сильным акцентом, например, когда говорит иностранец.

В каких случаях программа автоматической транскрибации будет давать самый наилучший результат перевода речи в текст? Программа будет делать более или менее качественный перевод, когда на записи человек говорит с четкой дикцией, с нормальным темпом речи, без акцента. При этом в записи речи отсутствуют посторонние звуки в виде шума, музыки, разговоров других людей. Тогда можно надеяться на хороший автоматический перевод, не требующий ручных исправлений или с минимальными изменениями.

В остальных случаях, когда речь невыразительная и присутствуют посторонние шумы, перевод с помощью программы или приложения будет значительно хуже. Возможно, какая-то программа или сервис будет выполнять транскрибацию такой речи лучше, чем другие программы и приложения, но не стоит ожидать чуда.

В некоторых случаях стоит все-таки обратиться на биржу фриланса, где живой человек выполнит перевод вручную. Впрочем, здесь тоже нельзя гарантировать высокого качества, поскольку фрилансер может использовать программы автоматической транскрибации, и поленится вносить в получившийся текст правки.

Опишем наиболее эффективные инструменты, доступные на компьютере, мобильные приложения и онлайн-сервисы для перевода речи в текст.

iTranslate

Переводчик iTranslate, пожалуй, главный конкурент Google Translate, так как имеет почти такой же богатый функционал. Кроме работы с аудио, он распознает текст на фотографиях и поддерживает автономные словари, дающие возможность переводить без подключения к Интернету. Однако эти функции доступны только в платной версии.

Возможности приложения:

  • поддержка более 100 языков; кроме привычных английского, немецкого, французского, итальянского, испанского и т.д., здесь присутствуют китайский, корейский и другие восточные языки.
  • автономный режим перевода более чем на 40 языках;
  • озвучивание текста на выбор мужским или женским голосом;
  • различение диалектов;
  • встроенный словарь и тезаурус;
  • транслитерация, совместное использование, функция избранного и история переводов;
  • перевод с камеры телефона;

В iTranslate есть раздел с часто используемыми фразами, которые могут понадобиться в общении с иностранцами.

Переведенный текст можно отправить по почте или в виде СМС на телефон.

В бесплатной версии программы есть ограничение на объем переводимого материала. Чтобы его убрать, придется купить премиум-подписку. Кроме того, бесплатная версия не поддерживает захват текста с камеры и фото, а также не работает без подключения к Интернету.

Чтобы выполнить звуковой перевод в iTranslate, сделайте следующее:

  1. Выберите направление.
  2. Нажмите на иконку с изображением микрофона и начните говорить.

Цены на различные опции программы варьируются от $2.99 — $43.99 долларов США.

5 Dragon Dictation

Это приложение, которое распространяется бесплатно для мобильных устройств от компании Apple.

Программа может работать с 15 языками. Она позволяет редактировать результат, выбирать из списка нужные слова. Нужно четко проговаривать все звуки, не делать лишних пауз и избегать интонации. Иногда возникают ошибки в окончаниях слов.

Приложение Dragon Dictation используют обладатели яблочных гаджетов, например, чтобы, перемещаясь по квартире, надиктовать список покупок в магазине. Придя туда, они могут посмотреть на текст в заметке, и не надо слушать.

Только так можно будет получить безукоризненный текст без ошибок.

TripLingo

Мне нравитсяНе нравится

Это приложение – интерактивный разговорник, которым удобно и интересно пользоваться. Оно мгновенно переводит устную речь с 19 языков. Программа была разработана для путешествий, поэтому у нее много соответствующих функций, таких как:

  • расчет чаевых с учетом особенностей и этикета страны;
  • возможность позвонить по телефону в США через Интернет;
  • конвертация валют;
  • краткий экскурс в культуру определенной страны. 

После последнего обновления приложение стало работать еще быстрее. Также были добавлены новые, актуальные сведения о различных странах, советы для путешественников, справочник по местам культурного отдыха. Теперь ТрипЛингво – это больше, чем переводчик, это настоящий путеводитель для туристов. 

Приложение очень популярно, им пользуется более чем 300 тысяч человек во всем мире. Его не раз упоминали в средствах массовой информации, и количество скачиваний все время растет. 

Загрузить ТрипЛингво можно на устройства Apple и Android. Есть бесплатная и платная версии ( в последней расширяется выбор доступных функций). 

Плюсы и минусы

Огромное количество фраз.
Множество файлов для прослушивания.
Встроенный конвертер валют.
Поддержка карточек.

Небольшое количество языков

Google Translate

Компания Google преуспела не только в развитии своей поисковой системы, но и создала, пожалуй, самый признанный в мире переводчик, который воспринимает голос, печатный текст, а также текст на фотографиях на более чем 100 языках. Google Translate распознает речь даже при низким качеством звука и в большинстве случаев выдает правильный перевод.

Если предварительно загрузить словари, в текстовом режиме Google Translate работает автономно, но для голосового переводчика всегда нужен доступ в Интернет.

Функции приложения:

  • текстовой перевод на 103 языка, без подключения к интернету — на 59;
  • мгновенный перевод захваченного изображения с камеры на 88 языков, текста на фото — на 50;
  • прямой голосовой перевод на 43 языка;
  • распознавание рукописного текста на 95 языках;
  • сохранение переведенных слов и фраз для дальнейшего использования;
  • синхронизация между устройствами.

Голосовой перевод Google Translate работает в двух режимах. В первом вы произносите фразу, программа ее распознает и выдает переведенный текст, который впоследствии можно озвучить, нажав соответствующую кнопку. Второй режим отличается от первого тем, что озвучивает переведенное сразу, однако он поддерживает не все диалекты.

Чтобы выполнить голосовой перевод в Google Translate, сделайте следующее:

  1. Переключите программу в режим разговора.
  2. Установите направление перевода.
  3. Нажмите на иконку с изображением микрофона и начните диктовать текст.

Заказ перевода аудио в текст у специалистов

Вообще, мне достаточно часто нужна услуга по расшифровке аудиозаписей в текст. Нужно переводить в текст мои видеоуроки. Иногда я сначала наговариваю мысли для статьи на диктофон, а потом транскрибирую. Можно конечно заниматься этим самостоятельно с помощью программ, но это отнимает много времени. Почему? Потому что программы для транскрибации не всегда верно расшифровывают слова и приходится долго править полученный текст, форматировать его, вставлять знаки препинания и таймкоды.

Поэтому я нанимаю фрилансеров. Но.. И тут есть “засады”! Очень сложно найти “правильного” фрилансера, который бы делал все четко и в срок. И особенная проблема в том, что фрилансеры (особенно молодые) плохо дружат с русским языком. И часто делают еще больше ошибок, чем программы 🙁 Поэтому я стал искать специализированный сервис, который занимается ручным переводом аудио в текст. И чтобы качественно и недорого. И… Я похоже, нашел такую фирму.

Сейчас я расскажу, чем мне приглянулся данный сервис. Итак, смотрим. Кстати, Все картинки увеличиваются по клику…

Это пока единственный российский сервис по транскрибации аудио с личными кабинетами, который “заточен” под бизнесменов, журналистов, юристов и т.п. То есть, для тех людей, для которых качество и скорость расшифровки аудиофайлов являются самыми важными факторами.

Из “приятных плюшек” хочу отметить еще три, особо мне понравившихся.

  • Тестовый заказ. Бесплатный. Для проверки качества работы этого сервиса. Можете попробовать, если не уверены в качестве расшифровки.
  • Работа с PayPal. Это означает, что с сервисом могут работать “забугорные” люди. Кстати, проблема с платежами, нередка в случае когда пытаются оплатить услуги российского сервиса из-за рубежа. Ну и PayPal дополнительно защищает Ваши покупки.
  • Работа с аудиозаписями из судов. Для меня это ничего не говорит, но мой друг, юрист, говорит, что это крутая фишка..

Короче, не буду навязывать Вам этот сервис. Лучше сами посмотрите и решите, стоит ли с ним работать.

Ну и как обещал выше, рекомендую посмотреть это видео, где я подробней разбираю этот сайт.

А вот и подоспели итоги полной расшифровки моего видеоролика. Посмотрим, что получилось!

Microsoft Translator

Мне нравится216Не нравится76

Переводчик от компании Майкрософт способен работать не только с напечатанным текстом, но и с голосом. При этом он способен распознавать нескольких людей и корректно отобразить, а далее и перевести беседу. Программа способна организовать единовременное общение до 100 человек. 

Одно из особенных функций переводчика от Майкрософт – он может работать с изображениями и камерой. То есть, чтобы перевести какую-то надпись на объекте, ее не потребуется вводить вручную: достаточно будет просто навести на нее камеру смартфона. Также в программу встроен разговорник и руководство по произношению слов и выражений на некоторых языках. Общая языковая база:

  • для текстового перевода – 64 языка (большинство из них работает в режиме офлайн);
  • для распознавания и перевода речи – 21 язык. 

Переводчик способен помочь с общением в чужой стране. В его базу занесен большой разговорник, который можно и читать, и слушать. Примечательно, что приложение также активно в фоновом режиме: любую фразу из браузера и других программ можно будет перевести через контекстное меню. 

Скачать переводчик от Майкрософт можно и на устройства Apple, и на ОС Android. 

Плюсы и минусы

Поддержка огромного количества языков.
Возможность скачивания языкового пакета для работы без интернета.
Перевод надписей с изображений.
Возможность синхронного перевода (до 100 собеседников одновременно.)
Полностью бесплатное приложение

Возникают проблемы при переводе технических текстов.

Отзывы

Переводчик от Яндекс – эффективный отечественный транслейтор

Компания «Яндекс» использует собственный алгоритм машинного перевода для работы своего сервиса «Яндекс.Переводчик». Последний был создан ещё в 2009 году, прошёл несколько этапов своего становления, а с сентября 2017 года начал активный переход на нейронный машинный перевод. На сервисе доступен конвертер текста до 10 тысяч символов с озвучкой голосом.

Работа с Яндекс в целом не отличается от аналога Гугл:

  1. Перейдите на Яндекс.Переводчик.
  2. В поле слева введите нужный текст.
  3. Справа просмотрите полученный результат.
  4. Для воспроизведения голосом нажмите на пиктограмму динамика чуть выше текста.

Bing Translator – онлайн-решение от компании Майкрософт

Компания Майкрософт старается не отставать от конкурентов, постоянно работая над созданием и улучшением своих переводчиков. Последние встроены в Bing, MS Office, Edge, SharePoint, Skype Translator и другие инструменты, позволяя выполнять качественные переводы текстов с одного языка в другой. Давайте воспользуемся данным инструментом, содержащимся в популярном сервисе bing.com.

Для запуска переводчика со звуком голоса от Бинг выполните следующее:

  1. Активируйте bing.com.
  2. Введите в поле слева ваш текст. Справа автоматически отобразится полученный результат.
  3. Для прочтения результата голосом нажмите на значок динамика чуть выше.

Стационарные программы для голосового ввода

Кроме перечисленных сервисов существуют разнообразные стационарные программы, позволяющие перевести речь в текст. Обычно они имеют в своей структуре встроенный механизм для распознавания текста, работают с множеством языков, и во многих случаях не требуют постоянного подключения к Интернету.

Среди таких программ отметим следующие:

  • «Dictate» — специальная программа-надстройка для MS Word. После установки программы в системе откройте ваш Ворд, и выберите в нём вкладку «Dictation». Появится значок с микрофоном. Рядом с последним выберите русский язык и начните запись;
  • «Dragon Professional Individual» (Windows, Mac) – одна из лучших платных программ в своём сегменте. Включает множество инноваций, поддерживает различные голосовые команды формата, имеют мощные возможности транскрибации;
  • «Braina Pro» (Windows) – это целый виртуальный ассистент, управляемый искусственным интеллектом. Вы можете диктовать ему текст более чем на 100 языках, он отлично понимает различные компьютерные команды, устанавливает будильник, служит как словарь и тезаурус;
  • «E-speaking.com» (Windows) — Используя программный интерфейс «Microsoft Speech Application» и «Net Framework», программа «e-Speaking» позволяет использовать голос для управления ПК, диктовки документов и электронных писем, прочтения текста вслух. Поддерживается множество голосовых команд для управления ПК.

1 Сайт speechpad.ru

Это онлайн-сервис, который позволяет через браузер Google Chrome переводить речь в текст. Сервис работает с микрофоном и с готовыми файлами. Конечно, качество будет значительно выше, если использовать внешний микрофон и диктовать самому. Однако сервис неплохо справляется даже с видеороликами на YouTube.

Нажимаем «Включить запись», отвечаем на вопрос про «Использование микрофона» – для этого кликаем «Разрешить».

Длинную инструкцию про использование сервиса можно свернуть, нажав на кнопку 1 на рис. 3. От рекламы можно избавиться, пройдя несложную регистрацию.

Рис. 3. Сервис speechpad

Готовый результат легко редактируется. Для этого нужно либо вручную исправить выделенное слово, либо надиктовать его заново. Результаты работы сохраняются в личном кабинете, их также можно скачать на свой компьютер.

Список видео-уроков по работе с speechpad:

Можно транскрибировать видео с Youtube или со своего компьютера, правда, понадобится микшер, подробнее:

Видео «Транскрибирование аудио»

Работает сервис с семью языками. Есть небольшой минус. Он заключается в том, что если нужно транскрибировать готовый аудио-файл, то его звучание раздаётся в колонки, что создает дополнительные помехи в виде эха.

Особенности перевода голоса в текстовый формат

Как известно, попытки создать программы для распознавания голоса берут своё начало ещё в середине 20 века. Поначалу распознавание было довольно слабым, но использование более совершенных методов и технологий (скрытые марковские модели, нейронные сети etc.) подняло распознавание голоса на довольно высокий уровень.

Ныне мы можем встретить достаточное количество сетевых сервисов и программ, выполняющих перевод речи в текст. Практически все они хорошо распознают человеческий голос на многих языках (включая русский), и способны переводить его в текстовый формат. При этом 100% понимания речи достичь пока не удаётся, Это связано с шумами при звучании, невнятной дикцией или акцентом говорящего, помехами в работе микрофона, эмоциональным состоянием человека и другими схожими факторами.

При этом использование таких сервисов и программ позволяет существенно сэкономить время при наборе различных текстов. Вы можете быстро надиктовать нужный фрагмент после чего сохранить его в удобном текстовом формате на ваш компьютер или телефон.

Давайте разберёмся, какие сервисы и программы помогут быстро перевести речь в текст.

Day Translations

Иногда бесплатные сервисы не справляются. Например, плохо читается надпись, у собеседника специфическое произношение или просто требуется максимально высокое качество перевода для серьезных задач. Тогда на помощь приходят гибридные решения, сочетающие скорость систем на базе ИИ с уровнем профессиональных лингвистов.

Такой метод использует в своем одноименном онлайн-сервисе компания Day Translations Inc. Она была основана в Нью-Йорке в 2007 году, и с тех пор предлагает услуги перевода более чем на ста языках.

На момент написания этой статьи (ноябрь 2019 года) была доступна версия 2.0.2. Она оставила в целом приятное впечатление, но в ходе тестирования выявились и некоторые минусы. В частности, Day Translations не позволяет изменять вручную неуверенно распознанные слова. Программа сама подменяет их сходными по звучанию и сразу озвучивает перевод. Еще одно существенное ограничение касается работы с текстом. В бесплатной версии установлен лимит на перевод в объеме до 30 тыс. символов в сутки.

Если программа не справляется, то прямо в ней можно воспользоваться платными услугами профессиональных переводчиков. Они всегда доступны в чате и готовы помочь там, где ИИ не распознает оригинал или плохо улавливает контекст. По большому счету, это единственное преимущество программы.

Приложение для онлайн-трансформации текста на другой язык

В мобильном приложении Google Translate всё так же очень просто. Доступно для двух популярных мобильных платформ — Андроид и iOS.

Оно также ещё более функциональное, чем сайт переводчика Google:

Функции: Особенности:
Большой выбор языков Позволяет переводить текстовые сообщения на более чем 100 языков.
Работа в режиме офлайн Можно переводить предложения и речь без интернета. Эта функция будет работать для 59 языков до того момента, пока вы снова не подключитесь к интернету.
Перевод через фотокамеру Моментальный перевод, используя фотокамеру мобильного устройства (функция доступна для Android 5.0 и выше). Поддерживается 38 языков.
Распознавание текста на картинках Поддерживается 37 языков.
Поддержка моментального перевода надиктованной речи В этом режиме можно общаться с иностранцами и читать перевод на смартфоне
Перевод рукописного ввода Ввода со стилуса.
Разговорник Есть также словарь, который составляет сам пользователь. Каждый раз при переводе фразы можно отбирать для разговорника.

Чтобы переводить на смартфоне свою речь, например, с русского языка на английский, скачайте приложение. Если его ещё нет на вашем мобильном устройстве.

Порядок работы с сервисом:

  1. Откройте Google Translate в главном меню;
  2. Выберите в приложении кнопку с микрофоном;
  3. Укажите пару языков, для которых нужен перевод;
  4. И произнесите фразу, которую нужно трансформировать.

Если вы выбрали какой-то язык, но кнопка с микрофоном сейчас окрашена в серый цвет, значит выбранный вами язык не поддерживается для голосового перевода в сервисе Google. Когда вы увидите приглашение «Говорите» в окне приложения, это значит, что можно произносить слова для перевода. Пользователь может настроить в онлайн-программе диалекты. Доступно не для всех поддерживаемых языков.

Translate Voice – переводчик аудио

Translate Voice — приложение для перевода диалогов с одного языка на другой. Будет полезно, если вы хотите на лету перевести собеседника или наоборот, озвучить свои фразы на другом языке.

Вкратце отметим основные функции мобильного переводчика:

  • Перевод между несколькими языками. В настройках выбираете язык, на котором произносятся фразы, а также направление перевода (по такому принципу работают многие голосовые переводчики). Немецкий, итальянский, испанский, английский русский, японский – всего около 100 языковых направлений.  
  • Переводить можно не только человеческую речь, но и простой текст — результат будет доступен в виде текста либо можно озвучить переведенные фразы.
  • Публикация результатов перевода — можно отправить на почту, поделиться в социальной сети, сбросить в онлайн-облако.
  • Доступно такое направление перевода: речь преобразуется в текст, затем текст переводится.

В общем и целом, переводчик Translate Voice удобен и прост в использовании (можно переводить в один клик). Приложение будет полезно для общения с носителями иностранных языков, простого текстового перевода.

Преимущества Недостатки
  • Реклама не отвлекает
  • Хорошо воспринимает голос на русском
  • Нет перевода с немецкого и обратно
  • На Samsung смартфонах приложение определяется как вредоносное

Google Translate

Скорость перевода текста этим голосовым переводчиком для iPhone достаточно высокая. Результаты он выдает очень быстро. Даже если проговорить целое предложение, программа выдаст результаты перевода почти сразу. Все быстро и красиво. Минималиcтичный интерфейс, аккуратные кнопки, значки и прочее.

Для активации работы приложения с голосом достаточно нажать на микрофончик около поля ввода текста и приложение начнет считывать ваш голос.

Пожалуй, две важнейшие особенности приложения, которые заставят вас побежать в App Store и скачать приложение – это его цена – бесплатно, и поддержка русского языка.

Естественно, приложение работает с API Google. И это его огромный плюс. Но увы, переводчик не поддерживает перевод диалога. То есть, один говорит «в микрофон» и приложение переводит его речь, затем другой делает то же самое, и так далее, как это реализовано в iTranslate Voice.

С той самой замысловатой фразой, которую я приводил выше, приложение справилось абсолютно также, как и все остальные.

Google Переводчик — ведущий сетевой переводчик онлайн

Наиболее популярным в мире переводчиком является Гугл Переводчик – веб-служба Гугл, созданная для выполнения автоматического перевода части текста или сетевой страницы на различные языки. Данный переводчик имеет бесплатный характер, способен за раз переводить большие куски текста с узбекского языка, поддерживает более сотни других языков. С 2017 годов компания Гугл полностью перевела свой переводчик на нейросеть, что существенно улучшило качество выполняемых переводов.

Имеется на сервисе и функция перевода с узбекского на русский язык и наоборот. Голосовой ввод на узбекском на данный момент не доступен, тексты же с узбекского Гугл Переводчик переводит без проблем.

Для работы с сервисом перейдите на translate.google.com, слева введите текст на узбекском, а справа получите перевод.

Нажав на кнопку динамика под ответом, вы сможете прослушать перевод с узбекского голосом.

Заключение

Итак, для перевода с русского на другие языки и обратно мы рекомендуем использовать программу от Яндекса, поскольку нашу речь она понимает лучше всего. Для переводов c/на остальные языки целесообразнее использовать Гугл переводчик и iTranslate. А для специфических текстов и терминов — Day Translations.

Важно отметить и особенность всех голосовых переводчиков: для повышения точности результата лучше диктовать текст фразами из 5-7 слов. Это нужно для того, чтобы приложение уловило смысл текста и выбрало наиболее подходящие формулировки

На этом обзор голосовых переводчиков подошел к концу. Надеемся, что информация будет вам полезна.

Обложка: Яндекс.Переводчик

Заключение

Большинству пользователей в зарубежных поездках поможет сервис Google Translate, доступный как через веб-интерфейс, так и через мобильное приложение с интеграцией функций перевода в контекстное меню. За счет офлайновых словарей он выручит и там, где нет Интернета.

Если вам требуется локализация программ, быстрый перевод презентаций или чтение лекций для зарубежных студентов, обратите внимание на Microsoft Translator. В этом сервисе доступна интеграция через API и специальные инструменты для образования.. Обладателям старых смартфонов стоит присмотреться к SayHi как самому легковесному приложению

Его функция выбора голоса и настройки скорости озвучки существенно упрощают живое общение.

Обладателям старых смартфонов стоит присмотреться к SayHi как самому легковесному приложению. Его функция выбора голоса и настройки скорости озвучки существенно упрощают живое общение.

По возможности используйте несколько переводчиков для перекрестной проверки результата. Благо, они бесплатные и не занимают много места в памяти смартфона.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Adblock
detector