Содержание
- Голосовой переводчик Гугл онлайн с произношением слов
- Яндекс переводчик Онлайн голосовой ввод
- Голосовой переводчик Гугл онлайн с произношением
- Транскрибация вручную
- Заказ перевода аудио в текст у специалистов
- Субтитры Ютуб
- Программа Express Scribe (Экспресс Скрайб)
- Программа Lossplay
- Сайт и программа Speechpad (Спичпэд)
- Онлайн-сервис dictation.io
- Сайт и программа RealSpeaker
- Программа Transcriber-pro
- Программа RSPlayer
- Приложение Windows – VOCO
- Программа Virtual Audio Cable
- Гугл Документы
- Итого:
- Speechpad.ru
- Dictation.io
- Otter.ai
- Cloud Speech-to-Text
- Google Переводчик
- Бот во ВКонтакте
- Бот в Telegram
На днях закончил работу над журналом, который готовил к 55-летнему юбилею мамы. Основой содержимого стали интервью с её близкими и друзьями. С ними я встречался лично, записывал разговор на диктофон. Дальше начиналось самое интересное. Эти записи предстояло расшифровать в текст.
138 838просмотров
Пять лет назад подобный подарок я уже делал, подруге. В 2015-м ещё не имелось достойных сервисов, способных транскрибировать аудиофайлы в текст. Сейчас технологии достигли необходимого уровня.
Делюсь подборкой соответствующих сервисов, наиболее совершенных. Trial-версия в каждом из них даёт обработать от 30 минут до 9 часов. Как правило, этого достаточно для большинства непромышленных задач. Экспорт готовой стенограммы возможен в Word и т.п. Если звук чёткий, без посторонних шумов, а люди говорят внятно, то качество расшифровки будет близко к 100%. В полученном документе останется лишь настроить стили и разбить его на абзацы.
1.https://trint.com/
Здесь можно бесплатно расшифровать три файла. При этом максимальная длина каждого – до трёх часов. Итого, 1 аккаунт = 9 бесплатных часов. Если у вас больше трёх файлов, но все они суммарно меньше 9-часового лимита, просто «склейте» их предварительно в аудиоредакторе. Тогда вам будет достаточно одной учётки. В противном случае на каждые три файла придётся регистрировать новый профиль.
Примечание. Во время регистрации нужно привязать банковскую карту. Если не планируете покупать платный тариф, не забудьте после транскрибации удалить её данные в Настройках. Тогда через 7 дней деньги не спишутся. Безлимитный тариф стоит от 75$ в месяц.
2.https://www.happyscribe.co/ и https://sonix.ai/
На каждом из этих сайтов бесплатно можно обработать запись до 30 минут. Принцип работы, и, судя по всему, движок, один и тот же. Тарифы не совсем прозрачные. В т.ч., поэтому первый сервис удобнее.
UPD 3.02.20193. В комментариях ещё порекомендовали данный сервис от Google:
При регистрации в любом из сервисов Google Cloud даётся 300$ на их использование (бесплатный trial). Этого хватит для перевода около 300 часов аудио в текст.
Как не заводить много электропочт, создавая новый аккаунт, т.к. в существующем истёк trial, а отдавать почти 5 тысяч за платный не хочется? Возможно, вы об этом способе уже слышали. Допустим, у вас почта «mypochta2020@gmail.com», заводя новый аккаунт, в поле e-mail укажите «mypochta2020++@gmail.com». Письмо-подтверждение придёт на «mypochta2020@gmail.com». Насколько я знаю, кол-во плюсов может быть любым.
Используйте технологии XXI века для удобства и экономии времени!
В нынешнее время каждый может с легкостью перевести необходимую статью или цитату воспользовавшись онлайн переводчиком, если ранее приходилось сидеть над словарями то сейчас перевод занимает несколько секунд. Также можно слушать как правильно произносить слова и фразы, воспользовавшись голосовым переводчиком онлайн, и можно не вводить текст а произносить слова в микрофон. В этой статье мы хотим рассказать как воспользоваться голосовым переводчиком Гугл и переводчиком Яндекс.
Голосовой переводчик Гугл онлайн с произношением слов
Данный сервис от Гугл позволяет переводить слова с 103 языков мира, переключать которые очень просто. Система автоматически определяет при входе подходящий язык и подходящие языке перевода. Вам не совсем обязательно знать язык исходного текста или документа, скопировав кусочек текста вставьте текст в строку ввода и кликните «Определить язык».
Чтобы воспользоваться вводом текста голосом, на странице переводчика google необходимо нажать значок микрофона и произнести в микрофон слово или фразу. Главные преимущества голосового переводчика онлайн:
- Большая база знаний. Каждую секунду обрабатывается огромное количество слов, которые воспроизводит «Голосовой перевод». Сервис все время улучшается, анализируя разные слова, способы употребления, особенности языков. Можно вносить свои недочеты в сервис с помощью галочки.
- Перевод документов и web-страниц. Если воспользоваться голосовым вводом, можно произносить целые предложения и система автоматически покажет перевод. при неправильном произношении, ошибки будут исправлены.
- Быстрый перевод. Переводчик от Гугл переводит в реальном времени. Набирая текст в специальном поле, он автоматически обрабатывается и выводиться его перевод. Чтобы перевод был максимально точным, предложения стоит вводить до конца.
- Определение слов. При написании слова в переводчик, будет показан список возможных переводов и синонимов этого слова. Указывается частота употребления данного перевода.
Данный сервис весьма функционален, а также имеет специальное мобильное приложение для телефонов и планшетов. Миллионы людей всего мира используют Google Translate.
Яндекс переводчик Онлайн голосовой ввод
Яндекс переводчик позволит переводить синхронно более чем с 95 языков мира. Принцип работы похож многим на другие переводчики:также в одно поле вставляет слова или текст которые необходимо перевести, выбираем на какой язык переводим и читаем перевод с другом поле. Также есть функция голосовго перевода, для этого просто нажмите на значек микрофона и произнести слова в микрофон. Одним из плюсов является исправление-опечаток.
Как и в переводчике от Гугл можно включить произношение перевода. Можно полностью переводить тексты, сайты,картинки – переключатель находиться вверху.
Большинству тех, кто пользуются переводчиками, не нужно переводить целые статьи. Обычно требуется перевести несколько абзацев или пару предложений. Не нужно устанавливать полноценный программный продукт, для этого существует голосовой переводчик онлайн. Данная программа способна самообучаться, учитывая все предпочтения пользователя. Похожий алгоритм имеет и Яндекс.Переводчик.
Пользуясь этой программой, можно легко переключать языки. При входе в онлайн-сервис, автоматически определяется язык и предоставляются наиболее подходящие. Не обязательно знать язык исходного документа, достаточно вставить фразу в строку ввода и нажать «Определить язык». На сегодняшний день, Google поддерживает около 71 языка.
Голосовой переводчик Гугл онлайн с произношением
Для включения функции ввода теста голосом, на странице переводчика google требуется нажать на значок микрофона, в левом нижнем углу. Преимущества голосового переводчика онлайн:
- Большая база знаний. Система каждую минуту обрабатывает большое количество текстов, с помощью которых воспроизводится механизм «Голосовой перевод». Программа анализирует и запоминает разные словоформы, способы употребления слов, особенности языков, тем самым максимально улучшая качество перевода онлайн. Оценить качество работы голосового переводчика онлайн и выразить все недочеты программы можно с помощью галочки. Это поможет в будущем не допускать ошибок, учитывая замечания пользователей.
- Перевод различных документов. Кроме текста, Google позволяет загружать документы, а также переводить целые web-страницы. Если на компьютере есть микрофон, то можно просто произнести вслух предложения, а программа сама определит, что покажет перевод сказанного. Если не правильно произнести слово, голосовой переводчик исправит.
- Быстрый перевод. Переводчик Гугл способен переводить тексты в режиме реального времени. Для этого нужно набрать текст, а Google его автоматически обрабатывает и моментально выводит на экран. Чтобы перевод был максимально точным, предложения стоит вводить до конца.
- Определение слов. Написав одно слово в переводчике, будет выведен список возможных переводов и синонимов этого слова. Программа указывает, какой перевод встречается наиболее часто, а какой редко. Google Translate показывает примеры использования слова в определенных предложениях, его смысл, а также источник.
Данный web-сервис отличается особой функциональностью. Подтверждение этого – множество пользователей с разных стран, которые постоянно пользуются услугами голосового переводчика онлайн Google.
Если Вам понадобился перевод аудио в текст, то Вам понадобятся программы для транскрибации. Можно конечно, и вручную переводить. Точнее “в ушную” 🙂 Но, согласитесь, это как-то сильно уж неправильно… Хотя я лично знаю таких вундеркиндов, которые зарабатывали на транскрибации без всяких программ некоторое время. Просто потому, что не знали, что они существуют 🙂 Но я отвлекся…
Итак. Для транскрибации, то есть перевода голоса в текст, можно использовать или программы, или специальные онлайн сервисы. Или комплексный вариант, оффлайн-программа + онлайн-сервис. Сейчас я расскажу, какие программы и сервисы для расшифровки аудиозаписей я знаю.
Содержание статьи:
Небольшое замечание! Я убрал ссылки на конкретные программы из текста статьи. Почему? Дело в том, что некоторые программы изменили ссылки. Другие выпустили новые версии. Короче, я это сделал, чтобы Вас не путать. Все указанные ниже программы легко находятся путем “загугливания” 🙂 . В крайнем случае напишите мне – подскажу..
Транскрибация вручную
Если Вы хотите экстрима, то попробуйте перевести речь в текст вручную. Даже если Вы планируете в дальнейшем для транскрибации активно использовать программы или сайты, о которых я расскажу ниже, все равно попробуйте это поделать “ручками”. Точнее “ушками”.
Это достаточно сложно. Точнее, технически-то, как раз ничего сложного нет. Берете аудиозапись, прослушиваете несколько секунд. Записываете. Возвращаетесь. Слушаете снова. Проверяете, все ли верно записали. И так следующий кусок. То есть, идея простая.
Сложность заключается в том, что сразу запомнить большой объем информации очень сложно. Вы играли когда-либо в “глухие телефончики”? 🙂 Вот такой же итог часто получается в случае “ручной транскрибации”, когда “переводчик” пытается запомнить сразу много информации.
Так зачем же я Вам советую попробовать ручную расшифровку аудио в текст? Дело в том, что какие-бы ни были классные программы для транскрибирования, о которых я буду рассказывать дальше, иногда они не могут помочь. Например:
- В комнате шумно
- Диктор говорит тихо
- Диктор говорит с сильным акцентов
- У диктора “фефекты фикции”
- Записан на плохой микрофон
- Одновременно говорит много людей
- Диктор “вклинивает” иностранные фразы. Или малоупотребительные
Короче, “кочек”, на которых может застопориться Ваша программа масса. И в этом случае нужно подключать транскрибацию “вручную”.
Заказ перевода аудио в текст у специалистов
Вообще, мне достаточно часто нужна услуга по расшифровке аудиозаписей в текст. Нужно переводить в текст мои видеоуроки. Иногда я сначала наговариваю мысли для статьи на диктофон, а потом транскрибирую. Можно конечно заниматься этим самостоятельно с помощью программ, но это отнимает много времени. Почему? Потому что программы для транскрибации не всегда верно расшифровывают слова и приходится долго править полученный текст, форматировать его, вставлять знаки препинания и таймкоды.
Поэтому я нанимаю фрилансеров. Но.. И тут есть “засады”! Очень сложно найти “правильного” фрилансера, который бы делал все четко и в срок. И особенная проблема в том, что фрилансеры (особенно молодые) плохо дружат с русским языком. И часто делают еще больше ошибок, чем программы 🙁 Поэтому я стал искать специализированный сервис, который занимается ручным переводом аудио в текст. И чтобы качественно и недорого. И… Я похоже, нашел такую фирму.
Сервис расшифровки аудиозаписей в текст Zapisano.org
Сейчас я расскажу, чем мне приглянулся данный сервис. Итак, смотрим. Кстати, Все картинки увеличиваются по клику…
Это пока единственный российский сервис по транскрибации аудио с личными кабинетами, который “заточен” под бизнесменов, журналистов, юристов и т.п. То есть, для тех людей, для которых качество и скорость расшифровки аудиофайлов являются самыми важными факторами.
- Начну с главного. C личного кабинета. Главный упор данного сервиса сделан на удобстве использования. Мне понравилось то, что можно заказ оформить прямо онлайн, тут же пообщаться с менеджерами и т.п. И все в одном месте. Не нужно никуда звонить, писать письма…Это здорово экономит время и нервы.
- Цены на расшифровку аудио на удивление вменяемые. Причем, эти цены даны уже “под ключ”! Кстати, я провожу сравнение стоимости расшифровки на сервисе “Записано” с фрилансеровскими в моем видео внизу этого абзаца. Много интересных моментов выясняется. Рекомендую посмотреть!
- Что еще? Есть работа с юр.лицами! Это просто супер! Можно платить по безналу по счету. А не искать наличку для платежа. Этого мне не хватало при работе с биржами фриланса.
- Есть защита информации. У многих бесплатных программ транскрибации Ваши данные могут уходить в “общий котел”. Это не есть зер гут! У “Записано” с этим все строго!
Из “приятных плюшек” хочу отметить еще три, особо мне понравившихся.
- Тестовый заказ. Бесплатный. Для проверки качества работы этого сервиса. Можете попробовать, если не уверены в качестве расшифровки.
- Работа с PayPal. Это означает, что с сервисом могут работать “забугорные” люди. Кстати, проблема с платежами, нередка в случае когда пытаются оплатить услуги российского сервиса из-за рубежа. Ну и PayPal дополнительно защищает Ваши покупки.
- Работа с аудиозаписями из судов. Для меня это ничего не говорит, но мой друг, юрист, говорит, что это крутая фишка..
Короче, не буду навязывать Вам этот сервис. Лучше сами посмотрите и решите, стоит ли с ним работать.
Ссылка на сервис Zapisano.org– https://zapisano.org/
Ну и как обещал выше, рекомендую посмотреть это видео, где я подробней разбираю этот сайт.
А вот и подоспели итоги полной расшифровки моего видеоролика. Посмотрим, что получилось!
Ну а тем, кто все-таки хочет самостоятельно освоить все тонкости расшифровки аудио в текст, нужно читать дальше!
Субтитры Ютуб
Если Вам лень устанавливать какие-либо программы, а Вам нужно срочно провести транскрибацию аудиозаписи в текст, то… то просто воспользуйтесь Ютубом. Точнее субтитрами Ютуб. Как это сделать? Все просто.
Шаг 1. Залейте видео на свой канал Ютуб.
Шаг 2. Включите субтитры
Ша
Шаг 3. Нажать кнопку “Посмотреть расшифровку видео”
Шаг 4. Копируйте себе в блокнот полученный текст.
Шаг 5. Удалите метки времени и “причешите текст. Вот и все.
Субтитры Ютуб создает достаточно качественные. Единственное, много времени уходит на приведение текста в порядок. Но и в других программах, расстановка знаков препинания и приведение текста к нормальному виду тоже нужно делать. Так что…
Программа Express Scribe (Экспресс Скрайб)
Это наверное, одна из самых популярных программ для транскрибации
Программа на английском языку, но она интуитивно понятна. Кроме того, есть масса инструкций на Ютубе, как работать в ней.
В этой программе можно переводить аудиофайлы в текст. Эта программа позволяет удобно корректировать текст, изменять скорость прокрутки аудио. Можно поставить медленную скорость для того, чтобы писать под диктовку. Есть горячие клавиши для ускорения, пауз, перемотки и т.п. Можно делать метки тайм-кодов.
Express Scribe поддерживает все известные мне (и не известные 🙂 ) аудиофайлы… Без проблем интегрируется с Вордом. Короче, работать с программой очень приятно и удобно.
Но… она ограниченно бесплатная. То есть, некоторое время ей можно пользоваться, а потом она перестает работать. Нужно покупать. Или удалять и ставить заново. Если Вы собираетесь профессионально зарабатывать, то можно и потратиться на пробретение Экспресс Скрайб.
Программа Lossplay
Вот еще одна программа для профессиональной расшифровки аудиофайлов. Программа ЛоссПлей. Это плеер от “нашего” разработчика. Поэтому удобен для русскоязычного транскрибатора.
Программа идеально подходит для новичка, который занимается расшифровкой аудио. В программе есть удобные быстрые клавиши.Этот плеер для транскрибации легко интегрируется с Word. Можно вставлять тайм-коды. Поддерживается огромное количество форматов аудиофайлов. Регулировка скорости воспроизведения. И многое-многое другое. Есть видеоуроки!
Сайт и программа Speechpad (Спичпэд)
Еще одна, любимая многими программа и одновременно онлайн-сервис. Голосовой блокнот Speechpad.
Можно заниматься транскрибацией прямо онлайн. На сайте. Можно установить расширение для Гугл Хром. Можно интегрировать это все в операционную систему для ввода в нужные программы. Кстати, это одна из немногих программ, которая работает в моем любимом Линукс Минт!
Вообще, функционал сервиса SpeechPad воистину огромен. Давайте посмотрим на него внимательней:
- Голосовой набор текста с микрофона. Кстати, этот сервис один из лидеров по правильному распознаванию речи (на мой взгляд). Ввод текста идет синхронно “говорению”. Можно по ходу сразу же править текст и вставлять знаки препинания.
- Транскрибация с аудиофайла или прямо с ролика Ютуб. Достаточно указать путь к аудиофайлу или видеоролику, включить транскрибатор, и начнется перевод. Правда, у меня почему-то не всегда получается это с первого раза. Может, потому что стоит Линукс.
- Есть озвучивание субтитров. Да и простого текста. Используется голос Гугл переводчика. Немного коряво, но в принципе “слушательно”
- Можно делать проверку произношения. Это пригодится тем, кто изучает иностранный язык
Если внимательно посмотреть, то можно много чего еще найти в сервисе для перевода аудио в текст SpeechPad. Есть подробные видеоуроки по каждому пункту. Есть просто подсказки. Можно сохранить готовый текст в файлы.
И да, он тоже бесплатен! Во всяком случае, на момент написания данной статьи!
Онлайн-сервис dictation.io
Этот сервис для перевода аудио в текст не может подключать аудиофайлы или видеофайлы. Тут для транскрибации нужно проиграть аудиофайл на другом устройстве, и записать на микрофон в dictation.io.
Чем же хорош это сервис для перевода аудио в текст? Своей лаконичностью. Ничего лишнего! И, кстати, качество распознавания речи вполне себе на уровне! Удобно сохранять распознанный текст на компьютер. Сервис полностью бесплатный. Жалко только, что нельзя транскрибировать аудиофайлы
Сайт и программа RealSpeaker
Нужно знать, что сейчас оффлайн версии, то есть, программы для транскрибации ReaLSpeaker уже нет. Если Вы хотите пользоваться именно программой, то ищите старую версию.
Сейчас же можно работать только в режиме онлайн-сервиса.
Некоторым транскрибаторам эта программа (и сайт) очень нравится. Некоторым не очень. Я предлагаю Вам ответить на этот вопрос самостоятельно. Потестируйте немного ее, и узнаете.
В плюсы Реалспикера можно отнести то, что она работает с загруженными аудиофайлами. Есть много языков, которые RealSpeaker понимает. Из минусов – программа и сервис платные. Правда цена не очень высокая, но все-таки…
Программа Transcriber-pro
Еще одна офф-лайн профессиональная программа для расшифровки аудио и видео записей. С помощью Transcriber – pro Вы легко переведете аудио в текст!
Эта программа для транскрибации достаточно удобна. Есть горячие клавиши. Можно загружать аудио и видеофайлы и их заниматься переводом аудио в текст. Одна из “фишек” Транскрибера – Про – это командная работа над проектом. Единственное, эта программа не умеет распознавать речь. Это узкоспециализированный инструмент, предназначенный только для транскрибации!
Программа RSPlayer
Многие хвалят эту программу для профессиональной транскрибации.
Однако, сейчас официальный сайт этой программы не работает. Может в ближайшем будущем эта программа возродится вновь, но пока я сделать обзор на нее не могу. Если где-то найдете старую рабочую версию РСплеера, проверьте на вирусы. Рекомендую 🙂
Приложение Windows – VOCO
Эта программа распознавания речи профессионального уровня.
Основной функционал Windows-приложения перевода аудио в текст VOCO:
- Голосовой набор текста с микрофона
- Расстановка знаков препинания устными командами
- Распознавание знаков препинания в аудиофайлах. Это круто!
- Само-собой есть распознавание речи из аудиозаписей.
- Есть сопряжение с Word
- Можно подключать словари
- Ну и есть свой, достаточно большой словарный запас
Короче, программа просто находка для профессионального транскрибатора! Но программа платная! Правда, есть демо-версия, в которой Вы можете ознакомиться с основным функционалом бесплатно. Правда, нужно подать заявку скачивание демо-версии Voco.
Программа Virtual Audio Cable
Для некоторых сервисов (например, для speechpad.ru) может понадобиться так называемый виртуальный кабель. Он нужен для того, чтобы напрямую передать аудиофайл в систему распознавания аудио, а не транслировать через микрофон. То есть, чтобы не терялось качество речи и все распознавалось как можно лучше.
Для настройки всего этого дела придется потанцевать с бубнами, то есть повозиться с настройками. Но, как я писал выше, некоторые программы без этой Virtual Audio Cable работать не будут.
К сожалению, проконсультировать по поводу настройки этих виртуальных кабелей я не смогу. У меня базовая система Линукс Минт. А эти программы предназначены для Windows. Впрочем, если будет интересно, скину ссылки на статьи других авторов, где все подробненько расписано.
Гугл Документы
На последнем месте в списке стоят гугл документы. Но не на последнем месте по значимости. В гугл документах тоже есть голосовой ввод!
Кстати, этот голосовой ввод работает на удивление очень хорошо. Вы даже можете голосом расставлять знаки препинания. К сожалению, сюда нельзя подключить аудиофайлы для прямой транскрибации. Только “динамик-к-микрофону”. Качество перевода аудио в текст при этом может пострадать. Зато Гугл Документы совершенно бесплатны!
А в этой статье я рассказываю, как заработать на транскрибации. Нажмите сюда для чтения статьи!
Итого:
Теперь Вы знаете, какие есть программы для транскрибатора, то есть для перевода аудио в текст. Возможно, есть еще что-то, что я не знаю. Тогда напишите мне о них и я расскажу об этом! И еще. Я не рассказывал про мобильные приложения для расшифровки аудиофайлов. Почему? Потому что, такие программы для смартфонов нужны в основном для записи своих мыслей простым людям, а также журналистам и писателям. профессиональные транскрибаторы мобильными программами практически не пользуются.
Посмотрите на видео ниже, как это выглядит “вживую”.
Ваш Nаставник онлайN
Голосовой набор позволяет быстро отправить текстовое сообщение без использования клавиатуры. А благодаря распознаванию звуковых файлов, можно без проблем выполнить транскрибацию записанной на диктофон лекции или создать печатную версию видеоролика. В статье поговорим о методах перевода аудио в текст с помощью специализированных онлайн-сервисов, расширений браузера и ботов.
Speechpad.ru
Один из немногих русскоязычных ресурсов, представляющий пользователям возможность речевого ввода. С его помощью можно вводить текст, используя микрофон, аудиозапись или, вставив ссылку на YouTube-видео. Работа с микрофоном поддерживается в браузере Chrome. Пользователи мобильных телефонов могут загрузить приложение с Play Market или App Store.
Инструкция по работе с сервисом:
- Перейти по ссылке. На странице дана подробная справка, описывающая различные функции и режимы работы, рекомендуем с ней ознакомиться перед началом процедуры.
Подключить микрофон к компьютеру, убедиться в его работоспособности.Кликнуть по кнопке «Включить запись» в нижней части страницы и начать диктовать текст. Если требуется перевести текст из аудиозаписи или видео, необходимо нажать кнопку «+Транскрибацию». Выше поля с результатом отобразится графа для добавления ссылки или файла:
- 1. В строке «Медиа тип» выбрать вариант предоставления материала. Для «YouTube video» потребуется указать не всю ссылку, а только ее окончание, которое идет после «https://www.youtube.com/watch?v=».
2. Запустить воспроизведение добавленного файла или ролика с YouTube.3. Ниже кликнуть по кнопке «Включить запись».В результирующем поле отобразится распознаваемый текст. По ходу его добавления можно вручную проставлять знаки препинания.
Расширение
С помощью браузерного расширения будет решен вопрос, как перевести голосовое сообщение в текст на любом сайте. Так пользователь сможет надиктовывать поисковые запросы, отвечать голосом на электронные письма, писать сообщения на форумах и т.д.
Чтобы установить расширение, необходимо запустить в системе браузер Google Chrome и перейти на страницу дополнения «Голосовой блокнот». Затем кликнуть по кнопке «Установить», подтвердить действие. Когда процесс завершится, можно начинать пользоваться утилитой:
- Нажать правой кнопкой на любом поле для ввода текста.
- В контекстном меню выбрать строку «SpeechPad».
Разрешить доступ к микрофону и начать говорить.В ходе диктовки нужно проговаривать знаки препинания, иначе потом придется расставлять их вручную. Потребуется некоторое время, чтобы привыкнуть выполнять подобное действие.
Уровень распознавания будет зависеть от дикции человека. Следует произносить слова четко и достаточно громко, также немаловажную роль играет качество микрофона.
Модуль интеграции с Windows, Linux, Mac
Загрузка …
Сервис «Speechpad» дополнительно предлагает пользователям программы для транскрибации аудио в текст. После интеграции модуля в выбранную операционную систему, станет доступен голосовой ввод для любых приложений (например, в Word).
Последовательность действий в данном случае будет следующей:
- Установить в браузер упомянутое выше расширение.
- Скачать модуль интеграции на странице сервиса.
- Выполнить регистрацию на сайте и произвести вход под своим логином.
В кабинете пользователя активировать тестовый период (по его истечении 1 месяц использования услуги обойдется в 100 рублей). Вернуться на главную страницу сервиса и отметить флажком пункт «Интеграция с OS». Кликнуть по кнопке «Включить запись».Открыть на компьютере программу, в которую нужно добавить текст голосом и начать диктовку.
Dictation.io
Сервис онлайн распознавания речи через микрофон. Посредством голоса можно расставлять параграфы, знаки пунктуации и даже смайлики. Dictation пригодится для написания электронных писем или заполнения документов в браузере.
Использование сервиса:
- Перейти на страницу транскрибации.
- В правой части экрана нажать на три горизонтальные полоски, чтобы выбрать язык ввода. Поддерживается большое количество языковых направлений.
В левом нижнем углу кликнуть по кнопке «Start».Начать диктовку текста.Редактирование материала осуществляется путем встроенного редактора. Непосредственно со страницы можно выполнить сохранение текста, его публикацию, печать.
Сайт не предоставляет отдельных программ для перевода аудио в текст, поэтому работа осуществляется только на его страницах.
Otter.ai
Зарубежный сервис распознавания речи, в настоящее время поддерживает работу только с английским языком. Предоставляет около 600 минут распознавания аудиофайлов на месяц. Если потребуется больше, присутствует премиум-подписка.
На сайте сохраняются все распознавания голосовых записей, обработка вновь добавленного файла выполняется достаточно быстро. В итоговых результатах сервис выделяет ключевые слова, обозначает отдельных собеседников (если на записи присутствует несколько голосов), выставляет параграфы. Со знаками препинания ситуация не лучше, чем на других сервисах – их придется расставлять самостоятельно.
Cloud Speech-to-Text
Мощный, но в то же время платный инструмент от разработчиков Google. В его работе используются технологии машинного обучения для распознавания коротких фраз и длительных аудиозаписей.
Cloud Speech-to-Text предоставляет пользователям расшифровку аудиозаписей в текст путем применения моделей нейронной сети через простой к понимаю API. Сервис может использоваться для голосовых команд управления, транскрибации аудио и прочих задач.
На стартовой странице сервиса можно провести распознавание с файла или микрофона без регистрации. Это позволит оценить качество его работы. Cloud Speech-to-Text умеет работать со 120 языками. Отрезок из аудиокниги на русском языке был транскрибирован практически идеально, исключение составили только несколько слов, которые было сложно разобрать даже человеческому уху.
Сервис можно смело рекомендовать, если перевод голоса в текст требуется постоянно в ходе профессиональной деятельности или по работе. Попробовать полный функционал можно на бесплатной основе, предварительно согласившись с правилами и предоставив данные кредитной карты.
Google Переводчик
На странице онлайн переводчика от Google присутствует возможность голосового ввода текста. Это может стать альтернативным и в то же время бесплатным вариантом, если требуется надиктовать запись с микрофона. Для начала ввода достаточно нажать на соответствующий значок.
Чуть более сложная задача стоит перед пользователем, если требуется выполнить перевод аудио в текст. Тем не менее зарубежные юзеры придумали решение – нужно установить специальный драйвер в систему и настроить вход микрофона на него. По итогу запущенный в плеере файл будет передаваться как голос, который поступает с микрофона. Это позволяет «обмануть» Google Переводчик и произвести транскрибацию с аудиофайла.
Качество распознавания находится на высоте. Присутствует ограничение в 5 тыс. символов. По его достижению нужно приостанавливать воспроизведение и копировать текст в Word или другую программу.
Бот во ВКонтакте
Перевести полученное ВКонтакте голосовое сообщение в текст поможет специальный бот. Им можно воспользоваться непосредственно на главной странице сообщества. Также присутствует возможность добавления в чат – тогда бот будет автоматически переводить все голосовые сообщения, присылаемые пользователями.
Стоит заметить, что система работает только с записями ВК. Загруженные извне файлы не распознаются и не переводятся в текст.
Бот в Telegram
Чуть более функциональную онлайн-расшифровку аудио в текст предоставляет бот Voicy, расположенный в мессенджере Telegram. Он работает с голосовыми сообщениями и отдельно загруженными файлами. Качество распознавания находится на среднем уровне. Поддерживается смена «движка» на Google Speach, однако для этого потребуется предварительно оформить подписку в сервисе Cloud Speech-to-Text. По умолчанию используется бесплатная система Wit.ai.
Инструкция по работе с ботом:
- Перейти по ссылке для добавления чата в мессенджер.
- Дать команду «/language» для выбора языка.
Если требует перевести файл, следует использовать команду «/files».Далее остается только прикрепить аудиозапись, после чего бот сообщит о запуске процесса распознавания.
Для просмотра всех команд Voicy необходимо отправить ему сообщение с текстом «/help».
Подведем итоги. Программа для преобразования голоса в текст на Виндовс присутствует только в сервисе Speechpad. Однако даже там основная часть данных берется с серверов. Прочие предложенные инструменты работают онлайн. Лучшим по качеству распознавания является Cloud Speech-to-Text. Бесплатная альтернатива представлена Google Переводчиком, где после установки специального драйвера получится проводить транскрибацию аудиофайлов.
Виталий Солодкий