Голосовой ввод на компьютер. Голосовой набор текста – онлайн сервисы распознавания речи в текст

28.08.2019 Photoshop 3D

Приветствую вас, уважаемые читатели блога сайт! Давно собирался подготовить заметку о программах и онлайн сервисах, при помощи которых можно переводить свой голос прямо в текст. Как рассказчик (мне кажется), я неплохой, но вот излагать свои мысли в виде печатного текста мне дается с большим усилием. Вот я и задался целью найти «чудо-сервис», который смог бы мою речь преобразовать в текст.

Актуальность набора текста голосом на сегодняшний день очевидна. Ведь не зря разработчики Google «вкрутили» в свой браузер Google Chrome голосовой поиск. И уже на основе этого открытого кода некоторые программисты и Web мастера сделали разные блокноты и сервисы для преобразования речи в текст в онлайн режиме. Для многих пользователей и особенно пользователей с ограниченными возможностями это просто незаменимые сервисы.

Попробовав в работе один из сервисов, которые я приведу ниже, возможно, не каждый получит желаемый результат. Особенно те, кто постоянно набирают тексты на компьютере, и для кого с текстами является основным источником дохода. И многие хотели бы как-то облегчить этот нелегкий труд. Но, если немного потренироваться, перевод голоса в текст в этих онлайн сервисах может получаться вполне качественный.

Чтобы приступить к преобразованию голоса в текст, понадобится микрофон (в ноутбуках он встроенный), желательно хорошая скорость интернет соединения и браузер Google Chrome не ниже 25 версии. В других браузерах функция голосового набора текстов, к сожалению, не работает. Как я уже говорил, код голосового распознавания в текст от разработчиков Google является открытым, и его можно использовать на своем сайте. Вот и я немного его русифицировал и установил на свой блог.

Голосовой ввод текста с помощью Web Speech API

Запустите страницу для ввода текста голосом в браузере Chrome. Внизу окна выберите язык, на котором вы планируете диктовать текст. Нажмите на иконку микрофона в верхнем правом углу. И в всплывшей строке нажмите кнопку «разрешить» использование браузером микрофона.

Теперь вы можете неспеша и четко наговаривать недлинные фразы. После завершения надиктовки текста голосом его можно выделить и при помощи комбинации клавиш на клавиатуре Ctrl+C скопировать в буфер обмена, а затем вставить в любой редактор для обработки. При желании текст можно сразу отправить по электронной почте.

Пожалуй, Web Speech API – самый простой и довольно качественный способ преобразовать свою речь в текст. Так как не надо отвлекаться на какие-то дополнительные манипуляции с клавиатурой. Просто включил микрофон и говори текст. В любом случае придется использовать какой-нибудь дополнительный текстовый редактор для дальнейшей корректировки надиктованного текста.

Преобразование речи в текст на странице сайта Online Dictation

Простой «буржуйский» блокнот, расположенный на странице Dictation , имеет всего три кнопки. Включить микрофон для записи, очисть поле для ввода текста и экспортировать надиктованный текст на свой компьютер, Google Диск, хранилище Dropbox или отправить электронной почтой в текстовом формате TXT. Все очень просто. Пробуйте, тестируйте и наслаждайтесь полученным результатом.

Набор текста голосом - онлайн сервис Talk Typer

Этот «буржуйский» онлайн блокнот распознавания голоса имеет несколько дополнительных встроенных функций. Возможность заменять продиктованные слова на другие предложенные варианты. Вставлять знаки пунктуации. Прослушать надиктованный текст, нажав на иконку динамик. Сделать перевод на выбранный иностранный язык. При желании можно изменить отображение внешнего вида и размер шрифта, нажав на иконку «шестеренка». Единственное неудобство: после каждой произнесенной фразы ее надо сбрасывать в нижнюю часть блокнота, нажимая на стрелку, и затем снова включать микрофон. В целом, это полноценный сервис, в котором можно преобразовать речь в текст и отредактировать его по своему усмотрению. Готовый текст можно распечатать, Твитнуть или отправить на электронную почту.

Распознавание голоса в блокноте VoiceNote

Этот сервис распознавание голоса в текст можно установить как приложение в браузер Chrome, или просто добавить в закладки сайт , который находится . Войснот по функционалу практически ничем не отличается от предыдущего сервиса-блокнота распознавания речи Talk Typer. Такой же основной минус, после каждой произнесенной фразы надо снова включать микрофон. Но зато не надо перемещать надиктованный текст, как в Talk Typer. Простой и очень удобный интерфейс сервиса для преобразования текста. Думаю, что он многим придется по душе. Тестируйте и делайте выводы.

Здравствуйте, уважаемые читатели. Сегодня я подробно расскажу про технические настройки и нюансы речевого набора текста голосом на компьютере. Как вы знаете способ, который я предложил в своём бесплатном видеокурсе « » — является мобильным и не требует наличие компьютера и платных программ. По многочисленным письмам можно судить, что курс очень понравился. Но также есть много вопросов, — А как набирать тексты голосом на компьютере? Причём из писем я понимаю, что интересен не, только способ набора текста голосом на компьютере, но и перевод аудио в текст.

Конечно, в комментариях и письмах я отвечал и рекомендовал единственный, на мой взгляд, подходящий для этого онлайн сервис «Блокнот для речевого ввода ». И теперь я уже получаю письма с просьбой рассказать о технических настройках компьютера (микрофона и звуковой карты) и как аудио перевести в текст.

В общем, секрет работы с данным сервисом очень прост, — у вас должен быть хороший, чувствительный микрофон. Иначе, качество распознания очень сильно хромает. Но и на этот случай есть выход.

1. Набор текста через микрофон.

2. Набор текста через виртуальный аудио кабель.

Прежде чем приступить к набору текста голосом при помощи голосового блокнота, нужно сделать кое какие настройки браузера Google Chrome. На данный момент, только в этом браузере доступна возможность набирать текст голосом. Нам понадобится установить два дополнительных расширения.

Как набрать текст голосом в голосовом блокноте

Для первого способа, дополнительных настроек делать не надо. Всё готово к набору текста голосом через голосовой блокнот.

Переходим на главную страницу блокнота, выставляем нужные параметры, и можно диктовать текст голосом. Иконка микрофона используется для ввода отдельных фраз или предложений. Для непрерывного ввода текста используйте кнопку «Включить запись».

Примечание: при первой попытке набрать текст голосом в верхней части браузера появится предупреждение с запросом на доступ к микрофону. Вам нужно нажать на кнопку «Разрешить».

Как заполнять любые поля и формы голосом в браузере Google Chrome

С помощью установленного ранее расширения «Голосовой ввод текста» Вам доступна функция заполнения любых полей в браузере. Например, в регистрационной форме или оставляя комментарий.

Для того чтобы заполнить отдельное поле в форме, — нажмите правую кнопку мышки в данном поле и в контекстно-зависимом меню выберите пункт «SpeechPad».

Разрешите доступ к микрофону и диктуйте текст.

А если вам нужно надиктовать несколько предложение, к примеру, комментарий или сообщение на форуме, нужно выполнить следующие действия.

Нажать правую кнопку мышки рядом с полем для ввода и выбрать в контекстно-зависимом меню все тот же пункт «SpeechPad». Но на этот раз откроется новое окно и включится запись. Диктуйте текст, а затем используя буфер обмена перенесите текст в нужную форму.

Комбинация клавиш для работы с буфером обмена:

Ctrl+A – выделить текст

Ctrl+C – скопировать в буфер обмена

Ctrl+V – вставить из буфера обмена

Вот так вот без особых хитрых настроек, при наличии доступа в Интернет можно вводить текст голосом на компьютере. Качество распознания будет зависеть от микрофона и Вашей дикции.

А теперь разберём возможность перевода аудио в текст. Этот метод называется – транскрибация. Данный сервис позволяет переводить аудио в текст из звуковых и видео файлов. И опять же упор делается на хороший микрофон.

Но в технических характеристиках микрофонов я не разбирался, и говорить какой хороший а какой нет, не стану. Скажу лишь, что у меня был обычный настольный микрофон Genius и он меня устраивал. Ещё вчера я начал подготовку к данной статье с использование этого микрофона, ошибок при распознании голоса было не много. За ночь, наш домашний питомец (кот) совершил диверсию и перегрыз провод микрофона. Не подумайте, что только микрофона, — нет, не только.

И для продолжения подготовки к статье я воспользовался наушниками с микрофоном. И должен сказать, это просто земля и небо. Микрофон на наушниках, — это просто труба. Толи от старости, толи он такой убогий и был, ну это просто убийца нервных клеток. Так, что делайте выводы.

Ну, да ладно, давайте переходить в к выполнению поставленной задачи.

Как преобразовать аудио в текст

Способ №1

Данный способ, не требует ни каких настроек. Принцип заключается в следующем. Вы воспроизводите звуковой файл или видео, звук идёт через колонки, а микрофон захватывает звук из колонок. Вы также можете включить запись на диктофоне или смартфоне, и микрофон будет захватывать звук с этих устройств.

Сервис предоставляет возможность захвата аудио из видео YouTube, видео файлов и аудио файлов. Видео и аудио файлы при этом могут быть расположены как в интернете, так и на Вашем компьютере.

Для начала, рассмотрим пример открытия видео с YouTube. Для этого потребуется ID данного видео. Этот ID нужно вставить в поле «URL медиа файла для проигрывания» и нажать кнопку «Обновить».

Такой уникальный ID есть у каждого видео на YouTube. Увидеть его можно в адресной строке браузера.

Теперь рассмотрим пример с открытием файла на вашем компьютере.

Сначала указываете тип файла, аудио или видео. Затем нажимаете на кнопку «Выберите файл» и выберите файл на компьютере. Выбрав файл, нажимаете кнопку «Открыть».

Следующим этапом располагаете, микрофон рядом с колонками вашего компьютера или скажем диктофоном или смартфоном, и включаете запись.

Способ №2

Данный способ позволяет исключить микрофон из цепочки преобразования аудио в текст. Звук будет напрямую передаваться из проигрывателя в голосовой блокнот. И уже не важно, какой у вас микрофон.

Но для этого потребуется отдельная программа — Virtual Audio Cable . Данная программа создаёт виртуальный аудио кабель и передаёт аудиопоток между приложениями. Программа эта платная, стоит от 25$ до 50$. Но можно воспользоваться бесплатной версией. В бесплатной версии есть ограничение на количество виртуальных кабелей. Можно создать только 3 кабеля. А ещё женский голос постоянно напоминает, что это бесплатная версия если использовать аудиорепитер. Но скажу вам честно, можно обойтись и без него. Зато пробная версия не ограничена по времени. В видеоуроке я покажу, в чем хитрость.

Итак, для начала скачиваем программу «Виртуальный аудио кабель», ссылка выше.

После того, как вы скачаете архивный файл на компьютер, его нужно распаковаться. Для этого можно воспользоваться архиватором или простым копирование файлов из архива в новую папку.

Установка программы VAC

Установка стандартная и не потребует от вас дополнительных знаний и умений. Просто следуйте указаниям мастера установки.

Теперь Вы ни звука не услышите из ваших колонок, зато весь звук через виртуальный аудио кабель будет передаваться в голосовой блокнот. То, что нам и нужно.

Примечание: если вы всё же захотите слышать звук, тогда следует перейти в папку, куда вы распаковали архив программы и запустить аудиорепитер. Указав в качестве устройства ввода виртуальный кабель, а в качестве устройства вывода колонки.

На этом все технические моменты набора текста голосом на компьютере, с помощью голосового блокнота, раскрыты. Если, что то рассказал не понятно, пишите в комментариях, постараюсь дополнить и помочь советом. А ещё, если писать статьи на сайт, самостоятельно вы не можете по какой-то причине, то можно на бирже. Сегодня так поступают многие владельцы сайтов, доверяя дело профессионалам.

Всем желаю удачи.

Здравствуйте, дорогие читатели! Перед вами самая необычная статья нашего блога, ведь при её написании использовался голосовой набор текста. Поэтому сегодня мы с вами обсудим, как набирать текст голосом.

Это метод набора текста при помощи речи, которая передаётся через микрофон. Эта тема очень актуальная для тех, кто работает с большими объёмами, например, блоггеры, а также люди с ограниченными возможностями. Или для тех, кто ещё не успел овладеть на клавиатуре компьютера.

Сервисы голосового набора

Существуют сервисы, которые работают онлайн, и есть программы, которые устанавливаются на компьютер.

Онлайн-сервисы

  • Speechpad

Это бесплатная разработка Google Chrome, которая, соответственно, работает только в этом браузере. Думаю, с этим проблем не будет, ведь это лучший браузер, и если вы до сих пор им не пользуетесь, то читайте статью про то, . Блокнот можно установить прямо в браузер или пользоваться возможностью набора текста голосом, перейдя на их сайт.

  • Войснот II

Аналогичен предыдущему сервису, также работает только в Google Chrome. Пользоваться им элементарно: выбираем нужный язык и приложение под диктовку само печатает.

  • August4u
  • TalkTyper

Преимущества данного бесплатного сервиса в наличии голосовых подсказок, возможности просмотра вариантов распознавания. Также имеется удобный редактор, с помощью которого вы cможете скопировать полученный материал, распечатать его на принтере, осуществить перевод на иностранные языки или отправить по почте.

Чтобы воспользоваться набором, не прикасаясь к клавиатуре, вам нужно открыть вкладку “Инструменты ”, а затем нажать на “Голосовой ввод…”

Разные команды для редактирования и форматирования пока доступны только на английском языке, но для русского языка поддерживаются пунктуационные команды :

  • «точка»,
  • «запятая»,
  • «восклицательный знак»,
  • «вопросительный знак»,
  • «новая строка»,
  • «новый абзац».

Как показала практика, это очень удобно.

Программы

  • Voco

Платная программа, которая при помощи голоса не только печатает на компьютере и устанавливает знаки препинания, но и радует дополнительными опциями: она умеет аудио, также можно расширить версию словарями (например, с юридическими терминами или другими).

Поддерживается операционными системами, начиная с Windows 7 и выше.
Цена: от 1 690 руб.

  • MSpeech

Бесплатна и может удовлетворить амбиции многих пользователей. Её привлекательность состоит в том, что она может распознавать голос на 50 языках. Для удобного использования есть горячие клавиши, можно самому выбирать источник звука, корректировать распознанный текст.

Плюсы и минусы набора при помощи голоса

Плюсы:

  • Благодаря этим приложениям, фрилансеры могут хорошо подзаработать, занимаясь транскрибацией. Множество заданий такого рода можно найти на бирже Work-zilla , — это излюбленное место новичков в удалённой работе. Вам только остаётся включить программу и чуть позже подкорректировать текст в Word.
  • Экономия времени и сил.
  • Отличная находка для людей с ограниченными возможностями.
  • Для творческих людей выше предложенные сервисы — палочка-выручалочка, все идеи можно быстро записать, просто озвучив голосом, чтобы не забыть.

К сожалению, существуют и минусы при работе с данными сервисами:

  • Если в помещении, где вы надиктовываете, есть посторонние звуки, то распознавание слов и словосочетаний в разы ухудшается.
  • Многие приложения, работающие онлайн, доступны только в браузере Google Chrome.
  • После набора нужно уделить время на редактирование и корректировку текста.
  • Необходимо иметь качественный чувствительный микрофон.
  • Желательно иметь хорошую дикцию, чтобы уменьшить риск возникновения ошибок.

Заключение

Подводя итог данной статьи, можем сказать, что технологии шагнули далеко вперёд, и если раньше всё требовалось печатать вручную, то сейчас это вполне реально делать, просто диктуя информацию голосом. Конечно, нет гарантии идеального распознавания, но прогресс очевиден.

Благодаря развитию приложений, которые значительно облегчают работу удалённым сотрудникам, можно добиться максимальной продуктивности и большей скорости выполняемых задач. Поэтому надеемся, что данная статья поможет вам стать эффективнее в своей работе.

Оставляйте в комментариях ваши отзывы о работе различных сервисов распознавания речи.

Всего вам доброго!

Ни одна программа не сможет полностью заменить ручную работу по расшифровке записанной речи. Однако существуют решения, которые позволяют существенно ускорить и облегчить перевод речи в текст, то есть, упростить транскрибацию.

Транскрибация – это запись аудио или видео-файла в текстовом виде. Есть в интернете оплачиваемые платные задания, когда за транскрибацию текста исполнителю выплачивается некоторая сумма денег.

Перевод речи в текст полезен

  • студентам для перевода записанных аудио- или видео-лекций в текст,
  • блогерам, ведущим сайты и блоги,
  • писателям, журналистам для написания книг и текстов,
  • инфобизнесменам, которым нужен текст после проведенного ими вебинара, выступления и т.д.,
  • людям, которым сложно печатать – они могут надиктовать письмо и послать его родным или близким,
  • другие варианты.

Опишем наиболее эффективные инструменты, доступные на ПК, мобильные приложения и онлайн-сервисы.

1 Сайт speechpad.ru

Это онлайн-сервис, который позволяет через браузер Google Chrome переводить речь в текст. Сервис работает с микрофоном и с готовыми файлами. Конечно, качество будет значительно выше, если использовать внешний микрофон и диктовать самому. Однако сервис неплохо справляется даже с видеороликами на YouTube.

Нажимаем «Включить запись», отвечаем на вопрос про «Использование микрофона» – для этого кликаем «Разрешить».

Длинную инструкцию про использование сервиса можно свернуть, нажав на кнопку 1 на рис. 3. От рекламы можно избавиться, пройдя несложную регистрацию.

Рис. 3. Сервис speechpad

Готовый результат легко редактируется. Для этого нужно либо вручную исправить выделенное слово, либо надиктовать его заново. Результаты работы сохраняются в личном кабинете, их также можно скачать на свой компьютер.

Список видео-уроков по работе с speechpad:

Можно транскрибировать видео с Youtube или со своего компьютера, правда, понадобится микшер, подробнее:

Видео «транскрибирование аудио»

Работает сервис с семью языками. Есть небольшой минус. Он заключается в том, что если нужно транскрибировать готовый аудио-файл, то его звучание раздаётся в колонки, что создает дополнительные помехи в виде эха.

2 Сервис dictation.io

Замечательный онлайн-сервис, который позволит бесплатно и легко переводить речь в текст.

Рис. 4. Сервис dictation.io

1 на рис. 4 – русский язык можно выбрать в конце страницы. В браузере Google Chrome язык выбирается, а в Мозилле почему-то нет такой возможности.

Примечательно то, что реализована возможность автосохранять готовый результат. Это убережет от случайного удаления в результате закрытия вкладки или браузера. Готовые файлы этот сервис не распознает. Работает с микрофоном. Нужно называть знаки препинания, когда производите диктовку.

Текст распознается достаточно корректно, орфографических ошибок нет. Можно самостоятельно вставлять знаки препинания с клавиатуры. Готовый результат можно сохранить на своем компьютере.

3 RealSpeaker

Эта программа позволяет легко переводить человеческую речь в текст. Она предназначена для работы в разных системах: Windows, Android, Linux, Mac. С ее помощью можно преобразовывать речь, звучащую в микрофон (например, он может быть встроен в ноутбук), а также записанную в аудиофайлы.

Может воспринимать 13 языков мира. Существует бета-версия программы, которая работает в режиме онлайн-сервиса:

Нужно перейти по указанной выше ссылке, выбрать русский язык, загрузить на онлайн-сервис свой аудио- или видео-файл и оплатить его транскрибацию. После транскрибации можно будет скопировать полученный текст. Чем больше файл для транскрибации, чем больше времени понадобится на его обработку, подробнее:

В 2017-ом году был бесплатный вариант транскрибации с помощью RealSpeaker, в 2018-ом году такой возможности нет. Сильно смущает тот момент, что транскрибированный файл доступен всем пользователям для скачивания, возможно это будет доработано.

Контакты разработчика (ВКонтакте, Facebook, Youtube, Твиттер, электронная почта, телефон) программы можно найти на странице его сайта (точнее, в подвале сайта):

4 Speechlogger

Альтернатива предыдущему приложению для мобильных устройств, работающих на Android. Доступно бесплатно в магазине приложений:

Текст редактируется автоматически, в нем расставляются знаки препинания. Очень удобно для того, чтобы надиктовывать себе заметки или составлять списки. В результате текст получится весьма достойного качества.

5 Dragon Dictation

Это приложение, которое распространяется бесплатно для мобильных устройств от компании Apple.

Программа может работать с 15 языками. Она позволяет редактировать результат, выбирать из списка нужные слова. Нужно четко проговаривать все звуки, не делать лишних пауз и избегать интонации. Иногда возникают ошибки в окончаниях слов.

Приложение Dragon Dictation используют обладатели , например, чтобы, перемещаясь по квартире, надиктовать список покупок в магазине. Приду туда, можно будет посмотреть на текст в заметке, и не надо слушать.

Какую бы программу Вы ни использовали в своей практике, будьте готовы перепроверять результат и вносить определенные коррективы. Только так можно получить безукоризненный текст без ошибок.

Также полезные сервисы:

Получайте актуальные статьи по компьютерной грамотности прямо на ваш почтовый ящик .
Уже более 3.000 подписчиков

.

Статьи и Лайфхаки

Далеко не каждый пользователь в курсе, что существует голосовой набор на андроид, как включить эту функцию тоже представляют себе не все. А ведь если посмотреть , перечень выпущенных моделей, становится ясно, что практически каждое современное устройство оснащено ею. Расскажем, как начать применять голосовой набор, используя стандартные варианты, предложенные системой, или же сторонние приложения.

Базовый ввод голосовых команд предполагает диктовку текста своему мобильному устройству без использования клавиш. Чтобы иметь возможность использовать данную функцию, необходимо проделать несколько простых и последовательных действий. Начнём с того, что поместим курсор в любое поле для ввода текста. Нам будет предложено использование клавиатуры Android. Находим рисунок микрофона и нажимаем на него. Перед нами появится панель для голосового ввода, где будут несколько важных элементов, включая список языков, голосовой индикатор и клавишу «Готово», на английском «Done» (переводит в обычный текстовый режим).

По умолчанию на одном из рабочих столов нашего смартфона установлен виджет поиска Google, где также есть иконка с изображением микрофона. Путём нажатия на неё мы сможем активировать функцию голосового набора.

Как управлять этой функцией? Следует знать о том, что красная рамка, находящаяся вокруг рисунка микрофона, меняет свою толщину в зависимости от того, насколько громким является наш голос. По мере обработки команд они будут появляться в виде слов в поле.

Добавим, что функция работает только при активном подключении к Интернету. Язык ввода выбирается в специальном поле («Select dictation language» > «Add languages», то есть «Добавить языки»). Теперь можно пользоваться голосовым набором без каких-либо проблем.

Теперь мы имеем представление о том, что такое голосовой набор на андроид, как включить его и как им пользоваться. Однако следует знать, что активировать эту функцию можно теми же путями, : т. е. не только встроенными средствами системы, но и при помощи сторонних программ.

Неплохой программой является Voice Button. Её можно найти и загрузить из Play Market. Это хорошее приложение для голосового управления всей домашней техникой. Оно построено на основе базового модуля сотового аппарата Android, а также модуля Arduino.

После самого первого запуска приложения переходим в «Настройки» («Settings»), после чего выбираем «Пожалуйста, нажимайте и говорите» («Please click and tell»). Откроется окно с изображением микрофона. Произносимые нами голосовые команды будут появляться в верхнем поле. Чтобы сохранить какую-либо команду и привязать её к определённой кнопке, стоит нажать на эту кнопку с надписью «Изменить голосовую команду №» («Change Voice command №»). Текст команды будет отображаться в скобках.

Ещё одной хорошей программой является Cyberon Voice Commander. Она отличается высокой степенью точности. Приложение позволяет совершать исходящие звонки, запускать другие программы и т.д. Функция голосового набора сопряжена с беспроводной Bluetooth гарнитурой.

Недостатком этого приложения является то, что оно предлагается на платной основе. Его цена составляет $5,99.