Pаспознавание речи и мгновенный перевод

Совместная работа с компьютером

Для использования голосового набора на ноутбуке или стационарном ПК потребуется подключение микрофона и установка десктопных версий мессенджеров. В таком случае можно будет диктовать информацию в микрофон, но текст будет отображаться в виде звуковых файлов.

Чтобы создать текст при помощи голоса, можно использовать приложение «Голосовой блокнот MSpeech» ( требует инсталляции на ПК) или онлайн-сервис Speechpad. После надиктовки информации в микрофон, расшифрованный текст отображается в окне, откуда его можно скопировать и вставить в текст сообщения мессенджера.

При работе с документами в Google.doc (в облаке), открываете документ на двух устройствах ПК и смартфон. При вводе текста голосом на мобильном устройстве изменения синхронно будут происходить на ПК.

Speechpad — Блокнот для речевого ввода

Онлайн сервис speechpad.ru работает в браузере Google Chrome. Для речевого перевода используются служба переводчика Google. Имеется расширение SpeechPad (голосовой ввод текста) для браузера, с помощью которого можно вводить текст с голоса на сайтах в интернете.

Для получения лучшего качества, рекомендуется использовать внешний микрофон.

На странице сайта spechpad.ru выполните следующие действия:

  1. На странице сервиса «Блокнот для речевого ввода» нажмите на кнопку «включить запись».
  2. В поле «Результирующее поле» станет отображаться текст, извлеченный из вашего голоса.

  1. Отредактируйте полученный текст, а затем скачайте его на компьютер.

Время записи в этом режиме ограничено 15 минутами.

Вам также может быть интересно:

  • Перевод речи в текст на Андроид — 10 способов
  • Переводчик по фото онлайн — 5 способов

Сервис умеет переводить в текст видео или аудио файлы из интернета или с компьютера. Для этого, можно использовать два способа.

1 способ:

  1. В другой вкладке браузера запустите воспроизведение видео или аудио в интернете, или запустите аудио или видео файл со своего компьютера в плеере.
  2. На странице речевого блокнота Spechpad нажмите на кнопку «включить запись».
  3. В результирующем поле появится текст из видео или аудио.

2 способ:

  1. На главной странице сервиса нажмите на кнопку «Транскрибацию», которая расположена под результирующем полем.
  2. На странице «Панель транскрибации» выберите файл с компьютера, или введите URL-адрес медиа файла.
  3. Запустите воспроизведение медиа во встроенном плеере. Для видео с YouTube вставьте в поле не полную ссылку, а идентификатор видео, как на примере.

Здесь имеет много настроек, которые можно изменить для получения лучшего результата.

В режиме транскрибации время записи не ограничено.

Веб-сервисы и приложения для голосового ввода

Для использования голосового ввода от случая к случаю можно обойтись без  установки на компьютер специальных программ. Скорее всего, вам будет достаточно возможностей веб-сервисов и расширений для браузера.

Google Docs

Простой инструмент голосового ввода есть в Google Docs — сервисе для работы с текстовыми документами. Для его использования достаточно иметь аккаунт почты Gmail.

Как пользоваться голосовым вводом в Google Docs:

  1. Откройте сайт поисковой системы Google.
  2. Авторизуйтесь под своей учётной записью Google или зарегистрируйте новый профиль.
  3. Кликните по квадрату из точек, чтобы раскрыть меню с сервисами.
  4. Нажмите «Ещё», чтобы увидеть полный список.
  5. Перейдите в «Документы».
  6. В поле «Создать документ» нажмите «Пустой файл».

На экране появится текстовый редактор Google. Чтобы включить голосовой ввод, раскройте меню «Инструменты» и выберите соответствующую опцию. Слева появится виджет с микрофоном. Выберите в нём язык, на котором вы будете говорить, а затем нажмите на иконку микрофона, чтобы включить распознавание. Значок должен стать красным. Если браузер запросит разрешение на использование микрофона, дайте его.

Запуск голосового ввода доступен также с помощью сочетания клавиш Ctrl+Shift+S. Функция запускается с языком, установленным по умолчанию.

После настройки начинайте говорить — Google Docs будет распознавать речь и превращать её в текст. Знаки препинания и новую строку проговаривайте словами, чётко произносите окончания слов — в противном случае исправлять текст придётся очень долго.

Speechpad

Speechpad — бесплатный сервис, который работает только в браузере Chrome. Выше мы рассказали, как настроить его интеграцию с Windows. Однако для набора небольшого фрагмента текста в этом нет необходимости — с задачей отлично справится веб-интерфейс голосового блокнота.

  1. Откройте сайт Speechpad.ru.
  2. Пролистните главную страницу до окна редактора.
  3. Выберите язык ввода.
  4. Нажмите на кнопку «Включить запись» и разрешите использование микрофона.
  5. Диктуйте текст.

Возле кнопки «Включить запись» вы увидите поле предварительного показа. В нём отображается то, что будет добавлено в документ.

Расставлять знаки препинания и переходить на новую строку можно голосом или кнопками, которые находятся между полем предварительного просмотра и редактором. При наведении на каждую кнопку появляется текст голосовой команды, к которой она применяется — например, «вопросительный знак» или «открыть скобку».

Итоговый документ доступен для скачивания в формате TXT.

VoiceNote

VoiceNote — ещё один сервис для преобразования голоса в текст, который работает только в Google Chrome. При попытке запустить его в другом браузере появляется сообщение об ошибке.

Для голосового ввода через VoiceNote можно использовать Live Demo или отдельное приложение для Chrome.

Как пользоваться VoiceNote:

  1. Откройте редактор.
  2. Нажмите на значок в виде земного шара и выберите язык ввода.
  3. Кликните по иконке микрофона.
  4. Разрешите использование записывающего устройства.
  5. Диктуйте текст.

Правила ввода здесь стандартные: знаки препинания можно проговаривать словами, а также голосом отправлять текст на новую строчку.

Полученный документ доступен для сохранения в формате TXT.

TalkTyper

TalkTyper — онлайн-редактор для голосового ввода. Главное его достоинство — поддержка 37 языков. Однако TalkTyper, как и предыдущие сервисы, работает только в Google Chrome.

Принцип ввода текста в этом редакторе не отличается от других: вы указываете язык, нажимаете на значок микрофона и разрешаете его использование. Знаки препинания и новая строка проговариваются словами.

Результат обработки текста в TalkTyper можно сохранить в виде документа в формате TXT, скопировать в буфер обмена, распечатать, отправить по почте, твитнуть и перевести на другой язык.

Voice Notepad

Voice Notepad — ещё один сервис для преобразования голоса в текст, работающий только в Chrome. Он поддерживает больше 120 языков ввода. В остальном функциональность у него такая же, как у сервисов, перечисленных выше: расстановка знаков препинания голосом, сохранение документа в формате TXT, копирование в буфер обмена, отправка по почте или на печать и т.д.

Особенность онлайн-сервисов заключается в том, что все они работают только в Google Chrome. Это связано с тем, что в их основе лежит лицензионная гугловская технология распознавания речи. Другие браузеры её не поддерживают или поддерживают с ограничениями. Например, Speechpad можно запускать в Яндекс.Браузере, однако в чужеродной среде он часто работает с ошибками. Так что если вы не пользуетесь Google Chrome, проще всего установить одну из программ для голосового ввода на компьютер и забыть про неудобства.

Инструменты для форматирования текста

Рис. 3. Инструменты в сервисе Dictation для форматирования текста.

В сервисе Dictation есть инструменты для внесения правок в продиктованный текст и для его форматирования. С их помощью можно сразу редактировать текст, не прибегая к помощи другого текстового редактора. Если же предлагаемые инструменты не подходят, можно текст поместить в любой текстовый редактор или в другое место, которое требуется.

Общее правило для работы: предварительно надо выделить необходимую часть текста (слово, фразу, предложение, абзац или весь текст), а затем кликнуть на подходящий инструмент.

На рис. 3 инструменты пронумерованы:

цифра 1 – в тексте можно использовать выделение жирным шрифтом;

2 – выделение курсивом;

3 – подчеркивание;

4 – выделение текста выбранным цветом;

5 на рис. 3 – закрашивание фона с текстом выбранным цветом;

6 – при клике по этому значку появится возможность выбрать выравнивание текста: по левому краю, по центру, по правому краю, по ширине;

7 – нумерованный список (с помощью цифр 1, 2, 3 и так далее);

8 – маркированный список (он выделяется маркером – жирной точкой);

9 – отступ выделенного текста влево или вправо;

10 на рис. 3 – табуляция (сдвиг выделенного текста).

Использование горячих клавиш

Начиная с версии 5.9 расширения, появилась возможность использовать горячие клавиши для расширения..
Комбинация клавиш Ctrl+Shift+Z (Command+ Shift+Z для Mac) и Ctrl+Shift+X (Command+ Shift+X для Mac) включает прямой ввод в поле и ввод через буфер обмена соответственно. Комбинация клавиш Ctrl+Shift+7 (Command+ Shift+7 для Mac) включает или отключает распознавание речи в голосовом блокноте (равносильно нажатию на кнопку включить/отключить запись).

Чтобы поменять горячие клавиши нужно выйти на страницу chrome://extensions/shortcuts. При этом откроется окно установки горячих клавиш.

э-Диктант (Android)

Помните, как писали в школе текст под диктовку? Теперь “диктант” за вас напишет приложение «э-Диктант». Нужно только скачать программу на свой смартфон через Play Market (https://play.google.com/store/apps/details?id=rs.edukom.diktat). 

«э-Диктант» упростит жизнь блогерам, писателям, бегунам, бизнесменам, студентам. В общем, тем, кому нужно быстро перевести речь в текст, и желательно на ходу.

Особенности приложения “э-Диктант”:

  • Речевой блокнот позволяет быстро писать тексты любого объема. 
  • Редактирование проводится прямо во время записи. 
  • Э-Диктант продолжает мониторинг звуков и речи при длительных перерывах. 
  • Доля успешно преобразованного текста превышает 90 процентов. 

Программы для преобразования текста в речь

Balabolka

Это программа, которая позволяет нам читать тексты, в дополнение к различным параметрам настройки голоса и поддержке Microsoft Файлы Word DOC, саман PDF или HTML для чтения веб-страниц. Имеет поддержку SAPI 4 (Microsoft Speech API) с восемью различными голосами на выбор и SAPI 5 , с двумя разными голосами, или вы можете напрямую использовать встроенный рассказчик в Microsoft Windows. Вы можете настроить тональность, скорость и громкость, чтобы создать голос, который адаптируется к нашим потребностям.

Помимо чтения вы также можете сохранить рассказы в аудиофайлах с широким набором опций, таких как MP3 и WAV, а также для очень длинных документов вы можете создавать закладки, чтобы упростить переход к различным разделам текста, а также инструменты для персонализации произношения слов в вкус каждого. Кроме того, он имеет программа проверки орфографии для текста и поддерживает несколько языков, в том числе испанский.

Вы можете скачать Balabolka совершенно бесплатно с веб-сайта, совместимого с компьютерами Windows, от XP до Windows 10.

Type with your voice

Start voice typing in a document

  1. Check that your microphone works.
  2. Open a document in Google Docs with a Chrome browser.
  3. Click Tools Voice typing. A microphone box appears.
  4. When you’re ready to speak, click the microphone.
  5. Speak clearly, at a normal volume and pace (see below for more information on using punctuation).
  6. When you’re done, click the microphone again.

Start voice typing in Slides speaker notes

  1. Check that your microphone works.
  2. Open a presentation in Google Slides with a Chrome browser.
  3. Click Tools Voice type speaker notes. The speaker notes open, and a microphone box appears.
  4. When you’re ready to speak, click the microphone.
  5. Speak clearly, at a normal volume and pace (see below for more information on using punctuation).
  6. When you’re done, click the microphone again.

Как исправить ошибки при голосовом вводе

  • If you make a mistake while you’re typing with your voice, you can move your cursor to the mistake and fix it without turning off the microphone.
  • After you correct the mistake, move the cursor back to where you want to continue.
  • To see a list of suggestions, right-click words underlined in gray.

Что такое транскрибация и зачем нужна расшифровка

Транскрибация — это расшифровка информации из аудио или видео в текстовую форму. Это может быть актуально для слабослышащих пользователей или для тех, кто предпочитает потреблять контент в беззвучном режиме, получая информацию из письменной речи.

Цель транскрибации — качественно перевести речь в текстовый формат, который человек будет хорошо понимать при прочтении.

Задачи расшифровки:

  • Разобрать все сказанное спикерами.
  • Разбить речь на предложения.
  • Убрать слова-паразиты и паузы.

Расшифровка используется в субтитрах к видео, в статьях и постах, а также для анализа и исследований.

Ниже представлена таблица, в которой мы указали, где используют расшифровку.

Вид транскрибации
Особенности
Надиктовка
Автор читает подготовленный текст — медленно, с выражением и расстановкой знаков препинания. Текст может использоваться для статей, постов, ведения блога или написания материала в журнал
Лекция
Студенты записывают речь преподавателя на диктофон для дальнейшей расшифровки лекций, в тексте которых встречаются сложные термины и незнакомые имена. Используется, когда лектор быстро говорит — и записать материал в такой ситуации очень сложно
Подкаст
Формат радио, в котором редко встречаются проблемы с речью. Подкаст может быть монологом или диалогом. При расшифровке нужно учитывать, кто говорит — обязательно укажите имя человека. Расшифровка нужна для субтитров
Интервью
Формат, в котором участвует двое и более человек. Расшифровка нужна для субтитров в видео, написания статьи или поста. Жесткая дословность не требуется, в приоритете — передать эмоции и главную мысль интервьюируемого
Синхрон
Похож на интервью. В кадре эксперт дает комментарий по какой-то теме, камера записывает не только голос, но и звуковой фон, который сопровождает запись
Вебинар
Речь одного или нескольких экспертов вебинара. Расшифровка похожа на формат подкаста — нужно указать имя говорящего. Транскрибацию используют для субтитров, написания статьи или книги
Фокус-группа
Фокус-группа используется в маркетинговых исследованиях и социологических опросах. Сложный формат для расшифровки. Изначально все люди могут говорить спокойно, но под конец многие начинают перебивать друг друга. Чтобы этого избежать — задавайте вопросы каждому участнику по очереди. Расшифровка нужна для отчетов, анализа и исследований
Конференция
В конференции есть ведущий (он же — модератор) и спикеры

Здесь также важно указать имя говорящего. Расшифровка используется для субтитров, написания статей и постов
Телефонные разговоры
Расшифровка используется для анализа клиентов, сбора данных о них — интересы, потребности, боли и проблемы

Также это помогает улучшить качество работы менеджеров. Транскрибация звонков используется не только для бизнеса, но и для решения более специфических задач — например, силовики могут прослушивать разговоры потенциальных преступников
Субтитры
Используются в видео. Текст должен точно повторять речь говорящего. А чтобы разбить ее на подтемы — используйте тайм-коды
Монтажный лист
Применяется в кино и клипах. Это таблица, в которой указаны кадры с репликами героев и техническими комментариями. Здесь нужно не только расписать речь персонажа, но и зафиксировать все, что в данный момент находится в кадре

Далее мы рассмотрим не только программы для автоматической транскрибации, но и сервисы для ручной расшифровки.

Прямая расшифровка от Google

Приложение «Прямая расшифровка от Google» разработано для людей с ограниченными возможностями, в частности с нарушениями слуха. Программа автоматически распознает голос и звуки, выводит разговор на экран в виде текста.

Распознавание голоса на телефоне нам поможет перевести голос в текст, а результатом этого можно воспользоваться по своему усмотрению. Вы самостоятельно можете надиктовать текст в приложении, или получить в текстовом виде разговор со своим собеседником. Отвечать собеседнику можно с помощью клавиатуры или голосом.

Основные возможности приложения «прямая расшифровка от Google»:

  • программа работает на мобильных устройствах, начиная с версии Android 5.0 (Lollipop);
  • поддержка более 70 языков;
  • поддержка внешних микрофонов;
  • возможность ответа собеседнику с помощью экранной клавиатуры;
  • виброотклик при начале разговора;
  • расшифровка текста доступна только на вашем устройстве.

Установите программу из магазина Google Play по этой ссылке. После установки приложения, его необходимо активировать в настройках мобильного устройства.

На телефоне, работающем под управлением операционной системы Android 9 (Pie) это можно сделать следующим образом («чистый» Android):

  1. Войдите в настройки телефона.
  2. Выберите «Спец. возможности», нажмите на опцию «Прямая расшифровка».
  3. Предоставьте необходимые разрешения для этого приложения.
  4. В параметре «Use service» передвиньте кнопку переключателя в положение «Включено».

В нижнем правом углу экрана появится кнопка приложения в виде человечка с расставленными руками. Этот значок используется для запуска приложения «Прямая расшифровка» в любой программе на вашем мобильном устройстве.

Запустите приложение, войдите в настройки. Здесь можно выбрать подходящие параметры для работы приложения:

  • размер шрифта;
  • возможность для сохранения расшифровки в течение 3 дней;
  • включить темную тему;
  • выбрать основной и дополнительный язык;
  • очистить историю;
  • включить вибрацию при возобновлении речи;
  • отмечать звуки, отличные от речи;
  • скрывать непристойную лексику с помощью символов;
  • показывать кнопку приостановки расшифровки.

Преобразование голоса в текст в приложении «Прямая расшифровка от Google» происходит следующим образом:

  1. Для запуска расшифровки голоса, нажмите на кнопку в нижней части экрана.
  2. Откроется окно приложения, в котором написано: «Готово к расшифровке».
  3. Начните говорить, речь отобразится в виде текста на экране смартфона.

Расстановка знаков пунктуации в русском языке не поддерживаются.

Распознанный текст можно скопировать в окно любой текстовой программы для дальнейшего редактирования или сохранить на устройстве в течении 3 дней, при условии, что включена данная опция. Отредактированный текст сохраните в файл на телефоне или отправьте адресату в мессенджер, в облачное хранилище, по электронной почте и т. д.

В приложении можно записывать телефонные разговоры.

Что такое транскрибация

Есть в интернете оплачиваемые платные задания, когда за транскрибацию текста исполнителю выплачивается некоторая сумма денег. В этом случае транскрибацию, в основном, делают вручную.

Однако можно сделать транскрибацию автоматически, с помощью специальной программы, умеющей “слушать” текст и одновременно “печатать” его, превращать в текстовый файл, пригодный для дальнейшего использования.

Перевод речи в текст вручную или с помощью специальной программы полезен

  • студентам для перевода записанных аудио- или видео-лекций в текст,
  • блогерам, ведущим сайты и блоги,
  • писателям, журналистам для написания книг и текстов,
  • инфобизнесменам, которым нужен текст после проведенного ими вебинара, выступления и т.д.,
  • фрилансерам, которые вручную делают перевод речи в текст, для облегчения и ускорения своей работы,
  • людям, которым сложно печатать – они могут надиктовать письмо и послать его родным или близким,
  • другие варианты.

О проблемах автоматического перевода речи в текст

Можно выделить две крупных проблемы перевода речи в текст с помощью программы: качество записанной речи и наличие в записи фона в виде шума, музыки или иных посторонних звуков.

Речь у всех людей разная:

  • настолько быстрая, что слова проглатываются, или, наоборот, очень медленная;
  • с четкой дикцией, как у профессиональных дикторов, или настолько невыразительная, что сложно что-либо разобрать;
  • с отличным произношением или, напротив, с сильным акцентом, например, когда говорит иностранец.

В каких случаях программа автоматической транскрибации будет давать самый наилучший результат перевода речи в текст? Программа будет делать более или менее качественный перевод, когда на записи человек говорит с четкой дикцией, с нормальным темпом речи, без акцента. При этом в записи речи отсутствуют посторонние звуки в виде шума, музыки, разговоров других людей. Тогда можно надеяться на хороший автоматический перевод, не требующий ручных исправлений или с минимальными изменениями.

В остальных случаях, когда речь невыразительная и присутствуют посторонние шумы, перевод с помощью программы или приложения будет значительно хуже. Возможно, какая-то программа или сервис будет выполнять транскрибацию такой речи лучше, чем другие программы и приложения, но все-таки не стоит ожидать чуда.

В некоторых случаях стоит обратиться на биржу фриланса, где живой человек выполнит перевод вручную. Впрочем, здесь тоже нельзя гарантировать высокого качества, поскольку фрилансер может использовать программы автоматической транскрибации, и он может полениться внести в получившийся текст правки.

Опишем наиболее эффективные инструменты, доступные на компьютере, мобильные приложения и онлайн-сервисы для перевода речи в текст.

Яндекс Переводчик

Сервис Яндекс Переводчик для перевода речи в текст работает в любых браузерах, в отличие от переводчика Гугла.

Выполните следующие шаги:

  1. Откройте страницу Яндекс Переводчик в браузере.
  2. Нажмите на значок микрофона (Голосовой ввод), расположенный в поле ввода исходного текста.
  3. Разрешите Яндекс Переводчику использовать микрофон на вашем компьютере.

  1. Говорите в микрофон, текст будет отображаться в окне переводчика. Одновременно текст будет синхронно переведен на другой язык, если вам необходима такая возможность.

В Яндекс Переводчик имеется возможность для перевода видео или аудио файлов из интернета:

  1. Включите микрофон на панели для ввода исходного текста.
  2. Откройте другую вкладку в браузере, запустите воспроизведение аудио или видео из интернета.
  3. В окне Яндекс Переводчика начнет отображаться текст. Параллельно будет вводится перевод на другой язык (если это вам нужно).

На Сервисе Яндекс Переводчик имеется ограничение в 10 000 знаков для одного перевода. Обход ограничения количества переведенных знаков:

  1. При подходе к лимиту, поставьте плеер на паузу, или прекратите диктовать в микрофон.
  2. Скопируйте в любой текстовый редактор переведенный текст.
  3. Включите голосовой ввод, а затем снова запустите воспроизведение исходного видео или аудио файла, чтобы продолжить перевод аудио в текст онлайн.

Преобразование речи в текст из видео или аудио файла, хранящегося на ПК, при помощи Яндекс Переводчика:

  1. Откройте окно Яндекс Переводчик, нажмите на кнопку «Голосовой ввод» (микрофон).
  2. При помощи мультимедиа плеера запустите видео или аудио файл на компьютере.
  3. В окне переводчика для ввода исходного текста появится перевод голоса в текст.

Расширение

Имеется специальное расширение голосовой блокнот speechpad, которое устанавливается в браузер и которое работает только в браузере Google Chrome. Блокнот голосового ввода Speechpad поможет вам вводить текст используя не клавиатуру, а микрофон.

Установка

Чтобы speechpad скачать и установить на ваш браузер нужно открыть настройки в браузере хром и перейти в расширения. В самом низу нажимаем на ссылку «Ещё расширения». Откроется в браузере новое окно интернет магазин Chrome.

В поле поиск по магазину нужно вписать «Speechpad» и нажать на клавиатуре «Enter». Находим расширение голосовой ввод текста — Speechpad.ru и нажимаем на кнопке «Бесплатно». Расширение установится и в правом верхнем углу появится соответствующий значок.

Инструкция

Нажав правой кнопкой по этому значку появится контекстное меню в котором нужно выбрать «Speechpad» и сразу после этого у вас откроется новая страница в браузере.

Запускаем голосовой ввод Chrome

На этой странице иногда нужно будет делать подтверждение на запрос разрешить использовать микрофон нужно нажать «Разрешить».

Разрешаем голосовой ввод хром

В верхней строчке будут появляться сказанные вами слова в микрофон, а вместо слов запятая, точка, вопросительный знак и восклицательный знак будут ставится знаки , . ? ! Нажав кнопку «Copy» вся строчка будет скопирована в буфер обмена и её можно будет вставит в блокнот, Word или ещё куда и там отредактировать.

Расширение для Microsoft Word поможет записать голосом-

Программа предназначена для голосовой печати в Ворде. После установки на панели инструментов документа появится новая вкладка «Dictation». Выбрав её, в окне появится кнопка с микрофоном. Она предназначена для старта записи. В этом же окне доступен выбор одного из 20 языков, на котором нужно вводить предложения озвучкой.

Это дополнение доступно для многих версий текстового редактора, так как является разработкой компании Microsoft. Её можно применять не только в Word, но и в PowerPoint, и Outlook

Стоит обратить внимание на то, какой пакет нужен для вашей системы Windows. Разрядность можно посмотреть в системном окне, нажав WIN+PAUSE

Этот параметр будет указан в строке «Тип системы». Dictate устанавливается как и любая другая программа. Но по её завершению нуждается в активации. Это можно сделать в настройках.

Работа расширения для перевода голоса в текст основана на нескольких компонентах — Cortana (доступна в Windows 10) и местном переводчике Microsoft Translator. Для стабильной работы требуется компонент .NET Framework 4.5.0.

Resume voice typing

To move the cursor to the end of the paragraph and start voice typing again, say «Resume.»

To move the cursor to the end of a particular word or phrase, say «Resume with .»

Here are all the commands you can say to resume voice typing:

  • Resume
  • Resume with
  • Go to the end of the paragraph
  • Move to the end of the paragraph
  • Go to the end of the line
  • Move to the end of the line
  • Go to

Commands to open help

To open a list of voice commands in your document, say these commands:

  • Voice typing help
  • Voice commands list
  • See all voice commands

Speak (for accessibility)

To use these commands, turn on screen reader support. It’s best to wear headphones so the screen reader feedback isn’t typed into your document.

  • Speak cursor location
  • Speak from cursor location
  • Speak selection
  • Speak selection formatting
  • Speak table row and column headers
  • Speak table cell location
  • Speak table column header
  • Speak table row header

Запуск онлайн-сервиса dictation

Этот онлайн сервис работает прямо в браузере, поэтому его не надо устанавливать. Он использует движок Гугла для того, чтобы распознать речь и сразу перевести её в текст.

Разработчики рекомендуют использовать браузер Google Chrome для запуска сервиса. Вероятно, такая рекомендация связана с тем, что разработки одного и того же производителя (в данном случае браузер и движок Гугла) лучше всего работают в связке друг с другом. Хотя сервис перевода речи работает не только в Гугл Хроме, но и в других браузерах.

Dictation легко запустить, работа с ним интуитивно понятна.

Рис. 1. В браузере открыт сервис Dictation.

Чтобы запустить Dictation:

  • надо открыть браузер;
  • в адресной строке браузера ввести dictation.io (цифра 1 на рис. 1);
  • затем нажать на кнопку «LAUNCH DICTATION» (2 на рис. 1).

Рис. 2. Нажав на кнопку «Start», можно говорить текст.

Чтобы начать диктовку, потребуется нажать на синюю кнопку «Start». После этого она превратится в «Stop».

Произносить текст надо четко и внятно, без ускорений и замедлений. Микрофон должен быть в исправном состоянии. Говорить можно по-русски, хоть меню программы сделано не на русском языке.

Для того чтобы остановить запись речи и ее автоматический перевод в текст, следует обязательно кликнуть на синюю команду «Stop».

Как поставить знаки препинания, начать новую строку или новый абзац

Есть некоторые моменты, на которые следует обратить внимание при диктовке. Для того чтобы в тексте была поставлена запятая, необходимо четко вслух произнести слово «Запятая»

Такую команду желательно проговаривать вместе с остальным текстом, без дополнительных пауз и задержек. Если же будет пауза, а потом произнесена команда «Запятая», тогда сначала в напечатанном тексте будет поставлен лишний пробел, и после него запятая. Пробел перед запятой придется удалять вручную, а это дополнительное ручное действие.

То же самое относится к точке. Её, как известно, следует ставить в конце предложения. Для этого придется сказать команду «Точка» в конце каждого предложения, причем сказать без паузы, в том же темпе, как произносится весь текст.

Для получения в тексте вопросительного знака, необходимо произнести команду «Знак вопроса». В итоге в конце предложения появится требуемый знак – «?».

Для выражения восклицаний понадобится команда «Восклицательный знак». Тогда предложение закончится знаком «!».

Чтобы начать текст с новой строки, надо произнести команду «Новая строка».

Аналогично потребуется сказать «Новый абзац», чтобы в тексте появился следующий абзац.

Сайт и программа Speechpad (Спичпэд)

Еще одна, любимая многими программа и одновременно онлайн-сервис. Голосовой блокнот Speechpad.

Можно заниматься транскрибацией прямо онлайн. На сайте. Можно установить расширение для Гугл Хром. Можно интегрировать это все в операционную систему для ввода в нужные программы. Кстати, это одна из немногих программ, которая работает в моем любимом Линукс Минт!

Вообще, функционал  сервиса SpeechPad воистину огромен. Давайте посмотрим на него внимательней:

  • Голосовой набор текста с микрофона. Кстати, этот сервис один из лидеров по правильному распознаванию речи (на мой взгляд). Ввод текста идет синхронно “говорению”. Можно по ходу сразу же править текст и вставлять знаки препинания.
  • Транскрибация с аудиофайла или прямо с ролика Ютуб. Достаточно указать путь к аудиофайлу или видеоролику, включить транскрибатор, и начнется перевод. Правда, у меня почему-то не всегда получается это с первого раза. Может, потому что стоит Линукс.
  • Есть озвучивание субтитров. Да и простого текста. Используется голос Гугл переводчика. Немного коряво, но в принципе “слушательно”
  • Можно делать проверку произношения. Это пригодится тем, кто изучает иностранный язык

Если внимательно посмотреть, то можно много чего еще найти в сервисе для перевода аудио в текст SpeechPad. Есть подробные видеоуроки по каждому пункту. Есть просто подсказки. Можно сохранить готовый текст в файлы.

И да, он тоже бесплатен! Во всяком случае, на момент написания данной статьи!

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Adblock
detector