Голосовой ввод. Голосовой ввод: как использовать функцию на разных устройствах.

Если Вы слишком медленно печатаете на клавиатуре, а учиться десятипальцевому методу набора лень, можете попробовать воспользоваться современными программами и сервисами голосового ввода текста.

Клавиатура, бесспорно, достаточно удобный инструмент управления компьютером. Однако, когда дело доходит до наборки длинного текста, мы понимаем всё её (а, если быть честными, то наше:)) несовершенство... На ней ещё нужно уметь быстро печатать!

Пару лет назад я, желая упростить себе работу по написанию статей, решил найти такую программу, которая бы позволяла преобразовать голос в текст. Я думал, как было бы хорошо, если бы я просто говорил всё что нужно в микрофон, а компьютер печатал вместо меня:)

Каково же было моё разочарование, когда я понял, что на тот момент никаких реально работающих (а тем более бесплатных) решений для этого дела не существовало. Были, правда, отечественные разработки, вроде "Горыныча" и "Диктографа". Они понимали русский язык, но, увы, качество распознавания речи имели довольно низкое, требовали долгой настройки с созданием словаря под свой голос, да ещё и стоили довольно недёшево...

Потом на свет появился Android и ситуация немного сдвинулась с мёртвой точки. В этой системе голосовой ввод появился в качестве встроенной (и довольно удобной) альтернативы ввода с виртуальной экранной клавиатуры. И вот недавно в одном из комментариев меня спросили, есть ли возможность голосового ввода для Windows? Я ответил, что пока нет, но решил поискать и оказалось, что, может и не совсем полноценная, но такая возможность существует! О результатах моих изысканий и будет сегодняшняя статья.

Проблема распознавания речи

Перед тем как начать разбор существующих на сегодняшний день решений для голосового ввода в Windows, хотелось бы немного осветить суть проблемы распознавания речи компьютером. Для более точного понимания процесса предлагаю взглянуть на следующую схему:

Как видим, преобразование речи в текст происходит в несколько этапов:

  1. Оцифровка голоса . На этом этапе качество зависит от чёткости дикции, качества микрофона и звуковой карты.
  2. Сравнение записи с записями в словаре . Здесь работает принцип "чем больше - тем лучше": чем больше записанных слов содержит словарь, тем выше шансы того, что Ваши слова будут распознаны правильно.
  3. Вывод текста . Система автоматически, ориентируясь по паузам, пытается выделить из потока речи отдельные лексемы, соответствующие шаблонным лексемам из словаря, а затем выводит найденные соответствия в виде текста.

Главная проблема, как нетрудно догадаться, кроется в двух основных нюансах: качестве оцифрованного отрезка речи и объёме словаря с шаблонами. Первую проблему реально минимизировать даже при наличии дешёвого микрофона и стандартной звуковой карты. Достаточно просто говорить не спеша и внятно.

Со второй проблемой, увы, не всё так просто... Компьютер, в отличие от человека, не может корректно распознать одну и ту же фразу, сказанную, например, женщиной и мужчиной. Для этого в его базе должны существовать оба варианта озвучки разными голосами!

В этом и кроется основной подвох. Создать словарь для одного человека, в принципе, не так сложно, однако, учитывая, что каждое слово должно быть записано в нескольких вариантах, это получается очень долго и трудозатратно. Поэтому, большинство из существующих на сегодняшний день программ для распознавания речи либо стоят слишком дорого, либо не имеют собственных словарей, предоставляя пользователю возможность создать их самостоятельно.

Я не зря упомянул про Андроид чуть выше. Дело в том, что Гугл, который его разрабатывает, создал и единственный на сегодня общедоступный глобальный онлайн-словарь для распознавания речи (причём многоязычный!) под названием Google Voice API . Подобный словарь для русского языка также создаёт Яндекс, но пока он, увы, ещё непригоден для использования в реальных условиях. Поэтому практически все бесплатные решения, которые мы рассмотрим ниже, работают именно со словарями Google. Соответственно, все они имеют одинаковое качество распознавания и нюансы заключаются лишь в дополнительных возможностях...

Программы голосового ввода

Полноценных программ для голосового ввода под Windows не так уж много. Да и те, которые есть и понимают русский язык, в основном являются платными... Например, стоимость популярной пользовательской системы преобразования голоса в текст RealSpeaker стартует с отметки 2 587 руб, а профессионального комплекса Цезарь-Р аж с 35 900 руб!

Но среди всего этого дорогого софта имеется одна программка, которая не стоит и копейки, но при этом предоставляет функционал, более чем достаточний для большинства пользователей. Называется она MSpeech :


Основное окно программы имеет максимально простой интерфейс - индикатор уровня звука и всего три кнопки: включить запись, остановить запись и открыть окно настроек. Работает MSpeech также весьма просто. Вам нужно нажать кнопку записи, установить курсор в окно, в которое должен выводиться текст и начать диктовать. Для большего удобства запись и её остановку лучше производить горячими клавишами, которые можно задать в Настройках:


Кроме горячих клавиш Вам может потребоваться изменить тип передачи текста в окна нужных программ. По умолчанию установлен вывод в активное окно, однако, можно задать передачу в неактивные поля или в поля конкретной программы. Из дополнительных возможностей стоит отметить группу настроек "Команды", которая позволяет реализовать голосовое управление компьютером при помощи заданных Вами фраз.

Вообще же MSpeech - довольно удобная программа, которая позволяет набирать текст голосом в любом окне Windows. Единственный нюанс в её использовании - компьютер должен быть подключён к Интернету для доступа к словарям Гугла.

Голосовой ввод онлайн

Если Вам не хочется устанавливать на свой компьютер никаких программ, но есть желание попробовать вводить текст голосом, можете воспользоваться одним из многочисленных онлайн-сервисов, которые работают на базе всё тех же словарей Гугла.

Ну и, естественно, первым делом стоит упомянуть о "родном" сервисе Google под названием Web Speech API :


Этот сервис позволяет переводить в текст неограниченные отрезки речи на более чем 50 языках! Вам достаточно просто выбрать язык, на котором Вы говорите, нажать на иконку микрофона в правом верхнем углу формы, при необходимости подтвердить разрешение на доступ сайта к микрофону и начать говорить.

Если Вы не используете какую-либо узкоспециализированную терминологию и говорите внятно, то сможете получить весьма неплохой результат. Кроме слов сервис "понимает" ещё и знаки препинания: если Вы скажете "точка" или "запятая", необходимый знак появится в форме вывода.

По окончании записи распознанный текст будет автоматически выделен и Вы сможете скопировать его в буфер обмена или отправить по почте.

Из недостатков стоит отметить лишь возможность работы сервиса только в браузере Google Chrome старше 25-й версии, а также отсутствие возможности мультиязычного распознавания.

Кстати, на нашем сайте вверху Вы найдёте полностью русифицированную версию этой же формы распознавания речи. Пользуйтесь на здоровье;)

На базе сервиса Гугла существует достаточно аналогичных онлайн-ресурсов распознавания речи. Одним из представляющих для нас интерес можно назвать сайт Dictation.io :


В отличие от Web Speech API, Dictation.io имеет более стильное оформление в виде блокнота. Основным его преимуществом перед сервисом Гугла является то, что он позволяет остановить запись, а затем снова запустить и при этом введённый ранее текст сохранится пока Вы сами не нажмёте кнопку "Clear".

Как и сервис Google Dictation.io "умеет" ставить точки, запятые, а также восклицательный знак и знак вопроса, но не всегда начинает новое предложение с большой буквы.

Если же Вы ищете сервис с максимальным функционалом, то, наверное, одним из лучших в этом плане будет :


Главные преимущества сервиса:

  • наличие русскоязычного интерфейса;
  • возможность просмотра и выбора вариантов распознавания;
  • наличие голосовых подсказок;
  • автоотключение записи после длительной паузы;
  • встроенный текстовый редактор с функциями копирования текста в буфер обмена, распечатки его на принтере, отправки по почте или в Твиттер и перевода на другие языки.

Единственным недостатком сервиса (кроме уже описанных общих недостатков Web Speech API) является не совсем привычный для подобных сервисов алгоритм работы. После нажатия кнопки записи и надиктовки текста, его нужно проверить, выбрать вариант, наиболее соответствующий тому, что Вы хотели сказать, а затем перенести в текстовый редактор внизу. После чего процедуру можно повторить.

Плагины для Хрома

Кроме полноценных программ и онлайн-сервисов, существует ещё один способ распознать речь в текст. Этот способ реализовывается за счёт плагинов для браузера Google Chrome.

Главным преимуществом использования плагинов является то, что с их помощью Вы можете вводить текст голосом не только в специальной форме на сайте сервиса, но и в любом поле ввода на любом веб-ресурсе! Фактически плагины занимают промежуточную нишу между сервисами и полноценными программами для голосового ввода.

Одним из лучших расширений для перевода речи в текст является SpeechPad :


Не совру, если скажу, что SpeechPad - один из лучших русскоязычных сервисов перевода речи в текст. На официальном сайте Вы найдёте довольно мощный (хоть и немного староватый дизайном) онлайн-блокнот со множеством продвинутых функций, среди которых есть:

  • поддержка голосовых команд управления компьютером;
  • улучшенная поддержка расстановки знаков препинания;
  • функция отключения звуков на ПК;
  • интеграция с Windows (правда, на платной основе);
  • возможность распознавания текста с видео или аудиозаписи (функция "Транскрибация");
  • перевод распознанного текста на любой язык;
  • сохранение текста в текстовый файл, доступный для скачивания.

Что же касается плагина, то он предоставляет нам максимально упрощённый функционал сервиса. Установите курсор в нужное Вам поле ввода, вызовите контекстное меню и нажмите на пункт "SpeechPad". Теперь подтвердите доступ к микрофону и, когда поле ввода станет розовым, надиктуйте нужный текст.

После того, как Вы прекратите говорить (пауза более чем в 2 секунды), плагин сам остановит запись и выведет в поле всё, что Вы сказали. При желании Вы можете зайти в настройки плагина (правый клик на иконке плагина вверху) и изменить параметры по умолчанию:

Как ни странно, но во всём Интернет-магазине расширений Гугла мне больше не попалось ни одного стоящего плагина, который бы позволял реализовать голосовой ввод в любом текстовом поле. Единственным похожим расширением было англоязычное . Оно добавляет иконку микрофона ко всем полям ввода на веб-странице, но не всегда правильно располагает её, поэтому она может оказаться вне экрана...

В действительности, голосовой ввод значительно упрощает работу как с поисковой системой, так и операционной системой Android. Не нужно вручную вводить текст, достаточно произнести голосом определенные команды. Голосовое управление Андроидом предполагает, что ваш телефон будет выполнять заранее указанные команды. Например: открыть приложение, курс валюты. прогноз погоды и прочие голосовые команды.

Для подключения голосового ввода текста на вашем смартфоне или планшете необходимо скачать соответствующее приложение для голосового поиска (это бесплатно). Мы предлагаем загрузить такие приложения, как OK Google, Google Now или голосовой помощник Assistant (одна из новейших разработок Google, скачать ее бесплатно можно в Маркете).

Обзор приложения "Окей Гугл" для Андроид. Как включить и настроить голосовой поиск на телефоне

Google обновила свою систему поиска на мобильных устройствах. Речь идет о новой функции голосового поиска Окей Гугл. Как настроить поиск в окей гугл, как включить это полезное приложение на Андроид, можно ли подключить голосовой ввод на компьютер? Предлагаем скачать голосовой поиск на ваш телефон, изучить все доступные команды.

Установка будильника на Андроиде. Голосовые команды ОК Гугл

Используя команды ОК Гугл, можно управлять приложениями на телефоне. Например, установить время будильника или быстро узнать, сколько время. Достаточно скачать Ассистент на Андроид и изучить список голосовых команд.

Итак, сегодня нам с вами предстоит разобраться, что собой представляет голосовой ввод текста. Если честно, то данной функцией интересуются многие пользователи разных гаджетов. Это очень удобно. Особенно если нет времени набирать текст или вы находитесь в неудобном положении. В таком случае придется как-то выкручиваться. И в этом вам поможет голос. Давайте же разберемся, как реализовать голосовой ввод текста.

Что это за возможность?

Для начала придется понять, с чем мы будем иметь дело. Ведь это очень важно. Можно долго промучиться с настройкой, а затем понять, что данная возможность оказалась абсолютно бесполезной. К счастью, с голосовым вводом все не так плохо.

Основная проблема тут действительно в настройке на разных гаджетах. В частности, на компьютере. Что дает голосовой ввод текста? Вы сможете не печатать свои сообщения, а проговаривать. За вас программа все запишет. Останется только опубликовать пост. Как видите, довольно удобная функция. И ее можно реализовывать не только на компьютерах.

Где встречается?

Где же еще есть голосовой ввод текста? Если честно, то он присутствует во всех современных гаджетах. Некоторые из покупателей даже не подозревают, что, к примеру, в их смартфоне присутствует голосовой набор. И поэтому придется точно составить перечень гаджетов, где нынче есть ввод текста при помощи голоса:

  • компьютеры;
  • голосовой ввод текста "Андроид" (то есть на смартфонах с данной системой);
  • телефоны;
  • планшеты;
  • электронные книги;
  • продукты Apple.


Главное, поинтересоваться перед покупкой наличием данной функции. В некоторых современных моделях она все-таки отсутствует. Правда, исправить данное положение можно очень быстро и легко. Тут помогут специальные приложения. Но о них чуть позже. Пока что попытаемся понять, каким образом можно осуществить голосовой ввод текста на разных гаджетах. Начнем, пожалуй, с самых простых вариантов развития событий.

Планшет

В любом современном планшете есть специальные встроенные приложения для ввода теста голосом. Они могут называться как угодно. Но наиболее распространенный вариант - это Speech.

Как набрать голосом текст? Просто запускаете приложение, а затем нажимаете на "Старт". Теперь просто начните говорить в то место, где расположен микрофон. Вот и все проблемы решены. Если честно, то этот способ действует исключительно в качестве блокнота. А вот для написания сообщений можно скачать специальную "вещицу" - это программа для голосового ввода текста. Например, Voice SMS. С ней вы не только сможете быстро и просто печатать сообщения, а еще и отправлять их.

Как видите, никаких проблем нет. Также в браузерах любого планшета имеются встроенные функции для набора текста голосом. Это очень полезно, особенно при поиске тех или иных данных. Вам не нужно долго набирать запрос - машина сама все сделает за вас.

Смартфоны

На телефонах тоже есть голосовой ввод текста. "Андроид" в этом - прирожденный лидер. Дело все в том, что на смартфонах с этой операционной системой уже есть несколько встроенных программ. Правда, они не отличаются оригинальными названиями. Как правило, для простоты поиска и использования они именуются просто - "Голосовой набор".

Вообще, по умолчанию любой пользователь смартфона может настроить набор текста, а также выполнение некоторых функций при помощи своего голоса. Все настройки имеются в специальном меню. Как правило, под веткой "Набор голосом". После сохранения всей информации можно перезагрузить смартфон, а затем попробовать просто сказать в микрофон текст. Он или напечатается в блокноте (в "Заметках"), или запустит ту или иную функцию на мобильнике. Очень удобно, просто и легко. Не нужно думать, какую программу использовать для того, чтобы осуществить голосовой ввод текста на смартфоне.

Apple

Вся продукция Apple изначально была оснащена упомянутой программой. Она помогала пользователям набирать текст без применения пальцев и клавиатуры. Только вот голосовой ввод текста на iPad - это очень трудный процесс. Почему? Все из-за трудностей настроек.


Изначально придется посетить данный пункт в телефоне. Теперь зайдите в закладку "Основные". Там отыщите "Клавиатуры", а далее поставьте галочку напротив "Включить диктовку". Остается сохранить изменения. Лучше будет перезагрузить ваш iPad или смартфон Apple, а затем опробовать настройку в действии. Для этого откройте браузер или сообщения, после чего начните говорить текст. Система должна начать печатать с соблюдением орфографии. Очень хороший и полезный прием. Отключается функция на iPad точно так же, как и включалась.

Компьютеры

Не так давно и на компьютерах появился голосовой ввод текста. Windows 7, пожалуй, родоначальник данной функции. И тут пользователи сталкиваются с огромными проблемами. Вроде бы, возможность набора текста голосом есть, но она изначально отключена. То есть, как бы вы ни старались, все равно не получится говорить выражения, а затем лицезреть их на компьютере. Придется настраивать голосовой ввод текста. Windows 7 позволяет активировать несколько очень хороших приложений. Но современные пользователи не любят с ними мучиться. По этой причине приходится искать универсальное средство. И оно есть - называется Speechpad.


Это детище "Гугла", которое порадовало многих пользователей. Теперь голосовой ввод на компьютере стал доступен всем и каждому. И это с учетом того, что вам не придется долго производить настройку. Просто отыщите данное приложение в Интернете (оно бесплатное и находится в свободном доступе), а затем скачайте его на компьютер. Далее нужно установить программу. Этот процесс не займет у вас много времени.

Когда установка завершится, достаточно будет запустить приложение. Перед вами откроется окно, в котором будет отображаться поле ввода текста. Вы говорите в микрофон, а программа печатает сказанные вами слова. И при всем этом она соблюдает правила пунктуации и орфографии. Speechpad - отличный помощник для писателей, а также копирайтеров и рерайтеров. Правда, не только так можно реализовать голосовой ввод текста на компьютере. Есть и еще один незамысловатый подход. Но он годится исключительно для браузеров.

Поиск данных

Очень удобно, когда поиск данных в Интернете происходит при помощи голосового набора. Такая функция уже вмонтирована во многие поисковики. Но чаще всего она встречается в Google.

Что вам нужно? Перейти на главную страницу поисковика, а затем нажать на изображение микрофона в правой части строки поиска. Теперь можно говорить текст, который стоит искать. Вот и все проблемы решены. Как видите, ничего трудного или сверхъестественного. Только не многим пользователям нравится эта функция - ведь при разговоре на иностранном языке придется настраивать голосовой набор. Таким образом, лучше использовать программу на одном языке. Это избавит вас от лишних проблем в процессе работы.

Как видите, вариантов очень много. И программ для каждого гаджета тоже. Каждый сам вправе решать, какими приложениями ему пользоваться. Но вам действительно стоит обратить внимание на встроенные функции, а также на Speechpad.

Всем доброго дня!
Сегодня я немного поговорю с вами о том, как получить больше отдачи от работы с текстами в Андроид. Научимся печатать немного быстрее и при этом меньше допускать промахов мимо нужных клавиш.
Сразу говорю, это советы применимы к , общий обзор которой я писал ранее. Но клавиши от Гугл доступны всем, скачать их можно в Плей Маркет совершенно бесплатно. Что я и советую вам сделать, хотя бы для сравнения.
Поехали.

Для начала я советовал бы вам немного пройтись по настройкам.
Итак, заходим в “Настройки” — “Язык и ввод” — “Клавиатура Google” — “Настройки”. Здесь я рекомендую выбрать все пункты, а звук клавиш и виброотклик оставить на свое усмотрение. Согласитесь, когда буква автоматически становится заглавной в начале предложения — это удобно. Голосовой ввод — тоже весьма полезно.



С этим разобрались. Снова заходим в “Язык и ввод” — “Клавиатура Google”. Тут мы можем настроить еще кое-что.
Подсказка следующего слова — еще одна полезная возможность, если привыкнуть к ней. Весьма облегчает и ускоряет процесс набора текста. Эта функция, как и вышеперечисленные, по умолчанию включены. Но, все же имеет смысл проверить настройки.
Выбираем пункт “Исправление текста”, заходим в него. Тут видим еще одну кучку полезных функций. Удостоверимся, что включено все, что нам нужно.



Возвращаемся на шаг назад. Заходим в “Непрерывный ввод”. Если пользуетесь свайпами (что очень удобно, опять-таки, когда привыкнешь), советую поставить галочки напротив каждого пункта.



Так, с настройками мы разобрались, переходим к набору текста.
Многие часто используют при переписке смайлики . Так вот, в Гугл клавиатуре их большое количество. Но на экране их не видно. Где они спрятаны? Чтобы добавить смайл вам нужно нажать на клавишу ввода (enter) и держать пока не появятся изображения. Теперь можно выбирать подходящий ситуации 🙂


Современные технологии не стоят на месте, и сегодня для набора текста уже не обязательно пользоваться стандартной клавиатурой. Голосовой ввод есть на большинстве устройств. Тем не менее далеко не все пользователи знают, как его правильно применять, и какую функцию он выполняет.

Для чего нужен ввод голосом

  • пользоваться поисковиками намного быстрее;
  • набирать сообщения в социальных сетях и популярных мессенджерах;
  • отвечать на СМС-сообщение, находясь за рулем;
  • быстро находить контакт в записной книжке телефона;
  • набирать текст в "Гугл-документах".

В браузере Google Chrome

Чтобы быстро набрать текст в режиме онлайн, достаточно выполнить несколько простых шагов:

  1. Включить микрофон.
  2. Открыть документ в браузере «Хром».
  3. Нажать «Инструменты» и выбрать «Голосовой ввод». Должна появиться иконка микрофона.
  4. Нажать на этот значок (он должен загореться красным цветом) и начать диктовку.
  5. Чтобы закончить ввод текста, достаточно еще раз кликнуть на иконку микрофона. Он должен стать серым.


Слова нужно произносить максимально четко, медленно и громко. Если использовать встроенный микрофон ноутбука, то система не поймет половину слов - и на выходе получится нечитаемый текст.

В некоторых ситуация может понадобиться надиктовать заметку докладчика для презентации. В этом случае необходимо:

  1. Убедиться, что микрофон хорошо работает.
  2. Открыть презентацию.
  3. Нажать «Инструменты» и выбрать «Продиктовать заметки…». После этого должен появиться значок микрофона.
  4. Нажать на его иконку и начать диктовку.
  5. Чтобы прекратить голосовой ввод, необходимо повторно нажать на значок микрофона.

При этом требуется хорошее подключение к интернету, иначе функция не активируется.

На телефоне

  1. Установить курсор таким образом, чтобы появилась стандартная клавиатура.
  2. Нажать на значок с микрофоном. Обычно он находится слева от клавиши пробела. Если иконки нет, то нужно зажать значок с изображением Земли (смена языка) и выбрать «Голосовой ввод Google».
  3. После этого на экране появится изображение микрофона и автоматически начнется запись текста.
  4. Когда диктовка будет завершена, достаточно подтвердить запись.

Подобным образом можно набирать СМС-сообщения, искать людей в записной книжке, пользоваться поисковиками, писать заметки и многое другое.

На Mac

Чтобы активировать интерактивный ввод текста, необходимо:

  1. Перейти в меню Apple (клавиша с изображением яблока).
  2. Нажать на «Системные настройки» и кликнуть на «Клавиатура». После этого необходимо активировать функцию «Диктовка».

В этом меню можно произвести следующие настройки:

  • активировать функцию улучшенной диктовки (работает в оффлайне);
  • выбрать язык и диалект;
  • указать используемый микрофон (встроенный или внешний);
  • задать наиболее удобную комбинацию клавиш, которая будет использоваться для быстрого начала и окончания записи.

Если в OS Mac установлена программа Siri, то активировать диктовку можно и через нее.


  1. Открыть документ или любое другое текстовое поле.
  2. Установить точку в том месте, откуда должен начать набираться текст.
  3. Нажать заданную ранее комбинацию клавиш (по умолчанию запись активируется при двойном клике на Fn). Также можно перейти во вкладку «Правка» и выбрать там «Начать диктовку».
  4. Произнести текст и сохранить его.
  5. Завершить диктовку нажатием на «Готово» или Fn.

Частые ошибки

Иногда функция не работает или выдает ошибки. Чаще всего пользователи сталкиваются со следующими проблемами:

  • «Вас плохо слышно». Если на экране появилась такая ошибка, то необходимо перейти в более тихое место, подключить другой микрофон или отрегулировать громкость устройства.
  • «Голосовые команды не работают». В этой ситуации необходимо говорить медленнее и громче. Между голосовыми командами рекомендуется делать паузы.
  • «Микрофон не работает». Если на экране всплывает такая ошибка, то нужно проверить, работает ли он на другом устройстве. Если микрофон исправен, необходимо проверить его настройки или перезагрузить компьютер или телефон.

Зная, как включить голосовой ввод, можно значительно упростить себе жизнь. Подобным образом пользователи могут набирать не только короткие текстовые сообщения, но и целые рассказы или инструкции. На планшетах эта функция активируется одним из описанных выше способов.