Распознать из jpeg в word онлайн. Распознать отсканированные документы

Перед каждым кто работает с текстами, да и перед обычными пользователями нередко встаёт необходимость распознать текст с картинки, фотографии, из книги, напечатанный на сканированном документе и прочее. Существуют программы, которые могут распознавать текст, но, во-первых, большинство из них платные, а, во-вторых, для работы такую программу надо устанавливать на компьютер.

А что делать тем, у кого нет постоянной потребности в распознавании или если такая необходимость она возникла разово и достаточно неожиданно или не хочется держать лишний, редко используемый софт. В этом случае помогут сервисы распознавания текста которых в интернете много.

Эти проблемы отлично решат сервисы, способные распознать текст онлайн . Причем каждый такой сервис распознает текст бесплатно (существуют и те, которые делают это за символические суммы). Их не так мало в интернете, каждый отличается своими положительными или отрицательными сторонами, но в данной статье мы рассмотрим только те из них, которые удовлетворяют условиям:

  • бесплатны (или почти бесплатны)
  • работают с русским языком
  • неограниченны по объему распознаваемых документов
  • распознают тексты различных форматов

Каким сервисом пользоваться выбираете вы сами. Многие из них отличаются по качеству распознавания и другим параметрам. С другой стороны многое зависит от качества распознаваемого документа.

Сервисы распознавания текстов:

Начнем с Drive Google, его можно найти в Google Документах. Он нам подходит прежде всего из-за того, что полностью русифицирован. Не слишком удобно то, что для тех, у кого собственного аккаунта в Google нет, потребуется регистрация. Обойдутся без этого те, у кого на blogspot уже существует свой блог. Кроме русского распознает тексты еще на 28 языках. Поддерживаются документы до 10 Mb и форматы JPG, PNG, GIF, PDF (в PDF распознаются первые 10 страниц). Файлы, в которых текст сохраняются: DOC, PDF, TXT, PRT, ODT.

Порядок работы в Drive Google

  • 1. Заходим в Google Документы;
  • 2. PDF-файл или картинку перетаскиваете в окно браузера;
  • 3. В появившемся окошке с меню проставляете флажки у 2 нижних пунктов (рис 2)
  • 4. Закрываем окошко и снова грузим картинку;
  • 5. При загрузке указываете язык;
  • 6. Картинка сохраняется как картинка, но открываться будет в текстовом редакторе в виде текста.

Это один из самых используемых онлайн сервисов распознавания, не с самыми широкими функциями, но достаточно хорошо работающий и довольно удобный. Если же вам необходимо больше функций (большее количество языков, выделение областей, другие форматы), то придется воспользоваться и другими сайтами.


Регистрации на сайте не требуется, поддерживаются и распознаются файлы JPEG, PDF, BMP, GIF, PNG.

Очень простой в использовании:

  • выбираем файл
  • указываем язык текста
  • нажимаем «process»

При необходимости могут быть загружены несколько файлов (до пяти), но только если язык исходника один и тот же. Общий объем загрузки – 5 Мб. В результате получите текстовый файл (формат TXT) в виде ссылки, с которой сам текст копируется и сохраняется в компьютере. (рис.4)

Регистрации не требуется, поддержка 32 языков, максимальный размер изображений — 4 МБ. За час может распознать текст с 15 изображений. Преобразуемые файлы: JPG, GIF, BMP, JPEG, TIFF. Если исходник многостраничный, можно выбрать страницы для распознавания. Распознанные онлайн тексты извлекаются из виртуального рабочего документа и сохраняются в памяти компьютера как документы с расширением не только в формате TXT, но и XLS (для MS Excel) или DOC (для MS Word). В созданных файлах будет точно повторена структура исходных документов (шрифт, колонки, таблицы и т.д.)

Существуют некоторые ограничения: размер файла не более 20 Mb, для качественного результата разрешение картинки не меньше 200 DPI.

ABBYY FineReade r – отличная программа, распознающая цифровые фотографии и отсканированные документы. Для работы нужна установка программы на компьютер. Устанавливается так же как любая другая программа. Пробные версии можно скачать .


Количество распознаваемых языков – 37, распознаваемые файлы – bmp, jpg (jpeg), png, dcx, pcx, tif, pdf, Djvu. Конвертирование в doc, txt, xls, pdf, rtf. После распознания файл скачивается в истории задания.

Работает очень просто – в обработке необходимо дождаться распознавания и можно скачивать результат, а можно получить ссылку и на e-mail. Полученный документ остается доступен 72 часа. Кстати, если программка признает, что распознание произошло с большим количеством ошибок, задание выполняется бесплатно.

Регистрации не требуется, бесплатный. Неудобство – при распознавании текста необходимо вводить капчу. Распознает изображения BMP, GIF, JPG, TIFF, PDF-формат. С3ществуют ограничения на использование: картинки – не больше 2 МБ и 5000 пикселей. Больше 10 картинок за час загружать нельзя. Готовый результат копируется.

Free Online OCR один из самых серьезных по функционалу онлайн сайтов для распознавания. Регистрации нет, бесплатен. Работает со многими форматами, кроме привычных JPEG, GIF или BMP, распознает, к примеру, DjVu.

Загружается необходимый для распознания файл, а затем может быть изменена область распознавания, перемещена или перевернута картинка. Можно выбрать для распознавания и отдельную область картинки.


Регистрация нужна, все бесплатно, распознает тексты с форматов JPEG, GIF, TIF, PNG, PGM, BMP, PPM, PBM. А вот PDF формат не поддерживается. Скачивается в расширении DOC. Онлайн распознавание текста происходит в три этапа:


OCRonline не очень удобный в интерфейсе, требует высокого качество изображений, причем, желательно, в формате JPG (другие форматы все-таки принимаются). Можно назвать его относительно бесплатным: в неделю разрешается распознать всего пять страниц за одну неделю. Для того чтобы пользоваться услугами дольше, необходима регистрация и дальнейшая оплата. Сохраняются тексты в форматах TXT, RTF, PDF и DOC.

Тестирование всех вышеперечисленных онлайн сервисов распознавания текстов показало почти мгновенный результат при небольших объемах. Естественно, и скорость, и качество получаемого текста во многом зависело от качества исходной картинки или фотографии, но особых нареканий не вызывало. Если вы собираетесь воспользоваться одним из них, то можно проверить все и увидеть результаты. В любом случае, онлайн сервисы распознавания текста перечисленные в статье, так и те которые не упомянуты здесь могут оказать неоценимую помощь и освободить от ручного трудоемкого набора вручную.

Позволяет бесплатно распознавать текст в режиме онлайн . Среди 32 языков, с которыми он работает, есть и русский (а еще украинский и белорусский).

Сокращение OCR (Optical Character Recognition) означает "оптическое распознавание символов". А "OCR онлайн " означает возможность конвертировать любое изображение (будь то фотография или отсканированный документ) в редактируемый текстовый файл.

Возьмем для примера распространенную задачу - "как перевести DJVU в TXT". Допустим, у вас есть файл в формате DJVU, и он не содержит текстового слоя. Другими словами, текст в нем - это просто картинка, и извлечь его простым копированием нельзя. Что же нужно сделать, чтобы получить этот текст - например, для цитат в своем дипломе или реферате?

Решить вопрос поможет сервис Onlineocr.net . Именно "OCR онлайн" и является его единственным назначением. Он способен преобразовать в редактируемый текст следующие графические форматы: TIF/TIFF, JPEG/JPG, BMP, PCX, PNG, GIF, PDF.

Главная страница

Начинаем с того, что преобразуем текст в один из указанных выше форматов. Для этого откроем файл в программе, работающей с DJVU, и пошлем "на печать" нужную страницу, выбрав в качестве принтера "Microsoft Office Document Image Writer". Реальной печати в данном случае не произойдет, а нужная страница будет помещена в файл с расширением TIF.


Используя "Microsoft Office Document Image Writer", создаем TIF-файл с нужной страницей

Полученный TIF-файл, открытый в фотоальбоме Windows


Сначала надо нажать кнопку "Выберите файл", а после выбора - кнопку "Upload"



Через несколько секунд результат готов. Полученный текст можно скопировать из окна в свой документ; но можно и скачать подготовленный файл в выбранном формате (Word или Excel) и работать уже с ним.

Результат распознавания текста

Пример готового Word-файла с распознанным текстом

Как мы видим, файл, скачанный с Onlineocr.net , содержит ошибки из-за погрешностей распознавания, а также нуждается в определенном форматировании.

Довести его до товарного вида совсем не сложно: ошибки исправляются в пункте "Сервис-Правописание", а форматирование состоит в выделении всего текста и установке для него единого размера шрифта, межстрочного и межбуквенного интервалов.

После недолгой обработки получаем окончательный вариант текста

Рассмотренным способом можно распознавать только одну страницу текста. Причем за час можно распознавать только 15 таких страниц.

Регистрация даст доступ к расширенным функциям Onlineocr.net , главная из которых - возможность распознавать многостраничные документы, в том числе целые книги, объемом до 100 Мб, за один сеанс. Но эти услуги уже, к сожалению, не бесплатны. И хотя после регистрации новый пользователь и получает 20 бесплатных "кредитов", их хватит на бесплатное онлайн распознавание текста всего лишь из 20 страниц.

Тем не менее, гостевой режим вполне позволит подготовить диплом, реферат или курсовую.

Другие полезные сервисы преобразования файлов: бесплатные конвертеры в форматы PDF - и EPUB - .

В завершение надо упомянуть о русскоязычной версии сервиса Onlineocr.net: ее адрес Onlineocr.ru . Однако бесплатное распознавание текста онлайн там ограничено не 15-тью, а 10-тью страницами в час, и нет возможности скачивать результат в формате Word или Excel. Кроме того, при регистрации вы не получите даже те 20 "кредитов", которые дает Onlineocr.net . Однако Onlineocr.ru можно использовать в качестве справки - там очень подробно объяснена теория, и вы сможете приобрести просто экспертные знания по теме "OCR онлайн" .

"Идеи могут создавать, идеи могут разрушать" - надеюсь, вам понравится это забавное видео

Функция распознания текста имеется в Google Документах.
Распознается 29 языков, включая русский. Поддерживаются форматы.JPG, .GIF, .PNG и.PDF документы размером до 10 Mb . Файл.PDF не более 10 страниц.

  1. Заходим в Google Документы , можно из Почты Google.
  2. Мышкой перетаскиваем картинку или PDF-файл в окно браузера (в Google Chrome это точно работает).
  3. Снизу появляется окошко и там есть сверху маленькое меню.
  4. Поставить флажки против 2 нижних пунктов (как это видно на картинке):
    • V - Преобразовывать текст из файлов PDF и изображений
    • V - Подтверждать настройки перед каждой загрузкой
  5. Закрываем окошко и грузим картинку снова.
  6. Теперь при загрузке он предлагает распознать текст, следует только указать язык.
  7. Затем картинка сохранилась как картинка, но если ее открыть открывает ее текстовый редактор, ниже картинки будет распознанный текст.


Finereader Online Распознаем отсканированные документы и цифровые фотографии онлайн.

Теперь все платно:

  • 10 страниц $3,00
  • 30 страниц $8,00
  • 100 страниц $20,00
  • 300 страниц $50,00
  • 1000 страниц $70,00
ABBYY FineReader - лучшая программа в этой сфере. Теперь есть ее Онлайн версия. Это будет удобно для тех, кому она требуется не очень часто. Вам не надо грузить на компьютер лишнюю программу (каждая забирает ресурсы, а потом система начинает тормозить).


  • распознавание многоязычных документов (до 3-х языков одновременно): английский, русский, французский, немецкий, испанский, украинский... (всего 37 языков);
  • Вы можете распознавать файлы любого из следующих форматов:
    1. *.jpg (*.jpeg)
    2. *.tif (*.tiff)
    3. *.pcx
    4. *.dcx
    5. *.bmp
    6. *.png
    7. *.djvu, *.djv
    8. *.pdf
  • конвертирование в форматы
    1. Текстовый документ (*.txt)
    2. Документ RTF (*.rtf)
    3. Документ PDF(*.pdf)
    4. Документ PDF/A (*.pdf)
  • После того, как документ успешно распознан и сохранен в выбранном вами формате, вы можете скачать его из истории заданий. Здесь вы можете увидеть статус вашего задания:
    1. В обработке – необходимо подождать, пока сервер распознает ваше изображение;
    2. Распознан – обработка документа завершена, и вы уже можете скачать результат распознавания;
    3. Ошибка при распознавании – документ не был распознан;
    4. Низкое качество распознавания. Задание выполнено бесплатно – документ распознан с большим количеством ошибок.
    5. распознанные документы хранятся на сервере 72 часа и доступны для скачивания из истории заказов в вашем профиле,
    6. если вам удобнее, чтобы на почту пришла ссылка для скачивания, просто поставьте галочку «Прислать на email ссылку на результат распознавания» и ждите письма о том, что ваш документ распознан.

Img2txt Сервис распознавания изображений.
Сервис на русском, совершенно бесплатный.
Распознает онлайн достаточно быстро. Правда меня поставили в очередь, но я был в очереди первым. Проверил на предмет ошибок. Небольшой кусок текста отличного качества (сделал скриншот с их же сайта, куда качественнее?) выдало по 2 ошибке в каждом слове. Со сканами работает значительно лучше. Сервис будут до ума доводить. Можно ожидать хорошего результата. На Украине всегда были хорошие программисты.

Английский язык

Online OCR Сервис распознавания текста.

Форматы исходника

  1. JPG/JPEG,
  2. TIF/TIFF,
  3. TIFF многостраничный,
  4. PDF многостраничный.
В многостраничном документе можно распознать страницы выборочно.

Конвертирует в форматы

  1. Документ PDF(*.pdf)
  2. Документ Microsoft Word (*.doc)
  3. Документ Microsoft Excel (*.xls)
  4. Документ HTML (*.html)
  5. Документ RTF (*.rtf)
  6. Текстовый документ (*.txt) Созданный файл будет в точности повторять структуру исходного документа (таблицы, колонки, шрифты и т.д.)

    Результат

    Файлы с результатом распознавания в вашем виртуальном рабочем кабинете онлайн, скачивать их на жесткий диск, редактировать, отправлять по почте и распечатывать на принтере.

    Ограничение

    1. Размер файла не должен превышать 20 Mb .
    2. Для получения качественного результата распознавания разрешение картинки должно быть не меньше 200 DPI .

Иногда возникает необходимость распознать текст с картинки или pdf файла. Все мы знаем, что найти бесплатную программу, которая это сделает не так и просто. Отличная альтернатива всяким программам распознавание текста с картинки онлайн, которое к тому же и бесплатное. К тому же онлайн сервис удобно использовать в тех случаях, когда необходимость распознавание текста с картинки требуется не часто.

Ниже я проведу подборку сервисов, на которых можно распознать текст бесплатно онлайн. Выберите себе подходящий, проверьте его функциональность и храните в закладках, чтобы быстро открыть в случае надобности.

Текст, который Вы получите после распознавания текста online зависит от качества исходного файла (рисунка или фотографии).

Где распознать текст с картинки онлайн бесплатно

Сервисы, на которых распознавание текста онлайн бесплатно, на английском языке, чтобы было понятнее я на скринах покажу, куда нажимать.

  • OCRconvert ocrconvert.com
    Поддерживает распознавание текста онлайн с фото (форматы PDF, PNG, GIF, BMP, JPEG). Результат распознавания предоставляется в виде ссылки на текстовый файл в формате TXT, по которой открывается этот файл. Текст можно скопировать и сохранить на компьютере в любом текстовом редакторе. Схема работы с этим сайтом простая: выберите файл, язык текста и нажмите на кнопку "process". Можно загрузить несколько файлов, если они на одном языке.


  • Free Online OCR www.newocr.com
    По функционалу более серьезный сервис, чем предыдущий. На нем можно распознать текст онлайн бесплатно без регистрации. Что радует, это то, что он поддерживает много форматов (JPEG, PNG, GIF, BMP, TIFF, PDF, DjVu).
    На первом этапе Вы загружаете файл для распознавания, потом можете изменить область распознавания, повращать картинку, и нажать на кнопку OCR для того, чтобы распознать текст с картинки.



    Еще хотелось бы отметить, что этот сервис предоставляет возможность выбрать область картинки для распознавания, повернуть картинку на 90 или 180 градусов. Сохранить результат распознавания можно в форматах TXT, DOC, PDF.
  • i2OCR i2ocr.com
    Поддерживаются такие файлы JPEG, TIF, GIF, PNG, BMP, PGM, PBM, PPM. Распознавание текста pdf не поддерживается этим сервисом. Весь процесс происходит в три шага:


  • Free-OCR.com
    Этот сервис на фоне перечисленных выше, выглядит послабее. Поддерживаются такие форматы: JPG, GIF, TIFF BMP, PDF. Но обратите внимание, что в файле PDF будет распознана только первая страница. Еще два ограничения: размер загружаемого файла 2 Мб и в течении одного часа разрешено распознавать не более 10 документов. Также, стоит защита от спамеров в виде капчи, которая тоже создает неудобства.


  • Free Online OCR onlineocr.net

    Поддерживается онлайн распознавание текста с фото следующих форматов JPG, JPEG, BMP, TIFF, GIF. Как и предыдущий сервис, Online OCR имеет ограничение на размер загружаемого файла - 4 Мб. и на количество обрабатываемых файлов за час - 15.


Теперь Вы знаете где и как распознать текст с картинки. На мой взгляд, самым функциональным и поддерживающим наибольшее число исходных форматов является сервис Free Online OCR. Пишите в комментариях свои отзывы о работе с данными сервисами.

Распознавание текста с картинки, OCR (optical character recognition), то есть превращение картинки в текст доступно бесплатно на многих сайтах в режиме онлайн. Но везде свое качество и свои ограничения на количество распознаваемых картинок.

Я проверила с десяток онлайн-сервисов и составила рейтинг лучших.

Для примера распознавала фотографию документа, который есть у каждого – свидетельство ИНН физического лица (разрешением 1275×1750 пикселей).

Сервис Нужна регистрация Рейтинг Адрес
да 3 https://drive.google.com/drive
да 5 https://finereaderonline.com/ru-ru
- 5 http://www.onlineocr.net
- 2 https://www.newocr.com
- 4 http://www.ocrconvert.com
- 1
- 4 http://www.i2ocr.com
Распознает и переводит. 5 https://translate.yandex.ru/ocr

Google

В Google можно распознавать неограниченное количество картинок, лишь бы они поместились на Google Drive. Нужно просто открыть картинку с Google диска с помощью Google Документов, и она автоматически распознается.

Как пользоваться

У вас должен быть Google-аккаунт для пользования сервисом, если есть почта gmail – подойдет аккаунт от нее.

Abbyy Finereader

В Abbyy Finereader Online самый удобный интерфейс, хорошее качество, но доступна только ознакомительная версия – можно распознать не более 10 страниц за две недели. (200 страниц в месяц стоят 299р). Для использования сервиса нужно зарегистрироваться (можно войти через аккаунты социальных сетей). Кроме того, полученный текст можно там же перевести на другой язык с помощью машинного перевода.

Бесплатно доступно не более 10 страниц в две недели.

Результат распознавания Finereader. (ФИО и город распознаны, но стерты вручную)

Как пользоваться



Распознавание текста онлайн без регистрации

Online OCR

Как пользоваться

      1. Загрузите файл, выберите язык и щелкните кнопку «Process»


      1. Появится ссылка на файл с распознанным текстом


Free OCR

Free OCR распознал документ хуже всех.

Как пользоваться

      1. Выберите файл
      2. Выберите языки на картинке
      3. Щелкните кнопку «Start»


I2OCR

I2OCR http://www.i2ocr.com/ неплохой сервис со средним качеством выходного файла. Отличается приятным дизайном, отсутствием ограничений на количество распознаваемых картинок. Но временами зависает.

Как пользоваться

  1. Выберите язык
  2. Загрузите файл
  3. Введите капчу
  4. Щелкните кнопку «Extract text»
  5. По кнопке «Download» можно загрузить выходной файл в нужном формате


Яндекс OCR

Недавно обнаружила этот сервис, и он мне очень понравился качеством и простотой использования. Вообще то он предназначен для перевода загруженной картинки, но его можно использоваться и для распознавания текста с картинки. Регистрации не требует, ограничений на количество изображений нет. В данный момент находится в стадии бета-тестирования.

Просто перейдите на https://translate.yandex.ru/ocr , загрузите картинку (можно перетащить) и щелкните «Открыть в Переводчике». Откроется как текст с картинки, так и перевод в правом поле.





Заключение

Лучше всего документ распознал Abbyy Finereader и Online OCR. Кроме того, эти сервисы сохраняют форматирование файла: где нет текста, оставляют картинки и компонуют их с распознанным текстом. Из новых сервисов хорош Яндекс OCR.

Хуже всего сработал Free OCR — он распознал всего три слова.