5 Безкоштовні онлайн послуги OCR перевірені та перевірені
У вас є PDF-документ або зображення, яке потрібно перетворити в текст? Нещодавно хтось надіслав мені поштою документ, який мені потрібно було відредагувати і відправити з виправленнями. Людина не могла знайти цифрову копію, тому мені було доручено отримати весь цей текст у цифровому форматі.
Не було ніякого способу, коли я збираюся проводити години, набравши все назад, тому я отримав гарну якісну картинку документа, а потім спалахнув через купу онлайн-OCR-служб, щоб побачити, який із них найкращий результатів.
У цій статті я пройду через пару моїх улюблених сайтів для OCR, які є безкоштовними. Варто зауважити, що більшість цих сайтів надають базову безкоштовну послугу, а потім мають платні опції, якщо ви хочете отримати додаткові функції, такі як великі зображення, багатосторінкові документи PDF, різні мови введення тощо..
Також добре знати заздалегідь, що більшість цих служб не зможуть відповідати форматуванню вашого оригінального документа. Це в основному для вилучення тексту і все. Якщо вам потрібне все, щоб бути в певному форматі або форматі, вам доведеться вручну це зробити, як тільки ви отримаєте весь текст з розпізнавання.
Крім того, найкращі результати для отримання тексту будуть надходити з документів з роздільною здатністю від 200 до 400 DPI. Якщо у вас зображення з низьким показником DPI, результати не будуть настільки хорошими.
Нарешті, було багато сайтів, які я тестував, що просто не працювало. Якщо у вас безкоштовне онлайн-розпізнавання Google, ви побачите купу сайтів, але деякі сайти з 10 найкращих результатів навіть не завершили конверсію. Деякі з них вичерпають час, інші видають помилки, а деякі просто застрягли на сторінці "конвертації", тому я навіть не згадав про ці сайти..
Для кожного сайту я перевірив два документи, щоб побачити, наскільки добре буде вихід. Для моїх тестів, я просто використовував мій iPhone 5S, щоб сфотографувати обидва документи, а потім завантажив їх безпосередньо на веб-сайти для перетворення.
У випадку, якщо ви хочете побачити, як виглядали зображення, які я використовував для мого тесту, я додав їх тут: Test1 і Test2. Зверніть увагу, що це не є повною роздільною здатністю зображень, зроблених з телефону. Під час завантаження на сайти я використовував зображення з повним дозволом.
OnlineOCR
OnlineOCR.net - це чистий і простий сайт, який дав дуже хороші результати в моєму тесті. Головне, що мені подобається в тому, що він не має тонни оголошень по всьому місці, що, як правило, має місце у таких місцях обслуговування ніш.
Щоб почати, виберіть файл і зачекайте, поки він закінчить завантаження. Максимальний розмір завантаження для цього сайту - 100 МБ. Якщо ви зареєструвалися для безкоштовного облікового запису, ви отримаєте кілька додаткових функцій, таких як більший розмір завантаження, багатосторінкові PDF-файли, різні мови введення, більше конверсій за годину тощо.
Далі виберіть мову введення та виберіть формат виводу. Ви можете вибрати з Word, Excel або звичайного тексту. Натисніть кнопку Перетворити і ви побачите текст у нижній частині вікна разом із посиланням для завантаження.
Якщо все, що ви хочете, це текст, просто скопіюйте та вставте його з коробки. Однак, я пропоную вам завантажити документ Word, тому що він робить дивовижну роботу зі збереження макета вихідного документа.
Наприклад, коли я відкрив документ Word для мого другого тесту, я був здивований тим, що документ містив таблицю з трьома стовпцями, як і на зображенні.
З усіх сайтів, цей був найкращим. Цілком варто зареєструватися, якщо вам потрібно зробити багато переходів.
Для повноти, я також збираюся посилання на вихідні файли, створені кожною службою, так що ви можете побачити результати для себе. Ось результати з OnlineOCR: Test1 Doc і Test2 Doc.
Зверніть увагу, що при відкритті цих документів Word на вашому комп'ютері в Word з'являється повідомлення про те, що він з Інтернету, а редагування вимкнено. Це цілком нормально, тому що Word не довіряє документам з Інтернету, і вам дійсно не потрібно вмикати редагування, якщо ви просто хочете переглянути документ.
i2OCR
Інший сайт, який дав досить хороші результати, був i2OCR. Процес дуже схожий: виберіть мову, файл і натисніть Витяг тексту.
Тут доведеться почекати хвилину-дві, тому що цей сайт займе трохи більше часу. Крім того, у кроці 2 переконайтеся, що зображення показується правою стороною вгору в попередньому перегляді, інакше ви отримаєте купу тарабарщини як вихід. З якихось причин зображення з мого iPhone відображаються в портретному режимі на моєму комп'ютері, але пейзаж, коли я завантажував на цей сайт.
Мені довелося вручну відкрити зображення в програмі для редагування фотографій, повернути на 90 градусів, потім повернути його в портрет, а потім знову зберегти. Після завершення прокрутіть вниз, і він покаже вам попередній перегляд тексту разом із кнопкою завантаження.
Цей сайт пройшов досить добре з виходом для першого тесту, але не зробив так добре з другим тестом, який мав колонку. Ось результати з i2OCR: Test1 Doc і Test2 Doc.
FreeOCR
Free-OCR.com прийме ваші зображення та перетворить їх у звичайний текст. Вона не має можливості експортувати у формат Word. Виберіть файл, виберіть мову та натисніть Початок.
Сайт є швидким, і ви отримаєте вихід досить швидко. Просто натисніть посилання, щоб завантажити текстовий файл на комп'ютер.
Як і у випадку з NewOCR, про який йдеться нижче, цей сайт використовує великі літери T у документі. Я поняття не маю, чому це буде робити, але з певної причини цей сайт і NewOCR обидва зробили це. Це не велика справа, щоб змінити його, але це нудний процес, який ви дійсно не повинні робити.
Ось результати FreeOCR: Test1 Doc і Test2 Doc.
ABBYY FineReader Online
Для використання FineReader Online потрібно зареєструватися для облікового запису, який дає вам безкоштовну 15-денну пробну версію для розпізнавання до 10 сторінок. Якщо вам потрібно лише зробити одноразове розпізнавання для декількох сторінок, ви можете скористатися цією послугою. Переконайтеся, що після реєстрації натисніть посилання "Перевірити" в електронному листі з підтвердженням.
Натисніть на Визнати у верхній частині та натисніть кнопку Завантажити , щоб вибрати файл. Виберіть мову, формат виводу та натисніть кнопку Визнати на дні. Цей сайт має чистий інтерфейс, а також оголошення.
У моїх тестах цей сайт міг захопити текст з першого тестового документа, але він був абсолютно величезним, коли я відкрив документ Word, тому я зробив це знову і вибрав Plain Text як вихідний формат.
Для другого тесту з колонками документ Word був порожнім, і я не міг навіть знайти текст. Не впевнений, що сталося там, але, здається, не в змозі впоратися ні з чим, крім простих пунктів. Ось результати FineReader: Test1 Doc і Test2 Doc.
NewOCR
Наступний сайт, NewOCR.com, був нормальний, але не настільки хороший, як перший сайт. По-перше, це оголошення, але, на щастя, не тонну. Спочатку виберіть файл і натисніть кнопку Попередній перегляд кнопки.
Потім можна повернути зображення та відрегулювати область, у якій потрібно сканувати текст. Це дуже схоже на те, як процес сканування працює на комп'ютері з приєднаним сканером.
Якщо документ містить кілька стовпців, можна перевірити Аналіз макета сторінки і вона спробує розділити текст на стовпці. Натисніть кнопку OCR, зачекайте кілька секунд, доки вона не завершиться, а потім перейдіть донизу, коли сторінка оновлюється.
У першому тесті він отримав весь текст правильно, але чомусь капіталізував кожний T у документі! Ніяка ідея чому це би не зробило що, але це. У другому тесті з включеним аналізом сторінок він отримав більшу частину тексту, але макет був повністю вимкнений.
Ось результати NewOCR: Test1 Doc і Test2 Doc.
Висновок
Як ви можете бачити, безкоштовна програма не дає вам дуже хороших результатів у більшості випадків, на жаль. Перший згаданий сайт є найкращим, оскільки він не тільки зробив велику роботу з розпізнавання всього тексту, але й зумів зберегти формат оригінального документа..
Якщо вам просто потрібен текст, більшість веб-сайтів вище повинні мати можливість зробити це за вас. Якщо у Вас виникли питання, не соромтеся коментувати. Насолоджуйтесь!