Tesseract.js переводить зображення OCR у браузери
Переклад OCR все ще не є досконалим, але він різко покращився за останні кілька років. Провідним шляхом є Tesseract двигун перекладу в даний час відкриті джерела в C++.
Хоча це неймовірна бібліотека, вона обмежена лише програмним забезпеченням. На щастя, хтось зробив порт Tesseract у JavaScript, який називається Tesseract.js. Це підтримує до 60 мов і хоча це, звичайно, не ідеально, вона добре виконує свою роботу.
Встановлення та налаштування - це вітер, де можна націлювання на будь-який елемент зображення на сторінці і запустіть Tesseract.recognize () функції. Це може зайняти будь-який тип зображення, і це автоматично стиснути та перекласти у браузері.
Ви можете отримати набагато складніше, але краса як можна запустити OCR з одним рядком коду.
Перегляньте цільову сторінку Tesseract.js, якщо ви хочете побачити демонстрацію в реальному часі. Це працює в браузері, де ви можете перетягніть будь-яке відскановане зображення тексту, щоб отримати автоматичний переклад OCR.
Ви також можете завантажити цей приклад локально через сторінку GitHub або створити власну програму, включивши сценарій Tesseract.js прямо з CDN.
Найпростіший приклад коду виглядає наступним чином myImage є прямим посиланням на елемент зображення HTML:
Tesseract.recognize (myImage). Then (функція (результат) console.log (результат));
У будь-якому випадку ця бібліотека є настільки корисною, щоб переміщатися за допомогою розпізнавання в Інтернеті. Це далеко не досконале, але це теж найкращий ресурс для веб-розробників, які хочуть динамічну функціональність розпізнавання на сторінці.
Щоб дізнатися більше, відвідайте сторінку GisHub Tesseract.js, де ви можете ознайомитися з демонстрацією в реальному часі та переглянути документацію в Інтернеті.