Домашня » Інструментарій » Як витягти текст із зображень за допомогою командного рядка

    Як витягти текст із зображень за допомогою командного рядка

    Досить легко прочитати зображення і витягнути текст самостійно. Але динамічно витягуючи текст з фотографії трохи жорсткіше і, на щастя,, imgclip пропонує досить просте рішення.

    Це інструмент командного рядка працює в терміналі для Mac, Windows і Linux. Потім він просто бере аргумент для файлу зображення разом з мовою повертає текст скопійовано в буфер обміну.

    Ви можете встановити всю бібліотеку через npm і це a досить проста установка. Річ у тім всього декілька Кб і він поставляється з файлом JS, який можна переглядати на GitHub.

    Зображення використовує Tesseract.js бібліотека для автоматизації обробки зображень і витягання тексту через OCR. Це одна з найпотужніших бібліотек OCR на сьогоднішній день, і це повністю відкрите джерело, як і imgclip.

    Я думаю, що я найбільше вражений якістю та швидкістю цього інструменту. Це дійсно працює тягніть точний текст і це один з найпростіших інструментів.

    Команда imgclip повинна бути працювати безпосередньо в терміналі, слідує відносний шлях до зображення. Можна також додати чотири варіанти на кінці, щоб налаштувати вихід.

    1. -h, --допомогу: виводить інформацію про використання
    2. -V, --версії: виводить номер версії
    3. -l, --lang: виводить мову тексту на зображенні
    4. -стор, --друк: друкує текст на зображенні (замість копіювання в буфер обміну)

    На момент написання статті, Tesseract підтримує 65 мов з більш на шляху. Код, який ви додаєте до --lang тег повинен бути будь-яким кодом, який використовується в цих файлах Tesseract.

    Наприклад, -l eng буде шукати зображення для Англійський текст, час -l jpn шукатиме Японський текст і ви навіть можете бігти -l jpn_vert для пошуку вертикально орієнтований японський текст.

    Оскільки imgclip значною мірою покладається на Tesseract, у вас в основному є сила всієї бібліотеки.

    До почати, відвідайте сторінку GitHub і завантажте копію локально або встановіть її в певний каталог за допомогою npm. Потім ви можете запустити інструмент у терміналі, як додаток до розібрати будь-яке зображення.

    Бачити imgclip в дії, перевірте цей короткий відео, створений як demgclip demo.