TesseractOCR: додаток для OCR

Authors: Rui Fontes, Ângelo Abrantes and Abel Passos do Nascimento Jr.
Оновлено 30/05/2023
Завантажити стабільну версію
Сумісність: NVDA версія 2019.3 і вище

Інформація

Цей додаток використовує безкоштовну систему Tesseract OCR з відкритим джерельним кодом для оптичного розпізнавання символів у файлі зображення, PDF, JPG, TIF чи іншому, без необхідності його відкривати.

Він також використовує wia-cmd-сканер, щоб отримати доступ до сканерів із підтримкою WIA та виконати оптичне розпізнавання для паперового документа.

У меню «Параметри» NVDA додано розділ TesseractOCR, де можна налаштувати наступне:

мови, які будуть використовуватися для розпізнавання;
тип документів для розпізнавання;
запитувати чи не запитувати пароль до PDF-файлу. Якщо ви позначили цю опцію, а PDF-файл не має пароля, просто натисніть Enter у діалозі із запитом пароля;
Виберіть сканер, який буде використовуватися;
встановіть роздільну здатність сканера в діапазоні від 150 до 400 dpi.

За винятком англійської й португальської мов, які вже включені в додаток, інші мови буде завантажено та встановлено, коли ви виберете мову, якої ще немає в додатку.

Зауважте, що зі збільшенням кількості вибраних мов, процес розпізнавання триватиме довше.

Тому ми рекомендуємо використовувати лише ті мови, які вам потрібні.

Зауважте також, що якість розпізнавання може відрізнятися залежно від порядку мов.

Тому, якщо результат розпізнавання незадовільний, ви можете спробувати інший порядок мов.

Гарячі клавіші

Початково використовуються такі команди:

Windows+Control+r — для розпізнавання вибраного документа;
Windows+Control+w — для сканування та розпізнавання документа через сканер;
Windows+Control+c - для скасування процесу сканування.

Зверніть увагу: комбінація повинна бути застосована до того, як з'явиться діалог із запитом про те, чи хочете ви відсканувати більше сторінок!

Потім просто зачекайте, поки ocr.pdf відкриється з розпізнаним текстом.

Якщо ви хочете зберегти розпізнаний текст, не забудьте зберегти документ під іншим ім'ям та в іншому місці, тому що всі файли в тимчасовому каталозі видаляються на початку наступного оптичного розпізнавання!

Ці команди можна змінити в діалозі «Жести вводу» в розділі «TesseractOCR».

Відомі проблеми

При виборі опції «Різне»» у списку "Тип документів" розпізнаний текст, ймовірно, відображається з великою кількістю порожніх рядків

Це відома проблема з Tesseract, і не витрачаючи багато часу на обробку, автор поки що не знайшов рішення. Але він ще не здався!

Підтримувані мови

У цій версії підтримуються такі мови:

Африканська
Албанська
Амхарська
Арабська
Вірменська
Ассамська
Азербайджанська (латиниця)
Баскська
Білоруська
Бенгальська
Боснійська
Бретонська
Болгарська
Бірманська
Каталонська/Валенсія
Себуанська
Черокі
Китайська спрощена
Китайська традиційна
Корсиканська
Хорватська
Чеська
Данська
Німецька
Мальдівська
Голланська (фламандська)
Дзонг-ке
Англійська
Есперанто
Естонська
Фарерська
Філіппінська
Фінська
Французька
Галісійська
Грузинська
Грецька
Гуджараті
Гаїтянська
Іврит
Гінді
Угорська
Ісландська
Індонезійська
Інуктитут
Ірландська
Італійська
Яванська
Японська
Каннада
Казахська
Кхмерська (центральна)
Киргизька
Корейська
Курдська Kurmanji
Лаоська
Латинська
Латиська
Литовська
Люксембурзька
Македонська
Малайська
Малаялам
Мальтійська
Маорійська
Маратська
Модуль виявлення математики / рівнянь
Монгольська
Непальська
Норвезька
Окситанська
Орія
Пенджабська
Пушту
Перська
Польська
Португальська
Кечуа
Румунська/Молдавська
Російська
Санскрит
Шотландська гельська
Сербська (латиниця)
Словацька
Словенська
Синдхі
Сингальська
Іспанська
Сунданська
Суахілі
Шведська
Сирійська
Таджицька
Тамільська
Татарська
Телугу
Тайська
Тибетська
Тигринья
Тонганська
Турецька
Уйгурська
Українська
Урду
Узбецька (латиниця)
В'єтнамська
Валлійська
Західнофризька
Їдиш
Йоруба

Підтримувані типи зображень

Цей додаток підтримує такі типи файлів:

PDF
jpg
tif
png
bmp
pnm
pbm
pgm
jp2
gif
jfif
jpeg
tiff
spix
webp