TesseractOCR: Добавка за OCR (оптично разпознаване на символи)

Автори: Rui Fontes, Ângelo Abrantes и Abel Passos do Nascimento младши
Обновено на 04.05.2023 г.
Изтегляне на стабилна версия
Съвместимост с NVDA: 2019.3 и по-нови версии

Информация

Тази добавка използва безплатния Tesseract OCR механизъм с отворен код, за да извършва оптично разпознаване на символи (OCR) на файл с изображение, PDF, JPG, TIF или друг, без да е необходимо да го отваряте.

Той също така позволява достъп до скенери поддържащи WIA за извършване на OCR на хартиен документ.

В менюто на NVDA -> Настройки, се добавя раздел "TesseractOCR", където можете да конфигурирате следните неща:

Езици, които да бъдат използвани при разпознаването;
Типовете документи, които да бъдат разпознавани;
Дали да се запитва за PDF парола или не. Ако сте включили тази опция и PDF файлът няма парола, просто натиснете Enter в диалоговия прозорец с искане за парола;
Изберете скенера, който ще използвате;
задайте разделителната способност на скенера между 150 и 400 DPI (точки на инч).

С изключение на английски и португалски, които вече са включени в добавката, другите езици ще бъдат изтеглени и инсталирани, когато изберете език, който все още не е наличен в добавката.

Имайте предвид, че с нарастването на броя на избраните езици за разпознаване, процесът на OCR ще отнеме повече време.

Затова ви препоръчваме да използвате само езиците, от които се нуждаете.

Имайте предвид също, че качеството на разпознаване може да варира според реда на езиците.

Следователно, ако резултатът от разпознаването не е задоволителен, може да опитате различно подреждане на езиците.

Клавишни команди

Клавишните команди по подразбиране са:

Windows+Control+R: Разпознаване на избрания документ;
Windows+Control+W: Сканиране и разпознаване на документ през скенера;
Windows+Control+C: Отмяна на процеса на сканиране.

Моля, обърнете внимание: Трябва да се изпълни, преди да се появи диалоговият прозорец, който ви пита дали искате да сканирате още страници!

След това просто изчакайте да се появи уеб-базирания екран с разпознатия текст.

Ако искате да запазите разпознатия текст, не забравяйте да го запишете в някоя папка, тъй като резултатите се изтриват в началото на следващия OCR процес!

Тези команди могат да бъдат променяни в диалоговия прозорец "Жестове на въвеждане" в раздела "TesseractOCR".

Известни проблеми

Когато изберете опцията "Различни" в падащия списък "Тип документи", в разпознатият текст вероятно ще се появят много празни редове.

Това е известен проблем с Tesseract и, без да отнема много време за обработка, все още не съм намерил никакво решение. Но все още не съм се отказал!

Поддържани езици

Поддържаните езици в тази версия са:

Африкаанс
Албански
Амхарски
Arabic
Armenian
Assamese
Азербайджански (латиница)
Баски
Беларуски
Бенгалски
Босненски
Бретонски
Български
Бирмански
Каталонски/Валенсийски
Себуано
Чероки
Опростен китайски
Традиционен китайски
Корсикански
Хърватски
Чешки
Датски
Немски
Дивехи
Нидерландски (фламандски)
Дзонгкха
Английски
Есперанто
Естонски
Фарьорски
Филипински
Финландски
Френски
Галисийски
Грузински
Гръцки
Гуджаратски
Хаитянски
Иврит
Хинди
Унгарски
Исландски
Индонезийски
Инуктитут
Ирландски
Италиански
Явански
Японски
Каннада
Казахски
Кхмерски (централен)
Киргизки
Корейски
Кюрдски Курманджи
Лаос
Латински
Латвийски
Литовски
Люксембургски
Македонски
Малайски
Малаялам
Малтийски
Маори
Маратхи
Модул за откриване на математика/уравнения
Монголски
Непалски
Норвежки
Окситански
Ория
Панджабски
Пущунски
Персийски
Полски
Португалски
Кечуа
Румънски/Молдаве
Руски
Санскрит
Шотландски Келтски
Сръбски (латиница)
Словашки
Словенски
Синдхи
Синхалски
Испански
Сундански
Суахили
Шведски
Сирийски
Таджикски
Тамил
Татарски
Телугу
Тайландски
Тибетски
Тигриня
Тонга
Турски
Уйгурски
Украински
Урду
Узбекски (латиница)
Виетнамски
Уелски
Западен Фризийски
Идиш
Йоруба

Поддържани типове изображения

Тази добавка поддържа следните типове файлове:

PDF
jpg
tif
png
bmp
pnm
pbm
pgm
jp2
gif
jfif
jpeg
tiff
spix
webp