Online image describer

  • Autor: Larry Wang
  • Zgodność z NVDA: od 2018.3 do 2020.2
  • Pobierz wersja rozwojowa

Ten dodatek ma na celu dodanie silników rozpoznawania obrazów online do NVDA.

Istnieją dwa rodzaje silników. OCR i opis obrazu.

OCR wyodrębnia tekst z obrazu.

Opis obrazu opisuje cechy wizualne obrazu w formie tekstowej, takie jak ogólny opis, kolorowe punkty orientacyjne i tak dalej.

Do korzystania z tego dodatku wymagane jest połączenie z Internetem, ponieważ usługi opisu obrazu są dostarczane przez punkty końcowe interfejsu API w Internecie.

W tym dodatku nazywane są silnikami.

Istnieją trzy typy silników dla tego dodatku.

  • Silnik OCR online
  • Silnik opisu obrazu online
  • Aparat OCR systemu Windows 10 (w trybie offline)

Musisz także wybrać źródło rozpoznawania obrazu.

  • Bieżący obiekt nawigatora
  • Bieżące okno pierwszego planu
  • Cały ekran
  • Dane obrazu lub plik ze schowka
  • Nazwa ścieżki pliku obrazu lub adres URL obrazu ze schowka

Polecenia klawiszowe

Po wybraniu tych typów możesz rozpocząć rozpoznawanie jednym gestem.

NVDA + Alt + P Wykonaj rozpoznawanie zgodnie z ustawieniem źródła i typu silnika, a następnie odczytaj wynik. W przypadku dwukrotnego naciśnięcia otwórz wirtualny dokument wynikowy.

Istnieją cztery dodatkowe gesty pozostawione bez przypisania. Przypisz je przed użyciem.

Przełączaj się między różnymi typami aparatów rozpoznawania.

Przełączaj się między różnymi typami źródeł rozpoznawania.

Anuluj bieżące rozpoznanie

Ten gest może być przydatny, jeśli uważasz, że czekałeś zbyt długo i chcesz anulować.

Czasami nie chcesz być zakłócany przez komunikat rozpoznawania, ponieważ musisz przejrzeć niektóre wiadomości dostarczone po rozpoczęciu rozpoznawania.

Pokaż poprzedni wynik w wirtualnym dokumencie wyników.

Chociaż istnieje funkcja kopiowania wyników do schowka. Nie można zachować informacji o położeniu znaku, więc ten gest jest dodawany w celu rozwiązania tego problemu.

Istnieją również cztery stare gesty pozostawione bez przypisania dla użytkowników, którzy preferują gesty w poprzednich wersjach.

Zaleca się użycie nowego gestu i zmianę typu silnika w zależności od potrzeb.

Rozpoznaj bieżący obiekt nawigatora za pomocą silnika OCR online, a następnie odczytaj wynik. W przypadku dwukrotnego naciśnięcia otwórz wirtualny dokument wynikowy.

Rozpoznaje obraz w schowku za pomocą silnika OCR online. Następnie odczytaj wynik. W przypadku dwukrotnego naciśnięcia otwórz wirtualny dokument wynikowy.

Rozpoznaj bieżący obiekt nawigatora, a następnie odczytaj wynik. W przypadku dwukrotnego naciśnięcia otwórz wirtualny dokument wynikowy.

Rozpoznaje obraz w schowku . Następnie odczytaj wynik. W przypadku dwukrotnego naciśnięcia otwórz wirtualny dokument wynikowy.

Konfiguracja silnika

Silniki rozpoznawania można wybierać i szczegółowo konfigurować w kategorii Online Image Describer w ustawieniach NVDA.

Autor dodatku zarejestrował konto z bezpłatnym przydziałem API i skonfigurował serwer proxy na www.nvdacn.com, aby ten dodatek był łatwiejszy do przetestowania na początku. Przydział testowy jest ograniczony i może zostać anulowany przez dostawcę interfejsu API w dowolnym momencie.

Zdecydowanie zaleca się zarejestrowanie własnego klucza zgodnie z instrukcją w każdym silniku.

Następujące ustawienia mogą być stosowane do wszystkich silników.

  • Kopiuj wynik rozpoznawania do schowka: jeśli ta opcja jest włączona, tekst wyniku rozpoznawania zostanie skopiowany do schowka po rozpoznaniu.
  • Użyj wiadomości z możliwością przeglądania dla wyniku tekstowego: jeśli ta opcja jest włączona, tekst wyniku rozpoznawania będzie wyświetlany w wyskakującym okienku zamiast mowy lub wiadomości brajlowskiej.
  • Swap the effect of repeated gesture with none repeated ones: by default, a virtual result document is shown only if you press the corresponding gesture twice, if you use that frequently you can enable this option so that you only need to press once to get a result viewer.
  • Włącz bardziej szczegółowe rejestrowanie do celów debugowania: niektóre dzienniki są niezbędne do debugowania, ale wpływają na wydajność i zajmują dużo miejsca. Włącz tę funkcję tylko wtedy, gdy zostało to specjalnie poinstruowane przez autora dodatku lub programistę NVDA.
  • Typ serwera proxy: typ używanego serwera proxy. Jeśli nie wiesz, co to jest proxy, po prostu zostaw go takim, jaki jest.
  • Adres serwera proxy: pełny adres URL serwera proxy. Jeśli nie wiesz, co to jest proxy, po prostu zostaw go takim, jaki jest. Jeśli zdecydujesz się użyć proxy, Twój serwer proxy zostanie zweryfikowany przed zapisaniem, po weryfikacji pojawi się monit o podanie wyniku.

Poniższe ustawienia oznaczają to samo we wszystkich silnikach, opisz je tutaj, aby zaoszczędzić miejsce.

  • Typ dostępu do interfejsu API: określa sposób uzyskiwania dostępu do odpowiednich punktów końcowych interfejsu API.

    • Jeśli wybierzesz opcję "Użyj przydziału publicznego", korzystasz z bezpłatnego przydziału na koncie zarejestrowanym przez autora dodatku.
    • Jeśli wybierzesz opcję "Użyj własnego klucza API", ten dodatek użyje przydziału z Twojego konta.
  • Identyfikator aplikacji, klucz API lub tajny klucz API: jeśli chcesz użyć przydziału z własnego konta, wymagane są odpowiednie tokeny dostępu. Niektóre aparaty potrzebują tylko klucza API. Niektóre silniki wymagają dwóch tokenów. Są one ważne tylko wtedy, gdy wybierzesz "użyj własnego klucza API" w typie dostępu do interfejsu API.

Należy pamiętać, że na jakość i dokładność wyników wpływa wiele czynników.

  • Modele i techniki stosowane przez dostawcę silnika
  • Jakość przesłanego obrazu
  • Czy obiekt nawigatora jest ukryty za czymś innym
  • Rozdzielczość ekranu

Opis obrazu w sieci

Dostępne są trzy silniki.

Microsoft Azure Image Analyser

Ten silnik wyodrębnia bogaty zestaw funkcji wizualnych na podstawie zawartości obrazu.

Ten silnik jest tylko w języku angielskim. Jeśli chcesz opis w innych językach, możesz użyć Microsoft Azure Image Describer

Wśród cech wizualnych można wyróżnić:

  • Dla dorosłych - silnik wykrywa, czy obraz jest pornograficzny, tzn. przedstawia nagość lub stosunek seksualny. Ponadto wykrywane są obrazy z podtekstem seksualnym.
  • Marki - Silnik wykrywa na obrazie znaki różnych marek i podaje ich przybliżone położenie. Argument rozpoznawania marek jest dostępny tylko w języku angielskim.
  • Kategorie - Silnik klasyfikuje treść obrazu według systematyki opisanej w dokumentacji.
  • Kolor - Silnik określa akcenty kolorystyczne i barwę dominującą, a także wykrywa, czy obraz jest czarno-biały.
  • Opis - Silnik opisuje zawartość obrazu pełnymi zdaniami we wspieranych językach.
  • Wykrywanie twarzy - Silnik sprawdza, czy na obrazie są twarze. Jeśli są, określa ich współrzędne, płeć i wiek.
  • Typ obrazu - określa, czy jest to obraz typu clip art, czy rysunek liniowy.
  • Przedmioty - Silnik wykrywa różne przedmioty na obrazie i podaje ich przybliżone położenie. Argument rozpoznawania przedmiotów jest dostępny tylko w języku angielskim.
  • Tagi - Silnik może otagować obraz szczegółową listą słów związanych z jego zawartością.

Niektóre cechy wizualne zawierają dodatkowe szczegóły:

  • Gwiazdy - identyfikuje celebrytów, jeśli zostaną wykryte na obrazie.
  • Zabytki - Silnik wykrywa i identyfikuje zabytki na obrazie.

Microsoft Azure Image describer

Ten silnik generuje opis obrazu w języku czytelnym dla człowieka z pełnymi zdaniami. Opis jest oparty na kolekcji znaczników zawartości, które są również zwracane przez operację.

Dla każdego obrazu można wygenerować więcej niż jeden opis. Opisy są uporządkowane według ich wyniku ufności.

Istnieją dwa ustawienia dla tego silnika.

  • Język: język, w którym usługa zwróci opis obrazu. Domyślnie angielski.
  • Maksymalna liczba kandydatów: maksymalna liczba opisów kandydatów do zwrotu. Wartość domyślna to 1.

Online OCR

Silniki internetowe funkcjonują dzięki następującym usługom.

https://www.nvdacn.com

https://ocr.space/ocrapi

https://azure.microsoft.com/en-us/services/cognitive-services/

http://ai.qq.com

http://ai.baidu.com

http://ai.sogou.com/

https://intl.cloud.tencent.com

Silniki

Jest pięć dostępnych silników.

Tencent Cloud OCR

Ten interfejs API jest sponsorowany przez Tencent Cloud i [Aceessibility Research Association] (http://www.siaa.org.cn), z limitem 15000 dziennie.

Ten aparat obsługuje 19 języków.

  • Chińsko-angielska mieszanka
  • Japoński
  • Koreański
  • Hiszpański
  • Francuski
  • Niemiecki
  • Portugalski
  • Wietnamski
  • Malajski
  • Rosyjski
  • Włoski
  • Holenderski
  • Szwedzki
  • Fiński
  • Duński
  • Norweski
  • Węgierski
  • Tajski
  • Łaciński

Oto ustawienia tego silnika.

  • Język: Język rozpoznawania tekstu, domyślnie język jest wykrywany automatycznie.

OCR space

Ten jest płatnym interfejsem API z bezpłatnym przydziałem zapewnianym przez [OCR Space] (https://ocr.space)

Obsługuje 24 języki

  • Arabski
  • Bułgarski
  • Chiński (uproszczony)
  • Chiński (tradycyjny)
  • Chorwacki
  • Czeski
  • Duński
  • Holenderski
  • Angielski
  • Fiński
  • Francuski
  • Niemiecki
  • Grecki
  • Węgierski
  • Koreański
  • Włoski
  • Japoński
  • Polski
  • Portugalski
  • Rosyjski
  • Słoweński
  • Hiszpański
  • Szwedzki
  • Turecki

Poniżej znajdują się ustawienia tego silnika:

  • Język: język tekstu do rozpoznawania. Domyślnie angielski.
  • Wykryj orientację obrazu: jeśli ustawiona jest wartość true, interfejs API automatycznie autorotuje obraz.
  • Skaluj obraz, aby uzyskać lepszą jakość: jeśli ustawisz wartość true, interfejs API wykonuje wewnętrzne skalowanie. Może to znacznie poprawić wynik OCR, szczególnie w przypadku skanowania plików PDF w niskiej rozdzielczości.
  • Optymalizacja pod kątem rozpoznawania tabel: jeśli ustawiona jest wartość true, logika OCR zapewnia, że wynik przeanalizowanego tekstu jest zawsze zwracany wiersz po wierszu. Ten przełącznik jest zalecany do OCR tabeli, OCR paragonów, przetwarzania faktur i wszystkich innych typów dokumentów wejściowych, które mają strukturę podobną do tabeli.

Aby móc używać własnego klucza, należy określić również klucz API.

Możesz uzyskać własny bezpłatny klucz API, rejestrując się na [przestrzeń OCR] (https://ocr.space/ocrapi)

Poniżej krótki przewodnik.

Znajdź link "Zarejestruj się, aby uzyskać bezpłatny klucz API"

Kliknij na niego, a znajdziesz formularz do wypełnienia.

Formularz prosi o wprowadzenie następujących danych

  • Adres e-mail
  • Imię
  • Nazwisko
  • Jak planujesz korzystać z interfejsu API OCR?

Po wypełnieniu i przesłaniu. Może być również konieczne przekazanie captcha

Następnie otrzymasz wiadomość e-mail z potwierdzeniem

Znajdź link o nazwie "Tak, zapisz mnie na tę listę. " w tej wiadomości e-mail. Uzyskaj dostęp do tego linku, a wkrótce otrzymasz klucz API e-mailem.

Microsoft Azure OCR

Ten silnik korzysta z OCR API w Microsoft Azure Cognitive Services Computer Vision.

Obsługuje 24 języki, w tym

  • Chiiński uproszczony
  • Chiński tradycyjny
  • Czeski
  • Duński
  • Holenderski
  • Angielski
  • Fiński
  • Francuski
  • Niemiecki
  • Grecki
  • Węgierski
  • Włoski
  • Japoński
  • Koreański
  • Norweski
  • Polski
  • Portugalski
  • Rosyjski
  • Hiszpański
  • Szwedzki
  • Turecki
  • Arabski
  • Rumuński
  • Serbska cyrylica
  • serbski łaciński
  • Słowacki

Poniżej znajdują się ustawienia tego silnika:

  • Język: język tekstu do rozpoznawania. Domyślnie automatyczne wykrywanie.
  • Wykryj orientację obrazu: jeśli ustawiona jest wartość true, interfejs API automatycznie autorotuje obraz.

Jeśli używasz własnego klucza, powinieneś uzyskać klucz subskrypcji do korzystania z interfejsu API przetwarzania obrazów firmy Microsoft, korzystając z poniższego łącza:

Krok 1: Utwórz konto w witrynie witryna sieci Web platformy Azure

Uwaga! Klucz dla Computer Vision API jest konieczny. Pierwszy przycisk "Uzyskaj klucz API" który zobaczysz, dotyczy klucza jednorazowego. Obecnie, Microsoft umożliwia uzyskanie subskrypcji na 7 dni. Można również założyć darmowe konto azure i uzyskać więcej próbnych wywołań. Do zarejestrowania się potrzebna jest karta kredytowa. Jeśli posiadasz już konto subskrypcyjne, możesz pominąć ten krok.

Krok 2: Wdrażanie usług Cognitive Services

Teraz masz konto platformy Azure.Now you have an azure account.

Najpierw zaloguj się do Portalu Azure

Zaczekaj na wiadomość: Portal gotowy, udane logowanie do Portalu Azure.

Otwórz link Wszystkie zasoby, a następnie aktywuj przycisk Wszystkie usługi.

Zaczekaj na wiadomość: Wszystkie zasoby gotowe. Punkt uwagi znajdzie się na polu edycyjnym. Naciśnij shift tab, znajdź element meni o nazwie Dodaj i aktywuj go.

Zaczekaj na wiadomość: Przeszukaj witrynę Marketplace. Wpisz frazę Cognitive Services i naciśnij strzałkę w dół.

Zaczekaj na wiadomość: lista opcji, usługi rozpoznawania jeden z pięciu i naciśnij enter.

Zaczekaj na wiadomość: Usługi rozpoznawania gotowe. Naciśnij tab lub b aby znaleźć przycisk Utwórz i aktywuj go.

Poczekaj, aż pojawi się komunikat Tworzenie ostrza jest gotowe, fokus będzie polem edycji, wpisz nazwę tego zasobu. Pamiętaj, że nazwa zasobu może zawierać tylko znaki alfanumeryczne, "", "-" i nie może kończyć się na "" lub "-".

Wybieram NVDA_OCR.

Naciśnij Tab, aby przejść do pola kombi Subskrypcja. Zwykle możesz zostawić go takim, jaki jest.

Naciśnij Tab, aby przejść do pola kombi Lokalizacja. Wybierz jedną z nich w pobliżu bieżącej lokalizacji.

Pamiętaj o tym, ponieważ lokalizacja jest wymagana w konfiguracji silnika.

Naciśnij Tab, aby przejść do pola kombi Cennik wiązania. Zazwyczaj darmowy krawat, taki jak F0, jest odpowiedni. Jeśli to nie wystarczy, możesz wybrać inną warstwę po przeczytaniu pełnych szczegółów cen w linku Wyświetl pełne szczegóły cen.

Naciśnij Tab, aby przejść do pola edycji Utwórz nową grupę zasobów. Należy go utworzyć, jeśli nie masz żadnej grupy zasobów. Naciśnij Tab, znajdź przycisk Utwórz nowy.

Następnie naciśnij Tab, przejdź do przycisku Utwórz, aby utworzyć ten zasób.

Zaczekaj na wiadomość: Włączanie usług powiodło się.

Następnie znajdź przycisk Przejdź do zasobu. Czasem trzeba wrócić do przycisku Włącz powiadomienia zanim uda się znaleźć Przejdź do zasobu.

Zaczekaj na wiadomość: Strona szybkiego startu.

Znajdź link pod nazwą Klucze i otwórz go.

Zaczekaj na wiadomość: Zarządzanie kluczami gotowe.

Znajdź pole edycji o nazwie klucz 1 lub klucz 2. Zawartość tego pola edycji jest kluczem interfejsu API wymaganym w konfiguracji aparatu. Naciśnij Ctrl+C, aby skopiować je w celu skonfigurowania silnika

Następnie możesz wypełnić te dwa ustawienia wymagane, jeśli używasz własnego klucza API.

  • Region zasobów platformy Azure: region wybrany podczas wdrażania usług Cognitive Services w witrynie Azure Portal.Azure resource Region: the region you choose during deploying Cognitive Services in Azure Portal.
  • Klucz interfejsu API: klucz otrzymany po pomyślnym wdrożeniu usług Cognitive Services w witrynie Azure Portal, zalecany jest klucz 2.

Baidu OCR

Ten jest również płatnym API z bezpłatnym przydziałem dostarczonym przez Baidu.

Baidu OCR obsługuje 10 języków, w tym

  • Połączenie chińskiego i angielskiego
  • Angielski
  • Portugalski
  • Francuski
  • Niemiecki
  • Włoski
  • Hiszpański
  • Rosyjski
  • Japoński
  • Koreański

Ten silnik może również uzyskać pozycję każdej postaci

Poniżej opisane zostały jego ustawienia:

  • Śledzenie lokalizacji każdego znaku pomaga sprawniej posługiwać się różnymi niedostępnymi aplikacjami. Włączenie tej opcji nieco spowolni rozpoznawanie.

  • Użyj dokładnego interfejsu API: jeśli jest włączony, będzie używany inny punkt końcowy. Ten dokładny punkt końcowy zajmuje więcej czasu, ale ma wyższą jakość i (jeśli używasz własnego klucza API, jego cena jest również wyższa).

Silnik posiada cztery punkty docelowe z oddzielnymi kwotami wywołań.

  • Podstawowy OCR bez żadnych informacji o lokalizacji tekstu. Obecnie 50000 razy dziennie.
  • Podstawowy OCR z informacjami o lokalizacji tekstu. Obecnie 500 razy dziennie.
  • Dokładne OCR bez informacji o lokalizacji tekstu. Obecnie 500 razy dziennie.
  • Dokładne informacje o lokalizacji tekstu. Obecnie 50 razy dziennie.

Jeśli naciśniesz gest, który odczytuje tylko wynik, używasz punktów końcowych bez żadnych informacji o lokalizacji tekstu.

Jeśli naciśniesz gest, który pokazuje przeglądarkę wyników, używasz punktów końcowych z informacjami o lokalizacji tekstu.

Chociaż ten silnik oferuje dość dużą kwotę darmowych wywołań, jego strona jest napisana jedynie po chińsku, a ponadto nie jest zbyt dostępna.

Tencent AI OCR

Ten interfejs API może być używany z ograniczeniem częstotliwości do dwóch zapytań na sekundę.

Jeśli chcesz ominąć limit, możesz zarejestrować własny klucz API. Strona internetowa tego API jest tylko chińska i nie jest całkiem dostępna.

W dokumencie nie ma informacji o obsłudze języków. Według mojego testu chiński i angielski i ich mieszanka jest obsługiwana.

Nie ma dodatkowej konfiguracji dla tego interfejsu API.

Lista zmian

0.19

  • Kompatybilny z NVDA 2020.2
  • Dodaj silnik OCR Tencent Cloud sponsorowany przez [Tencent Cloud] (https://intl.cloud.tencent.com) i [Aceessibility Research Association] (http://www.siaa.org.cn)
  • Usunięto niedostępne Sougou OCR i Machine Learning Engine autorstwa Olivera Edholma.
  • Napraw publiczny punkt końcowy na NVDA China Site

0.18

  • Kompatybilny z python3
  • Wprowadź pojęcie typu źródła rozpoznawania i typu silnika, aby zmniejszyć użycie gestów.
  • Dodaj nowy nieprzypisany gest, aby przełączać się między różnymi typami źródeł rozpoznawania.
  • Dodaj nowy nieprzypisany gest, aby przełączać się między różnymi typami aparatu rozpoznawania.
  • Dodaj nowy gest do rozpoznania zgodnie z ustawieniem źródła obrazu i typu silnika.
  • Dodaj nowy nieprzypisany gest, aby wyświetlić poprzedni wynik w wirtualnym dokumencie wyników.

0.17

  • Naprawiono następujące problemy:

    • Przejdź bezpośrednio do panelu po przełączeniu do onlineImageDescriber w oknie dialogowym ustawień
    • Naprawianie nieprawidłowego opisu w analizatorze platformy Azure

0.16

  • Dodawanie gestu rozpoznawania anulowania
  • Naprawiono następujące problemy:

    • Zmiana stanu CheckListBox nie została ogłoszona
    • Zamień efekt powtarzającego się gestu niedziałającego w opisywaczu obrazu online

0.15

  • Dodawanie opcji wyświetlania okna zawierającego wiadomość zamiast mowy lub wiadomości brajlowskiej dla wyników tekstowych
  • Zamieniono pola wyboru z cechami wizualnymi w Microsoft Azure Image Analyzer na listę pól wyboru.
  • Naprawiono następujące problemy:

    • Nie można załadować pliku obrazu jpg ze schowka
    • Po rozpoznaniu nie pojawia się wiadomość z wynikiem.
    • Pozycja obiektów w wyniku jest niedokładna, jeżeli obraz był wewnętrznie zmniejszany.
    • Wynik z Microsoft Azure Image Describer jest podany w jednej linii, co utrudnia nawigowanie po nim.

0.14

  • Naprawiono kilka błędów:

    • Nie można użyć własnego klucza interfejsu API w aparatach platformy Microsoft Azure
    • Nie można uzyskać wyniku tekstowego, jeśli istnieje wyświetlacz brajlowski

0.13

  • Upewnij się, czy dodatek działa po przeładowaniu wtyczek bez restartu (NVDA+Control+F3).

0.12

  • Naprawiono komunikat trybu przeglądania w programie Microsoft Azure Image Describer
  • Kolor akcentowy jest od teraz przedstawiany w opisach kolorów NVDA.
  • Ulepszony format wyników analizatora obrazów Microsoft Azure
  • Ulepsz dokument zgodnie z komentarzami do recenzji
  • Naprawiono niekonsekwencję w poleceniach.
  • Control+Shift+NVDA dla schowka i NVDA+ALT dla obiektu nawigatora
  • Dodano brakujący komunikat błędu informacji o obrazie podczas rozpoznawania.

0.11

  • Dodano możliwość opisu obrazu
  • Zmień podsumowanie dodatku na opis obrazu online

0.10

  • Napraw błąd przy użyciu własnego klucza API użytkownika w sougou API.
  • Napraw nieznany problem z panelem, dodając ustawienia do obsługiwanych ustawieńUstawienia

0.9

  • Naprawiono problem, przez który nie działało dwukrotne naciśnięcie polecenia.
  • Sprawdzono dokumentację aby uwzględnić zmiany w kodzie.
  • Wyjaśniono, jaki rodzaj obrazu schowka jest obsługiwany i jak skopiować obraz do rozpoznania.
  • Naprawiono problem, przez który nie było można otworzyć przeglądu wyniku po rozpoznaniu obrazu ze schowka.
  • Dodano obsługę rozpoznawania skopiowanej ścieżki lokalnego pliku obrazu w schowku.

0.8

  • Dodano przyjazne powiadomienie gdy wynik rozpoznawania jest pusty.
  • Naprawiono inne miejsce nie działa dobrze ze ścieżką konfiguracji non ascii

0.6

  • Dodano ustawienia proxy dla osób z dostępem do Internetu za określonym serwerem proxy.
  • Dodano kilka opcji ogólnych.
  • Naprawiono błąd dekodowania Unicode spowodowany przesyłaniem adresów URL w Unicode do urllib3.

0.5

  • Naprawiono błąd Unicode powstający gdy silnik OCR przesyła plik obrazu bezpośrednio, zamiast dekodowania base64.
  • Change gesture of recognizing clipboard to Control+Shift+NVDA+R since NVDA+Shift+R is used in Word and Excel to define row headers in tables, or to delete the definitions when pressed twice.

0.4

  • Napraw błąd instalacji, gdy ścieżka konfiguracji zawiera znaki inne niż ascii
  • Zmieniono polecenie aby uniknąć konfliktu z dodatkiem golden cursor.
  • Zmieniono domyślny silnik rozpoznawania na Microsoft azure, ponieważ potrafi on automatycznie wykrywać język tekstu.

0.3

  • Dodaj szczegółową dokumentację dotyczącą sposobu uzyskiwania klucza interfejsu API usługi Microsoft Azure OCR
  • Naprawiono problem z nową instalacją.
  • Usunięto automatyczne OCR, ponieważ ta funkcja jest problematyczna i może mylić z silnikami online. Auto OCR będzie osobnym dodatkiem, gdy będzie wystarczająco stabilny.