Çevrimiçi Nesne Betimleyici

Bu eklenti, NVDA'ya çevrimiçi görüntü tanıma motorları eklemeyi amaçlamaktadır.

İki tip motor vardır. OCR ve görüntü betimleyici.

OCR, görüntüden metin çıkarır.

Görüntü betimleyici, genel açıklama, renk türü, yer işaretleri vb. gibi görüntüdeki görsel özellikleri metin biçiminde betimler.

Bu eklentiyi kullanmak için İnternet bağlantısı gereklidir, çünkü görüntü betimleme hizmetleri İnternet'teki API uç noktaları tarafından sağlanır.

Bu eklentide bunlara motor denir.

Bu eklenti için üç tür motor vardır.

  • Çevrimiçi OCR motoru
  • Çevrimiçi görüntü betimleme motoru
  • Windows 10 OCR motoru (çevrimdışı)

Ayrıca tanıma görüntüsünün kaynağını da seçmeniz gerekir.

  • Geçerli gezgin nesnesi
  • Geçerli ön plan penceresi
  • tüm ekran
  • Panodan görüntü verileri veya dosya
  • Image file pathname or image url from clipboard

klavye komutları

Bu türleri seçtikten sonra tek hareketle tanımaya başlayabilirsiniz. \n

NVDA+Alt+P Kaynağa ve motor tipi ayarına göre tanıma gerçekleştirir, Ardından sonucu okur. İki kez basılırsa sanal bir sonuç belgesi açar.

Atanmamış dört ek hareket vardır. Lütfen kullanmadan önce bunları atayın.

Farklı tanıma motoru türleri arasında geçiş yap.

Farklı tanıma kaynağı türleri arasında geçiş yap.

Geçerli tanımayı iptal et

Bu hareket, çok uzun süre beklediğinizi düşünüyorsanız ve iptal etmek istiyorsanız faydalı olabilir.

Ayrıca bazen tanıma başladıktan sonra gelen bazı mesajları gözden geçirmeniz gerektiğinden tanıma mesajı tarafından rahatsız edilmek istemezsiniz.

Önceki sonucu sanal bir sonuç belgesinde göster.

Sonucu panoya kopyalama özelliği olsa da. Karakter konum bilgisi korunamaz, bu nedenle bu sorunu çözmek için bu hareket eklenmiştir.

Ayrıca, önceki sürümlerde hareketleri tercih eden kullanıcılar için atanmamış dört eski hareket vardır. \n

Yeni hareket kullanmanız ve ihtiyacınıza göre motor türünü değiştirmeniz önerilir.

Mevcut gezgin nesnesini çevrimiçi OCR motoruyla tanır Ardından sonucu okur. İki kez basılırsa sanal bir sonuç belgesi açar.

Çevrimiçi OCR motoruyla panodaki görüntüyü tanır. Ardından sonucu okur. İki kez basılırsa sanal bir sonuç belgesi açar.

Geçerli gezgin nesnesini tanır Ardından sonucu okur. İki kez basılırsa sanal bir sonuç belgesi açar.

Panodaki görüntüyü tanır. Ardından sonucu okur. İki kez basılırsa sanal bir sonuç belgesi açar.

Motor Yapılandırması

NVDA ayarları iletişim kutusundaki *Çevrimiçi Görüntü Betimleyici * kategorisinde tanıma motorlarını seçebilir ve bunları ayrıntılı olarak yapılandırabilirsiniz.

Eklentinin yazarı, ücretsiz API kotasına sahip bir hesaba kaydoldu ve bu eklentinin ilk başta test edilmesini kolaylaştırmak için www.nvdacn.com'da bir proxy sunucusu kurdu. Test kotası sınırlıdır ve herhangi bir zamanda API sağlayıcısı tarafından iptal edilebilir.

Her motordaki kılavuza göre kendi anahtarınızı kaydetmeniz şiddetle tavsiye edilir.

Aşağıdaki ayarlar tüm motorlar için geçerlidir.

  • Tanıma sonucunu panoya kopyala: etkinleştirilirse, tanıma sonucu metni tanımadan sonra panoya kopyalanır.
  • Metin sonucu için göz atılabilir mesajı kullan: etkinleştirilirse, konuşma veya braille mesajı yerine bir açılır pencerede tanıma sonucu metni gösterilecektir.
  • tekrarlı hareketin etkisini tekrarlı olmayanlarla değiştir: varsayılan olarak, sanal bir sonuç belgesi yalnızca ilgili harekete iki kez basarsanız gösterilir, bunu sık kullanıyorsanız bu seçeneği etkinleştirebilirsiniz, böylece sonuç görüntüleyicide bir mesaj almak için yalnızca bir kez basmanız yeterli olur.
  • Hata ayıklama amacıyla daha ayrıntılı günlük kaydını etkinleştir: bazı günlükler hata ayıklama için gereklidir ancak performansı etkiler ve çok yer kaplar. Bunu yalnızca eklenti yazarı veya bir NVDA geliştiricisi tarafından özellikle talimat verildiyse açın.
  • Proxy türü: hangi tür proxy kullanıyorsunuz. Proxy'nin ne olduğunu bilmiyorsanız, olduğu gibi bırakın.
  • Proxy adresi: proxy'nizin tam URL'si. Proxy'nin ne olduğunu bilmiyorsanız, olduğu gibi bırakın. Proxy kullanmayı seçerseniz, proxy'niz kaydetmeden önce doğrulanacak, doğrulamadan sonra size sonucu bildiren bir istem olacaktır.

Aşağıdaki ayarlar tüm motorlarda aynı anlama gelir, yerden tasarruf etmek için bunları burada açıklayın.

  • API Erişim Türü: bu, ilgili API uç noktalarına nasıl erişeceğinizi kontrol eder.

    • "Genel kotayı kullan"ı seçerseniz, eklenti yazarı tarafından kayıtlı bir hesapta ücretsiz kota kullanıyorsunuz demektir.
    • "Kendi API anahtarınızı kullanın"ı seçerseniz, bu eklenti kendi hesabınızdan kota kullanır.
  • APP Kimliği, API anahtarı veya API Gizli Anahtarı: Kendi hesabınızdan kota kullanmak istiyorsanız, ilgili erişim belirteçleri gereklidir. Bazı motorlar yalnızca API anahtarına ihtiyaç duyar. Bazı motorlar iki jeton gerektirir. Bunlar yalnızca API Erişim türünde "kendi API anahtarınızı kullan" seçeneğini belirlediğinizde geçerlidir.

Sonuçların kalitesinin ve doğruluğunun birçok faktörden etkilendiğini unutmayın.

  • Motor sağlayıcısı tarafından kullanılan modeller ve teknikler
  • Yüklenen görüntünün kalitesi
  • Gezgin nesnesi başka bir şeyin arkasına mı gizlenmiş?
  • Ekran çözünürlüğü

Çevrimiçi resim betimlemesi

Burada üç motor mevcuttur.

Microsoft Azure Görüntü Çözümleyicisi

Bu motor, görüntü içeriğine dayalı olarak zengin bir görsel özellikler kümesi çıkarır. \n

Bu motor sadece ingilizcedir. Başka dillerde betimleme istiyorsanız, Microsoft Azure Image betimleyiciyi kullanabilirsiniz.

Görsel Özellikler şunları içerir:

  • Yetişkin - görüntünün pornografik olup olmadığını algılar (çıplaklığı veya seks eylemini gösterir). Müstehcen içerik de tespit edilir.
  • Markalar - yaklaşık konum da dahil olmak üzere bir görüntüdeki çeşitli markaları algılar. Markalar bağımsız değişkeni yalnızca İngilizce olarak mevcuttur.
  • Categories - categorizes image content according to a taxonomy defined in documentation.
  • Renk - vurgu rengini, baskın rengi ve görüntünün siyah beyaz olup olmadığını belirler.
  • Betimleme - desteklenen dillerde tam bir cümle ile görüntü içeriğini betimler.
  • Yüzler - yüzlerin olup olmadığını algılar. Varsa, koordinatları, cinsiyeti ve yaşı gösterir.
  • Görüntü Tipi - görüntünün küçük resim mi yoksa çizgi çizimi mi olduğunu algılar.
  • Nesneler - yaklaşık konum da dahil olmak üzere bir görüntüdeki çeşitli nesneleri algılar. Nesneler bağımsız değişkeni yalnızca İngilizce olarak mevcuttur.
  • Etiketler - resmi, resim içeriğiyle ilgili ayrıntılı bir kelime listesiyle etiketler.

Bazı özellikler ayrıca ek ayrıntılar sağlar:

  • Ünlüler - resimde tespit edilirse ünlüleri tanımlar.
  • Önemli yerler - görüntüde algılanırsa önemli yerleri tanımlar.

Microsoft Azure Görüntü Betimleyici

Bu motor, insan tarafından okunabilir bir dilde tam cümlelerle bir görüntünün tanımını oluşturur. Betimleme , işlem tarafından da döndürülen bir içerik etiketleri koleksiyonuna dayanır.

Her görüntü için birden fazla betimleme oluşturulabilir. Betimlemeler , güven puanlarına göre sıralanır.

Bu motor için iki ayar vardır.

  • Dil: hizmetin görüntünün betimlemesini döndüreceği dil. Varsayılan olarak İngilizcedir.
  • Maksimum Aday: döndürülecek maksimum aday betimleme sayısı. Varsayılan 1'dir.

Çevrimiçi OCR

Çevrimiçi motorlar, aşağıdaki hizmetlerin kullanımına ve varlığına dayanır.

https://www.nvdacn.com

https://ocr.space/ocrapi

https://azure.microsoft.com/en-us/services/cognitive-services/

http://ai.qq.com

http://ai.baidu.com

http://ai.sogou.com/

https://intl.cloud.tencent.com

motorlar

Beş motor mevcuttur.

Tencent Bulut OCR'si

Bu API, günde 15000 kota ile Tencent Cloud ve Aceessibility Research Association tarafından desteklenmektedir.

Bu motor 19 dili destekler.

  • Çince-İngilizce karışımı
  • Japonca
  • Korece
  • İspanyolca
  • Fransızca
  • Almanca
  • Portekize
  • Viyetnamca
  • Malayca
  • Rusça
  • İtalyanca
  • Flemenkçe
  • İsveççe
  • Fince
  • Danimarkaca
  • Norveççe
  • Macarca
  • Tayca
  • Latince

İşte bu motorun ayarları.

  • Dil: Tanıma için metin dili. Varsayılan olarak otomatik algılar.

OCR alanı

Bu, OCR Space tarafından sağlanan ücretsiz kotaya sahip ücretli bir API'dir.

24 dili destekler

  • Arapça
  • Bulgarca
  • Basitleştirilmiş Çince
  • Geleneksel Çince
  • Hırvatça
  • Çekce
  • Danimarkaca
  • Flemenkçe
  • İngilizce
  • Fince
  • Fransızca
  • Almanca
  • Yunanca
  • Macarca
  • Korece
  • İtalyanca
  • Japonca
  • Lehçe
  • Portekize
  • Rusça
  • Slovence
  • İspanyolca
  • İsveççe
  • Türkçe

İşte bu motor için ayarlar:

  • Dil: tanıma için metin dili. Varsayılan olarak İngilizcedir.
  • Görüntü yönünü algıla: doğru olarak ayarlanırsa API, görüntüyü doğru şekilde otomatik olarak döndürür.
  • Daha iyi kalite için görüntüyü ölçeklendir: doğru olarak ayarlanırsa API bazı dahili yükseltmeler yapar. Bu, özellikle düşük çözünürlüklü PDF taramaları için OCR sonucunu önemli ölçüde iyileştirebilir.
  • Tablo tanıma için optimize et: doğru olarak ayarlanırsa, OCR mantığı, ayrıştırılan metin sonucunun her zaman satır satır döndürülmesini sağlar. Bu anahtar, tablo OCR, makbuz OCR, fatura işleme ve tablo benzeri bir yapıya sahip diğer tüm girdi belgeleri için önerilir.

Kendi anahtarınızı kullanmak istiyorsanız, API Anahtarını da belirtmeniz gerekir.

OCR alanına kaydolarak kendi ücretsiz API anahtarınızı alabilirsiniz.

İşte basit bir kılavuz.

"Ücretsiz API anahtarı için kaydolun" bağlantısını bulun

Üzerine tıkladığınızda doldurulacak bir form bulacaksınız.

Form sizden aşağıdaki verileri girmenizi ister

  • İleti adresi
  • Ad
  • Soyad
  • OCR API'sini nasıl kullanmayı planlıyorsunuz?

Doldurup gönderdikten sonra, Ayrıca bir captcha'yı geçmeniz gerekecektir.

Ardından bir onay e-postası alacaksınız

"Evet, beni bu listeye abone et" adlı bağlantıyı bulun. o e-postada. Bu bağlantıya erişin ve yakında e-posta ile API anahtarını alacaksınız.

Microsoft Azure OCR'si

Bu motor, Microsoft Azure Bilişsel Hizmetler Computer Vision'da OCR API'sini kullanır.

Şunlar dahil olmak üzere 24 dili destekler.

  • Basitleştirilmiş Çince
  • Geleneksel Çince
  • Çekce
  • Danimarkaca
  • Flemenkçe
  • İngilizce
  • Fince
  • Fransızca
  • Almanca
  • Yunanca
  • Macarca
  • İtalyanca
  • Japonca
  • Korece
  • Norveççe
  • Lehçe
  • Portekize
  • Rusça
  • İspanyolca
  • İsveççe
  • Türkçe
  • Arapça
  • Rumence
  • Sırp Kirilce
  • Sırp Latince
  • Slovakça

İşte bu motor için ayarlar:

  • Dil: tanıma için metin dili. Varsayılan olarak otomatik algılar.
  • Görüntü yönünü algıla: doğru olarak ayarlanırsa API, görüntüyü doğru şekilde otomatik olarak döndürür.

Kendi anahtarınızı kullanıyorsanız, aşağıdaki bağlantıdan Microsoft Computer Vision API'yi kullanmak için bir abonelik anahtarı almalısınız:

  1. Adım: Azure web sitesinde bir hesap oluşturun

Lütfen anahtarın Computer Vision API için oluşturulması gerektiğini unutmayın. Bu, Tek tuş dolaşımında karşılaştığınız ilk "API anahtarı AL" düğmesidir. Şu anda Microsoft, 7 günlük bir deneme anahtarı oluşturma seçeneği sunmaktadır. Ayrıca daha fazla iz için ücretsiz bir Azure hesabına kaydolabilirsiniz. Kaydolmak için bir kredi kartı gerekir. Zaten bir abonelik hesabınız varsa, bu adımı atlayabilirsiniz.

  1. Adım: Bilişsel Hizmetleri Dağıtın

Artık bir Azure hesabınız var. \n

Öncelikle Azure Portal içinde oturum açın

Azure portal oturumunuz açık olan Portal is Ready mesajını alana kadar bekleyin.

Find the link called All resources after All services button and activate it.

Blade Tüm kaynaklar hazır mesajını alana kadar bekleyin, odağınız bir düzenleme kutusunda olacaktır, ardından Shift+taba basın, ekle adlı bir menü öğesi bulun ve etkinleştirin.

Market alanında Ara mesajını alana kadar bekleyin, Bilişsel Hizmetler yazın ve aşağı oka basın.

Beş seçenekten biri olan Bilişsel Hizmetler listesi mesajını alana kadar bekleyin, ardından enter tuşuna basın.

Blade Cognitive Services hazır mesajını alana kadar bekleyin, tab veya b düğmesine basarak Oluştur adlı bir düğmeyi bulun ve etkinleştirin.

Blade Create hazır mesajını alana kadar bekleyin, odağınız bir yazma alanında olacaktır. Bu kaynak için bir ad yazın. Kaynak adınızın yalnızca alfasayısal karakterler, '', '-' içerebileceğini ve '' veya '-' ile bitemeyeceğini unutmayın.

NVDA_OCR'yi seçiyorum.

Abonelik seçim kutusuna gitmek için sekmeye basın. Genellikle olduğu gibi bırakabilirsiniz.

Konum seçim kutusuna gitmek için sekmeye basın. Bulunduğunuz yere yakın bir tane seçin. \n

Motor konfigürasyonunda konum gerektiğinden bunu hatırladığınızdan emin olun.

Fiyatlandırma bağı seçim kutusuna gitmek için sekmeye basın. Genellikle F0 gibi ücretsiz bir bağ yeterlidir. Bu yeterli değilse, tüm fiyatlandırma ayrıntılarını görüntüle bağlantısındaki tüm fiyatlandırma ayrıntılarını okuduktan sonra başka bir katman seçebilirsiniz.

Yeni Kaynak grubu oluştur düzenleme kutusuna gitmek için sekmeye basın. Herhangi bir Kaynak grubunuz yoksa bir tane oluşturmalısınız. Yeni oluştur düğmesini bulmak için sekmeye basın. \n

Then press tab go to Create Button to create this resource.

Dağıtım başarılı mesajını alana kadar bekleyin.

Ardından Kaynağa git düğmesini bulun, bazen Kaynağa git düğmesini bulabilmeniz amacıyla Bildirimler düğmesini etkinleştirmek için yukarı gitmeniz gerekir.

Blade Quick Start meşgul mesajını alana kadar bekleyin.

Anahtarlar adlı bağlantıyı bulun, ardından etkinleştirin.

Blade Manage anahtarları hazır mesajını alana kadar bekleyin.

Anahtar 1 veya anahtar 2 adlı yazma alanını bulun. Bu yazma alanının içeriği, motor yapılandırmasında gereken API anahtarıdır. Motor yapılandırması için kopyalamak için Ctrl-C'ye basın

Ardından, kendi API anahtarınızı kullanıyorsanız gerekli olan bu iki ayarı doldurabilirsiniz.

  • Azure kaynak Bölgesi: Azure Portal'da Bilişsel Hizmetleri dağıtırken seçtiğiniz bölge.
  • API key: the key you get after successfully deploying Cognitive Services in Azure Portal, KEY 2 is recommended.

Baidu OCR

This one is also a paid API with free quota provided by Baidu.

Baidu OCR, şunlar dahil olmak üzere 10 dili destekler

  • Çince ve İngilize karışık
  • İngilizce
  • Portekize
  • Fransızca
  • Almanca
  • İtalyanca
  • İspanyolca
  • Rusça
  • Japonca
  • Korece

Bu motor ayrıca her karakterin pozisyonunu alabilir

İşte ayarları:

  • Her karakterin konumunu al, erişilebilir olmayan bazı uygulamalarda daha hassas işlem yapmanızı sağlar. Bunu etkinleştirmek, tanımayı biraz yavaşlatacaktır.

  • Doğru API Kullan: etkinleştirilirse farklı bir uç nokta kullanılır. Bu doğru uç nokta daha uzun zaman alır ancak daha yüksek kaliteye sahiptir ve (Kendi API anahtarınızı kullanırsanız fiyatı da daha yüksektir).

Ayrı kota sınırına sahip dört uç noktası vardır.

  • Metin konumu hakkında herhangi bir bilgi olmadan temel OCR. Şu anda günde 50000 OCR.
  • Metin konumu hakkında bilgi içeren temel OCR. Şu anda günde 500 OCR.
  • Metin konumu hakkında herhangi bir bilgi olmadan doğru OCR. Şu anda günde 500 OCR.
  • Metin konumu hakkında bilgi ile doğru. Şu anda günde 50 OCR.

Yalnızca sonucu oku hareketine basarsanız, metin konumu hakkında herhangi bir bilgi olmadan uç noktaları kullanmış olursunuz. \n

Sonuç görüntüleyiciyi göster hareketine basarsanız, metin konumu hakkında bilgi içeren uç noktaları kullanmış olursunuz. \n

Oldukça cömert bir ücretsiz kota sağlasa da, web sitesi yalnızca Çince'dir ve tam olarak erişilebilir değildir.

Tencent AI OCR'si

Bu API, saniyede yaklaşık iki sorgu sıklık sınırıyla kullanmak şartıyla ücretsizdir. \n

Sınırı ortadan kaldırmak istiyorsanız, kendi API anahtarınızı kaydedebilirsiniz. Bu API'nin web sitesi yalnızca Çince'dir ve tam olarak erişilebilir değildir.

Belgede dil desteği hakkında bilgi yok. Testime göre Çince ve İngilizce ve bunların karışımı destekleniyor. \n

Bu API için ek yapılandırma yok.

Değişim günlükleri

0.19

0.18

  • python3 ile uyumluluk
  • Hareket kullanımını azaltmak için tanıma kaynağı türü ve motor türü kavramını getirdi.
  • Farklı tanıma kaynağı türleri arasında geçiş yapmak için atanmamış yeni bir hareket eklendi.
  • Farklı tanıma motoru türleri arasında geçiş yapmak için atanmamış yeni bir hareket eklendi.
  • Görüntü kaynağına ve motor tipi ayarına göre tanımak için yeni bir hareket eklendi.
  • Bir sanal sonuç belgesinde önceki sonucu göstermek için atanmamış yeni bir hareket eklendi.

0.17

  • Aşağıdaki sorunlar düzeltildi:

    • Ayarlar iletişim kutusunda Çevrimiçi Görüntü Betimleyiciye geçtiğinizde doğrudan panele atlama
    • Azure çözümleyicisinde yanlış betimleme düzeltildi

0.16

  • tanımayı iptal etme hareketi eklendi
  • Aşağıdaki sorunlar düzeltildi:

    • İşaretleme listesinde durum değişikliği artık belirtilmiyor
    • Çevrimiçi görüntü betimleyicide tekrarlanan hareketin etkisini değiştirme çalışmıyordu

0.15

  • Metin sonuçları için konuşma veya braille mesajı yerine mesaj içeren bir pencere açma seçeneği eklendi
  • Microsoft Azure görüntü çözümleyicideki görsel özellikler için onay kutuları onay kutusu listesi olarak değiştirildi.
  • Aşağıdaki sorunlar düzeltildi:

    • Cannot load jpg image file from clipboard
    • Sonuç belge nesnesi, tanımadan sonra görünmüyor.
    • Görüntü dahili olarak yeniden boyutlandırılırsa, sonuç belge nesnelerindeki konum güvenilir değil.
    • Microsoft Azure görüntü betimleyicinin sonucu, gezinmeyi zorlaştıran aynı satırda yer alıyor.

0.14

  • Bazı hatalar düzeltildi:

    • Microsoft Azure motorlarında kendi API anahtarınızı kullanamazsınız
    • Braille ekran varsa metin sonucu alınamıyor

0.13

  • Eklentileri yeniden başlatmadan yeniden yüklerken eklentinin çalıştığından emin olun (NVDA+Control+F3)

0.12

  • Microsoft Azure görüntü betimleyicinin sabit göz atma modu mesajı onarıldı
  • Vurgu rengi artık NVDA renk açıklamaları olarak temsil ediliyor.
  • Microsoft Azure görüntü çözümleyicinin geliştirilmiş sonuç biçimi
  • İnceleme yorumlarına göre belge iyileştirildi
  • hareket tutarsızlığı onarıldı.
  • Pano için Control+Shift+NVDA, gezgin nesnesi için NVDA+ALT
  • Tanıma sırasında eksik imageInfo hatası düzeltildi.

0.11

  • resim betimleme özelliği eklendi
  • Eklenti özeti çevrimiçi resim betimleyici olarak değiştirildi

0.10

  • Sougou API'sinde kullanıcının kendi API anahtarını kullanma hatası düzeltildi.
  • desteklenen ayarlara ekleme yapılarak bilinmeyen panel sorunu düzeltildi

0.9

  • Çift basma hareketinin etki yaratmama sorunu düzeltildi.
  • Koddaki değişiklikleri yansıtmak için gözden geçirilmiş belge.
  • Ne tür bir pano görüntüsünün desteklendiği ve tanıma için görüntünün nasıl kopyalanacağı açıklığa kavuşturuldu.
  • Pano tanımanın sonuç görüntüleyici sorununu açamaması sorunu düzeltildi.
  • Panoda kopyalanan yerel görüntü dosyası yolunu tanımak için destek eklendi.

0.8

  • Tanıma sonucu boşsa bunu gösteren bir uyarı eklendi
  • başka bir yer, ascii olmayan yapılandırma yolu ile iyi çalışmama sorunu düzeltildi

0.6

  • Belirli bir proxy arkasından İnternet erişimi olan kişiler için proxy ayarları eklendi.
  • Birkaç genel seçenek eklendi.
  • Unicode URL'sinin urllib3'e gönderilmesinden kaynaklanan Unicode kod çözme hatasını düzeltildi.

0.5

  • OCR motoru görüntü dosyasını base64 kodlaması yerine doğrudan yüklerse Unicode hatası alınması düzeltildi.
  • NVDA+Shift+R, Word ve Excel'de tablolarda satır başlıklarını tanımlamak veya iki kez basıldığında tanımları silmek için kullanıldığından, pano tanıma hareketi Control+Shift+NVDA+R olarak değiştirildi.

0.4

  • Yapılandırma yolu ascii olmayan karakterler içerdiğinde yükleme hatası alınması düzeltildi
  • Altın imleçle çakışmayı önlemek için hareket değiştirildi.
  • Metin dilini otomatik olarak algılayabildiği için varsayılan motor Microsoft Azure olarak değiştirildi.

0.3

  • Microsoft Azure OCR'nin API anahtarının nasıl alınacağına ilişkin ayrıntılı bilgiler eklendi
  • Yeni kurulumla ilgili sorun düzeltildi.
  • Bu özellik sorunlu olduğundan ve çevrimiçi motorlarla karıştırılabileceğinden otomatik OCR kaldırıldı. Otomatik OCR, yeterince kararlı olduğunda ayrı bir eklenti olacaktır.