Optik Karakter Tanıma'nın Dezavantajları Nelerdir?

Optik karakter tanıma taramasının temel dezavantajı, taranan bir belgeye hatalar sokma potansiyelidir. Hiçbir OCR tarama sistemi yanılmaz ve düşük kaliteli belgeler uzun ve zaman gerektirecek kadar hata yaratabilir yeniden okuma tüketimini kullanıyor. El yazısı ve Latince olmayan fontların düzgün taranması özellikle zordur.

Optik tarayıcılar, karakterlerle arka plan arasında belirgin bir kontrast bulunmayan belgelerde de sorun yaşayabilir. Kirli sayfalar veya renkli bir forma basılan sayfalar tarayıcının kafasını karıştırabilir ve büyük okunmamış metin bloklarına neden olabilir. Düşük kaliteli orijinalleri OCR taraması için uygun hale getirmek için gerekli olan ilave adımlar, teknolojinin sunduğu potansiyel zaman tasarrufunu tamamen telafi edebilir.

OCR taramasının mümkün olduğunca doğru ve hızlı olmasını sağlamanın en iyi yolu, orijinal belgeyi özel olarak optik tarama için tasarlamaktır. Örneğin, birçok OCR paketi, sıfır rakamı ve O harfi gibi benzer karakterler arasında ayrım yapmakta zorluk çeker. OCR dostu fontlar, bu iki karakterin belgeyi okumasına yardımcı olmak için mümkün olduğunca farklı görünmesini sağlar.

El yazısı ile yazılmış belgeler düzgün taramayı sağlamak için harfler arasında eşit ve net boşluk bırakılmasını gerektirir. Bu nedenle OCR teknolojisini kullanan formlar, kullanıcıların bir dizi kutu içerisine büyük harflerle basmalarını gerektirir. Her bir ayrı kutu daha sonra ayrı ayrı taranabilir ve bilgisayarın birlikte çalışan harfleri yanlış okumasını önler.