OCR ile Metinleri Yakalamak
Basılı bir sayfa üzerindeki metinleri, tarayıcı ve OCR yazılımıyla bilgisayarınıza aktarabilirsiniz.
Bazen, basılı bir sayfa üzerindeki metinleri bilgisayar ortamına geçirmeniz gerekebilir. Ancak bu işlem için herşeyi baştan yazmak zorunda değilsiniz. OCR programları, tüm metni kısa süre içerisinde metin dosyası haline dönüştürebilirler.
OCR, "Optical Character Recognition" (optik karakter tanıma) teriminin kısaltmasıdır ve basılı bir sayfa üzerindeki metnin, klavye yardımıyla yazılmasına gerek kalmadan, kısa süre içerisinde elektronik bir metin dosyası formatına çevrilmesi anlamına gelir. Bir metnin OCR programı ile tanınması ve metin dosyası haline dönüştürülmesi, doğal olarak baştan yazılmasından çok daha kolaydır. En hızlı sekreter bile, dakikada maksimum 500 - 600 karakter yazabilir. Basılı bir metnin taranması ve elektronik formatta yeniden düzenlenmesi için gerekli olan zaman ise, baştan yazılmasına oranla en azından 40 kat daha kısadır. OCR teknolojisi sadece düz metinler için değil; aynı zamanda rakamlar ve özel semboller içeren tabloların dosya haline getirilmesi için de kullanılabilir. OCR teknolojisinin sunduğu avantajlardan yararlanmak istiyorsanız, öncelikle ortalama bir tarayıcıya ve özel bir OCR programına ihtiyacınız olacak. Eğer tarayıcınızla birlikte gelen CD'lere dikkatli bir biçimde göz atarsanız, bu CD'lerin içerisinde bir OCR programının bulunduğunu görebilirsiniz.
Ancak OCR yazılımlarını kullanabilmek için mutlaka bir tarayıcıya sahip olmanıza da gerek yok. Eğer bilgisayarınızda bir metin parçası içeren resim dosyaları varsa, bu dosyalar üzerindeki metinleri de metin dosyası haline dönüştürebilirsiniz. Yani OCR yazılımlarının görevi, aslında resim dosyalarındaki metinleri metin dosyasına dönüştürmekten başka bir şey değildir. Tarayıcı ise, basılı bir sayfanın resim dosyası olarak kaydedilmesi görevini üstlenir.
OCR Programları Nasıl Çalışır?
OCR PROGRAMLARI NASIL ÇALIŞIR?
Peki ama OCR programları nasıl bir sistemle çalışıyorlar? Tarayıcı, genellikle bilgisayarın "gözü" olarak tanımlanmaktadır; kağıt üzerine basılı bir resmi okuyabilecek yeteneğe sahip bir göz... Ancak bir metinden bahsedildiğinde, tarayıcı da bunu yalnızca beyaz fon üzerinde siyah noktalar topluluğu olarak algılar. Bu noktalar topluluğunu metne dönüştürmek ise OCR programlarının görevidir.
Başka bir deyişle OCR programları, siyah piksel topluluğu olarak temsil edilen harfleri "okuyabilecek" beceridedirler. Bir OCR programı, her şeyden önce sayfayı satırlara böler ve her bir kelimeyi diğerinden ayırarak sayfayı analiz eder. Analiz sırasında harflerin yapısal karakterleri, yükseklikleri ve genişlikleri değerlendirilir. Programın kendi bilgi deposu, her bir karakter için tanımlanmış çeşitli parametrelerle doludur. Algılanan pikseller bu parametrelerden birisine uygun ise, harfin ortaya çıkması mümkün hale gelir.
OCR programlarının son sürümleri, hemen her türlü karakteri yakalayabilecek seviyededirler. Ancak bu noktada devreye, analiz edilen resim dosyasının kalitesi girecektir. Metinleri içeren resim dosyası çok kaliteli bir görüntü sunmayı başarabilirse, ortaya çıkan metnin içerisindeki hatalar da büyük oranda azalır.
OCR Programları Nasıl Kullanılır?
OCR PROGRAMLARI NASIL KULLANILIR?
OCR programlarını kullanmak, aslında son derece basittir; dokümanın taranması ve algılanacak olan metinlerin belirginleştirilmeleri yeterlidir. Diyelim ki metin içeren bir sayfayı taradınız ve ortaya çıkan resim tam karşınızda duruyor. Öncelikle resim içerisindeki metin alanlarını teker teker seçmelisiniz. Program, seçtiğiniz tüm metin alanlarını belli bir sıraya sokar ve algılama işlemini de bu sıraya göre düzenler. Sizin yapmanız gerekense, sadece algılama işlemini başlatacak olan düğmeye basmak ya da gerekli komutu vermektir. Metinler, kısa süre içerisinde ekrana geleceklerdir. Bundan sonra, algılanan metinler için bir dosya formatı seçebilir ve kayıt aşamasını tamamlayabilirsiniz.
OCR Programını Seçerken...
OCR PROGRAMINI SEÇERKEN...
Internet üzerinde satışa sunulan çok sayıda farklı OCR programı bulmanız mümkün. Her şeyden önce, metin algılama işlemini hangi amaçla yapacağınıza karar vermelisiniz. Eğer profesyonel bir amacınız yoksa, uygun fiyatlı basit programlara yönelebilirsiniz. Fine Reader gibi kapsamlı ve nispeten daha yüksek bir fiyat karşılığında sunulan programlar ise, profesyonel amaçlar için bile yeterli performansı sunmaktadırlar. Bu tip bir program ile hem hataları minimum düzeye indirebilir, hem de metinleri imla hatalarına karşı koruyabilirsiniz. Çünkü gelişmiş OCR programları sadece metinleri algılamakla kalmazlar; aynı zamanda algılanan metni denetlerler.
OCR Programları Öğrenebilirler
OCR PROGRAMLARI ÖĞRENEBİLİRLER
OCR programlarının hemen hepsi "öğrenmeye" açıktırlar. Örneğin yeni bir harf tipini programa ezberletmeniz ve bu harf tipi ile hazırlanan bir metni metin dosyası haline getirmeniz mümkündür.
OCR programlarına sadece yeni harfleri değil, özel sembol ve işaretleri öğretme şansına da sahipsiniz. Basılı dokümanlarda bulunan özel karakterler de (matematik sembolleri veya deforme harfler gibi), kolaylıkla programın "bilgi deposu"na eklenebilirler.
OCR teknolojisinin gelecekte ulaşacağı noktayı şimdiden kestirmek oldukça zor. Kesin olan tek şey ise, bu teknolojinin en azından önümüzdeki on yıl boyunca yoğun olarak kullanılacağı. Başka bir deyişle kağıtlar ve basılı dokümanlar var oldukça, OCR teknolojisi de ağırlığını hissettirecek. Ayrıca OCR programlarının sunduğu özelliklerin daha da artacağından ve hata oranının sıfıra kadar düşeceğinden kimsenin şüphesi olmamalı.
OCR Programlarını Nerede Bulacağız?
OCR PROGRAMLARINI NEREDE BULACAĞIZ?
Yazı İçerisinde de belirttiğimiz gibi. OCR programları genellikle tarayıcı İle birlikte kullanıcılara sunulmaktadır. Ancak siz farklı bir program kullanmak İstiyor da olabilirsiniz. Bu durumda İnternette küçük bir arama yapmalı, ücretli ya da ücretsiz programlardan dilediğinizi seçmelisiniz. En İyi OCR programlarından biri, hiç kuşkusuz Fine Reader'dır. Fine Reader, çok düşük kalitedeki kağıtların üzerinde yer alan metinleri bile yüksek doğruluk oranı İle tanıyabilir, örneğin bir gazete sayfasındaki metinleri taramaya kalkıştığınızda, çoğu zaman hatalarla karşılaşırsınız. Ancak Fine Reader, bu sorunları minimum seviyeye İndirmeyi başarmıştır. Ayrıca program İle "yakalanan" metinler, birçok farklı dosya formatında ("TXT", "DOC" ya da "PDF" gibi) kaydedilebilir.
Nasıl Bir Tarayıcı?
NASIL BİR TARAYICI?
Piyasada çok farklı marka ve modellerde sayısız tarayıcı bulmanız mümkün. Uygun fiyat karşılığında satın alacağınız bir tarayıcı bile, OCR programlarının metinleri algılamasını sağlayacak yeterli performansı sunmaktadırlar. Ancak OCR teknolojisini profesyonel düzeyde kullanmak gibi bir niyetiniz varsa, bu durumda yüksek çözünürlükte tarama yapabilen ve daha pahalı olan üst düzey bir tarayıcıyı tercih etmeniz gerekli.
Bilgi: OCR Programları ve Dil Seçenekleri
BİLGİ: OCR PROGRAMLARI VE DİL SEÇENEKLERİ
Eğer OCR programlarını kullanmaya karar verdiyseniz, öncelikle programın desteklediği dilleri öğrenmelisiniz. Diyelim ki sisteminize bir OCR programı kurdunuz ve Türkçe bir metni metin dosyası haline getirmek istiyorsunuz... Eğer program Türkçe desteği sunmuyorsa, bu durumda "Ç", "Ö" ya da "Ğ" gibi harfler doğru olarak algılanamaz ve ortaya çıkan metin de yanlışlarla dolu olur.
Birçok OCR programı, çeşitli dil destekleri İçin özel dosyalar sunarlar. Bu dosyaları CD İçerisinde bulabileceğiniz gibi, çoğu zaman üreticilerin web sitelerinden de temin edebilirsiniz.