İnceleme
Kategoriler
Anakart
Cep Telefonu
Notebook
ADSL Modem
İşlemci
Tablet
Ekran Kartı
Televizyon
Fotoğraf Makinesi
Depolama
Klavye ve Mouse
Giyilebilir Teknoloji
Kulaklık
Ses Sistemi
Oyun İnceleme
Ev Elektroniği
Navigasyon
Son İncelenenler
iPhone 16 Pro inceleme
Nillkin Desktop Stand, Nillkin MagRoad Lite, Nillkin Bolster Portable Stand inceleme
Mcdodo MC-1360 10.000 mAh LED Göstergeli Powerbank inceleme
Omix X6 inceleme
Anker Soundcore P40i inceleme
Razer Siren V3 Mini inceleme
Dyson OnTrac inceleme
Haber
Kategoriler
Kripto Dünyası
Cep Telefonu
Windows
Sosyal Medya
Oyun ve Eğlence
Bilim
Dijital Fotoğraf
Notebook
Ekran Kartları
Güvenlik
Mobil Uygulamalar
Twitter
Instagram
Facebook
CES 2024
Scooter
Araçlar
Netflix
Gitex 2022
En Son Haberler
Bu mouse’lar oyuncuları çok heyecanlandıracak
Bu mouse’lar oyuncuları çok heyecanlandıracak
Nvidia'nın beklenen işlemcisi, RTX 4070'e rakip olacak entegre bir GPU içerecek
Windows kullanan AI PC'ler, ilk kez Apple'ın Mac'lerini geçti
Huawei, evdeki internet sorununu çözmeye geldi
BYD 6 modelle Türkiye pazarında: Fiyatlar belli oldu
Bilim insanları, kendini gençleştirebilen bir canlı keşfetti
Forum
CHIP Online
Chip Dergisi
PDF Arşivi
2009
Aralık
CHIP Dergisi Arşivi: Aralık 2009 - Sayfa 52
50
51
52
53
54
Kategoriler
İnceleme
Anakart
Cep Telefonu
Notebook
ADSL Modem
İşlemci
Tablet
Ekran Kartı
Televizyon
Fotoğraf Makinesi
Depolama
Klavye ve Mouse
Giyilebilir Teknoloji
Kulaklık
Ses Sistemi
Oyun İnceleme
Ev Elektroniği
Navigasyon
Haberler
Cep Telefonu
Oyun ve Eğlence
Bilim
Notebook
Ekran Kartları
Mobil Uygulamalar
Yapay zeka
Sony Xperia Z3
Xiaomi
Xbox One
Windows 11
Windows 10
TikTok
Sinema
Samsung Galaxy S8
Samsung Galaxy S6
Samsung Galaxy S5
Samsung
Playstation 5
Oyun konsolu
Otomobil
Ofis ve Finans
Note 4
MWC 2018
MWC 2017
MWC 2015
Microsoft
LG G6
LG G5
LG G4
LG G3
İşletim Sistemleri
İş dünyası
iPhone SE
iPhone 7
iPhone 6S
iPhone 6
iOS
Instagram
IFA 2017
HTC One M9
HTC 10
Google
Diziler
Discovery 2
CES 2018
CES 2017
CES 2015
Blockchain ve Bitcoin
Bilgisayarlar
Xbox Game Pass
Xbox Series S/X
Uzay
Android
Forum
© 2024 Doğan Burda Dergi Yayıncılık ve Pazarlama A.Ş.
TEST+TEKNOLOJİ?KAĞITTAN?PC'YE? 87 www.chip.cOM.TR 12/2009 TEST+TEKNOLOJİ?KAĞITTAN?PC'YE? rayıcıların çok hassas çalışmaması ve satırları yatay olarak hizalayamaması. Programlar böyle hataları otomatikman gideriyor. ÜçÜncÜ adım: Yerleşİm analİzİ Şimdiye kadar değindiğimiz iki adım da hazırlık amaçlıydı. Şimdiyse sıra yerleşim analizinde. Programlar bunun için bölümleme (segmentation) denilen bir işlem gerçekleştiriyor, yani sayfanın hangi kısımlarında metin, hangi kısımlarında grafik olduğunu, barkot ya da boşluk gibi unsurları tanımlıyor. Bu işlem sayfa sayfa yapılıyor. Sayfa yapısı bu işlem sırasında giderek daha küçük parçalara bölünüyor. Sayfalar metin bloklarına, sonra paragraflara, sonra satırlara, sözcüklere ve son olarak da harflere ayrılıyor (yukarı bakınız!). Uzmanlar buna Çok düzeyli Belge Analizi (Multilevel Document Analysis) adını veriyor. İyi ama program yazıyla resmi nasıl ayırt ediyor ve paragraflarla satırları nasıl tanıyor? Geçtiğimiz yıllarda, özellikle de giderek daha hızlı çalışan programların yazılmasıyla bu alanda çok şey değişti. Öncelikle renkli belgeler ikilileştirme (binarization) denilen bir işlemle siyah beyaza dönüştürülüyor. Bunu, kağıda uzaktan gözünüzü kısarak bakmak gibi düşünebilirsiniz. Harfleri tam okuyamasanız da sayfanın yapısını, metin bloklarını, beyaz boşlukları, resimleri ayırt edebilirsiniz. Bazı renk geçişleri fotoğraflara işaret ederken, düz satırlar bir paragrafı anlatır. OCR programları da sayfanın bölümlenmiş yapısını işte bu şekilde oluşturuyor. Bu elbette hataya açık bir yöntem, özellikle de arka plandaki bir resmin üzerinde yazı varsa. Programlar bu zorluğun üstesinden gelmek için aşamalı bir yaklaşımı benimsiyor ve yaptıkları hatalardan ders çıkarıyor. Mesela metin tanıma işe yaramazsa, yazılım karşısındakinin büyük olasılıkla metin olmadığını anlıyor. Metin blokları tanımlandıktan sonra iş kolaylaşıyor. Boşluklara bakılarak paragraflar, satırlar ve sözcükler ayrıştırılıyor. Karakterler ise sözcük düzeyinde ele alınıyor. dördÜncÜ adım: metİn tanıma Bu aşamada işler daha ilginç bir hal alıyor. OCR yazılımının tüm becerisini ortaya koyması ve karakterleri elinden geldiğince iyi tanıması gerekiyor. Karakter tanıma için kullanılan iki yöntem var: Desen eşleme ve özellik eşleme. Desen eşlemede, bir karakter bilinen bir karakter kümesiyle karşılaştırılıyor. Eğer eşleşirse, tanınmış sayılıyor. Bu yöntem kulağa çok mantıklı gelse de, pratikte bazı sorunlar var: Zira desen eşlemede karakterlerin %100 uyuşması gerekiyor. Ayrıca desenlerin tanınabilmesi için kullanılan yazıtipinin de karakter kümesinde yer alması şart. Bunlar yetmezmiş gibi, yazıtipi kalın, italik ya da farklı boyutlarda olabilir. Tüm bunlar, desen eşlemenin işini zorlaştırıyor. Bu yüzden günümüzde özellik eşleme giderek ağırlık kazanıyor. Karakterler yine daha küçük bileşenlere bölünüyor, örneğin küçük bir "b" harfi dikey bir çizgi ve küçük bir yarım çember olarak parçalanıyor. OCR yazılımı bu harfin tüm yazıtiplerinin bu özellİk eşleme: Desen Eşlemede tüm desen önemliyken, bu yöntemde yapı sınıflandırıcı bir karakteri, onu oluşturan parçalara bölüyor. Böylelikle A harfi yukarı çapraz bir çizgi, aşağı çapraz bir çizgi ve ikisini birleştiren ortada yatay bir çizgiden oluşuyor. Eğer ortada çizgi yoksa o zaman harf büyük olasılıkla A değil. Karakter?tanımada?üç?yaklaşım Karakterleri tanımanın başlıca üç yolu var. Modern Optik Karakter Tanıma (OCR) yazılımları genellikle duyarlığı artırmak için üçünü birden kullanıyor. BölÜmleme: Bu prosedürde algoritma mürekkebin çok olduğu alanları, yüzeylerin nasıl dizildiğini ve beyaz alanları kontrol ediyor. Bu bulgular istatistiksel olarak değerlendiriliyor. Örneğin A'nın ortasında boyalı alanın çok olduğu hemen dikkatinizi çekecektir. Diğer yandan, B harfinde boyalı alan sola ve sağa dağılmış durumda. Düşük siyah değerine sahip alanlar Yüksek siyah değerine sahip alanlar taranan harftaranan harf taranan harfkaYdedİlen harf Karşılaştırma deSen eşleme: Bu yöntemdeyse karakterler önceden kaydedilmiş bir tarz kümesiyle karşılaştırılıyor. Örnekte gördüğünüz farklı A harfleri, taranan karakterler kıyaslanıyor. Örneğin popüler OCR yazılımı Abbyy FineReader, A harfi için 48 farklı desen şablonu kullanıyor. kaYıtlı şaBlonlar A A AA AA AA A Karşılaştırma taranan harf