Ana Menü

  • Ana sayfa
  • Teknoloji Haberleri
  • Haberler
  • Makaleler
  • Download
  • Forum Knite Online Koxp
  • İletişim


  • Donanım
  • Mühendislik
  • Network
  • Oyunlar
  • Programlama
  • Tasarım
  • Yazılım
  •  
    Haberler

  • ASUS, A6000N serisi yeni diz üstü bilgisayarlarını duyurdu
  • Türk Telekom'dan öğrencilere ADSL kampanyası
  • ASUS WL-HDD 2.5: Kablosuz Ağlar İçin Disk Paylaştırıcı
  • Virüs En İyi 10: Sober'in Hoş Olmayan Geri Dönüşü
  • Microsoft WINS Yamasını Hazırlıyor
  • Devlet Yazışmaları İnternete Taşınıyor
  • ISS'ler de ADSL Hizmeti Vermeye Başlıyor
  • Taşınabilir Video oynatıcılarda devrim DivX-POD 7010
  • Kablo Internet'te indirim oldu mu, olmadı mı ?
  • Mobil kablosuz foto yazıcısı: HP Photosmart 375
  • En küçük Pocket Pc Phone Qtek s100
  • Google, interneti yeniden tanımlıyor
  • Kitap yorumu: Dijital Kale
  • Fedora Core 3
  • Zarif ve işlevsel
  • RoboDemo 5
  • Ateşli internet tilkisi
  • Türkçe GPL Wiki Yazılımı : Wiksis
  • VII. Bilisim Haftasi Etkinlikleri
  • Teknohaber.NET TRT INT'de
  • MyDoom: Yeni sanal kurt eskilerini temizliyor
  • Google artık 1/3 daha fazla web sayfası arıyor
  • MSN Messenger’da virüs!
  • 2003’ün ‘most wanted’ sitesi; Kazaa
  • Mars Express, gezegene yaklaşıyor
  •  
    Linkler

  • Bilgisayar
  • Diğer
  • Geyik
  • Internet
  • Üniversiteler
  •  
    WinBaglama Özel
  • Hakkında
  • Nota Dosyaları
  • Download
  •  
    Teknohaber.Net

    Site hakkında
    Editörler

     
    Arama

     
    Sponsor
     
     
    İstatistik
    eXTReMe Tracker
     

    Momentler yardımıyla Optik Karakter Tanıma

    Tarih: 30.12.2003 > Kaç kez okundu? 13559

    OCR(Optical Charecter Recognition) resim formatındaki herhangi bir dosya içindeki yazıyı tanıyarak,sonradan tekrar düzenlenebilecek metin biçimine dönüştürmektir.Yani elimizde,içinde yazı bulunan, JPG formatında bir dosya varsa bunu OCR programımızla WORD dökümanı şekline dönüştürüp kaydedeceğiz.Böylece bellekten kazanmış ve fazla yer kaplamadan JPG dosyalarımızı saklamış olacağız.Tarayıcıdan aldığımız dökümanlar jpg olarak kaydediliyor. OCR teknolojisini genellikle bu sorunu ortadan kaldırmak için kullanılıyor. OCR yazılımlarında yapay sinir ağları ve klasik olmak üzere iki programlama yöntemi vardır.Biz bu projede klasik yöntemi kullanacağız.Klasik yöntem momentler yardımıyla karakter tanıma işlemidir.





    MOMENTLER  YARDIMIYLA  OPTİK KARAKTER TANIMA

    Özet

    OCR(Optical Charecter Recognition)  resim formatındaki herhangi bir dosya içindeki yazıyı tanıyarak,sonradan tekrar düzenlenebilecek metin biçimine dönüştürmektir.Yani elimizde,içinde yazı bulunan, JPG formatında bir dosya varsa bunu OCR programımızla WORD dökümanı şekline dönüştürüp kaydedeceğiz.Böylece bellekten kazanmış ve fazla yer kaplamadan JPG dosyalarımızı saklamış olacağız.Tarayıcıdan aldığımız dökümanlar jpg olarak kaydediliyor. OCR teknolojisini genellikle bu sorunu ortadan kaldırmak için kullanılıyor. OCR yazılımlarında yapay sinir ağları ve klasik olmak üzere iki programlama yöntemi vardır.Biz bu projede klasik yöntemi kullanacağız.Klasik yöntem momentler yardımıyla karakter tanıma işlemidir.

    Giriş

    Pattern recognition (örüntü tanıma) bilim disiplininin amacı nesneleri bir kategoriye koymak veya sınıflamaktır. Bu nesneler, uygulamaya göre görüntü, ses ya da sınıflandırılması istenen başka bir işaret olabilir ve genel olarak pattern (örüntü) olarak adlandırılır. Karakter (harf veya sayı) tanıma, örüntü tanımanın başka bir önemli alanı“Optical Character Recognition” (OCR) sistemleridir.Optik Karakter Tanıma (OCR), elektronik görüntüler üzerindeki karakterlerin ya da metin bilgilerinin okunarak ASCII koda dönüştürülmesi işlemidir. OCR metodolojileri kullanılarak makineler tarafından yazılmış karakterler, elyazısı karakterler ve işaretler kolaylıkla okunup ASCII koda dönüştürülebilirler. OCR, makineler tarafından yazılmış karakterlerin okunup tanınmasında kullanılan teknolojidir.

    Optik Karakter Tanıma (OCR) Nasıl Çalışır?

    Karakterlerin tanınmasında birkaç OCR metodolojisi kullanılır. Bunlar arasında topolojik tabanlı olan, yapay sinir ağlarına dayanan, matris eşleme ile gerçekleşen, öznitelik analizi ile çalışan ve eğrileri izleyerek karakter tanıma işlemini gerçekleştiren metodolojiler yer almaktadır. Karakterlerin daha büyük doğrulukla tanınması için, okunan verilere ön işleme ve son işleme algoritmaları uygulanmaktadır. Bu algoritmalar, formların belirlenmesinde, formlar üzerindeki belirli alanların silinmesinde, form ve karakterlerin düzeltilmesinde (deskew) ve görüntünün iyileştirilmesinde kullanılırlar. Karakterlerin büyük doğrulukla okunmasında, sisteme sunulan elektronik görüntünün mümkün olduğunca keskin (sharp), temiz ve düzgün olması oldukça büyük önem taşımaktadır. Buna rağmen, günlük yaşamda kullanılan dokümanlar ve formlar genellikle kirli, yıpranmış ve katlanmıştırlar. Tanıma işleminden önce uygulanacak ön işleme algoritmaları ile formun elektronik görüntüsü temizlenir ve karakterler mümkün olduğunca iyileştirilir.
                   

    Karakterlerin tanınması sırasında, kullanıcı tarafından kabul edilmeyen ya da doğruluk kriterini yakalayamayan karakterler reddedilmelidir (tanınmıyor olarak değerlendirilmelidir). Örneğin doğruluk kriteri olarak % 99.98 kabul edilirse, doğru olmadığı kabul edilen birçok karakter reddedilecektir. Eğer doğruluk kriteri daha aşağı sınırlara çekilirse, tanınan karakter sayısı artacaktır. Buna rağmen % 99 oranındaki doğruluk kriterleri sıklıkla kullanılmaktadır.

    İçinde OCR tarafından okunamayan karakterler de bulunan reddedilen karakterler doğrulukla belirlenebilmelidir. Bu işlem genelde karakterin ekrana getirilerek el ile girişi yapılması süreci ile gerçekleştirilir.

     

    Doğruluğu iyileştirmenin en son basamağı ise OCR ya da el ile girişi yapılmış tüm karakterlerin işlenmesi, doğruluğunun istenilen kriteri yakaladığının sınanması ya da kullanıcı gereksinimini karşılayıp karşılamadığının belirlenmesidir. Son işleme işlemleri ile sözü edilen son basamak gerçekleştirilebilir. Ticari olarak var olan algoritmalar ile bu adım kolaylıkla uygulanabilir. Verinin arıtılması adı da verilen bu işlemler, karakter tanımadaki doğruluğu büyük oranda arttırmaktadır.

    Optik Karakter Tanıma (OCR) Sistemlerini Kimler Kullanır?

    Günümüzde, doküman işleme işlemleri ile ilgilenen kişiler, operasyon maliyetlerini düşürmek ve verimlilik oranlarını arttırmak isteyen her kullanıcı OCR ya da ICR teknolojilerini göz önüne alırlar.

    OCR teknolojisi sıklıkla şu alanlarda kullanılır :

    • Masaüstü Yayıncılık
    • Mahkemelerle İlgili Alanlar
    • Vergilendirme ve Tahsilat
    • Personel Kayıt Yönetimi
    • Nüfus Sayımı Formlarının İşlenmesi
    • Çek İşleme
    • Ödeme İşleme
    • Emekli Fonu İşleme
    • Sipariş İşleme
    • Tıbbi İstekler

    Günümüz ekonomisinde, elektronik doküman yönetimi sistemlerinin, hem iş dünyasında hem de devletin yönetim mekanizmalarında, görüntüleme ve OCR teknolojilerini birlikte kullandıklarını görebiliriz. İçinde yaşadığımız çalkantılı, dinamik ve maliyetlerin önem taşıdığı günümüz çalışma ortamlarında, OCR ile tanıma işlemleri görüntüleme teknolojisi ile birleştirilerek 21. yüzyıla geçişte kullanılan önemli bir basamaktır.

    OCR sistemleri ticari olarak bulunmaktadır. Tipik bir OCR sistemi, bir ışık kaynağı, tarama lensi ve bir detektörden oluşur. Işığa duyarlı detektörün çıkışında, parlaklık düzeylerindeki değişimler “sayılara” dönüştürülür ve bir resim dizisi oluşturulur, sonra “image restoration”, “image enhancement” gibi bir dizi görüntü işleme teknikleri resme uygulanır. Bundan sonra OCR yazılımı, okunan karakterleri, harf, sayı ve noktalama işareti olarak sınıflar.

    Görüntü İşleme Teknikleri

    1. Karakterleri Sınıflandırma

    Karakter resmimizi inceleyebilmek için önce tüm piksellere treshold dediğimiz işlemi yaparak resmi gri seviye resim haline getiriyoruz. Daha sonra kendimize bir referans nokta seçiyoruz ve bu referanstan büyük olan değerleri  255'e yani beyaza, referanstan küçük olanları ise 0'a yani siyaha çeviriyoruz. Siyah noktalar orada bir harfin olduğunu, Beyaz noktalar ise boşlukları gösteriyor.

    Karakterleri sınıflandırmak için önce resmi yatay ve dikey tarıyoruz. Yatay tarama sonucunda yazının kaç satırdan oluştuğunu buluyoruz. Karakter büyüklüklükleri hep aynı olduğu için (örneğin biz sadece 8 ve 10 punto kullanarak çalıştık) karakterleri yukarıdan aşağıya doğru taradığımızda harfin başladığı ve bittiği pikseller arasındaki fark sabit kalmaktadır. Yani 8 puntoda çalışıyorsak harfin başlangıcı ve bitişi arasındaki  fark 8 olmaktadır. Yukarıdan aşağıya doğru tararken bu sekiz değerinden farklı bir değer olduğunda başka bir satıra geçildiğini anlıyoruz.

    Yatay taramada satırları tespit ediyorduk, dikey taramada ise tek tek karakterleri buluyoruz. Bu sefer taramayı soldan sağa doğru yapıyoruz. Amacımız siyah noktaları bulmak. Çünkü siyah noktalar bir harfin başladığını gösteriyor. Herhangi bir nokta olmadığında orada boşluk olduğunu anlıyoruz. Dikey tarama yaparken bir karakter bitip başka bir karakter başladığında aradaki boşluğun en az 4 piksel olduğunu gördük ve bundan faydalanarak da karakterleri ayırt edebildik.

    2. Momentler

    Geometrik momentler normalize ve merkezi normalize olamak üzere ikiye ayrılır.Normalize momentler yalnız öteleme ve ölçekleme için değişmezdir. Amaç öteleme, ölçekleme ve döndürme için değişmez dönüşümler bulmaktır. Bu nedenle Hu tarafından tanımlanan, öteleme, ölçekleme, ve döndürme için değişmez olan 7 adet momente değinilmiştir.

    Geometrik Momentler

    I(x,y) bir sürekli görüntü fonksiyonu olsun. Bu görüntünün p+q nuncu dereceden   geometrik momentleri şöyle tanımlanır:

    (1.1)

    Geometrik momentler görüntü hakkında geniş bir bilgi sağlar ve pattern recognition için popülerdir.

    Geometrik dönüşümlerde değişmezlik pattern recognition da istenen bir özelliktir. (1.1)’ de tanımlanan momentler görüntünün koordinatlarına bağımlıdır ve değişmezlik özelliği göstermezler. Bu sorun, momentlerin normalize türlerinin uygun kombinasyonlarını tanımlamakla giderilir. Amaç aşağıda verilen dönüşümlerde değişmezliği olan momentler tanımlamaktır.

    Öteleme:   


    Ölçekleme:


    Döndürme:

    Bunun için aşağıdaki merkezi momentler tanımlanır:

                                                                               (1.2)   

    Burada

    dır.


     Normalize merkezi momentler:

    Bu momentler öteleme ve ölçekleme için değişmezdir.

      Hu’ nun yedi momenti:

    1962’ de Hu öteleme, ölçekleme ve döndürme için değişmez olan yedi moment tanımlamıştır. Bunlar:


        

                
     

    Bu momentlerin ilk altısı aynı zamanda aynalamada da değişmezdir. Aynalama durumunda yedinci momentin mutlak değeri değişmez, işareti değişir. Bu büyüklükler oldukça değişik değerler alabilirler. Pratikte doğruluk sorunlarından kaçınmak ve değişim aralığını kısıtlamak için momentlerin mutlak değerlerinin logaritmaları kullanılır.

    Uygulama

    OCR yazılımlarında yapay sinir ağları ve klasik olmak üzere iki programlama yöntemi vardır.Biz bu projede klasik yöntemi kullanacağız. Klasik yöntem momentler yardımıyla karakter tanıma işlemidir. Çalışmamızda  Hu'nun 7 momentini kullanarak, karakterlere ait özel değerler bulduk. Bu 7 moment değerinin farklı karakterler için farklı olduğunu gördük. Zaten bu da bizim istediğimiz bir durumdur.  Örneğin bir A harfi için bulunan 7 moment değeri, B harfi için bulunan 7 moment değeriyle karşılaştırıldı, sonunda bu değerlerin birbirinden çok farklı olduğu görüldü, böylece bu karakterlerin farklı karakterler olduğu anlaşılmış oldu.

    Program iki ana bölümden oluşmaktadır.

    1. Eğitim Verileri Oluştur

    Programda kullanılacak olan karakterlerin moment değerlerinin   belirlenmesi ve  kaydedilmesi

    Önce her karakter için 30 adet örnek topladık. Harflerin bir kısmını kendimiz paintte oluşturduk ve jpg olarak kaydettik. Bir kısmını da tarayıcıdan aldığımız dokümanlardan elde ettik. Topladığımız 30 örneğin 15'inin  moment değerlerini hesapladık ve bunları kaydedip eğitim verileri olarak kullandık. Bulduğumuz moment değerleri her karakter için farklı oldu. Bu da karakterlerin tanınması için gereklidir.

    2.OCR simülasyonu

    Tanımak için açtığımız JPG formatındaki yazıyı yatay ve dikey tarayarak önce sınıflarını bulduk. Böylece karakterleri  birbirinden ayırt etmiş olduk. Programı test etmek için kullandığımız  tüm karakterler için de moment değerlerini hesapladık ve bu değerleri veri tabanındaki daha önceden hesaplamış olduğumuz değerlerle karşılaştırdık. Test için kullanılan bir  karakterin moment değeri, veri tabanındaki karakterlerin moment değerleriyle karşılaştırıldı ve birbirine en çok benzeyen değerlerin aynı karaktere ait olduğunu görüldü.( korelasyon).

    Sonuç

    Tanımak istediğiniz  karakterler hangi büyüklük ve fontta ise eğitim verilerini de aynı büyüklük ve fontta veri olarak programa hesaplatmamız gerekiyor. Çalışmamızda arial fontunda 8 büyüklüğündeki karakterler kullandığımızda başarımız %100 oluyor. Fakat karakterler büyüdükçe bozulma oranı artıyor ve başarı da düşüyor. 

    Tuba Çağlıkantar, Sema Öksüzoğlu, Gülçin Yücel, Erciyes Üniv. Bilgisayar Müh.

    tuba@teknohaber.net






    Yorumlar

    Gönderen: Burak SARICA Tarih: 02:59 30.12.2003
    OCR uygulamalarının nasıl çalıştığını uzun süre merak eden biri olarak, böyle güzel bir makale görmek şanslı hissettirdi kendimi. (Tabi bu makaleyi önceden de gözatma şansına sahiptim ben ama olsun. Artık hep elimizin altında.) Tuba'yı tebrik ediyorum. Başarılar diliyorum. Teknohaber ekibini de ayrıca kutluyorum. Başarılar.

    Gönderen: Bekir ÖZPOZAN Tarih: 03:26 30.12.2003
    Çok güzel olmuş, başta Tuba olmak üzere tüm emeği geçen arkadaşlara teşekkür ediyorum. saygılar, iyi çalışmalar

    Gönderen: Ömer ÇOLAKOĞLU Tarih: 11:01 14.01.2004
    Ya bu momentler gerçekten ise yariyomu zamanında epey bi ugrastik da bi numarasını goremediydik. Azicik bozuk bi harf verdinmi cozutuyordu. Zernike momentlerine olceklemeden, otelemeden rotasyondan,gurultuden bagimsiz deniyordu her yerde ama harfi azıcık donderdimi tanimiyordu.
    Elinize saglik bu konularda turkce dokuman bulmak zor.


    Gönderen: NOmat Tarih: 11:48 16.05.2004
    Emeği geçen herkese teşekkürler. Dönem ödevi için ilaç gibi geldi.:))))

    Gönderen: Lagrima Tarih: 11:51 17.10.2005
    Arkadaşlar bu momentleri nasıl buluyoruz ben biraz yeniyim de

    Gönderen: deniz soy Tarih: 08:00 27.04.2006
    emeği geçen bütün üstadlara çok teşekkürler.acaba aktif görünüm model temelli yüz tanıma hakkında elinizde türkçe bilgi varsa gönderebilirmisiniz?şimdiden teşekkürler.iyi çalışmalar.(deniz_soy@yahoo.co.uk)

    Gönderen: ömer faruk polat Tarih: 01:34 07.01.2006
    güzel ama benim aradığım yok konu merkezi olmayan çarpışmayla birlikte moment

    Gönderen: ömer faruk polat Tarih: 01:36 07.01.2006
    güzel ama benim aradığım yok konu merkezi olmayan çarpışmayla birlikte moment msn gönderirmisin antepli_207@hotmail.com

    Gönderen: murat dodur Tarih: 01:36 08.05.2006
    iyi çok güzel teşekkürler

    Gönderen: ibrahim KURT Tarih: 09:34 06.02.2006
    oldukça güzel...

    Gönderen: EsAt FeYiZoĞlu Tarih: 06:16 01.06.2006
    walla nedim konu güzel wede hayatımı kurtardınız diyebilirim emeğinize sağlık çok tsk...

    Gönderen: burak bayram Tarih: 12:33 12.10.2006
    öteleme nedir bulamadım lütfen en kısa surede bulun

    Gönderen: Tarih: 09:21 04.11.2006
    matematikte öteleme nedir?bulamadım lütfen yardım edin.

    Gönderen: yusuf sevilgen Tarih: 03:29 25.03.2007
    Dökümantasyon hakkında biraz bilgi verebilirmisiniz?

    buy cialis fedex shipping
    cialis strenght mg
    buy viagra line
    cialis no rx
    generic viagra online
    us cialis
    indian cialis
    viagra next day delivery
    what is cialis
    buy discount viagra
    viagra for cheap
    discount propecia propecia
    viagra 100mg england
    generic propecia viagra
    usa cialis sales
    viagra mexico
    mail order propecia
    viagra gel
    real viagra pharmacy prescription
    buy cialis us
    buy propecia uk
    cialis levitra sale viagra
    viagra pills
    mexico viagra
    uk propecia sales
    cialis arterial fibrillation
    how to get viagra
    viagra free
    baldness male propecia
    ordering propecia
    viagra online
    cheap viagra online
    best price on propecia
    canadian generic viagra online
    buying cialis online
    cialis daily
    viagra prescriptions
    purchase cialis us
    combine cialis and levitra
    cialis herbal
    viagra canadian pharmacy dosage
    cialis and ketoconazole
    best price generic propecia
    cialis low price
    canadian pharmacy viagra legal
    best price for propecia online
    low price cialis
    cialis canada
    cialis price in canada
    effects of cialis
    purchase cialis cheap
    low cost propecia
    cialis mastercard
    cialis levitra
    cialis endurance
    cialis philippines
    woman and cialis
    info viagra
    real viagra without prescription
    how much is viagra
    viagra in india
    cialis 20 mg
    purchase cialis
    cialis sales uk
    real viagra online
    buy mg propecia
    buy levitra online viagra
    buy cialis canada
    online pharmacy propecia
    next day viagra
    cialis headaches
    viagra tablet weight
    online propecia prescription
    pfizer soft viagra
    viagra lawyers
    levitra vs cialis
    viagra blister 4
    cialis express delivery
    cialis for women
    lowest propecia prices
    cialis no prescription
    buy viagra
    viagra and cialis for sale
    buy viagra cialis levitra
    viagra for women
    should i chew cialis
    cialis 30 mg
    generic cialis sale
    generic propecia sale
    generic cialis canadian
    viagra discount sale
    viagra buy
    canadian propecia rx
    lowest price for propecia
    best price propecia
    viagra prescription
    cialis order
    china viagra
    canada viagra
    order propecia pill
    buy online propecia
    cialis soft
    best price for propecia
    brand viagra professional
    viagra dose
    cialis soft tablets
    buy cialis once daily
    order propecia
    viagra costs
    viagra samples
    levitra viagra online
    propecia for hair loss
    get viagra fast
    cialis professional no prescription
    canadian drugs propecia
    professional cialis
    canada viagra generic
    real cialis
    usa cialis
    viagra canada
    cialis next day
    online propecia sales
    cialis usa
    get cialis
    order viagra
    buy propecia online cheap pharmacy
    viagra label
    liquid propecia
    ordering viagra overnight delivery
    cialis fast delivery
    discount drug propecia
    viagra cialis online sales
    brand name cialis overnight
    viagra non prescription
    order cheapest propecia online
    cialis price 100 mg
    cost of cialis
    viagra perscription
    online prescription propecia
    buy cheap uk viagra
    viagra fast delivery
    how does viagra work
    canada online pharmacy propecia
    viagra in spain
    price check 50mg viagra
    purchase propecia
    canada viagra pharmacies scam
    buy cheap online propecia
    cialis buy on line
    get propecia online pharmacy

    Teknohaber.Net sitesi üzerinde özgür bir yazılım olan tekno.Portal isimli portal yönetim sistemi çalışmaktadır. Sitede bulunan yazılar kaynak gösterilerek yayınlanabilir. Yazıların sorumlulukları yazarlarına aittir. Her hakkı saklıdır, © 2001. google articles article