Apple'ın iOS 10 ve sonrasında kullandığı gizemli yüz tanıma işlevinin nasıl çalıştığı, firmanın bu hafta yayınladığı blog gönderisinde detaylarıyla anlatıldı.
Blog gönderisine göre teknoloji, New York Üniversitesi'nden araştırmacılar tarafından geliştirilen OverFeat'i temel alıyor. Bu teknoloji, resimlerdeki nesneleri sınıflandırıp konumlandırmak üzere derin konvolusyonel sinir ağından (DCN) faydalanıyor. Yazılım, bir "ikili sınıflandırıcı" yoluyla resimde herhangi bir yüzün yer alıp almadığını algılıyor ve "sınırlayıcı kutu regresyon ağı" ile yüzleri konumlandırma işini tamamlıyor. Böylece yüzler, uygulamalar tarafından etiketlenebilir hale geliyor.
Resimler, şekillere ve bölümlere ayrılmak üzere bir "özellik çıkartıcı" üzerinden yürütülüyor, ardından "ikili sınıflandırıcıya" iletiliyor. Yazılım, sınıflandırıcıyı eğitmek üzere üzerinde yüzden eser olmayan çok sayıda fotoğraf ve insan yüzlerinden oluşan fotoğraflarla eğitiliyor. Yazılım, tek bir karedeki birden fazla yüzü algılayabiliyor.
Derin öğrenme algoritmaları, bugün eskisinden güçlü olan mobil işlemciler ve yardımcı işlemciler için bile ciddi bir yük anlamına gelebiliyor. Apple bu yüzden eğitim işini önceden tamamlayarak yüz algılamada kullanılacak kaynakları azaltmış bulunuyor.
Firmanın yayınladığı belgeler, yüz tanımada kullandığı yazılımın nasıl çalıştığının bir özeti. Uygulama geliştirenler, iCihazlarda yüz tanıma sistemine ulaşmak için Vision API'dan faydalanabiliyorlar.