Apple'ın da artık açık kaynaklı bir yapay zeka görüntü düzenleyicisi var
Yapay zekayla görüntüler oluşturmak hızla popülerleşiyor ve Apple da bu akımdan geri kalmak istemiyor. iOS kullanıcıları yakında birkaç kısa komutla istedikleri görüntüyü yapay zeka yardımıyla düzenleyebilecekler.
Apple, iOS 17'ye eklenen bazı küçük özellikler dışında, üretken yapay zeka konusunda biraz geride kalmış durumda. Ama şirket durumun farkında ve 2024 Apple'ın yapay zekada atılım yılı olacak gibi görünüyor. Artık herkes yapay zeka yetenekleri genişlemiş bir Siri de dahil olmak üzere, AI özellikleriyle dolu olması beklenen iOS 18'e odaklanmış durumda.
Ancak öncesinde Apple mühendisleri, Santa Barbara'daki California Üniversitesi ile ortaklaşa çalışarak, doğal dil talimatlarını anlayan açık kaynaklı bir yapay zeka modelini tanıttı. Kısacası, Apple'ın yeni uygulamasıyla, yapay zekaya bir fotoğrafı değiştirmek için bir şey yapmasını söylüyorsunuz ve o da yapıyor. Ancak bu kez bu uygulama Apple müşterilerine özel değil, açık kaynak koduyla isteyen tüm geliştiricilere ve kullanıcılara açık.
Apple, Photoshop'a rakip mi olacak?
"MGIE" (MLLM-Guided Image Editing) olarak adlandırılan bu yeni yapay zeka modeli, üç farklı düzenleme işlemini yapmak için kullanıcıdan standart komutlar alabiliyor: "Photoshop tarzı modifikasyon, global fotoğraf optimizasyonu ve yerel düzenleme."
Photoshop tarzı modifikasyon kırpma, döndürme ve arka plan değiştirme gibi eylemleri içeriyor. Global fotoğraf optimizasyonu parlaklık, kontrast veya görüntünün keskinliği dahil olmak üzere tüm görüntü için efektlerin ayarlanmasını sağlıyor; yerel düzenleme ise görüntünün şekli, boyutu ve rengi gibi belirli alanlarını etkiliyor.
MGIE hakkında yayınlanan makale, bu modelin nasıl zorlukların üstesinden geldiğini de açıklıyor, çünkü kullanıcı komutları genellikle yapay zeka sistemleri tarafından doğrudan anlaşılmak için çok belirsiz olabiliyor. Örneği program "pizzanın daha sağlıklı görünmesini sağla" cümlesinin ne anlama geldiğini net anlayamıyor. Ancak geliştiriciler MGIE bu konuda daha etkin olduğunu vurguluyor.
MGIE ile yapılabilecekler
Apple'a göre MGIE birçok farklı türde görsel düzenleme yapabiliyor. Örneğin kullanıcılar, bir su kütlesinin görüntüsüne şimşek eklemesini ve suyun üzerinde bu şimşeğin yansımasının görünmesi isteyebilirler; bir görüntünün arka planındaki bir nesneyi, örneğin istemeden fotoğrafa girmiş arka plandaki bir insanı kaldırabilir; bir tabak çöreği bir pizzaya dönüştürmek gibi başka şeyleri de başka şeylere dönüştürebilirler. Hatta bulanık bir noktada odaklanmayı artırabilir; diğer birçok işlemin yanında güzel bir fotoğraftaki filigran metni bile kaldırmak bile mümkün.
Elbette bu uygulama, fotoğraf düzenlemede yapay zekanın ilk uygulaması değil. Photoshop da bir süredir, kullanıcı komutlarına göre üretken yapay zeka düzenlemeleri sunuyor. Ancak MGIE, komutlara dayalı bir yapay zeka görüntü düzenleyicisinin en pratik ve gerçekçi sonuçlar veren uygulaması olabilir.
Model açık kaynaklı olduğu için herkes indirebilir ve kendi araçlarıyla entegre edebilir. Ayrıca uygulamanın küçük bir demosu da var. Ancak şu anda, demoyu çalıştırmak için oldukça kalabalık bir istek kuyruğu bulunuyor. Bir işlem yaptırmak istediğinizde yüzlerce kişinin işleminin bitmesi için onlarca dakika bekleyebilirsiniz.
Apple'ın MGIE'yi kendi platformlarına entegre edip etmeyeceği ya da nasıl entegre edeceği belli değil. Ancak şirketin bunu yapması için 2024 kesinlikle doğru bir zaman.