Apple Intelligence savunması: Söz sırası Apple'da

Apple, kısa süre önce ortaya atılan Apple Intelligence'ın YouTube altyazıları veri setini izinsiz olarak kullandığı iddiası hakkında ilk kez konuştu.

Apple Intelligence savunması: Söz sırası Apple'da

Proof News tarafından kısa bir süre önce yapılan ve yayınlanan bir araştırma, aralarında Apple, Nvidia, Salesforce ve Anthropic gibi bazı büyük teknoloji şirketlerine ait olanların da bulunduğu bazı yapay zeka modellerinin izinsiz olarak YouTube altyazılarını içeren bir veri kümesi kullanılarak eğitildiğini iddia ederek tartışmalara yol açtı.

Kar amacı gütmeyen EleutherAI tarafından hazırlanan “YouTube Altyazıları” adlı veri seti, yüz milyonlarca abonesi olan Mr. Beast gibi popüler içerik oluşturucular da dahil olmak üzere 170.000’den fazla kanaldan altyazı içeriyordu. Teknoloji şirketlerinin bu verilerden kar elde etmeye çalıştığı yönünde iddialar vardı ve bu veri setini kullanan Apple’ın OpenELM modelleri de iddialardan etkilendi.

Kısa bir sessizliğin ardından 9to5Mac ile görüşen Apple, Apple Intelligence'da veya diğer AI/makine öğrenimi özelliklerinde OpenELM modelinin kullanılmadığını söyledi. Başka bir deyişle Apple'a göre, Apple Intelligence özelliklerinde bu YouTube Altyazı veritabanı yer almıyor.

OpenELM, bu yılın başlarında piyasaya sürülen bir açık kaynaklı model ailesi. Şirket, OpenELM’i “son teknoloji ürünü bir açık dil modeli” olarak tanımlıyor ve bunun “açık araştırma topluluğunu güçlendirmek ve desteklemek, gelecekteki açık araştırma çabalarının önünü açmak” için yayınlandığını söylüyor.

OpenELM’e, Apple’ın Makine Öğrenimi Araştırması web sitesi de dahil olmak üzere çeşitli kaynaklardan erişilebiliyor. Ancak Apple, 9to5Mac ile yaptığı görüşmede OpenELM modelinin gelecekteki sürümlerini oluşturma planlarının olmadığını belirtti.

Şirket daha önce Apple Intelligence modellerini eğitmek için “temel modellerimizi eğitirken kullanıcıların özel kişisel verilerini veya kullanıcı etkileşimlerini” kullanmadığını açıklamıştı. Ancak, web siteleri şirkete bunu yapmamasını özellikle söylemediği sürece lisanslı verileri ve tarayıcısı tarafından toplanan verileri kullanıyor: “Temel modellerimizi, belirli özellikleri geliştirmek için seçilen verilerin yanı sıra web tarayıcımız AppleBot tarafından toplanan halka açık veriler de dahil olmak üzere lisanslı veriler üzerinde eğitiyoruz. Web yayıncıları, veri kullanım kontrolüyle web içeriklerinin Apple Intelligence eğitimi için kullanılmasını devre dışı bırakma seçeneğine sahiptir.