Eğer üretken yapay zekaların mevcut sürümlerinin çok iyi ve empatik olduğundan endişeleniyorsanız, artık internetin en kötü kısmı olan Dark Web (Karanlık Web) üzerinde eğitilen yeni bir dil modeli daha bulunduğunu öğrenmek endişelerinizi artıracak.
Eğlenceli bir şekilde DarkBERT olarak adlandırılan bu dil modeli, yalnızca Dark Web üzerinde eğitilmiş bir üretken yapay zeka. Üretken yapay zekanın arkasındaki ekip, Dark Web’i bir veri kümesi olarak kullanmanın yapay zekaya internetin o kısmında kullanılan dil hakkında daha iyi bir bağlam sağlayıp sağlamayacağını araştırma amacıyla Dark Web’i taramak isteyen insanlar ve siber suçlarla mücadele eden kolluk kuvvetleri için daha değerli hale getirip getirmeyeceğini anlamak istedi. Ekip, bulgularını henüz hakem değerlendirmesinden geçmemiş bir ön baskı makalesinde bildirdi.
Ayrıca ekip, çoğu insanın gerçekten gitmek istemediği bir yeri kapsamlı bir şekilde taradı ve çeşitli alan adlarının bir dizinini oluşturdu.
Dark Web, Google ve diğer arama motorlarının görmediği ve bu yüzden insanların büyük çoğunluğunun gezinmesinin kolay olmadığı bir internet alanı. Yalnızca Tor (veya benzeri) özel bir yazılım kullanılarak erişilebilir ve bu nedenle orada olup bitenler konusunda pek çok söylenti (ve gerçek) bulunur. Şehir efsanelerinde işkence odalarından, kiralık katillerden ve her türlü korkunç suçtan bahsediliyor olsa da, gerçekte bu alanın büyük bir kısmı, hepimizin çok hafife aldığı şekilde, sadece dolandırıcılık ve verilerinizi tarayıcı güvenliğinin güvenliği olmadan çalmanın diğer yolları ile doludur. Yine de, Dark Web’in siber suç ağları tarafından anonim olarak konuşmak için kullanıldığı ve bunun da onu siber kolluk güçleri için son derece önemli bir hedef haline getirdiği biliniyor.
Güney Kore’den bir ekip, Dark Web’de gezinmek ve bulduğu ham verileri geri getirmek amacıyla bir dil modelini Tor’a bağladı ve orada kullanılan dili daha iyi anlayabilecek bir model oluşturdu. Tamamlandıktan sonra, RoBERTa ve BERT dahil olmak üzere araştırmacıların önceden oluşturduğu mevcut modellere göre nasıl performans gösterdiğini karşılaştırdılar.
Ön baskıda sunulan bulgular, DarkBERT’in tüm veri setlerinde diğerlerinden daha iyi performans gösterdiğini, ancak yakın olduğunu gösterdi. Tüm yapay zekalar benzer bir çerçeveden geldiğinden dolayı, benzer performansa sahip olmaları beklenir, ancak DarkBERT Dark Web’de daha iyi bir başarı elde etti.
DarkBERT’in amacına gelince... ekip, bunun Dark Web’i siber güvenlik tehditlerine karşı taramada ve yasa dışı faaliyetleri tespit etmek için forumları takip etmede güçlü bir araç olmasını bekliyor.