Yapay zeka geliştiricileri veri sızıntılarını tespit etmek için dijital 'kanarya jetonları' kullanıyor
Yapay zeka geliştiricileri, fikri mülkiyetlerini yetkisiz veri kazımaya karşı korumak için veri setlerine 'kanarya jetonları' adı verilen benzersiz metin dizileri yerleştiriyor.
OpenAI ve Anthropic gibi önde gelen yapay zeka laboratuvarları, tescilli modellerinin tersine mühendisliğe maruz kalıp kalmadığını anlamak için 'kanarya jetonları' kullanıyor. Bu jetonlar, doğal dilde bulunmayan benzersiz n-gramlardan oluşuyor. Bu dijital imzalar sessiz bir alarm görevi görüyor. Eğer rakip bir model bu özel dizileri üretmeye başlarsa, bu durum modelin çalınmış verilerle eğitildiğine dair reddedilemez bir kanıt sunuyor.
Bu hikayenin devamı uygulamada — okumaya devam etmek için aç.