Spotify İddiası: Anna’s Archive’in 300 TB’lık Veri Taz̧iyesi ve Genel Etki Analizi

Dünyanın en büyük müzik akış platformu olarak bilinen Spotify, yakın zamanda büyük bir veri hırsızlığı iddiasının hedefi oldu. Anna’s Archive adlı bir grup, platformdaki müziklerin neredeyse tamamını tarayarak yaklaşık 300 TB’lık bir veri seti oluşturdu ve bunları yasa dışı biçimde torrentlerle dağıtmaya başladı. Spotify bu iddiaları doğruladı ve olayın yetkisiz erişim sonucunda gerçekleştiğini açıkladı. Üçüncü bir tarafın herkese açık meta verileri kazıdığı ve DRM korumasını aşmak için yasa dışı yöntemler kullandığı kaydedildi. Şirket, olayla ilgili soruşturmanın sürdüğünü ifade etti.

86 milyon şarkı internete sızdırıldığı iddiasıyla konuşulan arşiv, yaklaşık 86 milyon ses dosyasını kapsıyor ve bunlar Spotify’daki tüm müziklerin yaklaşık %37’sine karşılık geliyor; ancak toplam dinlenmelerin %99,9’una uzanıyor. Dosyaların büyük bölümü OGG Vorbis 160 kbps formatında saklanmış durumda. Popülerlik puanı düşük parçalar ise 75 kbps kodlamayla yer tasarrufu sağlamak amacıyla yeniden sıkıştırılmış. Ayrıca, 256 milyon satırlık meta veri derlendi ve bu veriler Spotify’daki dinlenmelerin yaklaşık %99,6’sını temsil ediyor. Bu bilgiler sorgulanabilir SQL veritabanlarında tutuluyor. API üzerinden Spotify API ise neredeyse kayıpsız biçimde JSON formatında yeniden oluşturulmuş; arşivde 186 milyon benzersiz ISRC bulunuyor.
Albüm bilgileri, sanatçı detayları ve kapak görselleri de arşivde mevcut. Anna’s Archive’ın yayımladığı blog yazısı, sızıntının teknik yönlerinin yanı sıra Spotify’ın müzik ekosistemine dair çeşitli istatistikleri de içeriyor. Platformdaki şarkıların yaklaşık %70’i neredeyse hiç dinlenmiyor; buna karşılık %0,1’lik bir kesim çok daha yüksek bir popülerliğe sahip.
Amaç müziği korumak olarak özetlenen bu saldırının arkasında, müziğin korunması düşüncesi yatıyor. Daha önce kitapları açık kaynak yapmakla bilinen grup, benzer bir yaklaşımı burada da benimsedi. Spotify’ın arşivinin aşırı popüler sanatçılara ve yüksek kaliteli seslere odaklandığını savunarak, tüm geçmiş müziği temsil eden merkezi bir torrent listesi gerekliliğini öne sürüyor. Paylaşılan torrentler grup tarafından kendi sunucularında barındırılıyor ve dosyalar uzun süredir kullandıkları Anna’s Archive Containers (AAC) adlı özel bir formatla paketlenmiş durumda. Meta veriler şimdiden paylaşıldı; ses dosyalarının geri kalanı ise popülerlik sırasına göre ve büyük parçalar halinde sırayla paylaşılacak. Bu sızıntının gerçek etkileri zamanla netleşecek gibi görünüyor.






