
Cloudflare, Yapay Zeka Devi Perplexity’yi “Gizlice Veri Çalmakla” Suçladı!
İnternet altyapısı ve güvenlik devi Cloudflare, popüler yapay zeka (AI) arama motoru Perplexity‘yi, web sitelerinin tarama kurallarını kasıtlı olarak ihlal ederek, kimliğini gizleyerek ve gizlenmiş tarama faaliyetleri yürüterek “gayrimeşru bir şekilde veri çekmekle (scraping)” suçlayan sert bir rapor yayınladı. Bu iddialar, yapay zeka şirketlerinin modellerini eğitmek için kullandıkları veri toplama yöntemlerinin ne kadar etik ve yasal olduğu konusundaki tartışmaları yeniden alevlendirdi.
Cloudflare, bu bulgularının ardından Perplexity’nin botlarını “doğrulanmış botlar” listesinden çıkardığını ve gizli taramaları engellemek için yeni kurallar eklediğini duyurdu.
Suçlamanın Detayları: Kuralları Hiçe Saymak
Cloudflare’ın analizine göre, Perplexity’nin tarama botları bir dizi etik dışı ve kural ihlali içeren davranış sergiliyor:
robots.txtDosyasını İhlal Etme: Bir web sitesinin kök dizininde bulunan ve arama motoru gibi otomatik botlara hangi sayfaları tarayıp tarayamayacaklarını söyleyenrobots.txtdosyası, internetin en temel centilmenlik kurallarından biridir. Cloudflare, Perplexity’nin birçok durumda bu dosyayı yok saydığını veya hiç kontrol etmediğini tespit etti.- Kimlik Gizleme: Daha da endişe verici olanı, Perplexity’nin engellendiğinde kimliğini gizlemeye çalışması. Şirketin botları, kendilerini macOS üzerinde çalışan Google Chrome gibi gösteren sahte kullanıcı ajanları (user agents) kullanıyor.
- IP Adreslerini Değiştirme: Tespit edilmekten kaçınmak için sürekli olarak farklı IP adresleri ve ASN’ler (Otonom Sistem Numaraları) kullanıyorlar.
- Gizli Siteleri Tarama: Cloudflare, test amacıyla oluşturduğu,
robots.txtile taranması engellenmiş ve kamuya açık olmayan web sitelerine bile, Perplexity’nin resmi IP aralığıyla ilişkili olmayan, beyan edilmemiş tarayıcılarla erişmeye çalıştığını tespit etti.
Cloudflare araştırmacıları, “Perplexity başlangıçta beyan ettiği kullanıcı ajanıyla tarama yapsa da, bir ağ engeliyle karşılaştığında, web sitesinin tercihlerini aşmak amacıyla tarama kimliğini gizlemeye çalışıyor gibi görünüyor,” dedi.
Saldırının Boyutu
Bu ihlaller münferit olaylar değil. Cloudflare, on binlerce alan adında günde milyonlarca istek tespit ettiğini belirterek, bu gayrimeşru veri çekme operasyonunun ne kadar büyük bir ölçekte olduğunu vurguladı.
Perplexity’den Yalanlama: “Bu Bir Satış Taktiği”
İddiaların odağındaki Perplexity ise, bu suçlamaları reddetti. Şirket, Cloudflare’in blog yazısını bir “satış taktiği” olarak nitelendirdi ve tespit edilen botların kendilerine ait olmadığını iddia etti.
OpenAI Örneği ve İnternet Etiği
Cloudflare, Perplexity’nin bu davranışlarını, bir diğer yapay zeka devi olan OpenAI ile karşılaştırdı. Rapora göre, OpenAI’nin tarayıcıları şimdiye kadar robots.txt ve engelleme sayfalarına saygı göstermiş, bilgi toplamak için şeffaf tanımlayıcılar ve belgelenmiş davranışlar kullanmıştır.
Bu olay, yapay zeka şirketlerinin, modellerini beslemek için internetteki devasa veri havuzunu nasıl kullandığına dair önemli etik soruları gündeme getiriyor. Cloudflare, tüm bot operatörlerini şeffaf olmaya, iyi birer internet vatandaşı gibi davranmaya ve robots.txt gibi sinyallere uymaya davet ediyor.
Bu karşılıklı suçlamalar, yapay zeka çağında veri toplamanın “vahşi batı” döneminde olduğumuzu ve web sitesi sahipleri ile büyük AI şirketleri arasında yeni kuralların ve anlaşmaların yapılması gerektiğini gösteriyor.
Sizce bir yapay zeka şirketinin, bir web sitesinin kurallarını hiçe sayarak veri çekmesi kabul edilebilir mi? Bu tür davranışlar, o yapay zeka aracına olan güveninizi nasıl etkiler? Düşüncelerinizi yorumlarda bizimle paylaşın!
Bu Konuyla İlgili Diğer“Nedir?”Yazılarımız:
Dijital dünyada güvende kalmanızı sağlayacak en son siber güvenlik tehditleri, korunma yöntemleri ve gizlilik ipuçları için techneiro.com‘u takip etmeye devam edin!