Yapay zeka dedektörü nedir? Yapay zeka tarafından üretilen metinlerin her geçen gün artması, bu metinlerin insanlar tarafından mı yoksa makineler tarafından mı yazıldığının nasıl belirleneceği konusunda bir sorun meydana getiriyor. GPT-3’ün bir türü olan ChatGPT, internet kullanıcılarının dikkatini çekerken bu tür yapay zeka araçlarının ürettiği metinler insanlar tarafından yazılmış metinlerle karıştırılabiliyor. Yapay zeka modellerinin tehlikesi, ürettiği metinler konusunda oluşan yanılsamada yatıyor. Kimi zaman bir metnin insan ürünü olup olmadığını tespit etmek zorlaşıyor. Bu noktada yapay zeka dedektörü kullanmanın gerekliliği öne çıkıyor. Özellikle eğitim, akademik yazım, gazetecilik ve hukuk gibi metinlerin doğruluğu ve kaynağının önemli olduğu alanlarda bu dedektörlerin kullanımı kritik hale geliyor. Sahte içerik üretiminin artması, dezenformasyonun yayılması ve telif ihlalleri gibi riskler, yapay zekâ tespit teknolojilerini daha da önemli kılıyor. Ayrıca bazı ülkelerde devlet kurumları ve üniversiteler, yapay zeka tarafından yazılmış ödev veya sınav içeriklerini tespit edebilmek için bu tür dedektörleri zorunlu kılmaya başladı.

Yapay Zeka Dedektörü Bir Metni Nasıl Tarar?Yapay zeka tarafından üretilen metinleri insanlar tarafından yazılmış metinlerden ayırmak için araçlara ihtiyaç duyuluyor. Bu konuda farklı çalışmalar da bulunuyor. Araştırmacılar, yapay zeka tarafından üretilen metinleri belirlemek için yazılımlar kullanarak metnin farklı özelliklerini analiz etmek gibi çeşitli yöntemler deniyor. Örneğin, metnin ne kadar akıcı olduğu, belirli kelimelerin ne sıklıkta kullanıldığı veya noktalama veya cümle uzunluğunda farklılıklar olup olmadığı gibi özellikler incelenebilir. Bu bağlamda Daphne Ippolito (Google Brain derin öğrenme araştırma biriminden) gibi araştırmacılar, büyük dil modellerinin tahminlerinin sıklıkla ortaya çıkan kelimeleri kullandığını ve bu nedenle “the” kelimesinin çok sık kullanıldığını tespit ettiler. Ancak bu tür metinlerin temiz olduğu ve daha az hata içerdiği izlenimi verdiği için yine de insanların yapay zeka tarafından üretilen metinleri ayırt etmede zorlanabilecekleri belirtiliyor. Aynı araştırmacılar insan yazımı metinlerin hatalarla dolu olduğunu ve farklı tarzları – argo ifadeleri içerirken dil modellerinin çok nadir hata yaptığını söylüyorlar. Ayrıca yapay zeka metinlerinde çok düzenli bir yapı olduğu, metnin tonunun genellikle nötr olduğu, dolayısıyla duygusal iniş çıkışlar veya çarpıcı ifadelerin eksik olduğu da bir diğer ayırt edici özellik olarak öne çıkıyor. Ek olarak, metinlerin bağlamı içinde yapılan göndermelerin eksikliği, kültürel detaylardan uzak durulması gibi unsurlar da analizlere dâhil ediliyor.

Bir başka tespit unsuru olarak büyük dil modelleri, bir cümledeki bir sonraki kelimeyi tahmin ederek çalıştıkları için, nadir kullanılan sözcükler yerine “the”, “it” veya “is” gibi yaygın kelimeleri kullanma eğiliminde oluyorlar. Bu nedenle metinlerde özgünlük oranı görece düşüyor. Ayrıca dil modeli tarafından üretilen metinlerde bazen aynı yapılar tekrar edebiliyor; örneğin her paragrafın benzer uzunlukta olması veya benzer kalıplarla başlaması gibi. Bu tür düzenlilikler de dedektörler tarafından algoritmik olarak tespit edilebiliyor. Yazım tarzındaki istatistiksel benzerlikler, içeriklerin yapay zeka tarafından üretildiğini gösteren diğer göstergeler arasında yer alıyor. Özellikle metindeki kelime olasılık dağılımları, kelime çeşitliliği oranı (type-token ratio) ve karakteristik n-gram dizileri gibi istatistiksel ölçütler bu araçlarda sıklıkla kullanılır.

British Columbia Üniversitesi’nde doğal dil işleme ve makine öğrenimi çalışmaları yürüten Muhammad Abdul-Mageed’e göre bunu yapmanın en iyi yollarından biri, insanlar tarafından yazılan bazı metinleri ve diğerlerini makine tarafından oluşturulanlarla yeniden eğitmek, böylece aralarındaki farkı öğretmektir. Bu yaklaşım, makine öğrenimi destekli dedektörlerin başarımını artırabilir. Özellikle derin öğrenmeye dayalı sınıflandırıcılar, metindeki dilsel izleri öğrenerek karar mekanizmalarını zamanla daha doğru hale getirebilir. Eğitim verisi genişledikçe dedektörlerin ayırt etme kapasitesi artar. Ancak bu durum aynı zamanda yapay zeka sistemlerinin daha iyi taklit yeteneği kazanmasına da yol açar ve bu da kedi-fare oyununa dönüşen bir dinamiği tetikler. Bu sebeple birçok uzman, sadece metin analizi ile sınırlı kalmayan hibrit sistemlerin (örneğin stilometri + kaynak doğrulama + metadata analizi) daha başarılı olduğunu belirtmektedir.

Yapay Zekâ Dedektörlerinden Kaçmak Mümkün müdür?

Chatbotlar tarafından yazılan metinlerin bu tür uygulamalardan kaçması mümkündür. Bu nedenle, bazı chatbotlar, insanlar tarafından yazılmış metinlere benzer görünümlü metinler üretmek için özel olarak tasarlanmıştır. Ancak, bu chatbotlar bile, yukarıda belirtildiği gibi tamamen insan yazımı gibi görünen metinler üretmekte tam olarak başarılı değildirler ve bu nedenle yapay zekayı tespit eden uygulamalar tarafından tespit edilebilirler. Bu durum özellikle GPT-4 ve benzeri modellerin üretiminde daha ileri seviye prompt kullanımı ve stil taklidi gibi tekniklerle aşılmaya çalışılmaktadır. Ancak hala metinlerdeki istatistiksel izler, özgünlük eksikliği, kaynak referanslarının yapay olması veya uydurulmuş alıntılar gibi izler tespit edilebilmektedir. Üstelik bazı dedektörler sadece yazılı içeriği değil, üretim süreciyle ilişkili dijital izleri (örneğin dokümana gömülü metadata) de analiz ederek karar vermeye çalışır.

Chatbotlar tarafından yazılan metinlerin yapay zekayı tespit eden uygulamalardan kaçması, metinlerin ne kadar gerçekçi göründüğüne bağlıdır. Eğer chatbotlar tarafından yazılan metinler, gerçek insanların yazdığı metinlerle neredeyse aynı görünüyor ve doğal dil kullanımı, anlamsal tutarlılık ve dilbilgisi açısından gerçekçi görünüyorlarsa uygulamalar tarafından tespit edilmeleri daha zor olabilir. Bununla birlikte, yapay zekâ modelleri bazen içerik üretiminde çok “iyi” oldukları için şüphe uyandırabilir. Örneğin, hatasız ama fazla nötr bir üslup, yaratıcı ama aşırı mekanik fikir yapısı, metnin üretildiği bağlamdan kopukluk gibi faktörler hâlâ alarm oluşturur. Ayrıca kullanıcı tarafından girilen promptun doğrudan etkisi vardır: belirli bir üslubu taklit etmek, bilinçli olarak dilbilgisel hata eklemek veya karaktere özgü yazım biçimi kullanmak gibi taktikler, dedektörleri yanıltmak amacıyla bilinçli olarak kullanılabilir.

Farklı uygulamalar bu tespitlerinde bazen yanılmaktadır. Örneğin OpenAI, kendi ürünü olan ChatGPT’nin yazdığı metinlerin insan tarafından mı yapay zeka tarafından mı yazıldığını her zaman tespit edememektedir. Özetle bir metni oluşturmadan önce makinenin nasıl yönlendirildiği, girdiler, amaç gibi unsurlar yapay zeka dedektörlerinin gözünden kaçmada önemli noktalar olabilir. Yani sadece metne bakmak yeterli olmayabilir; üretim sürecinin izlenebilirliği, metadata bilgisi, prompt geçmişi ve çıktı ile bağlam arasındaki ilişki de önem kazanmaktadır. Bu nedenle, yapay zeka dedektörleri sürekli olarak geliştirilmekte ve yeni üretim tekniklerine karşı daha dirençli hale getirilmeye çalışılmaktadır. Ayrıca bazı ülkelerde bu tür dedektörlerin kullanımına ilişkin etik tartışmalar da sürmektedir. Zira yüksek doğrulukta çalışmayan bir dedektörün yanlış pozitif üretmesi durumunda masum bireylerin iftiraya uğraması veya akademik disiplin cezaları alması mümkündür.