Yapay Zeka Tarafından (mı) Yazıldı
Son zamanlarda okuduğunuz e-postalarda, sosyal medya paylaşımlarında veya raporlarda tuhaf bir benzerlik fark ettiniz mi? Dilbilgisi açısından kusursuz ama bir şekilde sığ, derinlikten yoksun bir ton. Sanki herkes aynı yazıyormuş gibi. Bunun nedenini anlayabilmek için önce büyük dil modellerinin (LLM) nasıl çalıştığını bilmemiz gerekiyor.
Büyük Dil Modelleri Nasıl Çalışır?
Diyelimki bir blog yazısı hazırlamak istiyorsunuz ve LLM’lerin birinden (ChatGPT, Claude, Gemini, Grok, Deepseek vb.) yardım istediniz. Sistem şöyle bir mantıkla çalışır:
1. Tokenizasyon (Parçalara Ayırma): Girdiğiniz metin öncelikle "token" adı verilen küçük parçalara bölünür. Her kelime veya kelime parçası sayısal bir değere dönüştürülür. Bu durum, sistemin metni işlemesine imkan tanır.
2. İstatistiksel Tahmin: Model, milyarlarca metinden öğrendiği bilgilere bakarak "bu kelimeden sonra hangi kelimenin gelme olasılığı en yüksek?" sorusunu sorar.
Örneğin, "Oyun oynayan çocuk çok …" cümlesini verdiğinizde, model eğitim verilerinde bu dizilimi en sık takip eden kelimeleri analiz eder. Bu nedenle, büyük olasılıkla "mutlu" veya "neşeli" gibi istatistiksel olarak en güvenli ve yaygın seçenekleri sunacaktır. Bu temel mekanizma, metinlerin neden bu kadar genel geçer olduğunun ana açıklamasıdır. Yapay zeka bir sanatçı değil, bir ezbercidir; en popüler olanı tekrar eder, özgün bir şey yaratmaz.
3. Bağlam Penceresi Analizi: Önceki cümlelerinize bakarak tutarlı bir akış yakalar. Ancak burada şöyle bir durum var: model sizin tarzınızı değil, internet üzerindeki milyonlarca benzer metinden türettiği ortalama bir tarzı kullanır. Burada Stochastic Parrot kavramına değinmekte fayda var.
Stochastic Parrot
Bu kavram, 2021 yılında Emily M. Bender, Timnit Gebru ve ekibi tarafından "On the Dangers of Stochastic Parrots: Can Language Models Be Too Big?" başlıklı ünlü makalede ortaya atılmıştır.
Bu metafor, büyük dil modellerinin gerçek bir anlama olmaksızın istatistiksel olarak dil kalıplarını taklit eden sistemler olduğunu vurgular. Tıpkı "Nasılsın?" dendiğinde bir papağanın bu sorunun anlamını bilmeden sadece sesi tekrar etmesi gibi, LLM'ler de eğitim verilerinde gördükleri kelime dizilimlerini olasılıklara dayanarak yeniden üretirler. Burada Stochastic kelimesi olasılığı, parrot ise tekrarı açıklamak için kullanılmıştır.
Bender ve meslektaşları bu metaforda iki kritik hususun altını çizmektedir:
- LLM'ler, eğitildikleri veri setleriyle sınırlıdır ve temelde bu veri setlerinin içeriğini rastlantısal olarak tekrar ederler. İnternetten toplanan milyarlarca kelime, modelin sözcük dağarcığını ve üslubunu belirler. Bu veriler önyargılar, yanlış bilgiler ve sorunlu içerikler barındırıyorsa, model bunları da öğrenir ve üretir.
- Sistemler, eğitim verilerine dayanarak çıktı ürettikleri için ne zaman yanlış ya da uygunsuz bir şey söylediklerini anlayamazlar. Bir insan yanlış bir şey söylediğinde bunu fark edebilir ve düzeltebilir, ancak yapay zeka modeli sadece olası olanı üretir, doğru olanı değil.
Ancak bu metafor, teknoloji dünyasında hararetli bir tartışmayı da beraberinde getirmiştir. Bazı uzmanlar, modern LLM'lerin basit papağan tanımının ötesine geçtiğini savunuyor. Firmalar gün geçtikçe bu sorunu çözme adına yoğun çalışmalar yürütüyor. Onlara da ilerleyen yazılarımızda değineceğiz. Bu tartışma devam ederken, pratik sonuç ortadadır: İster anlasın ister anlamasın, YZ şu anki haliyle istatistiksel olarak en güvenli yolları tercih etme eğilimindedir.
4. Güvenli Liman Stratejisi: Sistem risk almaz. Tartışmalı olmayan, herkes tarafından kabul görmüş, orta yol ifadeleri tercih eder. Bu yüzden çıkan metin kusursuz görünür ama sığdır.
Sık Tekrar Eden Kalıplardan Örnekler
Yapay zekanın tekrarlayan yapısı verilerle de kanıtlanmıştır. GPTZero gibi YZ tespit araçları, milyonlarca metni analiz ederek YZ modellerinin belirli kelime ve ifadeleri insanlara kıyasla şaşırtıcı derecede sık kullandığını ortaya koymuştur. Aşağıdaki tablo, bu ekim ayında güncellen en sık kullanılan 50 örneği göstermektedir:
Bir insan "harika" derken sesinde coşku, "berbat" derken hayal kırıklığı vardır. Yazısı kişisel deneyimler, duygular ve mizah anlayışı ile şekillenir. Bu durum, araştırmaların da gösterdiği gibi, "ben" ve "biz" gibi kişisel zamirlerin daha sık kullanılmasında veya cümle uzunluklarının aniden değiştirilmesinde kendini gösterir. Yapay zeka ise sadece hesap yapar ve veri setinde en çok geçen "harika"yı seçer. İşte bu fark, metinlerin ruhsuz görünmesinin temel nedenidir.
Tekrar Eden Kelime Tuzağına Düşmemek İçin Ne Yapmak Lazım?
Bu tekrar eden kelimeleri metinlerimizde kullanıldıkça derinlik kayboluyor ve yazılar ciddiye alınmadığı gibi çoğu zaman okunmuyor bile. Bunun önüne geçmek için bir kaç yol var:
- Dil modeli kişiselleştirme bölümünde sizin yapınızla uyumlu talimatları derli toplu yazıp istediğiniz şekilde davranmasını sağlayabilirsiniz. Bu durumda yasaklı kelime grubu oluşturup bunları kullanmamasını sağlayabilirsiniz.
- Hangi alanda çalışma yaparsanız yapın YZ'yi tamamlanmış ana çalışmayı gözden geçiren ve öneri getiren bir yardımcı gibi görün. Yani çalışmanızı detaylı bir şekilde hazırladıktan sonra eksik kaldığınız noktaları tamamlamasını, emin olmadığınız noktalarda ilave öneriler getirmesini isteyebilirsiniz.
- Eğer çalışmayı illa YZ'ya yaptıracaksanız sizin için hazırladığı çalışmayı bir kaç kez inceleyip mantık ve dil örgüsü bakımından kendi formatınızda yenilemenizde ve belki de en önemlisi kaynakça linklerinin her birini açıp oradan almış olduğu metnin doğruluğunu gözden geçirmenizde fayda var.
- Yapay zekaya mükemmel metin yazdırmaya çalışmak yerine, önce size kaba bir taslak oluşturmasını isteyin. Ardından bu taslağı kendi kelimelerinizle, duraksamalarınızla, hatta dilbilgisi hataları pahasına yeniden yazın. İnsanlar tarafında hazırlanan metinleri farklı kılan şey kusursuzluk değil, düzensizliktir. Bazen "ama"dan sonra başlayan cümleler, bazen eksik bırakılan düşünceler metne canlılık katar.
- Yapay zekaya yazmadan önce, yazmak istediğiniz konuyu bir arkadaşınıza anlatır gibi 2-3 dakika sesli kayıt alın. Sonra bu kaydı metne çevirin. Konuşma dilindeki doğallık, "kapsamlı", "optimize" gibi steril kelimelerden çok daha etkileyicidir. Yapay zekayı bu ham metni düzenleme için kullanın, sıfırdan yazma için değil.
- Yapay zeka genel konuşur, siz özel konuşun. Kendi mesleğinizdeki kelimeleri, başınızdan geçen somut olayları, hatta küçük hatalarınızı metne serpiştirin.
- Hazırladığınız metni yüksek sesle okuyun. Eğer hiçbir yerde tökezlemeden, nefes almadan, duygusal vurgu koymadan okuyabiliyorsanız, bu bir alarm işaretidir. İnsanlar tarafından hazırlanan metinler ritim değişiklikleri, beklenmedik kelime seçimleri ve ara sıra grameri zorlayan ifadelerle doludur.
Tüm bunları yaptıktan sonra size ait, YZ desteği ile hazırlanmış ve rahatlıkla paylaşabileceğiniz bir çalışmaya sahip olacaksınız. Unutmayın, hangi hammaddeyi koyarsanız YZ onu işler. O yüzden asıl sorumluluk hala sizde.

Yorumlar
Yorum Gönder