Türkçe Kısa Metinlerde Yazar Tanıma Yönteminin Sınanması ve Geliştirilmesi/Sonuç ve Öneriler

Vikikaynak, özgür kütüphane

yazarlarında ise muhtelif ayırt edici ölçütlerin varlığı tespit edilse de M0 iletisiyle karşılaştırılabilecek yalnız bir ölçüt bulunduğu görülmüştür: Cümle ve ileti sonu noktalama işaretlerinin varlığı. Diğer ölçütlerin hiçbiri, M0 iletisinin biçim ve içeriği itibariyle karşılaştırılabilir durumda değildir. Y5 yazarının ise noktalama işareti kullanmakla birlikte her iletisinde cümle içindeki bazı sözcüklerin büyük harfle başladığı ve tüm iletilerin, tıpkı şiirlerde olduğu gibi mısra düzeniyle ve her satır arasında birer boş satır bırakarak oluşturulduğu görülmüştür. Cins isimlerin başında büyük harf kullanılması ve iletinin biçimsel düzeni, ayrı ayrı ayırt edici birer ölçüt olarak not edilmiştir. Y3 yazarının cümle sonlarında noktalama işareti kullanmaması ve diğer tüm yazarların tesadüfî biçimde cümle ve ileti sonunda ilgili noktalama işaretine sürekli olarak yer vermesi, bu incelemede belirleyici olmuştur. Ne var ki bu tespitin hem istatistiksel hem de bilimsel olarak güvenilirliği tartışmaya son derece açık görünmektedir. Dolayısıyla yazar tanıma çalışmaları için mümkün olduğunca çok veri içeren, uzun metinlerin elde edilmesinin önemi bir kez daha ortaya çıkmaktadır.

Bu çalışma kapsamında gerçekleştirilen son deneyde kontrol iletisi, oldukça az miktarda dilsel veri içermekte olup toplam 5 sözcükten ibarettir. İletinin (ve cümlenin) sonunda noktalama işaretine yer verilmeyişi, yöntem bağlamında yer verilen ölçütler içerisindeki tek ayırt edici özellik olarak görülmektedir. Ayrıca içerik ele alındığında, yazarın erkek olduğu anlaşılmaktadır. Buna göre Y1 yazarı noktalama yönünden, Y3 ve Y5 yazarları ise hem noktalama hem de cinsiyet yönünden ayrılık göstermektedir. Zira Y3 ve Y5 yazarlarının oluşturduğu iletilere bakıldığında, yazarların kadın olduğu açıkça tespit edilebilmektedir. Y1, Y2 ve Y4 yazarlarının karşılaştırma iletileri ise bu konuda net bir tespit yapılmasına elverişli değildir. Netice olarak, Y2 ve Y4 yazarları, noktalama işareti kullanmamaları bakımından M0 iletisiyle benzerlik taşımaktadır. Bu esnada, her ne kadar yöntem bağlamında bir ölçüt olarak sunulmamışsa da iletilerin uzunluğunda açık bir farklılık olduğu görülmüştür. Kontrol iletisi 5 sözcükten ibaretken; Y2 yazarının iletileri en az 8, en fazla 27 ve ortalama 15,8 sözcükten oluşmaktadır. Y4 yazarının iletileri ise en az 5, en fazla 12 ve ortalama 6,8 sözcük içermektedir. Y2 yazarı, iletilerinde genellikle sebep-sonuç ilişkileri kurmuş, sıralı ve birleşik cümleler tercih etmiştir. Y4 yazarı ise daha yalın ve basit biçimde birtakım tespitlere yer verirken bunları basit cümlelerle aktarmıştır. Bu yönüyle, sözcük sayısı ve cümle kurgularının ayrı bir ölçüt olarak sayılmasıyla Y4 yazarının iletileri ile M0’ın benzerliği artmış ve yapılan kontrolde, M0 iletisinin Y4 tarafından yazıldığı doğrulanmıştır.

Özgül olarak bu deney, yöntem dahilindeki ölçütlerin ortalama sözcük sayısı ve ileti kurgusunu (cümle yapıları ile bir konunun ele alınış biçimlerini) da içerecek şekilde geliştirilmesinin, özellikle kısa metinlerde yazar tespiti açısından önemini ortaya koymaktadır. Bunlarla birlikte ileti içeriklerinden anlaşılabilmesi hâlinde, yazar cinsiyetinin veya yazara ilişkin başka birtakım bilgilerin belirlenmesi de uygulamaya ve dolayısıyla yazarın tespit edilmesine katkı sağlayacaktır.

Sonuç ve Öneriler

Çalışma kapsamında iki yazarın birer ve beşer iletisi ile beş yazarın birer ve beşer iletisi üzerinde, üçer farklı uygulama olmak üzere toplam 12 karşılaştırma gerçekleştirilmiştir. Yapılan bu incelemelerde, yöntem başlığı altında sunulan ölçütlerin bazıları hiç kullanılmamış, bazıları ise sıkça belirleyici bir özellik olarak öne çıkmıştır. Ölçütler arasındaki bu farklılığın hem örneklemin rastgele oluşu nedeniyle bazı ölçütlerin kullanılabileceği ya da ayırt edici olabileceği iletilerle karşılaşılmamasından hem de bazı ölçütlerin ayırt edicilik gücünün daha yüksek oluşundan kaynaklandığı değerlendirilmektedir.

Özellikle incelemeye konu olan ileti sayısının azaldığı ve yazar sayısının arttığı deneylerde, önceden tahmin edilebileceği gibi, yazar tespitinin zorlaştığı ve karşılaştırmanın, daha çok sayıda iletiyle yapılan deneylere göre, daha az güvenilir sonuç verdiği ortaya çıkmıştır. Diğer yandan bu çalışmanın örneklemi için veri toplayan, tasnif eden ve incelemeyi gerçekleştiren bir kişi olması dolayısıyla; karşılaştırmayı yapan, her deneyde kontrol iletisinin yazarı ile bir karşılaştırma iletisinin yazarının mutlaka eşleşeceğinin bilincindedir. Diğer bir deyişle iki yazarlı deneylerde %50, beş yazarlı deneylerde ise %20 ihtimalle yazar, hiçbir ölçüt olmaksızın doğru tespit edilecektir. Ne var ki 6’sı iki, diğer 6’sı beş yazarlı deneylerin hiçbirinde hatalı bir tespit yapılmamış ve hiçbir deneyde “sonuç” kısmı boş bırakılmamış, karşılaştırma sonucunda kararsız kalınmamıştır. Kontrol iletisi yazarının, karşılaştırma iletilerini oluşturan yazarlar arasında bulunmayabileceği durumlarda ise kimi deneylerde sonuç verilmeyebileceği, kararsız kalınabileceği değerlendirilmektedir. Bu durumda dahi, hatalı bir tespit yapılmamış olacaktır.

Yazar sayısının fazla olması ya da karşılaştırma iletilerinin az olmasının yanı sıra, kontrol iletilerinin çok kısa olup az miktarda dilsel veri içerdiği durumlarda da mukayesenin zorlaştığı görülmektedir. Karşılaştırma iletileri kısa olsa dahi, sayıca fazla olduklarında ölçütler yönünden belirgin birtakım farklılıklar ortaya koymaktadır. Ne var ki yazarı tespit edilmeye çalışılan kontrol iletileri, varoluşları itibariyle, ikame edilemez ve genişletilemez durumdadır. Kontrol iletisi için ayırt edici olmayan bir ölçüt ise ancak örneklemin elverişli olduğu, karşılaştırmada yer alan diğer başka yazarların birbirlerine olan benzerliklerini tespit etmede kullanılmakta ve böylelikle ikincil bir işleve sahip olabilmektedir.

Yapılan deneyler ve detaylarına yer verilen bulgular doğrultusunda, aşağıda maddeler hâlinde sıralanan konuların da birer ölçüt olarak yönteme eklenmesi gerektiği değerlendirilmektedir:

Büyük harf kullanımı: Yazarların iletiye, cümleye, tırnak içindeki cümleye başlarken veya özel adları (cümlenin başında veya içinde) yazarken büyük harf kullanma eğilimleri, kaynak gösterilen yöntemde ayrı bir başlık olarak ele alınmışsa da (Tanrıvere, 2018, s. 185) bu çalışma çerçevesinde konum yönünden bir yazım yanlışı olarak değerlendirilmiştir. Ne var ki bu ölçütün sıkça kullanılması, ayırt ediciliğinin yüksek olması ve bir “yazım yanlışı” olmanın ötesinde yazarlar tarafından tercih edilen üslubun bir parçası olması dolayısıyla, kaynak yöntemdeki gibi ayrı bir başlık olarak kullanılması gerektiği değerlendirilmektedir. Bu ölçüt, yazım ve noktalama başlığı altına eklenmiştir.
Sözcük sayısı: Özellikle birden fazla karşılaştırma iletisinin bulunduğu deneylerde, iletilerin uzunluğuna dair yazar eğilimlerinin ayırt edici olabildiği görülmüştür. Bu noktada, yazara ait iletilerdeki en az, en fazla ve ortalama sözcük sayıları, kontrol iletisi karşısında anlam kazanabilecek bir özelliktir. Bu ölçüt, sözcük ve bağlam başlığının konusu olarak eklenmiştir.
Kurgu: İletilerde sıklıkla karşılaşılan cümle türleri (basit, sıralı, birleşik) ile bir konunun nasıl ele alındığı, sözcük sayısı ile de yakından ilişkili olmakla birlikte, yazarların ayırt edilmesinde kullanılabilecek niteliktedir. Zira deneyler kapsamında iletileri incelenen yazarlardan bazılarının, bu yönde belirgin eğilimlerinin bulunduğu gözlemlenmiştir. Bu konu, içeriksel özelliği gözetilerek sözcük ve bağlam başlığında değerlendirilmektedir.
Vurgu > Diğer: Yöntemde vurgularla ilgili bir alt başlık bulunmakta ve burada büyük harf, tırnak işareti ve ünlem işaretiyle oluşturulan vurgular öngörülmektedir. Yapılan çalışmada, bazı harflerin tekrar edilmesi (“acccayip” gibi) ya da harfler arasında boşluk bırakılması (“n e d e n ?” gibi) gibi yollarla da vurgu oluşturulduğu görülmüştür. Bu nedenle, ilgili başlığın altına, öngörülmemiş olan ifadeler için “diğer” seçeneğinin eklenmesi kullanışlı olacaktır.
Profil bilgileri: Gerçekleştirilen son deneyde, ileti içeriklerinden hareketle yazarların cinsiyetlerine dair bir çıkarımda bulunulmuştur. Yazar tanıma uygulamasının temel amacı, metni oluşturan kişilerin ayırt edici dil kullanımlarını tespit etmek olsa da yazarların kimliklerine yönelik ayrım yapılabilmesine olanak sunan bilgiler de göz ardı edilmemelidir. Bu bağlamda yazarın cinsiyeti, yaşı, yaşadığı yer veya memleketi, mesleği gibi birtakım bilgileri açığa çıkaran ileti içerikleri de yazar tanıma çalışmaları yönünden ayrıca kayda değerdir. Sözcük ve bağlam düzeyinde, kullanılması hâlinde argo ile birlikte jargon ve terminoloji örneklerinin hangi konuya, bilim ya da meslek alanına dahil olduğu sorusu da yazara ilişkin profil bilgilerini elde etmeye yönelik olduğundan; “profil bilgileri” başlığının “argo ve jargon” kullanımını da kapsayacak biçimde, sözcük ve bağlam başlığı altında genişletilmesinin yerinde olacağı değerlendirilmektedir.
Şekil ve işaretler > Konum: Deneylerin gerçekleştirilmesinden önce yer verilen yöntemde şekil ve işaretlerle ilgili bir başlık oluşturulmuşsa da bu işaretlerin kullanıldığı konumlar itibariyle de yazarların ayırt edilebileceği görülmüştür. Yazarların iletinin başında, ortasında, sonunda ve hatta iletideki bir sözcük yerine çeşitli şekil ve işaretler kullanması dolayısıyla bunların konumları, ayrı bir alt başlık altında ele alınmalıdır.
İleti düzeni: Yapılan çalışmada, iletilerin biçimsel düzeninde yer yer boş satırların bulunduğu veya yazılanlara bir şiir gibi mısra düzeninde yer verildiği görülmüştür. Boş satırlar kimi zaman birbirinden bağımsız cümleleri, kimi zaman ise ileti içeriği ile konu etiketlerini ayırmak için ya da son sözcüğün veya sözcüklerin vurgusunu arttırmak için kullanılabilmektedir. Bu bağlamda iletinin şekil yönünden düzenine dair görülen eğilim, yazarları ayırt etmede kullanılabilmektedir. Bu son ölçüt ise ne doğrudan yazım ve noktalama ne de sözcük ve bağlam özellikleriyle ilintili göründüğünden, konu etiketleri ile şekil ve işaretler konularının da yer aldığı “diğer ölçütler” başlığına eklenmiştir.

Yukarıda önerilen ölçütlerin de yönteme dahil edilmesiyle birlikte genişletilmiş ölçüt tablosu, aşağıda sunulmuş olan Tablo 6’daki gibi geliştirilebilir.

Daha önce yöntem oluşturmaya yönelik gerçekleştirilen çalışmada 10 farklı yazardan 5’er adet olmak üzere toplam 50 ileti incelenmişken (Tanrıvere, 2018, s. 181), bu çalışmada 50 farklı yazarın 20’şer iletisi olmak üzere toplam 1000 gönderi göz önünde bulundurulmuş ve hem gerçekleştirilen deneylere bulgularıyla birlikte hem de bu deneyler sonucunda yöntem bağlamında faydalı olacağı görülen iyileştirmelere yukarıda yer verilmiştir.

Özellikle yazar sayısının fazla ya da ileti sayısının az veya kontrol iletisinin oldukça kısa olduğu durumlarda karşılaşılan güçlüklere yukarıda değinilmiştir. Her bir muhtemel yazarın kontrol iletisi karşısındaki benzerlik ve farklılıklarının tespit edilmesiyle en yakın muhtemel sonucun ortaya çıkarıldığı bu çalışmalarda, her iki yöndeki (benzerlik/ayrılık) ölçütlerin tekrar etme sıklıklarının da son derece önemli olduğu görülmüştür. Tıpkı dilbilgisel hataların münferit oluşu ya da tekrar edişi gibi, ölçütlerden birinde tespit edilen ayırt edici bir unsurun da münferit oluşu, her iletide yer alışı ya da her bir iletide birden fazla kez gözlenmesi, bu ölçütün ilgili inceleme özelindeki ispat gücünü etkilemektedir. Bu çalışmalar çerçevesinde sadece benzer veya sadece ayrı sonuç veren ölçütlere odaklanılmamalı, her iki yönden gerçekleştirilen incelemede en fazla benzerlik ve en az farklılık sonucunu veren yazarlar aranmalıdır.

Diğer yandan bu çalışma, çeşitli suç veya hukuki uyuşmazlık konuları bağlamında ihtiyaç duyulabilecek adli dilbilim uygulamalarını geliştirmek üzere gerçekleştirilmiştir. Soruşturma ve kovuşturma makamlarının da hiçbir zaman bir tek delili esas alarak hüküm vermemesi gerektiği açıktır. Dolayısıyla yukarıda örneklendirilen yazar tanıma çalışmalarından alınan sonuçlar, başka birtakım delillerce de desteklenerek bir örüntü oluşturduğunda anlam kazanacaktır. Bu nedenle, adli dilbilim çerçevesinde yazar tanıma çalışmasını yürüten kişi, yetersiz veriyle karşı karşıya kaldığında ya da yaptığı inceleme sonucunda kararsız kaldığında, bu durumu, görevlendirme makamına açıkça belirtmelidir.

Tablo 6. Uygulama ile birlikte genişletilmiş ölçütler
Yazım ve
Noktalama
Noktalama Konum Cümle içi
Cümle sonu
Tırnak içindeki cümle sonu
İleti sonu
Sayı Tekli
Çoklu Aynı
Farklı
Parantezler Normal parantez
Köşeli parantez
Küme parantezi
Büyüktür/küçüktür simgeleri
Tırnak işaretleri Tek
Çift
Yazım yanlışları Konum
Sözcük
Büyük harf kullanımı Cümle başlangıcı Tırnak içindeki cümle
Özel adlar Cümle başında
Cümle içinde
Sözcük ve Bağlam Eğilim sonucu ölçünlü dilden uzaklaşan sözcük ve ifadeler ile bunların oluşturulma biçimi
Sözcük sayısı (En az, en çok ve ortalama)
Kurgu (Cümle türleri ve konunun ele alınışı)
Vurgu Büyük harf
Tırnak işareti
Ünlem Parantez içinde
Diğer
Yabancı sözcük Kaynak dil
Profil bilgileri Argo ve jargon Bilim/meslek/ilgi alanı
Bağlaç Anlam değeri
Konu, anlaşılırlık ve tutarlılık
Yansıma sözcükler
Kısaltmalar Niteliği Kalıplaşmış
Kişisel Oluşturulma biçimi
Büyük harf kullanımı
Nokta kullanımı
Sayılar Niteliği Yazıyla
Rakamla
Nokta kullanımı
Diğer Ölçütler Konu etiketleri Konum
Sözcük / sözcük öbeği / cümle
Büyük harf kullanımı Etiket başında
Sözcük başında
Şekil ve işaretler Biçim Grafik
Noktalama işareti
Sayı Tekli
Çoklu Aynı
Farklı
Konum
İleti düzeni

Türkçe alan yazınına bakıldığında hem adli dilbilim hem de yazar tanıma ve özgül olarak kısa metinlerde yazar tanıma çalışmalarının nispeten oldukça yeni olduğu görülecektir. Bu nedenle, anılan bu konular üzerinde daha fazla çalışılması gerektiği açıktır. Zira gerçekleştirilen bu araştırmalar yalnızca bilimsel bir boşluğu doldurmakla kalmayacak, aynı zamanda adaletin etkin ve doğru, diğer bir deyişle kısa sürede ve maddi gerçeğe uygun biçimde yerini bulmasını sağlamaya hizmet edecektir. Yazar tanıma uygulamaları özelinde ise her örneklem için uygun olduğu iddia edilebilecek tek ve genel-geçer bir yöntem olmadığı daha önce belirtilmiştir (Tanrıvere, 2018, s. 189). Dolayısıyla yukarıda sınanmış ve birtakım ölçütlere yönelik ekleme önerileri sunulmuş bu yöntem, her zaman için geliştirilmeye açıktır ve incelemeye konu edilecek örneklem özelinde uyarlanabilir niteliktedir. Gelecekte bu yöntemi geliştirip güçlendirmeye ve yapılan tespitlerin ispat gücünü ifade etmeye yarayan ölçekler oluşturmaya yönelik çalışmalar yapılması, hem bilimsel hem de mesleki alanda kayda değer bir bilgi birikimi oluşturmaya yarayacaktır.