Türkçe Kısa Metinlerde Yazar Tanıma Yönteminin Sınanması ve Geliştirilmesi/Yöntem

Vikikaynak, özgür kütüphane

Yöntem

Geliştirilmesi hedeflenen ve bununla beraber verimliliği, olumlu ve olumsuz yönleri değerlendirilecek olan ölçütlerin üç temel başlık altında gruplandırılması önerilmektedir (Tanrıvere, 2018, s. 184): “Yazım ve noktalama” başlığı altında iletilerin biçimsel boyutu, “sözcük ve bağlam” başlığı altında bu iletilerin içeriksel yönleri ve doğrudan bu şekilde adlandırılmamış da olsa, ayrıca gruplandırılması gerektiği belirtilmiş olan “diğer ölçütler” bağlamında ise kullanımda olan teknoloji ve sosyal medya platformunun niteliklerine özgü biçimde konu etiketleri (hashtag) ve duygu belirtmeye yarayan yüz ifadeleri (emoticon) ile benzeri diğer işaretler ele alınmaktadır.

Yazım ve Noktalama

Yazım ve noktalama bakımından karşılaştırmada kullanılabileceği ifade edilen ölçütler, noktalama ve yazım yanlışları olmak üzere iki temel alt başlık içermektedir (Tanrıvere, 2018, s. 186).

Noktalama işaretleri sırasıyla “konum”, “sayı”, “parantezler” ve “tırnak işaretleri” olmak üzere dört farklı ölçüt grubuna ayrılmakta ve noktalama işaretlerinin cümle içinde, cümle sonunda, tırnak içindeki cümle sonunda ve ileti sonunda kullanımı; tek işaret, birden çok işaret ve birbirinden farklı işaretler hâlinde kullanımları; parantezlerin şekil yönünden normal parantez, köşeli parantez, küme parantezi veya büyüktürküçüktür simgeleriyle oluşturulması ve tırnak işaretlerinin tekli veya çift simge ile kullanımı ayrı birer ölçüt olarak belirtilmektedir (Tanrıvere, 2018, s. 186).

Rastgele seçilmiş ve yazarı bilinmeyen 1 ileti (buradan itibaren “karşılaştırma iletisi” olarak adlandırılacaktır) ile yazarı bilinen 12 farklı iletinin (buradan itibaren “kontrol iletisi” olarak adlandırılacaktır) dâhil olduğu bir uygulamada, yalnızca cümle sonundaki noktalama işaretleriyle birlikte cümlelerin başında büyük veya küçük harf kullanımının değerlendirilmesinin yeterli olduğu belirtilmiştir (Tanrıvere, 2018, s. 183). Buradan anlaşılmaktadır ki yöntem, büyük ve küçük harf kullanımına dair tespitleri, biçimsel ölçütlerin ikinci ana başlığı olan “yazım yanlışları” kapsamına almaktadır. “Konum” ve “sözcük” olarak iki alt başlık içeren yazım yanlışları bağlamında ayrıca, söz konusu yanlışın; münferiden yapılan bir hata mı, sürekli yapılan bir hata mı, yoksa yazarın kasten tercih ettiği bir üslup eğilimi mi olduğu önem taşımaktadır.

İlk durumda, yani yazarın yanlış bilgisinden veya dil kullanım eğiliminden kaynaklanmayan münferit bir hatayla karşılaşıldığında bu durumun, tam olarak tespit edilen yanlıştan önce ve sonra klavyede basılan tuşun ya da tuşların tespit edilmesiyle anlaşılabileceği öngörülmektedir. Örneğin “Kısa metinler” yazmak isteyen bir kimsenin “KIsa metinler”, “Kıssa metinler”, “Kısa metyinler” veya “Kısa merinler” yazmış olması, münferit birer hata olarak görülebilir. İlk örnekte klavyedeki shift tuşunu geç bırakan yazar, ikinci örnekte bir tuşa iki kere basmış, üçüncü örnekte “t” harfinden sonra Türkçe klavyede sağında bulunan “y” tuşuna da basmış, son örnekte ise “t” tuşu yerine Türkçe klavyede solunda bulunan “r” tuşuna basmıştır. Ayrıca noktalama işaretleri yönünden de “münferit hata” olarak değerlendirilmesi gereken bu yazımlarla, yazarın bir sonraki metninde muhtemelen karşılaşılmayacağı varsayılmaktadır. Bu nedenle münferit hatalar, yazarlar bakımından ayırt edici olarak ele alınmamalıdır.


  Diğer yandan süreğen hatalar ile tercih edilen üslubun içerdiği ve ölçünlü dilden ayrılan dil kullanımları, yazarın muhtemelen her metninde yer alabilecektir. Bilinçli bir eğilim olarak yer verilen kullanımların, yanlış dil bilgisi kaynaklı yapılan hatalardan farkı ise yazarın, herhangi bir nedenle farklı bir üslup tercih etmesi durumunda bu kullanımlarla karşılaşılmayacağı varsayımıdır. Buna örnek olarak herhangi bir kimseye hitap etmeksizin, doğrudan kendisini takip eden diğer kullanıcılar geneline kendi vücut ağırlığıyla ilgili ileti yazan bir Twitter kullanıcısı sürekli “külo” yazımını tercih ederken, yazışma çerçevesinde kendisinin beslenme ve diyetetik uzmanı olduğu anlaşılan (ve hesap bilgilerinde bu yönde beyan bulunan) kişiye hitap ettiği (mention) iletilerde “kilo” yazmayı tercih ettiği görülmüştür. Dolayısıyla bilinçli eğilime dayalı biçimde ölçünlü dilden ayrı kullanımların varlığı, yazarın tercih ettiği üsluba, dolayısıyla iletişim sürecinde yer alan değişkenlere bağlı görünmektedir. Yanlış bilgiye dayanan yazım hatalarında ise bu bilgi düzeltilmediği müddetçe yazar, aynı hatayı üslup seçiminden bağımsız olarak tekrarlamaya devam edecektir. Önerilmiş olan yöntemde, hata kavramından uzaklaşılarak, yazarın bilinçli tercihi olduğu değerlendirilen yazımların, açıkça belirtilmese de örtülü biçimde sözcük ve bağlam yönünden yapılacak karşılaştırma içerisinde ele alındığı görülmektedir (Tanrıvere, 2018, s. 187).

Yazım yanlışları yönünden yapılan “konum” ve “sözcük” ayrımı; bir hatanın, iletinin belirli bir yerinde mi, yoksa belirli bir sözcük üzerinde mi tekrar ettiğini tespit etmeye yöneliktir. Örneğin “bas” yerine “bass” sözcüğünün sürekli kullanımı sözcük yönünden bir hatayken, cümlelere veya iletinin sadece ilk cümlesine küçük harfle başlamak ise konum yönünden bir hata olarak değerlendirilmektedir. Ayrıca, şimdiye dek gerçekleştirilen önsel çalışmalarda sıkça karşılaşıldığı için belirtilmesi gerekli görülmektedir ki, sözcüklere getirilen eklerin yazımında görülebilecek hatalar konum, bağlaçların yazımında rastlanılan yanlışlar ise sözcük yönünden değerlendirilebilecek yazım hatalarıdır. Sözcüklerin arasında birden fazla boşluk bırakmak veya boşluk bırakmamak, bir cümleyi ardışık iki nokta ile sonlandırmak veya soru işareti ile sonlandırılması gereken cümlenin sonunda noktaya yer vermek de -münferit olmadığı sürece- konum yönünden yapılan hatalardır.

Sözcük ve Bağlam

Sözcük ve bağlam bakımından yapılacak karşılaştırma için belirli bir ölçütten bahsedilmemiş, verilen uygulama örneğinde ise “ölçünlü dilin dışındaki ifadeler”, “küfürler”, “yapıca bağımsız tümcelerin bir araya getirilişi” görgül ve betimleyici biçimde ele alınmıştır (Tanrıvere, 2018, s. 187). Bununla birlikte iletinin kime atfedildiğinin belirli ya da belirsiz oluşu, öznenin içerik yönünden açık ve anlaşılır oluşu, örnek metindeki sövme belirten yazımların içeriğinin yanı sıra cümle içerisinde bulundukları konumlar ve oluşturulma biçimleri (morfolojisi), cümlelerde bağlaç kullanma durumu ve tekrar eden sözcük bulunup bulunmadığı da incelemeye konu edilmiştir (Tanrıvere, 2018, s. 188).

Söz konusu uygulama örneğinde “milyar” sözcüğü yerine “milyor”, “euro” yerine “yuro” yazımı da ele alınmış (Tanrıvere, 2018, s. 187) ve böylelikle yöntem bakımından bir farklılık doğmuştur. Daha önce sunulmuş olan bilgiler bakımından bu yazımların, ilgili başlık altında (yazım ve noktalama > yazım yanlışları > sözcük) değerlendirilmesi gerektiği düşünülse de yazımların niteliği göz önünde bulundurulduğunda bunların birer “hata” değil, “eğilim” olarak değerlendirildiği ve incelenen ileti yazarının tercih ettiği üslubun bir parçası olarak sözcük ve bağlam kapsamında ele alındığı anlaşılmaktadır.

Yer verilen uygulama ile birlikte sunulan bilgiler değerlendirildiğinde, sözcük ve bağlam özelliklerine dair yapılacak incelemenin, büyük ölçüde, karşılaştırmayı yapacak kişinin değişiklik ve geliştirmesine açık olduğu görülmektedir. Başka bir deyişle, sunulmuş olan ayırt edici ölçütlerin haricinde, verili metinler arasındaki farkların veya benzerliklerin başka hangi yollarla ortaya çıkarılabileceğine veya pekiştirilebileceğine dair tespit, incelemeyi yapan kişiye kalmaktadır. Şimdiye dek yapılan önsel çalışmalar ve sosyal medyadaki gözlemler ise aşağıda belirtilen konuların, sözcük ve bağlam yönünden ayırt edici bir ölçüt olarak değerlendirmelerde ele alınması gerektiğini göstermiştir. Burada yer verilmeyen sözcük ve bağlam ölçütleri, her bir karşılaştırma (ve örneklem) özelinde incelemeyi yapacak kişi tarafından geliştirilmeli ve çeşitlendirilmelidir.

Yazarın tercih ettiği eğilim sonucu ölçünlü dilden uzaklaşan sözcük ve diğer ifadeler ile bu ifadelerin oluşturulma biçimi, ayırt etmede kullanılabilecek niteliktedir. Ölçünlü dilden ayrılan sözcüğün yazar tarafından tercih edilen bir kullanım mı, yoksa münferit ya da süreğen bir hata mı olduğu, daha önce de belirtildiği gibi incelemeyi yapan kişiye bırakılmaktadır. Ne var ki bu üç seçenekten ilkinin elenmesi durumunda söz konusu sözcük, “yazım ve noktalama” kapsamında bir yazım yanlışı olarak ele alınacak, sonuç olarak başka başlık altında da olsa değerlendirmeye dahil olacaktır.


  Yazılı bir iletide vurgu yaratmak için tercih edilen kullanımlar da önem arz etmektedir. Bir sözcüğün ya da sözcük öbeğinin büyük harfle, tırnak içinde, ünlemle veya parantez içinde ünlemle ya da vurgulandığını belirtecek başka herhangi bir şekilde yazımı, bu noktada ayırt edici olabilecek niteliktedir. Bunun yanı sıra iletide yabancı bir dildeki sözcüğün kullanılması, bu sözcüğün kaynak dili, terminoloji dahil olmak üzere jargon ve ayrıca argo kullanımı, bağlaçlara yer verilmesi ve bu bağlaçların anlam değeri (olumlu-olumlu ya da olumlu-olumsuz gibi), özellikle muhtemel yazarlara ait birden fazla karşılaştırma iletisi bulunan durumlarda ileti içeriğinin kontrol iletisi karşısındaki konu benzerliği ile anlaşılır ve tutarlı oluşu da yazarları ayırt etmede kullanılabilmektedir. Zira gerçekleştirilen gözlemlerde, anılan sosyal medya platformundaki bazı kullanıcıların; insan ilişkileri, spor, dizi/film vb. belirli konu başlıkları özelinde ileti oluşturmaya eğilimli oldukları tespit edilmiştir.

Yansıma ses (sözcük) ve kısaltma kullanımı ile sayıların yazımı ise MacLeod ve Grant (2012, s. 218) tarafından önerilmiş olup Türkçe kısa metinler üzerinde de kullanışlı olacağı öngörülmektedir.

Diğer Ölçütler

“Diğer ölçütler” başlığı altında ise daha önce ifade edildiği gibi konu etiketleri ile duygu belirten yüz ifadelerinin ele alınması öngörülmektedir (Tanrıvere, 2018, s. 184).

Konu etiketleri bakımından bunların konumu, bir ya da daha fazla sözcükten ibaret veya cümle oluşları, birden fazla sözcük olması hâlinde her sözcüğün ilk harfinde büyük harf kullanma eğilimleri değerlendirilmektedir. Duygu belirtmeye yarayan yüz ifadelerinin ise öntanımlı grafikler veya noktalama işaretleriyle oluşturulması, bir veya çok sayıda aynı ya da farklı grafik veya noktalama işareti kullanılması gibi hususlar incelemeye konu edilmektedir. Bu noktada belirtmek gerekir ki, her ne kadar “yüz ifadeleri” olarak anılsa da öntanımlı grafikler çok çeşitli olabilmekte ve hayvanlar, bitkiler, taşıtlar, bayraklar gibi farklı görseller içerebilmektedir. Bu nedenle ilgili ölçüt, “şekil ve işaretler” olarak adlandırılmıştır.

Tüm bu bilgileri özetlemek gerekirse, uygulanacak yönteme dair aşağıdaki şekilde bir çizelge ortaya çıkmaktadır. Yazar tanıma çalışması, detayları bir sonraki başlık altında sunulmuş olan veri kullanılarak, bu çizelgede gösterilmiş olan ölçütler ile gerçekleştirilmektedir.

Tablo 1. Uygulamada kullanılacak ölçütler
Yazım ve
Noktalama
Noktalama Konum Cümle içi
Cümle sonu
Tırnak içindeki cümle sonu
İleti sonu
Sayı Tekli
Çoklu Aynı
Farklı
Parantezler Normal parantez
Köşeli parantez
Küme parantezi
Büyüktür/küçüktür simgeleri
Tırnak işaretleri Tek
Çift
Yazım yanlışları Konum
Sözcük
Sözcük ve Bağlam Eğilim sonucu ölçünlü dilden uzaklaşan sözcük ve ifadeler ile bunların oluşturulma biçimi
Vurgu Büyük harf
Tırnak işareti
Ünlem Parantez içinde
Yabancı sözcük Kaynak dil
Argo ve jargon Terminoloji ise bilim/meslek alanı
Bağlaç Anlam değeri
Konu, anlaşılırlık ve tutarlılık
Yansıma sözcükler
Kısaltmalar Niteliği Kalıplaşmış
Kişisel Oluşturulma biçimi
Büyük harf kullanımı
Nokta kullanımı
Sayılar Niteliği Yazıyla
Rakamla
Nokta kullanımı
Diğer Ölçütler Konu etiketleri Konum
Sözcük / sözcük öbeği / cümle
Büyük harf kullanımı Etiket başında
Sözcük başında
Şekil ve işaretler Biçim Grafik
Noktalama işareti
Sayı Tekli
Çoklu Aynı
Farklı