| |
BAŞ SAYFA
DÜŞÜNCE ODASI
MAVİPENCERE
GÖZLEMEVİ
ARKABAHÇE
IŞIKLIYOL Alıntılık Belgelik Yarenlik Okumalık Bakmalık Gezinmelik |
VE SÖZLÜK YAZIMINA GENEL BİR BAKIŞ
I – GİRİŞ Sözlük yazımında bilgisayardan yararlanmaya başlanması sözlükçülüğü temelden değiştirmiştir. Bugün artık pek çok ülkede sözlükçülükten değil bilgisayar destekli sözlükçülükten bahsedilmektedir, zira bu ülkelerde sözlük yapımı tümüyle bilgisayarlaştırılmıştır; yani sözlük yapımı ile ilgili bütün süreçlerde, bilgisayar çalışmanın merkezine oturtulmuş, sözlük hazırlama yöntemi tümüyle değişmiştir.
Bu değişimin Türkiye ve Türkçe için aynı yönde ve yoğunlukta gerçekleşmediğini düşünüyor ve bundan büyük üzüntü duyuyorum. . Esasen gerek dilbilim ve gerek bilişim alanlarında sadece hevesli ve meraklı bir amatörden ileri gidemediğimi bildiğim halde bu bildiriyi hazırlama cüretini göstermeme bu üzüntüm neden olmuştur. Ayrıca, ülkemizde, yalnız sözlükçülükte değil, dilbilimle ilgili bütün inceleme, araştırma ve uygulama konularında bilişim teknolojilerinden yararlanmanın bir türlü yaygınlaşamadığını eklemek gerekir. Bununla beraber Türk Dil Kurumu yönetiminin bu eksikliğin farkına varmış olduğunu ve ‘durumdan görev çıkarılması’ sonucunda TDK çatısı altında bilgisayar destekli dilbilim konularında inceleme ve araştırmalar yapmak üzere bir çalışma grubu kurulmuş bulunduğunu memnunlukla görüyoruz.
Bu grubun çalışmalarına mütevazı bir katkı olmak amacıyla hazırlanan bu bildirinin bütün yüzeyselliğine rağmen, sözcüklerle uğraşmayı iş edinmiş amatör dilciler başta olmak üzere, sayıları pek az olan sözlük yazarlarımızın belki yeni arayışlara yönelmesine yardımcı olabileceği umulmaktadır. (Ne yazık TDK web sitesinden anlaşıldığına göre kurum çatısı altında böyle bir Çalışma Grubu artık yer almamaktadır.)
Diğer taraftan Türkçemiz için oldukça geniş kapsamlı bir derlem hazırlanmaya başlanmış olması sözlükçülüğümüzün parlak bir geleceği olacağı müjdesini vermektedir. Zira derlemler dilbilim çalışmalarında bir devrim yaratmış, derlem oluşturulmuş olan dillerde sözlük yazıcılığında büyük atılımlar gerçekleştirilmiştir Bu bakımdan bu müjdenin gerçek mutluluk kaynağı olacağına inanılmaktadır. Bilgisayarların sözlükçülükte kullanılmaya başlanmasından önce sözlüklerin hazırlanmasından başlıca iki kaynaktan yararlanılıyordu:
II - SÖZLÜK Sözlük dilimizin sözcüklerini abecesel bir sırayla ve yazım, okunuş, anlam ve kökeni ile ilgili bilgilerle birlikte veren bir kitap olarak tanımlanabilir. Diğer bir deyişle sözlük sözcükler hakkında bilgi veren bir başvuru kitabıdır. Sözlükler başlangıçta kişinin kendisi için hazırladığı hatırlatıcı notlar olarak ortaya çıkmış olabilir ki bugün de kişinin belki kendisi için değil ama başkaları için hazırladığı hatırlatıcı bilgiler içeren bir yapıt olarak karşımıza çıkmaktadır. Sözlük kısaca sözcükleri abecesel sırada listeleyen ve anlamlarını açıklayan bir kitap olarak tanımlayabiliriz" Sözlükler bilgi içeren metinler şeklinde de düşünülebilir. Ne var ki bu bilgiler tutarlı bir biçimde birbiri ile ilişkilendirilmemiş, binlerce küçük bölümlere ayrılmıştır. Bu bölümlerin her biri bir “sözlük maddesi” veya kısaca “madde” adını alır. Bu maddeler “madde başı” (veya başsözcük) denilen sözcüğe göre abecesel olarak dizilir. Sözlükler okuyucu açısında bakılırsa, başından sonuna kadar okunacak kitaptan ziyade, gerektikçe başvurulan yapıtlardır. Ansiklopediler de gerektikçe başvurulmak üzere hazırlanmış kitaplar olmakla beraber her iki tür kitabın içerdiği bilgiler birbirinden oldukça farklıdır. Ansiklopediler şeyler, olaylar, durumlarla ilgili bilgiler verir; sözlükler ise insanlar arasında iletişim için kullanılan bir dilin öğeleri hakkında bizi bilgilendirir. Bu fark daha çözümleyici bir bakış açısından şöyle açıklanabilir: Ansiklopedi Falan (olay, durum, şey) nedir? sorusuna, sözlük ise Falan (sözcük) ün anlamı nedir? sorusuna cevap bulmak için kullanılır A -Sözlük Türleri Sözlükler amaçları açısından betimleyici sözlükler ve buyurgan sözlükler diye ayrılabilir. Betimleyici sözlükler olanı olduğu gibi açıklarken buyurgan sözlükler yazım, dilbilgisi, biçem vb. bakımından doğru olanı bildirerek uyulması gerekeni belirtirler. . Bununla beraber bir dilin betimleyici sözlüğü de o dil konusunda önemli bir otorite sayılmakla kalmaz aynı zamanda dilde birliği sağlar, yazım ve dilbilgisi ile ilgili hatalarımızın düzeltilmesine yardımcı olur, konuşmada ve hatta davranışlarda iyi ve kötü örnekleri belirler, diğer bir deyişle betimleyici sözlükler dahi zamanla buyurgan bir işlev kazanırlar Sözlükler içerdikleri söz varlığının ve ait olduğu zaman dilimi ve açıklamaların amacı açısından da sınıflandırılabilirler. Sözlükler, sözcüklerin çoğu kez belirli bir zamandaki kullanımını açıklamayı amaçlar: Synchronic= koşut zamanlı= eşsüremli sözlük Bazı sözlükler ise zamanın akışı içinde dilin ve sözcüklerin geçirdiği gelişmeleri göstermeyi üstlenir: diachronic= gelişmeli= çok süremli sözlük Diğer taraftan sözlükteki açıklamalar içinde bulunulan zamanla ilgili ise çağdaş, daha önceki bir zamana ait is tarihsel sözlük olarak nitelendirilir. Bir halkın anadilini açıklamak için yazılmış olan sözlüklerde sadece tek bir dil kullanılır; diğer bir deyişle açıklanan sözcükler de açıklamak için kullanılan sözcükler de aynı dildendir. Anadili başka olan okuyucuların yararlanması için hazırlanan sözlüklerde ise açıklanan sözcükler hedef sözcükler ile bu sözcükleri açıklamak için kullanılan sözcükler iki ayrı dile ait olur. Bu tür sözlüklere ikidilli sözlük adı verilir. Sözlükler genel ve teknik sözlük şeklinde de ikiye ayrılır. B -Sözlüğün Yapısı Kitap haline getirilmiş bir sözlüğün bir dışyapı ’sı bir de içyapısı olduğundan söz edilir. Sözlüğün Dışyapısı denince cildinin ve kağıdının türü gibi maddî öğeler ile sayfalarının ve bölümlerinin düzeni gibi dış görünümü anlaşılır. Dışyapı genelde üç bölümden oluşur: Ön bölüm, ana bölüm, arka bölüm.
C - Sözlük Hazırlama Süreci Bir sözlüğün hazırlanması başlıca üç aşamada olur: Planlama, Hazırlama, Yapım 1 -Birinci Aşama: Planlama Birinci aşama olan planlama çok önemlidir ve çok dikkatle yürütülmelidir. Çünkü ortaya çıkan plan ve program üzerinde daha sonraki aşamalarda değişiklik yapılması hem çok masraflı hem de çok zaman alıcı olacaktır Planlama aşamasında, sözlüğün tasarımından başlayarak bütün üretim ve dağıtım süreçleri planlanacaktır. Bu aşamada özellikle şu çalışmalar da yapılmalıdır:
2 - İkinci Aşama: Hazırlama Bu aşamada önce sözlük maddelerinin ilk taslakları hazırlanır, daha sonra hazırlanan bu taslaklar Yazar veya Yazarlar Kurulu tarafından kontrol edilip düzeltilir. Bu aşamaya kadar insan emek ve yargısı ile ortaya çıkmış olan hazırlıkların kontrol edilip düzeltilmesi aşamasında bugün hemen bütün yayınevlerinde bilgisayarlardan yararlanılmaya başlanılmıştır. Hatta yayıncıların bilgisayarların katkısı hakkında biraz abartılı bir yaklaşım sergiledikleri söylenebilir. Oysa sözlükleri bilgisayarların değil insanların yaptığı unutulmamalıdır. 3 Son Aşama: Yapım (Baskı Ve Cilt ) Bundan çok değil 20–25 Yıl önce ikinci aşama sonunda ortaya çıkan el yazması hazırlıkların kitap haline dönüştürülmesi yazarlara ve yayıncılara kök söktüren ve çok zaman alan bir çalışma idi. Bugün artık en az ikinci aşamadan itibaren bilgisayarlar işin içine girmiş olduğu için yapım işi oldukça kolaylaşmıştır. Bununla beraber son ürünün ortaya konulmasında insan emeği ve yargısı önemini hala korumaktadır. III - SÖZLÜK YAZICILIĞI (Lexicography) Sözlük yazıcılığı oldukça uzun çalışmalar gerektiren bir uğraş koludur. Bu çalışmaların başlıca aşamaları:
gibi konularında bilgi sahibi olmak için araştırma ve incelemeler yapılmalıdır
Sözlük yazıcılığı dil ile ilgili hemen bütün disiplinlerle ve özellikle anlambilim, sözlükbilimi, dilbilgisi, biçembilim ile de ilgilidir.
Hemen bütün diller sürekli olarak değişmektedir. Bu yüzden sözlükler standart dili belirleme işlevini de yüklenmek zorundadır. Bu sürekli değişiklik
Hem yeni sözcüklerin dile girmesi Hem de var olan sözcüklerin (1)Yeni,(2>Değişik ve hatta
(3>Çok farklı
anlamlar kazanması şeklinde ortaya çıkar. Bu olgu, sözlüklerin sözcüklerin anlamlarını belirlemeye yönelik yaklaşımlarında da yeni arayışlara yol açtı. Örneğin bazı yeni sözlüklerde tanımlama yerine veya tanımlama yanında sözcüğün kullanış biçimlerine ağırlık verildiği görülmektedir. Sözlüklerin kullanım amaçlarından birisi de dile yeni giren veya yeni duyulan sözcüklerin anlamları ve kullanışları hakkında bilgi ermektir. Bu bakımdan sözlüklerin yeni basımları yapılır, okuyucular yeni basımlarını alırlar. Bilişim teknolojilerinin yarattığı olanaklar sayesinde bu amacın gerçekleşmesinde de kolaylıklar sağlanmıştır. Özellikle Türkçemize sel gibi akmakta olan yeni kavramları daha kapıda karşılayıp, ancak Türkçe karşılığını bulduktan sonra kabul etmek bir vatan borcu haline gelmiştir. Ne yazık ki bilişim teknolojilerinin bu alanda sağlayabileceği olanaklar hemen hiç kullanılmamaktadır. Yeni kavramlar ve yeni sözcükler daha çok özel teknik alanlarda ortaya çıkar. Bilişim alanı bu olgunun en belirgin örneğini oluşturur. Bu durumda sözlükçü, bu özel teknik alanların uzmanlarından yardım almak zorunda kalır ya da bu uzmanların kendi alanları ile ilgili terimbilim ile bizzat ilgilenmeleri gerekir. Dilbilimcilerle özel teknik alan uzmanlarının terimbilim konusundaki işbirliği yapmalarında da bilişim teknolojileri yararlı olmaktadır. Günümüzde, başta televizyon ve İnternet olmak üzere iletişim alanındaki büyük gelişme ve yaygınlaşma dolayısı ile class=textbgy>sözlüklerin bir dilin yazılı ve sözlü kullanımı konusunda standart oluşturma işlevini gittikçe yitirmekte olduğunu kabul etmek gerekmektedir. Bununla beraber sözlükçülerin dilin gelişimi ve yozlaşmasının önlenmesi konusundaki sorumlulukları azalmamıştır ve sözlük yazıcılarının çalışmaları halkı doğrudan doğruya etkilemeye devam etmektedir. Dilbilimin diğer alanları ile uğraşan diğer dilbilimciler bu kadar talihli değildirler. Sözlük yazarı, özel teknik alan uzmanları ile birlikte emek verecek ve sözcüklerin tam tanımlarını yazmaya çalışacaktır. Sözlük yapımı kökenbilim , sesbilim özel uzmanlık alanlarına ayrılmıştır. Sözlük yazarından beklenen başlıca özellikler,
IV - BİLGİSAYAR DESTEKLİ SÖZLÜK BİLİMİ (Computational Lexicology) Bilgisayar Destekli Sözlük Bilimi sözvarlığının incelenmesinde bilgisayardan yararlanılması anlamını taşır. Daha dar bir anlam verenler de vardır. Bunlar Bilgisayar Destekli Sözlük Bilimi sözünü, makineyle okunabilir sözlüklerin incelenmesi anlamında kullanmaktadır. Diğer taraftan Bilgisayar Destekli Sözlük Bilimi ifadesini Bilgisayar Destekli Sözlük Yazımı teriminden ayırmak gerekir. Bununla beraber Bilgisayar Destekli Sözlük Yazımı ile Bilgisayar Destekli Sözlük Bilimi sözlerini eşanlamlı olarak kullanan araştırmacılar da vardır.
V - DERLEM Çeşitli kaynaklardan çeşitli amaçlarla seçilip bir araya getirilerek (derlenerek) elektronik ortamda kayda geçirilmiş (=saklanmış) metinler toplamına derlenmiş metinler veya kısaca derlem denebilir. Bununla beraber derlem kelimesi bir dilbilim terimi olarak kullanıldığında biraz değişik bir anlam taşır. Bu takdirde derlem, herhangi bir dilde yayınlanmış bilimsel yayınlar, öyküler, şiirler, köşe yazıları, makaleler gibi basılı metinler ile konferans, tartışma, açık oturum, gösteri gibi etkinliklerdeki konuşma metinlerini dengeli ve ölçülü bir şekilde temsil etmek üzere toplanmış bir seçki şeklinde tanımlanabilir. Diğer bir deyişle derlem bir dilin basılı ve/veya sözlü kullanımını temsil eden örneklerini bir araya getirir. Dilbilim çalışmalarında buradan bir adım daha ileri gidilerek toplanan metinlerde geçen sözcük, ibare, cümle gibi bütün sözel öğelerin anlam ve işlemlerinin ve birbirleriyle ilişkilerinin belli normlara göre işaretlenmesi gerekir. Örneğin bir sözcüğün sıfat, fiil veya isim mi olduğu ve ayrıca sözdizimi açısından özne mi, tümleç mi yüklem mi olduğu, kabul edilen bir notasyona göre işaretlenir. Dünyanın pek çok dili için böyle derlemler yapılmış ve yapılmaktadır. Türkçemiz için de ufak çaplı daha çok akademik düzeyde birkaç çalışma yapılmıştır. Türk Dil Kurumunun girişimi ile geliştirilen bir derlem projesinin çok kısa bir zaman içinde uygulamaya konulacağı umulmaktadır. (Ne yazık ki bu proje TÜBİTAK’tan istenen mali destek sağlanamadığı için akim kalmıştır.)
Bildiği kadarıyla ilk derlem 1960’ larda geliştirilmişti. Bilişim teknolojilerindeki 1980 ve 1990 larda gerçekleşen olağanüstü ilerleme ve kolaylıklar derlem çalışmalarına ve bilgisayar destekli sözlük yapımına beklenmedik derecede ivme kazandırmıştır. Zira bilişim teknolojilerindeki gelişme bilgi işlem çalışmalarının gücünü yükseltmiş, maliyetini düşürmüş olduğu için yüz milyonlarca sözcük içeren derlemlerin hayata geçirilmesine olanak sağlamıştır.
VI - BİLİŞİM TEKNOLOJİLERİ VE SÖZLÜK YAZICILIĞI A Genel Bilgisayarlar sözlük yazıcılığını iki ana alanda da etkilemiştir. Gerçekten bilgisayarların devreye girmesi ile bir sözlüğün hazırlanmasında hem araştırma hem de üretim süreçleri değişikliğe uğramıştır.
Örneğin üretim alanında sözlükler artık veritabanı şeklinde saklanabilmekte ve böylece değişiklikler çok kolay ve kısa yoldan gerçekleştirilebilmektedir. Öyle ki ortaya çıkan değişiklik ihtiyaçları hemen yerine getirilebilmekte, bütün sözlük, diğer taraflarına dokunulmadan yeniden baskıya Veya Sunuma Hazırlanabilmektedir.
Sözlüklerin Yeni Sürümleri Bütün Sözlüğü Yeniden Tuşlamaya Gerek Kalmaksızın Baskıya Verilebilmektedir.
Diğer Taraftan Sözlüklerin Kağıt Ortamı Yerine Veya Bunun Yanında Elektronik Ortamda Da Kullanıcının Yararlanmasına Sunulmaktadır.
Araştırma Konusuna Gelince. Sözlük Yapıcılar devasa boyutta sözvarlığını içeren derlemlere kolayca erişebilmekte gerek dilbilgisi gerek anlam ve gerek çeşitli deyim ve deyişlere örnekleri ile birlikte ulaşabilmektedirler.
Sözlük, aslında, bir dildeki sözcüklerin kullanılışı hakkında bir takım genellemelerden ibarettir. O halde bu genellemelerin doğruluğundan nasıl emin olabiliyoruz. Bilgisayarların bu işe koşulmasının mümkün olacağı ortaya çıkmadan önce, sözlük yazarları, bu genellemelere, madde başı yapılacak sözcüğü bağlamıyla birlikte gösteren alıntılar destesinden yararlanarak ve biraz da kendi sezgilerine dayanarak erişmeye çalışıyorlardı. Kabul etmek gerekir ki; bir veya birkaç insanoğlu tarafından gerçekleştirilen okumalar temel alınarak yapılan bu genellemeler biraz tesadüfe bağlı olduğu için dağınık ve eksik olabilmekte, bir kişinin bireysel sezgisi ile varılan sonuçlar da çoğu kez öznel ve kısmî kalabilmekte idi. Oysa değişik türde yazı ve konuşma metinlerinden oluşan çok büyük hacimli derlemler, bir sözcüğün gerçek iletişimlerde kullanılış biçim ve yerlerini gösterdiği için o sözcük hakkında çok geniş bir veri yığınına dayalı olarak genelleme yapılmasını kanıtları ile birlikte mümkün kılıyor. Bu kanıtların gittikçe daha gelişmiş hale gelen yazılımlar aracılığı ile analiz edilmesi yoluyla da yapılmış olan genellemeler daha büyük güven verir olmaktadır.
B -Derlem Dilbilimciliği Derlem dilbilimciliği bugün Sözlük yazımı işinin en önemli temelini oluşturmaktadır. Öyle ki İngiltere’de sözlük yayıncılığı yapan hemen bütün yayınevleri derlem yaklaşımından yararlandıklarını ifade etmektedirler.
Bugün artık sözlük yazım ve yapımcılığında derlem yaklaşımından yararlanılmayan hiç bir alan kalmamış gibidir.
Diğer bir deyişle derlemlerin ortaya çıkması yalnız dilbilimde değil sözlükçülükte de bir devrim yaratmış bulunmaktadır.
Derlem sözcüğü Türkçemizde, Latince gövde anlamına gelen Corpus sözcüğünün karşılığı olarak kullanılmaktadır. Bu sözcüğe bir karşılık olarak bütünce sözcüğü ortaya atılmış ise de, bu sözcük fazla yaygınlık kazanamamıştır. Oysa, corpus sözcüğü için daha uygun bir karşılık olduğu halde,. bütünce sözcüğü değil font color=brown>collection sözcüğü gibi de algılanabilmekte olan derlem sözcüğü benimsenmiştir.
Aslında, dilbilim alanında kullanılan şekliyle “Derlem” çeşitli kaynaklardan çıkarılmış, doğal ve gerçek iletişim aracı olarak kullanılmış metinlerin çok büyük hacimli bir derlemesidir. Bu derleme çoğu kez yalnız yazılı metinleri değil konuşmaların yazıya çevrilmesinden elde edilen metinleri de içerir.
Sözcüklerle ilgili istatistiksel incelemeler açısından derlemler alıntı dosyalarından daha güvenilir bir veri kaynağı oluşturmaktadır.
Derlemdeki metinler gibi okuyucular tarafından yapılan seçimlere dayanmamaktadır.
Derlem dengeli ise - yani dünya ve yaşamla ilgili bütün genel bilgilerle birlikte bilimsel ve teknik alanlardaki özellikli metinleri içeren her kaynaktan orantılı olarak seçilmiş metinlerden oluşuyorsa – bu derlemden elde edilen veriler doğal dilin kullanımı sonunda ortaya çıkan bütün ürünleri nesnel olarak temsil edebilir.
Ne kadar büyük olursa olsun bir derlem bir dilin bütün sözvarlığını tam bir yansısı olamaz.
Derleme konulacak metinlerin belirlenmesinde iyi düşünülmüş ölçütler kullanılmalıdır. Diğer bir deyişle temsil hususuna çok dikkat edilmelidir, yani derlemin kapsama alanı her tür, alan, yer, durumu içermelidir.
Zira derlemin gerek tasarlanması ve gerek oluşturulmasında başarıya ancak temsil hususuna odaklanılarak erişilebilecektir.
“Dengeli Derlem“ le ilgili bu övgülere rağmen, derlem geliştiricilerin hepsi aynı görüşte değildir. Daha doğrusu, dengeli derleme karşı “ucu açık derlem”i savunanlar da vardır. Hatta deneblir ki derlem yapımında iki yaklaşım ortaya çıkmıştır: Fırsatçılık ve İlkecilik
Fırsatçılık yaklaşımında ele geçirilebilen her metin derleme alınır. İlkelilik yaklaşımında ise sadece belli bir amaca uygun olan metinler seçilir. İngiltere’de her iki yaklaşımın da birer temsilcisi bulunmaktadır. Bank of English (=İngilizce Bankası) derlemi daha çok her türden büyük hacimli metinlere öncelik verirken, British National Corpus (=İngiliz Ulusal Derlemi) İngilizcedeki en yaygın metinler dağarcığından dikkatle dengelenmiş örnek verilere yer vermektedir.
Bilişim teknolojideki ilerlemeler, gittikçe daha büyük derlemlerin oluşturulmasına olanak vermiştir. Diğer taraftan derlemler üzerinde yapılacak sorgulama, çözümleme, listeleme, dilbilimsel ve istatistiksel inceleme gibi işlemlerin daha hızlı ve daha doğru yapılmasını sağlayan yazılımlar geliştirilmiştir.
Derlemin büyüklüğü daha zengin veriler elde edilmesini, yazılımların hız ve doğruluğunun artması da daha güvenilir sonuçlara erişilmesini sağlamıştır.
C -Bağlamlı Dizim (Concordance) 1 – Ön Açıklama Dil ile uğraşanların ilk fark ettikleri gerçeklerden biri, sözcüklerin hemen daima başka sözcüklerle beraber bulunduklarıdır. Bu durumun ayırdına varan dilbilimcilerden çoğu bugün artık söylemin sözcüklerden değil sözcük tınazlarından oluştuğunu söylüyorlar.
Derlemlerle ilgili çalışmalardaki son gelişmeler sözcüklerin böyle öbekler halinde bulunmasının gerek konuşmalardaki ve gerek yazılardaki önemini vurgulamıştır. Bu bakımdan iyi bir sözlük, madde başı sözcüğün anlamını tanımlamakla kalmamalı, ayrıca o sözcüğün genellikle birlikte bulunduğu sözcükleri gösteren örnekleri de vermelidir.
Bilgisayar ortamında oluşturulmuş olan derlemler işte böyle sözcük öbeklerini belirlemeyi çok kolaylaştırmıştır. Bu görev Bağlamlı Dizimleme adı verilen bilgisayar programları tarafından kolayca yerine getirilir
Bağlamlı Dizim bir metindeki sözcükleri metinde yer alan bağlamıyla birlikte abecesel sırada listelenmesi şeklinde tanımlanabilir. Bu işi yapan büyük küçük, paralı, bedava pek çok program geliştirilmiş bulunmaktadır. Bu programların bir kısmı İnternet’te çevrim içi olarak dahi kullanılabilmektedir. Ne yazık ki daha çok İngilizce için yapılmış olan bu programlar Türkçe metinlerde Türkçemizin özel karakterleri açısından bazı sorunlar doğurmaktadır. Bununla beraber bi, Türkçe karakterleri dönüştüren bir arayüz kullanarak bu sorunları aşmak bazen mümkün olabilmektedir.
Bir Bağlamlı Dizimleme programı öncelikle hazırlanacak sözlükteki madde başı olarak seçilmiş sözcükler için, bu sözcüğün önünde ve arkasında bulunan sözcüklerle birlikte bağlamlı dizimler oluşturulmasını sağlar.
Bir sözcükle ilgili bağlamlı dizimler çıkarılması suretiyle o sözcüğü içeren deyim, deyiş, atasözü, özdeyiş gibi kullanımlar saptanabilmektedir. Sup>(Yukarıda Giriş bölümünde yer alan tablodaki basit örneğe bakınız)
2 - Anlam Belirlenmesi Bu tür kullanımları içeren listeler, ele alınan sözcük için yapılacak tanımı yazacak dilbilimcinin işini çok kolaylaştıracaktır. Doğaldır burada önemli olan dilbilimcinin kendi kararıdır, ne var ki, derlemden elde edilen verilen sözcüğün anlamı ve kullanımı hakkında daha net ve güvenilir bilgiler verilmesine yardımcı olacaktır.
3 - Kullanım Sıklığı Derlemin bir yararı da bir dildeki sözcüklerin kullanım sıklığının belirlenmesini sağlamasıdır. Bu suretle sözlükte yer alacak madde başı sözcüklerin seçilmesi kolaylaşır. Bu işi kotaran yazılımlar geliştirilmiştir.
4 - Diğer İşler Derlem üzerinde bilgisayar yardımıyla aşağıdaki işler de gerçekleştirilebilmektedir:
VII -MAKİNAYLA OKUNABİLİR SÖZLÜK Bu yazının bir amacı da Türk Dil Kurumu çatısı altında Doğal Dil İşleme konusunda yapılmakta olan çalışmalara destek olmak amacıyla Türkçe İçin Makineyle Okunabilir Bir Sözlük oluşturulması için bir proje önerisi sunulması idi.
Konuyu incelemeye başlamadan bu sözlüğün hazırlanmasında TDK Güncel Türkçe Sözlük ’ün oldukça önemli bir dayanak olacağı düşünülmüştü. Çok geçmeden burada fazla aceleci ve iyimser davranmış olduğumuz, bilgisayar destekli dilbilim incelemelerinde gerçekten yararlı olabilecek makineyle okunabilir bir sözlüğün hazırlanmasında çok daha geniş bir yelpazeye yayılmış bir “dayanak sözlük “destesine ihtiyaç bulunduğu anlaşıldı. Böylece daha ilk adımlarda gördük ki Türkçe için böyle bir proje önerisinin hazırlanmasını sağlayacak altyapı henüz yeterli değildir.
Bunun üzerine mevcut sözlüklerden yararlanılarak Makineyle Okunabilir Sözlük hazırlanması konusunda İngilizce dili ile ilgili olarak yapılan çalışmalar hakkında genel bir bilgi sunulması ile yetinilmesi uygun bulunmuştur.
Makineyle Okunabilir Sözlük (MOS) denince, öncelikle kağıda basılı sözlüğe karşı olarak, bilgisayar ortamında (elektronik ortamda) kayıtlı sözlük anlaşılır. Bu tanıma göre MOS elektronik sözlük ile eşanlamlıdır. Bu anlamda dahi MOS kullanım açısından kağıda basılı sözlüğe göre bazı farklılıklar (kolaylıklar) sağlar. Örneğin aranan sözlüğe daha kolay erişilebilir, eş ve zıt anlamlı sözcükler daha kolay bulunur, Bununla beraber doğal dil işleme uygulamalarında yararlanılmak üzere hazırlanan Makineyle Okunabilir Sözlük ise daha başka özellikler taşır.
Doğal dil işlemeye yönelik bilgisayar sistemlerinin oluşturulmasında kullanılmak üzere bilgisayarla okunabilen (bilgisayarlaştırılmış = bilgisayara dayalı) sözlüklere kesin ihtiyaç bulunduğu çoktan anlaşılmış bulunmaktadır. Böyle bir sözlüğün sözcükler hakkında hem sözdizimi ve hem de anlambilim bakımından güvenilir bilgiler verebilmesi ve geniş kapsamlı olması gerekmektedir. Diğer taraftan bu niteliklere sahip bir sözlüğün sadece dilbilim, sözlük yapımı ve bilişim gibi alanlardaki uzmanların ortaklaşa katkılarından oluşan insan emeği ile yapılmasının mümkün olamayacağı da ortaya çıkmıştır. Bununla beraber mevcut sözlüklerin bilgisayara dayalı sözlükler haline dönüştürülmesi için bu yarım veya tam otomatik yöntemler geliştirilmesi mümkün olmuştur. Bu konuda daha büyük ilerlemeler kaydedileceği de umulmaktadır.
VIII - ARAÇLAR Yukarıda sözlük yazımında bazı dillerle ilgili çalışma yapan sözlükçüler tarafından bilişim teknolojilerinden nasıl yararlanılmakta olduğu konusunda yüzeysel de olsa bazı bilgiler verilmeye çalışıldı. Konunun tamamlanması için biraz daha teknik bir alana, bu çalışmalarda kullanılan bilgisayar programlarına da bir göz atmak gerekmekte ise de burada sadece bu gibi programlardan birkaç örnek vermekle yetinilecektir.
Öncelikle TDK da bazı çalışma gruplarının aktif üyelerinden olan Prof. Ceval Kaya’nın iki programından söz edilmek gerekir. Hocamızın birinci programı TersDizici adını taşımakta ve bir dosyadaki kayıtların (kelime, mısra, beyit, cümle vs.) tersten dizinini hazırlamaktadır. Diğer program ise CİBAKAYA 2.2 adını taşımakta ve geçtiği yerleri de göstermek suretiyle bir metindeki bütün kelimelerin dizinini hazırlamaktadır.
İkinci olarak yukarıda da söz edildiği üzere İnternet’te pek çok Bağlamlı Dizimleyici programı bulunmaktadır. Bunların çoğu kullanıcının yükleyeceği (=upload) metin üzerinde bağlamlı dizimleme yapmaktadır.
Diğer bazı programlar da aşağıda açıklanmaktadır:
Toolbox: İki dilli bir sözlük yapısı için hazırlanmış anlam karşılaştırması gibi işler yapan bir program
DDP : (Dictionary Development Process) Sözlük Geliştirme Süreci adını taşıyan bu program, adından da anlaşıldığı gibi sözlük hazırlamaya yardımcı olarak kullanılabilecektir.
WeSay: Web tabanlı bir program olup sistematik olarak yapılandırılmış bir sözlük geliştirmek için kullanılmak için hazırlanmıştır
Elan: Halk dili araştırmacılarının yaptıkları ses ve görüntü kayıtlarına notlar ve yorumlar eklenmesi olanağı vermektedir.
ShoeBox: Esas itibariyle bir sözel veri tabanı programıdır. Biçimbirimsel çözümleme yordamını da içermektedir.
IX - SONUÇ Bilgisayar Destekli Sözlük Yazımı terimi hem geleneksel sözlük yazımı alanında bilişim teknolojilerinden yararlanma hem de doğal dil işleme alanında kullanılacak sözlüksel kaynakların tasarım ve uygulamaları anlamını taşımaktadır.
Sözlük yazımı giderek çok veri-yoğun bir çaba haline gelmiş olduğu için bilişim araçlarının desteği sözlük yazarlarına olağanüstü yararlar sağlayabilmektedir.
Bilgisayar, özellikle sözel verilerin elde edilmesini, düzeltilip düzenlenmesini, işlenmesini çok kolaylaştırmıştır. Ayrıca sözlük kullanıcıları açısından da büyük kolaylıklar ortaya çıkmıştır.
Diğer taraftan, doğal dil işleme sistemlerinde sözlüksel kaynaklara büyük gereksinim duyulmaktadır. Doğal dil işleme uygulamaları arttıkça bu gereksinimin daha da artması beklenir.
Bilgisayar Destekli Sözlük Bilimi açısından da sözlüklerin yapım, denetim, geliştirilmesi ve sözlüklerle ilgili araştırmaların yürütülmesi konularında çok umut verici olanaklar sunulmaktadır. Derlemler ve sözel veri tabanları giderek yaygınlaşmakta sözlük yapımı ile ilgili kuramsal ve uygulamalı çalışmalar derinleşmektedir.
Yukarıda bilgisayar destekli sözlük bilimi ve sözlük yazımında günümüzde erişilen noktalar ve gelecek için öngörülen gelişmeler hakkında bazı genel bilgiler vererek genç dilbilimcilerin konuyla ilgilenmeleri için bir pencere açmaya çalıştık. Bu amacı bir nebze olsun gerçekleştirmiş olmayı umuyoruz.
|