Hakkında

Türkçe Dil Deposu (TDD), Türkçe Doğal Dil İşleme ve bilişimsel dilbilim için veri kümeleri, dil modelleri, derlemler ve doğal dil işleme araçları gibi veri kaynakları ve yazılımların paylaşıldığı bir platformdur. TDD, araştırma topluluğu tarafından yürütülen kâr amacı gütmeyen bir platformdur. TDD’nin mevcut çabaları üç ana projeye odaklanmıştır:

Veri Deposu, ayrıntılı üst metin bilgileriyle sunulan Türkçe veri kümelerinden oluşan bir koleksiyondur. Metin künyelerinde boyut, veri türü, kaynak, lisans türü vb. diğer bilgiler verilmektedir. Her veri seti, platforma yüklenmeden önce veri kümesinin kullanılabilirliğini ve kalitesini sağlamak için TDD ekibi tarafından kontrol edilir. Ayrıca, veri kümesi için referans verilebilir bir DOI yoksa, her veri kümesi için bir DOI TDD ekibince sağlanmaktadır.
Mukayese platformu, yazım denetiminden Doğal Dil Anlama (NLU) görevlerine kadar çeşitli Türkçe NLP araçları ve görevleri için bir kıyaslama platformudur. Her kıyaslama bir lider panosu ile sağlanır, bir veya daha fazla veri kümesi içerir ve iki veya daha fazla temel modele sahiptir.
Corpus arayüzü, kullanıcı dostu bir derlem arayüsü sunmaktadır. Sunulan derlemler dilbilim veya sosyal bilimler alanında çalışan akademisyen ve araştırmacıların kullanımına yöneliktir. TDD derlemleri altında farklı kaynaklardan gelen verilerle oluşturulmuş ve farklı öznitelikler bakımında işaretlenmiş derlemler sunmayı amaçlamaktayız.


Üniversiteler


Kamu ve Özel Sektör Kurumları

EnglishTurkey