REAL

A nganszan nyelv számítógépes morfológiai elemzése = Computational Morphological Analyser of Nganasan

Várnai, Zsuzsa and Szeverényi, Sándor and Wagner-Nagy, Beáta (2010) A nganszan nyelv számítógépes morfológiai elemzése = Computational Morphological Analyser of Nganasan. Project Report. OTKA.

[img]
Preview
PDF
60807_ZJ1.pdf

Download (744Kb)

Abstract

Jelen kutatás közvetlen előzményének tekinthető az a projektum (NKFP 2001/5/135: Komplex uráli nyelvészeti adatbázis), amelynek egyik célkitűzése az volt, hogy kilenc uráli nyelvhez számítógépes morfológiai elemzőprogram készüljön. OTKA projektumunk a modell, azaz az elemzőprogram fejlesztését, a hiányos és ellentmondásos adatok, paradigmák tisztázását, újabb szövegek, hangzóanyagok terepen történő gyűjtését, valamint a nganaszan nyelv teljes és részletes leírását tűzte ki céljául. Az elemző tökéletesítése mellett nagy hangsúlyt fektettünk egyrészt az újabb szövegek gyűjtésére, másrészt a részletes nyelvi leírásra. Célul tűztük ki azt is, hogy szövegeinket elérhetővé tesszük, hiszen a kisebb uráli nyelvek kutatásában az egyik legnagyobb probléma, hogy kevés a hozzáférhető, elektronikus formátumú szöveg. Mindezt erősítette az a tény, hogy a nganaszan az egyik legveszélyeztetettebb uráli nyelvek egyike, anyanyelvi szinten ma már csak a legidősebb generáció (40-50 fölötti nemzedék) beszéli. Ennek megfelelően a kutatás folyamán a következő eredmények születtek: - Egy morfológiai elemző program, amely az interneten on-line elérhető, és melynek segítségével nganaszan szövegek elemezhetők. - Az online elemző által megelemzett, általunk egyértelműsített, annotált szövegek. - A nganaszan nyelv korábbiaknál sokkal alaposabb és korszerűbb angol nyelvű leírását adjuk egy modern szemléletű monográfia keretében. | The present research is based on the project NKFP 2001/5/135: Komplex uráli nyelvészeti adatbázis (Complex Uralic Linguistic Database) that aimed - among other objectives - to develop morphological analyzer for nine small Uralic languages. The objective of the present OTKA project was to further develop its model - the morphological analyzer-, to disambiguate the incomplete or contradictory data and paradigms, to collect new data on site, and to give an exhaustive description the Nganasan language. Apart from the improvement of the morphological analyzer, great emphasis was put on the collection of new texts as well as on providing a detailed linguistic description. A further objective was to offer texts reachable on-line, since one of the main problems in the research of the smaller Uralic languages is the lack of sufficient electronic texts. The fact that Nganasan is one of the most endangered Uralic languages, spoken as a mother tongue only by the oldest generation (those older than 40-50) puts emphasis on the importance of this research. The results obtained during the project are the following. - A morphological analyser for Nganasan texts that can be reached on-line. - Annotated texts, analysed by the software and disambiguated by the researchers. - A modern description of the Nganasan language in a monography far more detailed and up-to-date than previous works.

Item Type: Monograph (Project Report)
Uncontrolled Keywords: Nyelvészet
Subjects: P Language and Literature / nyelvészet és irodalom > P0 Philology. Linguistics / filológia, nyelvészet
Depositing User: Mr. Andras Holl
Date Deposited: 07 Sep 2010 14:30
Last Modified: 30 Nov 2010 12:19
URI: http://real.mtak.hu/id/eprint/2527

Actions (login required)

View Item View Item