REAL

Egy komi-permják korpusz létrehozásának kihívásai: igék és melléknevek

Szabó, Ditta and F. Gulyás, Nikolett and Németh, Szilvia Viktória (2024) Egy komi-permják korpusz létrehozásának kihívásai: igék és melléknevek. NYELVTUDOMÁNYI KÖZLEMÉNYEK, 120. pp. 21-48. ISSN 0029-6791

[img]
Preview
Text
Szaboetal_REAL.pdf - Published Version

Download (387kB) | Preview

Abstract

A tanulmány egy új komi-permják korpusz (PermCorp) létrehozásának aktuális lépéseiről számol be. Projektünk (NKFIH FK 143242) célja a nyelv első gold sztenderd korpuszának létrehozása elsősorban korábban már publikált, írott szövegek alapján. A korpusz szövegeit kutatócsoportunk a FieldWorks Language Explorer (FLEx) szoftver segítésével annotálja oly módon, hogy a program beépített általános célú morfológiai elemzőjével előcímkézzük a mondatokat, majd az előállt gépi javaslatokat manuálisan ellenőrizzük. A projekt kimeneteleként elérhetővé tesszük majd a FLEx állományt, melynek segítségével más kutatók is könnyebben annotálhatják a saját komi-permják szövegeiket. Ahhoz, hogy az általános elemzőt használni lehessen, fel kell készítenünk a komi-permják nyelvrendszerre, vagyis a szoftver igényei szerint formalizálnunk kell a komi-permják morfológiát. A tanulmány az elemző alapelveinek ismertetése után ennek a folyamatnak a kihívásaiból mutat be néhány konkrét példát a melléknevekkel és az igékkel kapcsolatban.

Item Type: Article
Uncontrolled Keywords: FieldWorks Language Explorer (FLEx), komi-permják, korpuszépítés, melléknevek, igék
Subjects: P Language and Literature / nyelvészet és irodalom > P0 Philology. Linguistics / filológia, nyelvészet
SWORD Depositor: MTMT SWORD
Depositing User: MTMT SWORD
Date Deposited: 28 Jan 2025 15:33
Last Modified: 28 Jan 2025 15:33
URI: https://real.mtak.hu/id/eprint/214553

Actions (login required)

Edit Item Edit Item