REAL

Magyar spontán beszéd adatbázis = Hungarian Spontaneous Speech Corpus

Gósy, Mária and Gráczi, Tekla Etelka and Gyarmathy, Dorottya and Váradi, Tamás and Veresné Horváth, Viktória (2012) Magyar spontán beszéd adatbázis = Hungarian Spontaneous Speech Corpus. Project Report. OTKA.

[img]
Preview
PDF
78315_ZJ1.pdf

Download (237kB) | Preview

Abstract

A kutatás során a terveknek megfelelően ugyanazon protokoll mentén rögzítették 90 adatközlő spontán beszédét, mondatismétléseit és felolvasásait, elvégezték a digitalizálást, az anonimizálást, a hanganyagok átírását, valamint az archiválást. A beszédanyag rögzítése állandó felvételi körülmények között történt, korszerű technikai háttér biztosításával. A beszélők közül 50 nő, 40 férfi, életkoruk 20 és 73 év közötti. A teljes beszédanyag időtartama 89 óra. Megvalósult a hanganyagok lekérdezhetősége a protokollegységek, illetve az adatközlők szerint. Számos, több szempontú fonetikai kutatást végeztek az adatbázis felhasználásával, összesen 31 tanulmányt publikáltak magyar és angol nyelven. A kutatott témák a beszéd szegmentális és szupraszegmentális szintjével, a spontán beszéd jellemzőivel, az olvasás és a spontán beszéd sajátosságaival, illetve a társalgás egyes fonetikai tényezőivel foglalkoztak. Az adatbázist a nyelvészet más területén kutatók számára is hozzáférhetővé tették. A kutatás eredményeként létrejött adatbázis nemzetközileg is és az ezredforduló magyar beszédének rögzítésével kulturálisan is maradandó értéket képvisel. Közvetlen tudományos jelentőségén túl számos gyakorlati alkalmazáshoz is felhasználható, és ez társadalmi tekintetben is növeli a jelentőségét. | In accordance with the plans, project participants recorded spontaneous speech samples, sentence repetitions and text recitals from 90 subjects using identical recording protocols, and digitalised, anonymised, transcribed, and archived the whole material. Speech recording was carried out under uniform recording circumstances and in an up-do-date technological setting. The subjects included 50 women and 40 men; their ages ranged from 20 to 73 years. The total duration of the recorded material is 89 hours. The material can be searched/accessed both in terms of protocol units and in terms of subjects. Several multi-purpose phonetic investigations were carried out using the data base; as a result, a total of 31 papers have been published either in Hungarian or in English. The research topics involved both segmental and supra-segmental properties of speech, specific characteristics of spontaneous speech, peculiarities of reading aloud vs. spontaneous speech, as well as selected phonetic aspects of conversation. The data base has been made accessible for researchers working on other aspects of linguistic description, too. The data base represents a lasting value in the international scene and also in a cultural sense by recording the Hungarian speech of the turn of the millennium. Beyond its immediate scientific importance, it can be made use of in a number of practical applications, a fact that contributes to its general significance for the society at large.

Item Type: Monograph (Project Report)
Uncontrolled Keywords: Nyelvészet
Subjects: P Language and Literature / nyelvészet és irodalom > PH Finno-Ugrian, Basque languages and literatures / finnugor és baszk nyelvek és irodalom > PH04 Hungarian language and literature / magyar nyelv és irodalom
Z Bibliography. Library Science. Information Resources / könyvtártudomány > ZA Information resources / információforrások > ZA4450 Databases / adatbázisok
Depositing User: Kotegelt Import
Date Deposited: 01 May 2014 06:20
Last Modified: 09 Jul 2014 08:55
URI: http://real.mtak.hu/id/eprint/12552

Actions (login required)

Edit Item Edit Item