Nagy, Dóra and Sándor, Ákos (2024) Voice2text: a hanganyagátírás lehetőségei MI segítségével = Voice2text: the possibilities of voice transcription with AI. In: Az oktatás, a kutatás és a közgyűjtemények digitális transzformációja felsőfokon : NETWORKSHOP 2024 : 33. Országos Informatikai Konferencia : 2024. április 3-5. Eszterházy Károly Katolikus Egyetem, Eger. HUNGARNET Egyesület, Budapest, pp. 149-156. ISBN 9786158224321
|
Text
19_Nagy_Sandor.pdf - Published Version Available under License Creative Commons Attribution. Download (1MB) | Preview |
Abstract
Az MI-technológia fejlődésével manapság már rengeteg eszköz áll rendelkezésünkre hangfelvételek szerkeszthető szöveggé alakítására, amelyek mind sokkal egyszerűbbnek és gyorsabbnak tűnnek, mint a hallgatás utáni átgépelés. A korábban szinte csak angol nyelven elérhető programok többsége ma már boldogul a magyar nyelvvel is. Azonban kérdés, hogy ezek mennyire pontosak? Mennyi időt vesz igénybe, amíg kijavítjuk a hibákat? Kell-e minden esetben kézzel javítani vagy elfogadható a nyers gépi átirat? A cikkben röviden bemutatásra kerülnek különböző beszédfelismerő programok, illetve egy konkrét projekten keresztül ismertetjük saját tapasztalatainkat is | In this article, different methods of transcribing audio material are presented through concrete examples. With the advances in AI technology, there are now many tools available for converting audio recordings into editable text, all of which seem much easier and faster than transcribing after listening. Many of the programmes that were previously available almost exclusively in English now also work in Hungarian. But how accurate are they? How long does it take to correct errors? Do they always have to be corrected by hand, or is the raw machine transcription acceptable? In this article, we will introduce different speech recognition software and present our own experience through a specific project.
Item Type: | Book Section |
---|---|
Uncontrolled Keywords: | MI, mesterséges intelligencia, beszédfelismerés, hanganyagátírás, AI, artificial intelligence, speech recognition, voice transcription |
Subjects: | Z Bibliography. Library Science. Information Resources / könyvtártudomány > Z701.3.D54 Digitalisation/ICT and cultural heritage / Digitalizálás, ICT és kulturális örökség |
SWORD Depositor: | MTMT SWORD |
Depositing User: | MTMT SWORD |
Date Deposited: | 02 Jan 2025 13:06 |
Last Modified: | 02 Jan 2025 13:06 |
URI: | https://real.mtak.hu/id/eprint/212383 |
Actions (login required)
Edit Item |