REAL

Voice2text: a hanganyagátírás lehetőségei MI segítségével = Voice2text: the possibilities of voice transcription with AI

Nagy, Dóra and Sándor, Ákos (2024) Voice2text: a hanganyagátírás lehetőségei MI segítségével = Voice2text: the possibilities of voice transcription with AI. In: Az oktatás, a kutatás és a közgyűjtemények digitális transzformációja felsőfokon : NETWORKSHOP 2024 : 33. Országos Informatikai Konferencia : 2024. április 3-5. Eszterházy Károly Katolikus Egyetem, Eger. HUNGARNET Egyesület, Budapest, pp. 149-156. ISBN 9786158224321

[img]
Preview
Text
19_Nagy_Sandor.pdf - Published Version
Available under License Creative Commons Attribution.

Download (1MB) | Preview

Abstract

Az MI-technológia fejlődésével manapság már rengeteg eszköz áll rendelkezésünkre hangfelvételek szerkeszthető szöveggé alakítására, amelyek mind sokkal egyszerűbbnek és gyorsabbnak tűnnek, mint a hallgatás utáni átgépelés. A korábban szinte csak angol nyelven elérhető programok többsége ma már boldogul a magyar nyelvvel is. Azonban kérdés, hogy ezek mennyire pontosak? Mennyi időt vesz igénybe, amíg kijavítjuk a hibákat? Kell-e minden esetben kézzel javítani vagy elfogadható a nyers gépi átirat? A cikkben röviden bemutatásra kerülnek különböző beszédfelismerő programok, illetve egy konkrét projekten keresztül ismertetjük saját tapasztalatainkat is | In this article, different methods of transcribing audio material are presented through concrete examples. With the advances in AI technology, there are now many tools available for converting audio recordings into editable text, all of which seem much easier and faster than transcribing after listening. Many of the programmes that were previously available almost exclusively in English now also work in Hungarian. But how accurate are they? How long does it take to correct errors? Do they always have to be corrected by hand, or is the raw machine transcription acceptable? In this article, we will introduce different speech recognition software and present our own experience through a specific project.

Item Type: Book Section
Uncontrolled Keywords: MI, mesterséges intelligencia, beszédfelismerés, hanganyagátírás, AI, artificial intelligence, speech recognition, voice transcription
Subjects: Z Bibliography. Library Science. Information Resources / könyvtártudomány > Z701.3.D54 Digitalisation/ICT and cultural heritage / Digitalizálás, ICT és kulturális örökség
SWORD Depositor: MTMT SWORD
Depositing User: MTMT SWORD
Date Deposited: 02 Jan 2025 13:06
Last Modified: 02 Jan 2025 13:06
URI: https://real.mtak.hu/id/eprint/212383

Actions (login required)

Edit Item Edit Item