Látics, Barbara (2025) Olvashatóságot meghatározó szövegtényezők és automatizált szövegelemző szoftverek = Factors of Readability in Text and Automated Text-Analysis Software. ANYANYELVI KULTÚRAKÖZVETÍTÉS, 8 (2). pp. 4-23. ISSN 2063-2991
|
Text
LB2025II.pdf - Published Version Available under License Creative Commons Attribution Non-commercial No Derivatives. Download (823kB) | Preview |
Abstract
Oktatási környezetben a rosszul olvasható tartalom akadályozhatja a megértést és a tanulást, ami hatással lehet a diákok tanulmányi eredményére és szövegértésére. A klasszikus olvashatósági formulák gyakran olyan felszíni szövegjellemzőkön alapulnak, mint például az átlagos mondat- és szóhosszúság. Nem veszik figyelembe az olvashatóság egyéb árnyalatait, ezért a rájuk való támaszkodás korlátozó és felszínes lehet (Marulli et al. 2024, Látics–Gombos 2025). A tanulmány azonosítja azokat a főbb tényezőket, amik hatással lehetnek egy szöveg nehézségére, olvashatóságára. A magyar nyelvű szakirodalom a tankönyvanalízis felől közelítve, a nyelvi szintek szegmentálásával – a szavak, a mondatok és a szöveg szintjén – tárja fel ezeket (Fóris 2002, Kojanitz 2004a, Domonkosi 2013). Az olvashatóság mérhetővé tétele háromféle módszerrel lehetséges (Lukács et al. 2022): az olvashatósági formulákkal szemben effektívebb megoldást jelentenek a természetesnyelv-feldolgozáson alapuló, gépi tanulási módszerek, de a leghatékonyabbnak mégis neurális hálókra épülő mély tanulási modellek bizonyulnak. A tanulmányban a kézzelfoghatóbb szövegtényezőkön túl néhány modernebb, automatikus szövegelemző szoftvert is bemutatok. Működési elvük ismerete hasznos lehet a magyar nyelvű szövegek géppel történő elemzésekor. Képet adnak arról is, hogy az olvashatóságot meghatározó bemeneti jegyek milyen főbb kategóriákba sorolhatók. Léteznek magyar nyelvfeldolgozó eszközláncok: UDPipe, huspaCy, Magyarlánc, s kiváltképp az e-magyar, melynek 2019-es (emtsv néven ismert) új verziója már a gyakorlatban is bizonyította a hatékonyságát. Kutatásunk szempontjából – az olvashatóság mérhetővé tételéhez – pedig hasznos eszköz lehet. | Hard to read content can hinder understanding and learning in educational environments, which can affect students’ academic performance and reading comprehension. Traditional readability formulas are often based in surface-level characteristics of the text, such as average sentence and word length. They disregard further nuances in readability, which is why depending on them can be stifling and shallow (Marulli et al. 2024, Látics– Gombos 2025). This study identifies the major factors, which can determine the difficulty and readability of a text. Hungarian academic literature approaches the subject through student book-analysis, segmenting levels of language – morphology, semantics, syntax (Fóris 2002, Kojanitz 2004a, Domonkosi 2013). To make readability measurable, three methods can be employed (Lukács et al. 2022): Natural Language Processing based machine learning, which is more effective than readability formulas, but more potent still are neural web based deep learning models. Beyond more obvious aspects of text, in this study I present several modern text-analysis software as well. Understanding their operating principles can prove useful in the analysis of Hungarian texts through machinebased processes. They also provide a fuller picture of what categories the different input signals determining readability can be sorted into. There also exist Hungarian language processing tools, such as UDPipe, huspaCy, Magyarlánc, and especially e-magyar, whose latest, 2019 version (also known as emtsv) has already proven useful in practice. From the point of view of this study – to make readability a measurable metric – it can also prove to be an effective tool.
| Item Type: | Article |
|---|---|
| Uncontrolled Keywords: | Mélytanulás; olvashatóság; szövegtényezők; szöveganalízis; számítógépes nyelvészet; természetes nyelvi feldolgozás; readability, text factors, text-analysis, deep learning, computational linguistics |
| Subjects: | P Language and Literature / nyelvészet és irodalom > P0 Philology. Linguistics / filológia, nyelvészet Q Science / természettudomány > QA Mathematics / matematika > QA75 Electronic computers. Computer science / számítástechnika, számítógéptudomány |
| SWORD Depositor: | MTMT SWORD |
| Depositing User: | MTMT SWORD |
| Date Deposited: | 20 Mar 2026 14:39 |
| Last Modified: | 20 Mar 2026 14:39 |
| URI: | https://real.mtak.hu/id/eprint/236044 |
Actions (login required)
![]() |
Edit Item |




