REAL

Polarizációs dinamikák a Magyar Országgyűlésben 1998 és 2018 között = Dynamics of polarization in the Hungarian Parliament between 1998–2018

Buda, Jakab Máté and Németh, Renáta (2026) Polarizációs dinamikák a Magyar Országgyűlésben 1998 és 2018 között = Dynamics of polarization in the Hungarian Parliament between 1998–2018. STATISZTIKAI SZEMLE, 104 (6). pp. 553-569. ISSN 0039-0690

[img]
Preview
Text
2026_06_553.pdf - Published Version

Download (728kB) | Preview

Abstract

Tanulmányunkban a Magyar Országgyűlésben 1998 és 2018 között elhangzott beszédeket elemezve a szöveges adatokon végzett felügyelt és felügyelet nélküli gépi tanulás kombinációjának alkalmazási lehetőségeit mutatjuk be. A polarizáció mértékét n-gram1 alapú XGBoost (extreme gradient boosting) klasszifikációs modellel mérjük, amely a két domináns párt (Fidesz és MSZP) képviselőinek beszédeit különbözteti meg. Ezt kiegészítve 16 topikból álló strukturális topikmodellt (structural topic model, STM) alkalmazunk a polarizáció tartalmi csomópontjainak feltárására. Az egyes topikok polarizáltságát a modell biztossága alapján határozzuk meg, és ez alapján azonosítjuk a polarizáltabb és kevésbé polarizált témákat, majd ezeket mélyebben is megvizsgáljuk. Tudomásunk szerint ilyen vagy hasonló módszerkombinációval még nem kísérleteztek korábban, de eredményeink alapján érdemes lehet más esetekben is használni, amikor csoportok nyelvhasználati különbségének értelmező feltárása a kutatási cél. | In this study we demonstrate the potential applications of combining supervised and unsupervised machine learning methods on texts by analyzing polarization on corpus consisting of speeches delivered in the Hungarian Parliament between 1998–2018. We measure the degree of polarization using an XGBoost classification model which distinguishes between speeches given by MPs of the two dominant parties (Fidesz and MSZP) of the studied period. We also fit a structural topic model (STM) with 16 topics to find the substantive topics of polarization. We determine the polarization level of individual topics based on the XGBoost model's confidence, which allows us to identify more and less polarized topics for deeper examination. To the best of our knowledge, this is the first time that a similar methodological combinations have been used, and our results suggest it may be a good apprroach in other cases as well, when the research objective is to interpretively explore linguistic differences between groups.

Item Type: Article
Uncontrolled Keywords: természetes nyelvfeldolgozás, polarizáció, topikmodellezés, natural language processing, polarization, topic modeling
Subjects: H Social Sciences / társadalomtudományok > H Social Sciences (General) / társadalomtudomány általában
J Political Science / politológia > JA Political science (General) / politológia általában
SWORD Depositor: MTMT SWORD
Depositing User: MTMT SWORD
Date Deposited: 01 Jul 2026 08:01
Last Modified: 01 Jul 2026 08:01
URI: https://real.mtak.hu/id/eprint/241088

Actions (login required)

Edit Item Edit Item