REAL

Adatbányászati szoftver használata szövegosztályozáshoz = Data Mining Software for Text Classification

Subecz, Zoltán and Csák, Éva (2017) Adatbányászati szoftver használata szövegosztályozáshoz = Data Mining Software for Text Classification. GRADUS, 4 (2). pp. 444-452. ISSN 2064-8014

[img]
Preview
Text
2017_CSC_001_Subecz.pdf

Download (625kB) | Preview

Abstract

Dolgozatunkban a Weka adatbányászati szoftver használatát és a szövegosztályozás alapelveit mutatjuk be. Egy gyakorlati példán keresztül, amiben Internetről letöltött 4000 db ingatlanhirdetési szöveget dolgoztunk fel, több szöveg-osztályozási módszert megvizsgáltunk. Voltak olyan módszerek, amelyekhez a Weka beépített algoritmusát használtuk fel, és előfordultak olyanok is, amelyekhez saját programot készítettünk. Több módszert is részletesen elemeztünk a paraméterek beállításának változtatásával. Az egyes módszerek eredményeit összehasonlítottuk az osztályozási pontosság és a futási idő szerint. A feladatokhoz a programokat Java nyelven írtuk meg.

Item Type: Article
Additional Information: Második szerző: Nagyné Csák Éva
Uncontrolled Keywords: szövegosztályozás, információkinyerés, adatbányászat, szövegbányászat, mesterséges intelligencia
Subjects: Q Science / természettudomány > QA Mathematics / matematika > QA76 Computer software / programozás
Depositing User: Zoltán Subecz
Date Deposited: 17 Jun 2020 08:49
Last Modified: 17 Jun 2020 08:49
URI: http://real.mtak.hu/id/eprint/109818

Actions (login required)

Edit Item Edit Item