REAL

Szakértői heurisztika alkalmazása a FRIQ-learning megerősítéses tanulási módszerben

Tompa, Tamás and Kovács, Szilveszter (2019) Szakértői heurisztika alkalmazása a FRIQ-learning megerősítéses tanulási módszerben. MULTIDISZCIPLINÁRIS TUDOMÁNYOK: A MISKOLCI EGYETEM KÖZLEMÉNYE, 9 (4). pp. 356-368. ISSN 2062-9737

[img]
Preview
Text
223_doi_v2.pdf

Download (837kB) | Preview

Abstract

Jelen cikk szakértői tudásbázis, mint előzetes, a priori heurisztika alkalmazási lehetőségét és annak hatását mutatja be a FRIQ-learning megerősítéses tanulási módszerben. A megerősítéses tanulási mód-szerek többsége, mint ahogyan a FRIQ-learning rendszer is üres tudásbázissal indítja a tanulási folya-matot, majd egy megfelelően meghatározott jutalomfüggvény alapján inkrementálisan bővíti azt. A cikk bemutatja a FRIQ-learning algoritmus továbbfejlesztett verzióját, amely esetében a rendszer nem üres tudásbázissal indítja a tanulási fázist, hanem egy szakértő által megadott, előzetes tudásbázissal. A bemutatott módszer segítségével az előzetes szakértői heurisztika beágyazható az FRIQ-learning mód-szerbe. Továbbá a cikk a népszerű „mountain car” mintapéldán keresztül szemlélteti a szakértői tudás-bázis beágyazásának módját és hatását a rendszerre.

Item Type: Article
Subjects: Q Science / természettudomány > QA Mathematics / matematika
SWORD Depositor: MTMT SWORD
Depositing User: MTMT SWORD
Date Deposited: 02 May 2023 14:16
Last Modified: 02 May 2023 14:16
URI: http://real.mtak.hu/id/eprint/164814

Actions (login required)

Edit Item Edit Item