Tompa, Tamás and Kovács, Szilveszter (2020) Heurisztikusan gyorsított megerősítéses tanulási módszerek - áttekintés. MULTIDISZCIPLINÁRIS TUDOMÁNYOK: A MISKOLCI EGYETEM KÖZLEMÉNYE, 10 (3). pp. 394-402. ISSN 2062-9737 (nyomtatott), 2786-1465 (online)
|
Text
581_doi.pdf - Published Version Download (839kB) | Preview |
Abstract
A klasszikus megerősítéses tanulási módszerek (Q-learning, SARSA) mindegyike egy megfelelően definiált jutalomfüggvény által, a környezettől kapott visszajelzések ismeretében számos próbálkozással térképezi fel az adott probléma megoldásához vezető utat. A rendszer a tanulási folyamat kezdetén semmilyen tudással nem rendelkezik a probléma megoldásával kapcsolatban, a megoldás tudásbázisát a tanulási fázis során állítja elő, az a célja, hogy iterációról-iterációra feltérképezze azt. Ennek következtében azonban a tanulási folyamat, illetve a probléma megoldása alatt lejátszódó iterációk száma meglehetősen hosszadalmas lehet. Ez a folyamat felgyorsítható lehet abban az esetben, ha áll rendelkezésre részleges információ a megoldásra vonatkozóan és az injektálható a rendszerbe. A heurisztikusan gyorsított megerősítéses tanulási módszerek ember által, valamilyen formában megadott tudást visznek be rendszerbe, amely által a konvergenciasebesség és a megoldás alatt eltelt lépések száma csökkenhető. Jelen cikk célja, hogy áttekintse azon megerősítéses tanulási módszereket, melyek heurisztikusan gyorsítottak, azaz ember által megadott előzetes (a priori) illetve részleges tudásbázis injektálását teszik lehetővé a megerősítéses tanuló rendszerbe.
Item Type: | Article |
---|---|
Uncontrolled Keywords: | megerősítéses tanulás, heurisztikusan gyorsított megerősítéses tanulás, szakértői tudásbázis, Q-learning, fuzzy Q-learning |
Subjects: | Q Science / természettudomány > QA Mathematics / matematika > QA75 Electronic computers. Computer science / számítástechnika, számítógéptudomány T Technology / alkalmazott, műszaki tudományok > T2 Technology (General) / műszaki tudományok általában |
SWORD Depositor: | MTMT SWORD |
Depositing User: | MTMT SWORD |
Date Deposited: | 28 Apr 2023 10:47 |
Last Modified: | 28 Apr 2023 10:47 |
URI: | http://real.mtak.hu/id/eprint/164578 |
Actions (login required)
Edit Item |