Abaligeti, Gallusz and Gyimesi, András and Kehl, Dániel (2020) Adatforrások használata R-ben. STATISZTIKAI SZEMLE, 98 (7). pp. 858-884. ISSN 0039-0690
|
Text
2020_07_858.pdf Download (941kB) | Preview |
Abstract
A tanulmány célja, hogy olyan módszereket mutasson be, melyek segítségével statisztikai elemzésre kész adatállományok gyűjthetők. A szerzők a bemutatott adatforrásokat 3 kategóriára osztják: adatbázisokra, REST API végpontokra és weblapokra. Az adatgyűjtéshez alkalmazott eszköz az ingyenes, open source R nyelv és annak kiegészítő csomagjai, melyek segítségével mindhárom adatforrástípusból kinyerhetők adatok. Jelen írás adatelemzésre nem vállalkozik, az egyes adatállományok esetén inkább a potenciális lehetőségekre utal. A módszerek lehetséges használatára mutat be példákat a makroökonómia, a közösségi média, valamint a sport területéről. Ezeken a területeken tipikusan nagy mennyiségű publikusan elérhető adat található a világhálón, ám az ismertetett eljárások más területeken folytatott tudományos kutatásokban is alkalmazhatók. Az egyre népszerűbb akadémiai szemlélet, a megismételhető kutatás (reproducible research) egy példáját nyújtják a szerzők azzal, hogy elérhetővé teszik a cikkhez tartozó forráskódot. Amennyiben az alkalmazott csomagok lényeges elemei változnak, a tanulmány frissített verziója elérhető lesz (a cikk és mellékletei a következő linken találhatók: http://search.ksh.hu/#/year/2020?c=s#07).
Item Type: | Article |
---|---|
Subjects: | H Social Sciences / társadalomtudományok > HA Statistics / statisztika |
Depositing User: | Zsanett Kun |
Date Deposited: | 20 Jul 2020 07:33 |
Last Modified: | 20 Jul 2020 07:33 |
URI: | http://real.mtak.hu/id/eprint/111541 |
Actions (login required)
Edit Item |