REAL

Adatforrások használata R-ben

Abaligeti, Gallusz and Gyimesi, András and Kehl, Dániel (2020) Adatforrások használata R-ben. STATISZTIKAI SZEMLE, 98 (7). pp. 858-884. ISSN 0039-0690

[img]
Preview
Text
2020_07_858.pdf

Download (941kB) | Preview

Abstract

A tanulmány célja, hogy olyan módszereket mutasson be, melyek segítségével statisztikai elemzésre kész adatállományok gyűjthetők. A szerzők a bemutatott adatforrásokat 3 kategóriára osztják: adatbázisokra, REST API végpontokra és weblapokra. Az adatgyűjtéshez alkalmazott eszköz az ingyenes, open source R nyelv és annak kiegészítő csomagjai, melyek segítségével mindhárom adatforrástípusból kinyerhetők adatok. Jelen írás adatelemzésre nem vállalkozik, az egyes adatállományok esetén inkább a potenciális lehetőségekre utal. A módszerek lehetséges használatára mutat be példákat a makroökonómia, a közösségi média, valamint a sport területéről. Ezeken a területeken tipikusan nagy mennyiségű publikusan elérhető adat található a világhálón, ám az ismertetett eljárások más területeken folytatott tudományos kutatásokban is alkalmazhatók. Az egyre népszerűbb akadémiai szemlélet, a megismételhető kutatás (reproducible research) egy példáját nyújtják a szerzők azzal, hogy elérhetővé teszik a cikkhez tartozó forráskódot. Amennyiben az alkalmazott csomagok lényeges elemei változnak, a tanulmány frissített verziója elérhető lesz (a cikk és mellékletei a következő linken találhatók: http://search.ksh.hu/#/year/2020?c=s#07).

Item Type: Article
Subjects: H Social Sciences / társadalomtudományok > HA Statistics / statisztika
Depositing User: Zsanett Kun
Date Deposited: 20 Jul 2020 07:33
Last Modified: 20 Jul 2020 07:33
URI: http://real.mtak.hu/id/eprint/111541

Actions (login required)

Edit Item Edit Item