Sebestyén, Ádám and Sárközi-Lindner, Zsófia (2024) Történeti források szemantikus feldolgozása – Az ELTEdata adatbázis új gyűjteményei = Semantic data processing of historical sources – New collections of ELTEdata. In: Az oktatás, a kutatás és a közgyűjtemények digitális transzformációja felsőfokon : NETWORKSHOP 2024 : 33. Országos Informatikai Konferencia : 2024. április 3-5. Eszterházy Károly Katolikus Egyetem, Eger. HUNGARNET Egyesület, Budapest, pp. 105-111. ISBN 9786158224321
|
Text
13_Sebestyen_Sarkozi.pdf - Published Version Available under License Creative Commons Attribution. Download (1MB) | Preview |
Abstract
Az ELTE BTK Digitális Örökség Nemzeti Laboratóriumban fejlesztjük wikibase-alapokon működő szemantikus adatbázisunkat, az ELTEdatát. Folyamatosan dolgozunk mind az újabb kutatási anyagok és gyűjtemények integrálásán, mind a meglévő funkciók fejlesztésén, adott esetben új kiegészítések telepítésén. Jelen tanulmány az újonnan elért fejlesztések és eredmények bemutatására vállalkozik, a legutóbbi, nagy mennyiségű adatbetöltésre helyezve a hangsúlyt, melynek keretében a kora újkori Győri Jezsuita Gimnázium anyakönyvéből kiadott adattár névanyagát dolgoztuk fel. Az adatfelvitel egy tesztanyag manuális létrehozását követően félautomatikus módon történt, eleinte a QuickStatements Wikidata-eszköz, illetve API-n keresztül, egy erre a célra írt Python-kód segítségével. A tanulmány az elért eredmények mellett az automatizálás során felmerült nehézségeket is számba veszi. A bizonytalan adatok nagy száma, a változó értékek (például a települések és személyek névváltozatai) leképezése és összehangolása jelentették az automatikus betöltés előtti legnagyobb kihívásait. | ELTEdata, developed by the National Digital Heritage Laboratory of Eötvös Loránd University, aims to organize the sources of prosopographical, bibliographical and other historical research groups into a semantic data network. This paper presents our new developments, focusing on the recent entry of a large amount of data. Our primary source was the register of the Jesuit Gymnasium of Győr, containing data of matriculation from the 17th and 18th centuries. Data entry was accomplished after the specification and the creation of a test material semiautomatic, using the tool QuickStatements (decisively in the first phase of the workflow) and API, by means of a code, written in Python. The paper takes into account our current results and the difficulties during the automation as well. The uncertain data, the diverse forms of values (aliases, for instance) proved to be the greatest challenge during the creation of the namespace.
Item Type: | Book Section |
---|---|
Uncontrolled Keywords: | szemantikus adatbázis, Wikibase, félautomatikus adatgazdagítás, semantic database, Wikibase, semiautomatic data enrichment |
Subjects: | Z Bibliography. Library Science. Information Resources / könyvtártudomány > Z665 Library Science. Information Science / könyvtártudomány, információtudomány Z Bibliography. Library Science. Information Resources / könyvtártudomány > ZA Information resources / információforrások > ZA4450 Databases / adatbázisok |
SWORD Depositor: | MTMT SWORD |
Depositing User: | MTMT SWORD |
Date Deposited: | 02 Jan 2025 11:06 |
Last Modified: | 02 Jan 2025 11:06 |
URI: | https://real.mtak.hu/id/eprint/212378 |
Actions (login required)
![]() |
Edit Item |