REAL

A nyílt forrásból származó adatgyűjtés automatizálásának lehetőségei = Possibilities of Automated Open Source Information Gathering

Gulyás, Attila (2023) A nyílt forrásból származó adatgyűjtés automatizálásának lehetőségei = Possibilities of Automated Open Source Information Gathering. BELÜGYI SZEMLE : A BELÜGYMINISZTÉRIUM SZAKMAI, TUDOMÁNYOS FOLYÓIRATA, 71 (7). pp. 1237-1269. ISSN 2062-9494 (nyomtatott); 2677-1632 (elektronikus)

[img]
Preview
Text
6_GulyasAttilaBelugyiSzemle2023.evi7.szam1237-1269..pdf
Available under License Creative Commons Attribution Non-commercial No Derivatives.

Download (1MB) | Preview

Abstract

Cél: A digitális forradalom korát éljük, amelyben a korszerű technológiáknak és ezek dinamikusan növekvő felhasználói táborának köszönhetően eddig soha nem látott mennyiségű, szabadon hozzáférhető, részben nemzetbiztonsági szempontból fontos adat keletkezik a kibertérben, amelyek összegyűjtése és elemzése messze túllépi az emberi teljesítőképesség határait. Ez az adatrobbanás indokolttá teszi az eddig nyílt forrásból történő adatgyűjtés újragondolását, beleértve az információgyűjtés és feldolgozás automatizálási lehetőségeinek vizsgálatát. Módszertan: A tanulmány egy félautomatizált rendszer felépítését és működését vázolja fel, megvizsgálva a megvalósítás elméleti lehetőségeit és buktatóit. A tanulmány nem vizsgálja a rendszer létesítésének és üzemeltetésének jogi kereteit. Terjedelmi okok miatt a szerző a fő pontok felvillantására koncentrált, hiszen egy-egy téma részletes tárgyalása önmagában is meghaladná a cikk kereteit. A tanulmány elkészítésekor a szemléletformálást és gondolatébresztést tűzte ki elsődleges célként. Megállapítások: A kutatás során a hazai és a külföldi idevágó szakirodalom tanulmányozásán túl, mivel a szerző évek óta tanulmányozza a dark webet, illetve a nyílt forrású információgyűjtés lehetőségeit, nagymértékben támaszkodott a saját kutatási eredményeire és tapasztalataira. Érték: A tanulmányban bemutatott elméleti rendszer vizsgálata rámutatott arra, hogy az ilyen rendszerek a jelenlegi technikai fejlettség mellett – ideértve a mesterséges intelligencia felhasználásának korlátait – nem működtethetők emberi felügyelet nélkül, ezért csak a félautomata rendszer kialakítása tűnik megvalósítható opciónak. Az adatfeldolgozás ma még elképzelhetetlen az ezen a területen jártas adatmérnökök nélkül. Ezek mellet a korlátok mellet is az ilyen rendszer rendkívüli mértékben felgyorsíthatja a nyílt forrásból történő adatok gyűjtését, hatékonyabbá téve a felderítő munkát. A gyakorlati életben természetesen nem feltétlenül kell minden elemet egyszerre megvalósítani vagy létrehozni, hiszen már egyes részegységek működtetése és integrálása a meglevő rendszerekhez is jelentősen felgyorsíthatja és hatékonyabbá teheti az adatgyűjtés folyamatát. Aim: The digital revolution, in which advanced technologies and their dynamically growing user base are generating unprecedented amounts of freely accessible data in cyberspace, some of which is of national security importance, and the collection and analysis of which is far beyond human capacity. This explosion of data justifies a rethinking of the way data has been collected from open sources, including the exploration of ways to automate the collection and processing of information. Methodology: The study outlines the design and operation of a semi-automated system, examining the theoretical possibilities and pitfalls of its implementation. The study does not examine the legal framework for setting up and operating the system. For reasons of space, the author has concentrated on highlighting the main points, as a detailed discussion of a single topic would exceed the scope of this article. The primary objective of the study is to stimulate and stimulate reflection. Findings: In addition to the research on the relevant literature in Hungary and abroad, as the author has been investigating the dark web and the possibilities of open source information gathering for many years, he has relied heavily on his own research and experience. Value: The theoretical system analysis presented in the study showed that such systems cannot be operated without human supervision at the current state of the technological development, including the limitations of the use of artificial intelligence, and therefore only the design of a semi-automated system seems to be a feasible option. Today, data processing is still unthinkable without data engineers skilled in this field. In addition to these limitations, such a system can speed up the collection of data from open sources to an extraordinary extent, making Intelligence more efficient. In practice, of course, it is not necessary to implement or create all the elements at once, as the operation and integration of some of the components into existing systems can significantly speed up and improve the efficiency of the data collection process.

Item Type: Article
Uncontrolled Keywords: OSINT, dark web, mesterséges intelligencia, adatvizualizáció; OSINT, Dark Web, Artificial Intelligence, data visualisation
Subjects: Q Science / természettudomány > QA Mathematics / matematika > QA76.9.D343 Data mining and searching techniques / adatbányászati és keresési módszerek
SWORD Depositor: MTMT SWORD
Depositing User: MTMT SWORD
Date Deposited: 11 Jul 2023 08:39
Last Modified: 11 Jul 2023 08:39
URI: http://real.mtak.hu/id/eprint/169333

Actions (login required)

Edit Item Edit Item