Ugrás a tartalomhoz

 

A kis gömböc meséje – az ITIdata irodalomtudományos adatbázis fejlesztése 2022–2023-ban

  • Metaadatok
Tartalom: http://ocs.mtak.hu/index.php/nws/2023/paper/view/156
Archívum: NETWORKSHOP
Gyűjtemény: Tanulmányok
Cím:
A kis gömböc meséje – az ITIdata irodalomtudományos adatbázis fejlesztése 2022–2023-ban
Létrehozó:
Kata Dobás; Bölcsészettudományi Kutatóközpont, Irodalomtudományi Intézet
Zsófia Fellegi; Bölcsészettudományi Kutatóközpont, Irodalomtudományi Intézet
Gábor Palkó; <p>Digitális Örökség Nemzeti Laboratórium ELTE Digitális Bölcsészet Tanszék</p><p>Bölcsészettudományi Kutatóközpont, Irodalomtudományi Intézet</p>
Kiadó:
NETWORKSHOP
Dátum:
2023-12-16 13:24:32
Tartalmi leírás:
A Wikibase szoftverrel működő, a Wikidata struktúráját részben követő ITIdata irodalomtudományos adatbázis specifikációját még 2022-ben úgy találtuk ki, hogy minél több típusú projekt befogadására alkalmas legyen. Az elmúlt évben számos kutatás csatlakozott az ITIdata-hoz, így tanulságos volt összegzést tartani az elmúlt egy év történéseiről.Tanulmányunkban a következő témaköröket fogjuk említeni: milyen konkrét projektek csatlakoztak az adatbázishoz az első tesztprojektünk, a Kosztolányi-forrásjegyzéket követően; milyen ütemben követte az egyik kutatás a másikat; milyen elképzelésekkel érkeztek a kutatók az adatstruktúrát illetően és mi és hogyan valósult meg ebből, valamint milyen workflow-t alkalmaztunk az egyes esetekben. Az adatgazdagítás mikéntjéről is szót ejtünk: a félautomatikus (QuickStatements) és a nagy mennyiségű adatfelvitel tapasztalatairól egyaránt. Fontosnak tartottuk kiemelni, hogy az ITIdata adatstruktúrája hogyan változott meg a különböző adattípusoknak köszönhetően, milyen új tulajdonságok és entitások felvitelére volt szükség, illetve a jövőt illetően milyen lépésekre volt/lesz szükségünk, az adatfelviteli protokoll szigorításától kezdődően az egyes projektek elkülönítésén át az ellenőrző scriptek kidolgozásáig. Tanulmányunk végén azokat a nemzetközi, szintén wikibase szoftverrel működő adatbázisokat is áttekintem, amelyek eredményeit, tanulságait hasznosítani tudtuk az ITIdata fejlesztésekor.Kulcsszavak: szemantikus web, Wikibase, adatgazdagítás, digitális filológia, workflow The tale of the roly-poly – development of the ITIdata literary database in 2022-2023The specification of ITIdata, a wikibase-based database that partially follows the structure of wikidata, was designed in 2022 to accommodate as many types of projects as possible. In the past year, a large number of research projects have joined ITIdata, so it was instructive to provide a summary of what has happened in the past year.In our study, we will cover the following topics: what specific projects joined the database after our first test project, the Kosztolányi Resource Directory; the pace at which one research followed another; what ideas researchers came with about the data structure and what and how this was achieved, and what workflow was used in each case. We will also discuss how data was managed: both semi-automatic (QuickStatements) and experiences with largescale data entry. We considered it important to highlight how the data structure of ITIdata has changed due to the different data types, what new properties and entities needed to be added, and what steps were/are needed for the future, from tightening the data upload protocol to the separation of each project and the development of control scripts. At the end of our study, I will also review the international databases, also using wikibase software, whose results and lessons learned we could use in the development of ITIdata.Keywords: semantic database, Wikibase, digital philology, data management, workflow https://doi.org/10.31915/NWS.2023.28
Nyelv:
magyar
Típus:
Peer-reviewed Paper
Formátum:
application/pdf
Azonosító:
Forrás:
NETWORKSHOP; NETWORKSHOP 2023
Létrehozó:
Authors who submit to this conference agree to the following terms:<br/> <strong>a)</strong>&nbsp;Authors retain copyright over their work, while allowing the conference to place this unpublished work under a <a href="http://creativecommons.org/licenses/by/3.0/">Creative Commons Attribution License</a>, which allows others to freely access, use, and share the work, with an acknowledgement of the work's authorship and its initial presentation at this conference.<br/> <strong>b)</strong>&nbsp;Authors are able to waive the terms of the CC license and enter into separate, additional contractual arrangements for the non-exclusive distribution and subsequent publication of this work (e.g., publish a revised version in a journal, post it to an institutional repository or publish it in a book), with an acknowledgement of its initial presentation at this conference.<br/> <strong>c)</strong>&nbsp;In addition, authors are encouraged to post and share their work online (e.g., in institutional repositories or on their website) at any point before and after the conference.