Kereső
Bejelentkezés
Kapcsolat
Magyar kulcsszavak vizsgálata és kinyerésük eredményeinek összevetése – pilotkutatás |
Tartalom: | http://hdl.handle.net/20.500.12944/24655 |
---|---|
Archívum: | Közszolgálati Tudásportál |
Gyűjtemény: |
Folyóiratok, folyóiratcikkek
Filológia.hu |
Cím: |
Magyar kulcsszavak vizsgálata és kinyerésük eredményeinek összevetése – pilotkutatás
|
Létrehozó: |
Dodé, Réka
|
Téma: |
terminus
kulcsszókinyerés
kulcsszómegadás
nyelvi modell
ChatGPT
term
keyword extraction
providing keyword
language model
Társadalomtudományok
Társadalomtudományok/Média- és Kommunikációs tudományok
|
Tartalmi leírás: |
A kulcsszó- és terminuskinyerés nem új keletű kutatási téma, már ötven éve foglalkoznak vele a kutatók, azonban még mindig rejt magában kihívásokat. A nyelvi modellek új perspektívát adnak számos nyelvtechnológiai területen, így a kulcsszó- és terminuskinyerésterületén is, mivel a nyelvi modellek olyan új kulcsszavak generálására is képesek, amelyek nem, vagy csak részlegesen szerepelnek a szövegben. Amikor a szerzők kézzel adnak meg kulcsszavakat, akkor a saját háttértudásukból is merítenek, így ezek a kulcsszavak nemfeltétlenül szerepelnek a szövegben. A kézzel megadott kulcsszavakkal tehát érdemes foglalkozni, és tekinthetők a gold sztenderdnek, célnak a kulcsszókinyerő alkalmazások teszteléséhez. Kutatásunkban 30 változó doménból származó tudományos szöveget és a hozzájuk tartozó szerzői kulcsszavakat vetettünk össze a ChatGPT által, többféle promptra adott megoldásokkal. Az eredmények szerint nincs szignifikáns különbség a kvantitatív eredményekben, de amennyiben kvalitatívan elemezzük a ChatGPT megoldásait, azokat relevánsnak találjuk. A dolgozat célja, hogy a ChatGPT által adott kimeneteket kiértékeljük abból a szempontból, hogy mennyire közelítik meg a szerzők által megadott kulcsszavakat.
Keyword and term extraction is a well-established area of research that has attracted scholarly attention for the past five decades. However, it continues to pose persistent challenges. Language models introduce a novel dimension to various facets of natural language processing, including the realm of keyword and term extraction. They offer the capability to generate novel keywords that may be absent or only partially represented within the source text. When the authors enter keywords manually, they draw on their own background knowledge, so these keywords are not necessarily included in the text. Manually entered keywords are therefore worth dealing with and can be considered the gold standard, a benchmark, against which to test keyword extraction applications. In our study, we conducted a comparative analysis of manually assigned keywords for 30 scientifical textual documents (from different domains) against keyword solutions provided by ChatGPT in response to various prompts. Our findings indicate that while there may not be a statistically significant difference in quantitative metrics, a qualitative examination of ChatGPT-generated solutions reveal their relevance and utility in augmenting keyword assignments. The aim of the thesis is to evaluate the outputs given by ChatGPT from the point of view of how close they are to the keywords given by the authors.
|
Típus: |
info:eu-repo/semantics/other
|
Formátum: |
application/pdf
|
Azonosító: |
nke:2062-7858
nke:10.59648/filologia.2023.1-4.3
nke:34799776
nke:10069970
nke:Filológia.hu
nke:14
nke:1–4
nke:FILOLÓGIA.HU
|
Létrehozó: |
info:eu-repo/semantics/openAccess
|